CN117396602A - 具有增强的稳定性的cas9效应蛋白 - Google Patents
具有增强的稳定性的cas9效应蛋白 Download PDFInfo
- Publication number
- CN117396602A CN117396602A CN202280037340.4A CN202280037340A CN117396602A CN 117396602 A CN117396602 A CN 117396602A CN 202280037340 A CN202280037340 A CN 202280037340A CN 117396602 A CN117396602 A CN 117396602A
- Authority
- CN
- China
- Prior art keywords
- nuclear localization
- localization signal
- protein
- effector protein
- cas9 effector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 493
- 108091033409 CRISPR Proteins 0.000 title claims abstract description 481
- 102000004169 proteins and genes Human genes 0.000 title claims abstract description 479
- 239000012636 effector Substances 0.000 title claims abstract description 363
- 108010077850 Nuclear Localization Signals Proteins 0.000 claims abstract description 515
- 102000040430 polynucleotide Human genes 0.000 claims abstract description 191
- 108091033319 polynucleotide Proteins 0.000 claims abstract description 191
- 239000002157 polynucleotide Substances 0.000 claims abstract description 191
- 238000000034 method Methods 0.000 claims abstract description 123
- 210000003527 eukaryotic cell Anatomy 0.000 claims abstract description 48
- 230000004048 modification Effects 0.000 claims abstract description 34
- 238000012986 modification Methods 0.000 claims abstract description 34
- 210000004027 cell Anatomy 0.000 claims description 99
- 239000002773 nucleotide Substances 0.000 claims description 86
- 125000003729 nucleotide group Chemical group 0.000 claims description 86
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 80
- 229920001184 polypeptide Polymers 0.000 claims description 53
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 53
- 150000007523 nucleic acids Chemical group 0.000 claims description 44
- 208000009869 Neu-Laxova syndrome Diseases 0.000 claims description 42
- 108091028113 Trans-activating crRNA Proteins 0.000 claims description 34
- 239000002245 particle Substances 0.000 claims description 34
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 27
- 238000003780 insertion Methods 0.000 claims description 24
- 230000037431 insertion Effects 0.000 claims description 24
- 230000001105 regulatory effect Effects 0.000 claims description 24
- 239000013603 viral vector Substances 0.000 claims description 22
- 238000010354 CRISPR gene editing Methods 0.000 claims description 21
- 230000001580 bacterial effect Effects 0.000 claims description 21
- 101710128836 Large T antigen Proteins 0.000 claims description 20
- 239000013598 vector Substances 0.000 claims description 20
- 230000035772 mutation Effects 0.000 claims description 18
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 16
- 239000002502 liposome Substances 0.000 claims description 12
- 241000894007 species Species 0.000 claims description 12
- 238000012217 deletion Methods 0.000 claims description 11
- 230000037430 deletion Effects 0.000 claims description 11
- 210000005260 human cell Anatomy 0.000 claims description 11
- 101100011365 Caenorhabditis elegans egl-13 gene Proteins 0.000 claims description 8
- 102100038895 Myc proto-oncogene protein Human genes 0.000 claims description 8
- 101710135898 Myc proto-oncogene protein Proteins 0.000 claims description 8
- 102000002488 Nucleoplasmin Human genes 0.000 claims description 8
- 101710150448 Transcriptional regulator Myc Proteins 0.000 claims description 8
- 108060005597 nucleoplasmin Proteins 0.000 claims description 8
- 210000001808 exosome Anatomy 0.000 claims description 7
- 241000702421 Dependoparvovirus Species 0.000 claims description 5
- 241001465754 Metazoa Species 0.000 claims description 5
- 210000004102 animal cell Anatomy 0.000 claims description 5
- 150000002632 lipids Chemical class 0.000 claims description 5
- 230000017854 proteolysis Effects 0.000 claims description 5
- 241000701161 unidentified adenovirus Species 0.000 claims description 4
- 241000700584 Simplexvirus Species 0.000 claims description 3
- 239000000853 adhesive Substances 0.000 claims description 3
- 230000001070 adhesive effect Effects 0.000 claims description 3
- 238000005304 joining Methods 0.000 claims description 3
- 239000002184 metal Substances 0.000 claims description 3
- 235000018102 proteins Nutrition 0.000 description 379
- 108020004414 DNA Proteins 0.000 description 51
- 239000004544 spot-on Substances 0.000 description 46
- 230000000694 effects Effects 0.000 description 28
- 102000039446 nucleic acids Human genes 0.000 description 25
- 108020004707 nucleic acids Proteins 0.000 description 25
- 108020005004 Guide RNA Proteins 0.000 description 22
- 230000027455 binding Effects 0.000 description 21
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 20
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 20
- 210000003494 hepatocyte Anatomy 0.000 description 20
- 230000006780 non-homologous end joining Effects 0.000 description 18
- 241000196324 Embryophyta Species 0.000 description 15
- 101150038500 cas9 gene Proteins 0.000 description 15
- 238000003776 cleavage reaction Methods 0.000 description 15
- 239000003112 inhibitor Substances 0.000 description 15
- 230000007017 scission Effects 0.000 description 15
- 239000000758 substrate Substances 0.000 description 14
- 102000053602 DNA Human genes 0.000 description 13
- 101000910035 Streptococcus pyogenes serotype M1 CRISPR-associated endonuclease Cas9/Csn1 Proteins 0.000 description 13
- 241000282414 Homo sapiens Species 0.000 description 12
- 239000013604 expression vector Substances 0.000 description 12
- 230000002103 transcriptional effect Effects 0.000 description 12
- 238000001890 transfection Methods 0.000 description 12
- 238000011144 upstream manufacturing Methods 0.000 description 12
- 238000001727 in vivo Methods 0.000 description 11
- 102100031573 Hematopoietic progenitor cell antigen CD34 Human genes 0.000 description 10
- 101000777663 Homo sapiens Hematopoietic progenitor cell antigen CD34 Proteins 0.000 description 10
- 238000004458 analytical method Methods 0.000 description 10
- 108020001507 fusion proteins Proteins 0.000 description 10
- 102000037865 fusion proteins Human genes 0.000 description 10
- 238000010362 genome editing Methods 0.000 description 10
- 230000008439 repair process Effects 0.000 description 10
- 230000007018 DNA scission Effects 0.000 description 9
- 150000001413 amino acids Chemical group 0.000 description 9
- 239000013612 plasmid Substances 0.000 description 9
- 108091093088 Amplicon Proteins 0.000 description 8
- 102100023823 Homeobox protein EMX1 Human genes 0.000 description 8
- 101001048956 Homo sapiens Homeobox protein EMX1 Proteins 0.000 description 8
- 101710163270 Nuclease Proteins 0.000 description 8
- 230000000295 complement effect Effects 0.000 description 8
- 230000005782 double-strand break Effects 0.000 description 8
- 230000037361 pathway Effects 0.000 description 8
- 238000012163 sequencing technique Methods 0.000 description 8
- 230000008685 targeting Effects 0.000 description 8
- 108091034117 Oligonucleotide Proteins 0.000 description 7
- 241000193996 Streptococcus pyogenes Species 0.000 description 7
- 238000002474 experimental method Methods 0.000 description 7
- 108091006047 fluorescent proteins Proteins 0.000 description 7
- 102000034287 fluorescent proteins Human genes 0.000 description 7
- 230000014509 gene expression Effects 0.000 description 7
- 230000010354 integration Effects 0.000 description 7
- 238000006467 substitution reaction Methods 0.000 description 7
- 238000001262 western blot Methods 0.000 description 7
- XDHNQDDQEHDUTM-UHFFFAOYSA-N bafliomycin A1 Natural products COC1C=CC=C(C)CC(C)C(O)C(C)C=C(C)C=C(OC)C(=O)OC1C(C)C(O)C(C)C1(O)OC(C(C)C)C(C)C(O)C1 XDHNQDDQEHDUTM-UHFFFAOYSA-N 0.000 description 6
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 description 6
- 238000000338 in vitro Methods 0.000 description 6
- 230000009437 off-target effect Effects 0.000 description 6
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 description 5
- 238000010442 DNA editing Methods 0.000 description 5
- 230000033616 DNA repair Effects 0.000 description 5
- 230000004568 DNA-binding Effects 0.000 description 5
- 102000004190 Enzymes Human genes 0.000 description 5
- 108090000790 Enzymes Proteins 0.000 description 5
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 5
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 5
- 230000004913 activation Effects 0.000 description 5
- 235000001014 amino acid Nutrition 0.000 description 5
- 230000015556 catabolic process Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 239000005090 green fluorescent protein Substances 0.000 description 5
- 210000000130 stem cell Anatomy 0.000 description 5
- 108091006106 transcriptional activators Proteins 0.000 description 5
- 102000043136 MAP kinase family Human genes 0.000 description 4
- 108091054455 MAP kinase family Proteins 0.000 description 4
- 102000004389 Ribonucleoproteins Human genes 0.000 description 4
- 108010081734 Ribonucleoproteins Proteins 0.000 description 4
- 108010044012 STAT1 Transcription Factor Proteins 0.000 description 4
- 102100029904 Signal transducer and activator of transcription 1-alpha/beta Human genes 0.000 description 4
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 4
- 125000003342 alkenyl group Chemical group 0.000 description 4
- 125000000217 alkyl group Chemical group 0.000 description 4
- 125000000304 alkynyl group Chemical group 0.000 description 4
- XDHNQDDQEHDUTM-JQWOJBOSSA-N bafilomycin A1 Chemical compound CO[C@H]1\C=C\C=C(C)\C[C@H](C)[C@H](O)[C@H](C)\C=C(/C)\C=C(OC)\C(=O)O[C@@H]1[C@@H](C)[C@@H](O)[C@H](C)[C@]1(O)O[C@H](C(C)C)[C@@H](C)[C@H](O)C1 XDHNQDDQEHDUTM-JQWOJBOSSA-N 0.000 description 4
- XDHNQDDQEHDUTM-ZGOPVUMHSA-N bafilomycin A1 Natural products CO[C@H]1C=CC=C(C)C[C@H](C)[C@H](O)[C@H](C)C=C(C)C=C(OC)C(=O)O[C@@H]1[C@@H](C)[C@@H](O)[C@H](C)[C@]1(O)O[C@H](C(C)C)[C@@H](C)[C@H](O)C1 XDHNQDDQEHDUTM-ZGOPVUMHSA-N 0.000 description 4
- 230000033228 biological regulation Effects 0.000 description 4
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 4
- 238000006731 degradation reaction Methods 0.000 description 4
- 230000001973 epigenetic effect Effects 0.000 description 4
- 102000034356 gene-regulatory proteins Human genes 0.000 description 4
- 108091006104 gene-regulatory proteins Proteins 0.000 description 4
- 238000002744 homologous recombination Methods 0.000 description 4
- 230000006801 homologous recombination Effects 0.000 description 4
- YACHGFWEQXFSBS-XYERBDPFSA-N leptomycin B Chemical compound OC(=O)/C=C(C)/C[C@H](C)[C@@H](O)[C@H](C)C(=O)[C@H](C)/C=C(\C)/C=C/C[C@@H](C)/C=C(/CC)\C=C\[C@@H]1OC(=O)C=C[C@@H]1C YACHGFWEQXFSBS-XYERBDPFSA-N 0.000 description 4
- 230000002132 lysosomal effect Effects 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 238000013507 mapping Methods 0.000 description 4
- 239000000203 mixture Substances 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 239000000126 substance Substances 0.000 description 4
- 238000013518 transcription Methods 0.000 description 4
- 230000035897 transcription Effects 0.000 description 4
- 230000003612 virological effect Effects 0.000 description 4
- 229930024421 Adenine Natural products 0.000 description 3
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 3
- 241001453380 Burkholderia Species 0.000 description 3
- 241000589876 Campylobacter Species 0.000 description 3
- 235000002566 Capsicum Nutrition 0.000 description 3
- 241000207199 Citrus Species 0.000 description 3
- 108091026890 Coding region Proteins 0.000 description 3
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 3
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 3
- YACHGFWEQXFSBS-UHFFFAOYSA-N Leptomycin B Natural products OC(=O)C=C(C)CC(C)C(O)C(C)C(=O)C(C)C=C(C)C=CCC(C)C=C(CC)C=CC1OC(=O)C=CC1C YACHGFWEQXFSBS-UHFFFAOYSA-N 0.000 description 3
- 101710125418 Major capsid protein Proteins 0.000 description 3
- 229940079156 Proteasome inhibitor Drugs 0.000 description 3
- 108091027544 Subgenomic mRNA Proteins 0.000 description 3
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 3
- 229960000643 adenine Drugs 0.000 description 3
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 3
- 235000020971 citrus fruits Nutrition 0.000 description 3
- 230000009918 complex formation Effects 0.000 description 3
- 210000000805 cytoplasm Anatomy 0.000 description 3
- 239000012634 fragment Substances 0.000 description 3
- 238000001415 gene therapy Methods 0.000 description 3
- 210000004263 induced pluripotent stem cell Anatomy 0.000 description 3
- 238000011081 inoculation Methods 0.000 description 3
- 230000006674 lysosomal degradation Effects 0.000 description 3
- 239000003550 marker Substances 0.000 description 3
- 230000001404 mediated effect Effects 0.000 description 3
- 230000030147 nuclear export Effects 0.000 description 3
- 230000012223 nuclear import Effects 0.000 description 3
- 239000003207 proteasome inhibitor Substances 0.000 description 3
- 101150071322 ruvC gene Proteins 0.000 description 3
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 2
- 241000726119 Acidovorax Species 0.000 description 2
- 108700028369 Alleles Proteins 0.000 description 2
- 102100021266 Alpha-(1,6)-fucosyltransferase Human genes 0.000 description 2
- 208000024827 Alzheimer disease Diseases 0.000 description 2
- 241000219198 Brassica Species 0.000 description 2
- 235000011331 Brassica Nutrition 0.000 description 2
- 235000011299 Brassica oleracea var botrytis Nutrition 0.000 description 2
- 240000003259 Brassica oleracea var. botrytis Species 0.000 description 2
- -1 COM Proteins 0.000 description 2
- 108091079001 CRISPR RNA Proteins 0.000 description 2
- 241000282465 Canis Species 0.000 description 2
- 240000008574 Capsicum frutescens Species 0.000 description 2
- 102100026846 Cytidine deaminase Human genes 0.000 description 2
- 108010031325 Cytidine deaminase Proteins 0.000 description 2
- 102100036279 DNA (cytosine-5)-methyltransferase 1 Human genes 0.000 description 2
- 238000007400 DNA extraction Methods 0.000 description 2
- 102100030324 Ephrin type-A receptor 3 Human genes 0.000 description 2
- 102100021601 Ephrin type-A receptor 8 Human genes 0.000 description 2
- 102000012216 Fanconi Anemia Complementation Group F protein Human genes 0.000 description 2
- 108010022012 Fanconi Anemia Complementation Group F protein Proteins 0.000 description 2
- 241000282326 Felis catus Species 0.000 description 2
- 102000003964 Histone deacetylase Human genes 0.000 description 2
- 108090000353 Histone deacetylase Proteins 0.000 description 2
- 102100038720 Histone deacetylase 9 Human genes 0.000 description 2
- 101000819490 Homo sapiens Alpha-(1,6)-fucosyltransferase Proteins 0.000 description 2
- 101000931098 Homo sapiens DNA (cytosine-5)-methyltransferase 1 Proteins 0.000 description 2
- 101000938351 Homo sapiens Ephrin type-A receptor 3 Proteins 0.000 description 2
- 101000898676 Homo sapiens Ephrin type-A receptor 8 Proteins 0.000 description 2
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 2
- 235000003228 Lactuca sativa Nutrition 0.000 description 2
- 240000008415 Lactuca sativa Species 0.000 description 2
- 241000589242 Legionella pneumophila Species 0.000 description 2
- 239000000232 Lipid Bilayer Substances 0.000 description 2
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 2
- 241000282567 Macaca fascicularis Species 0.000 description 2
- 208000018737 Parkinson disease Diseases 0.000 description 2
- 108091008103 RNA aptamers Proteins 0.000 description 2
- 101100166144 Staphylococcus aureus cas9 gene Proteins 0.000 description 2
- 108700009124 Transcription Initiation Site Proteins 0.000 description 2
- 102000004243 Tubulin Human genes 0.000 description 2
- 108090000704 Tubulin Proteins 0.000 description 2
- 102000006943 Uracil-DNA Glycosidase Human genes 0.000 description 2
- 108010072685 Uracil-DNA Glycosidase Proteins 0.000 description 2
- 244000078534 Vaccinium myrtillus Species 0.000 description 2
- 210000004436 artificial bacterial chromosome Anatomy 0.000 description 2
- 210000001106 artificial yeast chromosome Anatomy 0.000 description 2
- 229930192649 bafilomycin Natural products 0.000 description 2
- 239000012620 biological material Substances 0.000 description 2
- 238000010170 biological method Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000000903 blocking effect Effects 0.000 description 2
- 239000001390 capsicum minimum Substances 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 229940104302 cytosine Drugs 0.000 description 2
- 238000006471 dimerization reaction Methods 0.000 description 2
- 238000012377 drug delivery Methods 0.000 description 2
- 210000001671 embryonic stem cell Anatomy 0.000 description 2
- 238000001976 enzyme digestion Methods 0.000 description 2
- 230000037433 frameshift Effects 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 238000010353 genetic engineering Methods 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 230000002779 inactivation Effects 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 229940115932 legionella pneumophila Drugs 0.000 description 2
- 210000002901 mesenchymal stem cell Anatomy 0.000 description 2
- 238000002703 mutagenesis Methods 0.000 description 2
- 231100000350 mutagenesis Toxicity 0.000 description 2
- 239000002105 nanoparticle Substances 0.000 description 2
- 230000004770 neurodegeneration Effects 0.000 description 2
- 208000015122 neurodegenerative disease Diseases 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 210000004940 nucleus Anatomy 0.000 description 2
- 210000000056 organ Anatomy 0.000 description 2
- 210000003819 peripheral blood mononuclear cell Anatomy 0.000 description 2
- 239000002243 precursor Substances 0.000 description 2
- 238000001243 protein synthesis Methods 0.000 description 2
- 238000004451 qualitative analysis Methods 0.000 description 2
- 108091008146 restriction endonucleases Proteins 0.000 description 2
- 239000007790 solid phase Substances 0.000 description 2
- 125000006850 spacer group Chemical group 0.000 description 2
- 230000002195 synergetic effect Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 108091006107 transcriptional repressors Proteins 0.000 description 2
- 230000014616 translation Effects 0.000 description 2
- 239000002691 unilamellar liposome Substances 0.000 description 2
- 229940035893 uracil Drugs 0.000 description 2
- 235000013311 vegetables Nutrition 0.000 description 2
- 239000003981 vehicle Substances 0.000 description 2
- JLIDBLDQVAYHNE-LXGGSRJLSA-N 2-cis-abscisic acid Chemical compound OC(=O)/C=C(/C)\C=C\C1(O)C(C)=CC(=O)CC1(C)C JLIDBLDQVAYHNE-LXGGSRJLSA-N 0.000 description 1
- 101710159080 Aconitate hydratase A Proteins 0.000 description 1
- 101710159078 Aconitate hydratase B Proteins 0.000 description 1
- 108010052875 Adenine deaminase Proteins 0.000 description 1
- 244000144725 Amygdalus communis Species 0.000 description 1
- 235000011437 Amygdalus communis Nutrition 0.000 description 1
- 244000144730 Amygdalus persica Species 0.000 description 1
- 241000354428 Amylovorax Species 0.000 description 1
- 101100300093 Arabidopsis thaliana PYL1 gene Proteins 0.000 description 1
- 101100412103 Arabidopsis thaliana REC3 gene Proteins 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- 244000003416 Asparagus officinalis Species 0.000 description 1
- 235000005340 Asparagus officinalis Nutrition 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 240000007124 Brassica oleracea Species 0.000 description 1
- 235000003899 Brassica oleracea var acephala Nutrition 0.000 description 1
- 235000011301 Brassica oleracea var capitata Nutrition 0.000 description 1
- 235000017647 Brassica oleracea var italica Nutrition 0.000 description 1
- 235000001169 Brassica oleracea var oleracea Nutrition 0.000 description 1
- 241001277598 Campylobacter lanienae Species 0.000 description 1
- 241000589994 Campylobacter sp. Species 0.000 description 1
- 101100348617 Candida albicans (strain SC5314 / ATCC MYA-2876) NIK1 gene Proteins 0.000 description 1
- 101710132601 Capsid protein Proteins 0.000 description 1
- 108010078791 Carrier Proteins Proteins 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 235000005979 Citrus limon Nutrition 0.000 description 1
- 244000248349 Citrus limon Species 0.000 description 1
- 240000000560 Citrus x paradisi Species 0.000 description 1
- 101710094648 Coat protein Proteins 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 240000007154 Coffea arabica Species 0.000 description 1
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 229920000742 Cotton Polymers 0.000 description 1
- 241000699800 Cricetinae Species 0.000 description 1
- 241000699802 Cricetulus griseus Species 0.000 description 1
- 241000195493 Cryptophyta Species 0.000 description 1
- 241000701022 Cytomegalovirus Species 0.000 description 1
- 102220605874 Cytosolic arginine sensor for mTORC1 subunit 2_D10A_mutation Human genes 0.000 description 1
- 102100024812 DNA (cytosine-5)-methyltransferase 3A Human genes 0.000 description 1
- 108010024491 DNA Methyltransferase 3A Proteins 0.000 description 1
- 102000011724 DNA Repair Enzymes Human genes 0.000 description 1
- 108010076525 DNA Repair Enzymes Proteins 0.000 description 1
- 229940126289 DNA-PK inhibitor Drugs 0.000 description 1
- 102100022204 DNA-dependent protein kinase catalytic subunit Human genes 0.000 description 1
- 235000002767 Daucus carota Nutrition 0.000 description 1
- 244000000626 Daucus carota Species 0.000 description 1
- 241000195634 Dunaliella Species 0.000 description 1
- 101100005249 Escherichia coli (strain K12) ygcB gene Proteins 0.000 description 1
- 235000016623 Fragaria vesca Nutrition 0.000 description 1
- 240000009088 Fragaria x ananassa Species 0.000 description 1
- 235000011363 Fragaria x ananassa Nutrition 0.000 description 1
- 241000589601 Francisella Species 0.000 description 1
- 241000589599 Francisella tularensis subsp. novicida Species 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 1
- JZNWSCPGTDBMEW-UHFFFAOYSA-N Glycerophosphorylethanolamin Natural products NCCOP(O)(=O)OCC(O)CO JZNWSCPGTDBMEW-UHFFFAOYSA-N 0.000 description 1
- 102100021181 Golgi phosphoprotein 3 Human genes 0.000 description 1
- 241000219146 Gossypium Species 0.000 description 1
- 108091005772 HDAC11 Proteins 0.000 description 1
- 102100032606 Heat shock factor protein 1 Human genes 0.000 description 1
- 101710190344 Heat shock factor protein 1 Proteins 0.000 description 1
- 102000008157 Histone Demethylases Human genes 0.000 description 1
- 108010074870 Histone Demethylases Proteins 0.000 description 1
- 108010036115 Histone Methyltransferases Proteins 0.000 description 1
- 102000011787 Histone Methyltransferases Human genes 0.000 description 1
- 102000003893 Histone acetyltransferases Human genes 0.000 description 1
- 108090000246 Histone acetyltransferases Proteins 0.000 description 1
- 102100039996 Histone deacetylase 1 Human genes 0.000 description 1
- 102100039385 Histone deacetylase 11 Human genes 0.000 description 1
- 102100039999 Histone deacetylase 2 Human genes 0.000 description 1
- 102100021455 Histone deacetylase 3 Human genes 0.000 description 1
- 102100021454 Histone deacetylase 4 Human genes 0.000 description 1
- 102100021453 Histone deacetylase 5 Human genes 0.000 description 1
- 102100022537 Histone deacetylase 6 Human genes 0.000 description 1
- 102100038715 Histone deacetylase 8 Human genes 0.000 description 1
- 102100029144 Histone-lysine N-methyltransferase PRDM9 Human genes 0.000 description 1
- 101000619536 Homo sapiens DNA-dependent protein kinase catalytic subunit Proteins 0.000 description 1
- 101001035024 Homo sapiens Histone deacetylase 1 Proteins 0.000 description 1
- 101001035011 Homo sapiens Histone deacetylase 2 Proteins 0.000 description 1
- 101000899282 Homo sapiens Histone deacetylase 3 Proteins 0.000 description 1
- 101000899259 Homo sapiens Histone deacetylase 4 Proteins 0.000 description 1
- 101000899255 Homo sapiens Histone deacetylase 5 Proteins 0.000 description 1
- 101000899330 Homo sapiens Histone deacetylase 6 Proteins 0.000 description 1
- 101001032113 Homo sapiens Histone deacetylase 7 Proteins 0.000 description 1
- 101001032118 Homo sapiens Histone deacetylase 8 Proteins 0.000 description 1
- 101001032092 Homo sapiens Histone deacetylase 9 Proteins 0.000 description 1
- 101001124887 Homo sapiens Histone-lysine N-methyltransferase PRDM9 Proteins 0.000 description 1
- 101000615488 Homo sapiens Methyl-CpG-binding domain protein 2 Proteins 0.000 description 1
- 101000616738 Homo sapiens NAD-dependent protein deacetylase sirtuin-6 Proteins 0.000 description 1
- 101000616727 Homo sapiens NAD-dependent protein deacylase sirtuin-5, mitochondrial Proteins 0.000 description 1
- 101000863629 Homo sapiens NAD-dependent protein lipoamidase sirtuin-4, mitochondrial Proteins 0.000 description 1
- 241000701024 Human betaherpesvirus 5 Species 0.000 description 1
- 102100034343 Integrase Human genes 0.000 description 1
- 240000007049 Juglans regia Species 0.000 description 1
- 235000009496 Juglans regia Nutrition 0.000 description 1
- 241000208822 Lactuca Species 0.000 description 1
- 241000589248 Legionella Species 0.000 description 1
- 241000189475 Legionella londiniensis Species 0.000 description 1
- 208000007764 Legionnaires' Disease Diseases 0.000 description 1
- 241000713666 Lentivirus Species 0.000 description 1
- 102000016267 Leptin Human genes 0.000 description 1
- 108010092277 Leptin Proteins 0.000 description 1
- 229930190887 Leptomycin Natural products 0.000 description 1
- 241000589902 Leptospira Species 0.000 description 1
- 241000209510 Liliopsida Species 0.000 description 1
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 235000011430 Malus pumila Nutrition 0.000 description 1
- 235000015103 Malus silvestris Nutrition 0.000 description 1
- 244000070406 Malus silvestris Species 0.000 description 1
- 240000003183 Manihot esculenta Species 0.000 description 1
- 235000016735 Manihot esculenta subsp esculenta Nutrition 0.000 description 1
- 102100021299 Methyl-CpG-binding domain protein 2 Human genes 0.000 description 1
- 108060004795 Methyltransferase Proteins 0.000 description 1
- 102000016397 Methyltransferase Human genes 0.000 description 1
- 108700011259 MicroRNAs Proteins 0.000 description 1
- 241000235575 Mortierella Species 0.000 description 1
- 101100219625 Mus musculus Casd1 gene Proteins 0.000 description 1
- 101100445099 Mus musculus Emx1 gene Proteins 0.000 description 1
- 108010021466 Mutant Proteins Proteins 0.000 description 1
- 102000008300 Mutant Proteins Human genes 0.000 description 1
- WWGBHDIHIVGYLZ-UHFFFAOYSA-N N-[4-[3-[[[7-(hydroxyamino)-7-oxoheptyl]amino]-oxomethyl]-5-isoxazolyl]phenyl]carbamic acid tert-butyl ester Chemical compound C1=CC(NC(=O)OC(C)(C)C)=CC=C1C1=CC(C(=O)NCCCCCCC(=O)NO)=NO1 WWGBHDIHIVGYLZ-UHFFFAOYSA-N 0.000 description 1
- OVRNDRQMDRJTHS-KEWYIRBNSA-N N-acetyl-D-galactosamine Chemical compound CC(=O)N[C@H]1C(O)O[C@H](CO)[C@H](O)[C@@H]1O OVRNDRQMDRJTHS-KEWYIRBNSA-N 0.000 description 1
- MBLBDJOUHNCFQT-UHFFFAOYSA-N N-acetyl-D-galactosamine Natural products CC(=O)NC(C=O)C(O)C(O)C(O)CO MBLBDJOUHNCFQT-UHFFFAOYSA-N 0.000 description 1
- 102100031455 NAD-dependent protein deacetylase sirtuin-1 Human genes 0.000 description 1
- 102100022913 NAD-dependent protein deacetylase sirtuin-2 Human genes 0.000 description 1
- 102100030710 NAD-dependent protein deacetylase sirtuin-3, mitochondrial Human genes 0.000 description 1
- 102100021840 NAD-dependent protein deacetylase sirtuin-6 Human genes 0.000 description 1
- 102100021839 NAD-dependent protein deacylase sirtuin-5, mitochondrial Human genes 0.000 description 1
- 102100030709 NAD-dependent protein lipoamidase sirtuin-4, mitochondrial Human genes 0.000 description 1
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 1
- 244000061176 Nicotiana tabacum Species 0.000 description 1
- 108020004485 Nonsense Codon Proteins 0.000 description 1
- 101710141454 Nucleoprotein Proteins 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 101100300089 Oryza sativa subsp. japonica PYL10 gene Proteins 0.000 description 1
- 241000260425 Parasutterella excrementihominis Species 0.000 description 1
- 239000006002 Pepper Substances 0.000 description 1
- 102000035195 Peptidases Human genes 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 102000010292 Peptide Elongation Factor 1 Human genes 0.000 description 1
- 108010077524 Peptide Elongation Factor 1 Proteins 0.000 description 1
- 235000016761 Piper aduncum Nutrition 0.000 description 1
- 240000003889 Piper guineense Species 0.000 description 1
- 235000017804 Piper guineense Nutrition 0.000 description 1
- 235000008184 Piper nigrum Nutrition 0.000 description 1
- 235000003447 Pistacia vera Nutrition 0.000 description 1
- 240000006711 Pistacia vera Species 0.000 description 1
- 206010035226 Plasma cell myeloma Diseases 0.000 description 1
- 101710083689 Probable capsid protein Proteins 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 241000588769 Proteus <enterobacteria> Species 0.000 description 1
- 235000006029 Prunus persica var nucipersica Nutrition 0.000 description 1
- 235000006040 Prunus persica var persica Nutrition 0.000 description 1
- 244000017714 Prunus persica var. nucipersica Species 0.000 description 1
- 241000589516 Pseudomonas Species 0.000 description 1
- 241000589774 Pseudomonas sp. Species 0.000 description 1
- 241001658716 Pseudomonas sp. 37 Species 0.000 description 1
- 235000014443 Pyrus communis Nutrition 0.000 description 1
- 240000001987 Pyrus communis Species 0.000 description 1
- 102000044126 RNA-Binding Proteins Human genes 0.000 description 1
- 101710105008 RNA-binding protein Proteins 0.000 description 1
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- 235000017848 Rubus fruticosus Nutrition 0.000 description 1
- 240000007651 Rubus glaucus Species 0.000 description 1
- 235000011034 Rubus glaucus Nutrition 0.000 description 1
- 235000009122 Rubus idaeus Nutrition 0.000 description 1
- 241000606009 Ruminobacter Species 0.000 description 1
- 241000606008 Ruminobacter amylophilus Species 0.000 description 1
- 108091005770 SIRT3 Proteins 0.000 description 1
- 101100007329 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) COS1 gene Proteins 0.000 description 1
- 101100528972 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) RPD3 gene Proteins 0.000 description 1
- 241000607142 Salmonella Species 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 102000011990 Sirtuin Human genes 0.000 description 1
- 108050002485 Sirtuin Proteins 0.000 description 1
- 108010041191 Sirtuin 1 Proteins 0.000 description 1
- 108010041216 Sirtuin 2 Proteins 0.000 description 1
- 241000207763 Solanum Species 0.000 description 1
- 240000003768 Solanum lycopersicum Species 0.000 description 1
- 235000002597 Solanum melongena Nutrition 0.000 description 1
- 244000061458 Solanum melongena Species 0.000 description 1
- 235000002595 Solanum tuberosum Nutrition 0.000 description 1
- 244000061456 Solanum tuberosum Species 0.000 description 1
- 240000003829 Sorghum propinquum Species 0.000 description 1
- 235000011684 Sorghum saccharatum Nutrition 0.000 description 1
- 241000219315 Spinacia Species 0.000 description 1
- 235000009337 Spinacia oleracea Nutrition 0.000 description 1
- 244000300264 Spinacia oleracea Species 0.000 description 1
- 241000123713 Sutterella wadsworthensis Species 0.000 description 1
- 235000009470 Theobroma cacao Nutrition 0.000 description 1
- 244000299461 Theobroma cacao Species 0.000 description 1
- 241000224526 Trichomonas Species 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 244000098338 Triticum aestivum Species 0.000 description 1
- 241001140606 Turicimonas muris Species 0.000 description 1
- 235000003095 Vaccinium corymbosum Nutrition 0.000 description 1
- 235000017537 Vaccinium myrtillus Nutrition 0.000 description 1
- 241000607365 Vibrio natriegens Species 0.000 description 1
- 241000607284 Vibrio sp. Species 0.000 description 1
- 235000009754 Vitis X bourquina Nutrition 0.000 description 1
- 235000012333 Vitis X labruscana Nutrition 0.000 description 1
- 240000006365 Vitis vinifera Species 0.000 description 1
- 235000014787 Vitis vinifera Nutrition 0.000 description 1
- 241000605939 Wolinella succinogenes Species 0.000 description 1
- 240000008042 Zea mays Species 0.000 description 1
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 1
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 1
- 239000013543 active substance Substances 0.000 description 1
- 210000004504 adult stem cell Anatomy 0.000 description 1
- 235000020224 almond Nutrition 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 210000003578 bacterial chromosome Anatomy 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 229960000074 biopharmaceutical Drugs 0.000 description 1
- 235000021029 blackberry Nutrition 0.000 description 1
- 108091005948 blue fluorescent proteins Proteins 0.000 description 1
- 235000021014 blueberries Nutrition 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000005251 capillar electrophoresis Methods 0.000 description 1
- 101150055191 cas3 gene Proteins 0.000 description 1
- 101150055766 cat gene Proteins 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 235000013339 cereals Nutrition 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 239000013599 cloning vector Substances 0.000 description 1
- 235000016213 coffee Nutrition 0.000 description 1
- 235000013353 coffee beverage Nutrition 0.000 description 1
- 108010045512 cohesins Proteins 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 108010082025 cyan fluorescent protein Proteins 0.000 description 1
- 230000001086 cytosolic effect Effects 0.000 description 1
- 238000006298 dechlorination reaction Methods 0.000 description 1
- 238000002716 delivery method Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 229960003722 doxycycline Drugs 0.000 description 1
- XQTWDDCIUJNLTR-CVHRZJFOSA-N doxycycline monohydrate Chemical compound O.O=C1C2=C(O)C=CC=C2[C@H](C)[C@@H]2C1=C(O)[C@]1(O)C(=O)C(C(N)=O)=C(O)[C@@H](N(C)C)[C@@H]1[C@H]2O XQTWDDCIUJNLTR-CVHRZJFOSA-N 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 241001233957 eudicotyledons Species 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 231100000221 frame shift mutation induction Toxicity 0.000 description 1
- IXORZMNAPKEEDV-OBDJNFEBSA-N gibberellin A3 Chemical compound C([C@@]1(O)C(=C)C[C@@]2(C1)[C@H]1C(O)=O)C[C@H]2[C@]2(C=C[C@@H]3O)[C@H]1[C@]3(C)C(=O)O2 IXORZMNAPKEEDV-OBDJNFEBSA-N 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 210000003958 hematopoietic stem cell Anatomy 0.000 description 1
- 230000002440 hepatic effect Effects 0.000 description 1
- 210000004024 hepatic stellate cell Anatomy 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 210000004408 hybridoma Anatomy 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 230000001976 improved effect Effects 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000000968 intestinal effect Effects 0.000 description 1
- 210000003292 kidney cell Anatomy 0.000 description 1
- NRYBAZVQPHGZNS-ZSOCWYAHSA-N leptin Chemical compound O=C([C@H](CO)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)CNC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC(C)C)CCSC)N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CS)C(O)=O NRYBAZVQPHGZNS-ZSOCWYAHSA-N 0.000 description 1
- 229940039781 leptin Drugs 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 210000005229 liver cell Anatomy 0.000 description 1
- 210000003712 lysosome Anatomy 0.000 description 1
- 230000001868 lysosomic effect Effects 0.000 description 1
- 235000009973 maize Nutrition 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 210000004779 membrane envelope Anatomy 0.000 description 1
- 108091070501 miRNA Proteins 0.000 description 1
- 239000000693 micelle Substances 0.000 description 1
- 239000002679 microRNA Substances 0.000 description 1
- 201000000050 myeloid neoplasm Diseases 0.000 description 1
- 238000011587 new zealand white rabbit Methods 0.000 description 1
- 230000037434 nonsense mutation Effects 0.000 description 1
- 230000030648 nucleus localization Effects 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 235000014571 nuts Nutrition 0.000 description 1
- 238000012235 off-target genome editing Methods 0.000 description 1
- 230000000174 oncolytic effect Effects 0.000 description 1
- 210000001672 ovary Anatomy 0.000 description 1
- 210000004738 parenchymal cell Anatomy 0.000 description 1
- WTJKGGKOPKCXLL-RRHRGVEJSA-N phosphatidylcholine Chemical compound CCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCCCCCCC=CCCCCCCCC WTJKGGKOPKCXLL-RRHRGVEJSA-N 0.000 description 1
- 150000008104 phosphatidylethanolamines Chemical class 0.000 description 1
- 150000003904 phospholipids Chemical class 0.000 description 1
- 235000020233 pistachio Nutrition 0.000 description 1
- 210000001778 pluripotent stem cell Anatomy 0.000 description 1
- 239000001816 polyoxyethylene sorbitan tristearate Substances 0.000 description 1
- 230000023603 positive regulation of transcription initiation, DNA-dependent Effects 0.000 description 1
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 description 1
- 235000012015 potatoes Nutrition 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000000751 protein extraction Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 108010054624 red fluorescent protein Proteins 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000014493 regulation of gene expression Effects 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 230000003007 single stranded DNA break Effects 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 238000012453 sprague-dawley rat model Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 230000004936 stimulating effect Effects 0.000 description 1
- 238000007910 systemic administration Methods 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 238000004448 titration Methods 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- 235000020234 walnut Nutrition 0.000 description 1
- 108091005957 yellow fluorescent proteins Proteins 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/09—Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Wood Science & Technology (AREA)
- Molecular Biology (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Genetics & Genomics (AREA)
- Medicinal Chemistry (AREA)
- Microbiology (AREA)
- Biotechnology (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Peptides Or Proteins (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
提供了具有增强的稳定性的Cas9效应蛋白。Cas9效应蛋白的实施例具有附接至N‑末端的第一核定位信号和附接至C‑末端的第二核定位信号。还提供了Cas9系统,其包含具有增强的稳定性的Cas9效应蛋白和与该Cas9效应蛋白形成复合物的指导多核苷酸。进一步提供了用于在真核细胞中使用Cas9效应蛋白提供靶序列的位点特异性修饰的方法。
Description
技术领域
本披露提供了具有增强的稳定性的Cas9效应蛋白。Cas9效应蛋白的实施例具有附接至N-末端的第一核定位信号和附接至C-末端的第二核定位信号。本披露还提供了Cas9系统,其包含这样的Cas9效应蛋白和与Cas9效应蛋白形成复合物的指导多核苷酸。本披露进一步提供了用于在真核细胞中使用Cas9效应蛋白提供靶序列的位点特异性修饰的方法。
背景技术
CRIPR/Cas基因编辑技术的使用彻底改变了生物技术。CRISPR-Cas9基因编辑系统已成功用于许多种生物体和细胞系中,既为了在DNA中使用野生型Cas9蛋白诱导双链断裂(DSB)形成,又为了使用称为Cas9n/Cas9 D10A的突变型蛋白切割单DNA链(参见,例如,Mali等人,Science[科学],339(6121):823-826(2013)以及Sander和Joung,NatureBiotechnology[自然生物技术]32(4):347-355(2014),将其各自通过引用以其全文并入本文)。虽然DSB的形成导致可能破坏基因功能的小插入和缺失(插入缺失(indel))的产生,但Cas9n/Cas9 D10A切口酶避免了插入缺失的产生(通过非同源末端连接进行修复的结果),同时刺激了内源同源重组机制。因此,Cas9n/Cas9 D10A切口酶可用于将DNA区域高保真地插入基因组。
除基因组编辑外,CRISPR系统还具有许多其他应用,包括调节基因表达、基因回路构建和功能基因组学等(在Sander和Joung,2014中综述)。
虽然Cas9蛋白已被证明在多种体内和体外应用中有效,但作为蛋白质,它易受潜在降解的影响,特别是在细胞环境中。
发明内容
本披露涉及Cas9效应蛋白,其包含:a)附接至该Cas9效应蛋白N-末端的第一核定位信号;和b)附接至该Cas9效应蛋白C-末端的第二核定位信号。
在蛋白质的一些实施例中,第一核定位信号是单组分核定位信号。在一些实施例中,第一核定位信号是两组分核定位信号。在一些实施例中,第二核定位信号是单组分核定位信号。在一些实施例中,第二核定位信号是两组分核定位信号。在一些实施例中,第一核定位信号是两组分核定位信号,并且第二核定位信号是单组分核定位信号。
在一些实施例中,单组分核定位信号是SV40大T抗原、核质蛋白、EGL-13、c-Myc、TUS蛋白核定位信号、或其组合。在一些实施例中,两组分核定位信号是经典的两组分核定位信号。在一些实施例中,第一核定位信号是经典的两组分核定位信号,并且第二核定位信号是SV40大T抗原核定位信号。
在蛋白质的一些实施例中,第一核定位信号直接附接至Cas9效应蛋白。在一些实施例中,第一核定位信号经由接头附接至Cas9效应蛋白。在一些实施例中,第二核定位信号直接附接至Cas9效应蛋白。在一些实施例中,第二核定位信号经由接头附接至Cas9效应蛋白。在一些实施例中,接头是具有2至30个残基的肽接头。
在一些实施例中,蛋白质包含第一核定位信号的两个拷贝。在一些实施例中,蛋白质包含第一核定位信号的三个拷贝。在一些实施例中,蛋白质包含第二核定位信号的两个拷贝。在一些实施例中,蛋白质包含第二核定位信号的三个拷贝。
在一些实施例中,Cas9效应蛋白衍生自具有II-B型CRISPR系统的细菌物种。在一些实施例中,Cas9效应蛋白包含与SEQ ID NO:10-97中的任一个具有至少95%同一性的多肽序列。在一些实施例中,Cas9效应蛋白包含以1E-5的E值截止值匹配TIGR03031蛋白家族的结构域。在一些实施例中,Cas9效应蛋白包含与SEQ ID NO:98具有至少90%同一性的多肽序列。在一些实施例中,Cas9效应蛋白包含经修饰的SEQ ID NO:98的多肽,其中一个或多个修饰选自N1164R、N1265R、N1300R、N1412R、N347R、N651A、D1266R、D309R、D345R、D487R、D607R、Q1129R、Q1381A、Q1381A、Q1381R、Q661A、Q713R、Q734R、E1032G、E1032R、E1409A、E436R、E611R、E691R、E697R、G1335R、L125R、L1264S、L1299S、K1031R、K490R、K615R、K656R、F636R、S1334A、S1334A、S1334R、S1380R、S1410R、S1413R、S634R、S638R、S711R、S1006R、S1017R、T1267A、T1267R、T551R、Y1338A、Y1338R、V1273S、V1274S、V486R、V644R、V736R和V736Y。
本披露还涉及CRISPR-Cas系统,其包含:a)Cas9效应蛋白,该Cas9效应蛋白包含:i)附接至该Cas9效应蛋白N-末端的第一核定位信号;和ii)附接至该Cas9效应蛋白C-末端的第二核定位信号;以及b)指导多核苷酸,该指导多核苷酸包含指导序列并且与该Cas9效应蛋白形成复合物,其中该指导序列能够与真核细胞中的靶序列杂交。
本披露进一步涉及CRISPR-Cas系统,其包含:a)编码Cas9效应蛋白的核酸序列,该Cas9效应蛋白包含:i)附接至该Cas9效应蛋白N-末端的第一核定位信号;和ii)附接至该Cas9效应蛋白C-末端的第二核定位信号;以及b)编码指导多核苷酸的核酸序列,该指导多核苷酸包含指导序列并且与该Cas9效应蛋白形成复合物,其中该指导序列能够与真核细胞中的靶序列杂交。
在系统的一些实施例中,(a)和(b)的核苷酸序列在真核启动子的控制下。在一些实施例中,(a)和(b)的核酸序列在单个载体中。
本披露进一步涉及CRISPR-Cas系统,其包含一个或多个含有以下的载体:a)与一个或多个编码Cas9效应蛋白的核苷酸序列可操作地连接的调节元件,该Cas9效应蛋白包含:i)附接至该Cas9效应蛋白N-末端的第一核定位信号;和ii)附接至该Cas9效应蛋白C-末端的第二核定位信号;以及b)指导多核苷酸,该指导多核苷酸包含指导序列并且与该Cas9效应蛋白形成复合物,其中该指导序列能够与真核细胞中的靶序列杂交。
在系统的一些实施例中,调节元件是真核调节元件。
在系统的一些实施例中,第一核定位信号是单组分核定位信号。在一些实施例中,第一核定位信号是两组分核定位信号。在一些实施例中,第二核定位信号是单组分核定位信号。在一些实施例中,第二核定位信号是两组分核定位信号。在一些实施例中,第一核定位信号是两组分核定位信号,并且第二核定位信号是单组分核定位信号。在一些实施例中,第一核定位信号和第二核定位信号各自是两组分核定位信号。
在一些实施例中,单组分核定位信号是SV40大T抗原、核质蛋白、EGL-13、c-Myc、TUS蛋白核定位信号、或其组合。在一些实施例中,两组分核定位信号是经典的两组分核定位信号。在一些实施例中,第一核定位信号是经典的两组分核定位信号,并且第二核定位信号是SV40大T抗原核定位信号。
在系统的一些实施例中,第一核定位信号直接附接至Cas9效应蛋白。在一些实施例中,第一核定位信号经由接头附接至Cas9效应蛋白。在一些实施例中,第二核定位信号直接附接至Cas9效应蛋白。在一些实施例中,第二核定位信号经由接头附接至Cas9效应蛋白。在一些实施例中,接头是具有2至30个残基的肽接头。
在系统的一些实施例中,蛋白质包含第一核定位信号的两个拷贝。在一些实施例中,蛋白质包含第一核定位信号的三个拷贝。在一些实施例中,蛋白质包含第二核定位信号的两个拷贝。在一些实施例中,蛋白质包含第二核定位信号的三个拷贝。
在系统的一些实施例中,Cas9效应蛋白衍生自具有II-B型CRISPR系统的细菌物种。在一些实施例中,Cas9效应蛋白包含与SEQ ID NO:10-97中的任一个具有至少95%同一性的多肽序列。在一些实施例中,Cas9效应蛋白包含以1E-5的E值截止值匹配TIGR03031蛋白家族的结构域。在一些实施例中,Cas9效应蛋白包含与SEQ ID NO:98具有至少90%同一性的多肽序列。
在系统的一些实施例中,指导多核苷酸是RNA。在一些实施例中,指导序列的长度是19至30个碱基。在一些实施例中,指导序列的长度是19至25个碱基。在一些实施例中,指导序列的长度是21至26个碱基。在一些实施例中,指导多核苷酸进一步包含tracrRNA序列。
在系统的一些实施例中,Cas9效应蛋白产生粘性末端。在一些实施例中,粘性末端包含具有1至10个核苷酸的单链多核苷酸突出端。在一些实施例中,粘性末端包含具有2至6个核苷酸的单链多核苷酸突出端。在一些实施例中,粘性末端包含具有3至5个核苷酸的单链多核苷酸突出端。
本披露提供了真核细胞,其包含如上所述的蛋白质。本披露进一步提供了真核细胞,其包含如上所述的系统。
本披露提供了递送颗粒,其包含如上所述的蛋白质。本披露进一步提供了递送颗粒,其包含系统。在递送颗粒的一些实施例中,Cas9效应蛋白和指导多核苷酸以复合物存在。在一些实施例中,复合物进一步包含含有tracrRNA序列的多核苷酸。在一些实施例中,递送颗粒进一步包含脂质、糖、金属或蛋白质。
本披露提供了囊泡,其包含如上所述的蛋白质。本披露进一步提供了囊泡,其包含如上所述的系统。在囊泡的一些实施例中,Cas9效应蛋白和指导多核苷酸以复合物存在。在一些实施例中,囊泡进一步包含含有tracrRNA序列的多核苷酸。在一些实施例中,囊泡是外泌体或脂质体。
本披露提供了病毒载体,其包含如上所述的蛋白质。本披露进一步提供了病毒载体,其包含如上所述的系统。在一些实施例中,病毒载体进一步包含编码tracrRNA序列的核酸序列。在一些实施例中,病毒载体是腺病毒颗粒、腺相关病毒颗粒或单纯疱疹病毒颗粒。
本披露还提供了用于在真核细胞中提供靶序列的位点特异性修饰的方法,该方法包括:
a)将以下引入到该细胞中:i)编码Cas9效应蛋白的核苷酸,该Cas9效应蛋白包含:A)附接至该Cas9效应蛋白N-末端的第一核定位信号;和B)附接至该Cas9效应蛋白C-末端的第二核定位信号;以及ii)编码指导多核苷酸的核苷酸,该指导多核苷酸与该Cas9效应蛋白形成复合物并且包含指导序列,其中该指导序列能够与宿主多核苷酸中的靶序列杂交;
b)用该Cas9效应蛋白和该指导多核苷酸在该宿主多核苷酸中产生粘性末端;以及
c)i)将(b)的这些粘性末端连接在一起,或ii)将目的多核苷酸序列的3′端与一个粘性末端连接,并且将该多核苷酸序列的5’端与一个粘性末端连接;从而修饰该靶序列。
在方法的一些实施例中,第一核定位信号是单组分核定位信号。在一些实施例中,第一核定位信号是两组分核定位信号。在一些实施例中,第二核定位信号是单组分核定位信号。在一些实施例中,第二核定位信号是两组分核定位信号。在一些实施例中,第一核定位信号是两组分核定位信号,并且第二核定位信号是单组分核定位信号。在一些实施例中,单组分核定位信号是SV40大T抗原、核质蛋白、EGL-13、c-Myc、TUS蛋白核定位信号、或其组合。在一些实施例中,两组分核定位信号是经典的两组分核定位信号。在一些实施例中,第一核定位信号和第二核定位信号各自是两组分核定位信号。在一些实施例中,第一核定位信号是经典的两组分核定位信号,并且第二核定位信号是SV40大T抗原核定位信号。
在方法的一些实施例中,第一核定位信号直接附接至Cas9效应蛋白。在一些实施例中,第一核定位信号经由接头附接至Cas9效应蛋白。在一些实施例中,第二核定位信号直接附接至Cas9效应蛋白。在一些实施例中,第二核定位信号经由接头附接至Cas9效应蛋白。在一些实施例中,接头是具有2至30个残基的肽接头。
在方法的一些实施例中,蛋白质包含第一核定位信号的两个拷贝。在一些实施例中,蛋白质包含第一核定位信号的三个拷贝。在一些实施例中,蛋白质包含第二核定位信号的两个拷贝。在一些实施例中,蛋白质包含第二核定位信号的三个拷贝。
在方法的一些实施例中,Cas9效应蛋白衍生自具有II-B型CRISPR系统的细菌物种。在一些实施例中,Cas9效应蛋白包含与SEQ ID NO:10-97中的任一个具有至少95%同一性的多肽序列。在一些实施例中,Cas9效应蛋白包含以1E-5的E值截止值匹配TIGR03031蛋白家族的结构域。
在方法的一些实施例中,指导多核苷酸是RNA。在一些实施例中,指导多核苷酸的长度是19至30个碱基。在一些实施例中,指导多核苷酸的长度是19至25个碱基。在一些实施例中,指导多核苷酸的长度是21至26个碱基。在一些实施例中,指导多核苷酸进一步包含tracrRNA序列。
在方法的一些实施例中,Cas9效应蛋白产生粘性末端。在一些实施例中,粘性末端包含具有1至10个核苷酸的单链多核苷酸突出端。在一些实施例中,粘性末端包含具有2至6个核苷酸的单链多核苷酸突出端。在一些实施例中,粘性末端包含具有3至5个核苷酸的单链多核苷酸突出端。在实施例中,粘性末端是平末端。在实施例中,粘性末端具有5’单链多核苷酸突出端。在实施例中,粘性末端具有3’单链多核苷酸突出端。
在方法的一些实施例中,真核细胞是动物或人细胞。在一些实施例中,真核细胞是人细胞。在一些实施例中,真核细胞是植物细胞。
在方法的一些实施例中,修饰是靶序列的至少一部分的缺失。在一些实施例中,修饰是靶序列的突变。在一些实施例中,修饰是将目的序列插入靶序列中。
本披露还提供了用于减少细胞中Cas9效应蛋白降解的方法,该方法包括a)将第一核定位信号附接至该Cas9效应蛋白的N-末端;以及b)将第二核定位信号附接至该Cas9效应蛋白的C-末端。
在方法的实施例中,第一核定位信号是单组分核定位信号。在实施例中,第一核定位信号是两组分核定位信号。在实施例中,第二核定位信号是单组分核定位信号。在实施例中,第二核定位信号是两组分核定位信号。在实施例中,第一核定位信号是两组分核定位信号,并且第二核定位信号是单组分核定位信号。在实施例中,单组分核定位信号是SV40大T抗原、核质蛋白、EGL-13、c-Myc、TUS蛋白核定位信号、或其组合。在实施例中,两组分核定位信号是经典的两组分核定位信号。在实施例中,第一核定位信号是经典的两组分核定位信号,并且第二核定位信号是SV40大T抗原核定位信号。
附图说明
以下附图形成本说明书的一部分,并且被包括在内以进一步展示本发明的某些方面的示例性实施例。
图1提供了可用于本文所述Cas9效应蛋白的Cas9蛋白的氨基酸序列。
图2提供了可用于本文所述Cas9效应蛋白的Cas9蛋白的另外的氨基酸序列。
图3A是显示在不存在或存在以下抑制剂的情况下MHCas9表达的蛋白质印迹:1)浓度为5μM的蛋白酶体抑制剂MG132;2)浓度为20nM的溶酶体vATP酶抑制剂巴佛洛霉素(bafilomycin)A1;或3)浓度为10nM的核输出抑制剂来普霉素(leptomycin)B,如实例1中所述。图3B是使用MAPK对每种抑制剂和对照进行归一化的蛋白质印迹定量的条形图。
图4是显示以下Cas9构建体表达的蛋白质印迹:1)3xSV40-MHCas9;2)MHCas9-NLSSV40;3)3XNLSSV40-MHCas9-NLSSV40;和4)bpNLS-MHCas9-SLSSV40(SpOT-ON),如实例2中所述。检测作为转染对照的由克隆载体表达的GFP,并检测作为凝胶加载对照的微管蛋白。
图5示出了如实例3中所述的SpOT-ON(5A)或bpNLS-SpCas9-NLSSV40(5B)表达的蛋白质印迹。在不存在或存在以下抑制剂的情况下测试Cas9构建体:1)浓度为5μM的蛋白酶体抑制剂MG132;2)浓度为20nM的溶酶体vATP酶抑制剂巴佛洛霉素A1;或3)浓度为10nM的核输出抑制剂来普霉素B。
图6示出了如实例4中所述的SpOT-ON(MHCas9)或SpCas9在不同位点的DNA切割活性的滴定图。
图7示出了如实例5中所述使用不同前间区序列长度时DNA切割速度常数k的条形图。
图8示出了条形图,其绘制显示了如实例6中所述的EMX1位点(8A)和CD34位点(8B)处不同前间区序列长度的映射读数中突变读数的平均百分比。条形图表示如通过扩增子测序(Amplicon-Seq)和RIMA分析评估的靶向CD34或EMX1的n=3个不同PBMC供体的HEK293T细胞的平均编辑效率±SD。等位基因频率<0.1%被排除在分析之外。
图9示出了如实例7中所述的SpOT-ON和SPCas9的脱靶位点处的经修饰读数的百分比图。
图10示出了绘制如实例8中所述的在PAM的位置1、2和3处具有错配的DNA底物的切割速度常数的条形图。
图11示出了如实例9中所述的用23个核苷酸指导RNA测试的EMX1错配编辑的不同位置处的映射读数中突变读数的平均百分比的条形图。条形图表示如通过扩增子测序和RIMA分析评估的靶向EMX1的n=3个不同PBMC供体的HEK293T细胞的平均编辑效率±SD。等位基因频率<0.1%被排除在分析之外。
图12示出了如实例10中所述的EMX基因座(图12A)和CD34基因座(图12B)处DNA编辑的定性分析。图12C示出了在CD34基因座处SpCas9 DNA切割后DNA修复比较的定性分析。
图13是显示具有如图所示的不同突出端的底物的CD34基因座处非同源末端连接(NHEJ)敲入的百分比的条形图。如实例11中那样进行实验。图显示了插入的两个潜在方向性,其中深灰色代表正向(预期)插入,浅灰色代表反向插入。
图14是显示具有如图所示的不同突出端的底物的STAT1基因座处NHEJ敲入的百分比的条形图。如实例11中那样进行实验。图显示了插入的两个潜在方向性,其中深灰色代表正向(预期)插入,浅灰色代表反向插入。
具体实施方式
本披露提供了具有增强的稳定性的Cas9效应蛋白,该Cas9效应蛋白在其N-末端和C-末端上均包含核定位信号。本披露还提供了系统,其包含具有增强的稳定性的Cas9效应蛋白和与该Cas9效应蛋白复合的核酸指导序列。本披露还提供了用于在真核细胞中使用具有增强的稳定性的Cas9效应蛋白提供靶序列的位点特异性修饰的方法。本披露进一步提供了通过将核定位信号同时附接至Cas9效应蛋白的N-末端和C-末端来增强该蛋白质的稳定性的方法。
不希望受理论束缚,认为Cas9效应蛋白上另外的核定位信号的存在导致该蛋白质的核输入增强。这种增强的核输入导致Cas9效应蛋白在细胞质中停留的时间更少,在细胞质中它可以是溶酶体降解的底物,溶酶体降解是胞质蛋白的常见分解途径。在实施例中,本文所述的Cas9效应蛋白具有增强的稳定性,与不具有增强的稳定性的Cas9蛋白相比,保留了显著的Cas9效应子活性。
如本文所用,具有“增强的稳定性”的蛋白质意指在体内环境(例如细胞)或体外环境内部具有更长寿命的蛋白质。在一些实施例中,具有“增强的稳定性”的蛋白质可以对环境中的降解更具抗性,这是通过较少地暴露于降解蛋白质的因子(例如蛋白酶)和/或通过作为降解蛋白质的因子的较差底物(例如通过对蛋白质内键的切割更具抗性)来实现的。在实施例中,与呈未经修饰状态的蛋白质相比,“增强的稳定性”得到增强。在实施例中,与不具有核定位信号的Cas9效应蛋白相比,如本文所述的Cas9效应蛋白的“增强的稳定性”得到增强。在实施例中,与仅具有一个核定位信号的Cas9效应蛋白相比,如本文所述的Cas9效应蛋白的“增强的稳定性”得到增强。在实施例中,与仅具有一个附接至Cas9效应蛋白N-末端的核定位信号的Cas9效应蛋白相比,如本文所述的Cas9效应蛋白的“增强的稳定性”得到增强。在一些实施例中,Cas9效应蛋白的稳定性在表达30分钟、表达60分钟、表达90分钟、表达120分钟、表达150分钟、表达120分钟后增强大于10%、大于20%、大于30%、大于40%、大于50%、大于60%、大于70%、大于80%、大于90%、大于100%、大于120%、大于140%、大于160%、大于180%、大于200%、大于300%、或大于400%,如通过本领域技术人员已知的用于确定蛋白质数量的手段(例如,蛋白质印迹)或通过本领域技术人员已知的用于通过测量蛋白质的活性(例如,本文所述的活性测定)来确定蛋白质数量的手段测量的。
如本文所用,“一个/一种(a或an)”可以意指一个/一种或多个/多种。如本文所用,当与单词“包含”结合使用时,单词“一个/一种(a或an)”可以意指一个/一种或多于一个/一种。如本文所用,“另一个/另一种(another)”或“另一(further)”可以意指至少第二个/第二种或更多个/更多种。
在整个本申请中,术语“约”用于指示值包括被采用以确定该值的方法/装置的误差的固有变化,或者研究受试者之间存在的变化。典型地,术语“约”意指涵盖近似于或小于1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%或20%或更高变化,这取决于具体情况。在实施例中,本领域技术人员将理解由术语“约”指示的变化水平,这是由于其在本文中使用的上下文。还应理解,术语“约”的使用也包括特别列举的值。
权利要求书中使用术语“或”用于意指“和/或”,除非明确指示仅指替代方案或替代方案是相互排斥的,尽管本披露支持仅是指替代方案和“和/或”的定义。
如本文所用,术语“包含(comprising)”(以及包含的任何变体或形式,如“包含(comprise和comprises)”)、“具有(having)”(以及具有的任何变体或形式,如“具有(have和has)”)、“包括(including)”(以及包括的任何变体或形式,如“包括(includes和include)”)或者“含有(containing)”(以及含有的任何变体或形式,如“含有(contains和contain)”)是包括性的或开放式的,并且不排除另外的未列举的元素或方法步骤。
除非另有明确说明,否则术语“例如(for example)”及其对应的缩写“例如(e.g.)”(无论是否斜体)的使用意指所列举的特定术语是本披露的代表性示例和实施例,它们并不旨在限于所参考或引用的特定示例。
如本文所用,“之间”是包括范围末端的范围。例如,x与y之间的数值明确包括数值x和y,以及落在x和y内的任何数值。
Cas9效应蛋白
在实施例中,本披露提供了具有增强的稳定性的Cas9效应蛋白。在实施例中,本披露提供了Cas9效应蛋白,其包含多于一个核定位信号。在实施例中,本披露提供了Cas9效应蛋白,其包含:a)附接至该Cas9效应蛋白N-末端的第一核定位信号;和b)附接至该Cas9效应蛋白C-末端的第二核定位信号。
如本文所述,Cas蛋白是CRISPR-Cas系统的组分,该系统可尤其用于基因组编辑、基因调节、基因回路构建和功能基因组学。尽管Cas1和Cas2蛋白显现对所有目前鉴定的CRISPR系统通用,但Cas3、Cas9和Cas10蛋白被认为分别对I型、II型和III型CRISPR系统具有特异性。
在围绕CRISPR-Cas9系统(II型系统)的首次出版之后,已经在一系列细菌物种中鉴定出Cas9变体,并且已经对许多变体进行了功能性表征。参见,例如,Chylinski等人,“Classification and evolution of type II CRISPR-Cas systems[II型CRISPR-Cas系统的分类与进化]”,Nucleic Acids Research[核酸研究]42(10):6091-6105(2014),Ran等人,“In vivo genome editing using Staphylococcus aureus Cas9[使用金黄色葡萄球菌Cas9进行的体内基因组编辑]”,Nature[自然]520(7546):186-91(2015),以及Esvelt等人,“Orthogonal Cas9 proteins for RNA-guided gene regulation and editing[用于RNA指导基因调节和编辑的正交Cas9蛋白]”,Nature Methods[自然方法]10(11):1116-1121(2013),将其各自通过引用以其全文并入本文。
本披露涵盖了具有增强的Cas9稳定性的CRISPR-Cas9系统的新型效应蛋白。术语“Cas9”、“Cas9蛋白”和“Cas9效应蛋白”是可互换的,并且在本文中用于描述当在CRISPR-Cas9系统中使用时能够提供粘性末端、平末端或带切口的dsDNA的效应蛋白。
在实施例中,核定位信号是单组分核定位信号、两组分核定位信号或其组合。核定位信号(也称为核定位序列或NLS)是这样的氨基酸序列,其使具有该序列的蛋白质输入到细胞核。在实施例中,单组分核定位信号是具有被识别用于核输入的单个连续序列的信号。在实施例中,两组分核定位信号是具有由间隔子序列隔开的两个序列的信号,这两个序列被识别用于核输入。本文同时提供了单组分和两组分核定位信号的实例。
在Cas9效应蛋白的实施例中,第一核定位信号是单组分核定位信号。在实施例中,第一核定位信号是两组分核定位信号。在实施例中,第二核定位信号是单组分核定位信号。在实施例中,第二核定位信号是两组分核定位信号。
在实施例中,第一和第二核定位信号可以均是单组分核定位信号、均是两组分核定位信号或可以是单组分核定位信号和两组分核定位信号的混合物。在实施例中,第一核定位信号是两组分核定位信号,并且第二核定位信号是单组分核定位信号。在实施例中,第一核定位信号是单组分核定位信号,并且第二核定位信号是两组分核定位信号。在实施例中,第一核定位信号是单组分核定位信号,并且第二核定位信号是单组分核定位信号。在实施例中,第一核定位信号是两组分核定位信号,并且第二核定位信号是两组分核定位信号。
在实施例中,单组分核定位信号是本领域已知的单组分核定位信号。在实施例中,单组分核定位信号是表1中列出的单组分核定位信号中的一种或其组合。
表1-单组分核定位信号
在实施例中,两组分核定位信号是本领域已知的两组分核定位信号。在实施例中,两组分核定位信号是经典的两组分核定位信号。在实施例中,两组分核定位信号是表2中列出的两组分核定位信号中的一种或其组合。
表2-两组分核定位信号
NLS名称 | 序列 | SEQ ID NO: |
经典的两组分 | KRTADGSEFESPKKKRKV | 7 |
经典的两组分 | KRPAATKKAGQAKKKK | 8 |
经典的两组分 | KRPAATKKAGQAKKK | 9 |
在蛋白质的实施例中,第一核定位信号是经典的两组分核定位信号(SEQ ID NO:7),并且第二核定位信号是SV40大T抗原核定位信号(SEQ ID NO:1)。
在实施例中,使用本领域的标准方法将核定位信号附接至Cas9效应蛋白。在实施例中,使用标准分子生物学方法(如限制性内切酶消化和连接)将编码核定位信号的核酸序列置于编码Cas9效应蛋白的核酸序列的上游和下游,从而形成编码Cas9效应蛋白的核酸,该Cas9效应蛋白在其N-末端和C-末端包含核定位信号。随后该核酸可以在细胞(例如真核细胞)中表达。在其他实施例中,使用固相蛋白质合成方法完全或部分合成在其N-末端和C-末端包含核定位信号的Cas9效应蛋白。
在蛋白质的实施例中,第一核定位信号直接附接至Cas9效应蛋白。在实施例中,第一核定位信号经由接头附接至Cas9效应蛋白。在实施例中,第二核定位信号直接附接至Cas9效应蛋白。在实施例中,第二核定位信号经由接头附接至Cas9效应蛋白。
在使用接头的实施例中,接头是具有2至30个残基的肽接头。在实施例中,接头是具有2至20个残基的肽接头。在实施例中,接头是具有2至15个残基的肽接头。在实施例中,接头是具有2至10个残基的肽接头。在实施例中,接头是具有2至5个残基的肽接头。在实施例中,接头是经取代的或未经取代的C2-C20烷基、烯基或炔基链。
在实施例中,Cas9效应蛋白在其N-末端包含核定位信号的多于一个拷贝。在实施例中,Cas9效应蛋白在其N-末端包含核定位信号的多于一种类型。在实施例中,Cas9效应蛋白在其C-末端包含核定位信号的多于一个拷贝。在实施例中,Cas9效应蛋白在其C-末端包含核定位信号的多于一种类型。
在实施例中,蛋白质包含第一核定位信号的两个拷贝。在实施例中,蛋白质包含第一核定位信号的三个拷贝。在实施例中,蛋白质包含第二核定位信号的两个拷贝。在实施例中,蛋白质包含第二核定位信号的三个拷贝。
包含第一和第二核定位信号的Cas9蛋白的Cas9部分可以衍生自本领域已知的任何Cas9效应子结构域。在实施例中,Cas9效应蛋白衍生自具有II-B型CRISPR系统的细菌物种。合适的II-B型Cas9蛋白的实例描述于WO/2019/099943中,将其通过引用特此并入本文。在实施例中,合适的II-B型Cas9能够产生粘性末端。如本文所述,鉴定了II-B型CRISPR系统,尤其是通过cas操纵子上cas4基因的存在来鉴定,并且II-B型Cas9蛋白属于TIGR03031TIGRFAM蛋白家族。因此,在实施例中,Cas9部分属于TIGR03031 TIGRFAM蛋白家族。在实施例中,Cas9部分包含以1E-5的E值截止值匹配TIGR03031蛋白家族的结构域。在实施例中,位点特异性核酸酶包含以1E-10的E值截止值匹配TIGR03031蛋白家族的结构域。在例如像以下细菌物种中发现了II-B型CRISPR系统:嗜肺军团菌(Legionella pneumophila)、新凶手弗朗西斯氏菌(Francisella novicida)、γ变形菌HTCC5015、人粪便副萨特氏菌(Parasutterella excrementihominis)、华德萨特氏菌(Sutterella wadsworthensis)、硫磺单胞菌属物种(Sulfurospirillum sp.)SCADC、瘤胃杆菌属物种(Ruminobacter sp.)RM87、伯克霍尔德氏菌目(Burkholderiales)细菌1_1_47、拟杆菌门(Bacteroidetes)口腔分类群274菌株F0058、产琥珀酸沃廉氏菌(Wolinella succinogenes)、伯克霍尔德氏菌目细菌YL45、嗜淀粉瘤胃杆菌(Ruminobacter amylophilus)、弯曲杆菌属物种(Campylobacter sp.)P0111、弯曲杆菌属物种RM9261、拉尼尔弯曲杆菌(Campylobacterlanienae)菌株RM8001、拉尼尔弯曲杆菌菌株P0121、鼠毛滴虫(Turicimonas muris)、伦敦军团菌(Legionella londiniensis)、沙姆盐弧菌(Salinivibrio sharmensis)、钩端螺旋体属物种(Leptospira sp.)分离株FW.030、莫里特拉氏菌属物种(Moritella sp.)分离株NORP46、内生单胞菌属物种(Endozoicomonassp.)S-B4-1U、喜盐泰米尔纳德菌(Tamilnaduibacter salinus)、需钠弧菌(Vibrio natriegens)、斯氏弓形杆菌(Arcobacter skirrowii)、蜃楼弗朗西斯氏菌(Francisella philomiragia)、西班牙弗朗西斯氏菌(Francisella hispaniensis)或嗜盐副内生单胞菌(Parendozoicomonashaliclonae)。
在一些实施例中,Cas9能够产生双链多核苷酸切割,例如双链DNA切割。在一些实施例中,Cas9可以包括一个或多个核酸酶结构域(如RuvC和HNH),并且可以切割双链DNA。在一些实施例中,Cas9可以包含RuvC结构域和HNH结构域,其各自切割双链DNA的一条链。在一些实施例中,Cas9产生平末端。在一些实施例中,Cas核酸酶的RuvC和HNH在相同位置处切割每条DNA链,从而产生平末端。在一些实施例中,Cas9产生粘性末端。在一些实施例中,Cas9的RuvC和HNH在不同位置处切割每条DNA链(即,在“偏移”处切割),从而产生粘性末端。如本文所用,术语“粘性末端(cohesive end)”、“交错末端”或“粘性末端(sticky end)”是指具有长度不等的链的核酸片段。与“平末端”相反,粘性末端是由双链核酸(例如,DNA)上的交错切割产生的。粘性末端(sticky或cohesive end)具有突出的单链(这些链具有不成对的核苷酸)或突出端(例如,3′或5′突出端)。
在实施例中,术语Cas9是指工程化的Cas9变体,例如像deadCas9-FokI、Cas9nD10A-FokI和Cas9nH840A-FokI。在本披露的实施例中,Cas9效应蛋白包含:a)附接至该Cas9效应蛋白N-末端的第一核定位信号;和b)附接至该Cas9效应蛋白C-末端的第二核定位信号。
在一些实施例中,Cas9(例如融合蛋白的Cas9结构域)包含核酸酶灭活的Cas9(例如,缺乏DNA切割活性的Cas9;“dCas9”),该Cas9保留了RNA(gRNA)结合活性,因此能够结合与gRNA互补的靶位点。在实施例中,融合蛋白包含dCas9结构域与转录调节子结构域之间的接头。在实施例中,dCas9结构域与转录激活因子或阻遏因子结构域融合,形成dCas9转录调节子,该dCas9转录调节子可通过互补的gRNA序列引导至特定的靶位点。本文描述了接头的实例。在实施例中,dCas9结构域和转录调节子结构域的融合蛋白具有如本文所述的附接至dCas9结构域N-末端的核定位信号和附接至转录调节子结构域C-末端的核定位信号。
在实施例中,dCas9结构域是作为阻断转录的障碍起作用的dCas9结构域。在实施例中,dCas9结构域可以在空间上阻断RNA聚合酶的转录延伸。
在实施例中,dCa9结构域与VP64转录激活结构域融合。在实施例中,使用SunTag基因激活系统修饰dCas9结构域,其中利用小肽GCN4的串联重复序列来募集与转录激活因子VP64融合的单链可变片段的多个拷贝。在实施例中,使用协同激活介质(SAM)系统修饰dCas9结构域,其中dCas9与VP64融合,并且sgRNA已被修饰为含有两个MS2 RNA适配体以募集MS2噬菌体外壳蛋白(MCP),该MS2噬菌体外壳蛋白与转录激活因子p65和热休克因子1(HSF1)融合。在实施例中,用VP64-p65-Rta(VPR)修饰dCas9结构域用于基因激活,其中dCas9与组合VPR转录激活因子结构域融合以放大激活效应。在实施例中,用scRNA修饰dCas9结构域用于同时进行基因激活和抑制,其中偶联sgRNA和RNA适配体(例如,MS2、com、PP7)的杂交RNA支架可以募集束缚至转录激活因子或阻遏因子的RNA结合蛋白(例如,MCP、COM、PCP)。
在实施例中,用化学或光控制的二聚化系统修饰dCas9结构域,其中化学或光诱导的二聚化因子(例如,PYL1::ABI、GID::GAI和PhyB::PIF)分别与dCas9和转录效应子融合。在这些实施例中,添加相应的化学品(例如,脱落酸[ABA]或赤霉素[GA])或光可以诱导基因调节。在实施例中,使用分拆式dCas系统或受体偶联系统:I/O分子装置来修饰dCas9结构域。
在实施例中,dCas9是第二代或第三代转录调节子,如描述于Xu等人,“A CRISPR-dCas Toolbox for Genetic Engineering and Synthetic Biology[用于基因工程化和合成生物学的CRISPR-dCas工具箱],”J.Mol.Biol.[分子生物学杂志],2019,431:34-47,将其通过引用特此并入本文。
在实施例中,dCas9是用于表观基因组工程化的dCas9融合蛋白。在实施例中,用于表观基因组工程化的dCas9是dCas9融合蛋白,如描述于Xu等人,J.Mol.Biol.[分子生物学杂志],2019,431:34-47,将其通过引用特此并入本文。在实施例中,dCas9与甲基转移酶(例如,DNMT3A、DNMT3B或DNMT3L)融合。在实施例中,dCas9与KRAB结构域融合。在实施例中,dCas9与DNA脱甲基酶(例如,TET1)融合。在实施例中,dCas9与组蛋白甲基转移酶(例如,PRDM9或DOT1L)融合。在实施例中,dCas9与组蛋白脱甲基酶(例如,LSD1)融合。在实施例中,dCas9与组蛋白乙酰转移酶(例如,p300)融合。在实施例中,dCas9与组蛋白脱乙酰酶(例如,HDAC1、HDAC2、HDAC3、HDAC4、HDAC5、HDAC6、HDAC7、HDAC8、HDAC9、HDAC 10或HDAC11,或者SIRT1、SIRT2、SIRT3、SIRT4、SIRT5、SIRT6或SIRT7)融合。
在实施例中,dCas9是用于基因组成像的dCas9融合蛋白。在实施例中,用于基因组成像的dCas9是dCas9融合蛋白,如描述于Xu等人,J.Mol.Biol.[分子生物学杂志],2019,431:34-47,将其通过引用特此并入本文。在实施例中,dCas9与荧光蛋白(例如,绿色荧光蛋白、黄色荧光蛋白、蓝色荧光蛋白、青色荧光蛋白、橙色荧光蛋白或红色荧光蛋白)融合。
在实施例中,dCas9是用于碱基编辑的dCas9融合蛋白。在实施例中,dCas9与胞嘧啶碱基编辑器融合。在实施例中,dCas9与腺嘌呤碱基编辑器融合。在实施例中,dCas9与尿嘧啶碱基编辑器融合。在实施例中,dCas9与胞苷脱氨酶融合。在实施例中,dCas9与腺嘌呤脱氨酶融合。在实施例中,dCas9与尿嘧啶DNA糖基化酶融合。
在实施例中,Cas9结构域是用于碱基编辑的Cas9切口酶融合蛋白。如本文所用,“Cas9切口酶”是仅切割靶DNA的一条链的Cas9蛋白。在实施例中,Cas9切口酶与胞嘧啶碱基编辑器融合。在实施例中,Cas9切口酶与腺嘌呤碱基编辑器融合。在实施例中,Cas9切口酶与尿嘧啶碱基编辑器融合。在实施例中,Cas9切口酶与胞苷脱氨酶融合。在实施例中,Cas9切口酶与腺嘌呤脱氯酶融合。在实施例中,Cas9切口酶与尿嘧啶DNA糖基化酶融合。在实施例中,Cas9结构域是用于碱基编辑的Cas9切口酶融合物,如描述于US 2018/0312828、US2018/0237787和US 2020/0010835,将其各自通过引用特此并入本文。
在实施例中,Cas9结构域是用于先导编辑的Cas9切口酶融合蛋白。在实施例中,Cas9切口酶与逆转录酶融合。在实施例中,Cas9结构域是用于先导编辑的Cas9切口酶融合物,如WO 2020/191248中所述,将其通过引用特此并入本文。
在实施例中,Cas9效应蛋白包含与如图1和图2所示的SEQ ID NO:10-97中的任一个具有至少95%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与如图1和图2所示的SEQ ID NO:10-97中的任一个具有至少90%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与如图1和图2所示的SEQ ID NO:10-97中的任一个具有至少98%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与如图1和图2所示的SEQ ID NO:10-97中的任一个具有至少99%同一性的多肽序列。在实施例中,Cas9效应蛋白包含选自如图1和图2所示的SEQ IDNO:10-97中的任一个的多肽。
在实施例中,Cas9效应蛋白包含与SEQ ID NO:71具有至少95%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与SEQ ID NO:71具有至少90%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与SEQ ID NO:71具有至少98%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与SEQ ID NO:71具有至少99%同一性的多肽序列。在实施例中,Cas9效应蛋白包含SEQ ID NO:71。
在蛋白质的实施例中,Cas9效应蛋白包含与SEQ ID NO:98具有至少90%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与SEQ ID NO:98具有至少95%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与SEQ ID NO:98具有至少98%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与SEQ ID NO:98具有至少99%同一性的多肽序列。在实施例中,Cas9效应蛋白包含SEQ ID NO:98。
在一些实施例中,Cas9效应蛋白包含在以下的一个或多个位置处包括氨基酸修饰的SEQ ID NO:98:SEQ ID NO:98的R1336、R1389、R668、N1164、N1265、N1300、N1412、N347、N348、N562、N565、N618、N651、D1266、D309、D345、D487、D607、D30、Q1129、Q1381、Q624、Q661、Q713、Q734、E1032、E1409、E436、E610、E611、E691、E697、G1245、G1335、H777、I1242、L125、L1162、L1264、L1299、K1031、K443、K490、K615、K656、F1035、F620、F636、F670、S1243、S1334、S1380、S1410、S1413、S634、S638、S711、S1006、S1017、T1267、T1333、T551、T639、T639、T640、T666、T897、Y1338、Y343、Y566、V1273、V1274、V486、V644、V660、V667、V736,或其组合。
在一些实施例中,氨基酸修饰包括以下突变中的一个或多个:R668A、N1164R、N1265R、N1300R、N1412R、N347R、N348R、N562R、N565R、N618R、N651A、N651R、D1266R、D309R、D345R、D487R、D607R、Q1129R、Q1381A、Q1381A、Q1381R、Q624R、Q661A、Q661R、Q713R、Q734R、E1032G、E1032R、E1409A、E1409R、E436R、E610R、E611R、E691R、E697R、G1245R、G1335R、H777A、I1242S、L125R、L125Y、L1162S、L1264S、L1299S、K1031R、K443R、K490R、K615R、K656R、F1035R、F620R、F636R、F670Y、S1243R、S1334A、S1334A、S1334R、S1380R、S1410R、S1413R、S634R、S638A、S638R、S711R、S1006R、S1017R、T1267A、T1267R、T1333A、T1333R、T551R、T639A、T639R、T640R、T666R、T897R、Y1338A、Y1338R、Y343R、Y566R、V1273S、V1274S、V486R、V644R、V660R、V660Y、V667R、V667S、V736R或V736Y。在一些实施例中,氨基酸修饰包括以下突变中的一个或多个:N1164R、N1265R、N1300R、N1412R、N347R、N651A、D1266R、D309R、D345R、D487R、D607R、Q1129R、Q1381A、Q1381A、Q1381R、Q661A、Q713R、Q734R、E1032G、E1032R、E1409A、E436R、E611R、E691R、E697R、G1335R、L125R、L1264S、L1299S、K1031R、K490R、K615R、K656R、F636R、S1334A、S1334A、S1334R、S1380R、S1410R、S1413R、S634R、S638R、S711R、S1006R、S1017R、T1267A、T1267R、T551R、Y1338A、Y1338R、V1273S、V1274S、V486R、V644R、V736R或V736Y。在一些实施例中,氨基酸修饰包括以下突变中的一个或多个:N1265R、N1300R、N1412R、D1266R、E436R、G1335R、S1334R、S1380R、S1017R、T1267R、V736R或V736Y。
在一些实施例中,氨基酸修饰导致Cas9效应蛋白与DNA之间的结合亲和力增加。
CRISPR-Cas系统
在实施例中,本披露提供了CRISPR-Cas系统,其包含具有增强的稳定性的Cas9效应蛋白。
通常,CRISPR或CRISPR-Cas或CRISPR系统的特征在于促进靶序列位点处CRISPR复合物形成的元件(在内源性CRISPR系统的背景下也称为前间区序列)。在CRISPR复合物形成的背景下,“靶序列”是指设计指导多核苷酸靶向的序列,例如,它们具有互补性,其中靶序列与指导多核苷酸之间的杂交促进了CRISPR复合物的形成。指导多核苷酸中与靶序列互补的对于切割活性可能重要的节段在本文中称为指导序列。靶序列可以包含任何多核苷酸,如DNA或RNA多核苷酸,并且可能位于目的靶基因座内。在实施例中,靶序列位于细胞的细胞核或细胞质中。在实施例中,靶序列位于染色体(TSC)上。在实施例中,靶序列位于载体(TSV)上。
在实施例中,本披露提供了CRISPR-Cas系统,其包含:
a)Cas9效应蛋白,该Cas9效应蛋白包含:i)附接至该Cas9效应蛋白N-末端的第一核定位信号;和ii)附接至该Cas9效应蛋白C-末端的第二核定位信号;以及
b)指导多核苷酸,该指导多核苷酸包含指导序列并且与该Cas9效应蛋白形成复合物,其中该指导序列能够与真核细胞中的靶序列杂交。
在实施例中,本披露提供了CRISPR-Cas系统,其包含:
a)编码Cas9效应蛋白的核酸序列,该Cas9效应蛋白包含:i)附接至该Cas9效应蛋白N-末端的第一核定位信号;和ii)附接至该Cas9效应蛋白C-末端的第二核定位信号;以及
b)编码指导多核苷酸的核酸序列,该指导多核苷酸包含指导序列并且与该Cas9效应蛋白形成复合物,其中该指导序列能够与真核细胞中的靶序列杂交。
在该系统的实施例中,(a)和(b)的核苷酸序列在相同启动子的控制下。在实施例中,(a)和(b)的核苷酸序列在不同启动子的控制下。
如本文所用,“启动子”,“启动子序列”或“启动子区域”是指能够结合RNA聚合酶并涉及起始下游编码或非编码序列的转录的DNA调节区/序列。在本披露的一些实例中,启动子序列包括转录起始位点并向上游延伸以包括以高于背景可检测水平起始转录所使用的最少数目的碱基或元件。在实施例中,启动子序列包括转录起始位点以及负责RNA聚合酶结合的蛋白质结合结构域。真核启动子通常但并非总是含有“TATA”盒和“CAT”盒。各种启动子(包括诱导型启动子)可用于驱动本披露的各种载体。
在实施例中,(a)和(b)的核苷酸序列在真核启动子的控制下。在实施例中,(a)和(b)的核苷酸序列在两种不同的真核启动子的控制下。在实施例中,真核启动子中的至少一种是在人诱导多能干细胞中具有活性的启动子。在实施例中,真核启动子中的至少一种是EF1α(EF1a)。在实施例中,真核启动子中的至少一种是人巨细胞病毒(CMV)启动子。在实施例中,真核启动子中的至少一种是多西环素可调节启动子TRE3G。在实施例中,(a)和(b)的核苷酸序列在细菌启动子的控制下。在实施例中,(a)和(b)的核苷酸序列在两种不同的细菌启动子的控制下。在实施例中,(a)和(b)的核苷酸序列在病毒启动子的控制下。在实施例中,(a)和(b)的核苷酸序列在两种不同的病毒启动子的控制下。
在实施例中,(a)和(b)的核酸序列在单个载体中。在实施例中,(a)和(b)的核酸序列在单独的载体中。
在实施例中,本披露提供了CRISPR-Cas系统,其包含一个或多个含有以下的载体:
a)与一个或多个编码Cas9效应蛋白的核苷酸序列可操作地连接的调节元件,该Cas9效应蛋白包含:i)附接至该Cas9效应蛋白N-末端的第一核定位信号;和ii)附接至该Cas9效应蛋白C-末端的第二核定位信号;以及
b)指导多核苷酸,该指导多核苷酸包含指导序列并且与该Cas9效应蛋白形成复合物,其中该指导序列能够与真核细胞中的靶序列杂交。
在该系统的实施例中,调节元件是真核调节元件。在该系统的实施例中,调节元件是原核调节元件。
在实施例中,编码Cas9效应蛋白和指导多核苷酸的核苷酸在单个载体上。在实施例中,编码Cas9效应蛋白、指导多核苷酸(或可以转录成指导多核苷酸的核苷酸)和tracrRNA的核苷酸在单个载体上。在实施例中,编码Cas9效应蛋白、指导多核苷酸(或可以转录成指导多核苷酸的核苷酸)、tracrRNA和同向重复序列的核苷酸在单个载体上。在实施例中,载体是表达载体。在实施例中,载体是哺乳动物表达载体。在实施例中,载体是人表达载体。在实施例中,载体是植物表达载体。
在实施例中,编码Cas9效应蛋白和指导多核苷酸的核苷酸是单个核酸分子。在实施例中,编码Cas9效应蛋白、指导多核苷酸和tracrRNA的核苷酸是单个核酸分子。在实施例中,编码Cas9效应蛋白、指导多核苷酸、tracrRNA和同向重复序列的核苷酸是单个核酸分子。在实施例中,单个核酸分子是表达载体。在实施例中,单个核酸分子是哺乳动物表达载体。在实施例中,单个核酸分子是人表达载体。在实施例中,单个核酸分子是植物表达载体。
“可操作地连接”意指目的核苷酸(即编码Cas9效应蛋白的核苷酸)以允许核苷酸序列表达的方式与调节元件连接。因此,在实施例中,载体是表达载体。
在实施例中,调节元件是启动子。在实施例中,调节元件是细菌启动子。在实施例中,调节元件是病毒启动子。在实施例中,调节元件是真核调节元件,即真核启动子。在实施例中,真核调节元件是哺乳动物启动子。
在任一上述系统的实施例中,第一核定位信号是单组分核定位信号。在实施例中,第一核定位信号是两组分核定位信号。在实施例中,第二核定位信号是单组分核定位信号。在实施例中,第二核定位信号是两组分核定位信号。
在实施例中,第一和第二核定位信号可以均是单组分核定位信号、均是两组分核定位信号或可以是单组分核定位信号和两组分核定位信号的混合物。在实施例中,第一核定位信号是两组分核定位信号,并且第二核定位信号是单组分核定位信号。在实施例中,第一核定位信号是单组分核定位信号,并且第二核定位信号是两组分核定位信号。在实施例中,第一核定位信号是单组分核定位信号,并且第二核定位信号是单组分核定位信号。在实施例中,第一核定位信号是两组分核定位信号,并且第二核定位信号是两组分核定位信号。
在任一上述系统的实施例中,单组分核定位信号是本领域已知的单组分核定位信号。在实施例中,单组分核定位信号是上文表1中列出的单组分核定位信号(SEQ ID NO:1-6)中的一种或其组合。
在任一上述系统的实施例中,两组分核定位信号是本领域已知的两组分核定位信号。在实施例中,两组分核定位信号是经典的两组分核定位信号。在实施例中,两组分核定位信号是上文表2中列出的两组分核定位信号(SEQ ID NO:7-9)中的一种或其组合。
在任一上述系统的实施例中,第一核定位信号是经典的两组分核定位信号(SEQID NO:7),并且第二核定位信号是SV40大T抗原核定位信号(SEQ ID NO:1)。
在任一上述系统的实施例中,第一核定位信号直接附接至Cas9效应蛋白。在实施例中,第一核定位信号经由接头附接至Cas9效应蛋白。在实施例中,第二核定位信号直接附接至Cas9效应蛋白。在实施例中,第二核定位信号经由接头附接至Cas9效应蛋白。
在使用接头的实施例中,接头是具有2至30个残基的肽接头。在实施例中,接头是具有2至20个残基的肽接头。在实施例中,接头是具有2至15个残基的肽接头。在实施例中,接头是具有2至10个残基的肽接头。在实施例中,接头是具有2至5个残基的肽接头。在实施例中,接头是经取代的或未经取代的C2-C20烷基、烯基或炔基链。
在任一上述系统的实施例中,Cas9效应蛋白在其N-末端包含核定位信号的多于一个拷贝。在实施例中,Cas9效应蛋白在其N-末端包含核定位信号的多于一种类型。在实施例中,Cas9效应蛋白在其C-末端包含核定位信号的多于一个拷贝。在实施例中,Cas9效应蛋白在其C-末端包含核定位信号的多于一种类型。
在任一上述系统的实施例中,蛋白质包含第一核定位信号的两个拷贝。在实施例中,蛋白质包含第一核定位信号的三个拷贝。在实施例中,蛋白质包含第二核定位信号的两个拷贝。在实施例中,蛋白质包含第二核定位信号的三个拷贝。
在任一上述系统的实施例中,包含第一和第二核定位信号的Cas9蛋白的Cas9部分可以衍生自本领域已知的任何Cas9效应子结构域。在实施例中,Cas9效应蛋白衍生自具有II-B型CRISPR系统的细菌物种。上文描述了合适的II-B型Cas9蛋白的实例。在实施例中,Cas9部分包含以1E-5的E值截止值匹配TIGR03031蛋白家族的结构域。在实施例中,位点特异性核酸酶包含以1E-10的E值截止值匹配TIGR03031蛋白家族的结构域。
在任一上述系统的实施例中,Cas9效应蛋白包含与如图1和图2所示的SEQ ID NO:10-97中的任一个具有至少95%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与如图1和图2所示的SEQ ID NO:10-97中的任一个具有至少90%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与如图1和图2所示的SEQ ID NO:10-97中的任一个具有至少98%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与如图1和图2所示的SEQ ID NO:10-97中的任一个具有至少99%同一性的多肽序列。在实施例中,Cas9效应蛋白包含选自如图1和图2所示的SEQ ID NO:10-97中的任一个的多肽。
在任一上述系统的实施例中,Cas9效应蛋白包含与SEQ ID NO:71具有至少95%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与SEQ ID NO:71具有至少90%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与SEQ ID NO:71具有至少98%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与SEQ ID NO:71具有至少99%同一性的多肽序列。在实施例中,Cas9效应蛋白包含SEQ ID NO:71。
在任一上述系统的实施例中,Cas9效应蛋白包含与SEQ ID NO:98具有至少90%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与SEQ ID NO:98具有至少95%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与SEQ ID NO:98具有至少98%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与SEQ ID NO:98具有至少99%同一性的多肽序列。在实施例中,Cas9效应蛋白包含SEQ ID NO:98。
在任一上述系统的其他实施例中,Cas9效应蛋白的Cas9部分包含dCas9,即缺乏DNA双链断裂活性的失活或“死亡”的Cas9。在实施例中,dCas9可以与其它活性结构域(例如如本文其他地方描述的转录调节子、表观遗传调节蛋白或荧光蛋白)融合。在dCas9与另一个活性结构域融合的实施例中,本文所述的核定位信号存在于整个Cas9效应蛋白构建体的N-末端和C-末端。
在任一上述系统的其他实施例中,Cas9效应蛋白的Cas9部分包含Cas9切口酶,即仅切割DNA双链的一条链的Cas9蛋白。在实施例中,Cas9切口酶可以与其它活性结构域(例如如本文其他地方描述的转录调节子、表观遗传调节蛋白或荧光蛋白)融合。在Cas9切口酶与另一个活性结构域融合的实施例中,本文所述的核定位信号存在于整个Cas9效应蛋白构建体的N-末端和C-末端。
本文所述的系统和方法可以包含指导多核苷酸。在实施例中,指导多核苷酸是RNA。与CRISPR-Cas9组分结合并将其靶向靶DNA内特定位置的RNA在本文中称为“指导RNA”、“gRNA”或“小指导RNA”,并且在本文中也可称为“DNA靶向RNA”。指导多核苷酸(例如指导RNA)包含至少两个核苷酸区段:至少一个“DNA结合区段”和至少一个“多肽结合区段”。“区段”意指分子的部分、节段或区域,例如,指导多核苷酸分子的核苷酸的连续延伸段。除非另有明确定义,否则“区段”的定义不限于特定数目的总碱基对。
在实施例中,指导多核苷酸的DNA结合区段与真核细胞中的靶序列杂交,但不与细菌细胞中的序列杂交。如本文所用,细菌细胞中的序列是指细菌生物体原生的多核苷酸序列,即天然存在的细菌多核苷酸序列或细菌起源的序列。例如,该序列可以是细菌染色体或细菌质粒,或者是在细菌细胞中天然存在的任何其他多核苷酸序列。
在实施例中,指导多核苷酸的多肽结合区段与如本文所述的具有增强的稳定性的Cas9效应蛋白结合。
在实施例中,指导多核苷酸是10至150个核苷酸。在实施例中,指导多核苷酸是20至120个核苷酸。在实施例中,指导多核苷酸是30至100个核苷酸。在实施例中,指导多核苷酸是40至80个核苷酸。在实施例中,指导多核苷酸是50至60个核苷酸。在实施例中,指导多核苷酸是10至35个核苷酸。在实施例中,指导多核苷酸是15至30个核苷酸。在实施例中,指导多核苷酸是20至25个核苷酸。
可以将指导多核苷酸(例如,指导RNA)作为分离的分子(例如,RNA分子)引入靶细胞中,或使用含有编码指导多核苷酸(例如,指导RNA)的DNA的表达载体将其引入细胞中。
指导多核苷酸(例如,指导RNA)的“DNA结合区段”(或“DNA靶向序列”)包含与靶DNA内的特定序列互补的核苷酸序列。
本披露的指导多核苷酸(例如,指导RNA)可以包括多肽结合序列/区段。指导多核苷酸(例如,指导RNA)的多肽结合区段(或“蛋白结合序列”)与本披露的Cas蛋白的多核苷酸结合结构域相互作用。这样的多肽结合区段或序列是本领域技术人员已知的,例如,美国专利申请公开2014/0068797、2014/0273037、2014/0273226、2014/0295556、2014/0295557、2014/0349405、2015/0045546、2015/0071898、2015/0071899和2015/0071906中披露的那些,将其披露内容以其全文并入本文。
在一些实施例中,多肽结合区段已被修饰以改善与本发明多肽的结合。Riesenberg等人(Nature eommunications[自然通讯],2021)及其参考文献中描述了修饰多肽结合区段以改善结合的方法。适用于SEQ ID NO.98的指导RNA的优化多肽结合区段在表3中显示为SEQ ID NO:100-107。SEQ ID NO:99是适用于优化前的SEQ ID NO:98的多肽结合区段序列。在一些实施例中,指导RNA包含选自SEQ ID NO.99、SEQ ID NO.100、SEQ IDNO.101、SEQ ID NO.102、SEQ ID NO.103、SEQ ID NO.104、SEQ ID NO.105、SEQ ID NO.106或SEQ ID NO.107的序列。
表3
在本披露的实施例中,Cas9效应蛋白和指导多核苷酸可以形成复合物。“复合物”是两个或更多个缔合的核酸和/或多肽的组。在实施例中,当复合物的所有组分一起存在时,形成复合物,即自组装复合物。在实施例中,通过复合物的不同组分之间的化学相互作用(例如像氢键合)形成复合物。在实施例中,通过Cas9效应蛋白对指导多核苷酸的二级结构识别,该指导多核苷酸与该Cas9效应蛋白形成复合物。在实施例中,Cas9效应蛋白是无活性的,即,不展现出核酸酶活性,直到它与指导多核苷酸形成复合物。指导RNA的结合诱导Cas9效应蛋白的构象变化,以将Cas9效应蛋白从无活性形式转化为活性(即,催化活性)形式。
在任一上述系统的实施例中,指导序列的长度是19至30个碱基。在实施例中,指导序列的长度是19至25个碱基。在实施例中,指导序列的长度是21至26个碱基。
在任一上述系统的实施例中,指导多核苷酸进一步包含tracrRNA序列。“tracrRNA”或反式激活CRISPR-RNA与前体crRNA或前体CRISPR-RNA形成RNA双链体,然后被RNA特异性核糖核酸酶RNA酶III切割,形成crRNA/tracrRNA杂交体。在实施例中,指导RNA包含crRNA/tracrRNA杂交体。在实施例中,指导RNA的tracrRNA组分激活Cas9效应蛋白。
在本文披露的系统的实施例中,Cas9效应蛋白、指导多核苷酸和tracrRNA能够形成复合物。
在任一上述系统的实施例中,Cas9效应蛋白产生粘性末端。在实施例中,由Cas9效应蛋白产生的粘性末端包含5’突出端。在实施例中,由Cas9效应蛋白产生的粘性末端包含3’突出端。在实施例中,粘性末端包含具有1至10个核苷酸的单链多核苷酸突出端。在实施例中,粘性末端包含具有2至6个核苷酸的单链多核苷酸突出端。在实施例中,粘性末端包含具有3至5个核苷酸的单链多核苷酸突出端。
在实施例中,Cas9效应蛋白优选在5′端具有多个核苷酸的粘性末端。在实施例中,Cas9效应蛋白优选在5′端具有3个核苷酸的粘性末端。在实施例中,Cas9效应蛋白优选在5′端具有2、3、4、5或6个核苷酸的粘性末端。在实施例中,这种优选与传统使用的酿脓链球菌(S.pyogenes)Cas9(SpCas9)相反,后者优选单个核苷酸5′粘性末端。
在实施例中,单个核苷酸5′粘性末端的存在可用于指导目的核酸以特定方向插入。在实施例中,5′粘性末端上三个核苷酸的存在可用于指导目的核酸以特定方向插入。在实施例中,5′粘性末端上两个、三个、四个、五个或六个核苷酸的存在可用于指导目的核酸以特定方向插入。
细胞
在实施例中,本披露提供了真核细胞,其包含如本文所述的Cas9效应蛋白。在实施例中,本披露还提供了真核细胞,其包含含有如本文所述的Cas9效应蛋白的系统。
在实施例中,真核细胞是动物或人细胞。在实施例中,真核细胞是人或啮齿动物或牛细胞系或者细胞株。这样的细胞、细胞系或细胞株的实例包括但不限于小鼠骨髓瘤(NSO)细胞系、中国仓鼠卵巢(CHO)细胞系、HT1080、H9、HepG2、MCF7、MDBK Jurkat、NIH3T3、PCI2、BHK(幼仓鼠肾细胞)、VERO、SP2/0、YB2/0、Y0、C127、L细胞、COS(例如COS1和COS7)、QC1-3、HEK-293、VERO、PER.C6、HeLA、EB1、EB2、EB3、溶瘤或杂交瘤细胞系。在实施例中,真核细胞是CHO细胞系。在实施例中,真核细胞是CHO细胞。在实施例中,细胞是CHO-K1细胞、CHO-K1 SV细胞、DG44 CHO细胞、DUXB11 CHO细胞、CHOS、CHO GS敲除细胞、CHO FUT8 GS敲除细胞、CHOZN、或CHO衍生的细胞。CHO GS敲除细胞(例如,GSKO细胞)是例如CHO-K1 SV GS敲除细胞。CHO FUT8敲除细胞是例如CHOK1 SV(龙沙生物公司(Lonza Biologics,Inc.))。真核细胞也可以是鸟类细胞、细胞系或细胞株,例如像细胞、EB14、EB24、EB26、EB66或EBvl3。
在实施例中,真核细胞是人细胞。在实施例中,人细胞是干细胞。这些干细胞可以是例如多能干细胞,包括胚胎干细胞(ESC)、成体干细胞、诱导多能干细胞(iPSC)、组织特异性干细胞(例如,造血干细胞)和间充质干细胞(MSC)。在实施例中,人细胞是本文所述的任一细胞的分化形式。在实施例中,真核细胞是衍生自培养中的任何原代细胞的细胞。在实施例中,细胞是干细胞或干细胞系。
在实施例中,真核细胞是肝细胞,如人肝细胞、动物肝细胞或非实质细胞。例如,真核细胞可以是可铺板培养的代谢合格的人肝细胞、可铺板培养的诱导合格的人肝细胞、可铺板培养的Qualyst Transporter CertifiedTM人肝细胞、悬浮合格的人肝细胞(包括10-供体和20-供体合并的肝细胞)、人肝库普弗(hepatic kupffer)细胞、人肝星形细胞、犬肝细胞(包括单个的和合并的比格犬肝细胞)、小鼠肝细胞(包括CD-1和C57BI/6肝细胞)、大鼠肝细胞(包括Sprague-Dawley、Wistar Han和Wistar肝细胞)、猴肝细胞(包括食蟹猴或恒河猴肝细胞)、猫肝细胞(包括短毛家猫肝细胞)和兔肝细胞(包括新西兰白兔肝细胞)。
在实施例中,真核细胞是植物细胞。例如,植物细胞可以属于如木薯、玉米、高粱、小麦或水稻等农作物。植物细胞可以属于藻类、树木或蔬菜。植物细胞可以属于单子叶植物或双子叶植物,或者可以属于农作物或谷物植物、生产植物、水果或蔬菜。例如,植物细胞可以属于树木,例如柑橘属树木,如橘子树、葡萄柚树或柠檬树;桃树或油桃树;苹果树或梨树;坚果树,如杏仁树或核桃树或开心果树;茄属植物,即马铃薯;芸苔属(Brassica)植物;莴苣属(Lactuca)植物;菠菜属(Spinacia)植物;辣椒属(Capsicum)植物;棉花、烟草、芦笋、胡萝卜、卷心菜、西兰花、花椰菜、番茄、茄子、胡椒、生菜、菠菜、草莓、蓝莓、覆盆子、黑莓、葡萄、咖啡、可可等。
递送颗粒
在实施例中,本披露提供了递送颗粒,其包含如本文所述的Cas9效应蛋白。在实施例中,本披露还提供了递送颗粒,其包含含有如本文所述Cas9效应蛋白的系统。
在递送颗粒包含如本文所述的系统的实施例中,Cas9效应蛋白和指导多核苷酸以复合物存在。在实施例中,复合物进一步包含含有tracrRNA序列的多核苷酸。
在实施例中,递送颗粒是基于脂质的系统、脂质体、胶束、微囊泡、外泌体或基因枪。在实施例中,递送颗粒包含Cas9效应蛋白和指导多核苷酸。在实施例中,递送颗粒包含Cas9效应蛋白和指导多核苷酸,其中该Cas9效应蛋白和该指导多核苷酸以复合物存在。在实施例中,递送颗粒包含编码Cas9效应蛋白的多核苷酸、编码指导多核苷酸的多核苷酸和含有tracrRNA的多核苷酸。在实施例中,递送颗粒包含Cas9效应蛋白、指导多核苷酸和tracrRNA。在实施例中,递送颗粒包含编码一种或多种Cas9效应蛋白的多核苷酸、编码一种或多种指导多核苷酸的多核苷酸和编码tracrRNA的多核苷酸。
在实施例中,递送颗粒进一步包含脂质、糖、金属或蛋白质。在实施例中,递送颗粒是脂质包膜。在实施例中,递送颗粒是基于糖的颗粒,例如GalNAc。在实施例中,递送颗粒是纳米颗粒。本文描述了纳米颗粒的实例。在美国专利公开号2011/0293703、2012/0251560和2013/0302401以及美国专利号5,543,158、5,855,913、5,895,309、6,007,845和8,709,843中进一步描述了递送颗粒的制备,将其各自通过引用以其全文并入本文。
囊泡
在实施例中,本披露提供了囊泡,其包含如本文所述的Cas9效应蛋白。在实施例中,本披露还提供了囊泡,其包含含有如本文所述Cas9效应蛋白的系统。
在囊泡包含如本文所述的系统的实施例中,Cas9效应蛋白和指导多核苷酸以复合物存在。在实施例中,复合物进一步包含含有tracrRNA序列的多核苷酸。
“囊泡”是细胞内具有被脂质双层包围的流体的小结构。本文提供了囊泡的实例。在实施例中,囊泡包含Cas9效应蛋白和指导多核苷酸。在实施例中,囊泡包含Cas9效应蛋白和指导多核苷酸,其中该Cas9效应蛋白和该指导多核苷酸以复合物存在。在实施例中,囊泡包含编码Cas9效应蛋白的多核苷酸、编码指导多核苷酸的多核苷酸和含有tracrRNA的多核苷酸。在实施例中,囊泡包含Cas9效应蛋白、指导多核苷酸和tracrRNA。在实施例中,囊泡包含编码一种或多种Cas9效应蛋白的多核苷酸、编码一种或多种指导多核苷酸的多核苷酸和编码tracrRNA的多核苷酸。
在实施例中,囊泡是外泌体或脂质体。在实施例中,Cas9效应蛋白经由外泌体递送至细胞中。外泌体是内源性纳米囊泡(即,直径为约30nm至约100nm),可转运RNA和蛋白质,并且可将RNA递送至大脑和其他靶器官。例如,Alvarez-Erviti等人,NatureBiotechnology[自然生物学]29:341(2011),El-Andaloussi等人,Nature Protocols[自然实验手册]7:2112-2116(2012),以及Wahlgren等人,Nucleic Acids Research[核酸研究]40(17):e130(2012)中描述了用于将外源性生物材料递送至靶器官的工程化外泌体,将这些文献各自通过引用以其全文并入本文。
在实施例中,Cas9效应蛋白经由脂质体递送至细胞中。脂质体是具有至少一个脂质双层的球形囊泡结构,并且可以用作营养物和药物施用的媒介物。脂质体通常由磷脂(特别是磷脂酰胆碱)以及其他脂质(如蛋磷脂酰乙醇胺)组成。脂质体的类型包括但不限于多层囊泡、小单层囊泡、大单层囊泡和耳蜗囊泡。参见,例如,Spuch和Navarro,“Liposomesfor Targeted Delivery of ActiVe Agents against Neurodegenerative Diseases(Alzheimer′s Disease and Parkinson′s Disease)[用于抗神经退行性疾病(阿尔茨海默病和帕金森病)活性药物的靶向递送的脂质体]”,Journal of Drug Delivery[药物递送杂志]2011,文章ID 469679(2011)。例如,Morrissey等人,Nature Biotechnology[自然生物技术]23(8):1002-1007(2005),Zimmerman等人,Nature Letters[自然快报]441:111-114(2006),以及Li等人,Gene Therapy[基因疗法]19:775-780(2012)描述了用于递送生物材料例如CRISPR-Cas组分的脂质体,将这些文献各自通过引用以其全文并入本文。
病毒载体
在实施例中,本披露提供了病毒载体,其包含如本文所述的Cas9效应蛋白。在实施例中,本披露还提供了病毒载体,其包含含有如本文所述Cas9效应蛋白的系统。
在病毒载体包含如本文所述的系统的实施例中,Cas9效应蛋白和指导多核苷酸以复合物存在。在实施例中,复合物进一步包含含有tracrRNA序列的多核苷酸。
在实施例中,病毒载体是腺病毒颗粒、腺相关病毒颗粒或单纯疱疹病毒颗粒。在实施例中,病毒载体是腺病毒、慢病毒或腺相关病毒。本文提供了病毒载体的实例。使用腺相关病毒(AAV)和慢病毒载体的病毒转导(可以局部、靶向或全身施用)已被用作体内基因疗法的递送方法。在本披露的实施例中,Cas效应蛋白由转导的细胞在细胞内表达。
在实施例中,病毒载体包含Cas9效应蛋白和指导多核苷酸。在实施例中,病毒载体包含Cas9效应蛋白和指导多核苷酸,其中该Cas9效应蛋白和该指导多核苷酸以复合物存在。在实施例中,病毒载体包含编码Cas9效应蛋白的多核苷酸、编码指导多核苷酸的多核苷酸和含有tracrRNA的多核苷酸。在实施例中,病毒载体包含Cas9效应蛋白、指导多核苷酸和tracrRNA。在实施例中,病毒载体包含编码一种或多种Cas9效应蛋白的多核苷酸、编码一种或多种指导多核苷酸的多核苷酸和编码tracrRNA的多核苷酸。
用于提供靶序列的位点特异性修饰的方法
在实施例中,本披露提供了用于在真核细胞中提供靶序列的位点特异性修饰的方法,该方法包括:
a)将以下引入到该细胞中:
i)编码Cas9效应蛋白的核苷酸,该Cas9效应蛋白包含:
A)附接至该Cas9效应蛋白N-末端的第一核定位信号;和
B)附接至该Cas9效应蛋白C-末端的第二核定位信号;以及
ii)编码指导多核苷酸的核苷酸,该指导多核苷酸与该Cas9效应蛋白形成复合物并且包含指导序列,其中该指导序列能够与宿主多核苷酸中的靶序列杂交;
b)用该Cas9效应蛋白和该指导多核苷酸在该宿主多核苷酸中产生粘性末端;以及
c)
i)将(b)的这些粘性末端连接在一起,或
ii)将目的多核苷酸序列的3′端与一个粘性末端连接,并且将该多核苷酸序列的5’端与一个粘性末端连接;从而修饰该靶序列。
靶序列的修饰涵盖单核苷酸取代、多核苷酸取代、核酸的插入(即,敲入)和缺失(即,敲除)、移码突变和其他核酸修饰。
在实施例中,修饰是靶序列的至少一部分的缺失。可以在两个不同位点切割靶序列并产生互补的粘性末端,并且这些互补的粘性末端可以重新连接,从而去除两个位点之间的序列部分。
在实施例中,修饰是靶序列的突变。真核细胞中的位点特异性诱变是通过使用位点特异性核酸酶来实现的,该位点特异性核酸酶可促进含有目的突变的外源多核苷酸模板(也称为“供体多核苷酸”或“供体载体”)的同源重组。在实施例中,目的序列(SoI)包含目的突变。
在实施例中,修饰是将目的序列(SoI)插入靶序列中。SoI可以作为外源多核苷酸模板引入。在实施例中,外源多核苷酸模板包含粘性末端。在实施例中,外源多核苷酸模板包含与靶序列中的粘性末端互补的粘性末端。
外源多核苷酸模板可以具有任何合适的长度,如长度是约或至少约10、15、20、25、50、75、100、150、200、250、500或1000或更多个核苷酸。在实施例中,外源多核苷酸模板与包含靶序列的多核苷酸的一部分互补。当进行最佳比对时,外源多核苷酸模板与靶序列的一个或多个核苷酸(例如,约或至少约1、5、10、15、20、25、30、35、40、45、50、60、70、80、90或100或更多个核苷酸)重叠。在实施例中,当对外源多核苷酸模板和包含靶序列的多核苷酸进行最佳比对时,外源多核苷酸模板最接近的核苷酸在距离靶序列约1、5、10、15、20、25、50、75、100、200、300、400、500、100、1500、2000、2500、5000、10000个或更多个核苷酸内。
在实施例中,外源多核苷酸是DNA,例如,DNA质粒、细菌人工染色体(BAC)、酵母人工染色体(YAC)、病毒载体、单链或双链DNA的线性片段、寡核苷酸、PCR片段、裸核酸或与递送媒介物(如脂质体)复合的核酸。
在实施例中,使用细胞的内源DNA修复途径将外源多核苷酸插入靶序列中。内源DNA修复途径包括非同源末端连接(NHEJ)途径、微同源介导的末端连接(MMEJ)途径和同源定向修复(HDR)途径。NHEJ、MMEJ和HDR途径可修复双链DNA断裂。在NHEJ中,修复DNA中的断裂不需要同源模板。NHEJ修复可能容易出错,尽管当DNA断裂包含相容的突出端时,错误会减少。NHEJ和MMEJ是在机理上截然不同的DNA修复途径,它们各自涉及DNA修复酶的不同子集。与可能精确且容易出错的NHEJ不一样,MMEJ总是容易出错,并且会导致在修复位点处的缺失和插入。MMEI相关的缺失归因于双链断裂两侧的微同源性(2-10个碱基对)。相比之下,HDR需要同源模板来直接进行修复,但是HDR修复典型地具有高保真度,并且不易出错。在实施例中,利用NHEJ和MMEJ修复的容易出错的性质在靶序列中引入非特异性核苷酸取代。在实施例中,Cas9效应蛋白以促进HDR修复的方式切割靶序列。
在修复过程中,可以将包含SoI的外源多核苷酸模板引入靶序列中。在实施例中,将包含侧接上游序列和下游序列的SoI的外源多核苷酸模板引入细胞中,其中该上游和下游序列与靶序列中整合位点的任一侧具有序列相似性。在实施例中,包含SoI的外源多核苷酸包含例如突变基因。在实施例中,外源多核苷酸包含对于该细胞而言是内源性或外源性的序列。在实施例中,SoI包含编码蛋白质的多核苷酸、或非编码序列,例如像微小RNA。在实施例中,SoI与调节元件可操作地连接。在实施例中,SoI是调节元件。在实施例中,SoI包含抗性盒,例如赋予对抗生素的抗性的基因。在实施例中,SoI包含野生型靶序列的突变。在实施例中,SoI通过产生移码突变或核苷酸取代来破坏或校正靶序列。在实施例中,SoI包含标志物。将标志物引入靶序列可以便于筛选靶向的整合。在实施例中,标志物是限制性位点、荧光蛋白或选择性标志物。在实施例中,将SoI作为包含SoI的载体引入。
选择外源多核苷酸模板中的上游和下游序列以促进靶序列与外源多核苷酸之间的同源重组。该上游序列是与用于整合的靶位点的上游序列(即靶序列)具有序列相似性的核酸序列。类似地,该下游序列是与用于整合的靶位点的下游序列具有序列相似性的核酸序列。因此,在实施例中,通过在上游和下游序列处的同源重组,将包含SoI的外源多核苷酸模板插入靶序列中。在实施例中,外源多核苷酸模板中的上游和下游序列与靶向的基因组序列的上游和下游序列分别具有至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、分别至少97%、至少98%、至少99%或100%序列同一性。在实施例中,该上游或下游序列具有约20至2000个碱基对、或约50至1750个碱基对、或约100至1500个碱基对、或约200至1250个碱基对、或约300至1000个碱基对、或约400至约750个碱基对、或约500至600个碱基对。在实施例中,该上游或下游序列具有约50、约100、约250、约500、约100、约1250、约1500、约1750、约2000、约2250或约2500个碱基对。
在实施例中,靶序列中的修饰是细胞中靶序列表达的失活。例如,在CRISPR复合物与靶序列结合后,靶序列即失活,使得该序列不被转录,不产生编码的蛋白质,或者该序列不像野生型序列那样起作用。例如,蛋白质或微小RNA编码序列可能会失活,从而不产生蛋白质。
在实施例中,调节序列可能会失活,使得它不再作为调节序列起作用。调节序列的实例包括启动子、转录终止子、增强子和本文所述的其他调节元件。失活的靶序列可以包括缺失突变(即,一个或多个核苷酸的缺失)、插入突变(即,一个或多个核苷酸的插入)或无义突变(即,用另一个核苷酸取代一个单核苷酸从而引入终止密码子)。在实施例中,靶序列的失活导致靶序列的“敲除”。
在方法的实施例中,第一核定位信号是单组分核定位信号。在实施例中,第一核定位信号是两组分核定位信号。在实施例中,第二核定位信号是单组分核定位信号。在实施例中,第二核定位信号是两组分核定位信号。
在方法的实施例中,第一和第二核定位信号可以均是单组分核定位信号、均是两组分核定位信号或可以是单组分核定位信号和两组分核定位信号的混合物。在实施例中,第一核定位信号是两组分核定位信号,并且第二核定位信号是单组分核定位信号。在实施例中,第一核定位信号是单组分核定位信号,并且第二核定位信号是两组分核定位信号。在实施例中,第一核定位信号是单组分核定位信号,并且第二核定位信号是单组分核定位信号。在实施例中,第一核定位信号是两组分核定位信号,并且第二核定位信号是两组分核定位信号。
在方法的实施例中,单组分核定位信号是本领域已知的单组分核定位信号。在实施例中,单组分核定位信号是上文表1中列出的单组分核定位信号(SEQ ID NO:1-6)中的一种或其组合。
在方法的实施例中,两组分核定位信号是本领域已知的两组分核定位信号。在实施例中,两组分核定位信号是经典的两组分核定位信号。在实施例中,两组分核定位信号是上文表2中列出的两组分核定位信号(SEQ ID NO:7-9)中的一种或其组合。
在方法的实施例中,第一核定位信号是经典的两组分核定位信号(SEQ ID NO:7),并且第二核定位信号是SV40大T抗原核定位信号(SEQ ID NO:1)。
在方法的实施例中,第一核定位信号直接附接至Cas9效应蛋白。在实施例中,第一核定位信号经由接头附接至Cas9效应蛋白。在实施例中,第二核定位信号直接附接至Cas9效应蛋白。在实施例中,第二核定位信号经由接头附接至Cas9效应蛋白。
在使用接头的实施例中,接头是具有2至30个残基的肽接头。在实施例中,接头是具有2至20个残基的肽接头。在实施例中,接头是具有2至15个残基的肽接头。在实施例中,接头是具有2至10个残基的肽接头。在实施例中,接头是具有2至5个残基的肽接头。在实施例中,接头是经取代的或未经取代的C2-C20烷基、烯基或炔基链。
在方法的实施例中,Cas9效应蛋白在其N-末端包含核定位信号的多于一个拷贝。在实施例中,Cas9效应蛋白在其N-末端包含核定位信号的多于一种类型。在实施例中,Cas9效应蛋白在其C-末端包含核定位信号的多于一个拷贝。在实施例中,Cas9效应蛋白在其C-末端包含核定位信号的多于一种类型。
在方法的实施例中,蛋白质包含第一核定位信号的两个拷贝。在实施例中,蛋白质包含第一核定位信号的三个拷贝。在实施例中,蛋白质包含第二核定位信号的两个拷贝。在实施例中,蛋白质包含第二核定位信号的三个拷贝。
在方法的实施例中,包含第一和第二核定位信号的Cas9蛋白的Cas9部分可以衍生自本领域已知的任何Cas9效应子结构域。在实施例中,Cas9效应蛋白衍生自具有II-B型CRISPR系统的细菌物种。上文描述了合适的II-B型Cas9蛋白的实例。在实施例中,Cas9部分包含以1E-5的E值截止值匹配TIGR03031蛋白家族的结构域。在实施例中,位点特异性核酸酶包含以1E-10的E值截止值匹配TIGR03031蛋白家族的结构域。
在方法的实施例中,Cas9效应蛋白包含与如图1和图2所示的SEQ ID NO:10-97中的任一个具有至少95%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与如图1和图2所示的SEQ ID NO:10-97中的任一个具有至少90%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与如图1和图2所示的SEQ ID NO:10-97中的任一个具有至少98%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与如图1和图2所示的SEQ ID NO:10-97中的任一个具有至少99%同一性的多肽序列。在实施例中,Cas9效应蛋白包含选自如图1和图2所示的SEQID NO:10-97中的任一个的多肽。
在方法的实施例中,Cas9效应蛋白包含与SEQ ID NO:71具有至少95%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与SEQ ID NO:71具有至少90%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与SEQ ID NO:71具有至少98%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与SEQ ID NO:71具有至少99%同一性的多肽序列。在实施例中,Cas9效应蛋白包含SEQ ID NO:71。
在方法的实施例中,Cas9效应蛋白包含与SEQ ID NO:98具有至少90%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与SEQ ID NO:98具有至少95%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与SEQ ID NO:98具有至少98%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与SEQ ID NO:98具有至少99%同一性的多肽序列。在实施例中,Cas9效应蛋白包含SEQ ID NO:98。
在方法的其他实施例中,Cas9效应蛋白的Cas9部分包含dCas9,即缺乏DNA双链断裂活性的失活或“死亡”的Cas9。在实施例中,dCas9可以与其它活性结构域(例如如本文其他地方描述的转录调节子、表观遗传调节蛋白或荧光蛋白)融合。在dCas9与另一个活性结构域融合的实施例中,本文所述的核定位信号存在于整个Cas9效应蛋白构建体的N-末端和C-末端。
在方法的其他实施例中,Cas9效应蛋白的Cas9部分包含Cas9切口酶,即仅切割DNA双链的一条链的Cas9蛋白。在实施例中,Cas9切口酶可以与其它活性结构域(例如如本文其他地方描述的转录调节子、表观遗传调节蛋白或荧光蛋白)融合。在Cas9切口酶与另一个活性结构域融合的实施例中,本文所述的核定位信号存在于整个Cas9效应蛋白构建体的N-末端和C-末端。
在实施例中,该方法包括使用如本文所述的指导多核苷酸。在方法的实施例中,指导多核苷酸是RNA。
在任一上述系统的实施例中,指导序列的长度是19至30个碱基。在实施例中,指导序列的长度是19至25个碱基。在实施例中,指导序列的长度是21至26个碱基。
在任一上述系统的实施例中,指导多核苷酸进一步包含如本文所述的tracrRNA序列。在本文披露的系统的实施例中,Cas9效应蛋白、指导多核苷酸和tracrRNA能够形成复合物。
在方法的实施例中,Cas9效应蛋白产生粘性末端。在实施例中,由Cas9效应蛋白产生的粘性末端包含5’突出端。在实施例中,由Cas9效应蛋白产生的粘性末端包含3’突出端。在实施例中,粘性末端包含具有1至10个核苷酸的单链多核苷酸突出端。在实施例中,粘性末端包含具有2至6个核苷酸的单链多核苷酸突出端。在实施例中,粘性末端包含具有3至5个核苷酸的单链多核苷酸突出端。
在方法的实施例中,真核细胞是动物或人细胞。在实施例中,真核细胞是如本文所述的动物细胞。在实施例中,真核细胞是人细胞。在实施例中,真核细胞是如本文所述的人细胞。在实施例中,真核细胞是植物细胞。在实施例中,真核细胞是如本文所述的植物细胞。
在方法的实施例中,修饰是靶序列的至少一部分的缺失。在实施例中,修饰是靶序列的突变。在实施例中,修饰是将目的序列插入靶序列中。在实施例中,修饰是如本文所述的修饰。
在方法的实施例中,修饰提供了减少的脱靶效应。在方法的实施例中,与酿脓链球菌Cas9(SpCas9)提供的脱靶效应相比,修饰提供了减少的脱靶效应。
本披露还提供了用于在真核细胞中提供具有减少的脱靶效应的靶序列的位点特异性修饰的方法,该方法包括:
a)将以下引入到该细胞中:i)编码Cas9效应蛋白的核苷酸,该Cas9效应蛋白包含:A)附接至该Cas9效应蛋白N-末端的第一核定位信号;和B)附接至该Cas9效应蛋白C-末端的第二核定位信号;以及ii)编码指导多核苷酸的核苷酸,该指导多核苷酸与该Cas9效应蛋白形成复合物并且包含指导序列,其中该指导序列能够与宿主多核苷酸中的靶序列杂交;
b)用该Cas9效应蛋白和该指导多核苷酸在该宿主多核苷酸中产生粘性末端:以及
c)i)将(b)的这些粘性末端连接在一起,或ii)将目的多核苷酸序列的3′端与一个粘性末端连接,并且将该多核苷酸序列的5’端与一个粘性末端连接;从而修饰该具有减少的脱靶效应的靶序列。
在方法的实施例中,与酿脓链球菌Cas9(SpCas9)提供的脱靶效应相比,修饰提供了减少的脱靶效应。在方法的实施例中,与野生型酿脓链球菌Cas9(SpCas9)提供的脱靶效应相比,修饰提供了减少的脱靶效应。
用于减少Cas9效应蛋白降解的方法
在实施例中,本披露提供了用于减少细胞中Cas9效应蛋白降解的方法,该方法包括:
a)将第一核定位信号附接至该Cas9效应蛋白的N-末端;以及
b)将第二核定位信号附接至该Cas9效应蛋白的C-末端。
在实施例中,可以如本文所述的进行附接。在实施例中,使用标准分子生物学方法(如限制性内切酶消化和连接)将编码核定位信号的核酸序列置于编码Cas9效应蛋白的核酸序列的上游和下游,从而形成编码Cas9效应蛋白的核酸,该Cas9效应蛋白在其N-末端和C-末端包含核定位信号。随后该核酸可以在细胞(例如真核细胞)中表达。在其他实施例中,使用固相蛋白质合成方法完全或部分合成在其N-末端和C-末端包含核定位信号的Cas9效应蛋白。
在方法的实施例中,第一核定位信号是单组分核定位信号。在实施例中,第一核定位信号是两组分核定位信号。在实施例中,第二核定位信号是单组分核定位信号。在实施例中,第二核定位信号是两组分核定位信号。
在方法的实施例中,第一和第二核定位信号可以均是单组分核定位信号、均是两组分核定位信号或可以是单组分核定位信号和两组分核定位信号的混合物。在实施例中,第一核定位信号是两组分核定位信号,并且第二核定位信号是单组分核定位信号。在实施例中,第一核定位信号是单组分核定位信号,并且第二核定位信号是两组分核定位信号。在实施例中,第一核定位信号是单组分核定位信号,并且第二核定位信号是单组分核定位信号。在实施例中,第一核定位信号是两组分核定位信号,并且第二核定位信号是两组分核定位信号。
在方法的实施例中,单组分核定位信号是本领域已知的单组分核定位信号。在实施例中,单组分核定位信号是上文表1中列出的单组分核定位信号(SEQ ID NO:1-6)中的一种或其组合。
在方法的实施例中,两组分核定位信号是本领域已知的两组分核定位信号。在实施例中,两组分核定位信号是经典的两组分核定位信号。在实施例中,两组分核定位信号是上文表2中列出的两组分核定位信号(SEQ ID NO:7-9)中的一种或其组合。
在方法的实施例中,第一核定位信号是经典的两组分核定位信号(SEQ ID NO:7),并且第二核定位信号是SV40大T抗原核定位信号(SEQ ID NO:1)。
在方法的实施例中,第一核定位信号直接附接至Cas9效应蛋白。在实施例中,第一核定位信号经由接头附接至Cas9效应蛋白。在实施例中,第二核定位信号直接附接至Cas9效应蛋白。在实施例中,第二核定位信号经由接头附接至Cas9效应蛋白。
在使用接头的实施例中,接头是具有2至30个残基的肽接头。在实施例中,接头是具有2至20个残基的肽接头。在实施例中,接头是具有2至15个残基的肽接头。在实施例中,接头是具有2至10个残基的肽接头。在实施例中,接头是具有2至5个残基的肽接头。在实施例中,接头是经取代的或未经取代的C2-C20烷基、烯基或炔基链。
在方法的实施例中,Cas9效应蛋白在其N-末端包含核定位信号的多于一个拷贝。在实施例中,Cas9效应蛋白在其N-末端包含核定位信号的多于一种类型。在实施例中,Cas9效应蛋白在其C-末端包含核定位信号的多于一个拷贝。在实施例中,Cas9效应蛋白在其C-末端包含核定位信号的多于一种类型。
在方法的实施例中,蛋白质包含第一核定位信号的两个拷贝。在实施例中,蛋白质包含第一核定位信号的三个拷贝。在实施例中,蛋白质包含第二核定位信号的两个拷贝。在实施例中,蛋白质包含第二核定位信号的三个拷贝。
在方法的实施例中,包含第一和第二核定位信号的Cas9蛋白的Cas9部分可以衍生自本领域已知的任何Cas9效应子结构域。在实施例中,Cas9效应蛋白衍生自具有II-B型CRISPR系统的细菌物种。上文描述了合适的II-B型Cas9蛋白的实例。在实施例中,Cas9部分包含以1E-5的E值截止值匹配TIGR03031蛋白家族的结构域。在实施例中,位点特异性核酸酶包含以1E-10的E值截止值匹配TIGR03031蛋白家族的结构域。
在方法的实施例中,Cas9效应蛋白包含与如图1和图2所示的SEQ ID NO:10-97中的任一个具有至少95%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与如图1和图2所示的SEQ ID NO:10-97中的任一个具有至少90%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与如图1和图2所示的SEQ ID NO:10-97中的任一个具有至少98%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与如图1和图2所示的SEQ ID NO:10-97中的任一个具有至少99%同一性的多肽序列。在实施例中,Cas9效应蛋白包含选自如图1和图2所示的SEQID NO:10-97中的任一个的多肽。
在方法的实施例中,Cas9效应蛋白包含与SEQ ID NO:71具有至少95%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与SEQ ID NO:71具有至少90%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与SEQ ID NO:71具有至少98%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与SEQ ID NO:71具有至少99%同一性的多肽序列。在实施例中,Cas9效应蛋白包含SEQ ID NO:71。
在方法的实施例中,Cas9效应蛋白包含与SEQ ID NO:98具有至少90%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与SEQ ID NO:98具有至少95%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与SEQ ID NO:98具有至少98%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与SEQ ID NO:98具有至少99%同一性的多肽序列。在实施例中,Cas9效应蛋白包含SEQ ID NO:98。
将本文引用的所有参考文献(包括专利、专利申请、论文、教科书等)以及其中引用的参考文献(如同它们还未曾引用过的程度)通过引用以其全文特此并入本文。
实例
实例1-Cas9是用于溶酶体降解的底物
将来自序列肠道宏基因组MH0245(MHCas9)的Cas9蛋白(如WO 2019099943中所述,将其通过引用特此并入本文)克隆到编码SV40单组分核定位信号(NLS;SEQ ID NO:1)的三个拷贝的质粒中,以形成3xSV40-MHCas9(一种具有与其N-末端附接的三个SV40 NLS的Cas9蛋白)。
将质粒转染到HEK293T细胞中。将细胞在DMEM+10%FBS培养基中培养24小时,然后添加以下任一细胞培养物中:1)浓度为5μM的蛋白酶体抑制剂MG132;2)浓度为20nM的溶酶体vATP酶抑制剂巴佛洛霉素A1;或3)浓度为10nM的核输出抑制剂来普霉素B。将未经处理的细胞用作对照。收获细胞,随后进行总蛋白质提取。
在转染前一天,将HEK293T细胞以每孔25,000个细胞的密度接种在96孔板上。接种后20小时,将细胞用以上所述的质粒转染。转染后48小时,向细胞中添加100μL的培养基。转染后60小时收获细胞。
收获后,使用蛋白质印迹分析3xSV40-MHCas9的总水平(与丝裂原活化蛋白激酶(MAPK)的印迹进行比较),以使条带强度归一化。印迹如图3A所示。对蛋白质印迹进行定量,并绘制归一化的蛋白质表达,如图3B所示。
如图3B所示,用巴佛洛霉素A1阻断溶酶体功能导致MHCas9水平升高,表明MHCas9在溶酶体中被降解。
实例2-向Cas9中添加NLS防止降解
将如实例1中所述的MHCas9克隆到编码核定位信号的质粒中,以形成四种不同的Cas9效应蛋白构建体:1)如实例1中所述的3xSV40-MHCas9;2)在C-末端处具有单个SV40NLS的MHCas9(MHCas9-NLSSV40);3)在N-末端处具有三个SV40 NLS并且在C-末端处具有单个SV40 NLS的MHCas9(3XNLSSV40-MHCas9-NLSSV40);和4)在N-末端处具有单个两组分NLS(SEQ ID NO:7)并且在C-末端处具有单个SV40 NLS的MHCas9(bpNLS-MHCas9-SLSSV40)。质粒表达绿色荧光蛋白(GFP),检测该绿色荧光蛋白用于转染的归一化。
如实例1中所述转染HEK293T细胞并使其生长,但不用任何抑制剂处理。收获细胞并进行蛋白质印迹,检测到的微管蛋白作为凝胶加载对照,并且GFP用于转染量的归一化。印迹如图4所示。可以看出,在Cas9的C-末端添加NLS增加了蛋白质在体内的稳定性。选择bpNLS-MHCas9-SLSSV40蛋白用于进一步研究,并命名为SpOT-ON。
实例3-在两个末端均具有NLS的Cas9构建体避免溶酶体降解
为了测试NLS对其他Cas9蛋白的影响,将酿脓链球菌Cas9(SpCas9)克隆到与实例2中的构建体4相同的载体中,以形成bpNLS-SpCas9-NLSSV40构建体。
表达SpOT-ON和bpNLS-SpCas9-NLSSV40的细胞要么不进行处理,要么使其在抑制剂MG132、巴佛洛霉素A1或来普霉素(浓度与在实例1中使用的相同)的存在下生长。如实例1中所述,收获细胞并使用MAPK进行蛋白质印迹以使条带强度归一化。SpOT-ON的印迹如图5A所示,bpNLS-SpCas9-NLSSV40的印迹如图5B所示。
从印迹中可以看出,无论样品是用抑制剂处理还是用实例1中未显著减缓降解的抑制剂(MG132和来普霉素B)处理,都能检测到相似水平的蛋白质。由另外的NLS信号提供的增强的核输入可能会防止细胞质中的蛋白质降解。此外,在N-末端和C-末端处添加NLS信号导致MHCas9和SPCas9的稳定性均增强,这表明该技术应普遍适用于增强所有类型的Cas9蛋白的稳定性。
实例4-SpOT-ON与未经修饰的Cas9具有相似的DNA切割活性
将SpOT-ON的DNA切割活性与缺乏NLS的Cas9进行比较,发现是相似的。
体外测量SpOT-On和酿脓链球菌(Streptococcus pyogenes)Cas9蛋白(SpyCas9)的切割活性。将靶向20nt前间区序列的Cas9核糖核蛋白(RNP)与荧光标记的靶DNA和缺乏前间区序列相邻基序(PAM)的加载对照混合。将反应物在37C下孵育,在不同时间点取出等分试样,将其淬灭并使用毛细管电泳解析。对消化的DNA部分进行定量,相对于加载对照和零时间点归一化,然后相对于时间作图。两种酶对靶DNA的消化程度相同。对数据(未显示)的分析确定了以下速率常数(k):SpyCas9,k=0.224和SpOT-ON,k=0.004。
结果表明,SpOT-On Cas9能够在体外消化靶向DNA,程度与SPyCas9相同。然而,从不同的速率常数中可以看出,SpOT-On Cas9的这种切割比SpyCas9发生得慢。
实例5-SpOT-ON与未经修饰的Cas9具有相似的编辑活性
将SpOT-ON的基因编辑活性与缺乏NLS的Cas9进行比较,发现是相似的。
比较了SpOT-ON和SpCas9的基因编辑活性。HEK293T细胞通过表达Cas9变体以及HEK3、HEK4、EMX1和FANCF的指导RNA的表达载体转染。CD34用作插入位点,STAT1用作缺失位点。将细胞培养72小时,然后裂解以获得DNA。进行深度扩增子测序以评估已发生的编辑。如图6所示,SpOT-ON和SpCas9的编辑效率相似。
实例6-确定SpoT-ON的最佳前间区序列长度
假设实例4中显示的SpOT-On Cas9对DNA的缓慢切割是由次优的sgRNA设计,特别是前间区序列长度引起的。对于由一系列靶向相同序列的具有不同前间区序列靶向序列长度的sgRNA形成的SpOT-On-Cas9 RNP,重复实例4的体外切割实验。
为了优化反应效率,使用实例4中描述的方法确定具有不同间隔子长度的指导RNA的切割活性,并作图。条形表示计算的速度常数,误差条表示拟合的标准误差。结果如图7所示。
如图7所示,靶向较短前间区序列(18-20nt)的SpOT-On-Cas9在DNA切割中效率较低。然而,具有较长指导的RNP消化DNA的速度快10-50倍,这表明SpOT-On Cas9的最佳活性需要至少21个核苷酸靶序列。
进行了进一步的研究以确定体内最佳前间区序列长度。在以下两个不同的靶位点处测试体内切割活性:EMX1和CD34。
在转染前一天,将HEK293T细胞以每孔25,000个细胞的密度接种在96孔板上。接种后20小时,将细胞用以上所述的质粒转染。转染后48小时,向细胞中添加100μL的培养基。转染后60小时使用QuickExtract DNA提取溶液(卢西根公司(Lucigen))收获细胞。进行深度靶向扩增子测序。图8中显示的条形图示出了映射读数中突变读数的平均百分比。重复次数n=3(将细胞分成三个储备液,然后分别转染和分析)。
如图8所示,SpOT-ON的最佳前间区序列长度在19-23个核苷酸之间,其中21个核苷酸显示出峰活性。
实例7-SpOT-ON显示脱靶DNA编辑减少
使用与实例5中描述的方法类似的方法比较SpOT-ON和SpCas9的基因编辑活性。HEK293T细胞通过表达Cas9变体以及HEK3、HEK4、EMX1和FANCF的指导RNA的表达载体转染。将细胞培养72小时,然后裂解以获得DNA。进行深度扩增子测序以评估已发生的编辑。使用Crispresso2汇总分析对脱靶编辑进行分析。分析的14个脱靶位点是由Tsai等人(NatBiotechnol.[自然生物技术]2015年2月;33(2):187-197)确定的那些。脱靶分析图如图9所示。
如图9所示,与SpCas9相比,SpOT-ON在脱靶位点显示出大大降低的编辑百分比,这表明SpOT-ON在区分靶上和脱靶序列方面更好。
实例8-脱靶DNA编辑的分析
进行了进一步的研究,以研究底物DNA中的错配如何影响DNA切割的动力学。产生了在靶序列中携带单个碱基对取代的DNA底物,以研究SpyCas9和SpOT-ON的特异性。对于PAM的位置1、2和3处完美匹配和错配的DNA底物,测量Cas9酶的活性。用最佳指导物如上文实例中所述进行实验。计算每种DNA底物的切割速度常数,并且绘制在图10中。
如图10所示,Cas9酶消化错配的DNA底物的速度比完美匹配的DNA底物慢。紧邻PAM的错配导致SpyCas9和SpOT-On Cas9的切割速度均显著降低。更多的远端错配仅略微减小Spy Cas9活性,而SpOT-On Cas9被抑制了至少10倍。这些数据表明,SpOT-On Cas9在体外是比Spy Cas9更具特异性的酶,这可能解释了SpOT-On Cas9在体内的低脱靶基因组编辑活性。
实例9-体内错配耐受性
在HEK293T细胞中用23个核苷酸的指导RNA测试EMX1的SpOT-ON错配编辑的体内错配耐受性。
在转染前一天,将HEK293T细胞以每孔25,000个细胞的密度接种在96孔板上。接种后20小时,将细胞用以上所述的质粒转染。转染后48小时,向细胞中添加100μL的培养基。转染后60小时使用QuickExtract DNA提取溶液(卢西根公司)收获细胞。进行深度靶向扩增子测序。图11中的条形图示出了映射读数中突变读数的平均百分比。重复次数n=3(将细胞分成三个储备液,然后分别转染和分析)。
从图11中可以看出,位置1-10(其中1最靠近PAM)处的错配是非耐受的,并且导致没有编辑或非常低的编辑(>0.7%)。位置11-21之间的错配显示出高达20%的中等编辑效率。位置22处的错配导致与没有错配的sgRNA类似的编辑效率(约55%)。
实例10-切割位点的DNA编辑与分析
进一步分析EMX和CD34基因座处的DNA编辑,以定性评估DNA修复结果。如实例9中所述接种细胞并使其生长。使用RIMA分析的扩增子测序的NGS结果显示在图12A(EMX1)、图12B(CD34)和图12C(利用SpCas9的CD34对照)中。
这些结果表明,在HEK293T细胞中,SpOT-ON切割DNA以产生3个核苷酸突出端。
实例11-敲入实验
进行实验以评估定向非同源末端连接(NHEJ)介导的在CD34和STAT1两个靶位点处具有平末端或不同突出端的寡核苷酸敲入的效率。将DNA PK(M9831/VX-984)抑制剂以1μM的终浓度添加到一半样品中作为NHEJ抑制剂,以证明正在发生NHEJ。比较SpOT-ON Cas9和SpCas9。如实例9中所述接种细胞并使其生长。使用深度靶向扩增子测序分析DNA。
CD34基因座处敲入的结果如图13所示。STAT1基因座处敲入的结果如图14所示。如图13和图14所示,SpOT-ON对其3个核苷酸5’突出端的优先底物(灰色框)显示出最佳活性,而SpCas9对1个核苷酸5’突出端的优先底物(白色框)显示出最佳活性。图显示了插入的两个潜在方向性,其中深灰色代表正向(预期)插入,浅灰色代表反向插入。如DNAPK柱所示,DNA-PK抑制剂处理完全抑制寡核苷酸供体插入,这证明敲入是NHEJ介导的。
从数据中可以看出,在用SpCas9或SpOT-ON Cas9引入双链断裂后,以正向和反向掺入平末端dsDNA寡核苷酸。当在寡核苷酸的两端引入3个核苷酸的短同源臂时,仍然可以看到经由NHEJ的插入。
SpOT-ON Cas9能够有效地靶向整合具有5’突出端(1bp)、3个核苷酸和4个核苷酸突出端的dsDNA寡核苷酸,其中以定向方式对3个核苷酸突出端整合的效率最高。SpCas9显示对具有1个核苷酸突出端的dsDNA整合效率高,而具有3个核苷酸或4个核苷酸突出端的dsDNA整合效率低。这些结果表明,SpOT-ON Cas9 DSB主要导致产生3个核苷酸的5’突出端,并且SpCas9显示出具有1个核苷酸突出端的交错切割。
对于SpCas9和SpOT-ON Cas9,具有3’突出端(3个核苷酸)的dsDNA寡核苷酸的协同效率低于5%。这进一步支持了产生5’突出端的理论。
实例12不同的SpOT-ON酶的比较
进行了通过在DNA结合位点附近的残基处引入单个氨基酸取代来改善SpOT-ON的基因组编辑效率的实验。DNA结合位点附近的SpOT-ON残基通过用Alpha Fold2(Jumper等人,Nature[自然]2021)模拟SpOT-ON结构来定义(参见表图16A)。选择残基的子集用于后续研究和诱变。例如,去除负电荷(天冬氨酸(ASP或D)或谷氨酸(GLU或E))和/或引入正电荷(精氨酸(ARG或R)或赖氨酸(LYS或K))以增加SpOT-ON复合物与其靶DNA的结合。SpOT-ON变体通过诱变产生,并且将其转染到细胞中,如实例5中所述。表3显示了测试对SpOT-ON活性影响的突变。总的来说,PAM相互作用区域(CTD结构域)附近以及SpOT-ON的REC3结构域中的突变显示出酶活性有所改善。
表4
Claims (124)
1.一种Cas9效应蛋白,其包含:
a)附接至该Cas9效应蛋白N-末端的第一核定位信号;和
b)附接至该Cas9效应蛋白C-末端的第二核定位信号。
2.如权利要求1所述的蛋白质,其中该第一核定位信号是单组分核定位信号。
3.如权利要求1所述的蛋白质,其中该第一核定位信号是两组分核定位信号。
4.如权利要求1至3中任一项所述的蛋白质,其中该第二核定位信号是单组分核定位信号。
5.如权利要求1至3中任一项所述的蛋白质,其中该第二核定位信号是两组分核定位信号。
6.如权利要求1所述的蛋白质,其中该第一核定位信号是两组分核定位信号,并且该第二核定位信号是单组分核定位信号。
7.如权利要求2、4或6中任一项所述的蛋白质,其中该单组分核定位信号是SV40大T抗原、核质蛋白、EGL-13、c-Myc、TUS蛋白核定位信号、或其组合。
8.如权利要求3、5或6中任一项所述的蛋白质,其中该两组分核定位信号是经典的两组分核定位信号。
9.如权利要求6所述的蛋白质,其中该第一核定位信号是经典的两组分核定位信号,并且该第二核定位信号是SV40大T抗原核定位信号。
10.如权利要求1至9中任一项所述的蛋白质,其中该第一核定位信号直接附接至该Cas9效应蛋白。
11.如权利要求1至9中任一项所述的蛋白质,其中该第一核定位信号经由接头附接至该Cas9效应蛋白。
12.如权利要求1至11中任一项所述的蛋白质,其中该第二核定位信号直接附接至该Cas9效应蛋白。
13.如权利要求1至11中任一项所述的蛋白质,其中该第二核定位信号经由接头附接至该Cas9效应蛋白。
14.如权利要求11或13所述的蛋白质,其中该接头是具有2至30个残基的肽接头。
15.如权利要求1至14中任一项所述的蛋白质,其中该蛋白质包含该第一核定位信号的两个拷贝。
16.如权利要求1至14中任一项所述的蛋白质,其中该蛋白质包含该第一核定位信号的三个拷贝。
17.如权利要求1至14中任一项所述的蛋白质,其中该蛋白质包含该第二核定位信号的两个拷贝。
18.如权利要求1至14中任一项所述的蛋白质,其中该蛋白质包含该第二核定位信号的三个拷贝。
19.如权利要求1至18中任一项所述的蛋白质,其中该Cas9效应蛋白包含与SEQ ID NO:10-97中的任一个具有至少95%同一性的多肽序列。
20.如权利要求1至18中任一项所述的蛋白质,其中该Cas9效应蛋白包含以1E-5的E值截止值匹配TIGR03031蛋白家族的结构域。
21.如权利要求1至18中任一项所述的蛋白质,其中该Cas9效应蛋白包含与SEQ ID NO:98具有至少90%同一性的多肽序列。
22.如权利要求21所述的蛋白质,其中该多肽含有一个或多个选自以下的修饰:N1164R、N1265R、N1300R、N1412R、N347R、N651A、D1266R、D309R、D345R、D487R、D607R、Q1129R、Q1381A、Q1381A、Q1381R、Q661A、Q713R、Q734R、E1032G、E1032R、E1409A、E436R、E611R、E691R、E697R、G1335R、L125R、L1264S、L1299S、K1031R、K490R、K615R、K656R、F636R、S1334A、S1334A、S1334R、S1380R、S1410R、S1413R、S634R、S638R、S711R、S1006R、S1017R、T1267A、T1267R、T551R、Y1338A、Y1338R、V1273S、V1274S、V486R、V644R、V736R和V736Y。
23.一种CRISPR-Cas系统,其包含:
a)Cas9效应蛋白,该Cas9效应蛋白包含:
i)附接至该Cas9效应蛋白N-末端的第一核定位信号;和
ii)附接至该Cas9效应蛋白C-末端的第二核定位信号;以及
b)指导多核苷酸,该指导多核苷酸包含指导序列并且与该Cas9效应蛋白形成复合物,其中该指导序列能够与真核细胞中的靶序列杂交。
24.一种CRISPR-Cas系统,其包含:
a)编码Cas9效应蛋白的核酸序列,该Cas9效应蛋白包含:
i)附接至该Cas9效应蛋白N-末端的第一核定位信号;和
ii)附接至该Cas9效应蛋白C-末端的第二核定位信号;以及
b)编码指导多核苷酸的核酸序列,该指导多核苷酸包含指导序列并且与该Cas9效应蛋白形成复合物,其中该指导序列能够与真核细胞中的靶序列杂交。
25.如权利要求24所述的系统,其中(a)和(b)的这些核苷酸序列在真核启动子的控制下。
26.如权利要求24所述的系统,其中(a)和(b)的这些核酸序列在单个载体中。
27.一种CRISPR-Cas系统,其包含一个或多个含有以下的载体:
a)与一个或多个编码Cas9效应蛋白的核苷酸序列可操作地连接的调节元件,该Cas9效应蛋白包含:
i)附接至该Cas9效应蛋白N-末端的第一核定位信号;和
ii)附接至该Cas9效应蛋白C-末端的第二核定位信号;以及
b)指导多核苷酸,该指导多核苷酸包含指导序列并且与该Cas9效应蛋白形成复合物,其中该指导序列能够与真核细胞中的靶序列杂交。
28.如权利要求27所述的系统,其中该调节元件是真核调节元件。
29.如权利要求23至28中任一项所述的系统,其中该第一核定位信号是单组分核定位信号。
30.如权利要求23至28中任一项所述的系统,其中该第一核定位信号是两组分核定位信号。
31.如权利要求23至30中任一项所述的系统,其中该第二核定位信号是单组分核定位信号。
32.如权利要求23至30中任一项所述的系统,其中该第二核定位信号是两组分核定位信号。
33.如权利要求23至28中任一项所述的系统,其中该第一核定位信号是两组分核定位信号,并且该第二核定位信号是单组分核定位信号。
34.如权利要求23至28中任一项所述的系统,其中该第一核定位信号和该第二核定位信号各自是两组分核定位信号。
35.如权利要求29、31或33中任一项所述的系统,其中该单组分核定位信号是SV40大T抗原、核质蛋白、EGL-13、c-Myc、TUS蛋白核定位信号、或其组合。
36.如权利要求30、32或33中任一项所述的系统,其中该两组分核定位信号是经典的两组分核定位信号。
37.如权利要求33所述的系统,其中该第一核定位信号是经典的两组分核定位信号,并且该第二核定位信号是SV40大T抗原核定位信号。
38.如权利要求23至37中任一项所述的系统,其中该第一核定位信号直接附接至该Cas9效应蛋白。
39.如权利要求23至37中任一项所述的系统,其中该第一核定位信号经由接头附接至该Cas9效应蛋白。
40.如权利要求23至39中任一项所述的系统,其中该第二核定位信号直接附接至该Cas9效应蛋白。
41.如权利要求23至39中任一项所述的系统,其中该第二核定位信号经由接头附接至该Cas9效应蛋白。
42.如权利要求39或41所述的系统,其中该接头是具有2至30个残基的肽接头。
43.如权利要求23至42中任一项所述的系统,其中该蛋白质包含该第一核定位信号的两个拷贝。
44.如权利要求23至42中任一项所述的系统,其中该蛋白质包含该第一核定位信号的三个拷贝。
45.如权利要求23至44中任一项所述的系统,其中该蛋白质包含该第二核定位信号的两个拷贝。
46.如权利要求23至44中任一项所述的系统,其中该蛋白质包含该第二核定位信号的三个拷贝。
47.如权利要求23至46中任一项所述的系统,其中该Cas9效应蛋白衍生自具有II-B型CRISPR系统的细菌物种。
48.如权利要求23至46中任一项所述的系统,其中该Cas9效应蛋白包含与SEQ ID NO:10-97中的任一个具有至少95%同一性的多肽序列。
49.如权利要求23至47中任一项所述的系统,其中该Cas9效应蛋白包含以1E-5的E值截止值匹配TIGR03031蛋白家族的结构域。
50.如权利要求23至49中任一项所述的系统,其中该Cas9效应蛋白包含与SEQ ID NO:98具有至少90%同一性的多肽序列。
51.如权利要求23至50中任一项所述的系统,其中该指导多核苷酸是RNA。
52.如权利要求51所述的系统,其中该指导序列的长度是19至30个碱基。
53.如权利要求51所述的系统,其中该指导序列的长度是19至25个碱基。
54.如权利要求51所述的系统,其中该指导序列的长度是21至26个碱基。
55.如权利要求23至54中任一项所述的系统,其中该指导多核苷酸进一步包含tracrRNA序列。
56.如权利要求23至55中任一项所述的系统,其中该Cas9效应蛋白产生粘性末端。
57.如权利要求56中任一项所述的系统,其中这些粘性末端包含具有1至10个核苷酸的单链多核苷酸突出端。
58.如权利要求56中任一项所述的系统,其中这些粘性末端包含具有2至6个核苷酸的单链多核苷酸突出端。
59.如权利要求57中任一项所述的系统,其中这些粘性末端包含具有3至5个核苷酸的单链多核苷酸突出端。
60.一种真核细胞,其包含如权利要求1至22中任一项所述的蛋白质。
61.一种真核细胞,其包含如权利要求23至59中任一项所述的系统。
62.一种递送颗粒,其包含如权利要求1至22中任一项所述的蛋白质。
63.一种递送颗粒,其包含如权利要求23至59中任一项所述的系统。
64.如权利要求63所述的递送颗粒,其中该Cas9效应蛋白和该指导多核苷酸以复合物存在。
65.如权利要求64所述的递送颗粒,其中该复合物进一步包含含有tracrRNA序列的多核苷酸。
66.如权利要求62至65中任一项所述的递送颗粒,其进一步包含脂质、糖、金属或蛋白质。
67.一种囊泡,其包含如权利要求1至22中任一项所述的蛋白质。
68.一种囊泡,其包含如权利要求23至59中任一项所述的系统。
69.如权利要求68所述的囊泡,其中该Cas9效应蛋白和该指导多核苷酸以复合物存在。
70.如权利要求68所述的囊泡,其进一步包含含有tracrRNA序列的多核苷酸。
71.如权利要求67至70中任一项所述的囊泡,其中该囊泡是外泌体或脂质体。
72.一种病毒载体,其包含如权利要求1至22中任一项所述的蛋白质。
73.一种病毒载体,其包含如权利要求23至59中任一项所述的系统。
74.如权利要求73所述的病毒载体,其进一步包含编码tracrRNA序列的核酸序列。
75.如权利要求72至74中任一项所述的病毒载体,其中该病毒载体是腺病毒颗粒、腺相关病毒颗粒或单纯疱疹病毒颗粒。
76.一种用于在真核细胞中提供靶序列的位点特异性修饰的方法,该方法包括:
a)将以下引入到该细胞中:
i)编码Cas9效应蛋白的核苷酸,该Cas9效应蛋白包含:
A)附接至该Cas9效应蛋白N-末端的第一核定位信号;和
B)附接至该Cas9效应蛋白C-末端的第二核定位信号;以及
ii)编码指导多核苷酸的核苷酸,该指导多核苷酸与该Cas9效应蛋白形成复合物并且包含指导序列,其中该指导序列能够与宿主多核苷酸中的靶序列杂交;
b)用该Cas9效应蛋白和该指导多核苷酸在该宿主多核苷酸中产生粘性末端;以及
c)
i)将(b)的这些粘性末端连接在一起,或
ii)将目的多核苷酸序列的3′端与一个粘性末端连接,并且将该目的多核苷酸序列的5’端与一个粘性末端连接;从而修饰该靶序列。
77.如权利要求76所述的方法,其中该第一核定位信号是单组分核定位信号。
78.如权利要求76所述的方法,其中该第一核定位信号是两组分核定位信号。
79.如权利要求76至78中任一项所述的方法,其中该第二核定位信号是单组分核定位信号。
80.如权利要求76至78中任一项所述的方法,其中该第二核定位信号是两组分核定位信号。
81.如权利要求76至80中任一项所述的方法,其中该第一核定位信号是两组分核定位信号,并且该第二核定位信号是单组分核定位信号。
82.如权利要求77、79或81中任一项所述的方法,其中该单组分核定位信号是SV40大T抗原、核质蛋白、EGL-13、c-Myc、TUS蛋白核定位信号、或其组合。
83.如权利要求78、80或81中任一项所述的方法,其中该两组分核定位信号是经典的两组分核定位信号。
84.如权利要求76至83中任一项所述的方法,其中该第一核定位信号和该第二核定位信号各自是两组分核定位信号。
85.如权利要求81所述的方法,其中该第一核定位信号是经典的两组分核定位信号,并且该第二核定位信号是SV40大T抗原核定位信号。
86.如权利要求76至85中任一项所述的方法,其中该第一核定位信号直接附接至该Cas9效应蛋白。
87.如权利要求76至85中任一项所述的方法,其中该第一核定位信号经由接头附接至该Cas9效应蛋白。
88.如权利要求76至87中任一项所述的方法,其中该第二核定位信号直接附接至该Cas9效应蛋白。
89.如权利要求76至87中任一项所述的方法,其中该第二核定位信号经由接头附接至该Cas9效应蛋白。
90.如权利要求87或89所述的方法,其中该接头是具有2至30个残基的肽接头。
91.如权利要求76至90中任一项所述的方法,其中该蛋白质包含该第一核定位信号的两个拷贝。
92.如权利要求76至90中任一项所述的方法,其中该蛋白质包含该第一核定位信号的三个拷贝。
93.如权利要求76至92中任一项所述的方法,其中该蛋白质包含该第二核定位信号的两个拷贝。
94.如权利要求76至92中任一项所述的方法,其中该蛋白质包含该第二核定位信号的三个拷贝。
95.如权利要求76至94中任一项所述的方法,其中该Cas9效应蛋白衍生自具有II-B型CRISPR系统的细菌物种。
96.如权利要求76至95中任一项所述的方法,其中该Cas9效应蛋白包含与SEQ ID NO:10-97中的任一个具有至少95%同一性的多肽序列。
97.如权利要求76至95中任一项所述的方法,其中该Cas9效应蛋白包含以1E-5的E值截止值匹配TIGR03031蛋白家族的结构域。
98.如权利要求76至97中任一项所述的方法,其中该指导多核苷酸是RNA。
99.如权利要求98所述的方法,其中该指导多核苷酸的长度是19至30个碱基。
100.如权利要求98所述的方法,其中该指导多核苷酸的长度是19至25个碱基。
101.如权利要求98所述的方法,其中该指导多核苷酸的长度是21至26个碱基。
102.如权利要求76至101中任一项所述的方法,其中该指导多核苷酸进一步包含tracrRNA序列。
103.如权利要求76至102中任一项所述的系统,其中该Cas9效应蛋白产生粘性末端。
104.如权利要求76至103中任一项所述的方法,其中这些粘性末端包含具有1至10个核苷酸的单链多核苷酸突出端。
105.如权利要求76至104中任一项所述的方法,其中这些粘性末端包含具有2至6个核苷酸的单链多核苷酸突出端。
106.如权利要求76至105中任一项所述的方法,其中这些粘性末端包含具有3至5个核苷酸的单链多核苷酸突出端。
107.如权利要求76至106中任一项所述的方法,其中这些粘性末端是平末端。
108.如权利要求76至106中任一项所述的方法,其中这些粘性末端具有5’单链多核苷酸突出端。
109.如权利要求76至106中任一项所述的方法,其中这些粘性末端具有3’单链多核苷酸突出端。
110.如权利要求76至109中任一项所述的方法,其中该真核细胞是动物或人细胞。
111.如权利要求76至109中任一项所述的方法,其中该真核细胞是人细胞。
112.如权利要求76至109中任一项所述的方法,其中该真核细胞是植物细胞。
113.如权利要求76至112中任一项所述的方法,其中该修饰是该靶序列的至少一部分的缺失。
114.如权利要求76至112中任一项所述的方法,其中该修饰是该靶序列的突变。
115.如权利要求76至112中任一项所述的方法,其中该修饰是将目的序列插入该靶序列中。
116.一种用于减少细胞中Cas9效应蛋白降解的方法,该方法包括
a)将第一核定位信号附接至该Cas9效应蛋白的N-末端;以及
b)将第二核定位信号附接至该Cas9效应蛋白的C-末端。
117.如权利要求116所述的方法,其中该第一核定位信号是单组分核定位信号。
118.如权利要求116所述的方法,其中该第一核定位信号是两组分核定位信号。
119.如权利要求116至118中任一项所述的方法,其中该第二核定位信号是单组分核定位信号。
120.如权利要求116至118中任一项所述的方法,其中该第二核定位信号是两组分核定位信号。
121.如权利要求116所述的方法,其中该第一核定位信号是两组分核定位信号,并且该第二核定位信号是单组分核定位信号。
122.如权利要求117、119或121中任一项所述的方法,其中该单组分核定位信号是SV40大T抗原、核质蛋白、EGL-13、c-Myc、TUS蛋白核定位信号、或其组合。
123.如权利要求118、1 20或121中任一项所述的方法,其中该两组分核定位信号是经典的两组分核定位信号。
124.如权利要求121所述的方法,其中该第一核定位信号是经典的两组分核定位信号,并且该第二核定位信号是SV40大T抗原核定位信号。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202163193620P | 2021-05-27 | 2021-05-27 | |
US63/193620 | 2021-05-27 | ||
PCT/EP2022/064368 WO2022248645A1 (en) | 2021-05-27 | 2022-05-26 | Cas9 effector proteins with enhanced stability |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117396602A true CN117396602A (zh) | 2024-01-12 |
Family
ID=82117168
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202280037340.4A Pending CN117396602A (zh) | 2021-05-27 | 2022-05-26 | 具有增强的稳定性的cas9效应蛋白 |
Country Status (4)
Country | Link |
---|---|
EP (1) | EP4347805A1 (zh) |
JP (1) | JP2024518793A (zh) |
CN (1) | CN117396602A (zh) |
WO (1) | WO2022248645A1 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115716880A (zh) * | 2022-12-07 | 2023-02-28 | 云舟生物科技(广州)股份有限公司 | 一种核定位荧光蛋白及其应用 |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5543158A (en) | 1993-07-23 | 1996-08-06 | Massachusetts Institute Of Technology | Biodegradable injectable nanoparticles |
US6007845A (en) | 1994-07-22 | 1999-12-28 | Massachusetts Institute Of Technology | Nanoparticles and microparticles of non-linear hydrophilic-hydrophobic multiblock copolymers |
US5855913A (en) | 1997-01-16 | 1999-01-05 | Massachusetts Instite Of Technology | Particles incorporating surfactants for pulmonary drug delivery |
US5895309A (en) | 1998-02-09 | 1999-04-20 | Spector; Donald | Collapsible hula-hoop |
AU2002364927A1 (en) * | 2001-07-10 | 2003-06-30 | North Carolina State University | Nanoparticle delivery vehicle |
JP2008078613A (ja) | 2006-08-24 | 2008-04-03 | Rohm Co Ltd | 窒化物半導体の製造方法及び窒化物半導体素子 |
CA2742954C (en) | 2008-11-07 | 2018-07-10 | Massachusetts Institute Of Technology | Aminoalcohol lipidoids and uses thereof |
US9193827B2 (en) | 2010-08-26 | 2015-11-24 | Massachusetts Institute Of Technology | Poly(beta-amino alcohols), their preparation, and uses thereof |
PL2691443T3 (pl) | 2011-03-28 | 2021-08-30 | Massachusetts Institute Of Technology | Sprzężone lipomery i ich zastosowania |
US9637739B2 (en) | 2012-03-20 | 2017-05-02 | Vilnius University | RNA-directed DNA cleavage by the Cas9-crRNA complex |
DE202013012241U1 (de) | 2012-05-25 | 2016-01-18 | Emmanuelle Charpentier | Zusammensetzungen für die durch RNA gesteuerte Modifikation einer Ziel-DNA und für die durch RNA gesteuerte Modulation der Transkription |
KR102210322B1 (ko) | 2013-03-15 | 2021-02-01 | 더 제너럴 하스피탈 코포레이션 | Rna-안내 게놈 편집의 특이성을 증가시키기 위한 rna-안내 foki 뉴클레아제(rfn)의 용도 |
US9234213B2 (en) | 2013-03-15 | 2016-01-12 | System Biosciences, Llc | Compositions and methods directed to CRISPR/Cas genomic engineering systems |
US20140349405A1 (en) | 2013-05-22 | 2014-11-27 | Wisconsin Alumni Research Foundation | Rna-directed dna cleavage and gene editing by cas9 enzyme from neisseria meningitidis |
US9322037B2 (en) | 2013-09-06 | 2016-04-26 | President And Fellows Of Harvard College | Cas9-FokI fusion proteins and uses thereof |
US9526784B2 (en) | 2013-09-06 | 2016-12-27 | President And Fellows Of Harvard College | Delivery system for functional nucleases |
CA3030587A1 (en) * | 2016-07-15 | 2018-01-18 | Salk Institute For Biological Studies | Methods and compositions for genome editing in non-dividing cells |
US11542509B2 (en) | 2016-08-24 | 2023-01-03 | President And Fellows Of Harvard College | Incorporation of unnatural amino acids into proteins using base editing |
GB2572918B (en) | 2016-12-23 | 2023-02-15 | Harvard College | Gene editing of PCSK9 |
CN106632693B (zh) * | 2017-01-19 | 2021-05-25 | 上海科技大学 | 具有多个核定位序列的SpyCas9蛋白及其应用 |
IL269458B2 (en) | 2017-03-23 | 2024-02-01 | Harvard College | Nucleic base editors that include nucleic acid programmable DNA binding proteins |
CN111448313A (zh) | 2017-11-16 | 2020-07-24 | 阿斯利康(瑞典)有限公司 | 用于改善基于Cas9的敲入策略的有效性的组合物和方法 |
US20210115420A1 (en) * | 2018-05-01 | 2021-04-22 | The Children's Medical Center Corporation | Enhanced bcl11a rnp / crispr delivery & editing using a 3xnls-cas9 |
DE112020001342T5 (de) | 2019-03-19 | 2022-01-13 | President and Fellows of Harvard College | Verfahren und Zusammensetzungen zum Editing von Nukleotidsequenzen |
-
2022
- 2022-05-26 CN CN202280037340.4A patent/CN117396602A/zh active Pending
- 2022-05-26 WO PCT/EP2022/064368 patent/WO2022248645A1/en active Application Filing
- 2022-05-26 JP JP2023571310A patent/JP2024518793A/ja active Pending
- 2022-05-26 EP EP22732040.5A patent/EP4347805A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
JP2024518793A (ja) | 2024-05-02 |
WO2022248645A1 (en) | 2022-12-01 |
EP4347805A1 (en) | 2024-04-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20200239863A1 (en) | Tracking and Manipulating Cellular RNA via Nuclear Delivery of CRISPR/CAS9 | |
AU2021200636B2 (en) | Using programmable dna binding proteins to enhance targeted genome modification | |
JP7423520B2 (ja) | Cas9ベースノックイン方針の効力を改善するための組成物及び方法 | |
US20190300867A1 (en) | Bypassing the pam requirement of the crispr-cas system | |
CA3077086A1 (en) | Systems, methods, and compositions for targeted nucleic acid editing | |
CN111328290A (zh) | 用于靶向核酸编辑的基于crispr/cas-腺嘌呤脱氨酶的组合物、系统和方法 | |
US20190390229A1 (en) | Gene editing reagents with reduced toxicity | |
CN117396602A (zh) | 具有增强的稳定性的cas9效应蛋白 | |
JP2024534207A (ja) | キロ塩基スケールでのrnaガイドゲノムリコンビニアリング | |
EP4408993A1 (en) | Methods for gene editing | |
US20220372522A1 (en) | Compositions and methods for homology-directed recombination | |
CN117355607A (zh) | 非病毒同源性介导的末端连接 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |