CN118792270A - 工程化的dna甲基转移酶及其在表观遗传编辑中的应用 - Google Patents
工程化的dna甲基转移酶及其在表观遗传编辑中的应用 Download PDFInfo
- Publication number
- CN118792270A CN118792270A CN202410666514.4A CN202410666514A CN118792270A CN 118792270 A CN118792270 A CN 118792270A CN 202410666514 A CN202410666514 A CN 202410666514A CN 118792270 A CN118792270 A CN 118792270A
- Authority
- CN
- China
- Prior art keywords
- nls
- cooh
- dna
- binding domain
- domain
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 102000016397 Methyltransferase Human genes 0.000 title claims abstract description 305
- 108060004795 Methyltransferase Proteins 0.000 title claims abstract description 305
- 230000001973 epigenetic effect Effects 0.000 title claims abstract description 171
- 239000013598 vector Substances 0.000 claims abstract description 172
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 74
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 69
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 69
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 64
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 56
- 229920001184 polypeptide Polymers 0.000 claims abstract description 55
- 230000004927 fusion Effects 0.000 claims abstract description 38
- 238000000034 method Methods 0.000 claims abstract description 17
- 108700040121 Protein Methyltransferases Proteins 0.000 claims abstract description 12
- 102000055027 Protein Methyltransferases Human genes 0.000 claims abstract description 12
- 239000000203 mixture Substances 0.000 claims abstract description 4
- 108020004414 DNA Proteins 0.000 claims description 260
- 108010077850 Nuclear Localization Signals Proteins 0.000 claims description 239
- 230000004568 DNA-binding Effects 0.000 claims description 221
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 claims description 187
- 238000013518 transcription Methods 0.000 claims description 161
- 230000035897 transcription Effects 0.000 claims description 161
- 210000004027 cell Anatomy 0.000 claims description 102
- 108020005004 Guide RNA Proteins 0.000 claims description 79
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 54
- 108090000623 proteins and genes Proteins 0.000 claims description 50
- 239000002773 nucleotide Substances 0.000 claims description 49
- 125000003729 nucleotide group Chemical group 0.000 claims description 49
- 230000014509 gene expression Effects 0.000 claims description 45
- 108020001507 fusion proteins Proteins 0.000 claims description 44
- 102000037865 fusion proteins Human genes 0.000 claims description 44
- 102100025169 Max-binding protein MNT Human genes 0.000 claims description 41
- 108091006107 transcriptional repressors Proteins 0.000 claims description 41
- 238000006467 substitution reaction Methods 0.000 claims description 37
- 102000004169 proteins and genes Human genes 0.000 claims description 36
- 230000007067 DNA methylation Effects 0.000 claims description 27
- 102000040430 polynucleotide Human genes 0.000 claims description 17
- 108091033319 polynucleotide Proteins 0.000 claims description 17
- 239000002157 polynucleotide Substances 0.000 claims description 17
- 239000013603 viral vector Substances 0.000 claims description 15
- 208000009869 Neu-Laxova syndrome Diseases 0.000 claims description 14
- 230000004048 modification Effects 0.000 claims description 14
- 238000012986 modification Methods 0.000 claims description 14
- 150000001413 amino acids Chemical class 0.000 claims description 11
- 230000008685 targeting Effects 0.000 claims description 10
- 210000003527 eukaryotic cell Anatomy 0.000 claims description 9
- 101001098868 Homo sapiens Proprotein convertase subtilisin/kexin type 9 Proteins 0.000 claims description 8
- 102100038955 Proprotein convertase subtilisin/kexin type 9 Human genes 0.000 claims description 8
- 230000002401 inhibitory effect Effects 0.000 claims description 8
- 238000003780 insertion Methods 0.000 claims description 8
- 230000037431 insertion Effects 0.000 claims description 8
- 102000004190 Enzymes Human genes 0.000 claims description 7
- 108090000790 Enzymes Proteins 0.000 claims description 7
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 7
- 238000012217 deletion Methods 0.000 claims description 7
- 230000037430 deletion Effects 0.000 claims description 7
- 210000005260 human cell Anatomy 0.000 claims description 7
- 230000027455 binding Effects 0.000 claims description 6
- 230000030279 gene silencing Effects 0.000 claims description 6
- 108020004999 messenger RNA Proteins 0.000 claims description 5
- 102100038740 Activator of RNA decay Human genes 0.000 claims description 4
- 238000010453 CRISPR/Cas method Methods 0.000 claims description 4
- 108010077544 Chromatin Proteins 0.000 claims description 4
- 238000010459 TALEN Methods 0.000 claims description 4
- 210000003483 chromatin Anatomy 0.000 claims description 4
- 239000002105 nanoparticle Substances 0.000 claims description 4
- 239000013612 plasmid Substances 0.000 claims description 4
- 210000001236 prokaryotic cell Anatomy 0.000 claims description 4
- 230000001177 retroviral effect Effects 0.000 claims description 4
- 208000009889 Herpes Simplex Diseases 0.000 claims description 3
- 101710163270 Nuclease Proteins 0.000 claims description 3
- 108700008625 Reporter Genes Proteins 0.000 claims description 3
- 230000003834 intracellular effect Effects 0.000 claims description 3
- 230000001035 methylating effect Effects 0.000 claims description 3
- 230000004960 subcellular localization Effects 0.000 claims description 3
- 238000010361 transduction Methods 0.000 claims description 3
- 230000026683 transduction Effects 0.000 claims description 3
- 102100032919 Chromobox protein homolog 1 Human genes 0.000 claims description 2
- 108010034791 Heterochromatin Proteins 0.000 claims description 2
- 102000003964 Histone deacetylase Human genes 0.000 claims description 2
- 108090000353 Histone deacetylase Proteins 0.000 claims description 2
- 102100039996 Histone deacetylase 1 Human genes 0.000 claims description 2
- 102100038970 Histone-lysine N-methyltransferase EZH2 Human genes 0.000 claims description 2
- 101000741919 Homo sapiens Activator of RNA decay Proteins 0.000 claims description 2
- 101000797584 Homo sapiens Chromobox protein homolog 1 Proteins 0.000 claims description 2
- 101001035024 Homo sapiens Histone deacetylase 1 Proteins 0.000 claims description 2
- 101000882127 Homo sapiens Histone-lysine N-methyltransferase EZH2 Proteins 0.000 claims description 2
- 101000581507 Homo sapiens Methyl-CpG-binding domain protein 1 Proteins 0.000 claims description 2
- 101000651906 Homo sapiens Paired amphipathic helix protein Sin3a Proteins 0.000 claims description 2
- 101000727821 Homo sapiens RING1 and YY1-binding protein Proteins 0.000 claims description 2
- 101000874241 Homo sapiens Sin3 histone deacetylase corepressor complex component SDS3 Proteins 0.000 claims description 2
- 101000762938 Homo sapiens TOX high mobility group box family member 4 Proteins 0.000 claims description 2
- 101000796184 Homo sapiens U3 small nucleolar RNA-interacting protein 2 Proteins 0.000 claims description 2
- 102000006890 Methyl-CpG-Binding Protein 2 Human genes 0.000 claims description 2
- 108010072388 Methyl-CpG-Binding Protein 2 Proteins 0.000 claims description 2
- 102100027383 Methyl-CpG-binding domain protein 1 Human genes 0.000 claims description 2
- 102100027334 Paired amphipathic helix protein Sin3a Human genes 0.000 claims description 2
- 108090000506 Protein phosphatase inhibitor 1 Proteins 0.000 claims description 2
- 102100029760 RING1 and YY1-binding protein Human genes 0.000 claims description 2
- 102100035738 Sin3 histone deacetylase corepressor complex component SDS3 Human genes 0.000 claims description 2
- 102100026749 TOX high mobility group box family member 4 Human genes 0.000 claims description 2
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 claims description 2
- 102100031376 U3 small nucleolar RNA-interacting protein 2 Human genes 0.000 claims description 2
- 108010017070 Zinc Finger Nucleases Proteins 0.000 claims description 2
- 239000003937 drug carrier Substances 0.000 claims description 2
- 210000001808 exosome Anatomy 0.000 claims description 2
- 239000002502 liposome Substances 0.000 claims description 2
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims 1
- 235000018102 proteins Nutrition 0.000 description 35
- 230000011987 methylation Effects 0.000 description 29
- 238000007069 methylation reaction Methods 0.000 description 29
- 235000001014 amino acid Nutrition 0.000 description 22
- 101150066002 GFP gene Proteins 0.000 description 15
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 12
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 12
- 238000001890 transfection Methods 0.000 description 11
- 230000005764 inhibitory process Effects 0.000 description 8
- 230000000694 effects Effects 0.000 description 7
- 230000007774 longterm Effects 0.000 description 7
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 6
- 108091029523 CpG island Proteins 0.000 description 6
- 102000053602 DNA Human genes 0.000 description 6
- 102100034803 Small nuclear ribonucleoprotein-associated protein N Human genes 0.000 description 6
- 229910002092 carbon dioxide Inorganic materials 0.000 description 6
- 239000001569 carbon dioxide Substances 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000009975 flexible effect Effects 0.000 description 6
- 238000000684 flow cytometry Methods 0.000 description 6
- 108010039827 snRNP Core Proteins Proteins 0.000 description 6
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 5
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 5
- 101150069235 Snrpn gene Proteins 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 108010033040 Histones Proteins 0.000 description 4
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 4
- 229920000642 polymer Polymers 0.000 description 4
- 238000012795 verification Methods 0.000 description 4
- 108010075254 C-Peptide Proteins 0.000 description 3
- 108010063593 DNA modification methylase SssI Proteins 0.000 description 3
- 102000006947 Histones Human genes 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 238000001369 bisulfite sequencing Methods 0.000 description 3
- 230000000295 complement effect Effects 0.000 description 3
- 238000012258 culturing Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 206010073071 hepatocellular carcinoma Diseases 0.000 description 3
- 239000012528 membrane Substances 0.000 description 3
- 230000035772 mutation Effects 0.000 description 3
- 239000000047 product Substances 0.000 description 3
- 230000003252 repetitive effect Effects 0.000 description 3
- 230000009870 specific binding Effects 0.000 description 3
- LSNNMFCWUKXFEE-UHFFFAOYSA-M Bisulfite Chemical compound OS([O-])=O LSNNMFCWUKXFEE-UHFFFAOYSA-M 0.000 description 2
- 108091033409 CRISPR Proteins 0.000 description 2
- 102100036279 DNA (cytosine-5)-methyltransferase 1 Human genes 0.000 description 2
- 102100024811 DNA (cytosine-5)-methyltransferase 3-like Human genes 0.000 description 2
- 102100024812 DNA (cytosine-5)-methyltransferase 3A Human genes 0.000 description 2
- 108010024491 DNA Methyltransferase 3A Proteins 0.000 description 2
- 206010013801 Duchenne Muscular Dystrophy Diseases 0.000 description 2
- 239000004471 Glycine Substances 0.000 description 2
- 101000909250 Homo sapiens DNA (cytosine-5)-methyltransferase 3-like Proteins 0.000 description 2
- 101000827703 Homo sapiens Polyphosphoinositide phosphatase Proteins 0.000 description 2
- 208000010038 Ischemic Optic Neuropathy Diseases 0.000 description 2
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 2
- 206010028980 Neoplasm Diseases 0.000 description 2
- 102000002488 Nucleoplasmin Human genes 0.000 description 2
- 206010030924 Optic ischaemic neuropathy Diseases 0.000 description 2
- 102100023591 Polyphosphoinositide phosphatase Human genes 0.000 description 2
- MEFKEPWMEQBLKI-AIRLBKTGSA-N S-adenosyl-L-methioninate Chemical compound O[C@@H]1[C@H](O)[C@@H](C[S+](CC[C@H](N)C([O-])=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 MEFKEPWMEQBLKI-AIRLBKTGSA-N 0.000 description 2
- 101000910035 Streptococcus pyogenes serotype M1 CRISPR-associated endonuclease Cas9/Csn1 Proteins 0.000 description 2
- 206010045261 Type IIa hyperlipidaemia Diseases 0.000 description 2
- 229960001570 ademetionine Drugs 0.000 description 2
- 235000004279 alanine Nutrition 0.000 description 2
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 2
- 208000006682 alpha 1-Antitrypsin Deficiency Diseases 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 2
- 210000003855 cell nucleus Anatomy 0.000 description 2
- 210000004748 cultured cell Anatomy 0.000 description 2
- 229940104302 cytosine Drugs 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000004049 epigenetic modification Effects 0.000 description 2
- 238000012226 gene silencing method Methods 0.000 description 2
- 231100000844 hepatocellular carcinoma Toxicity 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- 201000002761 non-arteritic anterior ischemic optic neuropathy Diseases 0.000 description 2
- 108060005597 nucleoplasmin Proteins 0.000 description 2
- 210000003463 organelle Anatomy 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 239000002096 quantum dot Substances 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 230000001629 suppression Effects 0.000 description 2
- -1 target dsDNA Chemical class 0.000 description 2
- JARGNLJYKBUKSJ-KGZKBUQUSA-N (2r)-2-amino-5-[[(2r)-1-(carboxymethylamino)-3-hydroxy-1-oxopropan-2-yl]amino]-5-oxopentanoic acid;hydrobromide Chemical compound Br.OC(=O)[C@H](N)CCC(=O)N[C@H](CO)C(=O)NCC(O)=O JARGNLJYKBUKSJ-KGZKBUQUSA-N 0.000 description 1
- KUHSEZKIEJYEHN-BXRBKJIMSA-N (2s)-2-amino-3-hydroxypropanoic acid;(2s)-2-aminopropanoic acid Chemical compound C[C@H](N)C(O)=O.OC[C@H](N)C(O)=O KUHSEZKIEJYEHN-BXRBKJIMSA-N 0.000 description 1
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- 101000935845 Aliivibrio fischeri Blue fluorescence protein Proteins 0.000 description 1
- 208000023275 Autoimmune disease Diseases 0.000 description 1
- 206010061692 Benign muscle neoplasm Diseases 0.000 description 1
- 108700031361 Brachyury Proteins 0.000 description 1
- 238000010446 CRISPR interference Methods 0.000 description 1
- 208000017667 Chronic Disease Diseases 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 108010009540 DNA (Cytosine-5-)-Methyltransferase 1 Proteins 0.000 description 1
- 102100024810 DNA (cytosine-5)-methyltransferase 3B Human genes 0.000 description 1
- 101710123222 DNA (cytosine-5)-methyltransferase 3B Proteins 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 101000935842 Escherichia coli O127:H6 (strain E2348/69 / EPEC) Major structural subunit of bundle-forming pilus Proteins 0.000 description 1
- 108091092566 Extrachromosomal DNA Proteins 0.000 description 1
- 208000037149 Facioscapulohumeral dystrophy Diseases 0.000 description 1
- 102100039556 Galectin-4 Human genes 0.000 description 1
- 101150112014 Gapdh gene Proteins 0.000 description 1
- BCCRXDTUTZHDEU-VKHMYHEASA-N Gly-Ser Chemical compound NCC(=O)N[C@@H](CO)C(O)=O BCCRXDTUTZHDEU-VKHMYHEASA-N 0.000 description 1
- 102100031181 Glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 1
- 241000700721 Hepatitis B virus Species 0.000 description 1
- 101001023784 Heteractis crispa GFP-like non-fluorescent chromoprotein Proteins 0.000 description 1
- 101000931098 Homo sapiens DNA (cytosine-5)-methyltransferase 1 Proteins 0.000 description 1
- 101000608765 Homo sapiens Galectin-4 Proteins 0.000 description 1
- 101000741544 Homo sapiens Properdin Proteins 0.000 description 1
- 101001079872 Homo sapiens RING finger protein 112 Proteins 0.000 description 1
- 208000031226 Hyperlipidaemia Diseases 0.000 description 1
- 206010020772 Hypertension Diseases 0.000 description 1
- 208000026350 Inborn Genetic disease Diseases 0.000 description 1
- 206010061218 Inflammation Diseases 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- 101710128836 Large T antigen Proteins 0.000 description 1
- 239000000232 Lipid Bilayer Substances 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 101100078999 Mus musculus Mx1 gene Proteins 0.000 description 1
- 102100038895 Myc proto-oncogene protein Human genes 0.000 description 1
- 101710135898 Myc proto-oncogene protein Proteins 0.000 description 1
- 201000004458 Myoma Diseases 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 101150094724 PCSK9 gene Proteins 0.000 description 1
- 102000012338 Poly(ADP-ribose) Polymerases Human genes 0.000 description 1
- 108010061844 Poly(ADP-ribose) Polymerases Proteins 0.000 description 1
- 229920000776 Poly(Adenosine diphosphate-ribose) polymerase Polymers 0.000 description 1
- 208000035977 Rare disease Diseases 0.000 description 1
- 241000700584 Simplexvirus Species 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 101800001707 Spacer peptide Proteins 0.000 description 1
- 108091027544 Subgenomic mRNA Proteins 0.000 description 1
- 101710150448 Transcriptional regulator Myc Proteins 0.000 description 1
- 208000036142 Viral infection Diseases 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 102000009899 alpha Karyopherins Human genes 0.000 description 1
- 108010077099 alpha Karyopherins Proteins 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 208000015114 central nervous system disease Diseases 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 210000003763 chloroplast Anatomy 0.000 description 1
- 230000011088 chloroplast localization Effects 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 210000000172 cytosol Anatomy 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000017858 demethylation Effects 0.000 description 1
- 238000010520 demethylation reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000008143 early embryonic development Effects 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 210000001723 extracellular space Anatomy 0.000 description 1
- 208000008570 facioscapulohumeral muscular dystrophy Diseases 0.000 description 1
- 108010021843 fluorescent protein 583 Proteins 0.000 description 1
- 108091006047 fluorescent proteins Proteins 0.000 description 1
- 102000034287 fluorescent proteins Human genes 0.000 description 1
- 108010044804 gamma-glutamyl-seryl-glycine Proteins 0.000 description 1
- 238000003209 gene knockout Methods 0.000 description 1
- 208000016361 genetic disease Diseases 0.000 description 1
- 239000003862 glucocorticoid Substances 0.000 description 1
- 108700026078 glutathione trisulfide Proteins 0.000 description 1
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 1
- 208000006454 hepatitis Diseases 0.000 description 1
- 231100000283 hepatitis Toxicity 0.000 description 1
- 102000048122 human MX1 Human genes 0.000 description 1
- 230000004054 inflammatory process Effects 0.000 description 1
- 108700032552 influenza virus INS1 Proteins 0.000 description 1
- 150000002484 inorganic compounds Chemical class 0.000 description 1
- 229910010272 inorganic material Inorganic materials 0.000 description 1
- 210000003093 intracellular space Anatomy 0.000 description 1
- 230000005923 long-lasting effect Effects 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 1
- 239000000693 micelle Substances 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 210000003470 mitochondria Anatomy 0.000 description 1
- 230000025608 mitochondrion localization Effects 0.000 description 1
- 238000002715 modification method Methods 0.000 description 1
- 108091027963 non-coding RNA Proteins 0.000 description 1
- 102000042567 non-coding RNA Human genes 0.000 description 1
- 230000030147 nuclear export Effects 0.000 description 1
- 150000002894 organic compounds Chemical class 0.000 description 1
- 230000000149 penetrating effect Effects 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 239000012264 purified product Substances 0.000 description 1
- 230000002285 radioactive effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000007480 sanger sequencing Methods 0.000 description 1
- 208000000943 scapulohumeral muscular dystrophy Diseases 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 125000006850 spacer group Chemical group 0.000 description 1
- 108020003113 steroid hormone receptors Proteins 0.000 description 1
- 102000005969 steroid hormone receptors Human genes 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 230000009385 viral infection Effects 0.000 description 1
- 108091005957 yellow fluorescent proteins Proteins 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1003—Transferases (2.) transferring one-carbon groups (2.1)
- C12N9/1007—Methyltransferases (general) (2.1.1.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
- C12N15/1137—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against enzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
- C12N5/06—Animal cells or tissues; Human cells or tissues
- C12N5/0602—Vertebrate cells
- C12N5/0684—Cells of the urinary tract or kidneys
- C12N5/0686—Kidney cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y201/00—Transferases transferring one-carbon groups (2.1)
- C12Y201/01—Methyltransferases (2.1.1)
- C12Y201/01037—DNA (cytosine-5-)-methyltransferase (2.1.1.37)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y304/00—Hydrolases acting on peptide bonds, i.e. peptidases (3.4)
- C12Y304/21—Serine endopeptidases (3.4.21)
- C12Y304/21061—Kexin (3.4.21.61), i.e. proprotein convertase subtilisin/kexin type 9
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPR]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2510/00—Genetically modified cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/10—Plasmid DNA
- C12N2800/106—Plasmid DNA for vertebrates
- C12N2800/107—Plasmid DNA for vertebrates for mammalian
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Urology & Nephrology (AREA)
- Virology (AREA)
- Cell Biology (AREA)
- Medicinal Chemistry (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
本文公开了工程化的DNA甲基转移酶及其在表观遗传编辑中的应用。本文具体公开了工程化的DNA甲基转移酶及基于该DNA甲基转移酶的表观遗传编辑器,本文开发的用于表观遗传编辑的DNA甲基转移酶、复合物、融合多肽、核酸、载体、载体系统、递送系统、细胞、试剂盒、组合物,以及修饰靶核酸的方法和应用。
Description
技术领域
本发明涉及基因沉默和/或表观遗传编辑领域,特别是表观遗传编辑器(epigenetic editor)技术领域。具体而言,本发明涉及工程化的DNA甲基转移酶,包含此类蛋白的融合蛋白,以及编码它们的核酸分子。本发明还涉及用于沉默基因表达的复合物和组合物,其包含本发明的DNA甲基转移酶或融合蛋白,或编码它们的核酸分子。本发明还涉及用于沉默细胞中靶核酸序列的方法,其使用包含本发明的DNA甲基转移酶或融合蛋白。
背景技术
表观遗传编辑(epigenetic editing)机制主要涉及染色质中DNA、组蛋白等分子的化学修饰状态对基因表达的影响,及基因所编码的产物(生物分子)所决定的遗传性和不可遗传性改变。当前,已知的表观遗传修饰主要包括DNA和组蛋白的修饰,如DNA甲基化/去甲基化、各种类型的组蛋白可逆性修饰,以及调节非编码RNA等。DNA甲基化修饰通常由DNA甲基转移酶(DNAmethyltransferase,DNMT)可将S-腺苷甲硫氨酸(SAM)的“甲基”添加到位于基因上游启动子或结构基因的5'侧的CpG岛胞嘧啶中,导致生物基因组中“CpG岛”内胞嘧啶甲基化使相应部位染色质变“致密”,CpG岛甲基化修饰通常会关闭所在部位基因的转录。基因沉默是表观遗传编辑中的一项关键应用,它通过精确地定位到目标基因的启动子区域,使用特定的编辑复合物(如融合了转录阻遏物的dCas9蛋白)介导甲基化或其他表观遗传修饰,从而实现对基因表达的抑制。这种技术的优势在于其可逆性和高度的特异性,相比传统的基因敲除技术,表观遗传编辑能够在不改变基因组本身的情况下,实现对疾病相关基因的有效调控。
哺乳动物中已发现4种DNMTs,其中DNMT1负责基因组特定部位的DNA甲基化模式的维持,DNMT3A、DNMT3B以及DNMT3L则负责胚胎早期发育过程所必需的DNA甲基化修饰。在原核微生物中也发现可以特异性地将DNA中的CpG岛甲基化修饰的DNA甲基化酶(如M.SssI等)。但目前这些DNA甲基化酶存在各种各样的缺陷,前者的尺寸过大导致其在向细胞递送过程中存在巨大问题,后者的甲基化效率过低限制其应用。因此,发现和开发新型高效并且小分子量的DNA甲基转移酶具有重大的意义。
发明内容
本发明的一个方面提供一种工程化的DNA甲基转移酶,其相对于SEQ ID NO:1所示序列在以下位点中的一个、多个或全部具有氨基酸取代:C135、S139、Q141、E184、R228、R230、T301、N303、T317和S321,并且其氨基酸序列与SEQ ID NO:1所示序列具有约90%至约99.9%的序列同一性;优选地,所述DNA甲基转移酶相对于SEQ ID NO:1所示序列在以下位点中的一个氨基酸取代:S139、T301、N303、T317和S321;更优选地,所述DNA甲基转移酶相对于SEQ ID NO:1所示序列在S139位点发生氨基酸取代。
具体的,多核苷酸或多肽与另一多核苷酸或多肽具有一定的“序列同一性”百分比,这意味着当比对时碱基或氨基酸的百分数为相同的,并且当比较两个序列时在相同的相对位置上。可以许多不同方式确定序列同一性。为了确定序列同一性,可使用在包括ncbi.nlm.nili.gov/BLAST、ebi.ac.uk/Tools/msa/tcoffee/、ebi.ac.uk/Tools/msa/muscle/、mafft.cbrc.jp/alignment/software/的万维网网址上可获得的各种方便的方法和计算机程序(例如,BLAST、T-COFFEE、MUSCLE、MAFFT等)来比对序列。本文使用的术语“序列同一性”是指在比较窗内基于一个核苷酸接着一个核苷酸或基于一个氨基酸接着一个氨基酸的序列相同的程度。因此,“序列同一性百分比(percentage ofsequence identity)”如下计算:通过在比较窗内比较两个最佳比对的序列,确定两个序列中出现相同的核酸碱基(例如,A、T、C、G、I)或相同的氨基酸残基(例如,Ala、Pro、Ser、Thr、Gly、Val、Leu、Ile、Phe、Tyr、Trp、Lys、Arg、His、Asp、Glu、Asn、Gln、Cys和Met)的位置数目以产生匹配位置的数目,将匹配位置的数目除以比较窗中位置的总数目(即,窗大小),并将结果乘以100以得到序列同一性的百分比。
在本发明中,当比对的序列是非连续的两段序列时,序列同一性的计算基于该序列的比对结果获得。例如,“与SEQ ID NO.1的氨基酸序列相比具有约90%至约99.9%序列同一性”的术语“约90%至约99.9%”在本发明中是指90%至99.9%的任何值,例如90%、90.5%、91%、91.5%、92%、92.5%、93%、93.5%、94%、94.5%、95%、95.5%、96%、96.5%、97%、97.5%、98%、98.5%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%或99.9%。
在一些实施方式中,所述DNA甲基转移酶包含或为与SEQ ID NO.1所示的氨基酸序列相比具有至少95%序列同一性的氨基酸序列。例如,所述DNA甲基转移酶包含或为与SEQID NO.1所示的氨基酸序列相比具有至少95%、96%、97%、98%、98.1%、98.2%、98.3%、98.4%、98.5%、98.6%、98.7%、98.8%、98.9%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%或99.9%序列同一性的氨基酸序列,且相对于SEQ ID NO.1所示的氨基酸序列,在1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个或12个位置处具有氨基酸取代。
在优选的实施方式中,所述工程化的DNA甲基转移酶,其中:(a)C135的取代选自:C135A;(b)S139的取代选自:S139A;(c)Q141的取代为Q141L;(d)E184的取代选自:E184A;(e)R228的取代选自:R228A;(f)R230的取代选自:R230A;(g)T301的取代为T301A;(h)N303的取代为N303A;(i)T317的取代为T317A、T317D或T317H;或(j)S321的取代选自:S321A。
在更优选的实施方式中,所述工程化的DNA甲基转移酶,所述DNA甲基转移酶相对于SEQ ID NO:1所示序列在以下位点中的一个氨基酸取代:S139A、T301A、N303A、T317A和S321A;更优选地,所述DNA甲基转移酶相对于SEQ ID NO:1所示序列在S139位点发生丙氨酸取代。
具体的,所述工程化的DNA甲基转移酶在特定位置被特定氨基酸取代的突变多肽名称根据人类基因组变异协会(HGVS:Human Genome Variation Society)的突变命名规则命名,例如:“所述DNA甲基转移酶在S139位置处具有氨基酸取代”中“S139A”表示在SEQ IDNO.1的第139位置氨基酸发生了S替换原来的A。
在优选的实施方式中,所述工程化的DNA甲基转移酶,其中所述DNA甲基转移酶包含或为SEQ ID NO:2至8任一项所示的氨基酸序列或与它们各自具有至少约95%的序列同一性的氨基酸序列。
在另一些实施方式中,本发明提供一种工程化的DNA甲基转移酶,其具有以下一个或多个特征:(i)能够在真核细胞中实现DNA水平的甲基化;(ii)氨基酸长度不超过约395、约390、约385、约380、约375、约370、约365、约360、约355、约350、约345、约340、约335、约330、约325、约320或315;(iii)在真核细胞中将靶核酸序列甲基化的效率为10%至100%;以及(iv)氨基酸序列不是SEQ ID NO.1所示的氨基酸序列。
在本发明的另一个方面提供一种包含所述DNA甲基转移酶的表观遗传编辑器;优选地,所述表观遗传编辑器包含:DNA结合结构域以及所述DNA甲基转移酶。
在优选的实施方式中,所述表观遗传编辑器还包含转录阻遏物结构域。
具体的,在本发明的一种表观遗传编辑器,其包含:(a)DNA结合结构域;(b)所述DNA甲基转移酶;以及(c)转录阻遏物结构域。
在一些实施方式中,本发明提供的各种表观遗传编辑器中,所述DNA结合结构域包含CRISPR/Cas结构域、锌指核酸酶ZFN、转录激活因子样效应核酸酶TALEN、大范围核酸酶或其任意组合;优选地,所述DNA结合结构域包含CRISPR/Cas结构域;其中所述转录阻遏物结构域包含选自以下的结构域:Krüppel-associatedbox(KRAB)转录阻遏物、SID转录阻遏物、EZH2转录阻遏物、HP1异染色质蛋白、CBX1/5异染色质蛋白、Gli3转录阻遏物、MBD1/2/3转录阻遏物、TOX4转录阻遏物、RRP9转录阻遏物、NIPP1(PPP1R8)转录阻遏物、HDAC1/3/5/8组蛋白去乙酰化酶、SIN3A转录阻遏物、SUDS3转录阻遏物、RYBP转录阻遏物和MeCP2转录阻遏物;更优选地,所述转录阻遏物结构域包含KRAB转录阻遏物。
在优选的实施方式中,所述DNA结合结构域选自Type I型的无核酸酶活性的Cas蛋白系统、Type II型的无核酸酶活性的Cas蛋白或Type V型的无核酸酶活性的Cas蛋白;具体的,Type I型的无核酸酶活性的Cas蛋白选自Type I-A型、Type I-B型、Type I-C型、TypeI-U型、Type I-D型、Type I-E型或Type I-F型的无核酸酶活性的Cas蛋白;Type II型的无核酸酶活性的Cas蛋白选自无核酸酶活性的Cas9、无核酸酶活性的Cas9变异体(dSpCas9变体或dSaCas9变体);Type V型的无核酸酶活性的Cas蛋白选自Type V-A型、Type V-B型、Type V-C型、Type V-D型、Type V-E型、Type V-F1型、Type V-F2型、Type V-F3型、Type V-G型、Type V-H型、Type V-I型、Type V-J型、Type V-K型、Type V-L型、Type V-M型、Type V-N型、Type V-U2型、Type V-U3型或Type V-U4型的无核酸酶活性的Cas蛋白;所述DNA结合结构域选自为dCas12a(dCpf1)及其变体、dCas12b及其变体、dCas12c及其变体、dCas12d(dCasY)及其变体、dCas12e(dCasX)及其变体、dCas12f1(dCas14a)及其变体、dCas12f2(dCas14b)及其变体、dCas12f3(dCas14c)及其变体、dCas12 c2c8及其变体、dCas12 c2c9及其变体、dCas12 c2c10及其变体、dCas12g及其变体、dCas12h及其变体、dCas12i及其变体、dCas12j(dCasΦ)及其变体、dCas12k及其变体、dCas12L(dCasπ)及其变体、dCas12m及其变体、dCas12n及其变体、dCas12λ及其变体;优选地,所述DNA结合结构域选自dSpCas9、dSaCas9及其变体,所述dSpCas9包含SEQ ID NO.10所示的氨基酸序列,所述dSaCas9包含SEQ ID NO.11所示的氨基酸序列。
在优选的实施方式中,所述转录阻遏物结构域选自CN117136235A中公开的那些阻遏物结构域,通过引用将它们公开的内容完整合并至本文中。
在优选的实施方式中,所述KRAB转录阻遏物选自CN116209674A以及参考文献(Alerasool N,Segal D,Lee H,Taipale M.An efficient KRAB domain for CRISPRiapplications in human cells.NatMethods.2020;17(11):1093-1096.
doi:10.1038/s41592-020-0966-x)中公开的那些KRAB结构域,通过引用将它们公开的内容完整合并至本文中。
在一些实施方式中,所述表观遗传编辑器包含:DNA结合结构域以及所述的DNA甲基转移酶时,所述DNA甲基转移酶连接在所述DNA结合结构域的N末端或C末端;所述表观遗传编辑器包含:DNA结合结构域、转录阻遏物结构域以及所述的DNA甲基转移酶时,所述表观遗传编辑器包含一个融合蛋白,所述融合蛋白包含所述DNA结合结构域、所述DNA甲基转移酶和所述转录阻遏物结构域;或所述表观遗传编辑器包含第一融合蛋白和与所述第一融合蛋白不同的第二融合蛋白时,所述第一融合蛋白包含所述DNA结合结构域和所述DNA甲基转移酶,所述第二融合蛋白包含所述DNA结合结构域和所述转录阻遏物结构域。
在优选的实施方式中,所述表观遗传编辑器包含一个融合蛋白,所述融合蛋白从N末端到C末端依次包含:(1)所述DNA甲基转移酶、所述DNA结合结构域和所述转录阻遏物结构域;(2)所述转录阻遏物结构域、所述DNA结合结构域和所述DNA甲基转移酶;(3)所述DNA结合结构域、所述DNA甲基转移酶和所述转录阻遏物结构域;(4)所述DNA结合结构域、所述转录阻遏物结构域和所述DNA甲基转移酶;(5)所述DNA甲基转移酶、所述转录阻遏物结构域和所述DNA结合结构域;(6)所述转录阻遏物结构域、所述DNA甲基转移酶和所述DNA结合结构域;(7)所述DNA甲基转移酶和所述DNA结合结构域;或(8)所述DNA结合结构域和所述DNA甲基转移酶。
在优选的实施方式中,所述表观遗传编辑器包含两个融合蛋白,第一融合蛋白从N末端到C末端依次包含:(1)所述DNA结合结构域和所述DNA甲基转移酶;或(2)所述DNA甲基转移酶和所述DNA结合结构域;第二融合蛋白从N末端到C末端依次包含:(1)所述DNA结合结构域和所述转录阻遏物结构域;或(2)所述转录阻遏物结构域和所述DNA结合结构域;所述第一融合蛋白和所述第二融合蛋白的DNA结合结构域靶向结合至同一个靶核酸。
在一些实施方式中,当所述表观遗传编辑器包含两个融合蛋白(第一融合蛋白和与所述第一融合蛋白不同的第二融合蛋白),所述第一融合蛋白从N末端到C末端依次包含:(1)所述DNA结合结构域和所述DNA甲基转移酶;或(2)所述DNA甲基转移酶和所述DNA结合结构域;所述第二融合蛋白从N末端到C末端依次包含:(1)所述DNA结合结构域和所述转录阻遏物结构域;或(2)所述转录阻遏物结构域和所述DNA结合结构域;本发明提供一种载体系统,其包括第一载体、第二载体和第三载体,所述第一载体包含一种核酸,所述核酸包含编码本发明提供的任何一种第一融合蛋白的核苷酸序列;所述第二载体包含一种核酸,所述核酸包含编码本发明提供的任何一种第二融合蛋白的核苷酸序列;所述第三载体包含一种核酸,所述核酸包含引导RNA或编码所述引导RNA的核苷酸序列;所述第一融合蛋白和所述第二融合蛋白的DNA结合结构域被所述引导RNA引导靶向结合至同一个靶核酸。
在一些实施方式中,所述表观遗传编辑器还包括一个或多个表位标签、核定位信号、报告基因序列、能够与DNA分子或细胞内分子结合的结构域、可检测信号的酶、亚细胞定位和蛋白质转导结构域;优选地,在所述表观遗传编辑器的C端包含一个或多个核定位信号并且在所述融合蛋白的N端包含一个或多个核定位信号;优选地,在所述表观遗传编辑器的C端包含两个核定位信号并且在所述融合蛋白的N端包含两个核定位信号;更优选地,在所述表观遗传编辑器的N端包含三个核定位信号并且在C端包含三个核定位信号。
在一些实施方式中,所述表位标签(epitope tag)为现有常规的标签,包括但不限于His、V5、FLAG、HA、Myc、VSV-G、Trx等,并且本领域技术人员已知如何根据期望目的(例如,纯化、检测或示踪)选择合适的表位标签。
在一些实施方式中,所述报告基因序列是本领域技术人员熟知的,其实例包括但不限于GST、HRP、CAT、GFP、HcRed、DsRed、CFP、YFP、BFP等。
在一些实施方式中,所述能够与DNA分子或细胞内分子结合的结构域,例如麦芽糖结合蛋白(MBP)、LexA的DNA结合结构域(DBD)、GAL4的DBD等。
在一些实施方式中,所述可检测信号的酶是本领域技术人员熟知的可被检测的酶,如荧光素酶、荧光蛋白等,本发明提供的融合蛋白还包括用于检测的放射性同位素、特异性结合对的成员、荧光团或量子点(Quantum Dots,QDs:是能接受激发光产生荧光的半导体纳米粒子)等。
在一些实施方式中,所述亚细胞定位序列(例如,用于靶向细胞核的核定位信号(NLS)、用于将表观遗传编辑器保持在细胞核外的序列(例如核输出序列(NES))、用于将表观遗传编辑器保留在细胞质中的序列、用于靶向线粒体的线粒体定位信号、用于靶向叶绿体的叶绿体定位信号、ER保留信号等)。
在一些实施方式中,本发明提供的表观遗传编辑器(融合有)核定位信号(NLS)(例如,在一些实施方式中,1个或更多、2个或更多、3个或更多、4个或更多、或5个或更多个NLS)。在一些实施方式中,一个或多个NLS定位在融合蛋白的N末端,并且一个或多个NLS定位在融合蛋白的C末端。具体地,核定位信号(NLS)连接顺序可以为:NH2-[NLS]-[表观遗传编辑器]-COOH;NH2-[表观遗传编辑器]-[NLS]-COOH;NH2-[NLS]-[表观遗传编辑器]-[NLS]-COOH;NH2-[NLS]-[NLS]-[表观遗传编辑器]-[NLS]-[NLS]-COOH;NH2-[NLS]-[NLS]-[NLS]-[表观遗传编辑器]-[NLS]-[NLS]-[NLS]-COOH;其中]-[表示可任选地存在的根据下文定义的接头多肽(下同)。
在一些实施方式中,其中所述表观遗传编辑器的结构选自:NH2-[DNA甲基转移酶]-[DNA结合结构域]-COOH;NH2-[DNA结合结构域]-[DNA甲基转移酶]-COOH;NH2-[DNA甲基转移酶]-[DNA结合结构域]-[转录阻遏物结构域]-COOH;NH2-[转录阻遏物结构域]-[DNA结合结构域]-[DNA甲基转移酶]-COOH;NH2-[DNA结合结构域]-[DNA甲基转移酶]-[转录阻遏物结构域]-COOH;NH2-[DNA结合结构域]-[转录阻遏物结构域]-[DNA甲基转移酶]-COOH;NH2-[DNA甲基转移酶]-[转录阻遏物结构域]-[DNA结合结构域]-COOH;NH2-[转录阻遏物结构域]-[DNA甲基转移酶]-[DNA结合结构域]-COOH;NH2-[NLS]-[DNA甲基转移酶]-[DNA结合结构域]-COOH;NH2-[DNA甲基转移酶]-[DNA结合结构域]-[NLS]-COOH;NH2-[DNA甲基转移酶]-[DNA结合结构域]-[NLS]-[NLS]-COOH;NH2-[DNA甲基转移酶]-[NLS]-[DNA结合结构域]-[NLS]-COOH;NH2-[NLS]-[DNA甲基转移酶]-[DNA结合结构域]-[NLS]-COOH;NH2-[NLS]-[NLS]-[DNA甲基转移酶]-[DNA结合结构域]-[NLS]-[NLS]-COOH;
NH2-[NLS]-[DNA结合结构域]-[DNA甲基转移酶]-COOH;NH2-[DNA结合结构域]-[DNA甲基转移酶]-[NLS]-COOH;NH2-[DNA结合结构域]-[NLS]-[DNA甲基转移酶]-COOH;NH2-[DNA结合结构域]-[NLS]-[NLS]-[DNA甲基转移酶]-COOH;
NH2-[NLS]-[DNA结合结构域]-[NLS]-[DNA甲基转移酶]-COOH;NH2-[NLS]-[DNA结合结构域]-[DNA甲基转移酶]-[NLS]-COOH;NH2-[NLS]-[NLS]-[DNA结合结构域]-[DNA甲基转移酶]-[NLS]-[NLS]-COOH;NH2-[NLS]-[表观遗传编辑器]-COOH;NH2-[表观遗传编辑器]-[NLS]-COOH;NH2-[NLS]-[表观遗传编辑器]-[NLS]-COOH;NH2-[NLS]-[NLS]-[表观遗传编辑器]-[NLS]-[NLS]-COOH;NH2-[NLS]-[NLS]-[NLS]-[表观遗传编辑器]-[NLS]-[NLS]-[NLS]-COOH;NH2-[NLS]-[DNA甲基转移酶]-[DNA结合结构域]-[转录阻遏物结构域]-COOH;NH2-[DNA甲基转移酶]-[DNA结合结构域]-[转录阻遏物结构域]-[NLS]-COOH;NH2-[DNA甲基转移酶]-[DNA结合结构域]-[NLS]-[转录阻遏物结构域]-COOH;NH2-[NLS]-[DNA甲基转移酶]-[DNA结合结构域]-[转录阻遏物结构域]-[NLS]-COOH;NH2-[NLS]-[DNA甲基转移酶]-[DNA结合结构域]-[NLS]-[转录阻遏物结构域]-COOH;NH2-[DNA甲基转移酶]-[NLS]-[DNA结合结构域]-[NLS]-[转录阻遏物结构域]-COOH;NH2-[DNA甲基转移酶]-[NLS]-[DNA结合结构域]-[转录阻遏物结构域]-[NLS]-COOH;NH2-[NLS]-[NLS]-[DNA甲基转移酶]-[DNA结合结构域]-[转录阻遏物结构域]-COOH;NH2-[DNA甲基转移酶]-[DNA结合结构域]-[转录阻遏物结构域]-[NLS]-[NLS]-COOH;NH2-[DNA甲基转移酶]-[DNA结合结构域]-[NLS]-[NLS]-[转录阻遏物结构域]-COOH;NH2-[NLS]-[NLS]-[DNA甲基转移酶]-[DNA结合结构域]-[转录阻遏物结构域]-[NLS]-[NLS]-COOH;NH2-[NLS]-[NLS]-[DNA甲基转移酶]-[DNA结合结构域]-[NLS]-[NLS]-[转录阻遏物结构域]-COOH;NH2-[DNA甲基转移酶]-[NLS]-[NLS]-[DNA结合结构域]-[NLS]-[NLS]-[转录阻遏物结构域]-COOH;NH2-[DNA甲基转移酶]-[NLS]-[NLS]-[DNA结合结构域]-[转录阻遏物结构域]-[NLS]-[NLS]-COOH;NH2-[NLS]-[转录阻遏物结构域]-[DNA结合结构域]-[DNA甲基转移酶]-COOH;NH2-[转录阻遏物结构域]-[DNA结合结构域]-[DNA甲基转移酶]-[NLS]-COOH;NH2-[转录阻遏物结构域]-[DNA结合结构域]-[NLS]-[DNA甲基转移酶]-COOH;NH2-[NLS]-[转录阻遏物结构域]-[DNA结合结构域]-[DNA甲基转移酶]-[NLS]-COOH;NH2-[NLS]-[转录阻遏物结构域]-[DNA结合结构域]-[NLS]-[DNA甲基转移酶]-COOH;NH2-[转录阻遏物结构域]-[NLS]-[DNA结合结构域]-[NLS]-[DNA甲基转移酶]-COOH;NH2-[转录阻遏物结构域]-[NLS]-[DNA结合结构域]-[DNA甲基转移酶]-[NLS]-COOH;NH2-[NLS]-[NLS]-[转录阻遏物结构域]-[DNA结合结构域]-[DNA甲基转移酶]-COOH;NH2-[转录阻遏物结构域]-[DNA结合结构域]-[DNA甲基转移酶]-[NLS]-[NLS]-COOH;NH2-[转录阻遏物结构域]-[DNA结合结构域]-[NLS]-[NLS]-[DNA甲基转移酶]-COOH;NH2-[NLS]-[NLS]-[转录阻遏物结构域]-[DNA结合结构域]-[DNA甲基转移酶]-[NLS]-[NLS]-COOH;NH2-[NLS]-[NLS]-[转录阻遏物结构域]-[DNA结合结构域]-[NLS]-[NLS]-[DNA甲基转移酶]-COOH;NH2-[转录阻遏物结构域]-[NLS]-[NLS]-[DNA结合结构域]-[NLS]-[NLS]-[DNA甲基转移酶]-COOH;NH2-[转录阻遏物结构域]-[NLS]-[NLS]-[DNA结合结构域]-[DNA甲基转移酶]-[NLS]-[NLS]-COOH;NH2-[NLS]-[DNA结合结构域]-[DNA甲基转移酶]-[转录阻遏物结构域]-COOH;NH2-[DNA结合结构域]-[DNA甲基转移酶]-[转录阻遏物结构域]-[NLS]-COOH;NH2-[DNA结合结构域]-[NLS]-[DNA甲基转移酶]-[转录阻遏物结构域]-COOH;NH2-[NLS]-[DNA结合结构域]-[DNA甲基转移酶]-[转录阻遏物结构域]-[NLS]-COOH;NH2-[NLS]-[NLS]-[DNA结合结构域]-[DNA甲基转移酶]-[转录阻遏物结构域]-[NLS]-[NLS]-COOH;NH2-[NLS]-[NLS]-[DNA结合结构域]-[DNA甲基转移酶]-[转录阻遏物结构域]-COOH;NH2-[DNA结合结构域]-[DNA甲基转移酶]-[转录阻遏物结构域]-[NLS]-[NLS]-COOH;NH2-[DNA结合结构域]-[NLS]-[NLS]-[DNA甲基转移酶]-[转录阻遏物结构域]-COOH;NH2-[NLS]-[DNA结合结构域]-[NLS]-[DNA甲基转移酶]-[转录阻遏物结构域]-COOH;NH2-[NLS]-[NLS]-[DNA结合结构域]-[NLS]-[NLS]-[DNA甲基转移酶]-[转录阻遏物结构域]-COOH;NH2-[NLS]-[DNA结合结构域]-[转录阻遏物结构域]-[DNA甲基转移酶]-COOH;NH2-[DNA结合结构域]-[转录阻遏物结构域]-[DNA甲基转移酶]-[NLS]-COOH;NH2-[DNA结合结构域]-[NLS]-[转录阻遏物结构域]-[DNA甲基转移酶]-COOH;NH2-[NLS]-[DNA结合结构域]-[NLS]-[转录阻遏物结构域]-[DNA甲基转移酶]-COOH;NH2-[NLS]-[DNA结合结构域]-[转录阻遏物结构域]-[DNA甲基转移酶]-[NLS]-COOH;NH2-[NLS]-[NLS]-[DNA结合结构域]-[转录阻遏物结构域]-[DNA甲基转移酶]-COOH;NH2-[DNA结合结构域]-[转录阻遏物结构域]-[DNA甲基转移酶]-[NLS]-[NLS]-COOH;NH2-[DNA结合结构域]-[NLS]-[NLS]-[转录阻遏物结构域]-[DNA甲基转移酶]-COOH;
NH2-[NLS]-[NLS]-[DNA结合结构域]-[NLS]-[NLS]-[转录阻遏物结构域]-[DNA甲基转移酶]-COOH;NH2-[NLS]-[NLS]-[DNA结合结构域]-[转录阻遏物结构域]-[DNA甲基转移酶]-[NLS]-[NLS]-COOH;NH2-[NLS]-[DNA甲基转移酶]-[转录阻遏物结构域]-[DNA结合结构域]-COOH;NH2-[DNA甲基转移酶]-[转录阻遏物结构域]-[DNA结合结构域]-[NLS]-COOH;NH2-[DNA甲基转移酶]-[转录阻遏物结构域]-[NLS]-[DNA结合结构域]-[NLS]-COOH;NH2-[NLS]-[DNA甲基转移酶]-[转录阻遏物结构域]-[DNA结合结构域]-[NLS]-COOH;NH2-[NLS]-[NLS]-[DNA甲基转移酶]-[转录阻遏物结构域]-[DNA结合结构域]-COOH;NH2-[DNA甲基转移酶]-[转录阻遏物结构域]-[DNA结合结构域]-[NLS]-[NLS]-COOH;NH2-[DNA甲基转移酶]-[转录阻遏物结构域]-[NLS]-[NLS]-[DNA结合结构域]-[NLS]-[NLS]-COOH;NH2-[NLS]-[NLS]-[DNA甲基转移酶]-[转录阻遏物结构域]-[DNA结合结构域]-[NLS]-[NLS]-COOH;NH2-[NLS]-[转录阻遏物结构域]-[DNA甲基转移酶]-[DNA结合结构域]-COOH;NH2-[转录阻遏物结构域]-[DNA甲基转移酶]-[DNA结合结构域]-[NLS]-COOH;NH2-[转录阻遏物结构域]-[DNA甲基转移酶]-[NLS]-[DNA结合结构域]-[NLS]-COOH;NH2-[NLS]-[转录阻遏物结构域]-[DNA甲基转移酶]-[DNA结合结构域]-[NLS]-COOH;NH2-[NLS]-[NLS]-[转录阻遏物结构域]-[DNA甲基转移酶]-[DNA结合结构域]-COOH;NH2-[转录阻遏物结构域]-[DNA甲基转移酶]-[DNA结合结构域]-[NLS]-[NLS]-COOH;NH2-[转录阻遏物结构域]-[DNA甲基转移酶]-[NLS]-[NLS]-[DNA结合结构域]-[NLS]-[NLS]-COOH;NH2-[NLS]-[转录阻遏物结构域]-[DNA甲基转移酶]-[DNA结合结构域]-[NLS]-COOH;或NH2-[NLS]-[NLS]-[转录阻遏物结构域]-[DNA甲基转移酶]-[DNA结合结构域]-[NLS]-[NLS]-COOH;优选地,所述DNA甲基转移酶通过一个或多个接头多肽与所述DNA结合结构域连接,所述DNA甲基转移酶通过一个或多个接头多肽与所述转录阻遏物结构域连接。
在一些实施方式中,本发明提供的表观遗传编辑器包含(融合有)1至10个NLS(例如,1-9、1-8、1-7、1-6、1-5、2-10、2-9、2-8、2-7、2-6或2-5个NLS)。在一些实施方式中,本发明提供的表观遗传编辑器(融合有)2至5个NLS(例如,2-4个或2-3个NLS)。具体的,多个NLS之间可以通过接头多肽连接,接头多肽的氨基酸序列为GS。
在一些实施方式中,所述NLS的非限制性实例包括但不限于SV40病毒大T抗原的NLS、核质蛋白NLS、核质蛋白二分NLS(Bipartite NLS)、c-myc NLS、hRNPA1 M9NLS、输入蛋白-α的IBB结构域、肌瘤T蛋白、人p53、小鼠c-abl IV、流感病毒NS1、肝炎病毒δ抗原、小鼠Mx1蛋白、人聚(ADP-核糖)聚合酶、类固醇激素受体(人)糖皮质激素等常用的NLS。示例性NLS可包含氨基酸序列,所述氨基酸序列包括但不限于PKKKRKV(SEQ ID NO.19)、PAAKRVKLD(SEQ ID NO.20)、KRPAATKKAGQAKKKK(SEQ ID NO.21)、RQRRNELKRSP(SEQ ID NO.22)、KRTADGSEFESPKKKRKV(SEQ ID NO.23)、KRTADGSEFEPKKKRKV(SEQ ID NO.24)。
在一些实施方式中,“蛋白转导结构域”或PTD(又称为CPP–细胞穿透肽),其是指促进横穿脂质双层、胶束、细胞膜、细胞器膜或囊泡膜的多肽、多核苷酸、碳水化合物或有机化合物或无机化合物。连接至另一个分子(所述分子可在小极性分子至大的高分子和/或纳米颗粒的范围内)的PTD促进分子横穿膜,例如从细胞外空间进入细胞内空间或从胞质溶胶进入细胞器内。在一些实施方案中,PTD与本发明的表观遗传编辑器的氨基末端共价连接以生成融合蛋白。在一些实施方案中,PTD与本发明的表观遗传编辑器的羧基末端共价连接以生成融合蛋白。在一些实施方式中,PTD在合适的插入位点处内插在所述表观遗传编辑器中(即,不在所述融合蛋白的N端或C端)。在一些实施方式中,所述表观遗传编辑器包含(缀合至、融合至)一个或多个PTD(例如,两个或更多个、三个或更多个、四个或更多个PTD)。在一些实施方式中,PTD包括核定位信号(NLS)(例如,在一些实施方式中,2个或更多个、3个或更多个、4个或更多个或5个或更多个NLS)。
在一些实施方式中,所述DNA甲基转移酶包含SEQ ID NO.2至8任一个所示的氨基酸序列;所述DNA结合结构域包含SEQ ID NO.10或11所示的氨基酸序列;所述KRAB转录阻遏物包含SEQ ID NO.14至18任一个所示的氨基酸序列;所述NLS包含SEQ ID NO.19至24任一个所示的氨基酸序列。
本发明的另一个方面提供一种复合物,其包含所述的表观遗传编辑器以及引导RNA,所述引导RNA与所述表观遗传编辑器复合以引导所述表观遗传编辑器结合至靶核酸;优选地,所述引导RNA包含与所述靶核酸杂交的引导区段和与所述融合多肽结合的重复区段;优选地,所述引导RNA的重复区段包含SEQ ID NO.43至48任一个所示的核苷酸序列或与SEQ ID NO.43至48任一个所示的核苷酸序列相比具有1至10个核苷酸替换、缺失或插入的核苷酸序列;优选地,其中所述引导RNA的重复区段包含或为SEQ ID NO.43至48任一个所示的核苷酸序列。
具体的,引导RNA的引导区段也称靶向区段,其包含与靶核酸(例如,靶dsDNA、靶ssRNA、靶ssDNA、双链靶DNA的互补链等)内的特定序列(靶位点)互补(并因此杂交)的核苷酸序列(引导序列)。引导RNA的重复区段也称蛋白质结合区段(“蛋白质结合序列”或crRNA),其与本发明提供的表观遗传编辑器相互作用(结合)。靶核酸(例如,基因组DNA、dsDNA、RNA等)的位点特异性结合可发生在由引导RNA(引导序列)与靶核酸之间的碱基配对互补性确定的位置(例如,靶基因座的靶序列)处。
具体的,在本发明提供的复合物中,所述gRNA为任何一个在上文“引导RNA(gRNA或sgRNA)”,这些术语在本文可互换使用。
具体的,本发明提供的表观遗传编辑器在由靶向靶核酸的RNA与目的基因靶核酸之间的互补性区域限定的靶序列处与目的基因靶核酸结合。双链靶核酸的位点特异性结合发生在由以下二者确定的位置处:(i)引导RNA与靶核酸之间的碱基配对互补性;和(ii)靶核酸中的原间隔序列相邻基序(PAM)。
在一些实施方式中,所述引导RNA的引导区段与目的基因靶核酸的靶位点之间的互补性百分比为60%或更高(例如,65%或更高、70%或更高、75%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或者100%)。在一些实施方式中,所述引导RNA的引导区段与目的基因靶核酸的靶位点之间的互补性百分比为80%或更高(例如,85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或者100%)。在一些实施方式中,所述引导RNA的引导区段与目的基因靶核酸的靶位点之间的互补性百分比为90%或更高(例如,95%或更高、97%或更高、98%或更高、99%或更高或者100%)。在一些实施方式中,所述引导RNA的引导区段与目的基因靶核酸的靶位点之间的互补性百分比为100%。在一些实施方式中,所述引导RNA的引导区段与靶核酸的靶位点之间的互补性百分比在靶核酸的靶位点最3'端的七个连续核苷酸上为100%。
在一些实施方式中,所述引导RNA的引导区段具有14至50个核苷酸的长度(例如,14个核苷酸(nt)至20nt、20nt至25nt、25nt至30nt、30nt至35nt、35nt至40nt、40nt至45nt或45nt至50nt)。在一些优选实施方式中,所述引导RNA的引导区段具有在14-30个核苷酸(nt)(例如,14-25个、14-22个、14-20个、17-25个、17-22个、17-20个、19-30个、19-25个、19-22个、19-20个、20-30个、20-25个或20-22个nt)的范围内的长度。在一些实施方式中,所述引导RNA的引导区段具有在14-25个核苷酸(nt)(例如,14-22个、14-20个、17-22个、17-20个、19-25个、19-22个、19-20个、20-25个或20-22个nt)的范围内的长度。在一些实施方式中,所述引导RNA的引导区段具有14个或更多个nt(例如,14个或更多个、15个或更多个、16个或更多个、17个或更多个、18个或更多个、19个或更多个、20个或更多个、21个或更多个或者22个或更多个nt;14个nt、15个nt、16个nt、17个nt、18个nt、19个nt、20个nt、21个nt、22个nt、23个nt、24个nt、25个nt等)的长度。在一些优选实施方式中,所述引导RNA的引导区段具有17个nt的长度。在一些优选实施方式中,所述引导RNA的引导区段具有18个nt的长度。在一些优选实施方式中,所述引导RNA的引导区段具有19个nt的长度。在一些优选实施方式中,所述引导RNA的引导区段具有20个nt的长度。在一些优选实施方式中,所述引导RNA的引导区段具有21个nt的长度。在一些实施方式中,所述引导RNA的引导区段具有22个nt的长度。在一些优选实施方式中,所述引导RNA的引导区段具有23个nt的长度。
在一些实施方式中,本发明提供的复合物,所述引导RNA的重复区段(蛋白质结合区段)为单段核苷酸序列,所述重复区段的序列长度可以为15至100个nt,例如20-100nt、30-100nt、40-100nt、50-100nt、60-100nt、70-100nt、80-100nt、50-90nt、60-90nt、70-90nt,例如50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100个nt。
在一些实施方式中,所述引导RNA的重复区段包含或为SEQ ID NO.43至48任一个所示的核苷酸序列或与SEQ IDNO.43至48任一项所示的核苷酸序列相比具有1至10个(例如1、2、3、4、5、6、7、8、9或10个)核苷酸替换、缺失和/或插入的核苷酸序列。
本发明的另一个方面提供一种用于表观遗传编辑的融合多肽,其氨基酸序列包含SEQ ID NO.61至88任一个所示;优选的,所述融合多肽的氨基酸序列包含SEQ ID NO.61至74任一个所示;更优选的,所述融合多肽的氨基酸序列包含SEQ IDNO.62、67、68、69或72所示。
具体的,本发明提供一种用于表观遗传编辑的融合多肽,SEQ ID NO.75至87任一个所示的融合多肽结构与SEQ IDNO.62所示的融合多肽结构相似,区别在于NLS的数量和位置;SEQ ID NO.88任一个所示的融合多肽结构与SEQ ID NO.62所示的融合多肽结构相似,区别在于KRAB结构域的氨基酸序列,故SEQ ID NO.75至88任一个所示的融合多肽的功能与SEQ IDNO.62所示的融合多肽相似。
在本发明任一表观遗传编辑器中,所述DNA结合结构域与所述DNA甲基转移酶通过接头多肽(或称连接肽、接头)连接,所述DNA结合结构域与所述转录阻遏物结构域通过接头多肽(或称连接肽、接头)连接,所述DNA结合结构域、所述DNA甲基转移酶和所述转录阻遏物结构域之间相互通过接头多肽(或称连接肽、接头)连接。具体的,接头多肽(或称连接肽、接头)可具有多种氨基酸序列中的任一种。蛋白质可通过间隔肽连接,间隔肽通常具有柔性性质,但不排除其他化学键。合适的接头包括长度在4至40个氨基酸之间或者长度在4至25个氨基酸之间的多肽。这些接头可通过使用合成的编码接头的寡核苷酸来产生以偶联蛋白质,或者可由编码融合蛋白的核酸序列编码。可使用具有一定程度柔性的肽接头。连接肽实际上可具有任何氨基酸序列,应记住优选的接头将具有产生总体上柔性的肽的序列。小氨基酸(诸如甘氨酸和丙氨酸)的用途用于产生柔性肽。对于本领域技术人员来说,产生此类序列是常规的。多种不同的接头是可商购获得的并且被认为是适合使用的。
具体的,接头多肽的实例包括甘氨酸聚合物((G)n,其中n选自1,2,3,4,5或6)、甘氨酸-丝氨酸聚合物((GGGGS)n、(GGGS)n、(GGS)n、(GS)n或(G)n,其中n选自1,2,3,4,5或6)、甘氨酸-丙氨酸聚合物、丙氨酸-丝氨酸聚合物和α-螺旋接头((EAAAK)n,其中n选自1,2,3,4,5或6)。示例性接头可包含氨基酸序列,所述氨基酸序列包括但不限于EAAAK(SEQ IDNO.25)、GSGS(SEQ ID NO.26)、GGSG(SEQ ID NO.27)、GGSGG(SEQ ID NO.28)、GSGSG(SEQ IDNO.29)、GSGGG(SEQ ID NO.30)、GGGSG(SEQ ID NO.31)、GSSSG(SEQ ID NO.32)、SGGSSGGS(SEQ ID NO.33)、SGGSGGSGGS(SEQ ID NO.34)、GGGGSGGGGS(SEQ ID NO.35)、SGGSGGGGSGGGGS(SEQ ID NO.36)、SGSETPGTSESATPES(SEQ ID NO.37)、SGGSSGSETPGTSESATPESSGGS(SEQ ID NO.38)、SGGSSGGSSGSETPGTSESATPESSGGSSGGS(SEQID NO.39)等。连接肽还可以是各种XTEN linker等,XTEN linker的长度约为16-80个氨基酸,XTEN linker可以为XTEN16 linker、XTEN18 linker、XTEN32linker、XTEN80 linker(SEQ ID NO.40),用于连接DNMT3A和DNMT3L的接头多肽(SEQ ID NO:41)。更具体的,该连接肽包括但不限于SEQ ID NO.25至41所示的氨基酸序列。本领域技术人员将认识到,与任何所需元件缀合的肽的设计可包括全部或部分柔性的接头,使得接头可包括柔性接头以及赋予较少柔性结构的一个或多个部分。
本发明的另一个方面提供一种核酸,其包含编码所述表观遗传编辑器、所述复合物或所述融合多肽的多核苷酸;优选地,所述多核苷酸被密码子优化以在原核或真核细胞中表达;优选地,所述核酸是DNA或mRNA。
本发明的另一个方面提供一种核酸,包含引导RNA或编码所述引导RNA的核苷酸序列,所述引导RNA包含重复区段,包含引导RNA或编码所述引导RNA的核苷酸序列,所述引导RNA包含重复区段,包含SEQ ID NO.43至48任一项所示的核苷酸序列或与SEQ ID NO.43至48任一项所示的核苷酸序列相比具有1至10个核苷酸替换、缺失和/或插入的核苷酸序列;优选地,其中所述引导RNA的重复区段为SEQ ID NO.43至48任一项所示的核苷酸序列;优选地,所述核酸是DNA或mRNA。
本发明的另一个方面提供一种载体,其包含本发明提供的任何一种核酸。在优选的实施方式中,所述载体是质粒或病毒载体。在优选的实施方式中,所述病毒载体是腺相关病毒载体、腺病毒载体、逆转录病毒载体、慢病毒载体或单纯疱疹病毒载体。
本发明的另一个方面提供一种载体系统,其包括第一载体和与第一载体不同的第二载体,所述第一载体包含编码本发明提供的任一表观遗传编辑器、本发明提供的任一复合物、本发明提供的任一融合多肽的多核苷酸或本发明提供的任一核酸;所述第二载体包含引导RNA或编码所述引导RNA的核苷酸序列;优选地,所述第一载体和第二载体独立地是质粒或病毒载体;优选地,所述病毒载体是腺相关病毒载体、腺病毒载体、逆转录病毒载体、慢病毒载体或单纯疱疹病毒载体。
本发明的另一个方面提供一种递送系统,包含本发明提供的任一表观遗传编辑器、本发明提供的任一复合物、本发明提供的任一融合多肽、本发明提供的任一融合多肽的多核苷酸、本发明提供的任一核酸、本发明提供的任一载体、或本发明提供的任一载体系统。在优选的实施方式中,所述递送系统包括脂质体、纳米颗粒或外泌体。
本发明的另一个方面提供一种细胞,其包含本发明提供的任一表观遗传编辑器、本发明提供的任一复合物、本发明提供的任一融合多肽、本发明提供的任一融合多肽的多核苷酸、本发明提供的任一核酸、本发明提供的任一载体、或本发明提供的任一载体系统、或本发明提供的任一递送系统。在优选的实施方式中,所述细胞是真核细胞或原核细胞。在优选的实施方式中,所述细胞是人细胞。
本发明的另一个方面提供组合物或试剂盒,其包含本发明提供的任一表观遗传编辑器、本发明提供的任一复合物、本发明提供的任一融合多肽、本发明提供的任一融合多肽的多核苷酸、本发明提供的任一核酸、本发明提供的任一载体、或本发明提供的任一载体系统、本发明提供的任一递送系统、或本发明提供的任一细胞;以及药学上可接受的载体。
本发明的另一个方面提供修饰靶核酸的方法,所述方法包括使靶核酸与本发明提供的任一表观遗传编辑器、本发明提供的任一复合物、本发明提供的任一融合多肽、本发明提供的任一融合多肽的多核苷酸、本发明提供的任一核酸、本发明提供的任一载体、本发明提供的任一载体系统、或本发明提供的任一递送系统接触,所述接触导致所述靶核酸被修饰。在优选的实施方式中,所述修饰包括减少或沉默细胞中靶核酸的表达。在优选的实施方式中,所述修饰包括使含有所述靶核酸的染色质/DNA甲基化修饰以抑制或沉默所述细胞中的所述靶核酸表达。在优选的实施方式中,其中所述靶核酸选自:双链DNA、单链DNA、RNA、基因组DNA和染色体外DNA。在优选的实施方式中,其中所述接触在体外在细胞外部发生、在培养的细胞内部发生或在体内细胞内部发生。在优选的实施方式中,所述细胞是真核细胞,更优选为人细胞。
本发明的表观遗传编辑器或本发明的表观遗传编辑器融合多肽可用于多种方法中(例如,与表观遗传编辑器引导RNA组合)。例如,本发明的表观遗传编辑器可用于(i)修饰(例如甲基化等)靶核酸(DNA或RNA;单链或双链);(ii)调节靶核酸的转录;(iii)修饰与靶核酸相关联的多肽(例如,组蛋白)等。因此,本发明提供一种修饰靶核酸的方法。在一些实施方式中,本发明的用于修饰靶核酸的方法包括使靶核酸与以下物质接触:a)本发明的表观遗传编辑器或其融合多肽;和b)一种或多种(例如,两种)表观遗传编辑器的引导RNA。在一些实施方式中,接触步骤在体外细胞中进行。在一些实施方式中,接触步骤在体内细胞中进行。在一些实施方式中,接触步骤在离体细胞中进行。
在各种实施方案中,所公开的DNA甲基化修饰方法在靶核酸序列处产生至少约10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的DNA甲基化效率。接触步骤可导致至少约35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或100%的DNA甲基化效率。特别地,接触的步骤导致大于40%的基于目标的DNA甲基化效率。在某些实施例中,可以实现100%的DNA甲基化效率。
具体地,本文提供的表观遗传编辑器可用于治疗各种罕见病、肿瘤、癌症、炎症、病毒感染疾病、遗传疾病、中枢神经系统疾病、衰老和多种自身免疫性疾病以及常见和慢性疾病。更具体地,治疗的疾病可以为高血压、高脂血症、乙型肝炎病毒(HBV)、肝细胞癌(HCC)、肩肱型肌营养不良症(FSHD)、杂合子家族性高胆固醇血症(HeFH)、α-1抗胰蛋白酶缺乏症(A1AD)、非动脉性前部缺血性视神经病变(NAION)或杜氏肌营养不良(DMD)。
本发明的另一个方面提供一种用于抑制PCSK9表达的表观遗传编辑系统,其包含:
(1)本发明提供的任一表观遗传编辑器、本发明提供的任一复合物、本发明提供的任一融合多肽、本发明提供的任一融合多肽的多核苷酸、本发明提供的任一核酸、本发明提供的任一载体、或本发明提供的任一载体系统、或本发明提供的任一递送系统;以及
(2)靶向PCSK9的靶点序列gRNA,其中所述gRNA包含SEQ ID NO.50、52、54和56任一项所示的核苷酸序列或与SEQ ID NO.50、52、54和56任一项所示的核苷酸序列相比具有1至10个核苷酸替换、缺失和/或插入的核苷酸序列。
附图说明
图1展示本发明提供的表观遗传编辑器的结构示意图,图1A为第一种表观遗传编辑器的结构示意图(从N末端到C末端依次包含MT2及其突变体、DNA结合结构域和转录阻遏物结构域),图1B为第二种表观遗传编辑器的结构示意图(从N末端到C末端依次包含MT2及其突变体、DNA结合结构域和KRAB)。
图2展示采用甲基化报告系统验证本发明提供的表观遗传编辑器的原理和甲基化报告系统的示意图,图2A和2B表示将甲基化报告系统载体转染细胞,得到含有GAPDH-Snrpn-GFP载体的报告细胞,同时对该报告细胞转染本发明提供的表观遗传编辑器和gRNA载体,该gRNA与表观遗传编辑器复合以引导表观遗传编辑器结合至GFP的靶序列,并指导表观遗传编辑器的MT2突变体和KRAB结构域对该靶序列进行DNA甲基化修饰,从而抑制GFP基因的表达,通过检测GFP表达情况测定本发明提供的表观遗传编辑器的抑制基因表达能力。
图3展示本发明提供的甲基化报告系统(载体1)、各种表观遗传编辑器(载体2-载体20)和各种gRNA载体(载体21至载体25)的载体结构示意图。
图4显示采用GAPDH-Snrpn-GFP报告系统测试不同对照表观遗传编辑器(载体2至载体4)在不同时间抑制GFP基因表达的结果图。
图5显示采用GAPDH-Snrpn-GFP报告系统筛选不同MT2突变体(载体2、载体4至载体16)在不同时间抑制GFP基因表达的结果图。
图6显示采用GAPDH-Snrpn-GFP报告系统测试MT2-S139A突变体形成的不同表观遗传编辑器在第5天抑制GFP基因表达的结果图。
图7显示采用GAPDH-Snrpn-GFP报告系统测试MT2-S139A突变体形成的不同表观遗传编辑器在第5天的FACS结果图。
图8显示转染不同表观遗传编辑器(载体2至载体4、载体6和载体17)的细胞不经过分选,培养不同时间的转染阳性细胞的GFP基因抑制效率折线图。
图9显示转染不同表观遗传编辑器(载体2至载体4、载体6和载体17)的细胞不经过分选,培养不同时间的转染阳性细胞的FACS结果图。
图10显示转染不同表观遗传编辑器(载体3、载体4、载体6和载体17)的细胞分选后,培养不同时间的转染阳性细胞的GFP基因抑制效率折线图。
图11显示转染不同表观遗传编辑器(载体3、载体4、载体6和载体17)的细胞分选后,培养不同时间的转染阳性细胞的FACS结果图。
图12显示通过亚硫酸氢盐测序来分析Snrpn启动子区域中每一个单个CpG的甲基化水平。
图13在人细胞中验证本发明提供的表观遗传编辑器在内源靶点的性能。
具体实施方式
在本发明中,SEQ ID NO:1所示的DNA甲基转移酶称为“MT2”;“相对于SEQ ID NO:1所示序列在以下位点中的一个氨基酸取代:C135A、S139A、Q141L、E184A、R228A、R230A、T301A、N303A、T317A、T317D、T317H或S321A”统称为“MT2突变体”;对于每一个MT2突变体,对应称为“MT2-C135A”、“MT2-S139A”、“MT2-Q141L”、“MT2-E184A”、“MT2-R228A”、“MT2-R230A”、“MT2-T301A”、“MT2-N303A”、“MT2-T317A”、“MT2-T317D”、“MT2-T317H”和“MT2-S321A”;表观遗传编辑器为序列表描述的“MT2 S139A-XTEN80 linker-dSpCas9-linker-SV40 NLS-KRAB”、“MT2S139A-XTEN80 linker-dSpCas9-linker-2×SV40NLS-KRAB”、“MT2S139A-XTEN80 linker-dSpCas9-linker-KRAB-SV40NLS”、“MT2 S139A-XTEN80 linker-dSpCas9-linker-KRAB-2×SV40NLS”、“MT2 S139A-XTEN80 linker-SV40NLS-dSpCas9-linker-SV40 NLS-KRAB”、“MT2 S139A-XTEN80 linker-2×SV40NLS-dSpCas9-linker-2×SV40 NLS-KRAB”、“SV40NLS-MT2 S139A-XTEN80 linker-dSpCas9-linker-SV40 NLS-KRAB”、“2×SV40NLS-MT2 S139A-XTEN80
linker-dSpCas9-linker-2×SV40 NLS-KRAB”、“MT2 S139A-XTEN80 linker-SV40NLS-dSpCas9-linker-KRAB-SV40NLS”、“MT2S139A-XTEN80 linker-2×SV40 NLS-dSpCas9-linker-KRAB-linker-2×SV40 NLS”、“SV40NLS-MT2 S139A-XTEN80linker-dSpCas9-linker-KRAB-linker-SV40 NLS”、“2×SV40NLS-MT2 S139A-XTEN80 linker-dSpCas9-linker-KRAB-linker-2×SV40NLS”和“MT2 S139A-XTEN80 linker-dSpCas9-linker-2×SV40 NLS-linker-KRAB”;表观遗传编辑器为图3至图13描述的“MT2-dSpCas9-KRAB”、“MT2WT”、“M.SssI-dSpCas9-KRAB”、“dSpCas9-KRAB”、“MT2 C135A”、“MT2 S139A”、“MT2 S139A-dSpCas9-KRAB”、“dSpCas9-MT2 S139A”、“dCas9-KRAB”、“MT2 Q141L”、“MT2 E184A”、“MT2R228A”、“MT2 R230A”、“MT2 T301A”、“MT2 N303A”、“MT2 T317A”、“MT2 T317D”、“MT2T317H”、“MT2 S321A”、“CRISPRoff”、“MT2-dSpCas9”和“MT2 S139A-dSpCas9”。
序列表
实施例
实施例1.采用甲基化报告系统筛选DNA甲基转移酶(MT2)的氨基酸取代位点
本发明提供的各种表观遗传编辑器的结构示意图如图1。本实施例参考文献[StelzerY,Shivalila CS,SoldnerF,Markoulaki S,Jaenisch R.Tracing dynamicchanges of DNA methylation at single-cell resolution.Cell.2015;163(1):218-229.doi:10.1016/j.cell.2015.08.046]的方法构建甲基化报告系统并采用该报告系统筛选MT2蛋白的氨基酸取代位点,该报告系统可验证本发明的表观遗传编辑器是否具有抑制细胞中靶基因表达能力。本实施例的甲基化报告系统验证原理如图2A和图2B,甲基化报告系统所用的GAPDH-Snrpn-GFP报告系统如图3的载体1所示,该载体1从N末端到C末端依次包含GAPDH CpG区段(GAPDH基因的内源性CpG岛)、SNRPN启动子和GFP基因。该验证原理为:将甲基化报告系统载体转染细胞,得到含有GAPDH-Snrpn-GFP载体的报告细胞,同时对该报告细胞转染本发明提供的表观遗传编辑器载体和gRNA载体,在该gRNA引导下该表观遗传编辑器的dSpCas9蛋白结合至SNRPN启动子的靶序列并指导MT2突变体和KRAB结构域对该靶序列进行DNA甲基化修饰,从而调节靶基因(GFP)的表观遗传状态;若该MT2突变体具有DNA甲基化修饰活性,则该表观遗传编辑器可对SNRPN启动子进行甲基化修饰从而抑制其下游的GFP基因表达,最终报告细胞不发绿色荧光(图2B);若该MT2突变体不具有DNA甲基化修饰活性,则该表观遗传编辑器不具有抑制GFP基因表达活性,最终报告细胞发绿色荧光(图2B)。
第一轮氨基酸取代位点(相对于SEQ ID NO.1,氨基酸取代位点为C135A、S139A、Q141L、E184A、R228A、R230A、T301A、N303A、T317A、T317D、T317H和S321A)得到的对应的MT2突变体(分别标记为“MT2-C135A”、“MT2-S139A”、“MT2-Q141L”、“MT2-E184A”、“MT2-R228A”、“MT2-R230A”、“MT2-T301A”、“MT2-N303A”、“MT2-T317A”、“MT2-T317D”、“MT2-T317H”和“MT2-S321A”),按照图1B的载体结构构建3种对照表观遗传编辑器(图3的载体2、载体3和载体4)和12种不同的表观遗传编辑器(图3的载体5至载体16),这些表观遗传编辑器由EF-1αcore启动子启动表达。同时,构建gRNA载体:如图3的载体21,将靶向SNRPN启动子的靶点序列(SNRPN promoterTarget gRNA,SEQ IDNO.42)和SpCas9的Scaffold(SpCas9-gRNAscaffold,SEQ ID NO.43)形成的gRNA(SEQ ID NO.49)分别构建至pUC19商业载体中,该gRNA由U6启动子启动表达。具体的,载体2的对照表观遗传编辑器MT2-dSpCas9-KRAB/MT2WT(SEQ ID NO.58)从N末端到C末端依次为MT2蛋白(SEQ ID NO.1)、XTEN80 linker(SEQ IDNO.40)、dSpCas9(SEQ ID NO.10)、linker(SEQ ID NO.26)、2×SV40 NLS(SEQ ID NO.19)、linker(SEQ ID NO.35)和KRAB(SEQ ID NO.14),其中MT2-dSpCas9-KRAB和MT2 WT在本文可互换使用。载体3的对照表观遗传编辑器M.SssI-dSpCas9-KRAB(SEQ ID NO.59)从N末端到C末端依次为M.SssI蛋白(SEQ ID NO.9)、XTEN80 linker(SEQ ID NO.40)、dSpCas9(SEQ IDNO.10)、linker(SEQ ID NO.26)、2×SV40 NLS(SEQ ID NO.19)、linker(SEQ ID NO.35)和KRAB(SEQ ID NO.14)。载体4的对照表观遗传编辑器dSpCas9-KRAB(SEQ ID NO.60)从N末端到C末端依次为dSpCas9(SEQ ID NO.10)、linker(SEQ ID NO.26)、2×SV40NLS(SEQIDNO.19)、linker(SEQ ID NO.35)和KRAB(SEQ ID NO.14),其中dSpCas9-KRAB与dCas9-KRAB在本文可互换使用。载体5的对照表观遗传编辑器MT2 C135A(SEQ ID NO.61)从N末端到C末端依次为MT2-C135A蛋白(SEQ ID NO.2)、XTEN80linker(SEQ ID NO.40)、dSpCas9(SEQ ID NO.10)、linker(SEQ ID NO.26)、2×SV40 NLS(SEQ ID NO.19)、linker(SEQ IDNO.35)和KRAB(SEQ ID NO.14)。载体6的表观遗传编辑器MT2 S139A/MT2 S139A-dSpCas9-KRAB(SEQ ID NO.62)从N末端到C末端依次为MT2-S139A蛋白(SEQ ID NO.3)、XTEN80linker(SEQ ID NO.40)、dSpCas9(SEQ ID NO.10)、linker(SEQ ID NO.26)、2×SV40 NLS(SEQ ID NO.19)、linker(SEQ ID NO.35)和KRAB(SEQ ID NO.14),其中MT2 S139A和MT2S139A-dSpCas9-KRAB在本文可互换使用。载体7的表观遗传编辑器MT2 Q141L(SEQ IDNO.63)从N末端到C末端依次为MT2-Q141L蛋白(SEQ ID NO.4)、XTEN80 linker(SEQ IDNO.40)、dSpCas9(SEQ ID NO.10)、linker(SEQ IDNO.26)、2×SV40NLS(SEQ ID NO.19)、linker(SEQ ID NO.35)和KRAB(SEQ ID NO.14)。载体8的表观遗传编辑器MT2 E184A(SEQID NO.64)从N末端到C末端依次为MT2-E184A蛋白、XTEN80 linker(SEQ ID NO.40)、dSpCas9(SEQ ID NO.10)、linker(SEQ ID NO.26)、2×SV40NLS(SEQ ID NO.19)、linker(SEQ ID NO.35)和KRAB(SEQ ID NO.14)。载体9的表观遗传编辑器MT2 R228A(SEQ IDNO.65)从N末端到C末端依次为MT2-R228A蛋白、XTEN80 linker(SEQ ID NO.40)、dSpCas9(SEQ ID NO.10)、linker(SEQ ID NO.26)、2×SV40 NLS(SEQ ID NO.19)、linker(SEQ IDNO.35)和KRAB(SEQ ID NO.14)。载体10的表观遗传编辑器MT2 R230A(SEQ ID NO.66)从N末端到C末端依次为MT2-R230A蛋白、XTEN80 linker(SEQ ID NO.40)、dSpCas9(SEQ IDNO.10)、linker(SEQ ID NO.26)、2×SV40 NLS(SEQ ID NO.19)、linker(SEQ ID NO.35)和KRAB(SEQ ID NO.14)。载体11的表观遗传编辑器MT2 T301A(SEQ ID NO.67)从N末端到C末端依次为MT2-T301A(SEQ ID NO.5)蛋白、XTEN80 linker(SEQ ID NO.40)、dSpCas9(SEQ IDNO.10)、linker(SEQ ID NO.26)、2×SV40 NLS(SEQ ID NO.19)、linker(SEQ ID NO.35)和KRAB(SEQ ID NO.14)。载体12的表观遗传编辑器MT2N303A(SEQ IDNO.68)从N末端到C末端依次为MT2-N303A(SEQ ID NO.6)蛋白、XTEN80 linker(SEQ ID NO.40)、dSpCas9(SEQ IDNO.10)、linker(SEQ ID NO.26)、2×SV40 NLS(SEQ ID NO.19)、linker(SEQ ID NO.35)和KRAB(SEQ ID NO.14)。载体13的表观遗传编辑器MT2 T317A(SEQ ID NO.69)从N末端到C末端依次为MT2-T317A(SEQ ID NO.7)蛋白、XTEN80 linker(SEQ ID NO.40)、dSpCas9(SEQ IDNO.10)、linker(SEQ ID NO.26)、2×SV40 NLS(SEQ ID NO.19)、linker(SEQ ID NO.35)和KRAB(SEQ ID NO.14)。载体14的表观遗传编辑器MT2 T317D(SEQ ID NO.70)从N末端到C末端依次为MT2-T317D蛋白、XTEN80 linker(SEQ ID NO.40)、dSpCas9(SEQ ID NO.10)、linker(SEQ ID NO.26)、2×SV40 NLS(SEQ ID NO.19)、linker(SEQ ID NO.35)和KRAB(SEQID NO.14)。载体15的表观遗传编辑器MT2 T317H(SEQ ID NO.71)从N末端到C末端依次为MT2-T317H蛋白、XTEN80 linker(SEQ ID NO.40)、dSpCas9(SEQ ID NO.10)、linker(SEQ IDNO.26)、2×SV40NLS(SEQ ID NO.19)、linker(SEQ ID NO.35)和KRAB(SEQ ID NO.14)。载体16的表观遗传编辑器MT2 S321A(SEQ ID NO.72)从N末端到C末端依次为MT2-S321A(SEQ IDNO.8)蛋白、XTEN80 linker(SEQ ID NO.40)、dSpCas9(SEQ IDNO.10)、linker(SEQ IDNO.26)、2×SV40 NLS(SEQ ID NO.19)、linker(SEQ ID NO.35)和KRAB(SEQ ID NO.14)。
然后,如图2B所示,在HEK293T细胞中转染甲基化报告系统载体得到表达GAPDH-Snrpn-GFP报告系统的稳定报告细胞,对该稳定的报告细胞转染上述载体2、载体3和载体4的对照表观遗传编辑器后,同时将gRNA载体21转染至各组细胞中,将这些细胞在37℃、5%二氧化碳浓度下培养,分别在第5天、第9天、第14天和第21天进行FACS(流式细胞检测术)检测报告细胞中GFP荧光情况,结果如图4。图4结果说明,现有的DNA甲基转移酶(如M.SssI和MT2蛋白)与KRAB结构域组合形成的表观遗传编辑器具有一定的长效抑制靶基因表达能力,MT2-dSpCas9-KRAB表观遗传编辑器抑制GFP基因表达的抑制效率较低,说明MT2蛋白的DNA甲基化能力较弱,而不含有DNA甲基转移酶的dSpCas9-KRAB表观遗传编辑器在第5天具有快速高效的抑制靶基因表达能力但不具有14天之后的长效抑制能力。接着按照上述方法步骤,对表达GAPDH-Snrpn-GFP报告系统的报告细胞转染上述载体2、载体4至载体16的表观遗传编辑器后,同将gRNA载体21转染至各组细胞中,将这些细胞在37℃、5%二氧化碳浓度下培养,分别在第4天、第12天和第20天进行FACS(流式细胞检测术)检测报告细胞中GFP荧光情况,结果如图5(纵坐标为GFP基因表达受抑制的细胞数%)。图5结果说明,MT2 C135A、MT2S139A、MT2 Q141L、MT2T301A、MT2 N303A、MT2 T317A和MT2 S321A的表观遗传编辑器具有短期高效的沉默靶基因表达能力,MT2 S139A、MT2T301A、MT2N303A、MT2 T317A和MT2 S321A的表观遗传编辑器具有长期的高效沉默靶基因表达能力,说明以下氨基酸突变位点C135A、S139A、Q141L、T301A、N303A、T317A和S321A能有效提高MT2蛋白的DNA甲基化能力。
实施例2.测试MT2-S139A突变体在不同位置形成的表观遗传编辑器的抑制效率
进一步的,选取MT2-S139A突变体进行进一步验证,参考实施例1的方法,构建图3所示的表观遗传编辑器载体(载体17至载体20)。具体的,载体17的对照表观遗传编辑器CRISPRoff从N末端到C末端依次为Dnmt3A结构域(SEQ IDNO.12)、linker(SEQ ID NO.41)、Dnmt3L结构域(SEQ ID NO.13)、XTEN80 linker(SEQ ID NO.40)、dSpCas9(SEQ IDNO.10)、linker(SEQ ID NO.26)、2×SV40 NLS(SEQ ID NO.19)、linker(SEQ ID NO.35)和KRAB(SEQID NO.14)。载体18的表观遗传编辑器MT2-dSpCas9从N末端到C末端依次为MT2蛋白(SEQ IDNO.1)、XTEN80 linker(SEQ ID NO.40)、dSpCas9(SEQ ID NO.10)、linker(SEQ ID NO.26)和2×SV40 NLS(SEQ ID NO.19)。载体19的表观遗传编辑器MT2S139A-dSpCas9(SEQ IDNO.73)从N末端到C末端依次为MT2-S139A(SEQ ID NO.3)蛋白、XTEN80 linker(SEQ IDNO.40)、dSpCas9(SEQ ID NO.10)、linker(SEQ ID NO.26)和2×SV40 NLS(SEQ ID NO.19)。载体20的表观遗传编辑器dSpCas9-MT2S139A(SEQ ID NO.74)从N末端到C末端依次为dSpCas9(SEQ ID NO.10)、linker(SEQ ID NO.26)、2×SV40 NLS(SEQ ID NO.19)、XTEN80linker(SEQ ID NO.40)和MT2-S139A(SEQ ID NO.3)蛋白。然后,如图2B所示,在HEK293T细胞中转染甲基化报告系统载体得到表达GAPDH-Snrpn-GFP报告系统的稳定报告细胞,对该稳定的报告细胞转染上述载体2(MT2-dSpCas9-KRAB)、载体6(MT2 S139A-dSpCas9-KRAB)、载体17(CRISPRoff)、载体18(MT2-dSpCas9)、载体19(MT2 S139A-dSpCas9)和载体20(dSpCas9-MT2 S139A)的表观遗传编辑器后,同时将gRNA载体21转染至各组细胞中,另外还设置空白对照,接着将这些细胞在37℃、5%二氧化碳浓度下培养,在第5天进行FACS(流式细胞检测术)检测报告细胞中GFP荧光情况,结果如图6(纵坐标为GFP基因表达受抑制效率%)和图7。图6说明,MT2-S139A突变体可以单独连接在dSpCas9的N端或C端形成可抑制基因表达的表观遗传编辑器,MT2-S139A突变体也可以与KRAB分别连接在dSpCas9两端形成可抑制基因表达的表观遗传编辑器,从图7的流式图可知,与连接在dSpCas9的C端相比,MT2-S139A突变体连接在dSpCas9的N端的表观遗传编辑器抑制基因表达效率较高,MT2-S139A突变体连接在dSpCas9的N端且KRAB结构域连接在dSpCas9的C端形成的表观遗传编辑器(MT2S139A-dSpCas9-KRAB)与现有的CRISPRoff的流式细胞图相似,均能在短期抑制80%以上报告细胞的GFP基因表达,可见,MT2-S139A突变体与Dnmt3A-Dnmt3L蛋白的短期DNA甲基化能力相当。
实施例3.分析MT2 S139A表观遗传编辑器的强效性和长效性
进一步的,参考实施例1的方法,对MT2 S139A表观遗传编辑器进行进一步的长效性和稳定性验证。以上述实施例1至实施例2的载体17(CRISPRoff)、载体2(MT2-dSpCas9-KRAB)、载体3(M.SssI-dSpCas9-KRAB)和载体4(dSpCas9-KRAB)作为对照组,载体6(MT2S139A-dSpCas9-KRAB)作为实验组。在HEK293T细胞中转染甲基化报告系统载体得到表达GAPDH-Snrpn-GFP报告系统的稳定报告细胞,对该稳定的报告细胞分别转染上述实施例构建得到的载体2(MT2-dSpCas9-KRAB)、载体3(M.SssI-dSpCas9-KRAB)、载体4(dSpCas9-KRAB)、载体6(MT2 S139A-dSpCas9-KRAB)和载体17(CRISPRoff)的表观遗传编辑器,同时将gRNA载体21转染至各组细胞中,接着将这些细胞在37℃、5%二氧化碳浓度下培养,分别在第5天、第14天、第21天和第30天进行FACS(流式细胞检测术)检测该报告细胞中GFP荧光情况,结果如图8(纵坐标为GFP基因表达受抑制效率%)和图9。图8结果说明,相比于MT2-dSpCas9-KRAB编辑器,MT2S139A-dSpCas9-KRAB编辑器能长期高效抑制GFP的表达,说明对MT2的S139氨基酸位点突变为A不仅能显著提高其DNA甲基化瞬时效率还提高其DNA甲基化的长久性,基于该MT2突变体形成的表观遗传编辑器在强效性以及长效性上具有更好的沉默靶基因表达能力;进一步分析CRISPRoff编辑器组、MT2 S139A编辑器组和MT2编辑器组的流式细胞结果,图9的FACS结果图可知,CRISPRoff编辑器组的细胞群在第5天分为两群(阳性细胞群和阴性细胞群),在第14天后明显分为三个细胞群(最左边为GPF表达低的细胞群,中间为GPF表达中等的细胞群,最右边为GPF表达高的细胞群),MT2 S139A编辑器组的细胞群分群趋势与CRISPRoff编辑器组相似,说明MT2-S139A突变体的长期DNA甲基化能力与DNMT3A-DNMT3L蛋白相当。
实施例4.分析MT2-S139A突变体的酶活及其表观遗传编辑器的甲基化范围
参照上述实施例1的方法,在HEK293T细胞中转染甲基化报告系统载体得到表达GAPDH-Snrpn-GFP报告系统的稳定报告细胞,将上述实施例构建的载体3(M.SssI-dSpCas9-KRAB)、载体4(dSpCas9-KRAB)、载体6(MT2 S139A-dSpCas9-KRAB)和载体17(CRISPRoff)分别转染至该报告细胞,同时将gRNA载体21转染至各组细胞中,接着将这些细胞在转染后48小时对转染阳性细胞群体进行FACS分选,将分选得到的转染阳性细胞群继续培养,并在第6天、第14天、第21天、第30天、第39天和第49天进行FACS检测该报告细胞中GFP荧光情况,结果如图10(纵坐标为GFP基因表达受抑制效率%)和图11(由于M.SssI-dSpCas9-KRAB组在第6天转染阳性细胞数量少,故后续时间点不再检测其GFP荧光情况),图10结果说明,在该转染阳性细胞中的MT2 S139A编辑器与CRISPRoff相似,均具有高效的、长效的沉默靶基因表达的能力,也说明MT2-S139A突变体在细胞内具有长效的酶活力。进一步分析CRISPRoff编辑器组和MT2 S139A编辑器组的流式细胞结果,图11结果与图9相似,分选后的转染阳性细胞在第14天后均能明显分为三个细胞群(最左边为GPF表达低的细胞群,中间为GPF表达中等的细胞群,最右边为GPF表达高的细胞群),说明MT2-S139A突变体在细胞内具有稳定高效的酶活力。
接着,通过亚硫酸氢盐测序来分析Snrpn启动子区域中每一个单个CpG的甲基化水平。首先,参照上述实施例在HEK293T细胞中转染甲基化报告系统载体得到表达GAPDH-Snrpn-GFP报告系统的稳定报告细胞,将上述实施例构建的载体2(MT2-dSpCas9-KRAB)、载体3(M.SssI-dSpCas9-KRAB)、载体6(MT2 S139A-dSpCas9-KRAB)和载体17(CRISPRoff)分别转染至该报告细胞中,在转染后48小时对转染阳性细胞群体进行FACS分选,将分选得到的转染阳性细胞群继续培养,培养至第6天后收集1-2×106个细胞,提取这些细胞的基因组DNA。然后使用EpiArt DNAMethylation Bisulfite Kit亚硫酸氢盐试剂盒(诺唯赞)分别对这四组的基因组DNA进行亚硫酸氢盐转化和纯化。然后对纯化的亚硫酸氢盐转化的DNA进行PCR扩增。接着使用E.Z.N.A.Cycle Pure Kit(omega)纯化试剂盒对PCR产物进行纯化,将上述PCR纯化后产物连接到5minTA/Blunt-Zero Cloning Kit(诺唯赞)载体上,并将连接产物转化到大肠杆菌细胞中,在带Amp抗性的LB培养板中,37℃培养过夜,筛选出大小形状比较均匀的菌落送Sanger测序,分析得到DNA甲基化结果,Snrpn启动子区域全长为247bp,选择的Bis-snrpn DNA甲基化位点为第39、68、81、105、111、121、123、125、144、156、175、188、215和225,其中,第121-144为靶点(SNRPN promoterTargetgRNA,SEQ ID NO.42)所在处。本实施例的亚硫酸氢盐测序分析方法可参考现有文献公开的方法,如Liu XS,Wu H,Ji X,etal.Editing DNA Methylation in the Mammalian Genome.Cell.2016;167(1):233-247.e17.doi:10.1016/j.cell.2016.08.056。Snrpn启动子区域中每一个单个CpG的甲基化水平如图12,结果表明,CRISPRoff编辑器组和MT2 S139A编辑器组在Snrpn启动子的DNA甲基化位点的甲基化趋势和甲基化状态相似,均表现高甲基化,仅在靶点序列(图12的SNRPNpromoterTarget gRNA)未有高甲基化,这是因为编辑器结合在该位点导致该靶点区域中的甲基化显著减少,说明MT2-S139A突变体的DNA甲基化范围与DNMT3A-DNMT3L蛋白相当。
实施例5.在人细胞中验证本发明提供的表观遗传编辑器在内源靶点的性能
选择上述实施例构建的MT2 S139A-dSpCas9-KRAB(载体6)在人细胞中测试内源靶点的抑制效率。参照实施例1的方法,构建gRNA载体:如图3的载体22至载体25,将靶向PCSK9启动子CpG岛区域的靶点序列(PCSK9-1 Target gRNA、PCSK9-2 Target gRNA、PCSK9-3TargetgRNA和PCSK9-4 TargetgRNA,对应核苷酸序列分别为SEQ ID NO.50、SEQ ID NO.52、SEQ ID NO.54和SEQ ID NO.56)和SpCas9的Scaffold(SpCas9-gRNAscaffold,SEQ IDNO.43)形成的gRNA(PCSK9-1 SpgRNA、PCSK9-2 SpgRNA、PCSK9-3 SpgRNA和PCSK9-4SpgRNA,对应核苷酸序列分别为SEQ ID NO.51、SEQ ID NO.53、SEQ IDNO.55和SEQ IDNO.57)分别构建至pUC19商业载体中,该gRNA由U6启动子启动表达。在人肝癌细胞(HuH-7)中分别转染MT2 S139A-dSpCas9-KRAB(载体6)和CRISPRoff(载体17),同时将PCSK9-1SpgRNA载体、PCSK9-2 SpgRNA载体、PCSK9-3SpgRNA载体和PCSK9-4 SpgRNA载体转染至各组细胞中,另外还设置空白对照(不转染任何载体),接着将这些细胞在37℃、5%二氧化碳浓度下培养,然后将这些细胞在转染后48小时对转染阳性细胞群体进行FACS分选,将分选后的细胞在37℃、5%二氧化碳浓度下继续培养,培养第11天收取细胞提取RNA,进行反转录,最后QPCR检测每组PCSK9 mRNA表达水平,其中,PCSK9 QPCR检测引物为:RT-h-PCSK9-F1(SEQ ID NO.89)和RT-h-PCSK9-R1(SEQ ID NO.90),结果如图13(纵坐标为PCSK9 mRNA相对表达水平)。图13结果说明,本发明提供的表观遗传编辑器(MT2 S139A-dSpCas9-KRAB)可在多个靶点上有效抑制PCSK9基因的表达,且其抑制效率与CRISPRoff相当。
Claims (21)
1.工程化的DNA甲基转移酶,其相对于SEQ ID NO:1所示序列在以下位点中的一个、多个或全部具有氨基酸取代:C135、S139、Q141、E184、R228、R230、T301、N303、T317和S321,并且其氨基酸序列与SEQ ID NO:1所示序列具有约90%至约99.9%的序列同一性;
优选地,所述DNA甲基转移酶相对于SEQ ID NO:1所示序列在以下位点中的一个氨基酸取代:C135、S139、Q141、T301、N303、T317和S321;更优选地,所述DNA甲基转移酶相对于SEQID NO:1所示序列在S139位点发生氨基酸取代。
2.根据权利要求1所述的DNA甲基转移酶,其中:
(a)C135的取代选自:C135A;
(b)S139的取代选自:S139A;
(c)Q141的取代为Q141L;
(d)E184的取代选自:E184A;
(e)R228的取代选自:R228A;
(f)R230的取代选自:R230A;
(g)T301的取代为T301A;
(h)N303的取代为N303A;
(i)T317的取代为T317A、T317D或T317H;或
(j)S321的取代选自:S321A。
3.根据权利要求1或2所述的DNA甲基转移酶,其中所述DNA甲基转移酶包含或为SEQ IDNO:2至8任一项所示的氨基酸序列或与它们各自具有至少约95%的序列同一性的氨基酸序列。
4.根据权利要求1至3任一项所述的DNA甲基转移酶,其具有以下一个或多个特征:
(i)能够在真核细胞中实现DNA水平的甲基化;
(ii)氨基酸长度不超过约395、约390、约385、约380、约375、约370、约365、约360、约355、约350、约345、约340、约335、约330、约325、约320或315;
(iii)在真核细胞中将靶核酸序列甲基化的效率为10%至100%;以及
(iv)氨基酸序列不是SEQ ID NO.1所示的氨基酸序列。
5.包含权利要求1至4任一项所述的DNA甲基转移酶的表观遗传编辑器;优选地,所述表观遗传编辑器包含:DNA结合结构域以及权利要求1至4任一项所述的DNA甲基转移酶。
6.根据权利要求5所述的表观遗传编辑器,还包含转录阻遏物结构域。
7.根据权利要求6所述的表观遗传编辑器,其中所述DNA结合结构域包含CRISPR/Cas结构域、锌指核酸酶ZFN、转录激活因子样效应核酸酶TALEN、大范围核酸酶或其任意组合;优选地,所述DNA结合结构域包含CRISPR/Cas结构域;
其中所述转录阻遏物结构域包含选自以下的结构域:Krüppel-associatedbox(KRAB)转录阻遏物、SID转录阻遏物、EZH2转录阻遏物、HP1异染色质蛋白、CBX1/5异染色质蛋白、Gli3转录阻遏物、MBD1/2/3转录阻遏物、TOX4转录阻遏物、RRP9转录阻遏物、NIPP1(PPP1R8)转录阻遏物、HDAC1/3/5/8组蛋白去乙酰化酶、SIN3A转录阻遏物、SUDS3转录阻遏物、RYBP转录阻遏物和MeCP2转录阻遏物;所述转录阻遏物结构域包含KRAB转录阻遏物。
8.根据权利要求6所述的表观遗传编辑器,所述表观遗传编辑器包含:DNA结合结构域以及权利要求1至4任一项所述的DNA甲基转移酶,所述DNA甲基转移酶连接在所述DNA结合结构域的N末端或C末端;
所述表观遗传编辑器包含:DNA结合结构域、转录阻遏物结构域以及权利要求1至4任一项所述的DNA甲基转移酶,所述表观遗传编辑器包含一个融合蛋白,所述融合蛋白包含所述DNA结合结构域、所述DNA甲基转移酶和所述转录阻遏物结构域;或
所述表观遗传编辑器包含第一融合蛋白和与所述第一融合蛋白不同的第二融合蛋白,所述第一融合蛋白包含所述DNA结合结构域和所述DNA甲基转移酶,所述第二融合蛋白包含所述DNA结合结构域和所述转录阻遏物结构域。
9.根据权利要求6所述的表观遗传编辑器,其中所述表观遗传编辑器还包括一个或多个表位标签、核定位信号、报告基因序列、能够与DNA分子或细胞内分子结合的结构域、可检测信号的酶、亚细胞定位和蛋白质转导结构域;优选地,在所述表观遗传编辑器的C端包含一个或多个核定位信号并且在所述融合蛋白的N端包含一个或多个核定位信号;优选地,在所述表观遗传编辑器的C端包含两个核定位信号并且在所述融合蛋白的N端包含两个核定位信号;更优选地,在所述表观遗传编辑器的N端包含三个核定位信号并且在C端包含三个核定位信号。
10.根据权利要求8所述的表观遗传编辑器,其中所述表观遗传编辑器的结构选自:
NH2-[DNA甲基转移酶]-[DNA结合结构域]-COOH;
NH2-[DNA结合结构域]-[DNA甲基转移酶]-COOH;
NH2-[DNA甲基转移酶]-[DNA结合结构域]-[转录阻遏物结构域]-COOH;
NH2-[转录阻遏物结构域]-[DNA结合结构域]-[DNA甲基转移酶]-COOH;
NH2-[DNA结合结构域]-[DNA甲基转移酶]-[转录阻遏物结构域]-COOH;
NH2-[DNA结合结构域]-[转录阻遏物结构域]-[DNA甲基转移酶]-COOH;
NH2-[DNA甲基转移酶]-[转录阻遏物结构域]-[DNA结合结构域]-COOH;
NH2-[转录阻遏物结构域]-[DNA甲基转移酶]-[DNA结合结构域]-COOH;
NH2-[NLS]-[DNA甲基转移酶]-[DNA结合结构域]-COOH;
NH2-[DNA甲基转移酶]-[DNA结合结构域]-[NLS]-COOH;
NH2-[DNA甲基转移酶]-[DNA结合结构域]-[NLS]-[NLS]-COOH;
NH2-[DNA甲基转移酶]-[NLS]-[DNA结合结构域]-[NLS]-COOH;
NH2-[NLS]-[DNA甲基转移酶]-[DNA结合结构域]-[NLS]-COOH;
NH2-[NLS]-[NLS]-[DNA甲基转移酶]-[DNA结合结构域]-[NLS]-[NLS]-COOH;
NH2-[NLS]-[DNA结合结构域]-[DNA甲基转移酶]-COOH;
NH2-[DNA结合结构域]-[DNA甲基转移酶]-[NLS]-COOH;
NH2-[DNA结合结构域]-[NLS]-[DNA甲基转移酶]-COOH;
NH2-[DNA结合结构域]-[NLS]-[NLS]-[DNA甲基转移酶]-COOH;
NH2-[NLS]-[DNA结合结构域]-[NLS]-[DNA甲基转移酶]-COOH;
NH2-[NLS]-[DNA结合结构域]-[DNA甲基转移酶]-[NLS]-COOH;
NH2-[NLS]-[NLS]-[DNA结合结构域]-[DNA甲基转移酶]-[NLS]-[NLS]-COOH;
NH2-[NLS]-[表观遗传编辑器]-COOH;
NH2-[表观遗传编辑器]-[NLS]-COOH;
NH2-[NLS]-[表观遗传编辑器]-[NLS]-COOH;
NH2-[NLS]-[NLS]-[表观遗传编辑器]-[NLS]-[NLS]-COOH;
NH2-[NLS]-[NLS]-[NLS]-[表观遗传编辑器]-[NLS]-[NLS]-[NLS]-COOH;
NH2-[NLS]-[DNA甲基转移酶]-[DNA结合结构域]-[转录阻遏物结构域]-COOH;
NH2-[DNA甲基转移酶]-[DNA结合结构域]-[转录阻遏物结构域]-[NLS]-COOH;
NH2-[DNA甲基转移酶]-[DNA结合结构域]-[NLS]-[转录阻遏物结构域]-COOH;
NH2-[NLS]-[DNA甲基转移酶]-[DNA结合结构域]-[转录阻遏物结构域]-[NLS]-COOH;
NH2-[NLS]-[DNA甲基转移酶]-[DNA结合结构域]-[NLS]-[转录阻遏物结构域]-COOH;
NH2-[DNA甲基转移酶]-[NLS]-[DNA结合结构域]-[NLS]-[转录阻遏物结构域]-COOH;
NH2-[DNA甲基转移酶]-[NLS]-[DNA结合结构域]-[转录阻遏物结构域]-[NLS]-COOH;
NH2-[NLS]-[NLS]-[DNA甲基转移酶]-[DNA结合结构域]-[转录阻遏物结构域]-COOH;
NH2-[DNA甲基转移酶]-[DNA结合结构域]-[转录阻遏物结构域]-[NLS]-[NLS]-COOH;
NH2-[DNA甲基转移酶]-[DNA结合结构域]-[NLS]-[NLS]-[转录阻遏物结构域]-COOH;
NH2-[NLS]-[NLS]-[DNA甲基转移酶]-[DNA结合结构域]-[转录阻遏物结构域]-[NLS]-[NLS]-COOH;NH2-[NLS]-[NLS]-[DNA甲基转移酶]-[DNA结合结构域]-[NLS]-[NLS]-[转录阻遏物结构域]-COOH;NH2-[DNA甲基转移酶]-[NLS]-[NLS]-[DNA结合结构域]-[NLS]-[NLS]-[转录阻遏物结构域]-COOH;NH2-[DNA甲基转移酶]-[NLS]-[NLS]-[DNA结合结构域]-[转录阻遏物结构域]-[NLS]-[NLS]-COOH;NH2-[NLS]-[转录阻遏物结构域]-[DNA结合结构域]-[DNA甲基转移酶]-COOH;
NH2-[转录阻遏物结构域]-[DNA结合结构域]-[DNA甲基转移酶]-[NLS]-COOH;
NH2-[转录阻遏物结构域]-[DNA结合结构域]-[NLS]-[DNA甲基转移酶]-COOH;
NH2-[NLS]-[转录阻遏物结构域]-[DNA结合结构域]-[DNA甲基转移酶]-[NLS]-COOH;NH2-[NLS]-[转录阻遏物结构域]-[DNA结合结构域]-[NLS]-[DNA甲基转移酶]-COOH;
NH2-[转录阻遏物结构域]-[NLS]-[DNA结合结构域]-[NLS]-[DNA甲基转移酶]-COOH;
NH2-[转录阻遏物结构域]-[NLS]-[DNA结合结构域]-[DNA甲基转移酶]-[NLS]-COOH;
NH2-[NLS]-[NLS]-[转录阻遏物结构域]-[DNA结合结构域]-[DNA甲基转移酶]-COOH;
NH2-[转录阻遏物结构域]-[DNA结合结构域]-[DNA甲基转移酶]-[NLS]-[NLS]-COOH;
NH2-[转录阻遏物结构域]-[DNA结合结构域]-[NLS]-[NLS]-[DNA甲基转移酶]-COOH;
NH2-[NLS]-[NLS]-[转录阻遏物结构域]-[DNA结合结构域]-[DNA甲基转移酶]-[NLS]-[NLS]-COOH;NH2-[NLS]-[NLS]-[转录阻遏物结构域]-[DNA结合结构域]-[NLS]-[NLS]-[DNA甲基转移酶]-COOH;NH2-[转录阻遏物结构域]-[NLS]-[NLS]-[DNA结合结构域]-[NLS]-[NLS]-[DNA甲基转移酶]-COOH;NH2-[转录阻遏物结构域]-[NLS]-[NLS]-[DNA结合结构域]-[DNA甲基转移酶]-[NLS]-[NLS]-COOH;NH2-[NLS]-[DNA结合结构域]-[DNA甲基转移酶]-[转录阻遏物结构域]-COOH;
NH2-[DNA结合结构域]-[DNA甲基转移酶]-[转录阻遏物结构域]-[NLS]-COOH;
NH2-[DNA结合结构域]-[NLS]-[DNA甲基转移酶]-[转录阻遏物结构域]-COOH;
NH2-[NLS]-[DNA结合结构域]-[DNA甲基转移酶]-[转录阻遏物结构域]-[NLS]-COOH;
NH2-[NLS]-[NLS]-[DNA结合结构域]-[DNA甲基转移酶]-[转录阻遏物结构域]-[NLS]-[NLS]-COOH;NH2-[NLS]-[NLS]-[DNA结合结构域]-[DNA甲基转移酶]-[转录阻遏物结构域]-COOH;
NH2-[DNA结合结构域]-[DNA甲基转移酶]-[转录阻遏物结构域]-[NLS]-[NLS]-COOH;
NH2-[DNA结合结构域]-[NLS]-[NLS]-[DNA甲基转移酶]-[转录阻遏物结构域]-COOH;
NH2-[NLS]-[DNA结合结构域]-[NLS]-[DNA甲基转移酶]-[转录阻遏物结构域]-COOH;
NH2-[NLS]-[NLS]-[DNA结合结构域]-[NLS]-[NLS]-[DNA甲基转移酶]-[转录阻遏物结构域]-COOH;NH2-[NLS]-[DNA结合结构域]-[转录阻遏物结构域]-[DNA甲基转移酶]-COOH;
NH2-[DNA结合结构域]-[转录阻遏物结构域]-[DNA甲基转移酶]-[NLS]-COOH;
NH2-[DNA结合结构域]-[NLS]-[转录阻遏物结构域]-[DNA甲基转移酶]-COOH;
NH2-[NLS]-[DNA结合结构域]-[NLS]-[转录阻遏物结构域]-[DNA甲基转移酶]-COOH;
NH2-[NLS]-[DNA结合结构域]-[转录阻遏物结构域]-[DNA甲基转移酶]-[NLS]-COOH;
NH2-[NLS]-[NLS]-[DNA结合结构域]-[转录阻遏物结构域]-[DNA甲基转移酶]-COOH;
NH2-[DNA结合结构域]-[转录阻遏物结构域]-[DNA甲基转移酶]-[NLS]-[NLS]-COOH;
NH2-[DNA结合结构域]-[NLS]-[NLS]-[转录阻遏物结构域]-[DNA甲基转移酶]-COOH;
NH2-[NLS]-[NLS]-[DNA结合结构域]-[NLS]-[NLS]-[转录阻遏物结构域]-[DNA甲基转移酶]-COOH;NH2-[NLS]-[NLS]-[DNA结合结构域]-[转录阻遏物结构域]-[DNA甲基转移酶]-[NLS]-[NLS]-COOH;
NH2-[NLS]-[DNA甲基转移酶]-[转录阻遏物结构域]-[DNA结合结构域]-COOH;
NH2-[DNA甲基转移酶]-[转录阻遏物结构域]-[DNA结合结构域]-[NLS]-COOH;
NH2-[DNA甲基转移酶]-[转录阻遏物结构域]-[NLS]-[DNA结合结构域]-[NLS]-COOH;
NH2-[NLS]-[DNA甲基转移酶]-[转录阻遏物结构域]-[DNA结合结构域]-[NLS]-COOH;
NH2-[NLS]-[NLS]-[DNA甲基转移酶]-[转录阻遏物结构域]-[DNA结合结构域]-COOH;
NH2-[DNA甲基转移酶]-[转录阻遏物结构域]-[DNA结合结构域]-[NLS]-[NLS]-COOH;
NH2-[DNA甲基转移酶]-[转录阻遏物结构域]-[NLS]-[NLS]-[DNA结合结构域]-[NLS]-[NLS]-COOH;
NH2-[NLS]-[NLS]-[DNA甲基转移酶]-[转录阻遏物结构域]-[DNA结合结构域]-[NLS]-[NLS]-COOH;
NH2-[NLS]-[转录阻遏物结构域]-[DNA甲基转移酶]-[DNA结合结构域]-COOH;
NH2-[转录阻遏物结构域]-[DNA甲基转移酶]-[DNA结合结构域]-[NLS]-COOH;
NH2-[转录阻遏物结构域]-[DNA甲基转移酶]-[NLS]-[DNA结合结构域]-[NLS]-COOH;
NH2-[NLS]-[转录阻遏物结构域]-[DNA甲基转移酶]-[DNA结合结构域]-[NLS]-COOH;
NH2-[NLS]-[NLS]-[转录阻遏物结构域]-[DNA甲基转移酶]-[DNA结合结构域]-COOH;
NH2-[转录阻遏物结构域]-[DNA甲基转移酶]-[DNA结合结构域]-[NLS]-[NLS]-COOH;
NH2-[转录阻遏物结构域]-[DNA甲基转移酶]-[NLS]-[NLS]-[DNA结合结构域]-[NLS]-[NLS]-COOH;
NH2-[NLS]-[转录阻遏物结构域]-[DNA甲基转移酶]-[DNA结合结构域]-[NLS]-COOH;或
NH2-[NLS]-[NLS]-[转录阻遏物结构域]-[DNA甲基转移酶]-[DNA结合结构域]-[NLS]-[NLS]-COOH;
优选地,所述DNA甲基转移酶通过一个或多个接头多肽与所述DNA结合结构域连接,所述DNA甲基转移酶通过一个或多个接头多肽与所述转录阻遏物结构域连接。
11.根据权利要求9所述的表观遗传编辑器,其中所述DNA甲基转移酶包含SEQ ID NO.2至8任一个所示的氨基酸序列;所述DNA结合结构域包含SEQ ID NO.10或11所示的氨基酸序列;所述KRAB转录阻遏物包含SEQ ID NO.14至18任一个所示的氨基酸序列;所述NLS包含SEQ ID NO.19至24任一个所示的氨基酸序列。
12.一种复合物,其包含权利要求6至11任一项所述的表观遗传编辑器以及引导RNA,所述引导RNA与所述表观遗传编辑器复合以引导所述表观遗传编辑器结合至靶核酸;优选地,所述引导RNA包含与所述靶核酸杂交的引导区段和与所述融合多肽结合的重复区段;优选地,所述引导RNA的重复区段包含SEQ ID NO.43至48任一个所示的核苷酸序列或与SEQ IDNO.43至48任一个所示的核苷酸序列相比具有1至10个核苷酸替换、缺失或插入的核苷酸序列;优选地,其中所述引导RNA的重复区段包含或为SEQ ID NO.43至48任一个所示的核苷酸序列。
13.用于表观遗传编辑的融合多肽,其氨基酸序列包含SEQ ID NO.61至88任一个所示;优选的,所述融合多肽的氨基酸序列包含SEQ ID NO.61至74任一个所示;更优选的,所述融合多肽的氨基酸序列包含SEQ ID NO.62、67、68、69或72所示。
14.一种核酸,其包含编码如权利要求6至11任一项所述的表观遗传编辑器、权利要求12所述的复合物或权利要求13任一项所述的融合多肽的多核苷酸;优选地,所述多核苷酸被密码子优化以在原核或真核细胞中表达;
其中,所述核酸包含引导RNA或编码所述引导RNA的核苷酸序列,所述引导RNA包含重复区段,包含SEQ ID NO.43至48任一项所示的核苷酸序列或与SEQ ID NO.43至48任一项所示的核苷酸序列相比具有1至10个核苷酸替换、缺失和/或插入的核苷酸序列;优选地,其中所述引导RNA的重复区段为SEQ ID NO.43至48任一项所示的核苷酸序列;优选地,所述核酸是DNA或mRNA。
15.一种载体,其包含权利要求14所述的核酸;优选地,所述载体是质粒或病毒载体;优选地,所述病毒载体是腺相关病毒载体、腺病毒载体、逆转录病毒载体、慢病毒载体或单纯疱疹病毒载体。
16.一种载体系统,其包括第一载体和与第一载体不同的第二载体,所述第一载体包含编码如权利要求6至11任一项所述的表观遗传编辑器、权利要求12所述的复合物或权利要求13任一项所述的融合多肽的多核苷酸或权利要求14所述的核酸;所述第二载体包含引导RNA或编码所述引导RNA的核苷酸序列;优选地,所述第一载体和第二载体独立地是质粒或病毒载体;优选地,所述病毒载体是腺相关病毒载体、腺病毒载体、逆转录病毒载体、慢病毒载体或单纯疱疹病毒载体。
17.一种递送系统,其包含权利要求6至11任一项所述的表观遗传编辑器、权利要求12所述的复合物、权利要求13任一项所述的融合多肽的多核苷酸、权利要求14所述的核酸、权利要求15所述的载体、或权利要求16所述的载体系统;优选地,所述递送系统包括脂质体、纳米颗粒或外泌体。
18.一种细胞,其包含权利要求6至11任一项所述的表观遗传编辑器、权利要求12所述的复合物、权利要求13任一项所述的融合多肽的多核苷酸、权利要求14所述的核酸、权利要求15所述的载体、权利要求16所述的载体系统、或权利要求17所述的递送系统;优选地,所述细胞是真核细胞或原核细胞;更优选地,所述细胞是人细胞。
19.一种组合物或试剂盒,其包含权利要求6至11任一项所述的表观遗传编辑器、权利要求12所述的复合物、权利要求13任一项所述的融合多肽的多核苷酸、权利要求14所述的核酸、权利要求15所述的载体、权利要求16所述的载体系统、权利要求17所述的递送系统或权利要求18所述的细胞;以及药学上可接受的载体。
20.一种修饰靶核酸的方法,所述方法包括使靶核酸与权利要求6至11任一项所述的表观遗传编辑器、权利要求12所述的复合物、权利要求13任一项所述的融合多肽的多核苷酸、权利要求14所述的核酸、权利要求15所述的载体、权利要求16所述的载体系统、或权利要求17所述的递送系统接触,所述接触导致所述靶核酸被修饰;优选地,所述修饰包括减少或沉默细胞中靶核酸的表达;更优选地,所述修饰包括使含有所述靶核酸的染色质甲基化以减少或沉默所述细胞中的所述靶核酸表达。
21.一种用于抑制PCSK9表达的表观遗传编辑系统,其包含:
(1)权利要求6至11任一项所述的表观遗传编辑器、权利要求12所述的复合物、权利要求13任一项所述的融合多肽的多核苷酸、权利要求14所述的核酸、权利要求15所述的载体、权利要求16所述的载体系统或权利要求17所述的递送系统;以及
(2)靶向PCSK9的靶点序列gRNA,其中所述gRNA包含SEQ ID NO.50、52、54和56任一项所示的核苷酸序列或与SEQ ID NO.50、52、54和56任一项所示的核苷酸序列相比具有1至10个核苷酸替换、缺失和/或插入的核苷酸序列。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410666514.4A CN118792270A (zh) | 2024-05-27 | 2024-05-27 | 工程化的dna甲基转移酶及其在表观遗传编辑中的应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410666514.4A CN118792270A (zh) | 2024-05-27 | 2024-05-27 | 工程化的dna甲基转移酶及其在表观遗传编辑中的应用 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN118792270A true CN118792270A (zh) | 2024-10-18 |
Family
ID=93018918
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410666514.4A Pending CN118792270A (zh) | 2024-05-27 | 2024-05-27 | 工程化的dna甲基转移酶及其在表观遗传编辑中的应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN118792270A (zh) |
-
2024
- 2024-05-27 CN CN202410666514.4A patent/CN118792270A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2022253185A1 (zh) | Cas12蛋白、含有Cas12蛋白的基因编辑系统及应用 | |
US20200291424A1 (en) | Targeted deletion of cellular dna sequences | |
Brázda et al. | Cruciform structures are a common DNA feature important for regulating biological processes | |
Wu et al. | Structural and functional interaction between the human DNA repair proteins DNA ligase IV and XRCC4 | |
KR20190005801A (ko) | 표적 특이적 crispr 변이체 | |
CN110402287A (zh) | CRISPR/Cpf1系统和方法 | |
WO2022240858A1 (en) | Effector proteins and methods of use | |
KR20220010540A (ko) | 프로그래밍가능한 염기 편집기 시스템을 이용하여 단일염기다형성을 편집하는 방법 | |
KR102683424B1 (ko) | 타우 응집과 관련된 유전적 취약성을 식별하기 위한 CRISPR/Cas 드랍아웃 스크리닝 플랫폼 | |
KR20250060954A (ko) | Pcsk9 발현의 후성적 조절을 위한 조성물 및 방법 | |
Garrard | Chromosomal loop organization in eukaryotic genomes | |
CN116144629A (zh) | Cas9蛋白、含有Cas9蛋白的基因编辑系统及应用 | |
CN118652869A (zh) | Cas9蛋白、含有Cas9蛋白的基因编辑系统及应用 | |
CN117025570A (zh) | Cas12a突变体蛋白、含有Cas12a突变体蛋白的基因编辑系统及应用 | |
Chan et al. | Variant EWS-WT1 chimeric product in the desmoplastic small round cell tumor | |
CN116751762A (zh) | Cas12b蛋白、单链向导RNA、包含它们的基因编辑系统及相关应用 | |
WO1997011972A1 (en) | Chimeric dna-binding/dna methyltransferase nucleic acid and polypeptide and uses thereof | |
WO1997011972A9 (en) | Chimeric dna-binding/dna methyltransferase nucleic acid and polypeptide and uses thereof | |
AU2003215094A1 (en) | Zinc finger libraries | |
WO2020150338A1 (en) | Htt repressors and uses thereof | |
CN114269913B (zh) | 胞嘧啶碱基编辑组合物及其用途 | |
WO2024260268A1 (zh) | 利用Cpf1非滞留端提高基因敲进效率和精准度的方法 | |
CN118792270A (zh) | 工程化的dna甲基转移酶及其在表观遗传编辑中的应用 | |
US20020188103A1 (en) | Chimeric dna-binding/dna methyltransferase nucleic acid and polypeptide and uses thereof | |
Pereira et al. | Analysis ofE. coliRho Factor: Mutations Affecting Secondary-site Interactions |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |