BR112019028261A2 - uso de domínios de proteína de interação com nucleossomo para melhorar modificação de genoma direcionada - Google Patents
uso de domínios de proteína de interação com nucleossomo para melhorar modificação de genoma direcionada Download PDFInfo
- Publication number
- BR112019028261A2 BR112019028261A2 BR112019028261-0A BR112019028261A BR112019028261A2 BR 112019028261 A2 BR112019028261 A2 BR 112019028261A2 BR 112019028261 A BR112019028261 A BR 112019028261A BR 112019028261 A2 BR112019028261 A2 BR 112019028261A2
- Authority
- BR
- Brazil
- Prior art keywords
- protein
- seq
- domain
- activity
- fusion protein
- Prior art date
Links
- 108020001580 protein domains Proteins 0.000 title claims abstract description 102
- 230000004048 modification Effects 0.000 title description 17
- 238000012986 modification Methods 0.000 title description 17
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 300
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 285
- 238000000034 method Methods 0.000 claims abstract description 77
- 108010047956 Nucleosomes Proteins 0.000 claims abstract description 69
- 210000001623 nucleosome Anatomy 0.000 claims abstract description 69
- 230000008836 DNA modification Effects 0.000 claims abstract description 62
- 230000002759 chromosomal effect Effects 0.000 claims abstract description 57
- 210000003527 eukaryotic cell Anatomy 0.000 claims abstract description 46
- 230000001965 increasing effect Effects 0.000 claims abstract description 34
- 230000004049 epigenetic modification Effects 0.000 claims abstract description 25
- 230000000694 effects Effects 0.000 claims description 206
- 108020001507 fusion proteins Proteins 0.000 claims description 184
- 102000037865 fusion proteins Human genes 0.000 claims description 184
- 101710163270 Nuclease Proteins 0.000 claims description 179
- 210000004027 cell Anatomy 0.000 claims description 134
- 150000007523 nucleic acids Chemical class 0.000 claims description 80
- 230000004568 DNA-binding Effects 0.000 claims description 74
- 108091033409 CRISPR Proteins 0.000 claims description 73
- 108020004414 DNA Proteins 0.000 claims description 69
- 108010033040 Histones Proteins 0.000 claims description 49
- 108020005004 Guide RNA Proteins 0.000 claims description 45
- 102000039446 nucleic acids Human genes 0.000 claims description 44
- 108020004707 nucleic acids Proteins 0.000 claims description 44
- 108010077544 Chromatin Proteins 0.000 claims description 37
- 210000003483 chromatin Anatomy 0.000 claims description 37
- 102000040430 polynucleotide Human genes 0.000 claims description 28
- 108091033319 polynucleotide Proteins 0.000 claims description 28
- 239000002157 polynucleotide Substances 0.000 claims description 28
- 102000006947 Histones Human genes 0.000 claims description 26
- 101100339431 Arabidopsis thaliana HMGB2 gene Proteins 0.000 claims description 24
- 108010008532 Deoxyribonuclease I Proteins 0.000 claims description 24
- 102000007260 Deoxyribonuclease I Human genes 0.000 claims description 24
- 108700010013 HMGB1 Proteins 0.000 claims description 24
- 101150021904 HMGB1 gene Proteins 0.000 claims description 24
- 230000027455 binding Effects 0.000 claims description 23
- 238000007634 remodeling Methods 0.000 claims description 23
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 19
- 230000035897 transcription Effects 0.000 claims description 18
- 238000013518 transcription Methods 0.000 claims description 18
- 108010017070 Zinc Finger Nucleases Proteins 0.000 claims description 17
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 16
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 claims description 16
- 101000866795 Homo sapiens Non-histone chromosomal protein HMG-14 Proteins 0.000 claims description 15
- 102100031353 Non-histone chromosomal protein HMG-14 Human genes 0.000 claims description 15
- 102000055206 HMGN2 Human genes 0.000 claims description 14
- 239000012636 effector Substances 0.000 claims description 14
- 239000003550 marker Substances 0.000 claims description 14
- 108090000246 Histone acetyltransferases Proteins 0.000 claims description 13
- 102000003893 Histone acetyltransferases Human genes 0.000 claims description 13
- 241000193996 Streptococcus pyogenes Species 0.000 claims description 11
- 230000035515 penetration Effects 0.000 claims description 11
- 239000000126 substance Substances 0.000 claims description 11
- 101000866805 Homo sapiens Non-histone chromosomal protein HMG-17 Proteins 0.000 claims description 10
- 108060004795 Methyltransferase Proteins 0.000 claims description 10
- 241000191967 Staphylococcus aureus Species 0.000 claims description 10
- 101100166147 Streptococcus thermophilus cas9 gene Proteins 0.000 claims description 10
- 238000000338 in vitro Methods 0.000 claims description 10
- 230000037426 transcriptional repression Effects 0.000 claims description 10
- 241000589875 Campylobacter jejuni Species 0.000 claims description 9
- 102000000311 Cytosine Deaminase Human genes 0.000 claims description 9
- 108010080611 Cytosine Deaminase Proteins 0.000 claims description 9
- 241001501869 Streptococcus pasteurianus Species 0.000 claims description 9
- 210000004962 mammalian cell Anatomy 0.000 claims description 9
- 239000013600 plasmid vector Substances 0.000 claims description 9
- 108700036482 Francisella novicida Cas9 Proteins 0.000 claims description 8
- 241000589599 Francisella tularensis subsp. novicida Species 0.000 claims description 8
- 238000010459 TALEN Methods 0.000 claims description 8
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 claims description 8
- 239000012190 activator Substances 0.000 claims description 8
- 210000005260 human cell Anatomy 0.000 claims description 8
- 239000013603 viral vector Substances 0.000 claims description 8
- 108010077850 Nuclear Localization Signals Proteins 0.000 claims description 7
- 239000011230 binding agent Substances 0.000 claims description 7
- 238000013519 translation Methods 0.000 claims description 7
- 108700007305 ISWI Proteins 0.000 claims description 6
- 102000044753 ISWI Human genes 0.000 claims description 6
- 102000016397 Methyltransferase Human genes 0.000 claims description 6
- 102000029586 nucleosome binding proteins Human genes 0.000 claims description 6
- 108091009242 nucleosome binding proteins Proteins 0.000 claims description 6
- 230000010741 sumoylation Effects 0.000 claims description 6
- 241000093740 Acidaminococcus sp. Species 0.000 claims description 5
- 101000860090 Acidaminococcus sp. (strain BV3L6) CRISPR-associated endonuclease Cas12a Proteins 0.000 claims description 5
- 102100039095 Chromatin-remodeling ATPase INO80 Human genes 0.000 claims description 5
- 102100031880 Helicase SRCAP Human genes 0.000 claims description 5
- 102100022128 High mobility group protein B2 Human genes 0.000 claims description 5
- 102100022130 High mobility group protein B3 Human genes 0.000 claims description 5
- 101001033682 Homo sapiens Chromatin-remodeling ATPase INO80 Proteins 0.000 claims description 5
- 101000704158 Homo sapiens Helicase SRCAP Proteins 0.000 claims description 5
- 101001045791 Homo sapiens High mobility group protein B2 Proteins 0.000 claims description 5
- 101001045794 Homo sapiens High mobility group protein B3 Proteins 0.000 claims description 5
- 241000588653 Neisseria Species 0.000 claims description 5
- 230000010718 Oxidation Activity Effects 0.000 claims description 5
- 101710185494 Zinc finger protein Proteins 0.000 claims description 5
- 102100023597 Zinc finger protein 816 Human genes 0.000 claims description 5
- 230000006154 adenylylation Effects 0.000 claims description 5
- 238000005576 amination reaction Methods 0.000 claims description 5
- 238000001727 in vivo Methods 0.000 claims description 5
- 108020004705 Codon Proteins 0.000 claims description 4
- 108700010012 HMGN1 Proteins 0.000 claims description 4
- 108700010011 HMGN2 Proteins 0.000 claims description 4
- 102100028177 High mobility group nucleosome-binding domain-containing protein 4 Human genes 0.000 claims description 4
- 102100028176 High mobility group nucleosome-binding domain-containing protein 5 Human genes 0.000 claims description 4
- 101001006375 Homo sapiens High mobility group nucleosome-binding domain-containing protein 4 Proteins 0.000 claims description 4
- 101001006376 Homo sapiens High mobility group nucleosome-binding domain-containing protein 5 Proteins 0.000 claims description 4
- 101000615488 Homo sapiens Methyl-CpG-binding domain protein 2 Proteins 0.000 claims description 4
- 241000689670 Lachnospiraceae bacterium ND2006 Species 0.000 claims description 4
- 102100021299 Methyl-CpG-binding domain protein 2 Human genes 0.000 claims description 4
- 108010068261 Mi-2 Nucleosome Remodeling and Deacetylase Complex Proteins 0.000 claims description 4
- 102000002499 Mi-2 Nucleosome Remodeling and Deacetylase Complex Human genes 0.000 claims description 4
- 102000004160 Phosphoric Monoester Hydrolases Human genes 0.000 claims description 4
- 108090000608 Phosphoric Monoester Hydrolases Proteins 0.000 claims description 4
- 229930006000 Sucrose Natural products 0.000 claims description 4
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 claims description 4
- 230000029936 alkylation Effects 0.000 claims description 4
- 238000005804 alkylation reaction Methods 0.000 claims description 4
- 230000006329 citrullination Effects 0.000 claims description 4
- 230000020335 dealkylation Effects 0.000 claims description 4
- 238000006900 dealkylation reaction Methods 0.000 claims description 4
- 239000005720 sucrose Substances 0.000 claims description 4
- 201000009906 Meningitis Diseases 0.000 claims description 3
- 241000588654 Neisseria cinerea Species 0.000 claims description 3
- 108091000080 Phosphotransferase Proteins 0.000 claims description 3
- 102000005421 acetyltransferase Human genes 0.000 claims description 3
- 108020002494 acetyltransferase Proteins 0.000 claims description 3
- 230000009615 deamination Effects 0.000 claims description 3
- 238000006481 deamination reaction Methods 0.000 claims description 3
- 230000007498 myristoylation Effects 0.000 claims description 3
- 102000020233 phosphotransferase Human genes 0.000 claims description 3
- 102000044159 Ubiquitin Human genes 0.000 claims description 2
- 108090000848 Ubiquitin Proteins 0.000 claims description 2
- 102100037907 High mobility group protein B1 Human genes 0.000 claims 3
- 102000003960 Ligases Human genes 0.000 claims 1
- 108090000364 Ligases Proteins 0.000 claims 1
- 230000001629 suppression Effects 0.000 claims 1
- 239000000203 mixture Substances 0.000 abstract description 8
- 235000018102 proteins Nutrition 0.000 description 253
- 125000003729 nucleotide group Chemical group 0.000 description 61
- 239000002773 nucleotide Substances 0.000 description 57
- 230000004927 fusion Effects 0.000 description 47
- 238000003776 cleavage reaction Methods 0.000 description 32
- 230000007017 scission Effects 0.000 description 32
- 238000001890 transfection Methods 0.000 description 26
- 230000035772 mutation Effects 0.000 description 25
- 125000005647 linker group Chemical group 0.000 description 23
- 102000055207 HMGB1 Human genes 0.000 description 21
- 108091079001 CRISPR RNA Proteins 0.000 description 20
- 241000699666 Mus <mouse, genus> Species 0.000 description 18
- 238000011144 upstream manufacturing Methods 0.000 description 18
- 102000004533 Endonucleases Human genes 0.000 description 16
- 108010042407 Endonucleases Proteins 0.000 description 16
- 108091027544 Subgenomic mRNA Proteins 0.000 description 15
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 15
- 230000003993 interaction Effects 0.000 description 15
- 239000013612 plasmid Substances 0.000 description 15
- 108091028043 Nucleic acid sequence Proteins 0.000 description 14
- 230000014509 gene expression Effects 0.000 description 14
- 102000006491 HMGN Proteins Human genes 0.000 description 13
- 108010044429 HMGN Proteins Proteins 0.000 description 13
- 239000003446 ligand Substances 0.000 description 12
- 235000001014 amino acid Nutrition 0.000 description 11
- 108091006112 ATPases Proteins 0.000 description 10
- 102000057290 Adenosine Triphosphatases Human genes 0.000 description 10
- 102100023823 Homeobox protein EMX1 Human genes 0.000 description 10
- 101001048956 Homo sapiens Homeobox protein EMX1 Proteins 0.000 description 10
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 10
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 10
- 238000001514 detection method Methods 0.000 description 10
- 201000010099 disease Diseases 0.000 description 10
- 239000012634 fragment Substances 0.000 description 10
- 108090000765 processed proteins & peptides Proteins 0.000 description 10
- 239000011701 zinc Substances 0.000 description 10
- 229910052725 zinc Inorganic materials 0.000 description 10
- 102000000849 HMGB Proteins Human genes 0.000 description 9
- 108010001860 HMGB Proteins Proteins 0.000 description 9
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 9
- 229940024606 amino acid Drugs 0.000 description 9
- 230000000295 complement effect Effects 0.000 description 9
- 238000003556 assay Methods 0.000 description 8
- 239000013598 vector Substances 0.000 description 8
- 108091026890 Coding region Proteins 0.000 description 7
- 238000007400 DNA extraction Methods 0.000 description 7
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 7
- 241000700159 Rattus Species 0.000 description 7
- 150000001413 amino acids Chemical class 0.000 description 7
- 239000013611 chromosomal DNA Substances 0.000 description 7
- 230000002103 transcriptional effect Effects 0.000 description 7
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 6
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 6
- 108010015742 Cytochrome P-450 Enzyme System Proteins 0.000 description 6
- 102000003849 Cytochrome P450 Human genes 0.000 description 6
- 101100124507 Homo sapiens HMGN1 gene Proteins 0.000 description 6
- 101001025337 Homo sapiens High mobility group protein B1 Proteins 0.000 description 6
- 102000004316 Oxidoreductases Human genes 0.000 description 6
- 108090000854 Oxidoreductases Proteins 0.000 description 6
- 102000053637 human HMGB1 Human genes 0.000 description 6
- 230000006872 improvement Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 6
- 230000001105 regulatory effect Effects 0.000 description 6
- 125000002652 ribonucleotide group Chemical group 0.000 description 6
- 210000000130 stem cell Anatomy 0.000 description 6
- 230000014616 translation Effects 0.000 description 6
- VYZAMTAEIAYCRO-UHFFFAOYSA-N Chromium Chemical compound [Cr] VYZAMTAEIAYCRO-UHFFFAOYSA-N 0.000 description 5
- 102000052510 DNA-Binding Proteins Human genes 0.000 description 5
- 101710096438 DNA-binding protein Proteins 0.000 description 5
- 241000196324 Embryophyta Species 0.000 description 5
- 102000004190 Enzymes Human genes 0.000 description 5
- 108090000790 Enzymes Proteins 0.000 description 5
- 230000004913 activation Effects 0.000 description 5
- 230000001580 bacterial effect Effects 0.000 description 5
- 229910052804 chromium Inorganic materials 0.000 description 5
- 239000011651 chromium Substances 0.000 description 5
- 208000035475 disorder Diseases 0.000 description 5
- 230000002068 genetic effect Effects 0.000 description 5
- 230000010354 integration Effects 0.000 description 5
- -1 meganucleases Proteins 0.000 description 5
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 5
- 102000004196 processed proteins & peptides Human genes 0.000 description 5
- 238000006467 substitution reaction Methods 0.000 description 5
- 108091023037 Aptamer Proteins 0.000 description 4
- 241000894006 Bacteria Species 0.000 description 4
- 241000206602 Eukaryota Species 0.000 description 4
- 108091008103 RNA aptamers Proteins 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 description 4
- 230000007717 exclusion Effects 0.000 description 4
- 238000003780 insertion Methods 0.000 description 4
- 230000037431 insertion Effects 0.000 description 4
- 210000003292 kidney cell Anatomy 0.000 description 4
- 102100033647 Activity-regulated cytoskeleton-associated protein Human genes 0.000 description 3
- 241000282465 Canis Species 0.000 description 3
- 102100026846 Cytidine deaminase Human genes 0.000 description 3
- 108010031325 Cytidine deaminase Proteins 0.000 description 3
- 102220605874 Cytosolic arginine sensor for mTORC1 subunit 2_D10A_mutation Human genes 0.000 description 3
- SHIBSTMRCDJXLN-UHFFFAOYSA-N Digoxigenin Natural products C1CC(C2C(C3(C)CCC(O)CC3CC2)CC2O)(O)C2(C)C1C1=CC(=O)OC1 SHIBSTMRCDJXLN-UHFFFAOYSA-N 0.000 description 3
- 206010056740 Genital discharge Diseases 0.000 description 3
- 239000004471 Glycine Substances 0.000 description 3
- 241000238631 Hexapoda Species 0.000 description 3
- 206010025323 Lymphomas Diseases 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 3
- 206010035226 Plasma cell myeloma Diseases 0.000 description 3
- 108091028664 Ribonucleotide Proteins 0.000 description 3
- 102000006275 Ubiquitin-Protein Ligases Human genes 0.000 description 3
- 108010083111 Ubiquitin-Protein Ligases Proteins 0.000 description 3
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical group O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 3
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 3
- 125000000539 amino acid group Chemical group 0.000 description 3
- 229960002685 biotin Drugs 0.000 description 3
- 235000020958 biotin Nutrition 0.000 description 3
- 239000011616 biotin Substances 0.000 description 3
- 125000003636 chemical group Chemical group 0.000 description 3
- 239000003153 chemical reaction reagent Substances 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- QONQRTHLHBTMGP-UHFFFAOYSA-N digitoxigenin Natural products CC12CCC(C3(CCC(O)CC3CC3)C)C3C11OC1CC2C1=CC(=O)OC1 QONQRTHLHBTMGP-UHFFFAOYSA-N 0.000 description 3
- SHIBSTMRCDJXLN-KCZCNTNESA-N digoxigenin Chemical compound C1([C@@H]2[C@@]3([C@@](CC2)(O)[C@H]2[C@@H]([C@@]4(C)CC[C@H](O)C[C@H]4CC2)C[C@H]3O)C)=CC(=O)OC1 SHIBSTMRCDJXLN-KCZCNTNESA-N 0.000 description 3
- 108091006047 fluorescent proteins Proteins 0.000 description 3
- 102000034287 fluorescent proteins Human genes 0.000 description 3
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 3
- 239000010931 gold Substances 0.000 description 3
- 229910052737 gold Inorganic materials 0.000 description 3
- 125000001475 halogen functional group Chemical group 0.000 description 3
- 229910052739 hydrogen Inorganic materials 0.000 description 3
- 239000001257 hydrogen Substances 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 230000001404 mediated effect Effects 0.000 description 3
- 201000000050 myeloid neoplasm Diseases 0.000 description 3
- 239000002245 particle Substances 0.000 description 3
- 229920000642 polymer Polymers 0.000 description 3
- 239000002096 quantum dot Substances 0.000 description 3
- 108010054624 red fluorescent protein Proteins 0.000 description 3
- 230000008439 repair process Effects 0.000 description 3
- 239000002336 ribonucleotide Substances 0.000 description 3
- 230000035939 shock Effects 0.000 description 3
- 210000001550 testis Anatomy 0.000 description 3
- MPLHNVLQVRSVEE-UHFFFAOYSA-N texas red Chemical compound [O-]S(=O)(=O)C1=CC(S(Cl)(=O)=O)=CC=C1C(C1=CC=2CCCN3CCCC(C=23)=C1O1)=C2C1=C(CCC1)C3=[N+]1CCCC3=C2 MPLHNVLQVRSVEE-UHFFFAOYSA-N 0.000 description 3
- 210000001519 tissue Anatomy 0.000 description 3
- 108091006107 transcriptional repressors Proteins 0.000 description 3
- 241001515965 unidentified phage Species 0.000 description 3
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 2
- VGIRNWJSIRVFRT-UHFFFAOYSA-N 2',7'-difluorofluorescein Chemical compound OC(=O)C1=CC=CC=C1C1=C2C=C(F)C(=O)C=C2OC2=CC(O)=C(F)C=C21 VGIRNWJSIRVFRT-UHFFFAOYSA-N 0.000 description 2
- 101710169336 5'-deoxyadenosine deaminase Proteins 0.000 description 2
- 108010075752 ATPases Associated with Diverse Cellular Activities Proteins 0.000 description 2
- 102000011932 ATPases Associated with Diverse Cellular Activities Human genes 0.000 description 2
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 2
- 102000014914 Carrier Proteins Human genes 0.000 description 2
- 241000282693 Cercopithecidae Species 0.000 description 2
- 241000699800 Cricetinae Species 0.000 description 2
- 102000005636 Cyclic AMP Response Element-Binding Protein Human genes 0.000 description 2
- 108010045171 Cyclic AMP Response Element-Binding Protein Proteins 0.000 description 2
- 241000701022 Cytomegalovirus Species 0.000 description 2
- 102000053602 DNA Human genes 0.000 description 2
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 2
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 2
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 2
- 108010068250 Herpes Simplex Virus Protein Vmw65 Proteins 0.000 description 2
- 102100031336 High mobility group nucleosome-binding domain-containing protein 3 Human genes 0.000 description 2
- 102100033558 Histone H1.8 Human genes 0.000 description 2
- 102100022823 Histone RNA hairpin-binding protein Human genes 0.000 description 2
- 101000866771 Homo sapiens High mobility group nucleosome-binding domain-containing protein 3 Proteins 0.000 description 2
- 101000825762 Homo sapiens Histone RNA hairpin-binding protein Proteins 0.000 description 2
- 101001112118 Homo sapiens NADPH-cytochrome P450 reductase Proteins 0.000 description 2
- 101000897979 Homo sapiens Putative spermatid-specific linker histone H1-like protein Proteins 0.000 description 2
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 2
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 2
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 2
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 2
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 2
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 2
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 2
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 2
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 2
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 2
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 2
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 2
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 2
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 2
- 241001112693 Lachnospiraceae Species 0.000 description 2
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 2
- 108010072388 Methyl-CpG-Binding Protein 2 Proteins 0.000 description 2
- 102100039124 Methyl-CpG-binding protein 2 Human genes 0.000 description 2
- 108091093037 Peptide nucleic acid Proteins 0.000 description 2
- 102000011755 Phosphoglycerate Kinase Human genes 0.000 description 2
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 2
- 229930185560 Pseudouridine Natural products 0.000 description 2
- PTJWIQPHWPFNBW-UHFFFAOYSA-N Pseudouridine C Natural products OC1C(O)C(CO)OC1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-UHFFFAOYSA-N 0.000 description 2
- 102100021861 Putative spermatid-specific linker histone H1-like protein Human genes 0.000 description 2
- 241000714474 Rous sarcoma virus Species 0.000 description 2
- 101100509370 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) ISW1 gene Proteins 0.000 description 2
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 2
- 102100031010 Testis-specific H1 histone Human genes 0.000 description 2
- 101001099217 Thermotoga maritima (strain ATCC 43589 / DSM 3109 / JCM 10099 / NBRC 100826 / MSB8) Triosephosphate isomerase Proteins 0.000 description 2
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 2
- 239000004473 Threonine Substances 0.000 description 2
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 2
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 2
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 2
- 241000710959 Venezuelan equine encephalitis virus Species 0.000 description 2
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 2
- 235000004279 alanine Nutrition 0.000 description 2
- 125000002947 alkylene group Chemical group 0.000 description 2
- 229960001230 asparagine Drugs 0.000 description 2
- 235000009582 asparagine Nutrition 0.000 description 2
- 229940009098 aspartate Drugs 0.000 description 2
- WGDUUQDYDIIBKT-UHFFFAOYSA-N beta-Pseudouridine Natural products OC1OC(CN2C=CC(=O)NC2=O)C(O)C1O WGDUUQDYDIIBKT-UHFFFAOYSA-N 0.000 description 2
- 108091008324 binding proteins Proteins 0.000 description 2
- 108010006025 bovine growth hormone Proteins 0.000 description 2
- 210000000481 breast Anatomy 0.000 description 2
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 2
- 239000011248 coating agent Substances 0.000 description 2
- 238000000576 coating method Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 2
- 235000018417 cysteine Nutrition 0.000 description 2
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical group O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000004925 denaturation Methods 0.000 description 2
- 230000036425 denaturation Effects 0.000 description 2
- 239000005547 deoxyribonucleotide Substances 0.000 description 2
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 2
- 238000002405 diagnostic procedure Methods 0.000 description 2
- 230000005782 double-strand break Effects 0.000 description 2
- 210000001671 embryonic stem cell Anatomy 0.000 description 2
- 210000002950 fibroblast Anatomy 0.000 description 2
- 239000007850 fluorescent dye Substances 0.000 description 2
- 108010021843 fluorescent protein 583 Proteins 0.000 description 2
- 238000010362 genome editing Methods 0.000 description 2
- 229930195712 glutamate Natural products 0.000 description 2
- 229940049906 glutamate Drugs 0.000 description 2
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 2
- 229960002743 glutamine Drugs 0.000 description 2
- 206010073071 hepatocellular carcinoma Diseases 0.000 description 2
- 102000047583 human POR Human genes 0.000 description 2
- 229960000310 isoleucine Drugs 0.000 description 2
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 2
- 210000003734 kidney Anatomy 0.000 description 2
- 238000001638 lipofection Methods 0.000 description 2
- 210000005229 liver cell Anatomy 0.000 description 2
- 210000001161 mammalian embryo Anatomy 0.000 description 2
- 239000002609 medium Substances 0.000 description 2
- 201000001441 melanoma Diseases 0.000 description 2
- 229930182817 methionine Natural products 0.000 description 2
- 230000011987 methylation Effects 0.000 description 2
- 238000007069 methylation reaction Methods 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 239000000178 monomer Substances 0.000 description 2
- 238000002703 mutagenesis Methods 0.000 description 2
- 231100000350 mutagenesis Toxicity 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 201000008968 osteosarcoma Diseases 0.000 description 2
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 2
- 230000008488 polyadenylation Effects 0.000 description 2
- 229920001184 polypeptide Polymers 0.000 description 2
- 235000004252 protein component Nutrition 0.000 description 2
- 230000009145 protein modification Effects 0.000 description 2
- 230000012743 protein tagging Effects 0.000 description 2
- PTJWIQPHWPFNBW-GBNDHIKLSA-N pseudouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-GBNDHIKLSA-N 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 150000003212 purines Chemical class 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 108091008146 restriction endonucleases Proteins 0.000 description 2
- 208000002491 severe combined immunodeficiency Diseases 0.000 description 2
- 208000007056 sickle cell anemia Diseases 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 238000003151 transfection method Methods 0.000 description 2
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 2
- 239000004474 valine Substances 0.000 description 2
- 210000005253 yeast cell Anatomy 0.000 description 2
- 108091005957 yellow fluorescent proteins Proteins 0.000 description 2
- RAVVEEJGALCVIN-AGVBWZICSA-N (2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-5-amino-2-[[(2s)-2-[[(2s)-2-[[(2s)-6-amino-2-[[(2s)-6-amino-2-[[(2s)-2-[[2-[[(2s)-2-amino-3-(4-hydroxyphenyl)propanoyl]amino]acetyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]hexanoyl]amino]hexanoyl]amino]-5-(diamino Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCN=C(N)N)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 RAVVEEJGALCVIN-AGVBWZICSA-N 0.000 description 1
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 1
- YMHOBZXQZVXHBM-UHFFFAOYSA-N 2,5-dimethoxy-4-bromophenethylamine Chemical compound COC1=CC(CCN)=C(OC)C=C1Br YMHOBZXQZVXHBM-UHFFFAOYSA-N 0.000 description 1
- QQXLSKDNWDGVLG-UHFFFAOYSA-N 2-benzyl-1-ethoxyimidazole Chemical compound CCON1C=CN=C1CC1=CC=CC=C1 QQXLSKDNWDGVLG-UHFFFAOYSA-N 0.000 description 1
- LQEZHWGJSWHXPJ-UHFFFAOYSA-N 5-(4-carboxyphenyl)benzene-1,3-dicarboxylic acid Chemical compound C1=CC(C(=O)O)=CC=C1C1=CC(C(O)=O)=CC(C(O)=O)=C1 LQEZHWGJSWHXPJ-UHFFFAOYSA-N 0.000 description 1
- 241000007909 Acaryochloris Species 0.000 description 1
- 241001135190 Acetohalobium Species 0.000 description 1
- 241000093877 Acidithiobacillus sp. Species 0.000 description 1
- 101710159080 Aconitate hydratase A Proteins 0.000 description 1
- 101710159078 Aconitate hydratase B Proteins 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 102000055025 Adenosine deaminases Human genes 0.000 description 1
- 241000862484 Alicyclobacillus sp. Species 0.000 description 1
- 101000935845 Aliivibrio fischeri Blue fluorescence protein Proteins 0.000 description 1
- 241001655243 Allochromatium Species 0.000 description 1
- 241000099238 Ammonifex sp. Species 0.000 description 1
- 241000192531 Anabaena sp. Species 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- 241001495183 Arthrospira sp. Species 0.000 description 1
- 108091005950 Azurite Proteins 0.000 description 1
- 241000193830 Bacillus <bacterium> Species 0.000 description 1
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 1
- 101100381481 Caenorhabditis elegans baz-2 gene Proteins 0.000 description 1
- 241000589994 Campylobacter sp. Species 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 201000009030 Carcinoma Diseases 0.000 description 1
- 241000282552 Chlorocebus aethiops Species 0.000 description 1
- 241000579895 Chlorostilbon Species 0.000 description 1
- 102100035371 Chymotrypsin-like elastase family member 1 Human genes 0.000 description 1
- 101710138848 Chymotrypsin-like elastase family member 1 Proteins 0.000 description 1
- 241000207199 Citrus Species 0.000 description 1
- 241000193464 Clostridium sp. Species 0.000 description 1
- 241000065719 Crocosphaera Species 0.000 description 1
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 1
- 108091005943 CyPet Proteins 0.000 description 1
- 241000159506 Cyanothece Species 0.000 description 1
- 101710195240 Cysteine-rich venom protein Proteins 0.000 description 1
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 1
- 102100032218 Cytokine-inducible SH2-containing protein Human genes 0.000 description 1
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 1
- 230000006463 DNA deamination Effects 0.000 description 1
- 108090000133 DNA helicases Proteins 0.000 description 1
- 102000003844 DNA helicases Human genes 0.000 description 1
- 230000033616 DNA repair Effects 0.000 description 1
- 102100036912 Desmin Human genes 0.000 description 1
- 108010044052 Desmin Proteins 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 108700022093 Drosophila DSP1 Proteins 0.000 description 1
- 206010059866 Drug resistance Diseases 0.000 description 1
- 108091005941 EBFP Proteins 0.000 description 1
- 108091005947 EBFP2 Proteins 0.000 description 1
- 108091005942 ECFP Proteins 0.000 description 1
- 101710099240 Elastase-1 Proteins 0.000 description 1
- 102000011750 Endodeoxyribonucleases Human genes 0.000 description 1
- 108010037179 Endodeoxyribonucleases Proteins 0.000 description 1
- 101000889900 Enterobacteria phage T4 Intron-associated endonuclease 1 Proteins 0.000 description 1
- 241000283073 Equus caballus Species 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 101000935842 Escherichia coli O127:H6 (strain E2348/69 / EPEC) Major structural subunit of bundle-forming pilus Proteins 0.000 description 1
- 241000701959 Escherichia virus Lambda Species 0.000 description 1
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 1
- 241000168413 Exiguobacterium sp. Species 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- 241000282324 Felis Species 0.000 description 1
- 102000016359 Fibronectins Human genes 0.000 description 1
- 108010067306 Fibronectins Proteins 0.000 description 1
- 241000130991 Finegoldia sp. Species 0.000 description 1
- 102100036334 Fragile X mental retardation syndrome-related protein 1 Human genes 0.000 description 1
- 241000589601 Francisella Species 0.000 description 1
- 102000053717 GAT domains Human genes 0.000 description 1
- 108700036072 GAT domains Proteins 0.000 description 1
- 241000287828 Gallus gallus Species 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- 102100039289 Glial fibrillary acidic protein Human genes 0.000 description 1
- 101710193519 Glial fibrillary acidic protein Proteins 0.000 description 1
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 1
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 1
- 108010012029 Guanine Deaminase Proteins 0.000 description 1
- 102000013587 Guanine deaminase Human genes 0.000 description 1
- 102000029812 HNH nuclease Human genes 0.000 description 1
- 108060003760 HNH nuclease Proteins 0.000 description 1
- 102100021519 Hemoglobin subunit beta Human genes 0.000 description 1
- 108091005904 Hemoglobin subunit beta Proteins 0.000 description 1
- 102000008157 Histone Demethylases Human genes 0.000 description 1
- 108010074870 Histone Demethylases Proteins 0.000 description 1
- 102100037487 Histone H1.0 Human genes 0.000 description 1
- 102100039856 Histone H1.1 Human genes 0.000 description 1
- 102100023917 Histone H1.10 Human genes 0.000 description 1
- 102100039855 Histone H1.2 Human genes 0.000 description 1
- 102100027368 Histone H1.3 Human genes 0.000 description 1
- 102100027369 Histone H1.4 Human genes 0.000 description 1
- 102100022653 Histone H1.5 Human genes 0.000 description 1
- 101710192088 Histone H1.5 Proteins 0.000 description 1
- 101710192081 Histone H1.8 Proteins 0.000 description 1
- 102100023920 Histone H1t Human genes 0.000 description 1
- 102000011787 Histone Methyltransferases Human genes 0.000 description 1
- 108010036115 Histone Methyltransferases Proteins 0.000 description 1
- 108090000353 Histone deacetylase Proteins 0.000 description 1
- 102000003964 Histone deacetylase Human genes 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000883749 Homo sapiens Chromodomain-helicase-DNA-binding protein 4 Proteins 0.000 description 1
- 101000943420 Homo sapiens Cytokine-inducible SH2-containing protein Proteins 0.000 description 1
- 101000930945 Homo sapiens Fragile X mental retardation syndrome-related protein 1 Proteins 0.000 description 1
- 101100178199 Homo sapiens HMGB2 gene Proteins 0.000 description 1
- 101100178206 Homo sapiens HMGB3 gene Proteins 0.000 description 1
- 101100124512 Homo sapiens HMGN2 gene Proteins 0.000 description 1
- 101001026554 Homo sapiens Histone H1.0 Proteins 0.000 description 1
- 101001035402 Homo sapiens Histone H1.1 Proteins 0.000 description 1
- 101000905024 Homo sapiens Histone H1.10 Proteins 0.000 description 1
- 101001035375 Homo sapiens Histone H1.2 Proteins 0.000 description 1
- 101001009450 Homo sapiens Histone H1.3 Proteins 0.000 description 1
- 101001009443 Homo sapiens Histone H1.4 Proteins 0.000 description 1
- 101000872218 Homo sapiens Histone H1.8 Proteins 0.000 description 1
- 101000905044 Homo sapiens Histone H1t Proteins 0.000 description 1
- 101000882390 Homo sapiens Histone acetyltransferase p300 Proteins 0.000 description 1
- 101000608935 Homo sapiens Leukosialin Proteins 0.000 description 1
- 101000934372 Homo sapiens Macrosialin Proteins 0.000 description 1
- 101000946889 Homo sapiens Monocyte differentiation antigen CD14 Proteins 0.000 description 1
- 101001079872 Homo sapiens RING finger protein 112 Proteins 0.000 description 1
- 101001012157 Homo sapiens Receptor tyrosine-protein kinase erbB-2 Proteins 0.000 description 1
- 101000738771 Homo sapiens Receptor-type tyrosine-protein phosphatase C Proteins 0.000 description 1
- 101000821100 Homo sapiens Synapsin-1 Proteins 0.000 description 1
- 101000843236 Homo sapiens Testis-specific H1 histone Proteins 0.000 description 1
- 101000801209 Homo sapiens Transducin-like enhancer protein 4 Proteins 0.000 description 1
- 108090000144 Human Proteins Proteins 0.000 description 1
- 102000003839 Human Proteins Human genes 0.000 description 1
- 108700000788 Human immunodeficiency virus 1 tat peptide (47-57) Proteins 0.000 description 1
- 208000023105 Huntington disease Diseases 0.000 description 1
- XQFRJNBWHJMXHO-RRKCRQDMSA-N IDUR Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(I)=C1 XQFRJNBWHJMXHO-RRKCRQDMSA-N 0.000 description 1
- 108060003951 Immunoglobulin Proteins 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 102100025306 Integrin alpha-IIb Human genes 0.000 description 1
- 101710149643 Integrin alpha-IIb Proteins 0.000 description 1
- 102100037872 Intercellular adhesion molecule 2 Human genes 0.000 description 1
- 101710148794 Intercellular adhesion molecule 2 Proteins 0.000 description 1
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- 241001655931 Ktedonobacter sp. Species 0.000 description 1
- 241000186610 Lactobacillus sp. Species 0.000 description 1
- 241000029603 Leptotrichia shahii Species 0.000 description 1
- 241000029590 Leptotrichia wadei Species 0.000 description 1
- 102100039564 Leukosialin Human genes 0.000 description 1
- 241001134698 Lyngbya Species 0.000 description 1
- 102100025136 Macrosialin Human genes 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 241000501784 Marinobacter sp. Species 0.000 description 1
- 208000036626 Mental retardation Diseases 0.000 description 1
- 241000204639 Methanohalobium Species 0.000 description 1
- 241000179981 Microcoleus sp. Species 0.000 description 1
- 241000192709 Microcystis sp. Species 0.000 description 1
- 241000190905 Microscilla Species 0.000 description 1
- 102100035877 Monocyte differentiation antigen CD14 Human genes 0.000 description 1
- 241000713333 Mouse mammary tumor virus Species 0.000 description 1
- 101000981253 Mus musculus GPI-linked NAD(P)(+)-arginine ADP-ribosyltransferase 1 Proteins 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 102000034570 NR1 subfamily Human genes 0.000 description 1
- 108020001305 NR1 subfamily Proteins 0.000 description 1
- 241000167284 Natranaerobius Species 0.000 description 1
- 241001440871 Neisseria sp. Species 0.000 description 1
- 241000244206 Nematoda Species 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 206010029260 Neuroblastoma Diseases 0.000 description 1
- 244000061176 Nicotiana tabacum Species 0.000 description 1
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 1
- 241000192147 Nitrosococcus Species 0.000 description 1
- 241001221335 Nocardiopsis sp. Species 0.000 description 1
- 241000059630 Nodularia <Cyanobacteria> Species 0.000 description 1
- 241000192673 Nostoc sp. Species 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 241000192520 Oscillatoria sp. Species 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 241001038004 Pelotomaculum sp. Species 0.000 description 1
- 102000002508 Peptide Elongation Factors Human genes 0.000 description 1
- 108010068204 Peptide Elongation Factors Proteins 0.000 description 1
- 241001038000 Petrotoga sp. Species 0.000 description 1
- 241001472610 Polaromonas sp. Species 0.000 description 1
- 229920002873 Polyethylenimine Polymers 0.000 description 1
- 241000611831 Prevotella sp. Species 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- 108010043400 Protamine Kinase Proteins 0.000 description 1
- 102000001253 Protein Kinase Human genes 0.000 description 1
- 241000519582 Pseudoalteromonas sp. Species 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 230000006819 RNA synthesis Effects 0.000 description 1
- 102000044126 RNA-Binding Proteins Human genes 0.000 description 1
- 101710105008 RNA-binding protein Proteins 0.000 description 1
- 241000700157 Rattus norvegicus Species 0.000 description 1
- 101100372762 Rattus norvegicus Flt1 gene Proteins 0.000 description 1
- 102100030086 Receptor tyrosine-protein kinase erbB-2 Human genes 0.000 description 1
- 102100037422 Receptor-type tyrosine-protein phosphatase C Human genes 0.000 description 1
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 1
- 208000007014 Retinitis pigmentosa Diseases 0.000 description 1
- 108090000820 Rhodopsin Proteins 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- 108091061750 Signal recognition particle RNA Proteins 0.000 description 1
- 241000700584 Simplexvirus Species 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 241001147693 Staphylococcus sp. Species 0.000 description 1
- 241000194017 Streptococcus Species 0.000 description 1
- 241000194022 Streptococcus sp. Species 0.000 description 1
- 241000194020 Streptococcus thermophilus Species 0.000 description 1
- 241000187180 Streptomyces sp. Species 0.000 description 1
- 241000216438 Streptosporangium sp. Species 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 241000282898 Sus scrofa Species 0.000 description 1
- 102100021905 Synapsin-1 Human genes 0.000 description 1
- 241000192560 Synechococcus sp. Species 0.000 description 1
- 210000001744 T-lymphocyte Anatomy 0.000 description 1
- 241000255588 Tephritidae Species 0.000 description 1
- 101710159055 Testis-specific H1 histone Proteins 0.000 description 1
- 206010043395 Thalassaemia sickle cell Diseases 0.000 description 1
- 241000204315 Thermosipho <sea snail> Species 0.000 description 1
- 102100040396 Transcobalamin-1 Human genes 0.000 description 1
- 101710124861 Transcobalamin-1 Proteins 0.000 description 1
- 102100031027 Transcription activator BRG1 Human genes 0.000 description 1
- 101710122029 Transcription activator BRG1 Proteins 0.000 description 1
- 102100033763 Transducin-like enhancer protein 4 Human genes 0.000 description 1
- 241000545067 Venus Species 0.000 description 1
- 241001261005 Verrucomicrobia Species 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 241000589634 Xanthomonas Species 0.000 description 1
- 208000020329 Zika virus infectious disease Diseases 0.000 description 1
- 125000002777 acetyl group Chemical group [H]C([H])([H])C(*)=O 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 229960005305 adenosine Drugs 0.000 description 1
- 125000003342 alkenyl group Chemical group 0.000 description 1
- 125000004450 alkenylene group Chemical group 0.000 description 1
- 125000003545 alkoxy group Chemical group 0.000 description 1
- 125000000217 alkyl group Chemical group 0.000 description 1
- 125000000304 alkynyl group Chemical group 0.000 description 1
- 125000003277 amino group Chemical group 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 125000003710 aryl alkyl group Chemical group 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 125000004429 atom Chemical group 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 1
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 1
- 230000008238 biochemical pathway Effects 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 230000031018 biological processes and functions Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 108091005948 blue fluorescent proteins Proteins 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 125000002057 carboxymethyl group Chemical group [H]OC(=O)C([H])([H])[*] 0.000 description 1
- 101150038500 cas9 gene Proteins 0.000 description 1
- 239000003054 catalyst Substances 0.000 description 1
- 125000002091 cationic group Chemical group 0.000 description 1
- 229920006317 cationic polymer Polymers 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000032823 cell division Effects 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 108091092356 cellular DNA Proteins 0.000 description 1
- 208000019065 cervical carcinoma Diseases 0.000 description 1
- BHONFOAYRQZPKZ-LCLOTLQISA-N chembl269478 Chemical compound C([C@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCCNC(N)=N)[C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O)C1=CC=CC=C1 BHONFOAYRQZPKZ-LCLOTLQISA-N 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 235000020971 citrus fruits Nutrition 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000004624 confocal microscopy Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 244000038559 crop plants Species 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 108010082025 cyan fluorescent protein Proteins 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 239000000412 dendrimer Substances 0.000 description 1
- 229920000736 dendritic polymer Polymers 0.000 description 1
- 210000005045 desmin Anatomy 0.000 description 1
- 230000029180 desumoylation Effects 0.000 description 1
- 230000010460 detection of virus Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000005546 dideoxynucleotide Substances 0.000 description 1
- PQYUGUXEJHLOIL-UHFFFAOYSA-N diethoxysilyl triethyl silicate Chemical compound C(C)O[SiH](O[Si](OCC)(OCC)OCC)OCC PQYUGUXEJHLOIL-UHFFFAOYSA-N 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- 238000006471 dimerization reaction Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 239000000975 dye Substances 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 210000002257 embryonic structure Anatomy 0.000 description 1
- 229910052876 emerald Inorganic materials 0.000 description 1
- 239000010976 emerald Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 230000006353 environmental stress Effects 0.000 description 1
- 102000052116 epidermal growth factor receptor activity proteins Human genes 0.000 description 1
- 108700015053 epidermal growth factor receptor activity proteins Proteins 0.000 description 1
- 230000001973 epigenetic effect Effects 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 210000000604 fetal stem cell Anatomy 0.000 description 1
- 238000003209 gene knockout Methods 0.000 description 1
- 238000001415 gene therapy Methods 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 210000005046 glial fibrillary acidic protein Anatomy 0.000 description 1
- 208000005017 glioblastoma Diseases 0.000 description 1
- 108060003196 globin Proteins 0.000 description 1
- 102000034238 globular proteins Human genes 0.000 description 1
- 108091005896 globular proteins Proteins 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 229940029575 guanosine Drugs 0.000 description 1
- 208000006454 hepatitis Diseases 0.000 description 1
- 231100000283 hepatitis Toxicity 0.000 description 1
- 125000001072 heteroaryl group Chemical group 0.000 description 1
- 230000006195 histone acetylation Effects 0.000 description 1
- 230000006801 homologous recombination Effects 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 125000004435 hydrogen atom Chemical class [H]* 0.000 description 1
- 230000007062 hydrolysis Effects 0.000 description 1
- 238000006460 hydrolysis reaction Methods 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000010166 immunofluorescence Methods 0.000 description 1
- 102000018358 immunoglobulin Human genes 0.000 description 1
- 238000000530 impalefection Methods 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 230000002458 infectious effect Effects 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 210000005265 lung cell Anatomy 0.000 description 1
- 108091005949 mKalama1 Proteins 0.000 description 1
- 210000002540 macrophage Anatomy 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 125000005439 maleimidyl group Chemical class C1(C=CC(N1*)=O)=O 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 150000002739 metals Chemical class 0.000 description 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 238000000386 microscopy Methods 0.000 description 1
- 210000001616 monocyte Anatomy 0.000 description 1
- 125000004573 morpholin-4-yl group Chemical group N1(CCOCC1)* 0.000 description 1
- 210000003098 myoblast Anatomy 0.000 description 1
- YOHYSYJDKVYCJI-UHFFFAOYSA-N n-[3-[[6-[3-(trifluoromethyl)anilino]pyrimidin-4-yl]amino]phenyl]cyclopropanecarboxamide Chemical compound FC(F)(F)C1=CC=CC(NC=2N=CN=C(NC=3C=C(NC(=O)C4CC4)C=CC=3)C=2)=C1 YOHYSYJDKVYCJI-UHFFFAOYSA-N 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 125000004433 nitrogen atom Chemical group N* 0.000 description 1
- 238000001821 nucleic acid purification Methods 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 230000030648 nucleus localization Effects 0.000 description 1
- 230000009437 off-target effect Effects 0.000 description 1
- 210000000287 oocyte Anatomy 0.000 description 1
- 239000005022 packaging material Substances 0.000 description 1
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 1
- 150000008300 phosphoramidites Chemical class 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 244000000003 plant pathogen Species 0.000 description 1
- 229920005596 polymer binder Polymers 0.000 description 1
- 239000002491 polymer binding agent Substances 0.000 description 1
- 230000034190 positive regulation of NF-kappaB transcription factor activity Effects 0.000 description 1
- 210000002307 prostate Anatomy 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 230000001172 regenerating effect Effects 0.000 description 1
- 125000000548 ribosyl group Chemical class C1([C@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 229910052594 sapphire Inorganic materials 0.000 description 1
- 239000010980 sapphire Substances 0.000 description 1
- 238000010532 solid phase synthesis reaction Methods 0.000 description 1
- 125000006850 spacer group Chemical group 0.000 description 1
- 150000003431 steroids Chemical class 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 208000011580 syndromic disease Diseases 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 125000003396 thiol group Chemical group [H]S* 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical group [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 1
- 229940104230 thymidine Drugs 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 239000012096 transfection reagent Substances 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- GWBUNZLLLLDXMD-UHFFFAOYSA-H tricopper;dicarbonate;dihydroxide Chemical compound [OH-].[OH-].[Cu+2].[Cu+2].[Cu+2].[O-]C([O-])=O.[O-]C([O-])=O GWBUNZLLLLDXMD-UHFFFAOYSA-H 0.000 description 1
- 239000003744 tubulin modulator Substances 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 1
- 229940045145 uridine Drugs 0.000 description 1
- 210000002845 virion Anatomy 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 239000000277 virosome Substances 0.000 description 1
- 238000002689 xenotransplantation Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
- C07K14/4701—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
- C07K14/4702—Regulators; Modulating activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
- C12N15/907—Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6897—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids involving reporter genes operably linked to promoters
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/005—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/09—Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/10—Fusion polypeptide containing a localisation/targetting motif containing a tag for extracellular membrane crossing, e.g. TAT or VP22
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/80—Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/80—Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
- C07K2319/81—Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor containing a Zn-finger domain for DNA binding
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/22—Vectors comprising a coding region that has been codon optimised for expression in a respective host
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/80—Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A50/00—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
- Y02A50/30—Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Medicinal Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Crystallography & Structural Chemistry (AREA)
- Mycology (AREA)
- Cell Biology (AREA)
- Analytical Chemistry (AREA)
- Immunology (AREA)
- Toxicology (AREA)
- Gastroenterology & Hepatology (AREA)
- Pharmacology & Pharmacy (AREA)
- Epidemiology (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Enzymes And Modification Thereof (AREA)
- Peptides Or Proteins (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
A invenção refere-se a composições e métodos para usar domínios de proteína de interação com nucleossomo para melhorar a acessibilidade de proteínas de modificação de DNA programável para direcionar sequências cromossômicas, aumentando assim a eficiência do genoma direcionado / modificação epigenética em células eucarióticas.
Description
Relatório Descritivo da Patente de Invenção para "USO DE
[001] A presente descrição refere-se a composições e métodos para aumentar a eficiência da modificação de genoma direcionada, regulação transcricional direcionada ou modificação epigenética direcionada.
[002] As endonucleases programáveis vêm tornando-se cada vez mais uma ferramenta importante para a engenharia genética ou modificação de genoma direcionada em eucariotas. Recentemente, os sistemas de repetições palindrômicas curtas e regularmente intercaladas agrupadas guiadas por RNA (CRISPR) emergiram como uma nova geração de ferramentas de modificação de genoma. Essas novas endonucleases programáveis proporcionaram simplicidade e versatilidade sem precedentes em comparação com gerações anteriores de nucleases, como nucleases de dedos de zinco (ZFNs) e nucleases de efetores do tipo ativador de transcrição (TALENs). No entanto, as barreiras da cromatina nas células eucarióticas podem impedir o acesso ao alvo e a clivagem pelos sistemas CRISPR derivados de procariontes (Hinz et al., Biochemistry, 2015, 54: 7063-66; Horlbeck et al., ELife, 2016, 5: e12677).
[003] De fato, nenhuma ou baixa atividade de edição em certos sítios genômicos de mamíferos foi observada ao usar o Streptococcus pyogenes Cas9 (SpCas9), que é considerado a CRISPR nuclease mais ativa até o momento. Além disso, muitas das nucleases CRISPR que foram caracterizadas até agora não exibem atividade em células de mamíferos, embora sejam ativas em bactérias ou em substratos de DNA purificados. Portanto, existe uma necessidade de melhorar a capacidade dos sistemas de CRISPR nuclease e outras proteínas de modificação de DNA programável para superar o impedimento da cromatina para aumentar a eficiência do genoma direcionado ou da modificação epigenética nos eucariotas.
[004] Entre os vários aspectos da presente descrição está a provisão de proteínas de fusão, cada proteína de fusão compreendendo pelo menos um domínio de proteína de interação com nucleossomo ligado a uma proteína de modificação de DNA programável.
[005] O pelo menos um domínio de proteína de interação com nucleossomo pode ser um domínio de ligação ao DNA a partir de uma proteína box do grupo de alta mobilidade (HMG) (HMGB) escolhida entre HMGB1, HMGB2 ou HMGB3; uma proteína de ligação ao nucleossomo do HMG (HMGN) escolhida entre HMGN1, HMGN2, HMGN3a, HMGN3b, HMGN4 ou HMGN5; um domínio central globular de uma variante de histona H1; um domínio de ligação ao DNA a partir de uma proteína do complexo de remodelação de cromatina escolhida entre o complexo switch / sacarose não fermentável (SWI/SNF), complexo imitação de switch (ISWI), complexo de ligação cromodomaina-helicase-DNA (CHD), complexo de remodelação e desacetilase de nucleossomo (NuRD), complexo INO80, complexo SWR1, complexo RSC ou sua combinação. Em algumas modalidades, o pelo menos um domínio de proteína de interação com nucleossomo pode ser o domínio de box A de HMGB1, proteína HMGN1, proteína HMGN2, proteína HMGN3a, proteína HMGN3b, domínio globular central de histona H1, domínio de ligação ao DNA da proteína ISWI, domínio de ligação ao DNA da proteína CHD1 ou combinação dos mesmos.
[006] Em algumas modalidades, a proteína de modificação de DNA programável tem atividade de nuclease, e a proteína de modificação de DNA programável pode ser uma nuclease ou nickase de repetições palindrômicas curtas e regularmente intercaladas agrupadas (CRISPR), uma nuclease de dedo de zinco (ZFN), uma nuclease de efetor do tipo ativador de transcrição (TALEN), uma meganuclease ou uma proteína quimérica compreendendo um domínio de ligação ao DNA programável ligado a um domínio nuclease.
[007] Em outras modalidades, a proteína de modificação de DNA programável tem atividade de não nuclease, e a proteína de modificação de DNA programável pode ser uma proteína quimérica que compreende um domínio de ligação ao DNA programável ligado a um domínio de não nuclease. O domínio de ligação ao DNA programável da proteína quimérica pode ser uma proteína CRISPR modificada para não possuir toda atividade de nuclease, uma proteína de dedo de zinco ou um efetor do tipo ativador de transcrição, e o domínio de não nuclease da proteína quimérica pode ter atividade de acetiltransferase, atividade de desacetilase, atividade de metiltransferase, atividade da desmetilase, atividade da quinase, atividade da fosfatase, atividade da ubiquitina ligase, atividade de desiquiquilação, atividade de adenilação, atividade de desadenilação, atividade de SUMOilação, atividade deSUMOilação, atividade de ribosilação, atividade de derribosilação, atividade de miristoilação, atividade de demiristoilação, atividade de citrulinação, atividade de helicase, atividade de aminação, atividade de desaminação, atividade de alquilação, atividade de desalquilação, atividade de oxidação, atividade de ativação transcricional ou atividade de repressão transcricional. Em certas modalidades, o domínio não nuclease da proteína quimérica pode ter atividade de citosina desaminase, atividade de histona acetiltransferase, atividade de ativação transcricional ou atividade de repressão transcricional.
[008] O pelo menos um domínio de proteína de interação com nucleossomo pode ser ligado à proteína de modificação de DNA programável diretamente através de uma ligação química, indiretamente através de um ligante, ou uma combinação dos mesmos. O pelo menos um domínio de proteína de interação com nucleossomo pode ser ligado ao terminal N, terminal C e/ou a um local interno da proteína de modificação de DNA programável. Em algumas modalidades, a proteína de fusão compreende pelo menos dois domínios de proteína de interação com nucleossomo ligados à proteína de modificação de DNA programável.
[009] As proteínas de fusão aqui divulgadas podem adicionalmente compreender pelo menos um sinal de localização nuclear, pelo menos um domínio de penetração de células, pelo menos um domínio de marcador ou uma combinação dos mesmos.
[010] Outro aspecto da presente descrição abrange uma proteína de fusão compreendendo uma proteína CRISPR ligada a pelo menos um domínio de proteína de interação com nucleossomo.
[011] Em geral, a proteína CRISPR da referida proteína de fusão pode ser uma proteína CRISPR/Cas9 tipo II ou uma proteína CRISPR/Cpf1 tipo V. Em certas modalidades, a proteína CRISPR pode ser Streptococcus pyogenes Cas9 (SpCas9), Streptococcus thermophilus Cas9 (StCas9), Streptococcus pasteurianus (SpaCas9), Campylobacter jejuni Cas9 (CjCas9), Staphylococcus aureus (SaCas9), Francisella novicida Cas9 (FnCas9), Neisseria cinerea Cas9 (NcCas9), Neisseria meningite Cas9 (NmCas9), Francisella novicida Cpf1 (FnCpf1), Acidaminococcus sp. Cpf1 (AsCpf1), ou Lachnospiraceae bacterium ND2006 Cpf1 (LbCpf1).
[012] Em algumas modalidades, a proteína CRISPR tem atividade de nuclease ou nickase. Por exemplo, a proteína CRISPR pode ser uma nuclease ou nickase do tipo II CRISPR/Cas9 ou uma nuclease ou nickase do tipo V CRISPR/Cpf1. Em outras modalidades, a proteína CRISPR tem atividade de não nuclease. Em tais iterações, a proteína
CRISPR pode ser uma proteína CRISPR/Cas9 tipo II modificada para não possuir toda a atividade de nuclease e ligada a um domínio não nuclease, ou uma proteína CRISPR/Cpf1 tipo V modificada para não possuir toda a atividade de nuclease e ligada a um não domínio não nuclease, em que o domínio não nuclease pode ter atividade de citosina desaminase, atividade de histona acetiltransferase, atividade de ativação transcricional ou atividade de repressão transcricional.
[013] O pelo menos um domínio de proteína de interação com nucleossomo da proteína de fusão CRISPR pode ser um domínio de ligação ao DNA de box do grupo de alta mobilidade (HMG) (HMGB), uma proteína HMG de ligação ao nucleossomo (HMGN), um domínio globular central a partir de uma variante de histona H1, um domínio de ligação ao DNA a partir de uma proteína do complexo de remodelação de cromatina ou uma combinação dos mesmos. Em certas modalidades, o pelo menos um domínio de proteína de interação com nucleossomo da proteína de fusão CRISPR pode ser o domínio de box A de HMGB1, proteína HMGN1, proteína HMGN2, proteína HMGN3a, proteína HMGN3b, domínio globular central de histona H1, domínio de ligação ao DNA da proteína de imitação de switch (ISWI), domínio de ligação ao DNA de proteína 1 cromodomaina-helicase-DNA (CHD1), ou uma combinação dos mesmos.
[014] O pelo menos um domínio de proteína de interação com nucleossomo pode ser ligado à proteína CRISPR diretamente através de uma ligação química, indiretamente através de um ligante, ou uma combinação dos mesmos. O pelo menos um domínio de proteína de interação com nucleossomo pode ser ligado ao terminal N, terminal C e/ou a um local interno da proteína CRISPR. Em algumas modalidades, a proteína de fusão compreende pelo menos dois domínios de proteína de interação com nucleossomo ligados à proteína CRISPR.
[015] As proteínas de fusão CRISPR aqui divulgadas podem adicionalmente compreender pelo menos um sinal de localização nuclear, pelo menos um domínio de penetração de células, pelo menos um domínio de marcador ou uma combinação dos mesmos.
[016] Em certas modalidades, a proteína de fusão CRISPR pode ter uma sequência de aminoácidos com pelo menos cerca de 90% de identidade de sequência com a SEQ ID NO: 61, SEQ ID NO: 62, SEQ ID NO: 63, SEQ ID NO: 63, SEQ ID NO: 64, SEQ ID NO: 65, SEQ ID NO: 66, SEQ ID NO: 67, SEQ ID NO: 68, SEQ ID NO: 69, SEQ ID NO: 70, SEQ ID NO: 71, SEQ ID NO: 72, SEQ ID NO: 73, SEQ ID NO: 74, SEQ ID NO: 75, SEQ ID NO: 76, SEQ ID NO: 77, SEQ ID NO: 78 ou SEQ ID NO: 79.
[017] Em outras modalidades, a proteína de fusão CRISPR pode ter uma sequência de aminoácidos conforme estabelecido na SEQ ID NO: 61, SEQ ID NO: 62, SEQ ID NO: 62, SEQ ID NO: 63, SEQ ID NO: 64, SEQ ID NO: 65, SEQ ID NO: 66, SEQ ID NO: 67, SEQ ID NO: 68, SEQ ID NO: 69, SEQ ID NO: 70, SEQ ID NO: 71, SEQ ID NO: 72, SEQ ID NO: 73, SEQ ID NO: 74, SEQ ID NO: 75, SEQ ID NO: 76, SEQ ID NO: 77, SEQ ID NO: 78 ou SEQ ID NO: 79.
[018] Outro aspecto da presente descrição abrange complexos proteína-RNA compreendendo pelo menos uma das proteínas de fusão contendo CRISPR aqui divulgadas e pelo menos um RNA guia.
[019] Um outro aspecto da presente descrição fornece ácidos nucleicos que codificam qualquer uma das proteínas de fusão aqui divulgadas. Os ácidos nucleicos podem ser otimizados por códon para tradução em uma célula eucariótica. Em algumas modalidades, os ácidos nucleicos podem ser parte de um vetor, tal como, por exemplo, um vetor viral, um vetor plasmídeo ou um RNA autorreplicante.
[020] Ainda outro aspecto da presente descrição fornece métodos para aumentar a eficiência do genoma direcionado ou modificação epigenética em uma célula eucariótica. Os métodos envolvem a introdução em uma célula eucariótica (a) pelo menos uma proteína de fusão como aqui divulgada ou ácido nucleico que codifica as referidas proteínas de fusão, em que o pelo menos um domínio de proteína de interação com nucleossomo da pelo menos uma proteína de fusão altera a estrutura nucleossômica ou de cromatina de modo que a pelo menos uma proteína de fusão aumente o acesso à sequência cromossômica alvo, aumentando assim a eficiência do genoma direcionado ou da modificação epigenética.
[021] Em algumas iterações, o método compreende introduzir na célula eucariótica (a) pelo menos uma proteína de fusão CRISPR como aqui divulgada ou ácido nucleico que codifica as referidas proteínas de fusão CRISPR, em que a proteína CRISPR (i) tem atividade de nuclease ou nickase ou (ii) é modificada para não possuir toda atividade de nuclease e está ligada a um domínio de não nuclease; e (b) pelo menos um RNA guia ou ácido nucleico que codifica pelo menos um RNA guia; em que a proteína CRISPR da pelo menos uma proteína de fusão CRISPR é direcionada a uma sequência cromossômica alvo e o pelo menos um domínio de proteína de interação com nucleossomo da pelo menos uma proteína de fusão CRISPR altera a estrutura nucleossômica ou de cromatina, de modo que a pelo menos uma proteína de fusão CRISPR aumente o acesso à sequência cromossômica alvo, aumentando assim a eficiência do genoma direcionado ou modificação epigenética.
[022] Em certas modalidades, os métodos podem adicionalmente compreender a introdução na célula eucariótica de pelo menos um polinucleotídeo doador, o polinucleotídeo doador compreendendo pelo menos uma sequência doadora.
[023] As células eucarióticas usadas nos métodos aqui divulgados podem ser células de mamíferos. Em algumas modalidades, as células podem ser células humanas. As células podem ser in vitro ou in vivo.
[024] Outros aspectos e características da descrição são detalhados abaixo.
[025] A FIG. 1 apresenta a eficiência de clivagem (como a porcentagem de indels) de CjCas9 de tipo selvagem (CjeCas9), uma proteína de fusão compreendendo CjCas9 ligada a HMGN1 e Box A de HMGB1 (CjeCas9-HN1HB1) e uma proteína de fusão compreendendo CjCas9 ligada a HMGN1 e Domínio globular central de histona H1 (CjeCas9-HN1H1G) na presença de arcabouço de sgRNA de tipo selvagem ou arcabouço de sgRNA modificado.
[026] A presente descrição fornece composições e métodos para aumentar a acessibilidade do DNA cromossômico a proteínas de modificação de DNA programável, incluindo sistemas CRISPR. Em particular, a presente descrição fornece proteínas de fusão compreendendo pelo menos um domínio de proteína de interação com nucleossomo ligado a uma proteína de modificação de DNA programável. Os domínios de proteína de interação com nucleossomo alteram ou remodelam a estrutura nucleossômica e/ou cromatina, de modo que a proteína de modificação de DNA programável aumente o acesso a sequências cromossômicas direcionadas, aumentando assim a eficiência da modificação de genoma direcionada, regulação transcricional direcionada ou modificação epigenética direcionada. (i) Proteínas de Fusão
[027] Um aspecto da presente descrição fornece proteínas de fusão, em que cada proteína de fusão compreende pelo menos um domínio de proteína de interação com nucleossomo ligado a uma proteína de modificação de DNA programável. A proteína de modificação de DNA programável pode ter atividade de nuclease (vide a seção (I) (b) (i), abaixo) ou atividade de não nuclease (vide a seção (I)
(b) (ii) abaixo). Os domínios de proteína de interação com nucleossomo são descritos abaixo na seção (I) (a) e as ligações entre os domínios são descritas abaixo na seção (I) (c). (a) Domínios de Proteína de interação com Nucleossomo
[028] Domínios de proteína de interação com nucleossomo se referem a proteínas cromossômicas ou seus fragmentos que interagem com nucleossomo e/ou proteínas cromossômicas para facilitar o rearranjo dos nucleossomos e/ou a remodelação de cromatina. Em algumas modalidades, o domínio de proteína de interação com nucleossomo pode ser derivado de proteínas box do grupo de alta mobilidade (HMG) (HMGB). Em outras modalidades, o domínio de proteína de interação com nucleossomo pode ser proteínas de ligação ao nucleossomo do HMG (HMGN) ou fragmentos das mesmas. Em outras modalidades, o domínio de proteína de interação com nucleossomo pode ser derivado de variantes de histona H1 de ligante. Ainda em outras modalidades, o domínio de proteína de interação com nucleossomo pode ser derivado de proteínas complexas que remodelam a cromatina. (i) Proteínas HMGB
[029] Em algumas modalidades, o pelo menos um domínio de proteína de interação com nucleossomo pode ser derivado de uma proteína HMGB. As proteínas HMGB interagem com nucleossomos e outras proteínas cromossômicas para regular a estrutura e a função da cromatina. As proteínas HMGB adequadas incluem HMGB1 de mamífero, HMGB2 de mamífero e HMGB3 de mamífero. Por exemplo, o domínio de proteína de interação com nucleossomo pode ser derivado de um HNGB1 humano (RefSeqGene, U51677), HMGB2 humano (RefSeqGene, M83665) ou HMGB3 humano (RefSeqGene, NM_005342). Em outras modalidades, o domínio de proteína de interação com nucleossomo pode ser derivado de uma proteína HMGB ou de proteína semelhante a HMGB de outros vertebrados, invertebrados (por exemplo, Drosophila DSP1), plantas, leveduras ou outros eucariotas de célula única.
[030] Em modalidades específicas, o pelo menos um domínio de proteína de interação com nucleossomo pode ser um fragmento de uma proteína HMGB. Em particular, o fragmento da proteína HMGB é um domínio de ligação ao DNA. Proteínas HMGB contêm tipicamente dois domínios de ligação ao DNA, que são chamados de box A e box B. Em algumas modalidades, o domínio de interação do nucleossomo pode ser um domínio de box A ou um domínio de box B de uma proteína HMGB. Em modalidades específicas, o domínio de interação do nucleossomo pode ser um domínio de box A de HMGB1, um domínio de box A de HMGB2 ou um domínio de box A de HMGB3. (ii) Proteínas HMGN
[031] Em outras modalidades, o pelo menos um domínio de proteína de interação com nucleossomo pode ser uma proteína HMGN ou um fragmento da mesma. As proteínas HMGN são proteínas cromossômicas que modulam a estrutura e a função da cromatina. As proteínas HMGN de mamífero adequadas incluem HMGN1, HMGN2, HMGN3, HMGN3, HMGN4 e HMGN5. Em várias modalidades, o domínio de proteína de interação com nucleossomo pode ser HMGN1 humano (RefSeqGene, M21339), HMGN2 humano (RefSeqGene, X13546), HMGN3a humano ou HMGN3b (RefSeqGene, L40357), HMGNN humano (RefSeqGene5, RefSeqGene), NM_016710), um fragmento dos mesmos ou um derivado dos mesmos. Em outras modalidades, o domínio de proteína de interação com nucleossomo pode ser uma proteína HMGN não humana, fragmento ou derivado da mesma. As proteínas HMGN são proteínas relativamente pequenas. Como tal, toda a proteína HMGN pode ser ligada à proteína de modificação de DNA programável. Em algumas modalidades, no entanto, um fragmento (por exemplo, o domínio de ligação ao nucleossomo localizado centralmente) de uma proteína HMGN pode ser ligado à proteína de modificação de DNA programável. (iii) Variantes de histona H1
[032] Ainda em outras modalidades, o pelo menos um domínio de proteína de interação com nucleossomo pode ser derivado de uma variante de histona H1 de ligante. Por exemplo, o domínio de proteína de interação com nucleossomo pode ser um domínio globular central a partir de uma variante de histona H1. As variantes de histona H1 se ligam ao DNA ligante entre nucleossomos e o domínio globular central (de cerca de 80 aminoácidos) se liga ao DNA ligante nos sítios de entrada e saída do nucleossomo perto da díade do nucleossomo. As variantes de histona H1 compreendem uma grande família de proteínas relacionadas com especificidade distinta para tecidos, estágios de desenvolvimento e organismos em que são expressas. Por exemplo, humanos e camundongos contêm 11 variantes de histona H1, frango tem seis variantes (chamadas histona H5), sapo tem cinco variantes, nematoide tem oito variantes, espécies de mosca da fruta têm de uma a três variantes e tabaco tem seis variantes. Em algumas modalidades, a variante de histona H1 pode ser uma variante humana, como mostrado abaixo. Nome da Proteína* Símbolo do Gene Acesso UniProtKB Histona H1.0 H1F0 P07305 Histona H1.1 HIST1H1A Q02539 Histona H1.2 HIST1H1C P16403 Histona H1.3 HIST1H1D P16402 Histona H1.4 HIST1H1E P10412 Histona H1.5 HIST1H1B P16401 Histona H1.6 (específico de HIST1H1T P22492 testículo) Histona H1.7 (específico de H1FNT Q75WM6 testículo)
Histona H1.8 (específico de H1FOO Q8IZA3 oócito) Histona H1.9 (específico de HILS1 P60008 testículo) Histona H1.10 H1FX Q92522 * Talbert et al., Epigenetics & Chromatin, 2012, 5:7. (iv) Proteínas Complexas de Remodelação de cromatina
[033] Em outras modalidades, o pelo menos um domínio de proteína de interação com nucleossomo pode ser derivado de uma proteína complexa de remodelação de cromatina. Por exemplo, o domínio de proteína de interação com nucleossomo pode ser um domínio de ligação ao DNA a partir de uma proteína complexa de remodelação de cromatina. Os complexos de remodelação de cromatina são complexos enzimáticos com várias subunidades, com capacidade de remodelar a estrutura da cromatina. Esses complexos de remodelação usam a energia da hidrólise de ATP para mover, desestabilizar, ejetar ou reestruturar nucleossomos.
[034] Exemplos de complexos de remodelação de cromatina incluem SWI/SNF (SWItch / sacarose não fermentável), ISWI (imitação de SWItch), CHD (ligação de cromodomínio-helicase-DNA), Mi-2/NuRD (remodelação de nucleossomos e desacetilase), INO80, SWR1 e RSC. Em várias modalidades, o domínio de proteína de interação com nucleossomo pode ser derivado de uma ATPase, uma helicase e/ou uma proteína de ligação ao DNA no complexo de remodelação de cromatina. Em algumas modalidades, o domínio de proteína de interação com nucleossomo pode ser derivado do ATPase ISWI do complexo ISWI, a proteína de ligação ao DNA CHD1 do complexo CHD, helicase dependente de ATP SMARCA4 ou ATPase Snf2 do complexo SWI/SNF, ATPase Mi-2α ou ATPase Mi2-β do complexo Mi-1/NuRD, AAA ATPase 1 semelhante a RuvB ou AAA ATPase 2 semelhante a RuvB do complexo INO80, ATPase Swr1 do complexo SWR1 ou ATPase Rsc1 ou ATPase Rsc1 ou ATPase Rcs2 do complexo RSC. Em modalidades específicas, o domínio de proteína de interação com nucleossomo pode ser um domínio de ligação ao DNA da proteína ISWI ou um domínio de ligação ao DNA da proteína CHD1. (b) Proteínas de Modificação de DNA Programável
[035] Uma proteína de modificação de DNA programável é uma proteína direcionada para ligar uma sequência específica no DNA cromossômico, onde ela modifica o DNA ou uma proteína associada ao DNA na ou quase na sequência alvo. Assim, uma proteína de modificação de DNA programável compreende um domínio de ligação ao DNA programável e um domínio de modificação cataliticamente ativo.
[036] O domínio de ligação ao DNA das proteínas de modificação de DNA programável é programável, o que significa que pode ser construído geneticamente ou manipulado para reconhecer e ligar diferentes sequências de DNA. Em algumas modalidades, por exemplo, a ligação ao DNA é mediada por interações entre a proteína de modificação de DNA e o DNA alvo. Assim, o domínio de ligação ao DNA pode ser programado para ligar uma sequência de DNA de interesse por engenharia de proteínas. Em outras modalidades, por exemplo, a ligação ao DNA é mediada por um RNA guia que interage com a proteína de modificação do DNA e o DNA alvo. Nesses casos, a proteína de ligação ao DNA programável pode ser direcionada a uma sequência de DNA de interesse, projetando o RNA guia apropriado.
[037] Uma variedade de domínios de modificação pode ser incluída na proteína de modificação de DNA programável. Em algumas modalidades, o domínio de modificação tem atividade de nuclease e pode clivar uma ou ambas as cadeias de uma sequência de DNA de duplo filamento. A quebra de DNA pode então ser reparada por um processo de reparo de DNA celular, como uma junção de extremidade não homóloga (NHEJ) ou reparo direcionado por homologia (HDR), tal que a sequência de DNA pode ser modificada por uma exclusão, inserção e/ou substituição de pelo menos um par de bases. Exemplos de proteínas de modificação de DNA programável com atividade de nuclease incluem, sem limite, nucleases CRISPR (ou nickases), nucleases de dedo de zinco, nucleases de efetores do tipo ativador de transcrição, meganucleases e um domínio de ligação ao DNA programável ligado a um domínio nuclease. As proteínas de modificação de DNA programável com atividade de nuclease estão detalhadas abaixo na seção (I) (b) (i).
[038] Em outras modalidades, o domínio de modificação da proteína de modificação de DNA programável tem atividade de não nuclease (por exemplo, atividade de modificação epigenética ou atividade de regulação transcricional) tal que a proteína de modificação de DNA programável modifica a estrutura e/ou atividade do DNA e/ou proteína (s) associada (s) ao DNA. Assim, a proteína de modificação de DNA programável pode compreender um domínio de ligação a DNA programável ligado a um domínio não nuclease ligado. Tais proteínas são detalhadas abaixo na seção (I) (b) (ii).
[039] As proteínas de modificação de DNA programável podem compreender domínios de ligação e/ou modificação de DNA de tipo selvagem ou ocorrência natural, versões modificadas de domínios de ligação e/ou modificação de ocorrência natural, domínios de ligação e/ou modificação de DNA sintético ou artificial, e combinações dos mesmos. (i) Proteínas de Modificação de DNA Programável com Atividade de Nuclease
[040] Exemplos de proteínas de modificação de DNA programável com atividade de nuclease incluem, sem limite, nucleases CRISPR, nucleases de dedo de zinco, nucleases de efetores do tipo ativador de transcrição, meganucleases, e domínios de nuclease ligados a domínios programáveis de ligação a DNA.
[041] Nucleases CRISPR. A CRISPR nuclease pode ser derivada de uma proteína CRISPR do tipo I, tipo II (isto é, Cas9), tipo III, tipo V (isto é, Cpf1) ou tipo VI (isto é, Cas13), que está presente em várias bactérias e arquéias. Em outras modalidades, a CRISPR nuclease pode ser derivada de um sistema CRISPR archaeal, um sistema CRISPR/CasX ou um sistema CRISPR/CasY (Burstein et al., Nature, 2017, 542 (7640): 237-241). Em várias modalidades, a CRISPR nuclease pode ser de Streptococcus sp. (por exemplo, S. pyogenes, S. thermophilus, S. pasteurianus), Campylobacter sp. (por exemplo, Campylobacter jejuni), Francisella sp. (por exemplo, Francisella novicida), Acaryochloris sp., Acetohalobium sp., Acidaminococcus sp., Acidithiobacillus sp., Alicyclobacillus sp., Allochromatium sp., Ammonifex sp., Anabaena sp., Arthrospira sp., Bacillus sp., Burkholderiales sp., Caldicelulosiruptor sp., Candidatus sp., Clostridium sp., Crocosphaera sp., Cyanothece sp., Exiguobacterium sp., Finegoldia sp., Ktedonobacter sp., Lachnospiraceae sp., Lactobacillus sp., Lyngbya sp., Marinobacter sp., Methanohalobium sp., Microscilla sp., Microcoleus sp., Microcystis sp., Natranaerobius sp., Neisseria sp., Nitrosococcus sp., Nocardiopsis sp., Nodularia sp., Nostoc sp., Oscillatoria sp., Polaromonas sp., Pelotomaculum sp., Pseudoalteromonas sp., Petrotoga sp., Prevotella sp., Staphylococcus sp., Streptomyces sp., Streptosporangium sp., Synechococcus sp., Thermosipho sp., ou Verrucomicrobia sp.
[042] A CRISPR nuclease pode ser uma proteína do tipo selvagem ou de ocorrência natural. Alternativamente, a CRISPR nuclease pode ser projetada para ter especificidade aprimorada, especificidade PAM alterada, diminuição de efeitos fora do alvo, aumento da estabilidade e similares.
[043] Em algumas modalidades, a CRISPR nuclease pode ser uma proteína CRISPR/Cas 9 do tipo II. Por exemplo, a CRISPR nuclease pode ser Streptococcus pyogenes Cas9 (SpCas9), Streptococcus thermophilus Cas9 (StCas9), Streptococcus pasteurianus (SpaCas9), Campylobacter jejuni Cas9 (CjCas9), Staphylococcus aureus (SaCas9), Francisella novicida Cas9 (FnCas9), Neisseria cinerea Cas9 (NcCas9), ou Neisseria meningitis Cas9 (NmCas9). Em outras modalidades, a CRISPR nuclease pode ser uma proteína CRISPR/Cpf1 tipo V, por exemplo, Francisella novicida Cpf1 (FnCpf1), Acidaminococcus sp. Cpf1 (AsCpf1), ou Lachnospiraceae bacterium ND2006 Cpf1 (LbCpf1). Em modalidades adicionais, a CRISPR nuclease pode ser uma proteína CRISPR/Cas13 do tipo VI, por exemplo, Leptotrichia wadei Cas13a (LwaCas13a) ou Leptotrichia shahii Cas13a (LshCas13a).
[044] Em geral, a CRISPR nuclease compreende pelo menos um domínio nuclease com atividade de endonuclease. Por exemplo, uma Cas9 nuclease compreende um domínio HNH, que cliva o filamento complementar de RNA guia, e um domínio RuvC, que cliva o filamento não complementar, uma proteína Cpf1 compreende um domínio RuvC e um domínio NUC, e uma nuclease Cas13a compreende dois Domínios HNEPN. Em algumas modalidades, ambos os domínios de nuclease são ativos e a CRISPR nuclease tem atividade de clivagem de filamento duplo (isto é, cliva ambos os filamentos de uma sequência de ácido nucleico de filamento duplo). Em outras modalidades, um dos domínios da nuclease é inativado por uma ou mais mutações e/ou deleções, e a variante CRISPR é uma nickase que cliva uma cadeia de uma sequência de ácido nucleico de filamento duplo. Por exemplo, uma ou mais mutações no domínio RuvC da proteína Cas9 (por exemplo, D10A, D8A, E762A e/ou D986A) resultam em uma HNH nickase que corta a cadeia complementar de RNA guia; e uma ou mais mutações no domínio HNH da proteína Cas9 (por exemplo, H840A, H559A, N854A,
N856A e/ou N863A) resultam em uma RuvC nickase que corta o filamento não complementar do RNA guia. Mutações comparáveis podem converter Cpf1 e Cas13a nucleases em nickases.
[045] Nucleases de dedo de zinco. Ainda em outras modalidades, a proteína de modificação de DNA programável com atividade de nuclease pode ser um par de nucleases de dedo de zinco (ZFN). Um ZFN compreende uma região de dedo de zinco de ligação ao DNA e um domínio nuclease. A região do dedo de zinco pode compreender de cerca de dois a sete dedos de zinco, por exemplo, cerca de quatro a seis dedos de zinco, em que cada dedo de zinco liga três pares de bases consecutivos. A região do dedo de zinco pode ser projetada para reconhecer e se ligar a qualquer sequência de DNA. As ferramentas ou algoritmos de design do dedo de zinco estão disponíveis na Internet ou em fontes comerciais. Os dedos de zinco podem ser ligados usando sequências de ligação adequadas.
[046] Um ZFN também compreende um domínio nuclease, que pode ser obtido a partir de qualquer endonuclease ou exonuclease. Exemplos não limitativos de endonucleases a partir dos quais um domínio nuclease pode ser derivado incluem, mas não estão limitados a, endonucleases de restrição e endonucleases de retorno. Em algumas modalidades, o domínio da nuclease pode ser derivado de uma endonuclease de restrição do tipo II-S. As endonucleases do tipo II-S clivam o DNA em sítios que estão tipicamente a vários pares de bases de distância do sítio de reconhecimento / ligação e, como tal, têm domínios de ligação e clivagem separáveis. Essas enzimas geralmente são monômeros que se associam transitoriamente para formar dímeros para clivar cada filamento de DNA em locais escalonados. Exemplos não limitativos de endonucleases do tipo II-S adequadas incluem BfiI, BpmI, BsaI, BsgI, BsmBI, BsmI, BspMI, FokI, MboII e SapI. Em algumas modalidades, o domínio nuclease pode ser um domínio nuclease FokI ou um derivado do mesmo. O domínio nuclease do tipo II-S pode ser modificado para facilitar a dimerização de dois domínios de nuclease diferentes. Por exemplo, o domínio de clivagem de FokI pode ser modificado através da mutação de certos resíduos de aminoácidos. A título de exemplo não limitativo, resíduos de aminoácidos nas posições 446, 447, 479, 483, 484, 486, 487, 490, 491, 496, 498, 499, 500, 531, 534, 537 e 538 dos domínios de nuclease FokI são alvos para modificação. Em modalidades específicas, o domínio nuclease FokI pode compreender um primeiro meio domínio FokI compreendendo mutações Q486E, I499L e/ou N496D e um segundo meio domínio FokI compreendendo mutações E490K, I538K e/ou H537R. Em algumas modalidades, o ZFN tem atividade de clivagem de filamento duplo. Em outras modalidades, o ZFN tem atividade de nickase (isto é, um dos domínios da nuclease foi inativado).
[047] Nucleases de efetores do Tipo Ativadores de Transcrição. Em modalidades alternativas, a proteína de modificação de DNA programável com atividade de nuclease pode ser uma nuclease de efetor do tipo ativador de transcrição (TALEN). TALENs compreendem um domínio de ligação ao DNA composto por repetições altamente conservadas derivadas de efetores do tipo ativador de transcrição (TALEs) que estão ligados a um domínio nuclease. TALEs são proteínas secretadas pelo patógeno vegetal Xanthomonas para alterar a transcrição de genes nas células vegetais hospedeiras. As matrizes de repetição TALE podem ser projetadas através do projeto de proteína modular para atingir qualquer sequência de DNA de interesse. O domínio nuclease de TALENs pode ser qualquer domínio nuclease, como descrito acima na subseção que descreve ZFNs. Em modalidades específicas, o domínio da nuclease é derivado de FokI (Sanjana et al., 2012, Nat Protoc, 7 (1): 171-192). O TALEN pode ter atividade de clivagem de filamento duplo ou atividade de nickase.
[048] Meganucleases ou Endonucleases de Corte Raro. Em ainda outras modalidades, a proteína de modificação de DNA programável com atividade de nuclease pode ser uma meganuclease ou derivada da mesma. Meganucleases são endodeoxirribonucleases caracterizadas por longas sequências de reconhecimento, isto é, a sequência de reconhecimento geralmente varia de cerca de 12 pares de bases a cerca de 45 pares de bases. Como consequência desse requisito, a sequência de reconhecimento geralmente ocorre apenas uma vez em um determinado genoma. Entre as meganucleases, a família de endonucleases locais denominada LAGLIDADG se tornou uma ferramenta valiosa para o estudo de genomas e engenharia de genomas. Em algumas modalidades, a meganuclease pode ser I-SceI, I-TevI ou variantes dos mesmos. Uma meganuclease pode ser direcionada para uma sequência cromossômica específica modificando sua sequência de reconhecimento usando técnicas bem conhecidas dos especialistas na técnica. Em modalidades alternativas, a proteína de modificação de DNA programável tendo atividade de nuclease pode ser uma endonuclease de corte raro ou seu derivado. Endonucleases de corte raro são endonucleases específicas de sítio cuja sequência de reconhecimento ocorre raramente em um genoma, preferivelmente apenas uma vez em um genoma. A endonuclease de corte raro pode reconhecer uma sequência de 7 nucleotídeos, uma sequência de 8 nucleotídeos ou uma sequência de reconhecimento mais longa. Exemplos não limitativos de endonucleases de corte raro incluem NotI, AscI, PacI, AsiSI, SbfI e FseI.
[049] Domínios de Ligação a DNA programável ligados a domínios de nuclease. Em modalidades ainda adicionais, a proteína de modificação de DNA programável com atividade de nuclease pode ser uma proteína quimérica compreendendo um domínio de ligação ao DNA programável ligado a um domínio nuclease. O domínio nuclease pode ser qualquer um dos descritos acima na subseção que descreve ZFNs (por exemplo, o domínio nuclease pode ser um domínio nuclease FokI), um domínio nuclease derivado de uma CRISPR nuclease (por exemplo, domínios nuclease RuvC ou HNH de Cas9), ou um domínio nuclease derivado de uma meganuclease ou endonuclease de corte raro.
[050] O domínio de ligação a DNA programável da proteína quimérica pode ser qualquer proteína de ligação a DNA programável, tal como, por exemplo, uma proteína de dedo de zinco ou um efetor do tipo ativador de transcrição. Alternativamente, o domínio de ligação ao DNA programável pode ser uma proteína CRISPR cataliticamente inativa (morta) que foi modificada por deleção ou mutação para não possuir toda a atividade de nuclease. Por exemplo, a proteína CRISPR cataliticamente inativa pode ser uma Cas9 (dCas9) cataliticamente inativa na qual o domínio RuvC compreende uma mutação D10A, D8A, E762A e/ou D986A e o domínio HNH compreende uma H840A, H559A, N854A, Mutação N865A e/ou N863A. Alternativamente, a proteína CRISPR cataliticamente inativa pode ser uma proteína Cpf1 cataliticamente inativa (morta) compreendendo mutações comparáveis nos domínios da nuclease. Em ainda outras modalidades, o domínio de ligação ao DNA programável pode ser uma meganuclease cataliticamente inativa na qual a atividade da nuclease foi eliminada por mutação e/ou exclusão, por exemplo, a meganuclease cataliticamente inativa pode compreender um truncamento C-terminal. (ii) Proteínas de Modificação de DNA Programável com Atividade Não Nuclease
[051] Em modalidades alternativas, a proteína de modificação de DNA programável pode ser uma proteína quimérica que compreende um domínio de ligação a DNA programável ligado a um domínio de não nuclease. O domínio de ligação ao DNA programável pode ser uma proteína de dedo de zinco, um efetor do tipo ativador de transcrição,
uma proteína CRISPR cataliticamente inativa (morta) ou uma meganuclease cataliticamente inativa (morta). Por exemplo, a proteína CRISPR cataliticamente inativa pode ser uma Cas9 (dCas9) cataliticamente inativa na qual o domínio RuvC compreende uma mutação D10A, D8A, E762A e/ou D986A e o domínio HNH compreende uma mutação H840A, H559A, N854A, N865A e/ou N863A. Alternativamente, a proteína CRISPR cataliticamente inativa pode ser uma proteína Cpf1 cataliticamente inativa (morta) compreendendo mutações comparáveis nos domínios da nuclease.
[052] Em algumas modalidades, o domínio não nuclease da proteína quimérica pode ser um domínio de modificação epigenética, que altera a estrutura do DNA ou da cromatina (e pode ou não alterar a sequência do DNA). Exemplos não limitativos de domínios de modificação epigenética adequados incluem aqueles com atividade de DNA metiltransferase (por exemplo, citosina metiltransferase), atividade de DNA desmetilase, desaminação de DNA (por exemplo, citosina desaminase, adenosina desaminase, guanina desaminase), aminação de DNA, atividade de oxidação de DNA, atividade DNA helicase, atividade de histona acetiltransferase (HAT) (por exemplo, domínio HAT derivado da proteína de ligação a E1A p300), atividade de histona desacetilase, atividade de histona metiltransferase, atividade de histona desmetilase, atividade de histona quinase, atividade de histona fosfatase, atividade de histona ubiquitina ligase, atividade histona desubiquitina, atividade de adenilação de histona, atividade de mortenilação de histona, atividade de SUMOilação de histona, atividade de deSUMOilação de histonas, atividade de ribosilação de histona, atividade de derribosilação de histona, atividade de miristoilação de histona, atividade de desmististoilação de histona, atividade de citrulinação de histona, atividade de alquilação de histona, atividade de desalquilação de histona, ou uma atividade de oxidação. Em modalidades específicas, o domínio de modificação epigenética pode compreender a atividade da citidina desaminase, atividade de histona acetiltransferase ou atividade de DNA metiltransferase.
[053] Em outras modalidades, o domínio de modificação não nuclease da proteína quimérica pode ser um domínio de ativação transcricional ou domínio repressor transcricional. Os domínios de ativação transcricional adequados incluem, sem limite, o domínio VP16 do vírus herpes simplex, VP64 (que é um derivado tetramérico de VP16), VP160, domínios de ativação de p65 NFκB, domínios de ativação de p53 1 e 2, domínios de ativação de CRE (proteína de ligação ao elemento de resposta cAMP), domínios de ativação de E2A, domínio de ativação do fator de choque térmico humano 1 (HSF1) ou domínios de ativação NFAT (fator nuclear de células T ativadas). Exemplos não limitativos de domínios repressores transcricionais adequados incluem domínios indutíveis de repressores precoces de cAMP (ICER), domínios de repressores de box associados a Kruppel (KRAB), domínios de repressores ricos em glicina YY1, repressores do tipo Sp1, repressores E(spl), repressores IκB ou repressor da proteína 2 de ligação a metil- CpG (MeCP2). Os domínios de ativação transcricional ou repressor transcricional podem ser geneticamente fundidos à proteína de ligação ao DNA ou ligados via interações proteína-proteína não covalente, proteína-RNA ou proteína-DNA.
[054] Em modalidades particulares, o domínio não nuclease da proteína quimérica pode compreender a atividade da citidina desaminase, a atividade de histona acetiltransferase, a atividade de ativação transcricional ou a atividade de repressão da transcrição.
[055] Em algumas modalidades, a proteína quimérica com atividade de não nuclease pode adicionalmente compreender pelo menos um marcador detectável. O rótulo detectável pode ser um fluoróforo (por exemplo, FAM, TMR, Cy3, Cy5, Texas Red, Oregon
Green, Alexa Fluors, etiquetas Halo ou corante fluorescente adequado), uma etiqueta de detecção (por exemplo, biotina, digoxigenina e similares), pontos quânticos ou partículas de ouro. c) Ligações
[056] As proteínas de fusão aqui divulgadas compreendem pelo menos um domínio de proteína de interação com nucleossomo ligado a uma proteína de modificação de DNA programável. A ligação entre o pelo menos um domínio de proteína de interação com nucleossomo e a proteína de modificação de DNA programável pode ser direta via uma ligação química, ou a ligação pode ser indireta via um ligante.
[057] Em algumas modalidades, o pelo menos um domínio de proteína de interação com nucleossomo pode ser ligado diretamente à proteína de modificação de DNA programável por uma ligação covalente (por exemplo, ligação peptídica, ligação éster e similares). Alternativamente, a ligação química pode ser não covalente (por exemplo, iônica, eletrostática, hidrogênio, hidrofóbica, interações de Van der ou efeitos π).
[058] Em outras modalidades, o pelo menos um domínio de proteína de interação com nucleossomo pode ser ligado à proteína de modificação de DNA programável por um ligante. Um ligante é um grupo químico que conecta um ou mais outros grupos químicos através de pelo menos uma ligação covalente. Os ligantes adequados incluem aminoácidos, peptídeos, nucleotídeos, ácidos nucleicos, moléculas orgânicas de ligantes (por exemplo, derivados de maleimida, N- etoxibenzilimidazol, ácido bifenil-3,4′,5-tricarboxílico, p- aminobenziloxicarbonila e semelhantes), ligantes dissulfeto, e ligantes de polímero (por exemplo, PEG). O ligante pode incluir um ou mais grupos espaçadores, incluindo, entre outros, alquileno, alquenileno, alquinileno, alquila, alquenila, alquinila, alcóxi, arila, heteroarila, aralquila, aralquenila, aralquinila e similares. O ligante pode ser neutro,
ou carregar uma carga positiva ou negativa. Além disso, o ligante pode ser clivável de modo que a ligação covalente do ligante que conecta o ligante a outro grupo químico possa ser quebrada ou clivada sob certas condições, incluindo pH, temperatura, concentração de sal, luz, um catalisador ou uma enzima.
[059] Ainda em outras modalidades, o pelo menos um domínio de proteína de interação com nucleossomo pode ser ligado à proteína de modificação de DNA programável por ligantes peptídicos. O ligante peptídico pode ser um ligante de aminoácido flexível (por exemplo, compreendendo aminoácidos pequenos, não polares ou polares). Exemplos não limitativos de ligantes flexíveis incluem LEGGGS (SEQ ID NO:1), TGSG (SEQ ID NO:2), GGSGGGSG (SEQ ID NO:3), (GGGGS)1-4 (SEQ ID NO:4), e (Gly)6-8 (SEQ ID NO:5). Alternativamente, o ligante peptídico pode ser um ligante rígido de aminoácidos. Esses ligantes incluem (EAAAK)1-4 (SEQ ID NO: 6), A(EAAAK)2-5A (SEQ ID NO: 7), PAPAP (SEQ ID NO: 8) e (AP)6-8 (SEQ ID NO: 9). Exemplos de ligantes adequados são bem conhecidos na técnica e programas para projetar ligantes estão prontamente disponíveis (Crasto et al., Protein Eng., 2000, 13 (5): 309-312).
[060] O pelo menos um domínio de proteína de interação com nucleossomo pode ser ligado ao terminal N, ao terminal C, e/ou a um local interno da proteína de modificação de DNA programável. Em algumas modalidades, pelo menos um domínio de proteína de interação com nucleossomo pode ser ligado ao terminal N da proteína de modificação de DNA programável. Em outras modalidades, o pelo menos um domínio de proteína de interação com nucleossomo pode ser ligado ao terminal C da proteína de modificação de DNA programável. Em ainda outras modalidades, pelo menos um domínio de proteína de interação com nucleossomo pode ser ligado ao terminal N e pelo menos um domínio de proteína de interação com nucleossomo pode ser ligado ao terminal C da proteína de modificação de DNA programável.
[061] Em algumas modalidades, a proteína de fusão pode compreender um domínio de proteína de interação com nucleossomo. Em outras modalidades, a proteína de fusão pode compreender dois domínios de proteína de interação com nucleossomo. Ainda em outras modalidades, a proteína de fusão pode compreender três domínios de proteína de interação com nucleossomo. Em modalidades adicionais, a proteína de fusão pode compreender quatro, cinco ou mais de cinco domínios de proteína de interação com nucleossomo. Os um ou mais domínios de proteína de interação com nucleossomo podem ser os mesmos ou podem ser diferentes.
[062] Nas modalidades em que a proteína de fusão compreende dois ou mais domínios de proteína de interação com nucleossomo, os dois ou mais domínios de interação de nucleossomos podem ser ligados a uma das extremidades, ambas as extremidades e/ou a uma localização interna da proteína de modificação de DNA programável. Os dois ou mais domínios de proteína de interação com nucleossomo podem ser os mesmos ou podem ser diferentes. Por exemplo, o complexo pode compreender pelo menos dois domínios de ligação ao DNA de HMG, pelo menos duas proteínas HMGN, pelo menos um domínio de ligação ao DNA de HMG e pelo menos uma proteína HMGN, pelo menos um domínio de ligação ao DNA de HMG ou proteína HMGN e em pelo menos um domínio central de uma variante de histona H1, pelo menos um domínio de ligação ao DNA de HMG ou proteína HMGN e pelo menos um domínio de uma proteína do complexo de remodelação de cromatina, pelo menos um domínio de ligação ao DNA de HMG ou proteína HMGN, pelo menos um domínio central de variante de histona H1 e pelo menos um domínio de uma proteína complexa de remodelação de cromatina e semelhantes. (d) Sinal de Localização Nuclear Opcional, domínio de Penetração de Células e/ou Domínio de Marcador
[063] As proteínas de fusão aqui divulgadas podem compreender ainda pelo menos um sinal de localização nuclear, domínio de penetração de células e/ou domínio de marcador.
[064] Exemplos não limitativos de sinais de localização nuclear incluem PKKKRKV (SEQ ID NO:10), PKKKRRV (SEQ ID NO:11), KRPAATKKAGQAKKKK (SEQ ID NO:12), YGRKKRRQRRR (SEQ ID NO:13), RKKRRQRRR (SEQ ID NO:14), PAAKRVKLD (SEQ ID NO:15), RQRRNELKRSP (SEQ ID NO:16), VSRKRPRP (SEQ ID NO:17), PPKKARED (SEQ ID NO:18), PQPKKKPL (SEQ ID NO:19), SALIKKKKKMAP (SEQ ID NO:20), PKQKKRK (SEQ ID NO:21), RKLKKKIKKL (SEQ ID NO:22), REKKKFLKRR (SEQ ID NO:23), KRKGDEVDGVDEVAKKKSKK (SEQ ID NO:24), RKCLQAGMNLEARKTKK (SEQ ID NO:25), NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY (SEQ ID NO:26), e RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV (SEQ ID NO:27).
[065] Exemplos de domínios de penetração de células adequados incluem, sem limite, GRKKRRQRRRPPQPKKKRKV (SEQ ID NO:28), PLSSIFSRIGDPPKKKRKV (SEQ ID NO:29), GALFLGWLGAAGSTMGAPKKKRKV (SEQ ID NO:30), GALFLGFLGAAGSTMGAWSQPKKKRKV (SEQ ID NO:31), KETWWETWWTEWSQPKKKRKV (SEQ ID NO:32), YARAAARQARA (SEQ ID NO:33), THRLPRRRRRR (SEQ ID NO:34), GGRRARRRRRR (SEQ ID NO:35), RRQRRTSKLMKR (SEQ ID NO:36), GWTLNSAGYLLGKINLKALAALAKKIL (SEQ ID NO:37), KALAWEAKLAKALAKALAKHLAKALAKALKCEA (SEQ ID NO:38), e RQIKIWFQNRRMKWKK (SEQ ID NO:39).
[066] Os domínios de marcadores incluem proteínas fluorescentes e etiquetas de purificação ou epítopo. As proteínas fluorescentes adequadas incluem, sem limite, proteínas verdes fluorescentes (por exemplo, GFP, eGFP, GFP-2, tagGFP, turboGFP, Esmeralda, Verde Azami, Verde Azami Monomérico, CopGFP, AceGFP, ZsGreen1), proteínas fluorescentes amarelas (por exemplo, YFP, EYFP, Citrino, Vênus, YPet, PhiYFP, ZsYellow1), proteínas fluorescentes azuis (por exemplo, BFP, EBFP, EBFP2, Azurita, mKalama1, GFPuv, safira, safira-T), proteínas fluorescentes de ciano (por exemplo, ECFP, cerúleo, CyPet, AmCyan1, Midoriishi-Cyan), proteínas fluorescentes vermelhas (por exemplo, mKate, mKate2, mPlum, monômero DsRed, mCherry, mRFP1, DsRed-Express, DsRed2, DsRed-monômero, HcRed-Tandem, HcRed1, AsRed2, mqFP6, eqFberry6 Jred) e proteínas fluorescentes alaranjadas (por exemplo, mOrange, mKO, Kusabira- Orange, Komabira-Monomeric-Orange, mTangerin, tdTomato). Exemplos não limitativos de etiquetas de purificação ou epítopo adequados incluem 6xHis, FLAG®, HA, GST, Myc e similares.
[067] O pelo menos um sinal de localização nuclear, domínio de penetração celular e/ou domínio marcador pode estar localizado no terminal N, no terminal C e/ou em um local interno da proteína de fusão. (e) Proteínas de Fusão Específicas
[068] Em geral, o pelo menos um domínio de proteína de interação com nucleossomo da proteína de fusão é escolhido no domínio de box A de HMGB1, proteína HMGN1, proteína HMGN2, proteína HMGN3a, proteína HMGN3b, domínio globular central de histona H1, domínio de ligação ao DNA de proteína de imitação (ISWI), domínio de ligação ao DNA da proteína 1 de cromodomaina-helicase-DNA (CHD1) ou combinações dos mesmos.
[069] Em modalidades específicas, a proteína de modificação de DNA programável da proteína de fusão é uma proteína CRISPR. Por exemplo, a proteína CRISPR pode ser Streptococcus pyogenes Cas9
(SpCas9), Streptococcus thermophilus Cas9 (StCas9), Streptococcus pasteurianus (SpaCas9), Campylobacter jejuni Cas9 (CjCas9), Staphylococcus aureus (SaCas9), Francisella novicida Cas9 (FnCas9), Neisseria cinerea Cas9 (NcCas9), Neisseria meningite Cas9 (NmCas9), Francisella novicida Acpf1. Cpf1 (AsCpf1), ou bactéria Lachnospiraceae ND2006 Cpf1 (LbCpf1).
[070] Em algumas modalidades, a proteína de fusão tem uma sequência de aminoácidos tendo pelo menos cerca de 80% de identidade de sequência com qualquer uma das SEQ ID NOS: 61-79. Em geral, qualquer substituição de aminoácido é conservadora, isto é, limitada a trocas dentro dos membros do grupo 1: glicina, alanina, valina, leucina e isoleucina; grupo 2: serina, cisteína, treonina e metionina; grupo 3: prolina; grupo 4: fenilalanina, tirosina e triptofano; e grupo 5: aspartato, glutamato, asparagina e glutamina. Em várias modalidades, a sequência de aminoácidos da proteína de fusão tem pelo menos cerca de 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, Identidade de sequência de 93%, 94%, 95%, 96%, 97%, 98 ou 99% com qualquer uma das SEQ ID NOS: 61-79. Em algumas modalidades, a proteína de fusão tem uma sequência de aminoácidos conforme estabelecido na SEQ ID NO: 61, SEQ ID NO: 62, SEQ ID NO: 63, SEQ ID NO: 64, SEQ ID NO: 64, SEQ ID NO: 65, SEQ ID NO: 66, SEQ ID NO: 67, SEQ ID NO: 68, SEQ ID NO: 69, SEQ ID NO: 70, SEQ ID NO: 71, SEQ ID NO: 72, SEQ ID NO: 73, SEQ ID NO: 74, SEQ ID NO: 75, SEQ ID NO: 76, SEQ ID NO: 77, SEQ ID NO: 78 ou SEQ ID NO: 79. (II) Complexos
[071] Outro aspecto da presente descrição abrange complexos compreendendo pelo menos um sistema CRISPR (isto é, proteína CRISPR e RNA guia) e pelo menos um domínio de proteína de interação com nucleossomo. Em algumas modalidades, o pelo menos um domínio de proteína de interação com nucleossomo pode ser ligado à proteína CRISPR do sistema CRISPR (isto é, o complexo compreende uma proteína de fusão CRISPR como descrito na seção (I) acima). Em outras modalidades, o pelo menos um domínio de proteína de interação com nucleossomo pode ser ligado ao RNA guia do sistema CRISPR. A ligação pode ser direta ou indireta, essencialmente como descrito acima na seção (I) (c). Por exemplo, um domínio de proteína de interação com nucleossomo pode ser ligado a uma proteína de ligação ao aptâmero de RNA, e o RNA guia pode compreender sequências de aptâmero, de modo que a ligação da proteína de ligação ao aptâmero de RNA à sequência de aptâmero do RNA liga o domínio de proteína de interação com nucleossomo ao RNA guia.
[072] Os domínios de proteína de interação com nucleossomo são descritos acima na seção (I) (a), e as proteínas CRISPR são detalhadas acima na seção (I) (b). A proteína CRISPR pode ter atividade nuclease ou nickase (por exemplo, pode ser um tipo II de CRISPR/Cas9, tipo V de CRISPR/Cpf1 ou tipo VI de CRISPR/Cas13). Por exemplo, um complexo pode compreender uma CRISPR nuclease ou um complexo pode compreender duas nickases CRISPR. Alternativamente, a proteína CRISPR pode ser modificada para não possuir toda a atividade de nuclease e ligada a domínios não nuclease (por exemplo, domínios com atividade de citosina desaminase, atividade de histona acetiltransferase, atividade de ativação transcricional ou atividade de repressão transcricional). Em algumas modalidades, o domínio não nuclease também pode ser ligado a uma proteína de ligação ao RNA de aptâmero.
[073] Um RNA guia compreende (i) um RNA CRISPR (crRNA) que contém uma sequência guia na extremidade 5' que hibridiza com uma sequência alvo e (ii) uma sequência de transação de crRNA (tracrRNA) que interage com a proteína CRISPR. A sequência guia do crRNA de cada RNA guia é diferente (isto é, é específica da sequência). A sequência de tracrRNA é geralmente a mesma nos RNAs guia projetados para se complexarem com uma proteína CRISPR de uma espécie bacteriana específica.
[074] A sequência guia do crRNA é projetada para hibridizar com uma sequência alvo (isto é, protospacer) que é delimitada por um motivo adjacente ao protospacer (PAM) em uma sequência de filamento duplo. As sequências PAM para proteínas Cas9 incluem 5'-NGG, 5'-NGGNG, 5'-NNAGAAW e 5'-ACAY, e as sequências PAM para Cpf1 incluem 5'- TTN (em que N é definido como qualquer nucleotídeo, W é definido como A ou T, e Y é definido C ou T). Em geral, a complementaridade entre a sequência guia do crRNA e a sequência alvo é de pelo menos 80%, pelo menos 85%, pelo menos 90%, pelo menos 95% ou pelo menos 99%. Em modalidades específicas, a complementaridade é completa (isto é, 100%). Em várias modalidades, o comprimento da sequência guia do crRNA pode variar de cerca de 15 nucleotídeos a cerca de 25 nucleotídeos. Por exemplo, a sequência guia do crRNA pode ter cerca de 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 ou 25 nucleotídeos de comprimento. Em modalidades específicas, o crRNA pode ter cerca de 19, 20, 21 ou 22 nucleotídeos de comprimento.
[075] O crRNA e o tracrRNA compreendem sequências repetidas que formam uma ou mais estruturas de loop de haste, que podem interagir com a proteína CRISPR. O comprimento de cada loop e haste pode variar. Por exemplo, os um ou mais loops podem variar de cerca de 3 a cerca de 10 nucleotídeos de comprimento, e uma ou mais hastes podem variar de cerca de 6 a cerca de 20 pares de bases de comprimento. As uma ou mais hastes podem compreender um ou mais protuberâncias de 1 a cerca de 10 nucleotídeos.
[076] O crRNA pode variar em comprimento de cerca de 25 nucleotídeos a cerca de 100 nucleotídeos. Em várias modalidades, o crRNA pode variar em comprimento de cerca de 25 a cerca de 50 nucleotídeos, de cerca de 590 a cerca de 75 nucleotídeos ou de cerca de 75 a cerca de 100 nucleotídeos. O tracrRNA pode variar em comprimento de cerca de 50 nucleotídeos a cerca de 300 nucleotídeos. Em várias modalidades, o tracrRNA pode variar em comprimento de cerca de 50 a cerca de 90 nucleotídeos, de cerca de 90 a cerca de 110 nucleotídeos, de cerca de 110 a cerca de 130 nucleotídeos, de cerca de 130 a cerca de 150 nucleotídeos, de cerca de 150 a cerca de 170 nucleotídeos, de cerca de 170 a cerca de 200 nucleotídeos, de cerca de 200 a cerca de 250 nucleotídeos ou de cerca de 250 a cerca de 300 nucleotídeos.
[077] A sequência de tracrRNA no RNA guia geralmente é baseada na sequência de codificação do tracrRNA de tipo selvagem nas espécies bacterianas de interesse. Em algumas modalidades, a sequência de tracrRNA de tipo selvagem (ou a região de repetição constante de crRNA e a região 5' correspondente do tracrRNA que forma uma estrutura dúplex com a região de repetição constante de crRNA) pode ser modificada para facilitar a formação da estrutura secundária, aumento da estabilidade de estrutura secundária, facilitar a expressão em células eucarióticas, aumento da eficiência da edição e assim por diante. Por exemplo, uma ou mais alterações nucleotídicas podem ser introduzidas na sequência de RNA guia constante (vide Exemplo 8, abaixo).
[078] O RNA guia pode ser uma molécula única (isto é, um único RNA guia ou sgRNA), em que a sequência de crRNA está ligada à sequência de tracrRNA. Alternativamente, o RNA guia pode ser duas moléculas separadas. Uma primeira molécula compreendendo a sequência guia de crRNA na extremidade 5' e uma sequência adicional na extremidade 3' que é capaz de emparelhar a base com a extremidade 5’ de uma segunda molécula, em que a segunda molécula compreende a sequência 5' que é capaz de emparelhar a base com a extremidade 3' da primeira molécula, bem como a sequência adicional de tracrRNA. Em algumas modalidades, o RNA guia dos sistemas CRISPR/Cpf1 tipo V pode compreender apenas crRNA.
[079] Em algumas modalidades, as uma ou mais regiões de loop de haste do RNA guia podem ser modificadas para compreender uma ou mais sequências de aptâmeros (Konermann et al., Nature, 2015, 517 (7536): 583-588; Zalatan et al. Cell, 2015, 160 (1-2): 339-50). Exemplos de domínios de proteína de aptâmero de RNA adequados incluem proteína de revestimento MS2 (MCP), proteína de revestimento de bacteriófago PP7 (PCP), proteína Com de bacteriófago Mu, proteína N22 de bacteriófago lambda, proteína N22, proteína de ligação de loop estaminal (SLBP), proteína 1 relacionada à síndrome do retardo mental X frágil (FXR1), proteínas derivadas de bacteriófagos, como AP205, BZ13, f1, f2, fd, fr, ID2, JP34 / GA, JP501, JP34, JP500, KU1, M11, M12, MX1, NL95, PP7, ϕCb5, ϕCb8r, ϕCb12r, ϕCb23r, Qβ, R17, SP-β, TW18, TW19 e VK, seus fragmentos ou derivados. O comprimento da sequência de aptâmero adicional pode variar de cerca de 20 nucleotídeos a cerca de 200 nucleotídeos.
[080] O RNA guia pode compreender ribonucleotídeos padrão, ribonucleotídeos modificados (por exemplo, pseudouridina), isômeros de ribonucleotídeos e/ou análogos de ribonucleotídeos. Em algumas modalidades, o RNA guia pode adicionalmente compreender pelo menos um marcador detectável. O rótulo detectável pode ser um fluoróforo (por exemplo, FAM, TMR, Cy3, Cy5, Texas Red, Oregon Green, Alexa Fluors, etiquetas Halo ou corante fluorescente adequado), uma etiqueta de detecção (por exemplo, biotina, digoxigenina e similares), pontos quânticos ou partículas de ouro. Os especialistas na técnica estão familiarizados com o projeto e a construção de gRNA, por exemplo, as ferramentas de projeto de gRNA estão disponíveis na
Internet ou em fontes comerciais.
[081] O RNA guia pode ser sintetizado quimicamente, sintetizado enzimaticamente ou uma combinação dos mesmos. Por exemplo, o RNA guia pode ser sintetizado usando métodos padrão de síntese em fase sólida à base de fosforamidito. Alternativamente, o RNA guia pode ser sintetizado in vitro, ligando operacionalmente o DNA que codifica o RNA guia a uma sequência de controle de promotor que é reconhecida por uma polimerase de RNA de fago. Exemplos de sequências promotoras de fagos adequadas incluem sequências promotoras de T7, T3, SP6 ou variações das mesmas. Nas modalidades em que o RNA guia compreende duas moléculas separadas (isto é, crRNA e tracrRNA), o crRNA pode ser quimicamente sintetizado e o tracrRNA pode ser sintetizado enzimaticamente. (III) Ácidos Nucleicos
[082] Um outro aspecto da presente descrição fornece ácidos nucleicos que codificam as proteínas de fusão descritas acima na seção (I) e os complexos CRISPR descritos na seção (II). Os complexos CRISPR podem ser codificados por ácidos nucleicos únicos ou ácidos nucleicos múltiplos. Os ácidos nucleicos podem ser DNA ou RNA, lineares ou circulares, de filamento simples ou filamento duplo. O RNA ou DNA pode ser otimizado por códon para tradução eficiente em proteína na célula eucariótica de interesse. Os programas de otimização de códon estão disponíveis como freeware ou de fontes comerciais.
[083] Em algumas modalidades, o ácido nucleico que codifica a proteína de fusão ou os componentes proteicos do complexo CRISPR ou ele pode ser RNA. O RNA pode ser sintetizado enzimaticamente in vitro. Para isso, o DNA que codifica a proteína de interesse pode ser operacionalmente ligado a uma sequência promotora que é reconhecida por uma polimerase de RNA de fago para a síntese de RNA in vitro. Por exemplo, a sequência do promotor pode ser uma sequência do promotor
T7, T3 ou SP6 ou uma variação de uma sequência do promotor T7, T3 ou SP6. O DNA que codifica a proteína pode fazer parte de um vetor, conforme detalhado abaixo. Em tais modalidades, o RNA transcrito in vitro pode ser purificado, tapado e/ou poliadenilado. Em outras modalidades, o RNA que codifica a proteína de fusão ou o componente de proteína do complexo pode ser parte de um RNA autorreplicante (Yoshioka et al., Cell Stem Cell, 2013, 13: 246-254). O RNA autorreplicante pode ser derivado de um replicon de RNA do vírus da encefalite equina venezuelana não infecciosa e autorreplicante (VEE), que é um RNA de filamento simples de sentido positivo que é capaz de se autorreplicar para um número limitado de divisões celulares e que pode ser modificado para codificar proteínas de interesse (Yoshioka et al., Cell Stem Cell, 2013, 13: 246-254).
[084] Em outras modalidades, o ácido nucleico que codifica a proteína de fusão ou a proteína CRISPR e o RNA guia do complexo pode ser DNA. A sequência de codificação do DNA pode ser operacionalmente ligada a pelo menos uma sequência de controle do promotor para expressão na célula de interesse. Em certas modalidades, a sequência codificadora de DNA pode ser operacionalmente ligada a uma sequência promotora para expressão da proteína ou RNA em células bacterianas (por exemplo, E. coli) ou células eucarióticas (por exemplo, levedura, inseto ou mamífero). Promotores bacterianos adequados incluem, sem limite, promotores T7, promotores Iac operon, promotores trp, promotores tac (que são híbridos dos promotores trp e lac), variações de qualquer um dos anteriores, e combinações de qualquer dos anteriores. Exemplos não limitativos de promotores Pol II eucarióticos adequados incluem promotores constitutivos, regulados ou específicos de células ou tecidos. Sequências de controle de promotor constitutivo eucariótico adequado incluem, mas não estão limitadas a, promotor precoce imediato de citomegalovírus (CMV), promotor de vírus símio (SV40), promotor tardio principal de adenovírus, promotor de vírus de sarcoma de Rous (RSV), promotor de vírus de tumor mamário de rato (MMTV), promotor de fosfoglicerato quinase (PGK), promotor-alfa de fator de alongamento (ED1), promotores de ubiquitina, promotores de actina, promotores de tubulina, promotores de imunoglobulina, seus fragmentos ou combinações de qualquer um dos anteriores. Exemplos de sequências de controle de promotor reguladas por eucariotas adequadas incluem, sem limitação, as reguladas por choque térmico, metais, esteroides, antibióticos ou álcool. Exemplos não limitativos de promotores específicos de tecido incluem promotor B29, promotor CD14, promotor CD43, promotor CD45, promotor CD68, promotor de desmina, promotor de elastase-1, promotor de endoglina, promotor de fibronectina, promotor Flt-1, promotor GFAP, promotor GPIIb, promotor ICAM-2, promotor INF-p, promotor Mb, promotor NphsI, promotor OG- 2, promotor SP-B, promotor SYN1 e promotor WASP. A sequência do promotor pode ser do tipo selvagem ou pode ser modificada para expressão mais eficiente ou eficaz. Em algumas modalidades, a sequência de codificação de DNA também pode ser ligada a um sinal de poliadenilação (por exemplo, sinal SV40 poliA, sinal poliA do hormônio de crescimento bovino (BGH), etc.) e/ou pelo menos uma sequência de terminação transcricional. A sequência que codifica o RNA guia está operacionalmente ligada a uma sequência de controle do promotor Pol III para expressão em células eucarióticas. Exemplos de promotores Pol III adequados incluem, mas não estão limitados a, promotores de RNA U6, U3, H1 e 7SL de mamíferos. Em algumas situações, a proteína de fusão ou os componentes do complexo podem ser purificados a partir de células bacterianas ou eucarióticas.
[085] Em várias modalidades, o ácido nucleico que codifica a proteína de fusão ou a proteína CRISPR e o RNA guia do complexo pode estar presente em um vetor. Os vetores adequados incluem vetores plasmídicos, vetores virais e RNA autorreplicante (Yoshioka et al., Cell Stem Cell, 2013, 13: 246-254). Em algumas modalidades, o ácido nucleico que codifica a proteína de fusão ou os componentes do complexo pode estar presente em um vetor de plasmídeo. Exemplos não limitativos de vetores de plasmídeo adequados incluem pUC, pBR322, pET, pBluescript e variantes dos mesmos. Em outras modalidades, o ácido nucleico que codifica a proteína de fusão ou os componentes do complexo ou pode ser parte de um vetor viral (por exemplo, vetores lentivirais, vetores virais adenoassociados, vetores adenovirais e assim por diante). O plasmídeo ou vetor viral pode compreender sequências de controle de expressão adicionais (por exemplo, sequências potenciadoras, sequências Kozak, sequências de poliadenilação, sequências de terminação transcricionais, etc.), sequências marcadoras selecionáveis (por exemplo, genes de resistência a antibióticos), origens de replicação e similares. Informações adicionais sobre vetores e seu uso podem ser encontradas em "Current Protocols in Molecular Biology" Ausubel et al., John Wiley & Sons, Nova York, 2003 ou "Molecular Cloning: A Laboratory Manual" Sambrook & Russell, Cold Spring Harbor Press, Cold Spring Harbor, NY, 3ª edição, 2001. (IV) Kits
[086] Um outro aspecto da presente descrição fornece kits compreendendo pelo menos uma das proteínas de fusão detalhadas acima na seção (I), pelo menos um dos complexos CRISPR descritos acima na seção (II) e/ou pelo menos um dos ácidos nucleicos descritos acima na seção (III). Os kits podem adicionalmente compreender reagentes de transfecção, meio de crescimento celular, meio de seleção, reagentes de transcrição in vitro, reagentes de purificação de ácido nucleico, reagentes de purificação de proteínas, tampões e similares. Os kits aqui fornecidos geralmente incluem instruções para executar os métodos detalhados abaixo. As instruções incluídas nos kits podem ser afixadas no material da embalagem ou podem ser incluídas como uma bula. Embora as instruções sejam tipicamente materiais escritos ou impressos, elas não se limitam a isso. Qualquer meio capaz de armazenar essas instruções e comunicá-las a um usuário final é contemplado por esta descrição. Esses meios incluem, mas não estão limitadas a, meios de armazenamento eletrônico (por exemplo, discos magnéticos, fitas, cartuchos, chips), meios ópticos (por exemplo, CD ROM) e similares. Conforme usado aqui, o termo "instruções" pode incluir o endereço de um site da Internet que forneça as instruções. (V) Células
[087] A presente descrição também fornece células compreendendo pelo menos uma das proteínas de fusão detalhadas acima na seção (I), pelo menos um dos complexos CRISPR descritos acima na seção (II) e/ou pelo menos um dos ácidos nucleicos descritos acima na seção (III). Em geral, a célula é uma célula eucariótica. Por exemplo, a célula pode ser uma célula humana, uma célula de mamífero não humana, uma célula de vertebrado não mamífero, uma célula de invertebrado, uma célula de inseto, uma célula de planta, uma célula de levedura ou um organismo eucariótico de única célula. (VI) Métodos para Aumentar Eficiência de Genoma Alvo, Modificação Transcricional ou Epigenética
[088] Outro aspecto da presente descrição abrange métodos para aumentar a eficiência da modificação de genoma direcionada, modificação transcricional direcionada ou modificação epigenética direcionada em células eucarióticas, aumentando a acessibilidade de uma proteína de modificação de DNA programável à sua sequência alvo no DNA cromossômico. Em algumas modalidades, o método compreende introduzir na célula eucariótica de interesse pelo menos uma das proteínas de fusão descritas acima na seção (I), pelo menos um dos complexos CRISPR descritos acima na seção (II) ou ácido nucleico que codifica a em pelo menos uma proteína de fusão ou complexo CRISPR como descrito acima na seção (III) e, opcionalmente, um polinucleotídeo doador.
[089] A proteína de modificação de DNA programável da proteína de fusão é projetada para reconhecer e se ligar a uma sequência alvo no DNA cromossômico, e um ou mais domínios de proteína de interação com nucleossomo da proteína de fusão interagem com os nucleossomos na sequência alvo para alterar ou remodelar a estrutura nucleossômica e/ou cromatina. Como consequência, a proteína de modificação do DNA aumentou o acesso à sequência cromossômica alvo, de modo que a eficiência da modificação pela proteína de modificação do DNA foi aumentada. Em modalidades específicas, a proteína de fusão compreende pelo menos um domínio de proteína de interação com nucleossomo ligado a uma CRISPR nuclease, de modo que as interações entre o (s) domínio (s) da proteína que interagem com o nucleossomo e os nucleossomos / cromatina na ou perto da sequência alvo aumentam a eficiência das modificações genômicas direcionadas (vide exemplos 1-8).
[090] Assim, os métodos aqui divulgados podem aumentar a edição do genoma direcionado à eficiência (por exemplo, correções de genes, nocautes de genes, knock-ins de genes e similares), modificações epigenéticas direcionadas e regulação transcricional direcionada. (a) Introdução à Célula
[091] Como mencionado acima, o método compreende a introdução na célula de pelo menos uma proteína de fusão, pelo menos um complexo CRISPR ou ácido (s) nucleico (s) que codifica a referida proteína de fusão ou complexo CRISPR (e, opcionalmente, um polinucleotídeo doador). A pelo menos uma proteína de fusão, complexo CRISPR ou ácido nucleico podem ser introduzidos na célula de interesse por uma variedade de meios.
[092] Em algumas modalidades, a célula pode ser transfectada com as moléculas apropriadas (isto é, proteína, DNA e/ou RNA). Os métodos de transfecção adequados incluem nucleofecção (ou eletroporação), transfecção mediada por fosfato de cálcio, transfecção de polímero catiônico (por exemplo, DEAE-dextrano ou polietilenimina), transdução viral, transfecção de virossoma, transfecção de virion, transfecção de lipossomas, transfecção de lipossomas catiônicos, transfecção de imunolipossomos, lipídios não lipossômicos transfecção, transfecção de dendrímero, transfecção por choque térmico, magnetofecção, lipofecção, entrega por gene gun (injetor de gene), impalefecção, sonoporação, transfecção óptica e captação de ácidos nucleicos melhorada por agente proprietário. Os métodos de transfecção são bem conhecidos na técnica (vide, por exemplo, "Current Protocols in Molecular Biology" Ausubel et al., John Wiley & Sons, Nova York, 2003 ou "Molecular Cloning: A Laboratory Manual" Sambrook & Russell, Cold Spring Harbor Press, Cold Spring Harbor, NY, 3ª edição 2001). Em outras modalidades, as moléculas podem ser introduzidas na célula por microinjeção. Por exemplo, as moléculas podem ser injetadas no citoplasma ou núcleos das células de interesse. A quantidade de cada molécula introduzida na célula pode variar, mas os especialistas na técnica estão familiarizados com os meios para determinar a quantidade apropriada.
[093] As várias moléculas podem ser introduzidas na célula simultaneamente ou sequencialmente. Por exemplo, a proteína de fusão ou o complexo CRISPR (ou os ácidos nucleicos codificadores) e o polinucleotídeo doador podem ser introduzidos ao mesmo tempo. Alternativamente, um pode ser introduzido primeiro e depois o outro pode ser introduzido posteriormente na célula.
[094] Em geral, a célula é mantida em condições apropriadas para o crescimento e/ou manutenção das células. As condições adequadas de cultura de células são bem conhecidas na técnica e são descritas, por exemplo, em Santiago et al., Proc. Natl. Acad. Sci. USA, 2008, 105: 5809-5814; Moehle et al. Proc. Natl. Acad. Sci. USA, 2007, 104: 3055- 3060; Urnov et al., Nature, 2005, 435: 646-651; e Lombardo et al., Nat. Biotechnol., 2007, 25: 1298-1306. Os especialistas na técnica entendem que os métodos para cultivar células são conhecidos na técnica e podem e variarão dependendo do tipo de célula. A otimização de rotina pode ser usada, em todos os casos, para determinar as melhores técnicas para um tipo de célula específico. (b) Genoma Direcionado ou Modificação Epigenética
[095] Os um ou mais domínios de proteína de interação com nucleossomo da proteína de fusão ou do complexo CRISPR interage com nucleossomos e/ou DNA cromossômico na ou perto da sequência cromossômica alvo, de modo que a estrutura nucleossômica e/ou cromatina seja alterada / remodelada, aumentando assim a acessibilidade da proteína de modificação de DNA programável da proteína de fusão ou a proteína CRISPR do complexo CRISPR para a sequência cromossômica alvo. O aumento do acesso à sequência cromossômica alvo resulta em maior frequência / eficiência do genoma- alvo, modificação transcricional ou epigenética.
[096] Nas modalidades em que a proteína de fusão compreende uma proteína de modificação de DNA programável com atividade de nuclease, a proteína de fusão pode clivar uma ou ambas as cadeias da sequência cromossômica direcionada. As quebras de filamento duplo podem ser reparadas por um processo de reparo de união final não homóloga (NHEJ). Como o NHEJ é propenso a erros, indels (isto é, deleções ou inserções) de pelo menos um par de bases, substituições de pelo menos um par de bases ou combinações dos mesmos podem ocorrer durante o reparo da ruptura. Por conseguinte, a sequência cromossômica direcionada pode ser modificada, mutada ou inativada. Por exemplo, uma exclusão, inserção ou substituição no quadro de leitura de uma sequência de codificação pode levar a um produto proteico alterado ou a nenhum produto proteico (que é denominado "knock out"). Em algumas iterações, o método pode compreender ainda a introdução na célula de um polinucleotídeo doador (vide abaixo) compreendendo uma sequência doadora que é flanqueada por uma sequência que possui identidade substancial de sequência para sequências localizadas em ambos os lados da sequência cromossômica alvo, de modo que durante o reparo da quebra de filamento duplo por um processo de reparo dirigido por homologia (HDR), a sequência doadora no polinucleotídeo doador pode ser trocada ou integrada na sequência cromossômica na sequência cromossômica alvo. A integração de uma sequência exógena é denominada "knock in".
[097] Em várias iterações, portanto, a eficiência da modificação do genoma direcionado pode ser aumentada em pelo menos cerca de 0,1 vez, pelo menos cerca de 0,5 vez, pelo menos cerca de 1 vez, pelo menos cerca de 2 vezes, pelo menos cerca de 5 vezes, pelo menos cerca de 10 vezes, ou pelo menos cerca de 20 vezes, pelo menos cerca de 50 vezes, pelo menos cerca de 100 vezes ou mais do que cerca de 100 vezes em relação à proteína de modificação de DNA programável dos pais que não está ligado a pelo menos um domínio de proteína de interação com nucleossomo.
[098] Nas modalidades em que a proteína de fusão compreende uma proteína de modificação de DNA programável com atividade de não nuclease, a proteína de fusão pode modificar o DNA ou proteínas associadas na sequência cromossômica alvo ou modificar a expressão da sequência cromossômica alvo. Por exemplo, quando a proteína de modificação de DNA programável compreende atividade de modificação epigenética, o status de acetilação de histonas, metilação, fosforilação, adenilação, etc. pode ser modificado ou o status de metilação, aminação etc. do DNA pode ser modificado. Como um exemplo, em modalidades nas quais a proteína de modificação de DNA programável compreende a atividade da citidina-desaminase, um ou mais resíduos de citidina na sequência cromossômica alvo podem ser convertidos em resíduos de uridina. Alternativamente, quando a proteína de modificação de DNA programável compreende ativação transcricional ou atividade de repressão, a transcrição na sequência cromossômica alvo pode ser aumentada ou diminuída.
[099] A modificação epigenética resultante ou a regulação transcricional podem ser aumentadas em pelo menos cerca de 0,1 vez, pelo menos cerca de 0,5 vez, pelo menos cerca de 1 vez, pelo menos cerca de 2 vezes, pelo menos cerca de 5 vezes, em pelo menos cerca de 10 vezes ou pelo menos cerca de 20 vezes, pelo menos cerca de 50 vezes, pelo menos cerca de 100 vezes ou mais do que cerca de 100 vezes em relação à proteína de modificação de DNA programável dos pais que não está ligada a pelo menos um domínio de proteína de interação com nucleossomo.
[100] O genoma direcionado, as modificações epigenéticas transcricionais detalhadas acima podem ser realizadas isoladamente ou multiplexadas (isto é, duas ou mais sequências cromossômicas podem ser direcionadas simultaneamente). (c) Polinucleotídeo Doador Opcional
[101] Nas modalidades em que a proteína de fusão compreende uma proteína de modificação de DNA programável com atividade de nuclease, o método pode adicionalmente compreender a introdução de pelo menos um polinucleotídeo doador na célula. O polinucleotídeo doador pode ser de filamento simples ou duplo, linear ou circular e/ou RNA ou DNA. Em algumas modalidades, o polinucleotídeo doador pode ser um vetor, por exemplo, um vetor plasmídico.
[102] O polinucleotídeo doador compreende pelo menos uma sequência doadora. Em alguns aspectos, a sequência doadora do polinucleotídeo doador pode ser uma versão modificada de uma sequência cromossômica endógena ou nativa. Por exemplo, a sequência doadora pode ser essencialmente idêntica a uma porção da sequência cromossômica na ou próxima à sequência alvo da proteína de modificação do DNA, mas que compreende pelo menos uma alteração de nucleotídeo. Assim, após integração ou troca com a sequência nativa, a sequência no local cromossômico alvo compreende pelo menos uma alteração de nucleotídeo. Por exemplo, a alteração pode ser uma inserção de um ou mais nucleotídeos, uma exclusão de um ou mais nucleotídeos, uma substituição de um ou mais nucleotídeos ou combinações dos mesmos. Como consequência da integração "correção genética" da sequência modificada, a célula pode produzir um produto genético modificado a partir da sequência cromossômica direcionada.
[103] Em outros aspectos, a sequência doadora do polinucleotídeo doador pode ser uma sequência exógena. Como usado aqui, uma sequência "exógena" refere-se a uma sequência que não é nativa da célula ou a uma sequência cuja localização nativa está em um local diferente no genoma da célula. Por exemplo, a sequência exógena pode compreender a sequência de codificação da proteína, que pode ser operacionalmente ligada a uma sequência de controle do promotor exógeno, de modo que, após a integração no genoma, a célula seja capaz de expressar a proteína codificada pela sequência integrada. Alternativamente, a sequência exógena pode ser integrada na sequência cromossômica, de modo que sua expressão seja regulada por uma sequência de controle de promotor endógeno. Em outras iterações, a sequência exógena pode ser uma sequência de controle transcricional, outra sequência de controle de expressão, uma sequência de codificação de RNA e assim por diante. Como observado acima, a integração de uma sequência exógena em uma sequência cromossômica é denominada "knock in".
[104] Como pode ser apreciado pelos especialistas na técnica, o comprimento da sequência do doador pode e irá variar. Por exemplo, a sequência doadora pode variar em comprimento, de vários nucleotídeos a centenas de nucleotídeos e centenas de milhares de nucleotídeos.
[105] Tipicamente, a sequência do doador no polinucleotídeo doador é flanqueada por uma sequência a montante e uma sequência a jusante, que têm identidade substancial da sequência para sequências localizadas a montante e a jusante, respectivamente, da sequência direcionada pela proteína de modificação de DNA programável. Devido a essas semelhanças de sequência, as sequências a montante e a jusante do polinucleotídeo doador permitem a recombinação homóloga entre o polinucleotídeo doador e a sequência cromossômica direcionada, de modo que a sequência doadora possa ser integrada (ou trocada com) a sequência cromossômica.
[106] A sequência a montante, como aqui utilizada, refere-se a uma sequência de ácido nucleico que compartilha identidade substancial de sequência com uma sequência cromossômica a montante da sequência direcionada pela proteína de modificação de DNA programável. Do mesmo modo, a sequência a jusante refere-se a uma sequência de ácido nucleico que compartilha uma identidade substancial da sequência com uma sequência cromossômica a jusante da sequência alvo da proteína de modificação de DNA programável. Como aqui utilizado, a frase "identidade substancial da sequência" refere-se a sequências com pelo menos cerca de 75% de identidade de sequência. Assim, as sequências a montante e a jusante no polinucleotídeo doador podem ter cerca de 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência a montante ou a jusante da sequência alvo. Em uma modalidade exemplar, as sequências a montante e a jusante no polinucleotídeo doador podem ter cerca de 95% ou 100% de identidade de sequência com sequências cromossômicas a montante ou a jusante da sequência direcionada da proteína de modificação de DNA programável.
[107] Em algumas modalidades, a sequência a montante compartilha identidade de sequência substancial com uma sequência cromossômica localizada imediatamente a montante da sequência direcionada pela proteína de modificação de DNA programável. Em outras modalidades, a sequência a montante compartilha identidade de sequência substancial com uma sequência cromossômica que está localizada dentro de cerca de cem (100) nucleotídeos a montante da sequência alvo. Assim, por exemplo, a sequência a montante pode compartilhar uma identidade substancial da sequência com uma sequência cromossômica localizada cerca de 1 a cerca de 20, cerca de 21 a cerca de 40, cerca de 41 a cerca de 60, cerca de 61 a cerca de 80 ou cerca de 81 a cerca de 100 nucleotídeos a montante da sequência alvo. Em algumas modalidades, a sequência a jusante compartilha identidade de sequência substancial com uma sequência cromossômica localizada imediatamente a jusante da sequência direcionada pela proteína de modificação de DNA programável. Em outras modalidades, a sequência a jusante compartilha identidade de sequência substancial com uma sequência cromossômica que está localizada dentro de cerca de cem (100) nucleotídeos a jusante da sequência alvo. Assim, por exemplo, a sequência a jusante pode compartilhar uma identidade substancial de sequência com uma sequência cromossômica localizada cerca de 1 a cerca de 20, cerca de 21 a cerca de 40, cerca de 41 a cerca de 60, cerca de 61 a cerca de 80 ou cerca de 81 a cerca de 100 nucleotídeos a jusante da sequência alvo.
[108] Cada sequência a montante ou a jusante pode variar em comprimento de cerca de 20 nucleotídeos a cerca de 5000 nucleotídeos. Em algumas modalidades, as sequências a montante e a jusante podem compreender cerca de 50, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1100, 1200, 1300, 1400, 1500, 1600, 1700, 1800, 1900, 1900, 2000, 2100, 2200, 2300, 2400, 2500, 2600, 2800, 3000, 3200, 3400, 3600, 3800, 4000, 4200, 4400, 4600, 4800 ou 5000 nucleotídeos. Em modalidades específicas, as sequências a montante e a jusante podem variar em comprimento de cerca de 50 a cerca de 1500 nucleotídeos. (d) Tipos de Células
[109] Uma variedade de células é adequada para uso nos métodos aqui divulgados. Em geral, a célula é uma célula eucariótica. Por exemplo, a célula pode ser uma célula humana, uma célula de mamífero não humana, uma célula de vertebrado não mamífero, uma célula de invertebrado, uma célula de inseto, uma célula de planta, uma célula de levedura ou um organismo eucariótico de célula única. Em algumas modalidades, a célula também pode ser um embrião de uma célula. Por exemplo, um embrião de mamífero não humano, incluindo embriões de rato, hamster, roedor, coelho, felino, canino, ovino, suíno, bovino, equino e primata. Ainda em outras modalidades, a célula pode ser uma célula-tronco, como células-tronco embrionárias, células-tronco do tipo ES, células-tronco fetais, células-tronco adultas e semelhantes. Em uma modalidade, a célula-tronco não é uma célula-tronco embrionária humana. Além disso, as células estaminais podem incluir aquelas produzidas pelas técnicas divulgadas no documento WO2003/046141, que é aqui incorporado na sua totalidade, ou Chung et al. (Cell Stem
Cell, 2008, 2: 113-117). A célula pode ser in vitro ou in vivo (isto é, dentro de um organismo). Em modalidades exemplares, a célula é uma célula de mamífero ou linhagem de células de mamífero. Em modalidades particulares, a célula é uma célula humana ou uma linhagem de células humanas.
[110] Exemplos não limitativos de células ou linhagens celulares de mamíferos adequadas incluem células renais embrionárias humanas (HEK293, HEK293T); células de carcinoma cervical humano (HELA); células pulmonares humanas (W138); células hepáticas humanas (Hep G2); células de osteossarcoma U2-OS humanas, células A549 humanas, células A-431 humanas e células K562 humanas; células de ovário de hamster chinês (CHO), células de rim de filhote de hamster (BHK); células NS0 de mieloma de camundongo, células 3T3 de fibroblastos embrionários de camundongo (NIH3T3), células A20 de linfoma B de camundongo; células B16 de melanoma de camundongo; células C2C12 de mioblasto de camundongo; células SP2/0 de mieloma de camundongo; células C3H-10T1/2 embrionárias de camundongo; células CT26 de carcinoma de camundongo, células DuCuP da próstata de camundongo; células EMT6 de mama de camundongo; células Hepa1c1c7 de hepatoma de camundongo; células J5582 de mieloma de camundongo; células MTD-1A epiteliais de camundongo; células MyEnd do miocárdio de camundongo; células RenCa renais de camundongo; células RIN-5F pancreáticas de camundongo; células X64 de melanoma de camundongo; células YAC-1 de linfoma de rato; células 9L de glioblastoma de rato; células RBL de linfoma B de rato; células B35 de neuroblastoma de rato; células de hepatoma de rato (HTC); células BRL 3A de fígado de rato buffalo; células renais caninas (MDCK); células mamárias caninas (CMT); células D17 de osteossarcoma de rato; células DH82 de monócitos / macrófagos de rato; células de fibroblastos transformados em SV-40 (COS7) de rim de macaco; células CVI-76 de rim de macaco; células de rim de macaco verde africano (VERO-76). Uma extensa lista de linhas celulares de mamíferos pode ser encontrada no catálogo da American Type Culture Collection (ATCC, Manassas, VA). (VII) Métodos para Detectar Loci Genômicos Específicos
[111] Em modalidades nas quais a proteína de fusão compreende uma modificação de DNA programável com atividade de não nuclease ou o complexo CRISPR compreende um CRISP cataliticamente inativo A proteína R tendo atividade não nuclease, a referida proteína de fusão ou complexo CRISPR podem ser usados em métodos para detectar ou visualizar loci genômicos específicos em células eucarióticas. Em tais modalidades, a proteína de fusão ou proteína CRISPR do complexo adicionalmente compreende pelo menos um rótulo detectável, como um fluoróforo (por exemplo, FAM, TMR, Cy3, Cy5, Texas Red, Oregon Green, Alexa Fluors, etiquetas Halo, ou corante fluorescente adequado), uma etiqueta de detecção (por exemplo, biotina, digoxigenina e similares), pontos quânticos ou partículas de ouro. Alternativamente, o RNA guia do complexo CRISPR pode adicionalmente compreender uma etiqueta detectável para detecção in situ (por exemplo, FISH ou CISH). O pelo menos um domínio de proteína de interação com nucleossomo da proteína de fusão ou complexo CRISPR aumenta o acesso da proteína de modificação de DNA programável ou da proteína CRISPR tendo atividade de não nuclease para a sequência cromossômica alvo, melhorando assim a detecção de loci genômicos específicos ou de sequências cromossômicas direcionadas.
[112] O método compreende introduzir na célula eucariótica a proteína de fusão marcada de forma detectável, complexo CRISPR marcado de forma detectável ou ácido nucleico de codificação e detectar a proteína de modificação de DNA programável marcada ou a proteína CRISPR marcada ligada à sequência cromossômica alvo. A detecção pode ser por meio de imagem dinâmica de células vivas, microscopia fluorescente, microscopia confocal, imunofluorescência, imunodetecção, ligação RNA-proteína, ligação proteína-proteína e similares. A etapa de detecção pode ser realizada em células vivas ou células fixas.
[113] Nas modalidades em que o método compreende a detecção da dinâmica estrutural da cromatina em células vivas, a proteína de fusão marcada de forma detectável ou o complexo CRISPR marcado de forma detectável podem ser introduzidos na célula como proteínas ou ácidos nucleicos. Nas modalidades em que o método compreende a detecção da sequência cromossômica direcionada em células fixas, a proteína de fusão marcada de forma detectável ou o complexo CRISPR marcado de forma detectável podem ser introduzidos na célula como proteínas (ou complexos de proteína-RNA). Os meios para fixar e permeabilizar células são bem conhecidos na técnica. Em algumas modalidades, as células fixas podem ser submetidas a processos de desnaturação química e/ou térmica para converter DNA cromossômico de filamento duplo em DNA de filamento simples. Em outras modalidades, as células fixas não estão sujeitas a processos de desnaturação química e/ou térmica. (VIII) Aplicações
[114] As composições e métodos aqui divulgados podem ser usados em uma variedade de aplicações terapêuticas, de diagnóstico, industriais e de pesquisa. Em algumas modalidades, a presente descrição pode ser usada para modificar qualquer sequência cromossômica de interesse em uma célula, animal ou planta, a fim de modelar e/ou estudar a função de genes, estudar condições genéticas ou epigenéticas de interesse ou estudar vias bioquímicas envolvidas em várias doenças ou distúrbios. Por exemplo, organismos transgênicos podem ser criados para modelar doenças ou distúrbios, em que a expressão de uma ou mais sequências de ácidos nucleicos associadas a uma doença ou distúrbio é alterada. O modelo da doença pode ser usado para estudar os efeitos de mutações no organismo, estudar o desenvolvimento e/ou progressão da doença, estudar o efeito de um composto farmaceuticamente ativo na doença e/ou avaliar a eficácia de uma terapia genética potencial estratégia.
[115] Em outras modalidades, as composições e métodos podem ser usados para realizar triagens genômicas funcionais eficientes e econômicas, que podem ser usadas para estudar a função dos genes envolvidos em um processo biológico específico e como qualquer alteração na expressão gênica pode afetar o processo biológico ou para realizar mutagênese de varredura profunda ou saturante de loci genômicos em conjunto com um fenótipo celular. A mutagênese de saturação ou varredura profunda pode ser usada para determinar características mínimas críticas e vulnerabilidades discretas de elementos funcionais necessários para expressão de genes, resistência a medicamentos e reversão de doenças, por exemplo.
[116] Em outras modalidades, as composições e métodos aqui divulgados podem ser usados para testes de diagnóstico para estabelecer a presença de uma doença ou distúrbio e/ou para uso na determinação de opções de tratamento. Exemplos de testes de diagnóstico adequados incluem a detecção de mutações específicas nas células cancerígenas (por exemplo, mutação específica no EGFR, HER2 e similares), detecção de mutações específicas associadas a doenças específicas (por exemplo, repetições de trinucleotídeos, mutações na β-globina associada à doença celular de anemia falciforme, SNPs específicos, etc.), detecção de hepatite, detecção de vírus (por exemplo, zika) e assim por diante.
[117] Em modalidades adicionais, as composições e métodos aqui divulgados podem ser utilizados para corrigir mutações genéticas associadas a uma doença ou distúrbio específico, como, por exemplo, mutações corretas do gene da globina associadas à doença das células falciformes ou talassemia, mutações corretas no gene da adenosina desaminase associado à deficiência imunológica combinada grave (SCID), reduz a expressão de HTT, o gene causador da doença de Huntington, ou corrigir mutações no gene da rodopsina para o tratamento da retinite pigmentosa. Tais modificações podem ser feitas em células ex vivo.
[118] Em ainda outras modalidades, as composições e métodos aqui divulgados podem ser utilizados para gerar plantas de cultura com características aprimoradas ou maior resistência a estresses ambientais. A presente descrição também pode ser usada para gerar animais de fazenda com características aprimoradas ou animais de produção. Por exemplo, os porcos têm muitas características que os tornam atraentes como modelos biomédicos, especialmente em medicina regenerativa ou xenotransplante. (IX) MODALIDADES ENUMERADAS
[119] As seguintes modalidades enumeradas são apresentadas para ilustrar certos aspectos da presente invenção e não se destinam a limitar seu escopo.
[120] 1. Proteína de fusão compreendendo pelo menos um domínio de proteína de interação com nucleossomo ligado a uma proteína de modificação de DNA programável.
[121] 2. A proteína de fusão da modalidade 1, em que o pelo menos um domínio de proteína de interação com um nucleossomo é um domínio de ligação ao DNA de uma proteína box do grupo de alta mobilidade (HMG) (HMGB) escolhida entre HMGB1, HMGB2 ou HMGB3; uma proteína de ligação ao nucleossomo do HMG (HMGN) escolhida entre HMGN1, HMGN2, HMGN3a, HMGN3b, HMGN4 ou
HMGN5; um domínio globular central a partir de uma variante de histona H1; um domínio de ligação ao DNA a partir de uma proteína do complexo de remodelação de cromatina, escolhida entre o complexo switch / sacarose não fermentável (SWI/SNF), o complexo switch de imitação (ISWI), o complexo de ligação de cromodomaina-helicase-DNA (CHD), complexo de remodelação de nucleossomos e desacetilase (NuRD), complexo INO80, complexo SWR1, complexo RSC ou sua combinação.
[122] 3. A proteína de fusão da modalidade 2, em que o pelo menos um domínio de proteína de interação com nucleossomo é o domínio de box A de HMGB1, proteína HMGN1, proteína HMGN2, proteína HMGN3a, proteína HMGN3b, domínio globular central de histona H1, domínio de ligação ao DNA da proteína ISWI, domínio de ligação ao DNA da proteína CHD1 ou combinação dos mesmos.
[123] 4. A proteína de fusão de qualquer uma das modalidades 1 a 3, em que a proteína de modificação de DNA programável tem atividade de nuclease.
[124] 5. A proteína de fusão da modalidade 4, em que a proteína de modificação de DNA programável é uma nuclease ou nickase de repetições palindrômicas curtas e regularmente intercaladas agrupadas (CRISPR), uma nuclease de dedo de zinco (ZFN), uma nuclease de efetor do tipo ativador de transcrição (TALEN), uma meganuclease ou uma proteína quimérica compreendendo um domínio de ligação a DNA programável ligado a um domínio nuclease.
[125] 6. Proteína de fusão, de acordo com qualquer uma das modalidades de 1 a 3, caracterizada pelo fato de que a proteína de modificação de DNA programável tem atividade de não nuclease.
[126] 7. A proteína de fusão da modalidade 6, em que a proteína de modificação de DNA programável é uma proteína quimérica que compreende um domínio de ligação a DNA programável ligado a um domínio de não nuclease.
[127] 8. A proteína de fusão da modalidade 7, em que o domínio de ligação ao DNA programável é uma proteína CRISPR modificada para não possuir toda atividade de nuclease, uma proteína de dedo de zinco ou um efetor do tipo ativador de transcrição.
[128] 9. A proteína de fusão da modalidade 7, em que o domínio de não nuclease tem atividade de acetiltransferase, atividade de desacetilase, atividade de metiltransferase, atividade de desmetilase, atividade de quinase, atividade de fosfatase, atividade de ubiquitina ligase, atividade de desubiquitinante, atividade de adenilação, atividade de desadenilação, atividade de SUMOilação, atividade de deSUMOilação, atividade de ribosilação, atividade de derribosilação, atividade de miristoilação, atividade de desmististoilação, atividade de citrulinação, atividade de helicase, atividade de aminação, atividade de desaminação, atividade de alquilação, atividade de desalquilação, atividade de oxidação, atividade de ativação transcricional ou atividade de repressão da transcrição.
[129] 10. A proteína de fusão da modalidade 9, em que o domínio de não nuclease tem atividade de citosina desaminase, atividade de histona acetiltransferase, atividade de ativação transcricional ou atividade de repressão transcricional.
[130] 11. A proteína de fusão, de acordo com qualquer uma das modalidades de 1 a 10, em que pelo menos um domínio de proteína de interação com nucleossomo está ligado à proteína de modificação de DNA programável diretamente por meio de uma ligação química, indiretamente por meio de um ligante ou uma combinação dos mesmos.
[131] 12. A proteína de fusão, de acordo com qualquer uma das modalidades de 1 a 11, em que pelo menos um domínio de proteína de interação com nucleossomo está ligado à proteína de modificação de DNA programável em seu terminal N, terminal C, um local interno ou combinação dos mesmos.
[132] 13. A proteína de fusão de qualquer uma das modalidades 1 a 12, adicionalmente compreendendo pelo menos um sinal de localização nuclear, pelo menos um domínio de penetração de células, pelo menos um domínio de marcador ou uma combinação dos mesmos.
[133] 14. Uma proteína de fusão compreendendo uma proteína de repetições palindrômicas curtas regularmente intercaladas agrupadas (CRISPR) ligada a pelo menos um domínio de proteína de interação com nucleossomo.
[134] 15. A proteína de fusão da modalidade 14, em que a proteína CRISPR é uma CRISPR/Cas9 nuclease ou nickase tipo II, ou a proteína CRISPR é uma nuclease ou nickase CRISPR/Cpf1 tipo V.
[135] 16. A proteína de fusão da modalidade 14, em que a proteína CRISPR é uma proteína CRISPR/Cas9 tipo II modificada para não possuir toda atividade de nuclease e ligada a um domínio de não nuclease ou uma proteína CRISPR/Cpf1 tipo V modificada para não possuir toda a atividade da nuclease e ligada a um domínio não nuclease.
[136] 17. A proteína de fusão da modalidade 16, em que o domínio de não nuclease tem atividade de citosina desaminase, atividade de histona acetiltransferase, atividade de ativação transcricional ou atividade de repressão transcricional.
[137] 18. A proteína de fusão, de acordo com qualquer uma das modalidades 14 a 17, em que pelo menos um domínio de proteína de interação com nucleossomo é um domínio de ligação a DNA da box do grupo de alta mobilidade (HMG) (HMG), um domínio de ligação a DNA da box do HMG, uma proteína de ligação a nucleossomo HMG (HMGN), um domínio globular central a partir de uma variante de histona H1, um domínio de ligação ao DNA de uma proteína complexa de remodelação de cromatina ou uma combinação dos mesmos.
[138] 19. A proteína de fusão da modalidade 18, em que pelo menos um domínio de proteína de interação com nucleossomo é o domínio de box A de HMGB1, proteína HMGN1, proteína HMGN2, proteína HMGN3a, proteína HMGN3b, proteína globular central da histona H1, domínio de ligação ao DNA da proteína de switch de imitação (ISWI), domínio de ligação ao DNA de cromodomaína- helicase-proteína 1 (CHD1) ou uma combinação dos mesmos.
[139] 20. A proteína de fusão, de acordo com qualquer uma das modalidades 14 a 19, em que pelo menos um domínio de proteína de interação com nucleossomo está ligado à proteína CRISPR diretamente por meio de uma ligação química, indiretamente por meio de um ligante ou uma combinação dos mesmos.
[140] 21. A proteína de fusão, de acordo com qualquer uma das modalidades 14 a 20, caracterizada pelo fato de que pelo menos um domínio de proteína de interação com nucleossomo está ligado à proteína CRISPR em seu terminal N, terminal C, um local interno ou uma combinação dos mesmos.
[141] 22. A proteína de fusão de qualquer uma das modalidades 14 a 21, adicionalmente compreendendo pelo menos um sinal de localização nuclear, pelo menos um domínio de penetração de células, pelo menos um domínio de marcador ou uma combinação dos mesmos.
[142] 23. A proteína de fusão de qualquer uma das modalidades 14 a 22, em que a proteína CRISPR é Streptococcus pyogenes Cas9 (SpCas9), Streptococcus thermophilus Cas9 (StCas9), Streptococcus pasteurianus (SpaCas9), Campylobacter jejuni Cas9 (CjCas9), Staphylococcus aureus (SaCas9), Francisella novicida Cas9 (FnCas9), Neisseria cinerea Cas9 (NcCas9), Neisseria meningitis Cas9 (NmCas9), Francisella novicida Cpf1 (FnCpf1), Acidaminococcus sp. Cpf1 (AsCpf1), ou Lachnospiraceae bacterium ND2006 Cpf1 (LbCpf1).
[143] 24. A proteína de fusão de qualquer uma das modalidades
14 a 23, em que a proteína de fusão tem uma sequência de aminoácidos tendo pelo menos cerca de 90% de identidade de sequência com a SEQ ID NO: 61, SEQ ID NO: 62, SEQ ID NO: 63, SEQ ID NO: 64, SEQ ID NO: 65, SEQ ID NO: 66, SEQ ID NO: 67, SEQ ID NO: 68, SEQ ID NO: 69, SEQ ID NO: 70, SEQ ID NO: 71, SEQ ID NO: 72, SEQ ID NO: 73, SEQ ID NO: 74, SEQ ID NO: 75, SEQ ID NO: 76, SEQ ID NO: 77, SEQ ID NO: 78 ou SEQ ID NO: 79.
[144] 25. A proteína de fusão, de acordo com qualquer uma das modalidades 14 a 24, caracterizada pelo fato de que a proteína de fusão tem uma sequência de aminoácidos conforme estabelecido na SEQ ID NO: 61, SEQ ID NO: 62, SEQ ID NO: 63, SEQ ID NO: 64, SEQ ID NO: 65, SEQ ID NO: 66, SEQ ID NO: 67, SEQ ID NO: 68, SEQ ID NO: 69, SEQ ID NO: 70, SEQ ID NO: 70, SEQ ID NO: 71, SEQ ID NO: 72, SEQ ID NO: 73, SEQ ID NO: 74, SEQ ID NO: 75, SEQ ID NO: 76, SEQ ID NO: 77, SEQ ID NO: 78 ou SEQ ID NO: 79.
[145] 26. Um complexo compreendendo pelo menos uma proteína de fusão de qualquer uma das modalidades 14 a 25 e pelo menos um RNA guia.
[146] 27. Um ácido nucleico que codifica a proteína de fusão de qualquer uma das modalidades 1 a 25.
[147] 28. O ácido nucleico da modalidade 27, que é códon otimizado para tradução em uma célula eucariótica.
[148] 29. O ácido nucleico das modalidades 27 ou 28, que faz parte de um vetor viral, um vetor plasmídico ou um RNA autorreplicante.
[149] 30. Um método para aumentar a eficiência do genoma direcionado ou modificação epigenética em uma célula eucariótica, o método compreendendo a introdução na célula eucariótica de pelo menos uma proteína de fusão, conforme estabelecido em qualquer uma das modalidades 1 a 25, ou codificação de ácido nucleico a pelo menos uma proteína de fusão, como estabelecido em qualquer uma das modalidades 27 a 29, em que a proteína de modificação de DNA programável de pelo menos uma proteína de fusão é direcionada a uma sequência cromossômica alvo e pelo menos um domínio de proteína de interação com nucleossomo da pelo menos uma proteína de fusão altera a estrutura nucleossômica ou cromatina, de modo que a pelo menos uma proteína de fusão aumente o acesso à sequência cromossômica alvo, aumentando assim a eficiência do genoma alvo ou modificação epigenética.
[150] 31. O método da modalidade 30, em que a proteína de modificação de DNA de pelo menos uma proteína de fusão compreende uma proteína CRISPR e o método adicionalmente compreende a introdução na célula eucariótica de pelo menos um RNA guia ou ácido nucleico que codifica o pelo menos um RNA guia.
[151] 32. O método das modalidades 30 ou 31, em que o método adicionalmente compreende introduzir na célula eucariótica pelo menos um polinucleotídeo doador, o polinucleotídeo doador compreendendo pelo menos uma sequência doadora.
[152] 33. O método de qualquer uma das modalidades 30 a 32, em que a célula eucariótica é in vitro.
[153] 34. O método de qualquer uma das modalidades 30 a 32, em que a célula eucariótica é in vivo.
[154] 35. O método de qualquer uma das modalidades 30 a 34, em que a célula eucariótica é uma célula de mamífero.
[155] 36. O método de qualquer uma das modalidades 30 a 35, em que a célula eucariótica é uma célula humana.
[156] 37. Método para aumentar a eficiência do genoma direcionado ou modificação epigenética em uma célula eucariótica, o método compreendendo a introdução na célula eucariótica: (a) pelo menos uma proteína de fusão ou ácido nucleico que codifica pelo menos uma proteína de fusão, cada fusão proteína compreendendo uma proteína CRISPR ligada a pelo menos um domínio de proteína de interação com nucleossomo, em que a proteína CRISPR (i) tem atividade de nuclease ou nickase ou (ii) é modificada para não possuir toda a atividade de nuclease e está ligada a um domínio de não nuclease; e (b) pelo menos um RNA guia ou ácido nucleico que codifica pelo menos um RNA guia; em que a proteína CRISPR da pelo menos uma proteína de fusão é direcionada a uma sequência cromossômica alvo e o pelo menos um domínio de proteína de interação com nucleossomo da pelo menos uma proteína de fusão altera a estrutura nucleossômica ou cromatina, de modo que a pelo menos uma proteína de fusão tenha acesso aumentado à sequência cromossômica alvo, aumentando assim a eficiência do genoma direcionado ou modificação epigenética.
[157] 38. O método da modalidade 37, em que a proteína CRISPR é uma proteína CRISPR/Cas9 tipo II ou uma proteína CRISPR/Cpf1 tipo V.
[158] 39. O método das modalidades 37 ou 38, em que o domínio não nuclease tem atividade de citosina desaminase, atividade de histona acetiltransferase, atividade de ativação transcricional ou atividade de repressão transcricional.
[159] 40. O método, de acordo com qualquer uma das modalidades 37 a 39, caracterizado pelo fato de que pelo menos um domínio de proteína de interação com nucleossomo é um domínio de ligação ao DNA de box do grupo de alta mobilidade (HMG) (HMG) (HMGB), uma proteína de ligação ao nucleossomo (HMGN) de HMG, um domínio globular central a partir de uma variante de histona H1, um domínio de ligação ao DNA a partir de uma proteína do complexo de remodelação de cromatina ou uma combinação dos mesmos.
[160] 41. O método de qualquer uma das modalidades 37 a 40, em que pelo menos um domínio de proteína de interação com nucleossomo está ligado à proteína CRISPR diretamente por meio de uma ligação química, indiretamente por meio de um ligante ou uma combinação dos mesmos.
[161] 42. O método de qualquer uma das modalidades 37 a 41, em que o pelo menos um domínio de proteína de interação com nucleossomo está ligado ao terminal N, terminal C e/ou a um local interno da proteína CRISPR.
[162] 43. O método de qualquer uma das modalidades 37 a 42, em que a pelo menos uma proteína de fusão adicionalmente compreende pelo menos um sinal de localização nuclear, pelo menos um domínio de penetração de células, pelo menos um domínio de marcador ou uma combinação dos mesmos.
[163] 44. O método de qualquer uma das modalidades 37 a 43, em que o ácido nucleico que codifica a pelo menos uma proteína de fusão é códon otimizado para tradução na célula eucariótica.
[164] 45. O método de qualquer uma das modalidades 37 a 44, em que o ácido nucleico que codifica a pelo menos uma proteína de fusão faz parte de um vetor viral, um vetor plasmídeo ou um RNA autorreplicante.
[165] 46. O método de qualquer uma das modalidades 37 a 45, e em que o método adicionalmente compreende a introdução na célula eucariótica de pelo menos um polinucleotídeo doador, o polinucleotídeo doador compreendendo pelo menos uma sequência doadora.
[166] 47. O método de qualquer uma das modalidades 37 a 46, em que a célula eucariótica é in vitro.
[167] 48. O método de qualquer uma das modalidades 37 a 46, em que a célula eucariótica é in vivo.
[168] 49. O método de qualquer uma das modalidades 37 a 48, em que a célula eucariótica é uma célula de mamífero.
[169] 50. O método de qualquer uma das modalidades 37 a 48, em que a célula eucariótica é uma célula humana.
[170] A menos que definido de outra forma, todos os termos técnicos e científicos aqui utilizados têm o significado comumente entendido por um especialista na técnica ao qual esta invenção pertence. As seguintes referências fornecem aos especialistas uma definição geral de muitos dos termos usados nesta invenção: Singleton et al., Dictionary of Microbiology and Molecular Biology (2nd Ed. 1994); The Cambridge Dictionary of Science and Technology (Walker ed., 1988); The Glossary of Genetics, 5ª Ed., R. Rieger et al. (eds.), Springer Verlag (1991); e Hale e Marham, The Harper Collins Dictionary of Biology (1991). Conforme usado aqui, os seguintes termos têm os significados que lhes são atribuídos, a menos que especificado de outra forma.
[171] Ao introduzir elementos da presente descrição ou das modalidades preferidas da mesma, os artigos "a", "o", "um", "uma" e "referido(a)" pretendem significar que há um ou mais dos elementos. Os termos "compreendendo", "incluindo" e "tendo" pretendem ser inclusivos e significam que pode haver outros elementos além dos listados.
[172] O termo "cerca de" quando usado em relação a um valor numérico, x, por exemplo, significa x ± 5%.
[173] Como usado aqui, os termos "complementar" ou "complementaridade" se referem à associação de ácidos nucleicos de filamento duplo por emparelhamento de bases através de ligações de hidrogênio específicas. O emparelhamento de base pode ser o pareamento de base padrão do Watson-Crick (por exemplo, pares 5'-A G T C-3’ com a sequência complementar 3'-T C A G-5'). O emparelhamento de bases também pode ser Hoogsteen ou ligação de hidrogênio Hoogsteen invertida. A complementaridade é normalmente medida em relação a uma região dúplex e, portanto, exclui saliências, por exemplo. A complementaridade entre duas vertentes da região dúplex pode ser parcial e expressa como uma porcentagem (por exemplo, 70%), se apenas algumas (por exemplo, 70%) das bases forem complementares. As bases que não são complementares são "incompatíveis". A complementaridade também pode ser completa (ou seja, 100%), se todas as bases na região dúplex forem complementares.
[174] Como aqui utilizado, o termo "sistema CRISPR" refere-se a um complexo compreendendo uma proteína CRISPR (isto é, nuclease, nickase ou proteína cataliticamente morta) e um RNA guia.
[175] O termo "sequência endógena", como usado aqui, refere-se a uma sequência cromossômica que é nativa da célula.
[176] Como usado aqui, o termo "exógeno" refere-se a uma sequência que não é nativa da célula ou uma sequência cromossômica cuja localização nativa no genoma da célula está em um local cromossômico diferente.
[177] Um "gene", como usado aqui, refere-se a uma região de DNA (incluindo éxons e íntrons) que codifica um produto genético, bem como a todas as regiões de DNA que regulam a produção do produto gênico, quer essas sequências reguladoras sejam adjacentes ou não às sequências codificadoras e/ou transcritas. Por conseguinte, um gene inclui, mas não está limitado a, sequências promotoras, terminadores, sequências reguladoras de tradução, como sítios de ligação ao ribossomo e sítios de entrada interna do ribossomo, melhoradores, silenciadores, isoladores, elementos de contorno, origens de replicação, sítios de inserção de matrizes e regiões de controle de locus.
[178] O termo "heterólogo" refere-se a uma entidade que não é endógena ou nativa da célula de interesse. Por exemplo, uma proteína heteróloga refere-se a uma proteína que é derivada de ou foi originalmente derivada de uma fonte exógena, como uma sequência de ácido nucleico introduzida exogenamente. Em alguns casos, a proteína heteróloga não é normalmente produzida pela célula de interesse.
[179] O termo "nickase" refere-se a uma enzima que quebra uma cadeia de uma sequência de ácido nucleico de filamento duplo (isto é, corta uma sequência de filamento duplo). Por exemplo, uma nuclease com atividade de clivagem de filamento duplo pode ser modificada por mutação e/ou exclusão para funcionar como uma nickase e clivar apenas uma cadeia de uma sequência de filamento duplo.
[180] O termo "nuclease", como aqui utilizado, refere-se a uma enzima que cliva ambas as cadeias de uma sequência de ácido nucleico de filamento duplo.
[181] Os termos "ácido nucleico" e "polinucleotídeo" se referem a um polímero desoxirribonucleotídeo ou ribonucleotídeo, em conformação linear ou circular e na forma de filamento simples ou duplo. Para os fins da presente descrição, esses termos não devem ser interpretados como limitativos em relação ao comprimento de um polímero. Os termos podem abranger análogos conhecidos de nucleotídeos naturais, bem como nucleotídeos que são modificados nas porções base, açúcar e/ou fosfato (por exemplo, esqueletos de fosforotioato). Em geral, um análogo de um nucleotídeo específico tem a mesma especificidade de emparelhamento de bases; isto é, um análogo de A irá emparelhar com T.
[182] O termo "nucleotídeo" refere-se a desoxirribonucleotídeos ou ribonucleotídeos. Os nucleotídeos podem ser nucleotídeos padrão (isto é, adenosina, guanosina, citidina, timidina e uridina), isômeros de nucleotídeos ou análogos de nucleotídeos. Um análogo de nucleotídeo refere-se a um nucleotídeo que possui uma base de purina ou pirimidina modificada ou uma porção de ribose modificada. Um análogo de nucleotídeo pode ser um nucleotídeo de ocorrência natural (por exemplo, inosina, pseudouridina, etc.) ou um nucleotídeo de ocorrência não natural. Exemplos não limitativos de modificações nas porções de açúcar ou de base de um nucleotídeo incluem a adição (ou remoção) de grupos acetila, grupos amino, grupos carboxila, grupos carboximetila, grupos hidroxila, grupos metila, grupos fosforila e grupos tiol, também como a substituição dos átomos de carbono e nitrogênio das bases por outros átomos (por exemplo, 7-deaza purinas). Análogos de nucleotídeos também incluem nucleotídeos didesóxi, nucleotídeos de 2’-O-metila, ácidos nucleicos bloqueados (LNA), ácidos nucleicos peptídicos (PNA) e morfolinos.
[183] Os termos "polipeptídeo" e "proteína" são usados de forma intercambiável para se referir a um polímero de resíduos de aminoácidos.
[184] Como usado aqui, o termo "proteína de modificação de DNA programável" refere-se a uma proteína que é projetada para ligar uma sequência-alvo específica em ou próximo à sequência-alvo.
[185] O termo "identidade de sequência", como aqui utilizado, indica uma medida quantitativa do grau de identidade entre duas sequências de comprimento substancialmente igual. A identidade percentual de duas sequências, sejam sequências de ácidos nucleicos ou aminoácidos, é o número de correspondências exatas entre duas sequências alinhadas, divididas pelo comprimento da sequência mais curta e multiplicadas por 100. Um alinhamento aproximado para sequências de ácidos nucleicos é fornecido pelo algoritmo de homologia local de Smith e Waterman, Advances in Applied Mathematics 2: 482- 489 (1981). Este algoritmo pode ser aplicado a sequências de aminoácidos utilizando a matriz de pontuação desenvolvida por Dayhoff, Atlas of Protein Sequences and Structure, M. O. Dayhoff ed., 5 suppl. 3: 353-358, National Biomedical Research Foundation, Washington, DC, EUA, e normalizado por Gribskov, Nucl. Acids Res. 14 (6): 6745-6763
(1986). Uma implementação exemplar desse algoritmo para determinar a porcentagem de identidade de uma sequência é fornecida pelo Genetics Computer Group (Madison, Wis.) No aplicativo utilitário "BestFit". Outros programas adequados para calcular a porcentagem de identidade ou similaridade entre sequências são geralmente conhecidos na técnica, por exemplo, outro programa de alinhamento é o BLAST, usado com parâmetros padrão. Por exemplo, BLASTN e BLASTP podem ser usados usando os seguintes parâmetros padrão: código genético = padrão; filtro = nenhum; vertente = ambos; ponto de corte = 60; esperar = 10; Matriz = BLOSUM62; Descrições = 50 sequências; classificar por = ALTA PONTUAÇÃO; Bancos de dados = não redundantes, traduções GenBank + EMBL + DDBJ + PDB + GenBank CDS + proteína Swiss + Spupdate + PIR. Detalhes desses programas podem ser encontrados no site GenBank. Em geral, as substituições são substituições conservadoras de aminoácidos: limitadas a trocas dentro dos membros do grupo 1: glicina, alanina, valina, leucina e isoleucina; grupo 2: serina, cisteína, treonina e metionina; grupo 3: prolina; grupo 4: fenilalanina, tirosina e triptofano; grupo 5: aspartato, glutamato, asparagina e glutamina.
[186] Os termos "sequência alvo", "sequência cromossômica alvo" e "sítio-alvo" são usados de forma intercambiável para se referir à sequência específica no DNA cromossômico à qual a proteína programável de modificação do DNA é direcionada e ao local no qual a programável A proteína de modificação do DNA modifica o DNA ou as proteínas associadas ao DNA.
[187] Técnicas para determinar a identidade da sequência de ácidos nucleicos e aminoácidos são conhecidas na técnica. Tipicamente, essas técnicas incluem a determinação da sequência nucleotídica do mRNA para um gene e/ou a determinação da sequência de aminoácidos codificada assim, e a comparação dessas sequências com uma segunda sequência de nucleotídeo ou aminoácido. Sequências genômicas também podem ser determinadas e comparadas dessa maneira.
[188] Em geral, identidade refere-se a uma correspondência exata de nucleotídeo para nucleotídeo ou de aminoácido para aminoácido de dois polinucleotídeos ou sequências de polipeptídeos, respectivamente. Duas ou mais sequências (polinucleotídeo ou aminoácido) podem ser comparadas determinando sua identidade percentual.
[189] Como várias alterações podem ser feitas nas células e nos métodos descritos acima sem se afastar do escopo da invenção, pretende-se que toda a matéria contida na descrição acima e nos exemplos dados abaixo seja interpretada como ilustrativa e não em um sentido limitante.
[190] Os exemplos a seguir ilustram certos aspectos da descrição. A Tabela 1 lista as sequências peptídicas dos domínios que interagem com os nucleossomos e a Tabela 2 apresenta as sequências cromossômicas alvo usadas nos Exemplos 1-8 apresentados abaixo. Tabela 1. Sequência de Peptídeo de Domínios Interagindo com Nucleosomo Domínio Sequência (NH2-COOH) SEQ Interagindo ID com NO: Nucleossomo Domino Box A MGKGDPKKPRGKMSSYAFFVQTCREEHKKKHPDASV 40 de HMGB1 (1- NFSEFSKKCSERWKTMSAKEKGKFEDMAKADKARYE 84 aa) REMKTYIPPKGE Proteína MPKRKVSSAEGAAKEEPKRRSARLSAKPPAKVEAKPK 41 HMGN1 KAAAKDKSSDKKVQTKGKRGAKGKQAEVANQETKED humana LPAENGETKTEESPASDEAGEKEAKSD Proteína MPKRKAEGDAKGDKAKVKDEPQRRSARLSAKPAPPK 42 HMGN2 PEPKPKKAPAKKGEKVPKGKKGKADAGKEGNNPAEN humana GDAKTDQAQKAEGAGDAK Proteína MPKRKSPENTEGKDGSKVTKQEPTRRSARLSAKPAPP 43 HMGN3a KPEPKPRKTSAKKEPGAKISRGAKGKKEEKQEAGKEG humana TAPSENGETKAEEAQKTESVDNEGE
Proteína MPKRKSPENTEGKDGSKVTKQEPTRRSARLSAKPAPP 44 HMGN3b KPEPKPRKTSAKKEPGAKISRGAKGKKEEKQEAGKEG humana TEN Domínio STDHPKYSDMIVAAIQAEKNRAGSSRQSIQKYIKSHYK 45 globular central VGENADSQIKLSIKRLVTTGVLKQTKGVGASGSFRLAK de Histona SDEP Human H1 (22-101 aa) Domínio de LLNPTKRERKENYSIDNYYKDVLNTGRSSTPSHPRMP 46 ligação de DNA KPHVFHSHQLQPPQLKVLYEKERMWTAKKTGYVPTM ATPase ISW1 DDVKAAYGDISDEEEKKQKLELLKLSVNNSQPLTEEEE do complexo de KMKADWESEGFTNWNKLEFRKFITVSGKYGRNSIQAIA remodelação de RELAPGKTLEEVRAYAKAFWSNIERIEDYEKYLKIIENE cromatina ISWI EEKIKRVKMQQEALRRKLSEYKNPFFDLKLKHPPSSNN de levedura KRTYSEEEDRFILLMLFKYGLDRDDVYELVRDEIRDCP
KKAKIEDTSNVGTEQLVAEKIPENETTH Proteína 1 DMDSIGESEVRALYKAILKFGNLKEILDELIADGTLPVKS 47 domínio de FEKYGETYDEMMEAAKDCVHEEEKNRKEILEKLEKHA ligação de DNA TAYRAKLKSGEIKAENQPKDNPLTRLSLKKREKKAVLF (CHD1) NFKGVKSLNAESLLSRVEDLKYLKNLINSNYKDDPLKF contendo SLGNNTPKPVQNWSSNWTKEEDEKLLIGVFKYGYGS domínio cromo WTQIRDDPFLGITDKIFLNEVHNPVAKKSASSSDTTPTP de levedura SKKGKGITGSSKKVPGAIHLGRRVDYLLSFLRGGLNTK
SPS Tabela 2. Sítios-alvo Cromossomais Locus Sítio Sequência (5’-3’) SEQ ID NO: Streptococcus pyogenes Cas9 (SpCas9) POR #1 AGCCGTGAGTGGAGGGAGCGTGG 48 POR #2 AGAGGGAGGGGTTGGACTACAGG 49 POR #3 CATTCGCCAGTACGAGCTTGTGG 50 CAR #1 CTTTAATGCGCTGACTTGTGAGG 51 EMX1 #1 GTGGCGCATTGCCACGAAGCAGG 52 EMX1 #2 TTCTTCTTCTGCTCGGACTCAGG 53 Streptococcus pasteurianus Cas9 (SpaCas9) POR #1 TGCTGGAAAGGGGAGACCAAGGGTGA 54 POR #2 AGAGCTACGAGAACCAGAAGCCGTGA 55 Francisella novicida Cpf1 (FnCpf1) POR #1 TTCCCGGCCTCACCCTTGGTCTCCCC 56
POR #2 TTGGTCTCCCCTTTCCAGCATTCGCC 57 POR #3 TTCCAGCATTCGCCAGTACGAGCTTG 58 Campylobacter jejuni Cas9 (CjCas9) POR #1 GATCAACATGGGAGACTCCCACGTGGACAC 59 POR #2 AGATACTTCTTCGGCCACCGCCTCGGACAC 60 Exemplo 1. Melhoria da atividade de Streptococcus pyogenes Cas9 (SpCas9) usando o domínio de box A de HMGB1 humana
[191] Um domínio HMGB1 de box A humana (SEQ ID NO: 40) foi fundido com SpCas9 (+NLS) no terminal carboxila nuclease com o ligante LEGGGS (SEQ ID NO: 1) entre Cas9 e o domínio de box A de HMGB1. As células K562 humanas (1 x 106) foram transfectadas com o DNA de plasmídeo que codifica a proteína de fusão ou a proteína SpCas9 de tipo selvagem em quantidades de equivalente molar (5,2 e 5,0 µg para a proteína de fusão e a proteína Cas9 de tipo selvagem, respectivamente) em combinação com 3 µg de um plasmídeo sgRNA para direcionar um sítio genômico (# 1) no locus oxidoredutase do citocromo p450 humano (POR). A transfecção foi realizada usando nucleofecção em um nucleofector Amaxi. Três dias após a transfecção, as células foram lisadas com uma solução de extração de DNA (QuickExtract™) e a região genômica alvo foi amplificada por PCR. As atividades de clivagem alvo da Cas9 nuclease (% indels) foram medidas usando ensaios Cel-I. Como mostrado na Tabela 3, a fusão do domínio de box A de HMGB1 humana com a nuclease aumentou a eficiência da clivagem SpCas9 no sítio-alvo. Tabela 3. Eficiência de Clivagem Nuclease Sítio-alvo Indel (%) SpCas9 de tipo selvagem POR/sítio #1 8,5 Fusão SpCas9- box A de HMGB1 POR/sítio #1 21,3 Exemplo 2. Melhoria de atividade de Streptococcus pyogenes Cas9 (SpCas9) usando HMGN1, HMGN2, HMGN3a e HMGN3b
[192] HMGN1 humano, HMGN2, HMGN3a e HMGN3b (SEQ ID
NOS: 41-44, respectivamente) foram fundidos com SpCas9 (+NLS) no terminal carboxil nuclease com o ligante LEGGGS (SEQ ID NO: 1) entre Cas9 e cada um dos peptídeos HMGN. As células K562 humanas (1 x 106) foram transfectadas com o DNA de plasmídeo que codifica cada uma das proteínas de fusão ou a proteína SpCas9 de tipo selvagem em quantidades de equivalente molar (5,2 e 5,0 µg para cada uma das proteínas de fusão e a proteína Cas9 de tipo selvagem, respectivamente) em combinação com 3 µg de um plasmídeo sgRNA para atingir um sítio genômico (# 1) no locus oxidorredutase do citocromo p450 humano (POR). A transfecção foi realizada usando nucleofecção em um nucleofector Amaxi. Três dias após a transfecção, as células foram lisadas com uma solução de extração de DNA (QuickExtract™) e a região genômica alvo foi amplificada por PCR. As atividades de clivagem alvo de Cas9 (% indels) foram medidas usando ensaios Cel-I. Os resultados, como resumido na Tabela 4, mostram que a fusão de cada um dos peptídeos HMGN humanos com a nuclease aumentou a eficiência da clivagem SpCas9 no sítio-alvo. Tabela 4. Eficiência de Clivagem Nuclease Sítio-alvo Indel (%) SpCas9 de tipo selvagem POR/sítio #1 8,5 Fusão SpCas9-HMGN1 POR/sítio #1 18,3 Fusão SpCas9-HMGN2 POR/sítio #1 13,3 Fusão SpCas9-HMGN3a POR/sítio #1 13,5 Fusão SpCas9-HMGN3b POR/sítio #1 14,4 Exemplo 3. Melhoria de atividade de Streptococcus pyogenes Cas9 (SpCas9) usando o domínio globular central da histona H1 humana
[193] Um domínio globular central de histona H1 humana (SEQ ID NO: 45) foi fundido com SpCas9 (+NLS) no terminal carboxil nuclease com o ligante LEGGGS (SEQ ID NO: 1) entre Cas9 e o domínio globular. As células K562 humanas (1 x 106) foram transfectadas com o DNA de plasmídeo que codifica a proteína de fusão ou a proteína SpCas9 de tipo selvagem em quantidades de equivalente molar (5,2 e 5,0 µg para a proteína de fusão e a proteína Cas9 de tipo selvagem, respectivamente) em combinação com 3 µg de um plasmídeo sgRNA para direcionar um sítio genômico (# 1) no locus oxidoredutase do citocromo p450 humano (POR). A transfecção foi realizada usando nucleofecção em um nucleofector Amaxi. Três dias após a transfecção, as células foram lisadas com uma solução de extração de DNA (QuickExtract™) e a região genômica alvo foi amplificada por PCR. As atividades de clivagem alvo Cas9 (% indels) foram medidas usando ensaios Cel-I. Os resultados são apresentados na Tabela 5. A fusão do domínio globular central de histona H1 humana com a nuclease aumentou a eficiência da clivagem SpCas9 no sítio-alvo. Table 5. Eficiência de Clivagem Nuclease Target Site Indel (%) SpCas9 de tipo selvagem POR/sítio #1 8,5 Fusão de domínio globular central de POR/sítio #1 19,4 SpCas9-H1 Exemplo 4. Melhoria da atividade de Streptococcus pyogenes Cas9 (SpCas9) usando um domínio de ligação ao DNA da proteína de remodelação de cromatina
[194] SpCas9 (+NLS) foi fundido com o domínio de ligação ao DNA do complexo ATPase ISW1 de remodelação de cromatina de levedura (SEQ ID NO: 46) no terminal amino nuclease com o ligante TGSG (SEQ ID NO: 2) entre Cas9 e o domínio de ligação ao DNA. Independentemente, o SpCas9 do tipo selvagem foi fundido com o domínio de ligação ao DNA da proteína 1 que contém o domínio de cromo de levedura (CHD1) (SEQ ID NO: 47) no terminal carboxil nuclease com o ligante LEGGGS (SEQ ID NO: 1) entre o Cas9 e o domínio de ligação ao DNA. As células K562 humanas (1 x 106) foram transfectadas com o DNA de plasmídeo que codifica cada uma das proteínas de fusão ou a proteína SpCas9 de tipo selvagem em quantidades de equivalente molar (6,0 e 5,0 µg para cada uma das proteínas de fusão e a proteína Cas9 de tipo selvagem, respectivamente) em combinação com 3 µg de um plasmídeo sgRNA para atingir um sítio genômico (# 1) no locus oxidoredutase do citocromo p450 humano (POR). A transfecção foi realizada usando nucleofecção em um nucleofector Amaxi. Três dias após a transfecção, as células foram lisadas com uma solução de extração de DNA (QuickExtract™) e a região genômica alvo foi amplificada por PCR. As atividades de clivagem-alvo Cas9 (% indels) foram medidas usando ensaios Cel-I. Os resultados, como resumido na Tabela 6, mostram que a fusão de cada um dos domínios de ligação ao DNA com a nuclease aumentou a eficiência da clivagem de SpCas9 no sítio-alvo. Table 6. Eifciência de Clivagem Nuclease Sítio-alvo Indel (%) SpCas9 de tipo selvagem POR/sítio #1 8,5 Fusão de domínio de ligação de DNA POR/sítio #1 21,1 ISW1-SpCas9 Fusão de domínio de ligação de DNA POR/sítio #1 20,8 CHD1-SpCas9 Exemplo 5. Melhoria da atividade de Streptococcus pyogenes Cas9 (SpCas9) usando combinações de domínios de interação de nucleossomos
[195] SpCas9 (+NLS) foi fundido com o HMGN1 humano (SEQ ID N: 41) no terminal amino nuclease com o ligante TGSG (SEQ ID NO: 2) entre Cas9 e HMGN1 e com o domínio de box A de HMGB1 humano (SEQ ID NO: 40) ou o domínio globular central de histona H1 humana (SEQ ID NO: 45) ou o domínio de ligação ao DNA da proteína 1 (CHD1) que contém o domínio cromo de levedura (SEQ ID NO: 47) no terminal carboxil nuclease com o ligante LEGGGS (SEQ ID NO: 1) entre Cas9 e cada um dos domínios de proteína. As células K562 humanas (1 x 106) foram transfectadas com o DNA de plasmídeo que codifica cada uma das proteínas de fusão ou a proteína SpCas9 de tipo selvagem em quantidades de equivalente molar (5,4 µg para as proteínas Box A de HMGB1 e de fusão do domínio globular central e H1, 6,0 µg para a proteína de fusão do domínio de ligação ao DNA de CHD1 e 5,0 µg para a proteína Cas9 de tipo selvagem) em combinação com 3 µg de um plasmídeo sgRNA para direcionar um sítio genômico (#1, #2, #3) no locus oxidorredutase do citocromo humano p450 (POR), ou um sítio genômico (#1) no locus do membro 3 do grupo I (CAR) da subfamília 1 do receptor nuclear humano, ou um sítio genômico (# 1, # 2) no locus da homeobox 1 (EMX1) de espiráculos vazios humana.
A transfecção foi realizada usando nucleofecção em um nucleofector Amaxi.
Cinco dias após a transfecção, as células foram lisadas com uma solução de extração de DNA (QuickExtract™) e cada região genômica alvo foi amplificada por PCR.
As atividades de clivagem alvo Cas9 (% indels) foram medidas usando ensaios Cel-I.
Os resultados, como resumido na Tabela 7, mostram que a fusão combinatória desses domínios de proteína com a nuclease aumentou a eficiência da clivagem de SpCas9 nos sítios-alvo.
Tabela 7. Eficiência de Clivagem Nuclease Sítio-alvo Indel (%) SpCas9 de tipo selvagem POR/sítio #1 3,4 POR/sítio #2 1,3 POR/sítio #3 22,2 CAR/sítio #1 2,1 EMX1/sítio #1 2,2 EMX1/sítio #2 1,1 Fusão HMGN1-SpCas9- box A de HMGB1 POR/sítio #1 28,2 POR/sítio #2 8,3 POR/sítio #3 42,7 CAR/sítio #1 14,3 EMX1/sítio #1 29,0 EMX1/sítio #2 12,1 Fusão HMGN1-SpCas9- domínio globular POR/sítio #1 24,3 central H1 POR/sítio #2 6,5 POR/sítio #3 44,2 CAR/sítio #1 23,9 EMX1/sítio #1 26,9 EMX1/sítio #2 21,0 Fusão HMGN1-SpCas9- domínio de ligação POR/sítio #1 21,5 ao DNA de CHD1 POR/sítio #2 3,6 POR/sítio #3 39,8 CAR/sítio #1 9,0 EMX1/sítio #1 23,5 EMX1/sítio #2 20,2 Exemplo 6. Melhoria da atividade de Streptococcus pasteurianus Cas9 (SpaCas9) usando combinações de domínios de interação de nucleossomos
[196] Streptococcus pasteurianus Cas9 (SpaCas9) (+NLS) foi fundido com o HMGN1 humano (SEQ ID NO: 41) no terminal amino nuclease com o ligante TGSG (SEQ ID NO: 2) entre Cas9 e HMGN1 e com o domínio de box A de HMGB1 humano (SEQ ID NO: 41) ou o domínio globular central da histona H1 humana (SEQ ID NO: 45) ou o domínio de ligação ao DNA da proteína 1 (CHD1) que contém o domínio cromo de levedura (SEQ ID NO: 47) no terminal carboxil nuclease com o ligante LEGGGS (SEQ ID NO: 1) entre Cas9 e cada um dos domínios de proteína. As células K562 humanas (1 x 106) foram transfectadas com o DNA de plasmídeo que codifica cada uma das proteínas de fusão ou a proteína SpaCas9 do tipo selvagem em quantidades de equivalente molar (5,4 e 5,0 µg para cada uma das proteínas de fusão e a proteína Cas9 do tipo selvagem, respectivamente) em combinação com 3 µg de um plasma sgRNA meio para direcionar um sítio genômico (# 1, # 2) no locus oxidorredutase do citocromo humano p450 (POR). A transfecção foi realizada usando nucleofecção em um nucleofector Amaxi. Três dias após a transfecção, as células foram lisadas com uma solução de extração de DNA (QuickExtract™) e a região genômica alvo foi amplificada por PCR. As atividades de clivagem alvo Cas9 (% indels) foram medidas usando ensaios Cel-I. Como resumido na Tabela 8, a fusão combinatória desses domínios de proteína com a nuclease aumentou a eficiência da clivagem SpaCas9 nos sítios-alvo. tabela 8. Eficiência de Clivagem Nuclease Target Site Indel (%) SpaCas9 de tipo selvagem POR/sítio #1 16,6 POR/sítio #2 12,9 Fusão de HMGN1-SpaCas9- box A de POR/sítio #1 20,6 HMGB1 POR/sítio #2 35,8 fusão de HMGN1-SpaCas9- domínio globular POR/sítio #1 28,6 central H1 POR/sítio #2 31,7 Fusão HMGN1-SpCas9- domínio de ligação POR/sítio #1 19,4 ao DNA de CHD1 POR/sítio #2 18,5 Exemplo 7. Melhoria da atividade de Francisella novicida Cpf1 (FnCpf1) usando combinações de domínios de interação de nucleossomos
[197] Francisella novicida Cpf1 (FnCpf1) (+NLS) foi fundida com o HMGN1 humano (SEQ ID NO: 41) no terminal amino nuclease com o ligante TGSG (SEQ ID NO: 2) entre Cpf1 e HMGN1 e com o domínio de box A de HMGB1 humano (SEQ ID NO: 40) ou o domínio globular central da histona H1 humana (SEQ ID NO: 45) ou o domínio de ligação ao DNA da proteína 1 (CHD1) que contém o domínio cromo de levedura (SEQ ID NO: 47) no terminal carboxil nuclease com o ligante LEGGGS (SEQ ID NO: 1) entre Cpf1 e cada um dos domínios de proteína. As células K562 humanas (1 x 106) foram transfectadas com o DNA de plasmídeo que codifica cada uma das proteínas de fusão ou a proteína FnCpf1 do tipo selvagem em quantidades de equivalente molar (5,4 e 5,0 µg para cada uma das proteínas de fusão e a proteína Cas9 do tipo selvagem, respectivamente) em combinação com 3 µg de um plasmídeo sgRNA para atingir um sítio genômico (# 1, # 2, # 3) no locus oxidorredutase do citocromo p450 humano (POR). A transfecção foi realizada usando nucleofecção em um nucleofector Amaxi. Três dias após a transfecção, as células foram lisadas com uma solução de extração de DNA (QuickExtract™) e a região genômica alvo foi amplificada por PCR. As atividades de clivagem alvo Cas9 (% indels) foram medidas usando ensaios Cel-I. Os resultados, como resumido na Tabela 9, mostram que a fusão combinatória desses domínios de proteína com a nuclease aumentou a eficiência da clivagem de FnCpf1 nos sítios-alvo. Tabela 9. Eficiência de Clivagem Nuclease Sítio-alvo Indel (%) FnCpf1 de tipo selvagem POR/sítio #1 2,3 POR/sítio #2 5,3 POR/sítio #3 3,0 Fusão HMGN1-FnCpf1-box A de HMGB1 POR/sítio #1 8,2 POR/sítio #2 12,8 POR/sítio #3 13,2 Fusão HMGN1-FnCpf1-domínio globular POR/sítio #1 8,7 central H1 POR/sítio #2 12,9 POR/sítio #3 13,2 Fusão HMGN1-FnCpf1-domínio de ligação POR/sítio #1 7,7 ao DNA de CHD1 POR/sítio #2 7,5 POR/sítio #3 9,4 Exemplo 8. Melhoria da eficiência de edição de genes de Campylobacter jejuni Cas9 (CjCas9)
[198] Campylobacter jejuni Cas9 (CjCas9) (+NLS) foi fundido com o HMGN1 humano (SEQ ID NO: 41) no terminal amino nuclease com o ligante TGSG (SEQ ID NO: 2) entre Cas9 e HMGN1 e com o domínio de box A de HMGB1 humano (SEQ ID NO: 40) ou o domínio globular central da histona H1 humana (SEQ ID NO: 45) no terminal carboxil nuclease com o ligante LEGGGS (SEQ ID NO: 1) entre Cas9 e cada um dos domínios de proteína. O gRNA de CjCas9 de tipo selvagem foi modificado pela introdução de uma mutação U para C na região de repetição constante do crRNA e uma mutação correspondente de A para G na região 5’ da sequência de tracrRNA. A sequência de sgRNA modificada é: 5'-
UAGAAUAAAGAGUUUGCGGACACUCUGCGGGGUUACAAUCCCC UAAAACCGRUUU-3’. As sequências guia direcionadas a dois sítios diferentes (# 1, # 2) no gene oxidoredutase do citocromo p450 humano (POR) foram clonadas CjCas9 de tipo selvagem e arcabouço de sgRNA modificado, respectivamente. A expressão dos sgRNAs estava sob o controle de um promotor U6. As células K562 humanas (1x106) foram transfectadas com 4 µg de DNA de plasmídeo CjCas9 e 3 µg de um DNA de plasmídeo sgRNA. A transfecção foi realizada usando nucleofecção em um nucleofector Amaxi. Três dias após a transfecção, as células foram lisadas com QuickExtract e as regiões genômicas alvo foram amplificadas por PCR. As atividades de clivagem de DNA alvo de CjCas9 (% indels) foram medidas usando ensaios de Cel-I. Os resultados são apresentados na FIG. 1 e mostram que as proteínas de fusão aumentaram a eficiência de clivagem nos sítios-alvo e que o arcabouço de sgRNA de CjCas9 aumentou efetivamente a eficiência de clivagem de CjCas9 nos sítios-alvo.
[199] A Tabela 10 apresenta as sequências de aminoácidos das proteínas de fusão específicas. Os domínios das proteínas que interagem com os nucleossomos são mostrados em negrito, os ligantes são mostrados em itálico e o NLS é sublinhado. Tabela 10. Proteínas de fusão CRISPR Fusão SpCas9- box A de HMGB1 (SEQ ID NO:61)
GKFEDMAKADKARYEREMKTYIPPKGE Fusão SpCas9-HMGN1 (SEQ ID NO:62)
KGKQAEVANQETKEDLPAENGETKTEESPASDEAGEKEAKSD Fusão SpCas9-HMGN2 (SEQ ID NO:63)
GKADAGKEGNNPAENGDAKTDQAQKAEGAGDAK Fusão SpCas9-HMGN3a (SEQ ID NO:64)
AKGKKEEKQEAGKEGTAPSENGETKAEEAQKTESVDNEGE Fusão SpCas9-HMGN3b (SEQ ID NO:65)
AKGKKEEKQEAGKEGTEN Fusão SpCas9-Histona H1 globular (SEQ ID NO:66)
TKGVGASGSFRLAKSDEP Fusão ISWI-SpCas9 (SEQ ID NO:67)
STKEVLDATLIHQSITGLYETRIDLSQLGGDPKKKRKV Fusão SpCas9-CHD1 (SEQ ID NO:68)
DTTPTPSKKGKGITGSSKKVPGAIHLGRRVDYLLSFLRGGLNTKSPS Fusão HMGN1-SpCas9-box A de HMGB1 (SEQ ID NO:69)
KGKFEDMAKADKARYEREMKTYIPPKGE Fusão HMGN1-SpCas9-Histona H1 globular (SEQ ID NO:70)
KQTKGVGASGSFRLAKSDEP Fusão HMGN1-SpCas9-CDH1 (SEQ ID NO:71)
SSSDTTPTPSKKGKGITGSSKKVPGAIHLGRRVDYLLSFLRGGLNTKSPS Fusão HMGN1-SpaCas9-box A de HMGB1 (SEQ ID NO:72)
DKARYEREMKTYIPPKGE Fusão HMGN1-SpaCas9-Histona H1 globular (SEQ ID NO:73)
GSFRLAKSDEP Fusão HMGN1-SpaCas9-CHD1 (SEQ ID NO:74)
GKGITGSSKKVPGAIHLGRRVDYLLSFLRGGLNTKSPS Fusão HMGN1-FnCpf1-HNGB1 (SEQ ID NO:75)
MKTYIPPKGE Fusão HMGN1-FnCpf1-Histona H1 globular (SEQ ID NO:76)
DEP Fusão HMGN1-FnCpf1-CHD1 (SEQ ID NO:77)
SKKVPGAIHLGRRVDYLLSFLRGGLNTKSPS Fusão HMGN1-CjCas9-box A de HMGB1 (SEQ ID NO:78)
AKEKGKFEDMAKADKARYEREMKTYIPPKGE Fusão HMGN1-CjCas9-Histona H1 globular (SEQ ID NO:79)
Claims (36)
1. Proteína de fusão caracterizada pelo fato de que compreende pelo menos um domínio de proteína de interação com nucleossomo ligado a uma proteína de modificação de DNA programável.
2. Proteína de fusão, de acordo com a reivindicação 1, caracterizada pelo fato de que pelo menos um domínio de proteína de interação com nucleossomo é um domínio de ligação ao DNA de uma proteína box do grupo de alta mobilidade (HMG) (HMGB) escolhida entre HMGB1, HMGB2 ou HMGB3; uma proteína de ligação ao nucleossomo HMG (HMGN) escolhida entre HMGN1, HMGN2, HMGN3a, HMGN3b, HMGN4 ou HMGN5; um domínio globular central a partir de uma variante de histona H1; um domínio de ligação ao DNA a partir de uma proteína do complexo de remodelação da cromatina escolhida do complexo de switch / sacarose não fermentável (SWI/SNF), o complexo de switch de imitação (ISWI), o complexo de ligação de cromodomaina-helicase-DNA (CHD), o complexo remodelação de nucleossomo e desacetilase (NuRD), complexo INO80, complexo SWR1, complexo RSC ou sua combinação.
3. Proteína de fusão, de acordo com a reivindicação 2, caracterizada pelo fato de que pelo menos um domínio de proteína de interação com nucleossomo é domínio box A de HMGB1, proteína HMGN1, proteína HMGN2, proteína HMGN3a, proteína HMGN3b, domínio globular central de histona H1, domínio de ligação ao DNA de proteína ISWI, domínio de ligação ao DNA de proteína CHD1 ou combinação dos mesmos.
4. Proteína de fusão, de acordo com qualquer uma das reivindicações 1 a 3, caracterizada pelo fato de que a proteína de modificação de DNA programável tem atividade de nuclease.
5. Proteína de fusão, de acordo com a reivindicação 4,
caracterizada pelo fato de que a proteína de modificação de DNA programável é uma nuclease ou nickase de repetições palindrômicas curtas e intercaladas regularmente (CRISPR), uma nuclease de dedo de zinco (ZFN), uma nuclease de efetor do tipo ativador de transcrição (TALEN), uma meganuclease ou uma proteína quimérica compreendendo um domínio de ligação a DNA programável ligado a um domínio nuclease.
6. Proteína de fusão, de acordo com qualquer uma das reivindicações 1 a 3, caracterizada pelo fato de que a proteína de modificação de DNA programável tem atividade de não nuclease.
7. Proteína de fusão, de acordo com a reivindicação 6, caracterizada pelo fato de que a proteína de modificação de DNA programável é uma proteína quimérica que compreende um domínio de ligação a DNA programável ligado a um domínio de não nuclease.
8. Proteína de fusão, de acordo com a reivindicação 7, caracterizada pelo fato de que o domínio de ligação ao DNA programável é uma proteína CRISPR modificada para não possuir toda atividade de nuclease, uma proteína de dedo de zinco ou um efetor do tipo ativador de transcrição.
9. Proteína de fusão, de acordo com a reivindicação 7, caracterizada pelo fato de que o domínio não nuclease tem atividade de acetiltransferase, atividade de desacetilase, atividade de metiltransferase, atividade de desmetilase, atividade de quinase, atividade de fosfatase, atividade de ubiquitina ligase, atividade de desubiquitinante, atividade de adenilação, atividade de desadenilação, atividade SUMOilação, atividade deSUMOilação, atividade de ribosilação, atividade de derribosilação, atividade de miristoilação, atividade de desmististoilação, atividade de citrulinação, atividade de helicase, atividade de aminação, atividade de desaminação, atividade de alquilação, atividade de desalquilação, atividade de oxidação,
atividade de ativação transcricional ou atividade de repressão da transcrição.
10. Proteína de fusão, de acordo com a reivindicação 9, caracterizada pelo fato de que o domínio não nuclease tem atividade de citosina desaminase, atividade de histona acetiltransferase, atividade de ativação transcricional ou atividade de repressão transcricional.
11. Proteína de fusão, de acordo com qualquer uma das reivindicações 1 a 10, caracterizada pelo fato de que pelo menos um domínio de proteína de interação com nucleossomo está ligado à proteína de modificação de DNA programável diretamente por meio de uma ligação química, indiretamente por meio de um ligante ou uma combinação dos mesmos.
12. Proteína de fusão, de acordo com qualquer uma das reivindicações 1 a 11, caracterizada pelo fato de que pelo menos um domínio de proteína de interação com nucleossomo está ligado à proteína de modificação de DNA programável em seu terminal N, terminal C, um local interno ou combinação dos mesmos.
13. Proteína de fusão, de acordo com qualquer uma das reivindicações 1 a 12, caracterizada pelo fato de que adicionalmente compreende pelo menos um sinal de localização nuclear, pelo menos um domínio de penetração de células, pelo menos um domínio de marcador ou combinação dos mesmos.
14. Proteína de fusão caracterizada pelo fato de que compreende uma proteína de repetições palindrômicas curtas e intercaladas regularmente agrupada (CRISPR) ligada a pelo menos um domínio de proteína de interação com nucleossomo.
15. Proteína de fusão, de acordo com a reivindicação 14, caracterizada pelo fato de que a proteína CRISPR é uma nuclease ou nickase CRISPR/Cas9 tipo II, ou a proteína CRISPR é uma nuclease ou nickase CRISPR/Cpf1 tipo V.
16. Proteína de fusão, de acordo com as reivindicações 14 ou 15, caracterizada pelo fato de que a proteína CRISPR é uma proteína CRISPR/Cas9 tipo II modificada para não possuir toda a atividade de nuclease e ligada a um domínio não nuclease, ou uma proteína CRISPR/Cpf1 tipo V modificada para não possuir toda a atividade de nuclease e ligada a um domínio não nuclease.
17. Proteína de fusão, de acordo com a reivindicação 16, caracterizada pelo fato de que o domínio não nuclease tem atividade de citosina desaminase, atividade de histona acetiltransferase, atividade de ativação transcricional ou atividade de repressão transcricional.
18. Proteína de fusão, de acordo com qualquer uma das reivindicações 14 a 17, caracterizada pelo fato de que pelo menos um domínio de proteína de interação com nucleossomo é um domínio de ligação a DNA da box do grupo de alta mobilidade (HMG) (HMG), uma proteína HMG de ligação a nucleossomo (HMGN), domínio globular central a partir de uma variante de histona H1, um domínio de ligação ao DNA a partir de uma proteína complexa de remodelação de cromatina ou uma combinação dos mesmos.
19. Proteína de fusão, de acordo com a reivindicação 18, caracterizada pelo fato de que pelo menos um domínio de proteína de interação com nucleossomo é o domínio box de HMGB1, proteína HMGN1, proteína HMGN2, proteína HMGN3a, proteína HMGN3b, domínio globular central de histona H1, domínio de ligação ao DNA da proteína switch de imitação (ISWI), domínio de ligação ao DNA da proteína 1 de cromodomaína-helicase-DNA (CHD1) ou uma combinação dos mesmos.
20. Proteína de fusão, de acordo com qualquer uma das reivindicações 14 a 19, caracterizada pelo fato de que pelo menos um domínio de proteína de interação com nucleossomo está ligado à proteína CRISPR diretamente por meio de uma ligação química,
indiretamente por meio de um ligante, ou uma combinação dos mesmos.
21. Proteína de fusão, de acordo com qualquer uma das reivindicações 14 a 20, caracterizada pelo fato de que pelo menos um domínio de proteína de interação com nucleossomo está ligado à proteína CRISPR em seu terminal N, terminal C, um local interno ou uma combinação dos mesmos.
22. Proteína de fusão, de acordo com qualquer uma das reivindicações 14 a 21, caracterizada pelo fato de que adicionalmente compreende pelo menos um sinal de localização nuclear, pelo menos um domínio de penetração de célula, pelo menos um domínio de marcador ou uma combinação dos mesmos.
23. Proteína de fusão, de acordo com qualquer uma das reivindicações 14 a 22, caracterizada pelo fato de que a proteína CRISPR é Streptococcus pyogenes Cas9 (SpCas9), Streptococcus thermophilus Cas9 (StCas9), Streptococcus pasteurianus (SpaCas9), Campylobacter jejuni Cas9 (CjCas9), Staphylococcus aureus (SaCas9), Francisella novicida Cas9 (FnCas9), Neisseria cinerea Cas9 (NcCas9), Neisseria meningitis Cas9 (NmCas9), Francisella novicida Cpf1 (FnCpf1), Acidaminococcus sp. Cpf1 (AsCpf1), ou Lachnospiraceae bacterium ND2006 Cpf1 (LbCpf1).
24. Proteína de fusão, de acordo com qualquer uma das reivindicações 14 a 23, caracterizada pelo fato de que a proteína de fusão tem uma sequência de aminoácidos com pelo menos cerca de 90% de identidade de sequência com a SEQ ID NO: 61, SEQ ID NO: 62, SEQ ID NO: 63, SEQ ID NO: 64, SEQ ID NO: 65, SEQ ID NO: 66, SEQ ID NO: 67, SEQ ID NO: 68, SEQ ID NO: 69, SEQ ID NO: 70, SEQ ID NO: 71, SEQ ID NO: 72, SEQ ID NO: 73, SEQ ID NO: 74, SEQ ID NO: 75, SEQ ID NO: 76, SEQ ID NO: 77, SEQ ID NO: 78 ou SEQ ID NO: 79.
25. Proteína de fusão, de acordo com qualquer uma das reivindicações 14 a 24, caracterizada pelo fato de que a proteína de fusão tem uma sequência de aminoácidos conforme estabelecido na SEQ ID NO: 61, SEQ ID NO: 62, SEQ ID NO: 63, SEQ ID NO: 63, SEQ ID NO: 64, SEQ ID NO: 65, SEQ ID NO: 66, SEQ ID NO: 67, SEQ ID NO: 68, SEQ ID NO: 69, SEQ ID NO: 70, SEQ ID NO: 71, SEQ ID NO: 72, SEQ ID NO: 73, SEQ ID NO: 74, SEQ ID NO: 75, SEQ ID NO: 76, SEQ ID NO: 77, SEQ ID NO: 78 ou SEQ ID NO: 79.
26. Complexo caracterizado pelo fato de que compreende pelo menos uma proteína de fusão como definida em qualquer uma das reivindicações 14 a 25 e pelo menos um RNA guia.
27. Ácido nucleico caracterizado pelo fato de que codifica a proteína de fusão, como definida em qualquer uma das reivindicações 1 a 25.
28. Ácido nucleico, de acordo com a reivindicação 27, caracterizado pelo fato de que é um códon otimizado para tradução em uma célula eucariótica.
29. Ácido nucleico de acordo com as reivindicações 27 ou 28, caracterizado pelo fato de que faz parte de um vetor viral, um vetor plasmídico ou um RNA autorreplicante.
30. Método para aumentar a eficiência do genoma direcionado ou modificação epigenética em uma célula eucariótica, o método compreendendo a introdução na célula eucariótica de pelo menos uma proteína de fusão, como definida em qualquer uma das reivindicações 1 a 25, ou ácido nucleico que codifica a pelo menos uma proteína de fusão, como definida em qualquer uma das reivindicações 27 a 29, caracterizado pelo fato de que a proteína de modificação de DNA programável da pelo menos uma proteína de fusão é direcionada para uma sequência cromossômica alvo e pelo menos um domínio de proteína de interação com nucleossomo da pelo menos uma proteína de fusão altera a estrutura nucleossômica ou cromatina de modo que a pelo menos uma proteína de fusão aumente o acesso à sequência cromossômica alvo, aumentando assim a eficiência do genoma direcionado ou modificação epigenética.
31. Método, de acordo com a reivindicação 30, caracterizado pelo fato de que a proteína de modificação de DNA da pelo menos uma proteína de fusão compreende uma proteína CRISPR e o método adicionalmente compreende a introdução na célula eucariótica de pelo menos um RNA guia ou ácido nucleico que codifica o pelo menos um RNA guia.
32. Método, de acordo com a reivindicação 30 ou 31, caracterizado pelo fato de que o método adicionalmente compreende a introdução na célula eucariótica de pelo menos um polinucleotídeo doador, o polinucleotídeo doador compreendendo pelo menos uma sequência doadora.
33. Método, de acordo com qualquer uma das reivindicações 30 a 32, caracterizado pelo fato de que a célula eucariótica é in vitro.
34. Método, de acordo com qualquer uma das reivindicações 30 a 32, caracterizado pelo fato de que a célula eucariótica é in vivo.
35. Método, de acordo com qualquer uma das reivindicações 30 a 34, caracterizado pelo fato de que a célula eucariótica é uma célula de mamífero.
36. Método, de acordo com qualquer uma das reivindicações 30 a 34, caracterizado pelo fato de que a célula eucariótica é uma célula humana.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762531222P | 2017-07-11 | 2017-07-11 | |
US62/531,222 | 2017-07-11 | ||
PCT/US2018/041454 WO2019014230A1 (en) | 2017-07-11 | 2018-07-10 | USE OF DOMAINS OF PROTEINS INTERACTING WITH NUCLEOSOMES TO IMPROVE THE TARGETED MODIFICATION OF THE GENOME |
Publications (1)
Publication Number | Publication Date |
---|---|
BR112019028261A2 true BR112019028261A2 (pt) | 2020-07-14 |
Family
ID=62916578
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
BR112019028261-0A BR112019028261A2 (pt) | 2017-07-11 | 2018-07-10 | uso de domínios de proteína de interação com nucleossomo para melhorar modificação de genoma direcionada |
Country Status (17)
Country | Link |
---|---|
US (3) | US10604752B2 (pt) |
EP (2) | EP3428274B1 (pt) |
JP (2) | JP6994560B2 (pt) |
KR (3) | KR102655021B1 (pt) |
CN (1) | CN111183226A (pt) |
AU (3) | AU2018299995B2 (pt) |
BR (1) | BR112019028261A2 (pt) |
CA (1) | CA3066790C (pt) |
DK (1) | DK3428274T3 (pt) |
ES (1) | ES2901629T3 (pt) |
GB (3) | GB2598847B (pt) |
IL (2) | IL271197B2 (pt) |
LT (1) | LT3428274T (pt) |
PL (1) | PL3428274T3 (pt) |
PT (1) | PT3428274T (pt) |
SG (1) | SG11201911864PA (pt) |
WO (1) | WO2019014230A1 (pt) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019014230A1 (en) | 2017-07-11 | 2019-01-17 | Sigma-Aldrich Co. Llc | USE OF DOMAINS OF PROTEINS INTERACTING WITH NUCLEOSOMES TO IMPROVE THE TARGETED MODIFICATION OF THE GENOME |
EP3652312A1 (en) | 2017-07-14 | 2020-05-20 | Editas Medicine, Inc. | Systems and methods for targeted integration and genome editing and detection thereof using integrated priming sites |
BR112020021229A2 (pt) | 2018-04-19 | 2021-02-02 | The Regents Of The University Of California | composições e métodos para edição de genes |
WO2020036653A2 (en) * | 2018-04-25 | 2020-02-20 | The Regents Of The University Of California | Improved method for homology directed repair in cells |
WO2020187272A1 (zh) * | 2019-03-19 | 2020-09-24 | 上海邦耀生物科技有限公司 | 一种用于基因治疗的融合蛋白及其应用 |
CN111718420B (zh) * | 2019-03-19 | 2021-09-14 | 华东师范大学 | 一种用于基因治疗的融合蛋白及其应用 |
CN111718418B (zh) * | 2019-03-19 | 2021-08-27 | 华东师范大学 | 一种增强基因编辑的融合蛋白及其应用 |
CN114174500A (zh) * | 2019-05-13 | 2022-03-11 | Emd密理博公司 | 编码crispr蛋白的合成的自复制rna载体及其用途 |
WO2021224506A1 (en) * | 2020-05-08 | 2021-11-11 | Universitat Pompeu Fabra | Crispr-cas homology directed repair enhancer |
CN114507689B (zh) * | 2022-01-27 | 2024-01-16 | 山东大学 | 一种提高真核生物基因编辑效率的方法及其应用 |
CN115716880A (zh) * | 2022-12-07 | 2023-02-28 | 云舟生物科技(广州)股份有限公司 | 一种核定位荧光蛋白及其应用 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1456374A4 (en) | 2001-11-26 | 2005-08-17 | Advanced Cell Tech Inc | METHODS FOR THE PRODUCTION AND USE OF REPROGRAMME HUMAN SOMATIC CELL CORES AND AUTOLOGOUS AND ISOGENIC HUMAN STEM CELLS |
WO2004094613A2 (en) * | 2003-04-22 | 2004-11-04 | Ibc Pharmaceuticals | Polyvalent protein complex |
EP2834357B1 (en) * | 2012-04-04 | 2017-12-27 | Life Technologies Corporation | Tal-effector assembly platform, customized services, kits and assays |
JP2015527889A (ja) * | 2012-07-25 | 2015-09-24 | ザ ブロード インスティテュート, インコーポレイテッド | 誘導可能なdna結合タンパク質およびゲノム撹乱ツール、ならびにそれらの適用 |
CA2907198C (en) * | 2013-03-15 | 2019-12-10 | The General Hospital Corporation | Using rna-guided foki nucleases (rfns) to increase specificity for rna-guided genome editing |
US20140273230A1 (en) * | 2013-03-15 | 2014-09-18 | Sigma-Aldrich Co., Llc | Crispr-based genome modification and regulation |
US20160237455A1 (en) | 2013-09-27 | 2016-08-18 | Editas Medicine, Inc. | Crispr-related methods and compositions |
WO2016036754A1 (en) * | 2014-09-02 | 2016-03-10 | The Regents Of The University Of California | Methods and compositions for rna-directed target dna modification |
WO2016049251A1 (en) * | 2014-09-24 | 2016-03-31 | The Broad Institute Inc. | Delivery, use and therapeutic applications of the crispr-cas systems and compositions for modeling mutations in leukocytes |
US20180250424A1 (en) | 2014-10-10 | 2018-09-06 | Editas Medicine, Inc. | Compositions and methods for promoting homology directed repair |
US10190106B2 (en) * | 2014-12-22 | 2019-01-29 | Univesity Of Massachusetts | Cas9-DNA targeting unit chimeras |
EP3929286A1 (en) | 2015-06-17 | 2021-12-29 | Poseida Therapeutics, Inc. | Compositions and methods for directing proteins to specific loci in the genome |
WO2017031483A1 (en) | 2015-08-20 | 2017-02-23 | Applied Stemcell, Inc. | Nuclease with enhanced efficiency of genome editing |
WO2019014230A1 (en) | 2017-07-11 | 2019-01-17 | Sigma-Aldrich Co. Llc | USE OF DOMAINS OF PROTEINS INTERACTING WITH NUCLEOSOMES TO IMPROVE THE TARGETED MODIFICATION OF THE GENOME |
-
2018
- 2018-07-10 WO PCT/US2018/041454 patent/WO2019014230A1/en active Application Filing
- 2018-07-10 AU AU2018299995A patent/AU2018299995B2/en active Active
- 2018-07-10 IL IL271197A patent/IL271197B2/en unknown
- 2018-07-10 CA CA3066790A patent/CA3066790C/en active Active
- 2018-07-10 CN CN201880046339.1A patent/CN111183226A/zh active Pending
- 2018-07-10 JP JP2020501142A patent/JP6994560B2/ja active Active
- 2018-07-10 BR BR112019028261-0A patent/BR112019028261A2/pt unknown
- 2018-07-10 KR KR1020237012751A patent/KR102655021B1/ko active IP Right Grant
- 2018-07-10 IL IL309801A patent/IL309801A/en unknown
- 2018-07-10 SG SG11201911864PA patent/SG11201911864PA/en unknown
- 2018-07-10 KR KR1020207002645A patent/KR102523217B1/ko active IP Right Grant
- 2018-07-10 US US16/031,819 patent/US10604752B2/en active Active
- 2018-07-10 KR KR1020247010966A patent/KR20240046316A/ko active Search and Examination
- 2018-07-11 EP EP18182999.5A patent/EP3428274B1/en active Active
- 2018-07-11 ES ES18182999T patent/ES2901629T3/es active Active
- 2018-07-11 GB GB2114520.6A patent/GB2598847B/en active Active
- 2018-07-11 GB GB1811358.9A patent/GB2567917B/en active Active
- 2018-07-11 DK DK18182999.5T patent/DK3428274T3/da active
- 2018-07-11 GB GB2103935.9A patent/GB2593814B/en active Active
- 2018-07-11 EP EP21193940.0A patent/EP3988656A1/en active Pending
- 2018-07-11 LT LTEP18182999.5T patent/LT3428274T/lt unknown
- 2018-07-11 PL PL18182999T patent/PL3428274T3/pl unknown
- 2018-07-11 PT PT181829995T patent/PT3428274T/pt unknown
-
2020
- 2020-02-18 US US16/793,253 patent/US20200208135A1/en active Pending
- 2020-02-18 US US16/793,272 patent/US20210024916A1/en active Pending
-
2021
- 2021-10-06 AU AU2021245148A patent/AU2021245148B2/en active Active
- 2021-12-13 JP JP2021201415A patent/JP7469285B2/ja active Active
-
2022
- 2022-02-09 AU AU2022200851A patent/AU2022200851B2/en active Active
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7220737B2 (ja) | 標的ゲノム修飾を増強するためのプログラム可能なdna結合タンパク質の使用 | |
JP7469285B2 (ja) | 標的化されたゲノム修飾を増強するためのヌクレオソーム相互作用タンパク質ドメインの使用 | |
BR112021016019A2 (pt) | Sistemas e proteínas de fusão crispr/cas | |
JP2024096783A (ja) | 標的化されたゲノム修飾を増強するためのヌクレオソーム相互作用タンパク質ドメインの使用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
B350 | Update of information on the portal [chapter 15.35 patent gazette] | ||
B06W | Patent application suspended after preliminary examination (for patents with searches from other patent authorities) chapter 6.23 patent gazette] |