BR112018074531B1 - composição que compreende um sistema de nuclease e seu uso, kit, método in vitro para aumentar a eficiência da modificação do genoma-alvo e método para detectar uma sequência cromossômica - Google Patents
composição que compreende um sistema de nuclease e seu uso, kit, método in vitro para aumentar a eficiência da modificação do genoma-alvo e método para detectar uma sequência cromossômica Download PDFInfo
- Publication number
- BR112018074531B1 BR112018074531B1 BR112018074531-6A BR112018074531A BR112018074531B1 BR 112018074531 B1 BR112018074531 B1 BR 112018074531B1 BR 112018074531 A BR112018074531 A BR 112018074531A BR 112018074531 B1 BR112018074531 B1 BR 112018074531B1
- Authority
- BR
- Brazil
- Prior art keywords
- crispr
- protein
- programmable dna
- type
- sequence
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 140
- 239000000203 mixture Substances 0.000 title claims abstract description 59
- 101710163270 Nuclease Proteins 0.000 title claims description 157
- 230000002759 chromosomal effect Effects 0.000 title claims description 124
- 238000000338 in vitro Methods 0.000 title claims description 11
- 102000052510 DNA-Binding Proteins Human genes 0.000 claims abstract description 172
- 210000003527 eukaryotic cell Anatomy 0.000 claims abstract description 36
- 108090000623 proteins and genes Proteins 0.000 claims description 268
- 102000004169 proteins and genes Human genes 0.000 claims description 246
- 101710096438 DNA-binding protein Proteins 0.000 claims description 138
- 108020004414 DNA Proteins 0.000 claims description 118
- 230000008836 DNA modification Effects 0.000 claims description 106
- 108020005004 Guide RNA Proteins 0.000 claims description 91
- 108091033409 CRISPR Proteins 0.000 claims description 90
- 150000007523 nucleic acids Chemical class 0.000 claims description 86
- 102000039446 nucleic acids Human genes 0.000 claims description 78
- 108020004707 nucleic acids Proteins 0.000 claims description 78
- 239000003550 marker Substances 0.000 claims description 74
- 230000027455 binding Effects 0.000 claims description 62
- 230000004568 DNA-binding Effects 0.000 claims description 42
- 230000004048 modification Effects 0.000 claims description 40
- 238000012986 modification Methods 0.000 claims description 40
- 230000035772 mutation Effects 0.000 claims description 34
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 22
- 230000001965 increasing effect Effects 0.000 claims description 22
- 210000005260 human cell Anatomy 0.000 claims description 21
- 210000004962 mammalian cell Anatomy 0.000 claims description 14
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 claims description 13
- 108020004999 messenger RNA Proteins 0.000 claims description 13
- 239000013600 plasmid vector Substances 0.000 claims description 12
- 239000013603 viral vector Substances 0.000 claims description 12
- 241000589599 Francisella tularensis subsp. novicida Species 0.000 claims description 9
- 241000193996 Streptococcus pyogenes Species 0.000 claims description 8
- 241000589875 Campylobacter jejuni Species 0.000 claims description 6
- 102220605874 Cytosolic arginine sensor for mTORC1 subunit 2_D10A_mutation Human genes 0.000 claims description 5
- 238000011282 treatment Methods 0.000 claims description 5
- 210000000349 chromosome Anatomy 0.000 claims description 3
- 208000007056 sickle cell anemia Diseases 0.000 claims description 3
- 241000589601 Francisella Species 0.000 claims description 2
- 208000023105 Huntington disease Diseases 0.000 claims description 2
- 208000007014 Retinitis pigmentosa Diseases 0.000 claims description 2
- 238000010354 CRISPR gene editing Methods 0.000 claims 42
- 208000002491 severe combined immunodeficiency Diseases 0.000 claims 2
- 238000002560 therapeutic procedure Methods 0.000 claims 2
- 241000194017 Streptococcus Species 0.000 claims 1
- 208000002903 Thalassemia Diseases 0.000 claims 1
- 108700020911 DNA-Binding Proteins Proteins 0.000 abstract description 34
- 238000001514 detection method Methods 0.000 abstract description 26
- 230000000694 effects Effects 0.000 description 184
- 210000004027 cell Anatomy 0.000 description 132
- 125000003729 nucleotide group Chemical group 0.000 description 60
- 239000002773 nucleotide Substances 0.000 description 57
- 108020001507 fusion proteins Proteins 0.000 description 32
- 102000037865 fusion proteins Human genes 0.000 description 32
- 108010042407 Endonucleases Proteins 0.000 description 28
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 26
- 238000011144 upstream manufacturing Methods 0.000 description 24
- 239000013612 plasmid Substances 0.000 description 23
- 238000010459 TALEN Methods 0.000 description 21
- 230000010354 integration Effects 0.000 description 20
- 102000004533 Endonucleases Human genes 0.000 description 19
- 108010077544 Chromatin Proteins 0.000 description 18
- 210000003483 chromatin Anatomy 0.000 description 18
- 238000003776 cleavage reaction Methods 0.000 description 18
- 230000007017 scission Effects 0.000 description 18
- 108010033040 Histones Proteins 0.000 description 17
- 108091028043 Nucleic acid sequence Proteins 0.000 description 17
- 230000004049 epigenetic modification Effects 0.000 description 17
- 102000040430 polynucleotide Human genes 0.000 description 17
- 108091033319 polynucleotide Proteins 0.000 description 17
- 239000002157 polynucleotide Substances 0.000 description 17
- 238000013518 transcription Methods 0.000 description 17
- 230000035897 transcription Effects 0.000 description 17
- 238000001890 transfection Methods 0.000 description 17
- 101710185494 Zinc finger protein Proteins 0.000 description 16
- 102100023597 Zinc finger protein 816 Human genes 0.000 description 16
- 230000004913 activation Effects 0.000 description 15
- 238000001994 activation Methods 0.000 description 15
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 15
- 230000014509 gene expression Effects 0.000 description 15
- 239000013598 vector Substances 0.000 description 14
- 230000009977 dual effect Effects 0.000 description 13
- 108060004795 Methyltransferase Proteins 0.000 description 12
- 238000012217 deletion Methods 0.000 description 12
- 230000037430 deletion Effects 0.000 description 12
- 239000012636 effector Substances 0.000 description 12
- 108010061979 CEL I nuclease Proteins 0.000 description 11
- 239000013611 chromosomal DNA Substances 0.000 description 11
- 108091028113 Trans-activating crRNA Proteins 0.000 description 10
- 201000010099 disease Diseases 0.000 description 10
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 description 10
- 102000053602 DNA Human genes 0.000 description 9
- 102100031780 Endonuclease Human genes 0.000 description 9
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 9
- 108010073062 Transcription Activator-Like Effectors Proteins 0.000 description 9
- 230000003993 interaction Effects 0.000 description 9
- 230000002103 transcriptional effect Effects 0.000 description 9
- 102000000311 Cytosine Deaminase Human genes 0.000 description 8
- 108010080611 Cytosine Deaminase Proteins 0.000 description 8
- 102100021519 Hemoglobin subunit beta Human genes 0.000 description 8
- 108090000246 Histone acetyltransferases Proteins 0.000 description 8
- 102000003893 Histone acetyltransferases Human genes 0.000 description 8
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 8
- 108091006047 fluorescent proteins Proteins 0.000 description 8
- 102000034287 fluorescent proteins Human genes 0.000 description 8
- 230000035515 penetration Effects 0.000 description 8
- 229910052725 zinc Inorganic materials 0.000 description 8
- 239000011701 zinc Substances 0.000 description 8
- 102000016397 Methyltransferase Human genes 0.000 description 7
- 108091027544 Subgenomic mRNA Proteins 0.000 description 7
- 239000012190 activator Substances 0.000 description 7
- 150000001413 amino acids Chemical class 0.000 description 7
- 230000029087 digestion Effects 0.000 description 7
- 230000005782 double-strand break Effects 0.000 description 7
- 238000010362 genome editing Methods 0.000 description 7
- 230000001105 regulatory effect Effects 0.000 description 7
- 108091006107 transcriptional repressors Proteins 0.000 description 7
- 241000700159 Rattus Species 0.000 description 6
- 230000006154 adenylylation Effects 0.000 description 6
- 238000005576 amination reaction Methods 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 6
- 238000003556 assay Methods 0.000 description 6
- 238000002487 chromatin immunoprecipitation Methods 0.000 description 6
- 230000000295 complement effect Effects 0.000 description 6
- 229920002401 polyacrylamide Polymers 0.000 description 6
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 6
- 125000002652 ribonucleotide group Chemical group 0.000 description 6
- 230000008685 targeting Effects 0.000 description 6
- 108091026890 Coding region Proteins 0.000 description 5
- 101000615488 Homo sapiens Methyl-CpG-binding domain protein 2 Proteins 0.000 description 5
- 102100025169 Max-binding protein MNT Human genes 0.000 description 5
- 102100021299 Methyl-CpG-binding domain protein 2 Human genes 0.000 description 5
- 230000010718 Oxidation Activity Effects 0.000 description 5
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 5
- 108010083111 Ubiquitin-Protein Ligases Proteins 0.000 description 5
- 102000006275 Ubiquitin-Protein Ligases Human genes 0.000 description 5
- 230000029936 alkylation Effects 0.000 description 5
- 238000005804 alkylation reaction Methods 0.000 description 5
- 230000020335 dealkylation Effects 0.000 description 5
- 238000006900 dealkylation reaction Methods 0.000 description 5
- 230000009615 deamination Effects 0.000 description 5
- 238000006481 deamination reaction Methods 0.000 description 5
- 230000009504 deubiquitination Effects 0.000 description 5
- 208000035475 disorder Diseases 0.000 description 5
- 230000001404 mediated effect Effects 0.000 description 5
- 230000007498 myristoylation Effects 0.000 description 5
- 230000001718 repressive effect Effects 0.000 description 5
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 4
- 108010047956 Nucleosomes Proteins 0.000 description 4
- 108091034117 Oligonucleotide Proteins 0.000 description 4
- 102000004160 Phosphoric Monoester Hydrolases Human genes 0.000 description 4
- 108090000608 Phosphoric Monoester Hydrolases Proteins 0.000 description 4
- 108091000080 Phosphotransferase Proteins 0.000 description 4
- 102000005421 acetyltransferase Human genes 0.000 description 4
- 108020002494 acetyltransferase Proteins 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 230000006329 citrullination Effects 0.000 description 4
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 4
- 238000003780 insertion Methods 0.000 description 4
- 230000037431 insertion Effects 0.000 description 4
- 210000003292 kidney cell Anatomy 0.000 description 4
- 210000001623 nucleosome Anatomy 0.000 description 4
- 230000009437 off-target effect Effects 0.000 description 4
- 102000020233 phosphotransferase Human genes 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 108010054624 red fluorescent protein Proteins 0.000 description 4
- 230000008439 repair process Effects 0.000 description 4
- 210000000130 stem cell Anatomy 0.000 description 4
- 239000000126 substance Substances 0.000 description 4
- 230000010741 sumoylation Effects 0.000 description 4
- 108091023037 Aptamer Proteins 0.000 description 3
- 241000282465 Canis Species 0.000 description 3
- 102000014914 Carrier Proteins Human genes 0.000 description 3
- 241000196324 Embryophyta Species 0.000 description 3
- 102000004190 Enzymes Human genes 0.000 description 3
- 108090000790 Enzymes Proteins 0.000 description 3
- WSFSSNUMVMOOMR-UHFFFAOYSA-N Formaldehyde Chemical compound O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 description 3
- 101000882390 Homo sapiens Histone acetyltransferase p300 Proteins 0.000 description 3
- 101001000998 Homo sapiens Protein phosphatase 1 regulatory subunit 12C Proteins 0.000 description 3
- 206010025323 Lymphomas Diseases 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 3
- 206010035226 Plasma cell myeloma Diseases 0.000 description 3
- 102100035620 Protein phosphatase 1 regulatory subunit 12C Human genes 0.000 description 3
- 108091028664 Ribonucleotide Proteins 0.000 description 3
- 125000000539 amino acid group Chemical group 0.000 description 3
- 230000001580 bacterial effect Effects 0.000 description 3
- 108091008324 binding proteins Proteins 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 239000003153 chemical reaction reagent Substances 0.000 description 3
- 238000004624 confocal microscopy Methods 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 230000029180 desumoylation Effects 0.000 description 3
- 230000001973 epigenetic effect Effects 0.000 description 3
- 230000004927 fusion Effects 0.000 description 3
- 238000003384 imaging method Methods 0.000 description 3
- 238000010166 immunofluorescence Methods 0.000 description 3
- 238000011065 in-situ storage Methods 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- -1 meganucleases Proteins 0.000 description 3
- 238000000386 microscopy Methods 0.000 description 3
- 239000000178 monomer Substances 0.000 description 3
- 201000000050 myeloid neoplasm Diseases 0.000 description 3
- 230000008488 polyadenylation Effects 0.000 description 3
- 229920000642 polymer Polymers 0.000 description 3
- 230000010076 replication Effects 0.000 description 3
- 108091008146 restriction endonucleases Proteins 0.000 description 3
- 239000002336 ribonucleotide Substances 0.000 description 3
- 230000035939 shock Effects 0.000 description 3
- 238000006467 substitution reaction Methods 0.000 description 3
- VGIRNWJSIRVFRT-UHFFFAOYSA-N 2',7'-difluorofluorescein Chemical compound OC(=O)C1=CC=CC=C1C1=C2C=C(F)C(=O)C=C2OC2=CC(O)=C(F)C=C21 VGIRNWJSIRVFRT-UHFFFAOYSA-N 0.000 description 2
- 101710169336 5'-deoxyadenosine deaminase Proteins 0.000 description 2
- 241000093740 Acidaminococcus sp. Species 0.000 description 2
- 241000282693 Cercopithecidae Species 0.000 description 2
- 241000699800 Cricetinae Species 0.000 description 2
- 102000005636 Cyclic AMP Response Element-Binding Protein Human genes 0.000 description 2
- 108010045171 Cyclic AMP Response Element-Binding Protein Proteins 0.000 description 2
- 241000701022 Cytomegalovirus Species 0.000 description 2
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 2
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 2
- SHIBSTMRCDJXLN-UHFFFAOYSA-N Digoxigenin Natural products C1CC(C2C(C3(C)CCC(O)CC3CC2)CC2O)(O)C2(C)C1C1=CC(=O)OC1 SHIBSTMRCDJXLN-UHFFFAOYSA-N 0.000 description 2
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 2
- 206010056740 Genital discharge Diseases 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 2
- 108010068250 Herpes Simplex Virus Protein Vmw65 Proteins 0.000 description 2
- 241000238631 Hexapoda Species 0.000 description 2
- 102100038885 Histone acetyltransferase p300 Human genes 0.000 description 2
- 101000978776 Mus musculus Neurogenic locus notch homolog protein 1 Proteins 0.000 description 2
- 108091093037 Peptide nucleic acid Proteins 0.000 description 2
- 102000011755 Phosphoglycerate Kinase Human genes 0.000 description 2
- 229930185560 Pseudouridine Natural products 0.000 description 2
- PTJWIQPHWPFNBW-UHFFFAOYSA-N Pseudouridine C Natural products OC1C(O)C(CO)OC1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-UHFFFAOYSA-N 0.000 description 2
- 102000014450 RNA Polymerase III Human genes 0.000 description 2
- 108010078067 RNA Polymerase III Proteins 0.000 description 2
- 101100166147 Streptococcus thermophilus cas9 gene Proteins 0.000 description 2
- 101001099217 Thermotoga maritima (strain ATCC 43589 / DSM 3109 / JCM 10099 / NBRC 100826 / MSB8) Triosephosphate isomerase Proteins 0.000 description 2
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 2
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- WGDUUQDYDIIBKT-UHFFFAOYSA-N beta-Pseudouridine Natural products OC1OC(CN2C=CC(=O)NC2=O)C(O)C1O WGDUUQDYDIIBKT-UHFFFAOYSA-N 0.000 description 2
- 230000003115 biocidal effect Effects 0.000 description 2
- 230000031018 biological processes and functions Effects 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 2
- 229960002685 biotin Drugs 0.000 description 2
- 235000020958 biotin Nutrition 0.000 description 2
- 239000011616 biotin Substances 0.000 description 2
- 108010006025 bovine growth hormone Proteins 0.000 description 2
- 210000000481 breast Anatomy 0.000 description 2
- 102100029387 cAMP-responsive element modulator Human genes 0.000 description 2
- 101710152311 cAMP-responsive element modulator Proteins 0.000 description 2
- 238000004113 cell culture Methods 0.000 description 2
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 229940104302 cytosine Drugs 0.000 description 2
- 238000004925 denaturation Methods 0.000 description 2
- 230000036425 denaturation Effects 0.000 description 2
- 239000005547 deoxyribonucleotide Substances 0.000 description 2
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 2
- 238000002405 diagnostic procedure Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- QONQRTHLHBTMGP-UHFFFAOYSA-N digitoxigenin Natural products CC12CCC(C3(CCC(O)CC3CC3)C)C3C11OC1CC2C1=CC(=O)OC1 QONQRTHLHBTMGP-UHFFFAOYSA-N 0.000 description 2
- SHIBSTMRCDJXLN-KCZCNTNESA-N digoxigenin Chemical compound C1([C@@H]2[C@@]3([C@@](CC2)(O)[C@H]2[C@@H]([C@@]4(C)CC[C@H](O)C[C@H]4CC2)C[C@H]3O)C)=CC(=O)OC1 SHIBSTMRCDJXLN-KCZCNTNESA-N 0.000 description 2
- 238000006471 dimerization reaction Methods 0.000 description 2
- 210000001671 embryonic stem cell Anatomy 0.000 description 2
- 210000002950 fibroblast Anatomy 0.000 description 2
- 108010021843 fluorescent protein 583 Proteins 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 2
- 239000010931 gold Substances 0.000 description 2
- 229910052737 gold Inorganic materials 0.000 description 2
- 125000005843 halogen group Chemical group 0.000 description 2
- 206010073071 hepatocellular carcinoma Diseases 0.000 description 2
- 230000006195 histone acetylation Effects 0.000 description 2
- 238000009396 hybridization Methods 0.000 description 2
- 229910052739 hydrogen Inorganic materials 0.000 description 2
- 239000001257 hydrogen Substances 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- 210000003734 kidney Anatomy 0.000 description 2
- 238000001638 lipofection Methods 0.000 description 2
- 239000002502 liposome Substances 0.000 description 2
- 210000005229 liver cell Anatomy 0.000 description 2
- 210000001161 mammalian embryo Anatomy 0.000 description 2
- 201000001441 melanoma Diseases 0.000 description 2
- 239000003607 modifier Substances 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 238000002703 mutagenesis Methods 0.000 description 2
- 231100000350 mutagenesis Toxicity 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 201000008968 osteosarcoma Diseases 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 229920001184 polypeptide Polymers 0.000 description 2
- 108090000765 processed proteins & peptides Proteins 0.000 description 2
- 102000004196 processed proteins & peptides Human genes 0.000 description 2
- 238000000159 protein binding assay Methods 0.000 description 2
- 230000009145 protein modification Effects 0.000 description 2
- PTJWIQPHWPFNBW-GBNDHIKLSA-N pseudouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-GBNDHIKLSA-N 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 150000003212 purines Chemical class 0.000 description 2
- 239000002096 quantum dot Substances 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 229910052594 sapphire Inorganic materials 0.000 description 2
- 239000010980 sapphire Substances 0.000 description 2
- MPLHNVLQVRSVEE-UHFFFAOYSA-N texas red Chemical compound [O-]S(=O)(=O)C1=CC(S(Cl)(=O)=O)=CC=C1C(C1=CC=2CCCN3CCCC(C=23)=C1O1)=C2C1=C(CCC1)C3=[N+]1CCCC3=C2 MPLHNVLQVRSVEE-UHFFFAOYSA-N 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- 230000005030 transcription termination Effects 0.000 description 2
- 238000003151 transfection method Methods 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 230000014616 translation Effects 0.000 description 2
- 239000003981 vehicle Substances 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- 108091005957 yellow fluorescent proteins Proteins 0.000 description 2
- RAVVEEJGALCVIN-AGVBWZICSA-N (2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-5-amino-2-[[(2s)-2-[[(2s)-2-[[(2s)-6-amino-2-[[(2s)-6-amino-2-[[(2s)-2-[[2-[[(2s)-2-amino-3-(4-hydroxyphenyl)propanoyl]amino]acetyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]hexanoyl]amino]hexanoyl]amino]-5-(diamino Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCN=C(N)N)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 RAVVEEJGALCVIN-AGVBWZICSA-N 0.000 description 1
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 1
- YMHOBZXQZVXHBM-UHFFFAOYSA-N 2,5-dimethoxy-4-bromophenethylamine Chemical compound COC1=CC(CCN)=C(OC)C=C1Br YMHOBZXQZVXHBM-UHFFFAOYSA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- 102000012758 APOBEC-1 Deaminase Human genes 0.000 description 1
- 108010079649 APOBEC-1 Deaminase Proteins 0.000 description 1
- 241001135190 Acetohalobium Species 0.000 description 1
- 101000860090 Acidaminococcus sp. (strain BV3L6) CRISPR-associated endonuclease Cas12a Proteins 0.000 description 1
- 241000093877 Acidithiobacillus sp. Species 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 102000055025 Adenosine deaminases Human genes 0.000 description 1
- 241000862484 Alicyclobacillus sp. Species 0.000 description 1
- 101000935845 Aliivibrio fischeri Blue fluorescence protein Proteins 0.000 description 1
- 241001655243 Allochromatium Species 0.000 description 1
- 241000099238 Ammonifex sp. Species 0.000 description 1
- 241000192531 Anabaena sp. Species 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- 241001495183 Arthrospira sp. Species 0.000 description 1
- 108091005950 Azurite Proteins 0.000 description 1
- 241000194110 Bacillus sp. (in: Bacteria) Species 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 1
- 101100381481 Caenorhabditis elegans baz-2 gene Proteins 0.000 description 1
- 241000589994 Campylobacter sp. Species 0.000 description 1
- 201000009030 Carcinoma Diseases 0.000 description 1
- 108091005944 Cerulean Proteins 0.000 description 1
- 241000282552 Chlorocebus aethiops Species 0.000 description 1
- 241000579895 Chlorostilbon Species 0.000 description 1
- 102100035371 Chymotrypsin-like elastase family member 1 Human genes 0.000 description 1
- 101710138848 Chymotrypsin-like elastase family member 1 Proteins 0.000 description 1
- 241000207199 Citrus Species 0.000 description 1
- 241000193464 Clostridium sp. Species 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 206010010099 Combined immunodeficiency Diseases 0.000 description 1
- 241000065719 Crocosphaera Species 0.000 description 1
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 1
- 108091005943 CyPet Proteins 0.000 description 1
- 241000159506 Cyanothece Species 0.000 description 1
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 1
- 102100032218 Cytokine-inducible SH2-containing protein Human genes 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 1
- 230000006463 DNA deamination Effects 0.000 description 1
- 102000003844 DNA helicases Human genes 0.000 description 1
- 108090000133 DNA helicases Proteins 0.000 description 1
- 230000007067 DNA methylation Effects 0.000 description 1
- 230000033616 DNA repair Effects 0.000 description 1
- 230000007018 DNA scission Effects 0.000 description 1
- 102100036912 Desmin Human genes 0.000 description 1
- 108010044052 Desmin Proteins 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 206010059866 Drug resistance Diseases 0.000 description 1
- 108091005941 EBFP Proteins 0.000 description 1
- 108091005947 EBFP2 Proteins 0.000 description 1
- 108091005942 ECFP Proteins 0.000 description 1
- 101710099240 Elastase-1 Proteins 0.000 description 1
- 108010037179 Endodeoxyribonucleases Proteins 0.000 description 1
- 102000011750 Endodeoxyribonucleases Human genes 0.000 description 1
- 101000889900 Enterobacteria phage T4 Intron-associated endonuclease 1 Proteins 0.000 description 1
- 241000283073 Equus caballus Species 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 101000935842 Escherichia coli O127:H6 (strain E2348/69 / EPEC) Major structural subunit of bundle-forming pilus Proteins 0.000 description 1
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 241000168413 Exiguobacterium sp. Species 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- 241000282324 Felis Species 0.000 description 1
- 102000016359 Fibronectins Human genes 0.000 description 1
- 108010067306 Fibronectins Proteins 0.000 description 1
- 241000130991 Finegoldia sp. Species 0.000 description 1
- 229940123611 Genome editing Drugs 0.000 description 1
- 102100039289 Glial fibrillary acidic protein Human genes 0.000 description 1
- 101710193519 Glial fibrillary acidic protein Proteins 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 1
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 1
- 108010012029 Guanine Deaminase Proteins 0.000 description 1
- 102000013587 Guanine deaminase Human genes 0.000 description 1
- 108091005904 Hemoglobin subunit beta Proteins 0.000 description 1
- 108010034791 Heterochromatin Proteins 0.000 description 1
- 102000008157 Histone Demethylases Human genes 0.000 description 1
- 108010074870 Histone Demethylases Proteins 0.000 description 1
- 102100039869 Histone H2B type F-S Human genes 0.000 description 1
- 102000011787 Histone Methyltransferases Human genes 0.000 description 1
- 108010036115 Histone Methyltransferases Proteins 0.000 description 1
- 102000003964 Histone deacetylase Human genes 0.000 description 1
- 108090000353 Histone deacetylase Proteins 0.000 description 1
- 102000006947 Histones Human genes 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000943420 Homo sapiens Cytokine-inducible SH2-containing protein Proteins 0.000 description 1
- 101100230565 Homo sapiens HBB gene Proteins 0.000 description 1
- 101100506314 Homo sapiens HBD gene Proteins 0.000 description 1
- 101001035372 Homo sapiens Histone H2B type F-S Proteins 0.000 description 1
- 101000608935 Homo sapiens Leukosialin Proteins 0.000 description 1
- 101000934372 Homo sapiens Macrosialin Proteins 0.000 description 1
- 101000653360 Homo sapiens Methylcytosine dioxygenase TET1 Proteins 0.000 description 1
- 101000946889 Homo sapiens Monocyte differentiation antigen CD14 Proteins 0.000 description 1
- 101001079872 Homo sapiens RING finger protein 112 Proteins 0.000 description 1
- 101001012157 Homo sapiens Receptor tyrosine-protein kinase erbB-2 Proteins 0.000 description 1
- 101000738771 Homo sapiens Receptor-type tyrosine-protein phosphatase C Proteins 0.000 description 1
- 101000821100 Homo sapiens Synapsin-1 Proteins 0.000 description 1
- 101000801209 Homo sapiens Transducin-like enhancer protein 4 Proteins 0.000 description 1
- 108700000788 Human immunodeficiency virus 1 tat peptide (47-57) Proteins 0.000 description 1
- 108700003968 Human immunodeficiency virus 1 tat peptide (49-57) Proteins 0.000 description 1
- XQFRJNBWHJMXHO-RRKCRQDMSA-N IDUR Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(I)=C1 XQFRJNBWHJMXHO-RRKCRQDMSA-N 0.000 description 1
- 108060003951 Immunoglobulin Proteins 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 102100025306 Integrin alpha-IIb Human genes 0.000 description 1
- 101710149643 Integrin alpha-IIb Proteins 0.000 description 1
- 102100037872 Intercellular adhesion molecule 2 Human genes 0.000 description 1
- 101710148794 Intercellular adhesion molecule 2 Proteins 0.000 description 1
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- 241001655931 Ktedonobacter sp. Species 0.000 description 1
- 241000689670 Lachnospiraceae bacterium ND2006 Species 0.000 description 1
- 241000186610 Lactobacillus sp. Species 0.000 description 1
- 102100039564 Leukosialin Human genes 0.000 description 1
- 241001134698 Lyngbya Species 0.000 description 1
- 102100025136 Macrosialin Human genes 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 241000212301 Marinobacterium Species 0.000 description 1
- 102000006890 Methyl-CpG-Binding Protein 2 Human genes 0.000 description 1
- 108010072388 Methyl-CpG-Binding Protein 2 Proteins 0.000 description 1
- 102100030819 Methylcytosine dioxygenase TET1 Human genes 0.000 description 1
- 241000179981 Microcoleus sp. Species 0.000 description 1
- 241000192709 Microcystis sp. Species 0.000 description 1
- 241000190905 Microscilla Species 0.000 description 1
- 102100035877 Monocyte differentiation antigen CD14 Human genes 0.000 description 1
- 241000713333 Mouse mammary tumor virus Species 0.000 description 1
- 101000981253 Mus musculus GPI-linked NAD(P)(+)-arginine ADP-ribosyltransferase 1 Proteins 0.000 description 1
- 241000167284 Natranaerobius Species 0.000 description 1
- 241000588654 Neisseria cinerea Species 0.000 description 1
- 241001440871 Neisseria sp. Species 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 206010029260 Neuroblastoma Diseases 0.000 description 1
- 101100462611 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) prr-1 gene Proteins 0.000 description 1
- 241000192147 Nitrosococcus Species 0.000 description 1
- 241001221335 Nocardiopsis sp. Species 0.000 description 1
- 241000059630 Nodularia <Cyanobacteria> Species 0.000 description 1
- 241000192673 Nostoc sp. Species 0.000 description 1
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 241000192520 Oscillatoria sp. Species 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 241001038004 Pelotomaculum sp. Species 0.000 description 1
- 102000002508 Peptide Elongation Factors Human genes 0.000 description 1
- 108010068204 Peptide Elongation Factors Proteins 0.000 description 1
- 241001038000 Petrotoga sp. Species 0.000 description 1
- 108700019535 Phosphoprotein Phosphatases Proteins 0.000 description 1
- 102000045595 Phosphoprotein Phosphatases Human genes 0.000 description 1
- 241001472610 Polaromonas sp. Species 0.000 description 1
- 229920002873 Polyethylenimine Polymers 0.000 description 1
- 241000611831 Prevotella sp. Species 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- 108010043400 Protamine Kinase Proteins 0.000 description 1
- 241000519590 Pseudoalteromonas Species 0.000 description 1
- 241000709748 Pseudomonas phage PRR1 Species 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 230000004570 RNA-binding Effects 0.000 description 1
- 241000700157 Rattus norvegicus Species 0.000 description 1
- 101100372762 Rattus norvegicus Flt1 gene Proteins 0.000 description 1
- 102100030086 Receptor tyrosine-protein kinase erbB-2 Human genes 0.000 description 1
- 102100037422 Receptor-type tyrosine-protein phosphatase C Human genes 0.000 description 1
- 108090000820 Rhodopsin Proteins 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- 241000714474 Rous sarcoma virus Species 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 101100221606 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) COS7 gene Proteins 0.000 description 1
- 241000700584 Simplexvirus Species 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 241001147693 Staphylococcus sp. Species 0.000 description 1
- 241000194022 Streptococcus sp. Species 0.000 description 1
- 241000187180 Streptomyces sp. Species 0.000 description 1
- 241000216438 Streptosporangium sp. Species 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 102100021905 Synapsin-1 Human genes 0.000 description 1
- 241000192560 Synechococcus sp. Species 0.000 description 1
- 210000001744 T-lymphocyte Anatomy 0.000 description 1
- 206010043395 Thalassaemia sickle cell Diseases 0.000 description 1
- 241000204315 Thermosipho <sea snail> Species 0.000 description 1
- 102100038313 Transcription factor E2-alpha Human genes 0.000 description 1
- 102100033763 Transducin-like enhancer protein 4 Human genes 0.000 description 1
- 102000044159 Ubiquitin Human genes 0.000 description 1
- 108090000848 Ubiquitin Proteins 0.000 description 1
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical group O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 1
- 241000545067 Venus Species 0.000 description 1
- 241001261005 Verrucomicrobia Species 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 241000589634 Xanthomonas Species 0.000 description 1
- 208000020329 Zika virus infectious disease Diseases 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 125000002777 acetyl group Chemical group [H]C([H])([H])C(*)=O 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 102000035181 adaptor proteins Human genes 0.000 description 1
- 108091005764 adaptor proteins Proteins 0.000 description 1
- 229960005305 adenosine Drugs 0.000 description 1
- 125000003277 amino group Chemical group 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 125000004429 atom Chemical group 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 1
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 1
- 230000008238 biochemical pathway Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 108091005948 blue fluorescent proteins Proteins 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 125000004432 carbon atom Chemical group C* 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 125000002057 carboxymethyl group Chemical group [H]OC(=O)C([H])([H])[*] 0.000 description 1
- 125000002091 cationic group Chemical group 0.000 description 1
- 229920006317 cationic polymer Polymers 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 108091092356 cellular DNA Proteins 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000033077 cellular process Effects 0.000 description 1
- 208000019065 cervical carcinoma Diseases 0.000 description 1
- BHONFOAYRQZPKZ-LCLOTLQISA-N chembl269478 Chemical compound C([C@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCCNC(N)=N)[C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O)C1=CC=CC=C1 BHONFOAYRQZPKZ-LCLOTLQISA-N 0.000 description 1
- 238000012993 chemical processing Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 235000020971 citrus fruits Nutrition 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 244000038559 crop plants Species 0.000 description 1
- 108010082025 cyan fluorescent protein Proteins 0.000 description 1
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 239000000412 dendrimer Substances 0.000 description 1
- 229920000736 dendritic polymer Polymers 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 210000005045 desmin Anatomy 0.000 description 1
- 230000010460 detection of virus Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000005546 dideoxynucleotide Substances 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 239000000975 dye Substances 0.000 description 1
- 230000001094 effect on targets Effects 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 210000002257 embryonic structure Anatomy 0.000 description 1
- 229910052876 emerald Inorganic materials 0.000 description 1
- 239000010976 emerald Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 230000006353 environmental stress Effects 0.000 description 1
- 102000052116 epidermal growth factor receptor activity proteins Human genes 0.000 description 1
- 108700015053 epidermal growth factor receptor activity proteins Proteins 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 210000000604 fetal stem cell Anatomy 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000007850 fluorescent dye Substances 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 238000003209 gene knockout Methods 0.000 description 1
- 238000001415 gene therapy Methods 0.000 description 1
- 210000005046 glial fibrillary acidic protein Anatomy 0.000 description 1
- 208000005017 glioblastoma Diseases 0.000 description 1
- 108060003196 globin Proteins 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 229940029575 guanosine Drugs 0.000 description 1
- 208000006454 hepatitis Diseases 0.000 description 1
- 231100000283 hepatitis Toxicity 0.000 description 1
- 210000004458 heterochromatin Anatomy 0.000 description 1
- 230000006801 homologous recombination Effects 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 102000018358 immunoglobulin Human genes 0.000 description 1
- 238000000530 impalefection Methods 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 210000005265 lung cell Anatomy 0.000 description 1
- 108091005949 mKalama1 Proteins 0.000 description 1
- 210000002540 macrophage Anatomy 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 150000002739 metals Chemical class 0.000 description 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 210000001616 monocyte Anatomy 0.000 description 1
- 125000004573 morpholin-4-yl group Chemical group N1(CCOCC1)* 0.000 description 1
- 210000003098 myoblast Anatomy 0.000 description 1
- 230000002107 myocardial effect Effects 0.000 description 1
- YOHYSYJDKVYCJI-UHFFFAOYSA-N n-[3-[[6-[3-(trifluoromethyl)anilino]pyrimidin-4-yl]amino]phenyl]cyclopropanecarboxamide Chemical compound FC(F)(F)C1=CC=CC(NC=2N=CN=C(NC=3C=C(NC(=O)C4CC4)C=CC=3)C=2)=C1 YOHYSYJDKVYCJI-UHFFFAOYSA-N 0.000 description 1
- 125000004433 nitrogen atom Chemical group N* 0.000 description 1
- 239000002853 nucleic acid probe Substances 0.000 description 1
- 238000001821 nucleic acid purification Methods 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 230000030648 nucleus localization Effects 0.000 description 1
- 239000005022 packaging material Substances 0.000 description 1
- 230000000149 penetrating effect Effects 0.000 description 1
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 1
- 150000008300 phosphoramidites Chemical class 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 244000000003 plant pathogen Species 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 210000002307 prostate Anatomy 0.000 description 1
- 239000012474 protein marker Substances 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- 230000012743 protein tagging Effects 0.000 description 1
- 230000004850 protein–protein interaction Effects 0.000 description 1
- 230000001172 regenerating effect Effects 0.000 description 1
- 125000000548 ribosyl group Chemical class C1([C@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 1
- 230000005783 single-strand break Effects 0.000 description 1
- 238000010532 solid phase synthesis reaction Methods 0.000 description 1
- 150000003431 steroids Chemical class 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 230000036319 strand breaking Effects 0.000 description 1
- 230000002195 synergetic effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 125000003396 thiol group Chemical group [H]S* 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical group [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 1
- 229940104230 thymidine Drugs 0.000 description 1
- 108091006106 transcriptional activators Proteins 0.000 description 1
- 108091008023 transcriptional regulators Proteins 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 239000012096 transfection reagent Substances 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 238000011269 treatment regimen Methods 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- GWBUNZLLLLDXMD-UHFFFAOYSA-H tricopper;dicarbonate;dihydroxide Chemical compound [OH-].[OH-].[Cu+2].[Cu+2].[Cu+2].[O-]C([O-])=O.[O-]C([O-])=O GWBUNZLLLLDXMD-UHFFFAOYSA-H 0.000 description 1
- 239000003744 tubulin modulator Substances 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 1
- 229940045145 uridine Drugs 0.000 description 1
- 239000000277 virosome Substances 0.000 description 1
- 238000002689 xenotransplantation Methods 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
- C12N15/907—Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P25/00—Drugs for disorders of the nervous system
- A61P25/14—Drugs for disorders of the nervous system for treating abnormal movements, e.g. chorea, dyskinesia
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P27/00—Drugs for disorders of the senses
- A61P27/02—Ophthalmic agents
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P37/00—Drugs for immunological or allergic disorders
- A61P37/02—Immunomodulators
- A61P37/04—Immunostimulants
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P7/00—Drugs for disorders of the blood or the extracellular fluid
- A61P7/06—Antianaemics
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/62—DNA sequences coding for fusion proteins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1025—Acyltransferases (2.3)
- C12N9/1029—Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/78—Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2320/00—Applications; Uses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2320/00—Applications; Uses
- C12N2320/30—Special therapeutic applications
- C12N2320/32—Special delivery means, e.g. tissue-specific
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y203/00—Acyltransferases (2.3)
- C12Y203/01—Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
- C12Y203/01048—Histone acetyltransferase (2.3.1.48)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y301/00—Hydrolases acting on ester bonds (3.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y305/00—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
- C12Y305/04—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
- C12Y305/04001—Cytosine deaminase (3.5.4.1)
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Medicinal Chemistry (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Crystallography & Structural Chemistry (AREA)
- Pharmacology & Pharmacy (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- General Chemical & Material Sciences (AREA)
- Mycology (AREA)
- Cell Biology (AREA)
- Immunology (AREA)
- Epidemiology (AREA)
- Neurosurgery (AREA)
- Ophthalmology & Optometry (AREA)
- Diabetes (AREA)
- Psychology (AREA)
- Neurology (AREA)
- Hematology (AREA)
- Enzymes And Modification Thereof (AREA)
- Peptides Or Proteins (AREA)
Abstract
Composições e métodos para utilizar proteínas de ligação a DNA programáveis para aumentar a eficiência e/ou especificidade de modificação do genoma-alvo ou para facilitar a detecção de locos genômicos específicos em células eucarióticas.
Description
[001] A presente invenção refere-se a composições e métodos para aumentar a eficiência e/ou especificidade de modificação do genoma-alvo.
[002] As endonucleases programáveis tornaram-se cada vez mais uma importante ferramenta para a engenharia ou modificação do genoma-alvo em eucariotas. Recentemente, sistemas (Cas) (CRISPR/ Cas) associados a (CRISPR)/CRISPR de repetições palindrômicas curtas regularmente intercaladas agrupadas guiadas pelo RNA surgiram como uma nova geração de ferramentas de modificação do genoma. Essas novas endonucleases programáveis melhoraram muito a capacidade de edição do genoma em comparação com as gerações anteriores de nucleases, tais como as nucleases dedo de zinco (ZFNs) e nucleases efetoras semelhantes a ativador de transcrição (TALENs).
[003] Entretanto, nem todos os alvos genômicos são acessíveis à modificação eficiente por essas endonucleases programáveis. De fato, algumas endonucleases CRISPR-Cas parecem ter pouca ou nenhuma atividade nas células humanas. Entre outras coisas, a estrutura da cromatina pode apresentar uma barreira a estas endonucleases programáveis e impedir que se liguem à sequência-alvo. Desse modo, existe uma necessidade de melhorar a acessibilidade destas endonucleases programáveis às sequências alvo e/ou melhorar a eficiência da modificação do genoma-alvo. Além disso, existe uma necessidade de aumentar a especificidade para a modificação do genoma-alvo, reduzindo os efeitos fora do alvo.
[004] Entre os vários aspectos da presente invenção está uma composição compreendendo (a) uma proteína de modificação de DNA programável ou ácido nucleico codificando a proteína de modificação de DNA programável e (b) pelo menos uma proteína de ligação a DNA programável ou ácido nucleico codificando a pelo menos uma proteína de ligação a DNA programável. Em geral, a proteína de modificação de DNA programável tem atividade de nuclease (isto é, cliva ambos as fitas de uma sequência de fita dupla) ou atividade não nuclease (por exemplo, atividade de modificação epigenética ou atividade de regulação transcricional) e a pelo menos uma proteína de ligação a DNA programável não possuiu atividade de nuclease.
[005] Em modalidades nas quais a proteína de modificação de DNA programável tem atividade de nuclease, por exemplo, a proteína de modificação de DNA programável pode ser selecionada de um sistema de nuclease (Cas) (CRISPR/Cas) associado a (CRISPR)/CRISPR de repetições palindrômicas curtas regularmente intercaladas agrupadas guiadas pelo RNA, um sistema de nicase dual CRISPR/Cas, uma nuclease dedo de zinco (ZFN), uma nuclease efetora semelhante a ativador de transcrição (TALEN), uma meganuclease, uma proteína de fusão compreendendo um domínio de ligação ao DNA programável ligado a um domínio de nuclease (isto é, gera um rompimento de DNA de fita dupla) e suas combinações.
[006] Em modalidades nas quais a proteína de modificação de DNA programável tem atividade não nuclease, por exemplo, a proteína de modificação de DNA programável pode ser uma proteína de fusão compreendendo um domínio de ligação ao DNA programável ligado a um domínio de modificação não nuclease. Em certas modalidades, o domínio de ligação a DNA programável da proteína de fusão pode ser um sistema CRISPR/Cas cataliticamente inativo, uma meganuclease cataliticamente inativa, uma proteína dedo de zinco ou um efetor semelhante a ativador de transcrição e o domínio de modificação não nuclease da proteína de fusão pode ter atividade de acetiltransferase, atividade de desacetilase, atividade de metiltransferase, atividade de desmetilase, atividade de cinase, atividade de fosfatase, atividade de ubiquitina ligase, atividade de desubiquitinação, atividade de adenilação, atividade de desadenilação, atividade de SUMOilação, atividade de desSUMOilação, atividade de ribosilação, atividade de desribosilação, atividade de miristoilação, atividade de desmiristoilação, atividade de citrulinação, atividade de helicase, atividade de aminação, atividade de desaminação, atividade de alquilação, atividade de desalquilação, atividade de oxidação, atividade de ativação transcricional ou atividade repressora transcricional. Em modalidades específicas, o domínio de modificação não nuclease da proteína de fusão tem atividade de citosina desaminase, atividade de histona acetiltransferase, atividade de ativação transcricional ou atividade repressora transcricional.
[007] De acordo com certas modalidades das composições aqui descritas, a pelo menos uma proteína de ligação a DNA programável pode ser um sistema CRISPR/Cas cataliticamente inativo, uma meganuclease cataliticamente inativa, uma proteína dedo de zinco, um efetor semelhante a um ativador de transcrição, uma nicase CRISPR/ Cas, uma nicase ZFN, uma nicase TALEN ou uma nicase de meganuclease.
[008] Em geral, o ácido nucleico codificando a proteína de modificação de DNA programável e/ou a pelo menos uma proteína de ligação a DNA programável é mRNA ou DNA. Em algumas modalidades, o ácido nucleico codificando a proteína de modificação de DNA programável e/ou pelo menos uma proteína de ligação a DNA programável, faz parte de um vetor tal como, por exemplo, um vetor de plasmídeo, um vetor lentiviral, um vetor viral adenoassociado ou um vetor adenoviral.
[009] Em modalidades específicas, a proteína de modificação de DNA programável compreende um sistema de nuclease CRISPR/Cas, um sistema de nicase dual CRISPR/Cas, ou um sistema CRISPR/Cas cataliticamente inativo ligado a um domínio não nuclease e a pelo menos uma proteína de ligação a DNA programável compreende um CRISPR/Cas cataliticamente inativo, em que cada sistema CRISPR/ Cas compreende uma proteína CRISPR/Cas e um RNA guia. Em várias modalidades, cada sistema de nuclease CRISPR/Cas pode ser um sistema CRISPR/Cas tipo I, um sistema CRISPR/Cas tipo II, um sistema CRISPR/Cas tipo III ou um sistema CRISPR/Cas tipo V. Em algumas modalidades, cada RNA guia pode ser pelo menos parcialmente quimicamente sintetizado. Em outras modalidades, cada RNA guia pode ser enzimaticamente sintetizado. Em outras modalidades, o ácido nucleico codificando cada proteína CRISPR/Cas pode ser mRNA e o ácido nucleico codificando cada RNA guia pode ser DNA. Ainda em outras modalidades, o ácido nucleico codificando cada proteína CRISPR/Cas pode ser mRNA e o ácido nucleico codificando cada RNA guia pode ser DNA. Em certos aspectos, o ácido nucleico codificando a proteína CRISPR/Cas e/ou o ácido nucleico codificando o RNA guia podem ser parte de um vetor, por exemplo, um vetor de plasmídeo, um vetor lentiviral, um vetor viral adeno-associado ou um vetor adenoviral.
[0010] Outro aspecto da presente invenção abrange kits compreendendo qualquer uma ou mais das composições detalhadas acima.
[0011] Ainda outro aspecto da presente descrição fornece métodos para aumentar a eficiência de modificação do genoma-alvo e/ou especificidade em uma célula eucariótica. Os métodos envolvem introduzir em uma célula eucariótica (a) uma proteína de modificação de DNA programável ou ácido nucleico codificando a proteína de modificação de DNA programável e (b) pelo menos uma proteína de ligação a DNA programável ou ácido nucleico codificando a pelo menos uma proteína de ligação a DNA programável. A proteína de modificação de DNA programável é direcionada a uma sequência cromossômica alvo e cada uma das pelo menos uma proteína de ligação a DNA programável é direcionada a um sítio proximal à sequência cromossômica alvo. A ligação da pelo menos uma proteína de ligação a DNA programável ao sítio proximal à sequência cromossômica alvo aumenta a acessibilidade da proteína de modificação de DNA programável à sequência cromossômica alvo, aumentando desse método a eficiência e/ou especificidade de modificação do genoma-alvo. O sítio proximal ligado por cada uma das pelo menos uma proteína de ligação a DNA programável está localizado, por exemplo, dentro de cerca de 250 pares de base em quaisquer dos lados da sequência cromossômica alvo. Em algumas modalidades, o sítio de ligação proximal está localizado menos de cerca de 200 pb ou menos de cerca de 100 pb em cada lado da sequência cromossômica alvo.
[0012] A proteína de modificação de DNA programável usada no método pode ser um sistema de nuclease CRISPR/Cas, um sistema de nicase dual CRISPR/Cas, uma nuclease dedo de zinco (ZFN), uma nuclease efetora semelhante a ativador de transcrição (TALEN), uma meganuclease, uma proteína de fusão compreendendo um domínio de ligação a DNA programável ligado a um domínio de nuclease, ou uma proteína de fusão compreendendo um domínio de ligação a DNA programável ligado a um domínio não nuclease. O domínio de ligação a DNA programável da proteína de fusão pode ser um sistema CRISPR/ Cas cataliticamente inativo, uma meganuclease cataliticamente inativa, uma proteína dedo de zinco, ou um efetor semelhante a ativador de transcrição, e o domínio de modificação não nuclease da proteína de fusão pode ter atividade de acetiltransferase, atividade de desacetilase, atividade de metiltransferase, atividade de desmetilase, atividade de cinase, atividade de fosfatase, atividade de ubiquitina ligase, atividade de desubiquitinação, atividade de adenilação, atividade de desadenilação, atividade de SUMOilação, atividade de desSUMOilação, atividade de ribosilação, atividade de desribosilação, atividade de miristoilação, atividade de desmiristoilação, atividade de citrulinação, atividade de helicase, atividade de aminação, atividade de desaminação, atividade de alquilação, atividade de desalquilação, atividade de oxidação, atividade de ativação transcricional ou atividade repressora transcricional. Em modalidades específicas, o domínio de modificação não nuclease da proteína de fusão tem atividade de citosina desaminase, atividade de histona acetiltransferase, atividade de ativação transcricional ou atividade repressora transcricional.
[0013] A pelo menos uma proteína de ligação a DNA programável usada no método liga-se ao DNA, mas não possui atividade de nuclease (isto é, atividade de clivagem de fita dupla). Em certas modalidades, a pelo menos uma proteína de ligação a DNA programável pode ser um sistema CRISPR/Cas cataliticamente inativo, uma meganuclease cataliticamente inativa, uma proteína dedo de zinco, um efetor semelhante a ativador da transcrição, uma CRISPR/Cas nicase, uma nicase ZFN, uma nicase TALEN ou uma meganuclease nicase.
[0014] Em modalidades específicas, a proteína de modificação de DNA programável compreende um sistema de nuclease CRISPR/Cas, um sistema de nicase dual CRISPR/Cas, ou um sistema CRISPR/Cas cataliticamente inativo ligado a um domínio não nuclease, e pelo menos uma proteína de ligação a DNA programável compreende um sistema CRISPR/Cas cataliticamente inativo, em que cada sistema CRISPR/Cas compreende uma proteína CRISPR/Cas e um RNA guia.
[0015] Em várias modalidades, pelo menos duas, pelo menos três, ou mais de três proteínas de ligação a DNA programáveis são introduzidas na célula eucariótica. Em modalidades específicas, a célula eucariótica é uma célula mamífera ou uma célula humana.
[0016] Outro aspecto da presente invenção abrange métodos para detectar uma sequência cromossômica ou locus genômico em uma célula eucariótica. Os métodos envolvem introduzir na célula eucariótica (a) uma proteína de ligação a DNA programável, compreendendo pelo menos um domínio marcador detectável ou ácido nucleico codificando a proteína de ligação a DNA programável, compreendendo pelo menos um domínio marcador detectável e (b) pelo menos uma proteína de ligação a DNA programável, ou ácido nucleico codificando a pelo menos uma proteína de ligação a DNA programável, em que a proteína de ligação a DNA programável compreendendo pelo menos um domínio marcador detectável é direcionada para uma sequência cromossômica alvo e cada uma das pelo menos uma proteína de ligação a DNA programável destinada a um sítio proximal à sequência cromossômica alvo, em que a ligação da pelo menos uma proteína de ligação a DNA programável ao sítio proximal à sequência cromossômica alvo aumenta a acessibilidade da proteína de ligação a DNA programável compreendendo pelo menos um domínio marcador detectável à sequência cromossômica alvo. Os métodos podem ainda envolver a detecção da proteína de ligação a DNA programável compreendendo pelo menos um domínio marcador detectável ligado à sequência cromossômica alvo. A etapa de detecção pode ser em células vivas ou fixadas e pode envolver, por exemplo, imageamento dinâmico de células vivas, microscopia fluorescente, microscopia confocal, imunofluorescência, imunodetecção, ligação RNA-proteína ou ligação proteína-proteína.
[0017] A proteína de ligação a DNA programável compreendendo pelo menos um domínio marcador detectável que é usado no método de detecção compreende um domínio de ligação ao DNA programável, que pode ser um sistema CRISPR/Cas cataliticamente inativo, uma meganuclease cataliticamente inativa, uma proteína dedo de zinco ou um efetor semelhante a ativador de transcrição. O pelo menos um domínio marcador detectável da proteína de ligação a DNA programável, que compreende pelo menos um domínio marcador detectável pode ser, por exemplo, uma proteína fluorescente, um marcador fluorescente, um marcador de epítopo, ou um epítopo de ocorrência natural dentro da proteína de ligação a DNA programável. Em algumas modalidades, a proteína de ligação a DNA programável compreendendo pelo menos um domínio marcador detectável pode ainda compreender uma modificação não nuclease. A pelo menos uma proteína de ligação a DNA programável liga-se ao DNA mas não tem atividade de nuclease (isto é, atividade de clivagem de fita dupla). Em algumas modalidades, a proteína de ligação a DNA programável, pode ser um sistema CRISPR/Cas cataliticamente inativo, uma meganuclease cataliticamente inativa, uma proteína dedo de zinco, um efetor semelhante a ativador de transcrição, uma nicase CRISPR/Cas, uma nicase ZFN, uma nicase TALEN ou uma nicase de meganuclease. Em modalidades específicas, a proteína de ligação a DNA programável, compreendendo pelo menos um domínio marcador detectável pode ser um sistema CRISPR/Cas cataliticamente inativo ligado a pelo menos um domínio marcador detectável, e a pelo menos uma proteína de ligação a DNA programável, pode ser um sistema CRISPR/Cas cataliticamente inativo.
[0018] Outros aspectos e características da invenção são detalhados abaixo.
[0019] A FIG. 1 fornece um diagrama de uma modalidade dos métodos aqui descritos. A ligação proximal de proteína(s) de ligação ao DNA programáveis aumenta a acessibilidade do sítio-alvo para uma nuclease programável, aumentando assim a eficiência da clivagem no sítio-alvo.
[0020] A FIG. 2 ilustra que a ligação de SpCas9 cataliticamente inativa (SpdCas9) ao(s) sítio(s) proximal(is) aumenta a eficiência de clivagem por FnCas9. As sequências apresentadas na parte superior mostram as localizações relativas do sítio-alvo FnCas9 no locus POR e os sítios de ligação de SpdCas9. Os resultados de um ensaio de nuclease Cel-I são mostrados na parte inferior.
[0021] A FIG. 3A ilustra o planejamento de um experimento para determinar se a ligação de SpCas9 cataliticamente inativa (SpdCas9) aumenta a acessibilidade e ligação de CjCas9 cataliticamente inativa (isto é, marcado por FLAG®) (CjdCas9) a um sítio anteriormente inacessível no locus POR.
[0022] FIG. 3B fornece um diagrama do ensaio de ligação de imunoprecipitação da cromatina utilizado para detectar a ligação de CjdCas9 marcado com epítopo a sítios-alvo nos loci POR e AAVS1.
[0023] A FIG. 3 ilustra que a ligação de SppCas9 a sítios proximais aumenta a ligação de CjCas9 marcado com epítopo a um sítio anteriormente inacessível no locus POR.
[0024] A FIG. 4 ilustra que a ligação de SpCas9 cataliticamente inativa (SpdCas9) a sítios proximais aumenta a eficiência da clivagem por CjCas9. As sequências apresentadas na parte superior mostram as localizações relativas do sítio-alvo CjCas9 no locus POR e nos sítios de ligação de SpdCas9. Os resultados de um ensaio de Cel-I nuclease são mostrados na parte inferior.
[0025] A FIG. 5 ilustra que a ligação de SpCas9 cataliticamente inativa (SpdCas9) a sítios proximais aumenta a eficiência da clivagem por FnCpf1. As localizações relativas do sítio-alvo da FnCpf1 e sítios de ligação SpdCas9 no locus POR estão ilustradas na parte superior e os resultados de um ensaio da Cel-I nuclease são mostrados na parte inferior.
[0026] A FIG. 6 ilustra que a ligação de SpCas9 cataliticamente inativa (SpdCas9) ao(s) sítio(s) proximal(is) aumenta a clivagem específica por CjCas9. Os sítios-alvo de CjCas9 nos loci HBD e HBB, bem como os sítios de ligação de SpdCas9 no locus HBB, são mostrados na parte superior. Os resultados de um ensaio de Cel-I nuclease são mostrados na parte inferior.
[0027] A FIG. 7 ilustra que a ligação de FnCas9 cataliticamente inativa (FndCas9) a sítios proximais aumenta a clivagem específica por SpCas9. As localizações relativas do sítio-alvo SpCas9 e os sítios de ligação FndCas9 no locus POR são indicados na parte superior. Os resultados de um ensaio de Cel-I nuclease são mostrados na parte inferior.
[0028] A FIG. 8 ilustra o realce de edição de gene oligo-mediado por ssDNA. As localizações relativas dos sítios-alvo no locus POR e a sequência do oligo ssDNA são mostradas na parte superior. Os resultados da integração direcionada ao site EcoRI são mostrados na parte inferior. As eficiências de integração do sítio EcoRI (%) foram determinadas pelo ImageJ. M: Marcadores de DNA de amplo alcance. ND: não determinado.
[0029] A presente descrição fornece composições e métodos para aumentar a acessibilidade do DNA cromossômico para direcionar endonucleases e outras proteínas de modificação de DNA programáveis, em que a acessibilidade aumentada leva à eficiência e/ou especificidade de modificação do genoma-alvo ou modificação epigenética aumentadas. Verificou-se que algumas endonucleases CRISPR/Cas têm reduzida ou nenhuma atividade em células humanas. É possível que a ocupação, posicionamento do nucleossoma e como uma sequência de DNA é envolvida em torno do octâmero de histona pode determinar quão acessível é a sequência a uma proteína de ligação a DNA (Cherejiet al., Briefing Functional Genomics, 2014, 14: 506-60). Desse modo, é possível que o impedimento imposto pela configuração da cromatina local possa desempenhar um papel na inatividade aparente de muitas endonucleases CRISPR/Cas em células humanas. Foi descoberto, como aqui detalhado, que a ligação de proteínas de ligação a DNA a sítios localizados proximais (isto é, dentro de cerca de 250 pares de base) ao sítio-alvo de uma proteína de modificação de DNA alvo aumenta a acessibilidade da proteína de modificação de DNA alvo ao sítio-alvo, desse método aumentando a eficiência e/ou especificidade de modificação do genoma-alvo ou modificação epigenética alvo. As composições e métodos aqui descritos, portanto, possibilitam eficiente modificação de genoma-alvo/modificação epigenética usando endonucleases CRISPR/Cas que se pensava anteriormente serem inativas nas células humanas. Além disso, as composições e métodos aqui descritos também melhoram a modificação seletiva do genoma entre os sítios-alvo quase idênticos, reduzindo assim os efeitos fora do alvo. (1) Composições
[0030] Um aspecto da presente invenção fornece composições compreendendo (a) proteínas de modificação de DNA programáveis ou ácido nucleico codificando as proteínas de modificação de DNA programáveis e (b) pelo menos uma proteína de ligação a DNA programável ou ácido nucleico codificando a pelo menos uma proteína de ligação a DNA programável. Proteínas de modificação de DNA programáveis são detalhadas abaixo na seção (I) (a), proteínas de ligação a DNA programáveis são detalhadas abaixo na seção (I) (b) e os ácidos nucleicos que codificam estas proteínas são detalhados abaixo na seção (I) (c). (a) Proteínas de Modificação de DNA Programáveis
[0031] Uma proteína de modificação de DNA programável é uma proteína que se liga a uma sequência-alvo específica no DNA cromossômico e modifica o DNA ou uma proteína associada ao DNA na sequência ou perto dela. Desse modo, uma proteína de modificação de DNA programável compreende um domínio de ligação a DNA e um domínio de modificação cataliticamente ativo.
[0032] O domínio de ligação a DNA é programável, na medida em que pode ser planejado ou modificado para reconhecer e ligar diferentes sequências de DNA. Em algumas modalidades, por exemplo, a ligação ao DNA é mediada pela interação entre a proteína e o DNA alvo. Desse modo, o domínio de ligação a DNA pode ser programado para se ligar a uma sequência de DNA de interesse por engenharia de proteínas. Em outras modalidades, por exemplo, a ligação ao DNA mediada por um RNA guia que interage com o domínio de ligação a DNA programável da proteína e o DNA alvo. Em tais casos, o domínio de ligação ao DNA programável pode ser direcionado para uma sequência de DNA de interesse, designando o RNA guia apropriado.
[0033] Uma variedade de domínios de modificação pode ser incluída nas proteínas de modificação de DNA programáveis. Em algumas modalidades, o domínio de modificação é um domínio de nuclease, que tem atividade de nuclease e cliva ambos as fitas de uma sequência de DNA de fita dupla (isto é, gera um rompimento de fita dupla). O rompimento de fita dupla pode então ser reparado por um processo de reparo do DNA celular, tal como reparo de união de extremidade não homóloga (NHEJ) ou direcionado à homologia (HDR). Como uma consequência, a sequência de DNA pode ser modificada por uma deleção, inserção e/ou substituição de pelo menos um par de bases até, por exemplo, muitos milhares de pares de base. Exemplos de proteínas de modificação de DNA programáveis compreendendo domínios de nuclease incluem, sem limitar, sistemas de nuclease CRISPR/Cas, sistemas de nicase dual CRISPR/Cas, nucleases dedo de zinco, nucleases efetoras semelhantes a ativador de transcrição, meganucleases, proteínas de fusão compreendendo um domínio de nuclease ligado a um domínio de ligação a DNA programável, e combinações dos mesmos. Proteínas de modificação de DNA programáveis compreendendo domínios de nuclease são detalhadas abaixo nas seções (I) (a) (i) - (vi).
[0034] Em outras modalidades, o domínio de modificação da proteína de modificação de DNA programável tem atividade não nuclease (por exemplo, atividade de modificação epigenética ou atividade de regulação transcricional) de modo que a proteína de modificação de DNA programável modifique a estrutura e/ou atividade do DNA e/ou proteína(s) associada(s) ao DNA. Desse modo, a proteína de modificação de DNA programável é uma proteína de fusão compreendendo um domínio de modificação não nuclease ligado a um domínio de ligação ao DNA programável. Tais proteínas estão detalhadas abaixo na seção (I) (a) (vii).
[0035] As proteínas de modificação de DNA programáveis podem compreender domínios de ligação e/ou modificação de DNA do tipo selvagem ou de ocorrência natural, versões modificadas de domínios de ligação e/ou modificação de DNA de ocorrência natural, domínios de ligação e/ou modificação de DNA sintéticos ou artificiais, e combinações dos mesmos. (i) Sistemas de Nuclease CRISPR/Cas
[0036] Em algumas modalidades, a proteína de modificação de DNA programável pode ser um sistema de nuclease CRISPR/Cas guiado por RNA, que introduz um rompimento de fita dupla no DNA. O sistema de nuclease CRISPR/Cas compreende uma nuclease CRISPR/Cas e um RNA guia.
[0037] CRISPR/Cas Nuclease. Em certas modalidades, a nuclease CRISPR/Cas pode ser derivada de um sistema CRISPR tipo I (isto é, IA, IB, IC, ID, IE, ou IF), tipo II (isto é, IIA, IIB ou IIC), tipo III (isto é, IIIA ou IIIB), ou tipo V, que estão presentes em várias bactérias e archaea. Por exemplo, o sistema CRISPR/Cas pode ser de Streptococcus sp. (por exemplo, Streptococcus pyogenes), Campylobacter sp. (por exemplo, Campylobacter jejuni), Francisella sp. (por exemplo, Francisella novicida), Acaryocloris sp., Acetohalobium sp., Acidaminococcus sp., Acidithiobacillus sp., Alicyclobacillus sp., Allochromatium sp., Ammonifex sp., Anabaena sp., Arthrospira sp., Bacillus sp., Burkholderiales sp. Caldicelulosiruptor sp., Candidatus sp., Clostridium sp., Crocosphaera sp., Cyanothece sp., Exiguobacterium sp., Finegoldia sp., Ktedonobacter sp., Lachnospiraceaesp., Lactobacillus sp., Lyngbya sp., Marinobacter sp., Methanohalobium sp. , Microscilla sp., Microcoleus sp., Microcystis sp., Natranaerobius sp., Neisseria sp., Nitrosococcus sp., Nocardiopsis sp., Nodularia sp., Nostoc sp., Oscillatoria sp., Polaromonas sp., Pelotomaculum sp., Pseudoalteromonas. sp., Petrotoga sp., Prevotella sp., Staphylococcus sp., Streptomyces sp., Streptosporangium sp., Synechococcus sp., Thermosipho sp. ou Verrucomicrobia sp.. Em ainda outras modalidades, a nuclease CRISPR/Cas pode ser derivada de um sistema CRISPR archaeal, um sistema CRISPR-CasX ou um sistema CRISPR-CasY (Burstein et al., Nature, 2017, 542 (7640): 237- 241).
[0038] Em uma modalidade particular, a nuclease CRISPR/Cas pode ser derivada de um sistema CRISPR/Cas do tipo I. Em outra modalidade particular, a nuclease CRISPR/Cas pode ser derivada de um sistema CRISPR/Cas tipo II. Em outra modalidade particular, a nuclease CRISPR/Cas pode ser derivada de um sistema CRISPR/Cas tipo III. Em outra modalidade particular, a nuclease CRISPR/Cas pode ser derivada de um sistema CRISPR/Cas tipo V.
[0039] Exemplos não limitantes de proteínas CRISPR adequadas incluem proteínas Cas, proteínas Cpf, proteínas C2c (por exemplo, C2c1, C2c2, Cdc3), proteínas Cmr, proteínas Csa, proteínas Csb, proteínas Csc, proteínas Cse, proteínas Csf, proteínas Csm, Proteínas Csn, proteínas Csx, proteínas Csy, proteínas Csz, e seus derivados ou variantes. Em modalidades específicas, a nuclease CRISPR/Cas pode ser uma proteína Cas9 de tipo II, uma proteína Cpf1 de tipo V ou um seu derivado.
[0040] Em algumas modalidades, a nuclease CRISPR/Cas pode ser Streptococcus pyogenes Cas9 (SpCas9) ou Streptococcus thermophilus Cas9 (StCas9). Em outras modalidades, a nuclease CRISPR/Cas pode ser Campylobacter jejuni Cas9 (CjCas9). Em modalidades alternativas, a nuclease CRISPR/Cas pode ser Franscisella novicida Cas9 (FnCas9). Ainda em outras modalidades, a nuclease CRISPR/Cas pode ser Neisseria cinerea Cas9 (NcCas9). Em outras modalidades, a nuclease CRISPR/Cas pode ser Francisella novicida Cpf1 (FnCpf1), Acidaminococcus sp. Cpf1 (AsCpf1), ou Lachnospiraceae bacterium ND2006 Cpf1 (LbCpf1).
[0041] Em geral, a nuclease CRISPR/Cas compreende um domínio de reconhecimento de RNA e/ou de ligação de RNA, que interage com o RNA guia. A nuclease CRISPR/Cas também compreende pelo menos um domínio de nuclease que possui atividade de endonuclease. Por exemplo, uma proteína Cas9 compreende um domínio de nuclease semelhante a RuvC e um domínio de nuclease semelhante a HNH, e uma proteína Cpf1 compreende um domínio semelhante a RuvC. As nucleases CRISPR/Cas podem também compreender domínios de ligação ao DNA, domínios de helicase, domínios de RNase, domínios de interação proteína-proteína, domínios de dimerização, bem como outros domínios.
[0042] A nuclease CRISPR/Cas pode ainda compreender pelo menos um sinal de localização nuclear, domínio de penetração celular e/ou domínio marcador. Exemplos não limitantes de sinais de localização nuclear incluem PKKKRKV (SEQ ID NO: 1), PKKKRRV (SEQ ID NO: 2), KRPAATKKAGQAKKKK (SEQ ID NO: 3), YGRKKRRQRRR (SEQ ID NO: 28, RKKRRQRRR (SEQ ID NO: 29), PAAKRVKLD (SEQ ID NO: 30), RQRRNELKRSP (SEQ ID NO: 31), VSRKRPRP (SEQ ID NO: 32), PPKKARED (ID SEQ NO: 33), PQPKKKPL (SEQ ID NO: 34), SALIKKKKKMAP ( SEQ ID NO: 35), PKQKKRK (SEQ ID NO: 36), RKLKKKIKKL (ID SEQ NO: 37), REKKKFLKRR (ID SEQ NO: 38), KRKGDEVDGVDEVAKKKSKK (ID SEQ NO: 39), RKCLQAGMNLEARKTKK (SEQ ID NO: 40), NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY (SEQ ID NO: 41), e RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV (SEQ ID NO: 42). Exemplos de domínio de penetração celular adequados incluem, sem limitar, GRKKRRQRRRPPQPKKKRKV (SEQ ID NO: 4), PLSSIFSRIGDPPKKKRKV (SEQ ID NO: 5) , GALFLGWLGAAGSTMGAPKKKRKV (ID SEQ NO: 6), GALFLGFLGAAGSTMGAWSQPKKKRKV (ID SEQ NO: 7), KETWWETWWTEWSQPKKKRKV (SEQ ID NO: 8), YARAAARQARA (ID SEQ NO: 43), THRLPRRRRRR (SEQ ID NO: 44), GGRRARRRRRR (SEQ ID NO: 45), RRQRRTSKLMKR (SEQ ID NO: 46), GWTLNSA GYLLGKINLKALAALAKKIL (ID SEQ NO: 47), KALAWEAKLAKALAKALAKHLAKALAKALKCEA (SEQ ID NO: 48) e RQIKIWFQNRRMKWKK (SEQ ID NO: 49). Domínios marcadores incluem proteínas fluorescentes e marcadores de purificação ou epítopo. As proteínas fluorescentes adequadas incluem, sem limitar, proteínas fluorescentes verdes (por exemplo, GFP, eGFP, GFP-2, tagGFP, turboGFP, Esmeralda, Azami Green, Monomífico Azami Green, CopGFP, AceGFP, ZsGreen1), proteínas fluorescentes amarelas (por exemplo, YFP, EYFP, Citrino, Vênus, YPet, PhiYFP, ZsYellow1), proteínas fluorescentes azuis (por exemplo, BFP, EBFP, EBFP2, Azurita, mKalama1, GFPuv, safira, T-safira), proteínas fluorescentes ciano (por exemplo, ECFP, Cerulean, CyPet, AmCyan1, Midoriishi-Cyan), proteínas fluorescentes vermelhas (por exemplo, mKate, mKate2, mPlum, monômero DsRed, mCherry, mRFP1, DsRed- Express, DsRed2, DsRed-Monômero, HcRed-Tandem, HcRed1, AsRed2, eqFP611, mRasberry, mStrawberry, Jred), e proteínas fluorescentes laranja (por exemplo, mOrange, mKO, Kusabira-Laranja, Monomérico Kusabira-Laranja, mTangerina, tdTomato). Exemplos não limitantes de marcadores de purificação ou epítopo adequados incluem 6xHis, FLAGH, HA, GST, Myc e similares.
[0043] O sinal de localização nuclear, o domínio de penetração celular e/ou o domínio marcador podem estar localizados na terminação N, na terminação C ou em uma localização interna da proteína. Em algumas modalidades, a nuclease CRISPR/Cas pode ainda compreender pelo menos um marcador detectável. O marcador detectável pode ser um fluoróforo (por exemplo, FAM, TMR, Cy3, Cy5, Vermelho Texas, Verde Oregon, Flúores Alexa, marcadores Halo ou marcador/corante fluorescente adequado), um cromóforo (por exemplo, biotina, digoxigenina e similares), pontos quânticos ou partículas de ouro. O marcador detectável pode ser ligado por meio de recursos convencionais a qualquer aminoácido da proteína.
[0044] RNA Guia. O sistema de nuclease CRISPR/Cas também compreende um RNA guia (gRNA). O RNA guia interage com a nuclease CRISPR/Cas e o sítio-alvo para guiar a nuclease CRISPR/Cas ao sítio-alvo na sequência cromossômica. O sítio-alvo não tem nenhuma limitação de sequência, exceto que a sequência é limitada por um motivo adjacente protoespaçador (PAM). Por exemplo, as sequências de PAM para proteínas Cas9 incluem 3'-NGG, 3'- NGGNG, 3'-NNAGAAW e 3'-ACAY, e as sequências de PAM para Cpf1 incluem 5'-TTN (onde N é definido como qualquer nucleotídeo, W é definido como A ou T e Y é definido como C ou T).
[0045] Cada RNA guia pode compreender três regiões: uma primeira região na extremidade 5' que tem complementaridade com o sítio-alvo na sequência de DNA cromossômico, uma segunda região que é interna e forma uma estrutura haste-alça, e uma terceira região na extremidade 3' que permanece essencialmente de fita simples. A segunda e terceira regiões formam uma estrutura secundária que interage com a proteína CRISPR/Cas. A primeira região de cada RNA guia é diferente (isto é, é específica da sequência). A segunda e a terceira regiões podem ser iguais em RNAs guia que se complexam com uma proteína CRISPR/Cas particular.
[0046] A primeira região do RNA guia tem complementaridade com a sequência (isto é, sequência protoespaçadora) no sítio-alvo, de modo que, a primeira região do RNA guia possa formar par de base com a sequência-alvo. Por exemplo, a primeira região de um RNA guia SpCas9 pode compreender GN17-20GG. Em geral, a complementaridade entre a primeira região (isto é, crRNA) do RNA guia e a sequência-alvo é de pelo menos 80%, pelo menos 85%, pelo menos 90%, pelo menos 95%, ou mais. Em várias modalidades, a primeira região do RNA guia pode compreender de cerca de 10 nucleotídeos a mais que cerca de 25 nucleotídeos. Por exemplo, a região de pareamento de bases entre a primeira região do RNA guia e o sítio-alvo na sequência de cDNA pode ser de aproximadamente 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 22, 23, 24, 25 ou mais de 25 nucleotídeos de comprimento. Em uma modalidade exemplar, a primeira região do RNA guia tem cerca de 19, 20 ou 21 nucleotídeos de comprimento.
[0047] O RNA guia também compreende uma segunda região que forma uma estrutura secundária. Em algumas modalidades, a estrutura secundária compreende pelo menos uma haste (ou grampo de cabelo) e uma alça. O comprimento de cada alça e da haste podem variar. Por exemplo, a alça pode variar de cerca de 3 a cerca de 10 nucleotídeos de comprimento, e a haste pode variar de cerca de 6 a cerca de 20 pares de base de comprimento. A haste pode compreender uma ou mais protuberâncias de 1 a cerca de 10 nucleotídeos. Desse modo, o comprimento total da segunda região pode variar de cerca de 16 a cerca de 60 nucleotídeos de comprimento. O RNA guia também compreende uma terceira região na extremidade 3' que permanece essencialmente de fita simples. Desse modo, a terceira região não tem nenhuma complementaridade com qualquer sequência de ácido nucleico na célula de interesse e não tem complementaridade com o resto do RNA guia. O comprimento da terceira região pode variar. Em geral, a terceira região tem mais de cerca de 4 nucleotídeos de comprimento. Por exemplo, o comprimento da terceira região pode variar de cerca de 5 a cerca de 60 nucleotídeos de comprimento.
[0048] O comprimento combinado da segunda e terceira regiões (também chamado a região universal ou de estrutura) do RNA guia pode variar de cerca de 30 a cerca de 120 nucleotídeos de comprimento. Em um aspecto, o comprimento combinado da segunda e terceira regiões do RNA guia varia de cerca de 70 a cerca de 100 nucleotídeos de comprimento.
[0049] Ainda em outras modalidades, a segunda e a terceira regiões do RNA guia podem compreender uma ou mais regiões haste- alça adicionais, em que as regiões haste-alça compreendem sequências de aptâmero (Konermannet al., Nature 3, 2015, 517 (7536)): 583-588; Zalatan et al., Cell, 2015, 160 (1-2): 339-50). Sequências de aptâmeros adequadas incluem aquelas que ligam proteínas adaptadoras escolhidas de MS2, PP7, COM, Q2, F2, GA, fr, JP501, M12, R17, BZ13, JP34, JP500, KU1, M11, MX1, TW18, VK, SP, FI ID2, NL95, TW19, AP205, ΦCb5, ΦCb8r, ΦCb12r, ΦCb23r, 7s, PRR1, HSF1, AID, APOBEC1, p300, TET1 / 2/3, VP64, GFP, Rta, p65, MyoD1 ou VP160. Em tais modalidades, o comprimento total da segunda e terceira regiões do RNA guia pode variar até cerca de 125 nucleotídeos, até cerca de 150 nucleotídeos, até cerca de 175 nucleotídeos, até cerca de 200 nucleotídeos, até cerca de 225 nucleotídeos, até cerca de 250 nucleotídeos, até cerca de 275 nucleotídeos, ou até cerca de 300 nucleotídeos.
[0050] Em algumas modalidades, o RNA guia pode ser uma única molécula compreendendo todas as três regiões. Em outras modalidades, o RNA guia pode compreender duas moléculas separadas. A primeira molécula de RNA (isto é, crRNA) pode compreender a primeira região do RNA guia e metade da "haste" da segunda região do RNA guia. A segunda molécula de RNA (isto é, tracrRNA) pode compreender a outra metade da "haste" da segunda região do RNA guia e a terceira região do RNA guia. Desse modo, nesta modalidade, a primeira e segunda moléculas de RNA contêm, cada uma, uma sequência de nucleotídeos que são complementares entre si. Por exemplo, em uma modalidade, as moléculas de RNA crRNA e tracrRNA compreendem, cada uma, uma sequência (de cerca de 6 a cerca de 20 nucleotídeos) que formam pares de base com a outra sequência para formar um RNA guia funcional. Por exemplo, o RNA guia de sistemas CRISPR/Cas tipo II pode compreender crRNA e tracrRNA. Em alguns aspectos, o crRNA para um sistema CRISPR/Cas tipo II pode ser quimicamente sintetizado e o tracrRNA para o sistema CRISPR/Cas tipo II pode ser sintetizado in vitro (veja seção (I)(c) abaixo). Em outras modalidades, o RNA guia de sistemas CRISPR/Cas do tipo V pode compreender apenas crRNA.
[0051] O RNA guia pode compreender ribonucleotídeos padrão, ribonucleotídeos modificados (por exemplo, pseudouridina), isômeros de ribonucleotídeo e/ou análogos ribonucleotídeo. Em algumas modalidades, o RNA guia pode ainda compreender pelo menos um marcador detectável. O marcador detectável pode ser um fluoróforo (por exemplo, FAM, TMR, Cy3, Cy5, Vermelho Texas, Verde Oregon, Flúores Alexa, marcadores Halo, ou corante fluorescente adequado), um cromóforo (por exemplo, biotina, digoxigenina e similares), pontos quânticos ou partículas de ouro. Aqueles versados na técnica são familiarizados com planejamento e construção de gRNA, por exemplo, ferramentas de planejamento de gRNA estão disponíveis na internet ou de fontes comerciais.
[0052] O RNA guia pode ser quimicamente sintetizado, enzimaticamente sintetizado ou uma combinação destes. Por exemplo, o RNA guia pode ser sintetizado usando métodos de síntese em fase sólida com base em fosforamidito. Alternativamente, o RNA guia pode ser sintetizado in vitro operavelmente ligando o DNA que codifica o RNA guia a uma sequência de controle promotora que é reconhecida por uma polimerase de RNA do fago. Exemplos de sequências promotoras de fagos adequadas incluem sequências promotoras T7, T3, SP6, ou variações das mesmas. Em modalidades nas quais o RNA guia compreende duas moléculas separadas (isto é, crRNA e tracrRNA), o crRNA pode ser quimicamente sintetizado e o tracrRNA pode ser enzimaticamente sintetizado. O ácido nucleico codificando o RNA guia pode ser parte de um vetor plasmídeo, que pode ainda compreender sequências adicionais de controle de expressão (por exemplo, sequências realçadoras, sequências Kozak, sequências de poliadenilação, sequências de terminação transcricional, etc.), sequências marcadoras selecionáveis (por exemplo, genes com resistência a antibiótico), origens de replicação, e similares. Como detalhado abaixo na seção (I)(c), o ácido nucleico codificando o RNA guia pode ser operavelmente ligado a uma sequência de controle promotora que é reconhecida pela RNA polimerase III (Pol III) para expressão em células eucarióticas. (ii) Sistemas de Nicase Dual CRISPR/Cas
[0053] Em outras modalidades, a proteína de modificação de DNA programável pode ser um sistema de nicase dual CRISPR/Cas. Os sistemas de nicase dual CRISPR/Cas são similares aos sistemas de nuclease CRISPR/Cas descritos acima na seção (I)(a)(i), exceto que a nuclease CRISPR/Cas é modificada para clivar apenas uma fita de DNA. Desse modo, um sistema de nicase CRISPR/Cas simples cria um rompimento de fita simples ou um entalhe em DNA de fita dupla, e um sistema de nicase dual CRISPR/Cas pareado compreendendo RNAs guia de haste pareado cria um rompimento de fita dupla no DNA.
[0054] Uma nuclease CRISPR/Cas pode ser convertida em uma nicase por uma ou mais mutações e/ou deleções. Por exemplo, uma nicase Cas9 pode compreender uma ou mais mutações em um dos domínios de nuclease (por exemplo, o domínio semelhante a RuvC ou o domínio semelhante a HNH). Por exemplo, uma ou mais mutações podem ser D10A, D8A, E762A e/ou D986A no domínio semelhante a RuvC ou uma ou mais mutações podem ser H840A, H559A, N854A, N856A e/ou N863A no domínio semelhante a HNH. (iii) Nucleases Dedo de Zinco
[0055] Ainda em outras modalidades, a proteína de modificação de DNA programável pode ser uma nuclease dedo de zinco (ZFN). Uma ZFN compreende uma região dedo de zinco de ligação ao DNA e um domínio de nuclease. A região do dedo de zinco pode compreender cerca de dois a sete dedos de zinco, por exemplo, cerca de quatro a seis dedos de zinco, em que cada dedo de zinco se liga a três nucleotídeos. A região dedo de zinco pode ser modificada para reconhecer e ligar-se a qualquer sequência de DNA. Ferramentas de planejamento de dedo de zinco ou algoritmos estão disponíveis na internet ou de fontes comerciais. Os dedos de zinco podem ser ligados entre si usando sequências ligantes adequadas.
[0056] Uma ZFN também compreende um domínio de nuclease, que pode ser obtido a partir de qualquer endonuclease ou exonuclease. Exemplos não limitantes de endonucleases das quais um domínio de nuclease pode ser derivado incluem, porém não estão limitados a endonucleases de restrição e endonucleases de origem. Em algumas modalidades, o domínio de nuclease pode ser derivado de uma endonuclease de restrição do tipo II-S. As endonucleases do tipo II-S clivam o DNA em sítios que são tipicamente vários pares de base afastados do sítio de reconhecimento/ligação e, como tal, têm domínios de ligação e clivagem separáveis. Estas enzimas são geralmente monômeros que se associam transitoriamente para formar dímeros para clivar cada fita de DNA em localizações escalonadas. Exemplos não limitantes de endonucleases do tipo II-S adequadas incluem BfiI, BpmI, BsaI, Bsgl, BsmBI, BsmI, BspMI, FokI, MboII e SapI. Em algumas modalidades, o domínio de nuclease pode ser um domínio de nuclease de FokI ou um seu derivado. O domínio de nuclease do tipo II-S pode ser modificado para facilitar a dimerização de dois domínios de nucleases diferentes. Por exemplo, o domínio de clivagem de FokI pode ser modificado por mutação de certos resíduos de aminoácidos. A título de exemplo não limitantes, os resíduos de aminoácido nas posições 446, 447, 479, 483, 484, 486, 487, 490, 491, 496, 498, 499, 500, 531, 534, 537 e 538 de domínios de FokI nuclease são alvos para modificação. Por exemplo, um domínio FokI modificado pode compreender mutações Q486E, I499L e/ou N496D, e o outro domínio FokI modificado pode compreender mutações E490K, I538K e/ou H537R.
[0057] A ZFN pode ainda compreender pelo menos um sinal de localização nuclear, domínio de penetração celular e/ou domínio marcador, que são descritos acima na seção (I)(a)(i). (iv) Nucleases Efetoras semelhantes a Ativador de Transcrição
[0058] Em modalidades alternativas, a proteína de modificação de DNA programável pode ser uma nuclease efetora semelhante a ativador de transcrição (TALEN). TALENs compreendem um domínio de ligação a DNA composto de repetições altamente conservadas derivadas de efetores semelhantes a ativador da transcrição (TALEs) que é ligado a um domínio de nuclease. TALEs são proteínas secretadas pelo patógeno de planta Xanthomonas para alterar a transcrição de genes em células de planta hospedeira. As matrizes de repetição TALE podem ser modificadas por meio de planejamento de proteína modular para atingir qualquer sequência de DNA de interesse. O domínio de nuclease de TALENs pode ser qualquer domínio de nuclease como descrito acima na seção (I)(a)(iii). Em modalidades específicas, o domínio de nuclease é derivado de FokI (Sanjana et al., 2012, Nat Protoc, 7 (1): 171-192).
[0059] O TALEN também pode compreender pelo menos um sinal de localização nuclear, domínio de penetração celular, domínio marcador e/ou marcador detectável, que são descritos acima na seção (I)(a)(i). (v) Meganucleases ou Endonucleases de Corte Raro
[0060] Em ainda outras modalidades, a proteína de modificação de DNA programável pode ser uma meganuclease ou um seu derivado. As meganucleases são endodeoxirribonucleases caracterizadas por sequências longas de reconhecimento, isto é, a sequência de reconhecimento varia geralmente de cerca de 12 pares de base até cerca de 45 pares de base. Como consequência deste requisito, a sequência de reconhecimento geralmente ocorre apenas uma vez em qualquer genoma dado. Entre as meganucleases, a família de endonucleases homing, denominada LAGLIDADG, tornou-se uma ferramenta valiosa para o estudo de genomas e engenharia do genoma. Em algumas modalidades, a meganuclease pode ser I-SceI, I-TevI ou suas variantes. Uma meganuclease pode ser direcionada para uma sequência cromossômica específica modificando sua sequência de reconhecimento utilizando técnicas bem conhecidas por aqueles versados na técnica.
[0061] Em modalidades alternativas, a proteína de modificação de DNA programável pode ser uma endonuclease de corte raro ou seu derivado. Endonucleases de corte raro são endonucleases específicas do sítio cuja sequência de reconhecimento ocorre raramente em um genoma, de preferência apenas uma vez em um genoma. A endonuclease de corte raro pode reconhecer uma sequência de 7 nucleotídeos, uma sequência de 8 nucleotídeos ou uma sequência de reconhecimento mais longa. Exemplos não limitantes de endonucleases de corte raro incluem NotI, AscI, PacI, AsiSI, SbfI e FseI.
[0062] A meganuclease ou endonuclease de corte raro também pode compreender pelo menos um sinal de localização nuclear, domínio de penetração celular, domínio marcador e/ou marcador detectável, que são descritos acima na seção (I)(a)(i). (vi) Proteínas de Fusão Programáveis Compreendendo Domínios de Nuclease
[0063] Em ainda modalidades adicionais, a proteína de modificação de DNA programável pode ser uma proteína de fusão compreendendo um domínio de ligação ao DNA programável ligado a um domínio de nuclease (clivagem de fita dupla). O domínio de nuclease da proteína de fusão pode ser qualquer um daqueles acima descritos na seção (I)(a)(iii), um domínio de nuclease derivado de uma nuclease CRISPR/Cas (por exemplo, domínios de nuclease semelhantes a RuvC ou semelhantes a HNH de Cas9 ou domínio de nuclease de Cpf1), ou um domínio de nuclease derivado de uma meganuclease ou endonuclease de corte raro.
[0064] O domínio de ligação ao DNA programável da proteína de fusão pode ser uma endonuclease programável (isto é, nuclease CRISPR/CAS ou meganuclease) modificada para não ter toda a atividade da nuclease. Desse modo, o domínio de ligação a DNA da proteína de fusão pode ser um sistema CRISPR/Cas cataliticamente inativo ou uma meganuclease cataliticamente inativa. Alternativamente, o domínio de ligação a DNA programável da proteína de fusão pode ser uma proteína de ligação a DNA programável, tal como, por exemplo, uma proteína dedo de zinco ou um efetor semelhante a ativador de transcrição. Em algumas modalidades, o domínio de ligação ao DNA programável pode ser uma nuclease CRISPR/Cas cataliticamente inativa na qual a atividade da nuclease foi eliminada por mutação e/ou deleção. Por exemplo, a proteína CRISPR/Cas cataliticamente inativa pode ser uma Cas9 (morta) cataliticamente inativa (morta) (dCas9) em que o domínio semelhante a RuvC compreende uma mutação D10A, D8A, E762A, e/ou D986A e o domínio semelhante a HNH compreende uma mutação H840A, H559A, N854A, N865A e/ou N863A. Alternativamente, a proteína CRISPR/Cas cataliticamente inativa pode ser uma proteína Cpf1 cataliticamente inativa (morta) compreendendo mutações comparáveis no domínio de nuclease. Ainda em outras modalidades, o domínio de ligação a DNA programável pode ser uma meganuclease cataliticamente inativa na qual a atividade da nuclease foi eliminada por mutação e/ou deleção, por exemplo, a meganuclease cataliticamente inativa pode compreender uma truncação de terminação C.
[0065] A proteína de fusão compreendendo a atividade de nuclease também pode compreender pelo menos um sinal de localização nuclear, domínio de penetração celular, domínio marcador e/ou marcador detectável, que são descritos acima na seção (I)(a)(i). (vii) Proteínas de Fusão Programáveis/Complexos Compreendendo Domínios Não Nuclease
[0066] Em modalidades alternativas, a proteína de modificação de DNA programável pode ser uma proteína de fusão compreendendo um domínio de ligação a DNA programável ligado a um domínio de modificação não nuclease. Domínios de ligação de DNA programáveis adequados são descritos acima na seção (I)(a)(vi).
[0067] Em algumas modalidades, o domínio de modificação não nuclease pode ser um domínio de modificação epigenética, que altera a estrutura de DNA ou cromatina (e pode ou não alterar a sequência de DNA). Exemplos não limitantes de domínios de modificação epigenética adequados incluem aqueles com atividade de DNA metiltransferase (por exemplo, citosina metiltransferase), atividade de DNA desmetilase, desaminação de DNA (por exemplo, citosina desaminase, adenosina desaminase, guanina desaminase), aminação de DNA, atividade de DNA helicase, atividade de histona acetiltransferase (HAT) (por exemplo, domínio HAT derivado da proteína de ligação E1A p300), atividade de histona desacetilase, atividade de histona metiltransferase, atividade de histona desmetilase, atividade de histona cinase, atividade de histona fosfatase, atividade de histona ubiquitina ligase, atividade de histona desubiquitinação, atividade de histona adenilação, atividade de histona desadenilação, atividade de histona SUMOilação, atividade de histona desSUMOilação, atividade de ribosilação de histona, atividade de desribosilação de histona, atividade de miristoilação de histona, atividade de desmistoilação de histona, atividade de citrulinação de histona, atividade de alquilação de histona, atividade de desalquilação de histona ou atividade de oxidação de histona. Em modalidades específicas, o domínio de modificação epigenética pode compreender atividade de citosina desaminase, atividade de histona acetiltransferase ou atividade de DNA metiltransferase.
[0068] Em outras modalidades, o domínio de modificação não nuclease pode ser um domínio de ativação transcricional ou domínio repressor transcricional. Os domínios de ativação transcricional adequados incluem, sem limitar, o domínio VP16 do vírus herpes simples, domínios de ativação VP64 (que é um derivado tetramérico de VP16), VP160, NFKB p65, domínios de ativação p53 1 e 2, domínios de ativação CREB (proteína de ligação ao elemento resposta cAMP), domínios de ativação E2A, domínio de ativação de fator 1 de choque térmico humano (HSF1) ou domínios de ativação NFAT (fator nuclear de células T ativadas). Exemplos não limitantes de domínios repressores transcricionais adequados incluem domínios repressores precoces de cAMP induzíveis (ICER), domínios repressores da caixa A associados a Kruppel (KRAB-A), domínios repressores ricos em glicina YY1, repressores semelhantes a Sp1, repressores E (spl), repressor IkB, ou MeCP2. Os domínios de ativação transcricional ou repressores transcricionais podem ser geneticamente fundidos à proteína de ligação a DNA ou ligados por meio de interações não covalentes de proteína-proteína, proteína-RNA ou proteína-DNA.
[0069] Em modalidades nas quais a proteína de modificação de DNA programável compreende um sistema CRISPR/Cas, o RNA guia do sistema CRISPR/Cas pode compreender sequências de aptâmeros que ligam ativadores transcricionais, repressores transcricionais, ou proteínas de modificação epigenética (Konermannet al., Nature, 2015, 517 (7536): 583-588, Zalatanet al., Cell, 2015, 160 (1-2): 339-50).
[0070] A proteína de fusão compreendendo atividade não nuclease também pode compreender pelo menos um sinal de localização nuclear, domínio de penetração celular, domínio marcador e/ou marcador detectável, que são descritos acima na seção (I)(a)(i) . (b) Proteínas de ligação a DNA programáveis
[0071] A composição também compreende pelo menos uma proteína de ligação a DNA programável. Proteínas de ligação de DNA programáveis são proteínas que se ligam a sequências de DNA específicas, mas não modificam o DNA ou proteína(s) associada com o DNA.
[0072] Em algumas modalidades, a pelo menos uma proteína de ligação a DNA programável pode ser uma nuclease CRISPR/Cas modificada para não ter atividade de nuclease. Por exemplo, a proteína de ligação a DNA programável pode ser um sistema CRISPR/Cas cataliticamente inativo. Para isso, a nuclease CRISPR/Cas pode ser modificada por mutação e/ou deleção para eliminar toda a atividade da nuclease. Em uma modalidade, o domínio semelhante a RuvC e o domínio semelhante a HNH compreendem ambos uma ou mais mutações e/ou deleções para eliminar a atividade da nuclease. Por exemplo, a proteína CRISPR/Cas cataliticamente inativa pode ser uma Cas9 cataliticamente inativa (morta) (dCas9) em que o domínio semelhante a RuvC compreende uma mutação D10A, D8A, E762A, e/ou D986A e o domínio semelhante a HNH compreende uma mutação H840A, H559A, N854A, N856A e/ou N863A. Alternativamente, a proteína CRISPR/Cas cataliticamente inativa pode ser uma proteína Cpf1 cataliticamente inativa (morta) compreendendo mutações comparáveis no domínio de nuclease. Em outros aspectos, a proteína de ligação a DNA programável, pode ser uma proteína CRISPR/Cas modificada para cortar uma fita de uma sequência de fita dupla (isto é, uma nicase), como detalhado acima na seção (I)(a)(ii).
[0073] Em outras modalidades, a pelo menos uma proteína de ligação a DNA programável pode ser uma meganuclease cataliticamente inativa na qual a atividade da nuclease foi eliminada por mutação e/ou deleção, por exemplo, a meganuclease cataliticamente inativa pode compreender uma truncação de terminação C. Ainda em outras modalidades, a pelo menos uma proteína de ligação a DNA programável, pode ser uma proteína dedo de zinco ou um efetor semelhante a um ativador da transcrição (TALE). Em modalidades adicionais, a pelo menos uma proteína de ligação a DNA programável pode ser uma nicase CRISPR/Cas, uma nicase ZFN, uma nicase TALEN ou uma nicase de meganuclease. Nicases ZFN, TALEN e de meganuclease compreendem mutações e/ou deleções em um dos domínios de nuclease ou metade dos domínios, de método tal que a nicase clive apenas uma fita de uma sequência de fita dupla.
[0074] A proteína de ligação ao DNA programável também pode compreender pelo menos um sinal de localização nuclear, domínio de penetração celular, domínio marcador e/ou marcador detectável, que são descritos acima na seção (I)(a)(i). (c) Ácidos nucléicos que codificam proteínas de modificação de DNA programáveis ou proteínas de ligação de DNA programáveis
[0075] O ácido nucleico codificando a proteína de modificação de DNA programável, descrita acima na seção (I)(a), ou a proteína de ligação a DNA programável, descrita acima na seção (I)(b), pode ser DNA ou RNA, linear ou circular, de fita simples ou fita dupla. O RNA ou DNA pode ser otimizado por códon para translação eficiente em proteína na célula eucariótica de interesse. Programas de otimização de códon estão disponíveis como freeware ou de fontes comerciais.
[0076] Em algumas modalidades, o ácido nucleico codificando a proteína de modificação de DNA programável ou a pelo menos uma proteína de ligação a DNA programável pode ser mRNA. O mRNA pode ser sintetizado in vitro. Para isto, o DNA que codifica a proteína de modificação de DNA ou a pelo menos uma proteína de ligação a DNA podem ser operavelmente ligados a uma sequência promotora que é reconhecida por uma RNA polimerase de fago para a síntese in vitro de mRNA. Por exemplo, a sequência promotora pode ser uma sequência promotora T7, T3 ou SP6 ou uma variação de uma sequência promotora T7, T3 ou SP6. Em tais modalidades, o RNA transcrito in vitro pode ser purificado, tamponado e/ou poliadenilado. Como detalhado abaixo, o DNA que codifica a proteína de modificação de DNA ou a proteína de ligação a DNA faz parte de um vetor.
[0077] Em outras modalidades, o ácido nucleico codificando a proteína de modificação de DNA programável ou a pelo menos uma proteína de ligação a DNA programável pode ser DNA. A sequência de DNA que codifica a proteína de modificação de DNA programável ou a pelo menos uma proteína de ligação a DNA programável pode ser operavelmente ligada a pelo menos uma sequência de controle promotora para expressão na célula de interesse. Em algumas modalidades, a sequência de codificação de DNA também pode ser ligada a um sinal de poliadenilação (por exemplo, sinal poliA de SV40, sinal poliA de hormônio de crescimento bovino (BGH), etc.) e/ou pelo menos uma sequência de terminação da transcricional.
[0078] Em certas modalidades, a sequência de codificação de DNA pode ser operavelmente ligada a uma sequência promotora para expressão da proteína de modificação de DNA ou da proteína de ligação a DNA em células bacterianas (por exemplo, E. coli) ou células eucarióticas (por exemplo, levedura, inseto ou mamífero). Promotores bacterianos adequados incluem, sem limitar, promotores T7, promotores lac operon, promotores trp, promotores tac (que são híbridos de promotores trp e lac), variações de qualquer um dos anteriores e combinações de qualquer um dos anteriores. Exemplos não limitantes promotores eucarióticos adequados incluem promotores constitutivos, regulados ou específicos de células ou tecidos. Sequências de controle do promotor constitutivo eucariótico incluem, porém não estão limitados a, promotor precoce imediato de citomegalovírus (CMV), promotor do vírus símio (SV40), promotor tardio principal do adenovírus, promotor do vírus do sarcoma de Rous (RSV), promotor do vírus do tumor mamário de camundongo (MMTV) promotor de fosfoglicerato cinase (PGK), promotor do fator de alongamento (ED1)-alfa, promotores de ubiquitina, promotores de actina, promotores de tubulina, promotores de imunoglobulina, seus fragmentos ou combinações de qualquer um dos anteriores. Exemplos de sequências de controle de promotor reguladas eucarióticas adequadas incluem, sem limitação, aquelas reguladas por choque térmico, metais, esteroides, antibióticos ou álcool. Exemplos não limitantes de promotores específicos de tecido incluem o promotor B29, promotor CD14, promotor CD43, promotor CD45, promotor CD68, promotor desmina, promotor elastase-1, promotor endoglina, promotor fibronectina, promotor Flt-1, promotor GFAP, promotor GPIIb, Promotor ICAM-2, promotor INF-β, promotor Mb, promotor NphsI, promotor OG-2, promotor SP-B, promotor SYN1 e promotor WASP. A sequência promotora pode ser do tipo selvagem ou pode ser modificada para uma expressão mais eficiente ou eficaz.
[0079] Em várias modalidades, o ácido nucleico codificando a proteína de modificação de DNA programável e/ou a pelo menos uma proteína de ligação a DNA programável pode estar presente em um vetor. Vetores adequados incluem vetores de plasmídeo, fagemídeos, cosmídeos, artificiais/minicromossomas, transposons e vetores virais (por exemplo, vetores lentivirais, vetores virais adeno-associados, vetores adenovirais, etc.). Em uma modalidade, o DNA que codifica a proteína de modificação de DNA programável e/ou a pelo menos uma proteína de ligação a DNA programável pode estar presente em um vetor de plasmídeo. Exemplos não limitantes de vetores de plasmídeo adequados incluem pUC, pBR322, pET, pBluescript e suas variantes. Em outras modalidades, o ácido nucleico codificando a proteína de modificação de DNA programável e/ou a pelo menos uma proteína de ligação a DNA programável, pode estar presente em um vetor viral. O vetor viral ou plasmídeo pode compreender sequências de controle de expressão adicionais (por exemplo, sequências realçadoras, sequências Kozak, sequências de poliadenilação, sequências de terminação da transcricional, etc.), Sequências marcadoras selecionáveis (por exemplo, genes com resistência a antibiótico), origens de replicação, e similares. Informação adicional pode ser encontrada em "Current Protocols in Molecular Biology" Ausubel et al., John Wiley & Sons, Nova Iorque, 2003 ou "Molecular Cloning: A Laboratory Manual" Sambrook & Russell, Cold Spring Harbor Press, Cold Spring Harbor, NY, 3a. edição, 2001.
[0080] Em modalidades nas quais a proteína de modificação de DNA programável e/ou pelo menos uma proteína de ligação a DNA programável compreende uma proteína CRISPR/Cas ou sua variante, o vetor de expressão compreendendo ácido nucleico codificando a proteína de modificação de DNA programável e/ou a pelo menos uma proteína de ligação a DNA programável, pode ainda compreender sequência que codifica um ou mais RNAs guia. A sequência que codifica o RNA guia geralmente é operavelmente ligada a pelo menos uma sequência de controle transcricional para expressão do RNA guia na célula eucariótica de interesse. Por exemplo, o ácido nucleico codificando o RNA guia pode ser operavelmente ligado a uma sequência promotora que é reconhecida por RNA polimerase III (Pol III). Exemplos de promotores de Pol III adequados incluem, porém não estão limitados a promotores de RNA U6, U3, H1 e 7SL mamíferos. d) Composições específicas
[0081] Em algumas modalidades, a proteína de modificação de DNA programável e uma ou mais proteínas de ligação de DNA programáveis são fornecidas como proteínas (ou, em alguns casos, como complexos de proteína-RNA). As proteínas de modificação de DNA programáveis e as proteínas de ligação de DNA programáveis podem ser expressas em células bacterianas ou eucarióticas e purificadas utilizando meios bem conhecidos na técnica. Em outras modalidades, a proteína de modificação de DNA programável e a uma ou mais proteínas de ligação a DNA programáveis são fornecidas como ácidos nucleicos codificantes.
[0082] Em algumas modalidades, a composição pode compreender uma proteína / sistema de ligação ao DNA programável ou ácidos nucleicos codificantes. Em outras modalidades, a composição pode compreender duas proteínas/sistemas de ligação a DNA programáveis ou ácidos nucleicos codificantes. Ainda em outras modalidades, a composição pode compreender três proteínas/sistemas de ligação a DNA programáveis ou ácidos nucleicos codificantes. Em outras modalidades, a composição pode compreender quatro proteínas/sistemas de ligação a DNA programáveis ou ácidos nucleicos codificantes. Ainda em outras modalidades, a composição pode compreender cinco ou mais proteínas/sistema de ligação a DNA programáveis ou ácidos nucleicos codificantes.
[0083] Em modalidades específicas, a proteína de modificação de DNA programável pode compreender um sistema CRISPR/Cas (por exemplo, nuclease CRISPR/Cas, nicase dual CRISPR/Cas ou proteína CRISPR/Cas cataliticamente inativa (morta) ligada a um domínio de modificação não nuclease) e a proteína de ligação a DNA programável pode ser um sistema CRISPR/Cas que não possui atividade de nuclease. Por exemplo, a proteína de ligação a DNA programável pode ser catalisada pelo sistema CRISPR/Cas inativo. Em geral, cada proteína CRISPR/Cas compreende pelo menos um sinal de localização nuclear. Em algumas interações, a composição pode compreender os sistemas CRISPR/Cas como proteínas CRISPR/Cas e RNA guia, em que a proteína e o RNA podem ser entidades separadas ou a proteína e o RNA podem ser complexados entre si. O RNA guia pode ser pelo menos parcialmente quimicamente sintetizado. O RNA guia pode ser enzimaticamente sintetizado. Em outras interações, a composição pode compreender as proteínas CRISPR/Cas e o DNA que codifica os RNAs guia. Ainda em outras interações, a composição pode compreender mRNA que codifica as proteínas CRISPR/Cas e DNA que codifica os RNA guias. Ainda em outras interações, a composição pode compreender plasmídeos ou vetores virais codificando as proteínas CRISPR/Cas e/ou os RNAs guia. Em certas modalidades, a proteína CRISPR/Cas cataliticamente ativa e a proteína CRISPR/Cas cataliticamente inativa (morta) são proteínas Cas9. Os ácidos nucleicos que codificam as proteínas CRISPR/Cas são geralmente codificados para expressão ideal na célula eucariótica de interesse. (vii) Kits
[0084] Outro aspecto da presente invenção fornece kits compreendendo as composições detalhadas acima na seção (I). Os kits podem fornecer a proteína de modificação de DNA programável e pelo menos uma proteína de ligação a DNA programável como proteínas, como complexos de proteína-RNA, ou como ácidos nucleicos que codificam os vários componentes, como detalhado acima. Os kits podem ainda compreender reagentes de transfecção, meios de crescimento celular, meios de seleção, reagentes de transcrição in vitro, reagentes de purificação de ácidos nucleicos, reagentes de purificação de proteínas, tampões e similares. Os kits aqui fornecidos incluem geralmente instruções para executar os métodos detalhados abaixo. As instruções incluídas nos kits podem ser afixadas ao material de embalagem ou podem ser incluídas como um folheto informativo. Embora as instruções sejam tipicamente materiais escritos ou impressos, não estão limitadas a tais. Qualquer meio capaz de armazenar tais instruções e comunicá-las a um usuário final é contemplado por esta invenção. Tais meios incluem, porém não estão limitados a veículos de armazenamento eletrônico (por exemplo, discos magnéticos, fitas, cartuchos, chips), veículos óticos (por exemplo, CD-ROM), e similares. Como usado aqui, o termo "instruções" pode incluir o endereço de um site na Internet que fornece as instruções.
[0085] Em algumas modalidades, a proteína de modificação de DNA programável e/ou pelo menos uma proteína de ligação a DNA programável do kit pode compreender um sistema CRISPR/Cas tipo II. Em certas modalidades, o RNA guia do sistema CRISPR/Cas tipo II pode compreender crRNA e tracrRNA. O kit, portanto, pode fornecer o tracrRNA universal (s), e o usuário final do kit pode fornecer o(s) crRNA(s) específico(s) da sequência. Em alguns aspectos, o kit pode compreender a(s) proteína(s) CRISPR/Cas tipo II e o(s) tracrRNA(s). Em outros aspectos, o kit pode compreender mRNA ou DNA que codifica a(s) proteína(s) CRISPR/Cas tipo II e DNA que codifica o(s) ARNtrac (s).
[0086] Em ainda outras modalidades, a proteína de modificação de DNA programável e/ou a pelo menos uma proteína de ligação a DNA programável do kit pode compreender um sistema CRISPR/Cas tipo V. Como detalhado acima, o RNA guia dos sistemas CRISPR/Cas tipo V compreende apenas o crRNA. Em alguns aspectos, o kit pode compreender as proteínas CRISPR/Cas tipo V e crRNA(s), ou o kit pode compreender mRNA ou DNA codificando as proteínas CRISPR/Cas tipo V e DNA codificando os crRNA (s). Em outros aspectos, o kit pode compreender apenas a(s) proteína(s) CRISPR/Cas tipo V ou ácido nucléico codificando a(s) proteína(s) CRISPR/Cas tipo V, em que o usuário final do kit fornece o(s) crRNA (s). (viii) Métodos para Aumentar a Acessibilidade aos Sítios Cromossômicos Alvos
[0087] Outro aspecto da presente invenção abrange métodos para aumentar a eficiência e/ou especificidade do genoma-alvo/modificação epigenética em células eucarióticas aumentando a acessibilidade de uma proteína de modificação de DNA programável a sua sequência- alvo em DNA cromossômico. Os métodos compreendem introduzir na célula eucariótica de interesse (a) uma proteína de modificação de DNA programável ou ácido nucleico codificando a proteína de modificação de DNA programável e (a) pelo menos uma proteína de ligação a DNA programável ou ácido nucleico codificando a pelo menos uma proteína de ligação a DNA programável. A proteína de modificação de DNA programável modificada para reconhecer e ligar- se a uma sequência-alvo no DNA cromossômico, em cujo sítio a proteína de modificação de DNA pode modificar o DNA ou proteína(s) associada(s). Cada uma ou mais das proteínas de ligação a DNA programáveis é modificada para reconhecer e ligar uma sequência proximal à sequência cromossômica alvo da proteína de modificação de DNA. As proteínas de modificação de DNA programáveis e as proteínas de ligação de DNA programáveis estão detalhadas acima na seção (I).
[0088] Em geral, a sequência proximal à sequência cromossômica alvo está localizada dentro de cerca de 250 pares de base de cada lado (isto é, a montante ou a jusante) da sequência cromossômica alvo. O(s) sítio(s) proximal(is) pode(m) ser localizado(s) em quaisquer das fitas dupla do DNA. Em algumas modalidades, a sequência proximal à sequência cromossômica alvo pode estar localizada menos do que cerca de 250 pb, menos que cerca de 200 pb, menos que cerca de 150 pb, menos que cerca de 100 pb, menos que cerca de 75 pb, menos que cerca de 50 pb menos que cerca de 25 pb, menos que cerca de 20 pb, menos que cerca de 15 pb, menos que cerca de 10 pb ou menos que cerca de 5 pb da sequência cromossômica alvo a partir da proteína de modificação de DNA. Em certas modalidades, a sequência proximal à sequência cromossômica alvo pode estar localizada a partir de cerca de 1 pb a cerca de 10 pb, de cerca de 11 pb a cerca de 20 pb, de cerca de 21 pb a cerca de 30 pb, de cerca de 31 pb a cerca de 40 pb de cerca de 41 pb a cerca de 50 pb, de cerca de 51 pb a cerca de 60 pb, de cerca de 61 pb a cerca de 70 pb, de cerca de 71 pb a cerca de 80 pb, de cerca de 81 pb a cerca de 90 pb, de cerca de 91 pb a cerca de 100 pb, de cerca de 101 pb a cerca de 150 pb, de cerca de 151 pb a cerca de 200 pb, ou de cerca de 201 pb a cerca de 250 pb em quaisquer dos lados da sequência cromossômica alvo. Em outras modalidades, a sequência proximal à sequência cromossômica alvo pode estar localizada a partir de cerca de 5 pb a cerca de 75 pb, desde cerca de 10 pb a cerca de 50 pb, ou desde cerca de 15 pb a cerca de 25 pb de cada lado da sequência cromossômica alvo.
[0089] Em algumas modalidades, o método compreende introduzir na célula pelo menos uma proteína de ligação a DNA programável cuja sequência de ligação está localizada a montante ou a jusante da sequência cromossômica alvo. Em outras modalidades, o método compreende a introdução na célula de pelo menos duas proteínas de ligação de DNA programáveis, em que a sequência de ligação de uma está localizada a montante da sequência cromossômica alvo e a sequência de ligação da outra está localizada a jusante da sequência cromossômica alvo. Em outras modalidades, o método compreende a introdução na célula de pelo menos três proteínas de ligação de DNA programáveis cujas sequências de ligação estão localizadas a montante ou a jusante da sequência cromossômica alvo. Em modalidades adicionais, o método compreende a introdução na célula de quatro ou mais proteínas de ligação a DNA programáveis cujas sequências de ligação são localizadas a montante ou a jusante da sequência cromossômica alvo. Nestas modalidades, por exemplo, o método pode compreender a introdução de uma, duas três, quatro, cinco, seis, sete, oito, nove, dez ou mais do que dez proteínas de ligação de DNA programáveis cujas sequências de ligação são localizadas dentro de cerca de 250 pb sobre cada lado. (isto é, a montante ou a jusante) da sequência cromossômica alvo.
[0090] A ligação de uma ou mais proteínas de ligação a DNA programáveis ao sítio proximal à sequência cromossômica alvo muda a configuração da cromatina local, levando à acessibilidade aumentada da proteína de modificação de DNA programável à sequência cromossômica alvo (anteriormente inacessível) (veja a FIG. 1). Como consequência, a eficiência de modificação pela proteína de modificação de DNA é aumentada (veja, por exemplo, os Exemplos 13). Dito de outro modo, a eficiência de modificação por uma proteína de modificação de DNA aumentada quando a proteína de modificação de DNA é introduzida na célula em combinação com uma ou mais proteínas de ligação a DNA programáveis em comparação a quando a proteína de modificação de DNA introduzida na célula sozinha.
[0091] Além disso, os métodos aqui descritos aumentam a especificidade de modificação do genoma-alvo. Embora a proteína de modificação de DNA programável seja modificada para reconhecer e ligar uma sequência-alvo em um locus cromossômico específico, sequências idênticas ou quase idênticas podem existir em outras localizações cromossômicas (resultando em efeitos fora do alvo). Em modalidades em que a ligação de uma proteína de modificação de DNA programável a uma sequência cromossômica alvo depende largamente da ligação de uma ou mais proteínas de ligação a DNA programáveis a sequências proximais à sequência cromossômica alvo, a ligação de uma ou mais proteínas de ligação a DNA programáveis a sítio(s) proximal(is) à sequência-alvo no locus cromossômico de interesse, no entanto, fornece especificidade adicional para o evento de modificação (veja Exemplo 4).
[0092] Desse modo, os métodos aqui descritos podem aumentar a eficiência e/ou especificidade de edição do genoma-alvo (por exemplo, correções de genes, nocautes de genes, genes de ativação e similares), modificações epigenéticas direcionadas e regulação de transcrição direcionada. (a) Introdução na Célula
[0093] Como descrito, o método compreende introduzir na célula (b) uma proteína de modificação de DNA programável ou ácido nucleico codificando a proteína de modificação de DNA programável e (b) pelo menos uma proteína de ligação a DNA programável ou ácido nucleico codificando pelo menos uma proteína de ligação a DNA programável. Proteínas de modificação de DNA programáveis são detalhadas acima na seção (I)(a), proteínas de ligação a DNA programáveis são detalhadas acima na seção (I)(b) e ácidos nucleicos codificando as proteínas de modificação de DNA ou a proteína de ligação a DNA programável são descritos acima em seção (I)(c).
[0094] A proteína de modificação de DNA programável ou ácido nucleico codificando a proteína de modificação de DNA programável e pelo menos uma proteína de ligação a DNA programável ou ácido nucleico codificando a pelo menos uma proteína de ligação a DNA programável pode ser introduzida na célula de interesse por uma variedade de métodos.
[0095] Em algumas modalidades, a célula pode ser transfectada com as moléculas apropriadas (isto é, proteína, DNA e/ou RNA). Métodos de transfecção adequados incluem nucleofecção (ou eletroporação), transfecção mediada por fosfato de cálcio, transfecção de polímero catiônico (por exemplo, DEAE-dextrano ou polietilenimina), transdução viral, transfecção com virossoma, transfecção com vírion, transfecção com lipossoma, transfecção com lipossoma catiônico, transfecção com imunolipossomas, transfecção de lipídeo não lipossômico, transfecção de dendrímeros, transfecção por choque térmico, magnetofecção, lipofecção, liberação por pistola de gene, impalefecção, sonoporação, transfecção ótica e captação realçada de agente proprietário de ácidos nucleicos. Os métodos de transfecção são bem conhecidos na técnica (veja, por exemplo, "Current Protocols in Molecular Biology" Ausubelet at al., John Wiley & Sons, Nova Iorque, 2003 ou "Molecular Cloning: A Laboratory Manual" Sambrook & Russell, Cold Spring Harbor Press, Cold Spring Harbor, NY, 3a. edição, 2001). Em outras modalidades, as moléculas podem ser introduzidas na célula por microinjeção. Por exemplo, as moléculas podem ser injetadas no citoplasma ou núcleos das células de interesse. A quantidade de cada molécula introduzida na célula pode variar, porém aqueles versados na técnica são familiarizados com os métodos para determinação da quantidade apropriada.
[0096] As várias moléculas podem ser introduzidas na célula simultaneamente ou sequencialmente. Por exemplo, a proteína de modificação de DNA programável (ou o seu ácido nucleico codificante) e a pelo menos uma proteína de ligação a DNA programável (ou ácido nucleico codificante) podem ser introduzidas ao mesmo tempo. Alternativamente, um pode ser introduzido primeiro e em seguida o outro pode ser introduzido posteriormente na célula.
[0097] Em geral, a célula é mantida sob condições apropriadas para o crescimento celular e/ou manutenção. Condições de cultura celular adequadas são bem conhecidas na técnica e são descritas, por exemplo, em Santiago et al., Proc. Natl. Acad. Sci. USA, 2008, 105: 5809-5814; Moehle et al. Proc. Natl. Acad. Sci. USA, 2007, 104: 30553060; Urnov et al., Nature, 2005, 435: 646-651; e Lombardo et al. Nat. Biotechnol., 2007, 25: 1298-1306. Aqueles versados na técnica apreciam que os métodos para cultura celular são conhecidos na técnica e podem variar dependendo do tipo de célula. Otimização de rotina pode ser usada, em todos os casos, para determinar as melhores técnicas para um particular tipo de célula. (c) Modificação do genoma-alvo
[0098] A ligação de uma ou mais proteínas de ligação de DNA programáveis a sequência(s) proximal(is) à sequência cromossômica alvo muda a configuração de cromatina local, por exemplo, estrutura nucleossômica pode ser alterada e/ou histonas podem ser deslocadas. Como uma consequência, a proteína de modificação de DNA programável é capaz de acessar melhor a sequência cromossômica alvo quando comparado a quando a proteína de modificação de DNA programável é usada sozinha. A acessibilidade aumentada resulta em maior eficiência e/ou especificidade de modificação do genoma-alvo. A modificação do genoma-alvo/epigenética pode ser mediada por proteínas de modificação de DNA que têm atividade de nuclease ou atividade não nuclease.
[0099] Em modalidades nas quais a proteína de modificação de DNA programável tem atividade de nuclease, a proteína de modificação de DNA pode introduzir um rompimento de fita dupla na sequência cromossômica alvo. O rompimento de fita dupla na sequência cromossômica pode ser reparado por um processo de reparação de união de extremidade não homólogo (NHEJ). Por que o NHEJ é propenso a erros, deleções de pelo menos um nucleotídeo, inserções de pelo menos um nucleotídeo, substituições de pelo menos um nucleotídeo, ou suas combinações, podem ocorrer durante o reparo do rompimento. Por conseguinte, a sequência cromossômica alvo pode ser modificada ou inativada. Por exemplo, uma deleção, inserção ou substituição no deslocamento na estrutura de leitura de uma sequência de codificação pode levar a um produto proteico alterado ou a nenhum produto proteico (que é denominado "nocaute"). Em algumas interações, o método pode ainda compreender introduzir na célula de um polinucleotídeo doador (veja abaixo) compreendendo uma sequência doadora que é flanqueada por sequência tendo substancial identidade de sequência para sequências localizadas em qualquer um dos lados da sequência cromossômica alvo, de método que durante a reparação do rompimento de fita dupla por um processo de reparo direcionado por homologia (HDR) a sequência doadora no polinucleotídeo doador possa ser trocada com ou integrada na sequência cromossômica na sequência cromossômica alvo. A integração de uma sequência exógena é denominada "ativação". Como detalhado acima, os métodos aqui descritos também reduzem os efeitos fora do alvo, desse método aumentando a especificidade de modificação do genoma-alvo.
[00100] Em várias interações, portanto, a eficiência e/ou especificidade de modificação do genoma-alvo pode ser aumentada em pelo menos cerca de 0,1 vez, pelo menos cerca de 0,5 vez, pelo menos cerca de 1 vez, pelo menos cerca de 2 vezes, pelo menos cerca de 5 vezes, pelo menos cerca de 10 vezes, ou pelo menos cerca de 20 vezes, pelo menos cerca de 50 vezes, pelo menos cerca de 100 vezes, ou mais que cerca de 100 vezes relativamente a quando a proteína de modificação de DNA programável com atividade de nuclease, é usada sozinha. Por exemplo, a proteína de modificação de DNA programável tendo atividade de nuclease, quando usada sozinha, não pode nenhum indels ou eventos de integração detectáveis. No entanto, quando a proteína de modificação de DNA programável tendo atividade de nuclease é utilizada em combinação com pelo menos uma proteína de ligação a DNA programável, os indels e eventos de integração podem ser detectados (por exemplo, pelo menos cerca de 1% de indels/integrações, pelo menos cerca de 5% de indels/integração, pelo menos cerca de 10% indels/integrações, pelo menos cerca de 20% indels/integrações, pelo menos cerca de 30% indels/integrações, pelo menos cerca de 40% indels/integrações, pelo menos cerca de 50% indels/integrações, ou mais de cerca de 50% indels/integrações).
[00101] Em modalidades em que a proteína de modificação de DNA programável tem atividade não-nuclease, a proteína de modificação de DNA pode modificar DNA ou proteínas associadas na sequência cromossômica alvo ou modificar a expressão da sequência cromossômica alvo. Por exemplo, quando a proteína de modificação de DNA programável compreende atividade de modificação epigenética, o status de acetilação de histona, metilação, fosforilação, adenilação, etc. pode ser modificado ou o status de metilação de DNA, aminação, etc. pode ser modificado. Como um exemplo, em modalidades em que a proteína de modificação de DNA programável compreende atividade de citosina desaminase, um ou mais resíduos de citocina na sequência cromossômica alvo podem ser convertidos em resíduos de uracila. Alternativamente, quando a proteína de modificação de DNA programável compreende ativação transcricional ou atividade repressora, a transcrição na sequência cromossômica alvo pode ser aumentada ou diminuída. A modificação epigenética resultante ou regulação transcricional pode ser aumentada em pelo menos cerca de 0,1 vez, pelo menos cerca de 0,5 vez, pelo menos cerca de 1 vez, pelo menos cerca de 2 vezes, pelo menos cerca de 5 vezes, pelo menos cerca de 10 vezes, ou pelo menos cerca de 20 vezes, pelo menos cerca de 50 vezes, pelo menos cerca de 100 vezes, ou mais que cerca de 100 vezes relativamente a quando a proteína de modificação de DNA programável tendo atividade não nuclease é utilizada sozinha.
[00102] As modificações do genoma-alvo/modificações epigenéticas detalhadas acima podem ser realizadas isoladamente ou multiplexadas (isto é, duas ou mais sequências cromossômicas podem ser alvos simultaneamente). c) Polinucleotídeo Doador Opcional
[00103] Em modalidades nas quais a proteína de modificação de DNA programável compreende a atividade da nuclease, o método pode ainda compreender introduzir pelo menos um polinucleotídeo doador na célula. O polinucleotídeo doador pode ser de fita simples ou fita dupla, linear ou circular e/ou RNA ou DNA. Em algumas modalidades, o polinucleotídeo doador pode ser um vetor, por exemplo, um vetor de plasmídeo.
[00104] O polinucleotídeo doador compreende pelo menos uma sequência doadora. Em alguns aspectos, a sequência doadora do polinucleotídeo doador pode ser uma versão modificada de uma sequência cromossômica endógena ou nativa. Por exemplo, a sequência doadora pode ser essencialmente idêntica a uma porção da sequência cromossômica na, ou perto da, sequência alvejada pela proteína de modificação de DNA, porém que compreende pelo menos uma mudança de nucleotídeo. Desse modo, após integração ou troca com a sequência nativa, a sequência na localização cromossômica alvo compreende pelo menos uma mudança de nucleotídeo. Por exemplo, a mudança pode ser uma inserção de um ou mais nucleotídeos, uma deleção de um ou mais nucleotídeos, uma substituição de um ou mais nucleotídeos, ou suas combinações. Como uma consequência da integração de "correção de gene" da sequência modificada, a célula pode produzir um produto de gene modificado da sequência cromossômica alvo.
[00105] Em outros aspectos, a sequência doadora do polinucleotídeo doador pode ser uma sequência exógena. Como aqui utilizado, uma sequência "exógena" refere-se a uma sequência que não é nativa para a célula, ou uma sequência cuja localização nativa está em uma localização diferente no genoma da célula. Por exemplo, a sequência exógena pode compreender sequência de codificação de proteína, que pode ser operavelmente ligada a uma sequência de controle promotora exógena de modo que, após integração no genoma, a célula é capaz de expressar a proteína codificada pela sequência integrada. Alternativamente, a sequência exógena pode ser integrada na sequência cromossômica de método que sua expressão seja regulada por uma sequência de controle promotora endógena. Em outras interações, a sequência exógena pode ser uma sequência de controle transcricional, outra sequência de controle de expressão, uma sequência de codificação de RNA, e assim por diante. Como observado acima, a integração de uma sequência exógena em uma sequência cromossômica é denominada "ativação".
[00106] Como pode ser apreciado por aqueles versados na técnica, o comprimento da sequência doadora pode e variará. Por exemplo, a sequência doadora pode variar em comprimento de vários nucleotídeos a centenas de nucleotídeos a centenas de milhares de nucleotídeos.
[00107] Tipicamente, a sequência doadora no polinucleotídeo doador é flanqueada por uma sequência a montante e uma sequência a jusante, que têm substancial identidade de sequência para sequências localizadas a montante e a jusante, respectivamente, da sequência alvejada pela proteína de modificação de DNA programável. Devido a estas similaridades de sequência, as sequências a montante e a jusante do polinucleotídeo doador permitem a recombinação homóloga entre o polinucleotídeo doador e a sequência cromossômica alvo, de modo que, a sequência doadora possa ser integrada (ou trocada com) com a sequência cromossômica.
[00108] A sequência a montante, como aqui utilizada, refere-se a uma sequência de ácido nucleico que compartilha substancial identidade de sequência com uma sequência cromossômica a montante da sequência alvejada pela proteína de modificação de DNA programável. Similarmente, a sequência a jusante refere-se a uma sequência de ácido nucleico que compartilha substancial identidade de sequência com uma sequência cromossômica a jusante da sequência alvejada pela proteína de modificação de DNA programável. Como aqui utilizado, a frase "substancial identidade de sequência" refere-se a sequências tendo pelo menos cerca de 75% de identidade de sequência. Desse modo, as sequências a montante e a jusante no polinucleotídeo doador podem ter cerca de 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com sequência a montante ou a jusante da sequência-alvo. Em uma modalidade exemplar, das sequências a montante e a jusante no polinucleotídeo doador podem ter cerca de 95% ou 100% de identidade de sequência com sequências cromossômicas a montante ou a jusante em relação da sequência alvejada pela proteína de modificação de DNA programável.
[00109] Em algumas modalidades, a sequência a montante compartilha substancial identidade de sequência com uma sequência cromossômica localizada imediatamente a montante da sequência alvejada pela proteína de modificação de DNA programável. Em outras modalidades, a sequência a montante compartilha substancial identidade de sequência com uma sequência cromossômica que está localizada dentro de cerca de cem (100) nucleotídeos a montante da sequência-alvo. Desse modo, por exemplo, a sequência a montante pode compartilhar substancial identidade de sequência com uma sequência cromossômica que está localizada cerca de 1 a cerca de 20, cerca de 21 a cerca de 40, cerca de 41 a cerca de 60, cerca de 61 a cerca de 80 ou cerca de 81 a cerca de 100 nucleotídeos a montante da sequência-alvo. Em algumas modalidades, a sequência a jusante compartilha uma substancial identidade de sequência com uma sequência cromossômica localizada imediatamente a jusante da sequência alvejada pela proteína de modificação de DNA programável. Em outras modalidades, a sequência a jusante compartilha substancial identidade de sequência com uma sequência cromossômica que está localizada dentro de cerca de cem (100) nucleotídeos a jusante da sequência-alvo. Desse modo, por exemplo, a sequência a jusante pode compartilhar substancial identidade de sequência com uma sequência cromossômica que está localizada cerca de 1 a cerca de 20, cerca de 21 a cerca de 40, cerca de 41 a cerca de 60, cerca de 61 a cerca de 80 ou cerca de 81 a cerca de 100 nucleotídeos a jusante da sequência-alvo.
[00110] Cada sequência a montante ou a jusante pode variar em comprimento de cerca de 20 nucleotídeos a cerca de 5000 nucleotídeos. Em algumas modalidades, as sequências a montante e a jusante podem compreender cerca de 50, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1100, 1200, 1300, 1400, 1500, 1600, 1700, 1800, 1900, 2000, 2100, 2200, 2300, 2400, 2500, 2600, 2800, 3000, 3200, 3400, 3600, 3800, 4000, 4200, 4400, 4600, 4800 ou 5000 nucleotídeos. Em modalidades específicas, as sequências a montante e a jusante podem variar em comprimento de cerca de 50 a cerca de 1500 nucleotídeos. (e) Tipos celulares
[00111] Uma variedade de células é adequada para utilização nos métodos aqui descritos. Em geral, a célula é uma célula eucariótica. Por exemplo, a célula pode ser uma célula mamífera humana, uma célula mamífera não humana, uma célula de vertebrado não mamífera, uma célula de invertebrado, uma célula de inseto, uma célula vegetal, uma célula de levedura ou um organismo eucariótico de única célula. Em algumas modalidades, a célula também pode ser um embrião celular. Por exemplo, um embrião de mamífero não humano incluindo embriões de rato, hamster, roedor, coelho, felino, canino, ovino, porcino, bovino, equino e primata. Ainda em outras modalidades, a célula pode ser uma célula-tronco, tais como células-tronco embrionárias, células-tronco semelhantes a ES, células-tronco fetais, células-tronco adultas, e similares. Em uma modalidade, a célula- tronco não é uma célula-tronco embrionária humana. Além disso, as células-tronco podem incluir aquelas produzidas pelas técnicas descritas no documento WO 2003/046141, que é aqui incorporado na sua íntegra, ou Chung et al. (Cell Stem Cell, 2008, 2: 113-117). A célula pode ser in vitro ou in vivo (isto é, dentro de um organismo). Em modalidades exemplares, a célula é uma célula mamífera. Em modalidades particulares, a célula é uma célula humana.
[00112] Exemplos não limitantes de células mamíferas adequadas incluem células renais embrionárias humanas (HEK293, HEK293T); células de carcinoma cervical humano (HELA); células pulmonares humanas (W138); células hepáticas humanas (Hep G2); células de osteossarcoma humanas U2-OS, células humanas A549, células humanas A-431 e células humanas K562; Células de ovário de hamster chinês (CHO), células de rim de hamster bebês (BHK); células NS0 de mieloma de camundongo, células 3T3 de fibroblasto embrionário de camundongo (NIH3T3), células A20 de linfoma B de camundongo; células B16 de melanoma de camundongo; células C2C12 de mioblastos de camundongo; células SP2/0 de mieloma de camundongo; células C3H-10T1/2 mesenquimatosas embrionárias de camundongo; células CT26 de carcinoma de camundongo, células DuCuP da próstata de camundongo; células de EMT6 da mama de camundongo; células Hepa1c1c7 de hepatoma de camundongo; células J5582 de mieloma de camundongo; células MTD-1A epiteliais de camundongo; células MyEnd miocárdicas de camundongo; células renCa renais de camundongo; células RIN-5F pancreáticas de camundongo; células X64 de melanoma de camundongo; células YAC-1 de linfoma de camundongo; células 9L de glioblastoma de rato; células RBL de linfoma de rato B; células B35 de neuroblastoma de rato; células de hepatoma de rato (HTC), células BRL 3A de fígado de rato búfalo, células de rim canino (MDCK); células mamárias caninas (CMT); células D17 de osteossarcoma de rato; células DH82 de monócito/macrófago de rato; células de fibroblastos transformadas SV- 40 de rim de macaco (COS7); células CVI-76 de rim de macaco; Células de rim de macaco verde africano (VERO-76). Uma extensa lista de linhagens celulares de mamíferos pode ser encontrada no catálogo American Type Culture Collection (ATCC, Manassas, VA). (IV) Métodos para Detecção de Loci Genômicos Específicos
[00113] Também são fornecidos aqui métodos para detectar ou visualizar loci genômicos específicos em células eucarióticas. Uma vez que a ligação proximal de uma ou mais proteínas de ligação a DNA programáveis altera a estrutura da cromatina e aumenta o acesso da proteína de modificação de DNA programável a locus cromossômicos anteriormente inacessíveis, o método descrito acima na seção (III) pode ser modificado para realçar a detecção de loci genômicos específicos ou sequências cromossômicas alvos. O método compreende introduzir na célula eucariótica (a) uma proteína de ligação a DNA programável, apresentando pelo menos um domínio marcador ou ácido nucleico detectável codificando a proteína de ligação a DNA programável, compreendendo pelo menos um domínio marcador detectável e (b) pelo menos uma proteína de ligação a DNA programável ou ácido nucleico codificando a pelo menos uma proteína de ligação a DNA programável, em que a proteína de ligação a DNA programável compreendendo pelo menos um domínio marcador detectável é direcionada a uma sequência cromossômica alvo e cada uma ou mais proteínas de ligação a DNA programáveis é direcionada para um sítio proximal à sequência cromossômica alvo. A ligação de pelo menos uma proteína de ligação a DNA programável ao sítio proximal à sequência cromossômica alvo aumenta a acessibilidade da proteína de ligação a DNA programável compreendendo pelo menos um domínio marcador detectável à sequência cromossômica alvo. O método compreende ainda a detecção da proteína de ligação a DNA programável compreendendo pelo menos um domínio marcador detectável ligado à sequência cromossômica alvo.
[00114] A proteína de ligação a DNA programável compreendendo pelo menos um domínio marcador detectável compreende um domínio de ligação ao DNA programável. Domínios de ligação de DNA programáveis adequados são descritos acima na seção (I)(a)(vi). Em modalidades específicas, o domínio de ligação a DNA programável pode ser um sistema CRISPR/Cas cataliticamente inativo, uma meganuclease cataliticamente inativa, uma proteína dedo de zinco ou um efector semelhante a um ativador de transcrição. O pelo menos um domínio marcador detectável da proteína de ligação a DNA programável pode ser uma proteína fluorescente (por exemplo, GFP, eGFP, RFP, e similares), um marcador fluorescente ou um marcador de epítopo, (que são descritos na seção (I)(a)(i) acima). Em certas modalidades, o pelo menos um domínio marcador detectável da proteína de ligação a DNA programável, pode ser um epítopo de ocorrência natural dentro da proteína de ligação a DNA programável, de modo que, a proteína de ligação a DNA programável, seja detectado por um anticorpo contra a proteína de ligação a DNA programável. A proteína de ligação a DNA programável compreendendo pelo menos um domínio marcador detectável pode compreender ainda pelo menos um sinal de localização nuclear e/ou domínio de penetração celular, como descrito acima na seção (I)(a)(i). Em algumas modalidades, a proteína de ligação ao DNA programável compreendendo pelo menos um domínio marcador detectável pode também compreender um domínio de modificação não nuclease (como descrito acima na seção (I)(a)(vi) acima).
[00115] Uma ou mais proteínas de ligação a DNA programáveis são descritas acima na seção (I)(b). Em geral, a pelo menos uma ligação de DNA programável pode ser uma proteína CRISPR/Cas cataliticamente inativa, uma meganuclease cataliticamente inativa, uma proteína dedo de zinco, um efetor semelhante a um ativador de transcrição, uma nicase CRISPR/Cas, uma nicase ZFN, uma nicase TALEN, ou uma nicase de meganuclease.
[00116] O método também a detecção da proteína de ligação a DNA programável compreendendo o domínio marcador detectável que é ligado à sequência cromossômica alvo, em que a detecção pode ser por meio de imageamento de células vivas dinâmicas, microscopia fluorescente, microscopia confocal, imunofluorescência, imunodetecção, RNA-proteína ligação, ligação de proteína-proteína, e similares. A etapa de detecção pode ser realizada em células vivas ou em células fixadas.
[00117] Em modalidades nas quais o método compreende detectar a dinâmica estrutural da cromatina em células vivas, a proteína de ligação a DNA programável compreendendo o domínio marcador detectável e uma ou mais proteínas de ligação de DNA programáveis pode ser introduzida na célula como proteínas ou ácidos nucleicos, essencialmente como descrito acima na seção (III)(a). Em modalidades em que o método compreende a detecção da sequência cromossômica alvo em células fixadas, a proteína de ligação a DNA programável compreendendo o domínio marcador detectável e as proteínas de ligação a DNA programáveis pode ser introduzida na célula como proteínas (ou complexos de RNA-proteína). Métodos para fixar e permeabilizar células são bem conhecidos na técnica. Em algumas modalidades, as células fixas podem ser submetidas a processos de desnaturação química e/ou térmica para converter DNA cromossômico de fita dupla em DNA de fita simples. Em outras modalidades, as células fixas não são submetidas a processos de desnaturação química e/ou térmica.
[00118] Em modalidades específicas, a proteína de ligação a DNA programável compreendendo o domínio marcador detectável é uma proteína de fusão compreendendo uma proteína CRISPR/Cas cataliticamente inativa (ou morta) e um domínio marcador de proteína fluorescente, e a pelo menos uma proteína de ligação a DNA programável é uma proteína CRISPR/Cas cataliticamente inativa (ou morta).
[00119] Em modalidades em que pelo menos uma das proteínas programáveis de modificação de DNA ou de ligação a DNA compreende uma proteína CRISPR/Cas, o RNA guia pode também compreender um marcador detectável para detecção in situ (por exemplo, FISH ou CISH). Marcadores detectáveis são detalhados acima na seção (I)(a)(i). Em algumas modalidades, cada uma das proteínas de modificação de DNA programáveis e de ligação a DNA compreende uma proteína CRISPR/Cas e cada RNA guia compreende pelo menos um marcador detectável, desse modo aumentando a quantidade ou intensidade do sinal a ser detectado.
[00120] Ainda em outras modalidades, a proteína de modificação de DNA programável proximalmente ligada e a uma ou mais proteínas de ligação de DNA programáveis podem ser detectadas por meio de um ensaio de ligação proximal. Por exemplo, a proteína de modificação de DNA programável pode ser ligada por um primeiro anticorpo e pelo menos uma das proteínas de ligação a DNA programáveis pode ser ligada por um segundo anticorpo, cada um dos quais é ligado, diretamente ou indiretamente (por exemplo, por meio de anticorpos secundários), a um oligonucleotídeo de detecção de proximidade de fita simples. Em outras modalidades, o(s) oligonucleotídeo(s) de detecção de proximidade de fita simples podem ser ligadas, direta ou indiretamente, a RNA(s) guia. Ainda em outras modalidades, o(s) oligonucleotídeo(s) de detecção de proximidade de fita simples podem ser ligadas, direta ou indiretamente, a proteínas de ligação de modificação de DNA programáveis ou de ligação a DNA programáveis. Os oligonucleotídeos de detecção de proximidade, que são complexados com as proteínas cromossomicamente ligadas, localizadas proximalmente, podem ser detectados por meio de uma reação de amplificação dependente da proximidade in situ. A reação de amplificação dependente da proximidade in situ pode ser um ensaio de ligação de proximidade (PLA, ver Soderg et al., Nature Methods, 2006, 3 (12): 995-1000) ou um início dependente da proximidade da reação de cadeia de hibridização (proxHCR, veja Koos et al., Nature Communications, 2015, 6: 7294, 10 pp.). (V) Aplicações
[00121] As composições e métodos aqui descritos podem ser utilizados em uma variedade de aplicações terapêuticas, diagnósticas, industriais e de pesquisa. Em algumas modalidades, a presente invenção pode ser utilizada para modificar qualquer sequência cromossômica de interesse em uma célula, animal ou planta a fim de modelar e/ou estudar a função de genes, estudar as condições genéticas ou epigenéticas de interesse ou estudar vias bioquímicas envolvidas em várias doenças ou distúrbios. Por exemplo, organismos transgênicos podem ser criados que modelem doenças ou distúrbios, em que a expressão de uma ou mais sequências de ácido nucleico associadas a uma doença ou distúrbio é alterada. O modelo da doença pode ser usado para estudar os efeitos de mutações sobre o organismo, estudar o desenvolvimento e/ou a progressão da doença, estudar o efeito de um composto farmaceuticamente ativo sobre a doença e/ou avaliar a eficácia de uma potencial estratégia de terapia de gene.
[00122] Em outras modalidades, as composições e métodos podem ser utilizados para realizar avaliações genômicas funcionais eficazes e baratas, que podem ser utilizadas para estudar a função de genes envolvidos em um processo biológico particular e como qualquer alteração na expressão de gene pode afetar o processo biológico, ou para realizar mutagênese por saturação ou varredura profunda de loci genômicos em conjunção com um fenótipo celular. A mutagênese por saturação ou varredura profunda pode ser usada para determinar características mínimas críticas e vulnerabilidades discretas dos elementos funcionais necessários para a expressão gênica, resistência a drogas e reversão de doenças, por exemplo.
[00123] Em outras modalidades, as composições e métodos aqui descritos podem ser utilizados para testes de diagnóstico para estabelecer a presença de uma doença ou distúrbio e/ou para utilização na determinação de opções de tratamento. Exemplos de testes diagnósticos adequados incluem a detecção de mutações específicas em células cancerígenas (por exemplo, mutação específica em EGFR, HER2 e similares), detecção de mutações específicas associadas com doenças particulares (por exemplo, repetições de trinucleotídeos, mutações em β-globina associadas com doença de célula falciforme, SNPs específicos, etc.), detecção de hepatite, detecção de viroses (por exemplo, Zika) e assim por diante.
[00124] Em modalidades adicionais, as composições e métodos aqui descritos podem ser utilizados para corrigir mutações genéticas associadas com uma doença ou distúrbio particular, tais como, por exemplo, mutações corretas no gene globina associadas à doença falciforme ou talassemia, mutações corretas no gene da adenosina desaminase associado à imunodeficiência combinada severa (SCID), reduz a expressão de HTT, o gene causador da doença de Huntington, ou corrige mutações no gene da rodopsina para o tratamento da retinite pigmentosa. Tais modificações podem ser feitas em células ex vivo.
[00125] Em ainda outras modalidades, as composições e métodos aqui descritos podem ser usados para gerar plantas de cultura com características melhoradas ou resistência aumentada a estresses ambientais. A presente invenção também pode ser usada para gerar animais de fazenda com características melhoradas ou animais de produção. Por exemplo, os porcos têm muitas características que os tornam atrativos como modelos biomédicos, especialmente em medicina regenerativa ou xenotransplante.
[00126] A menos que de outro modo definidos, todos os termos técnicos e científicos usados aqui têm o significado comumente entendido por uma pessoa versada na técnica à qual essa invenção pertence. As seguintes referências fornecem uma habilidade com uma definição geral de muitos dos termos utilizados nesta invenção: Singleton et al., Dictionary of Microbiology and Molecular Biology (2 ed. 1994); The Cambridge Dictionary of Science and Technology (ed. Walker, 1988); The Glossary of Genetics, 5a Ed., R. Rieger et al. (eds.), Springer Verlag (1991); e Hale & Marham, The Harper Collins Dictionary of Biology (1991). Como usado aqui, os seguintes termos têm os significados atribuídos a eles, a menos que de outra forma especificado.
[00127] Quando introduzindo elementos da presente invenção ou as modalidades referidas da mesma, os artigos "um, uma, uns, umas",, "o, a, os, as" e "referido" destinam-se a significar que há um ou mais dos elementos. Os termos "compreendendo", "incluindo" e "tendo" se destinam a ser inclusivos e significam que pode haver elementos adicionais além dos elementos listados.
[00128] O termo "cerca de" quando usado em relação a um valor numérico, x, por exemplo, significa x ± 5%.
[00129] Como aqui utilizado, os termos "complementar" ou "complementaridade" referem-se à associação de ácidos nucleicos de fita dupla por pareamento de base por meio de ligações de hidrogênio específicas. O pareamento de base pode ser pareamento de base Watson-Crick padrão (por exemplo, pares 5’-AGT C-3’ com a sequência complementar 3’-T C A G-5’). O pareamento de base também pode ser Hoogsteen ou ligação de hidrogênio de Hoogsteen reversa. A complementaridade é tipicamente medida em relação a uma região duplex e, desse modo, exclui projeções, por exemplo. A complementaridade entre duas fitas da região dúplex pode ser parcial e expressa como uma percentagem (por exemplo, 70%), se apenas algumas (por exemplo, 70%) das bases forem complementares. As bases que não são complementares são "incompatíveis". A complementaridade pode também ser completa (isto é, 100%), se todas as bases da região dúplex forem complementares.
[00130] Como usado aqui, o termo "sistema CRISPR/Cas" refere-se a um complexo compreendendo uma proteína CRISPR/Cas (isto é, nuclease, nicase, ou proteína cataliticamente morta) e um RNA guia.
[00131] O termo "sequência endógena", como usado aqui, refere-se a uma sequência cromossômica que é nativa para a célula.
[00132] Como usado aqui, o termo "exógeno" refere-se a uma sequência que não é nativa para a célula, ou uma sequência cromossômica cuja localização nativa no genoma da célula está em uma localização cromossômica diferente.
[00133] Um "gene", como usado aqui, refere-se a uma região de DNA (incluindo éxons e íntrons) que codifica um produto de gene, bem como todas as regiões de DNA que regulam a produção do produto de gene, se ou não tais sequências regulatórias são adjacentes às sequências de codificação e/ou transcritas. Por conseguinte, um gene inclui, mas não está necessariamente limitado a sequências promotoras, terminadores, sequências regulatórias traducionais, tais como sítios de ligação a ribossoma e sítios internos de entrada dos ribossomas, realçadores, silenciadores, isolantes, elementos de fronteira, origens de replicação, sítios de ligação à matriz e regiões de controle de locus.
[00134] O termo "heterólogo" refere-se a uma entidade que não é endógena ou nativa para a célula de interesse. Por exemplo, uma proteína heteróloga refere-se a uma proteína que é derivada de ou foi originalmente derivada de uma fonte exógena, tal como uma sequência de ácido nucleico exogenamente introduzida. Em alguns casos, a proteína heteróloga não é normalmente produzida pela célula de interesse.
[00135] Os termos "estrutura da cromatina local" ou "configuração da cromatina local", como aqui utilizados, referem-se à estrutura nucleossômica e/ou espaçamento da proteína histona e geralmente não se referem à compactação de nucleossomas em fibras de cromatina e heterocromatina.
[00136] O termo "nicase" refere-se a uma enzima que cliva uma fita de uma sequência de ácido nucleico de fita dupla (isto é, cliva uma sequência de fita dupla). Por exemplo, uma nuclease com atividade de clivagem de fita dupla pode ser modificada por mutação e/ou deleção para funcionar como uma nicase e cliva apenas uma fita de uma sequência de fita dupla.
[00137] O termo "nuclease", como é usado no presente documento, refere-se a uma enzima que cliva ambas as cadeias de uma sequência de ácido nucleico de fita dupla.
[00138] Os termos "ácido nucleico" e "polinucleotídeo" referem-se a um polímero de desoxirribonucleotídeo ou ribonucleotídeo, em conformação linear ou circular, e na forma de fita simples ou dupla. Para os propósitos da presente invenção, estes termos não devem ser construídos como limitantes em relação ao comprimento de um polímero. Os termos podem abranger análogos conhecidos de nucleotídeos naturais, bem como nucleotídeos que são modificados nas porções base, açúcar e/ou fosfato (por exemplo, cadeias principais de fosforotioato). Em geral, um análogo de um nucleotídeo particular tem a mesma especificidade de pareamento de base; isto é, um análogo de A formará par de base com T.
[00139] O termo "nucleotídeo" refere-se a desoxirribonucleotídeos ou ribonucleotídeos. Os nucleotídeos podem ser nucleotídeos padrão (isto é, adenosina, guanosina, citidina, timidina e uridina), isômeros de nucleotídeo ou análogos de nucleotídeo. Um análogo de nucleotídeo refere-se a um nucleotídeo tendo uma base de purina ou pirimidina modificada ou uma porção de ribose modificada. Um análogo de nucleotídeo pode ser um nucleotídeo de ocorrência natural (por exemplo, inosina, pseudouridina, etc.) ou um nucleotídeo de ocorrência não natural. Exemplos não limitantes de modificações nas porções de açúcar ou base de um nucleotídeo incluem a adição (ou remoção) de grupos acetila, grupos amino, grupos carboxila, grupos carboximetila, grupos hidroxila, grupos metila, grupos fosforila e grupos tiol, bem como a substituição dos átomos de carbono e nitrogênio das bases com outros átomos (por exemplo, 7-deaza purinas). Os análogos de nucleotídeo incluem também didesóxi nucleotídeos, 2'-O-metil nucleotídeos, ácidos nucleicos bloqueados (LNA), ácidos nucleicos peptídicos (PNA) e morfolinos.
[00140] Os termos "polipeptídeo" e "proteína" são usados alternadamente para se referir a um polímero de resíduos de aminoácidos.
[00141] O termo "sítio proximal", como usado aqui, refere-se a um sítio de ligação ou sequência de nucleotídeo que está localizado dentro de cerca de 250 pares de base em cada lado de uma sequência alvo no DNA cromossômico.
[00142] Como usado aqui, o termo "proteína de modificação de DNA programável" refere-se a uma proteína que é modificada para se ligar a uma sequência-alvo específica no DNA cromossômico e que modifica o DNA ou proteína(s) associadas com o DNA na, ou próximo da sequência-alvo.
[00143] O termo "proteína de ligação a DNA programável", como usado aqui, se refere a uma proteína que é modificada para se ligar a uma sequência-alvo específica no DNA cromossômico, porém a proteína não modifica o DNA ou proteína(s) associadas com o DNA em, ou próximo da sequência-alvo.
[00144] Os termos "sequência-alvo", "sequência cromossômica alvo" e "local alvo" são utilizados alternadamente para se referir a sequência específica no DNA cromossômico para o qual a proteína de modificação de DNA programável é direcionada, e o sítio no qual a proteína de modificação de DNA programável modifica o DNA ou proteína(s) associadas com o DNA.
[00145] Técnicas para determinar a identidade de sequência de ácido nucleico e aminoácido são conhecidas na técnica. Tipicamente, tais técnicas incluem a determinação da sequência de nucleotídeo do mRNA para um gene e/ou a determinação da sequência de aminoácido desse modo codificada, e comparando estas sequências com uma segunda sequência de nucleotídeo ou de aminoácido. Sequências genômicas também podem ser determinadas e comparadas desta forma. Em geral, a identidade refere-se a uma correspondência exata de nucleotídeos-a-nucleotídeos ou aminoácidos-a-aminoácido de duas sequências de polinucleotídeos ou polipeptídeo, respectivamente. Duas ou mais sequências (polinucleotídeo ou aminoácido) podem ser comparadas determinando a sua identidade percentual. A identidade percentual de duas sequências, quer sejam sequências de ácido nucleico ou de aminoácido, é o número de correspondências exatas entre duas sequências alinhadas divididas pelo comprimento das sequências mais curtas e multiplicadas por 100. Um alinhamento aproximado das sequências de ácido nucleico é fornecido pelo algoritmo de homologia local de Smith e Waterman, Advances in Applied Mathematics 2: 482489 (1981). Este algoritmo pode ser aplicado a sequências de aminoácido usando a matriz de pontuação desenvolvida por Dayhoff, Atlas of Protein Sequences and Structure, M. O. Dayhoff ed., 5 supl. 3: 353-358, National Biomedical Research Foundation, Washington, DC, USA, e normalizada por Gribskov, Nucl. Acids Res. 14 (6): 6745-6763 (1986). Uma implementação exemplar desse algoritmo para determinar a identidade percentual de uma sequência é fornecida pelo Genetics Computer Group (Madison, Wisconsin) na aplicação de utilidade "BestFit". Outros programas adequados para calcular a identidade percentual ou similaridade entre sequências são geralmente conhecidos na técnica, por exemplo, outro programa de alinhamento é o BLAST, utilizado com parâmetros padrão. Por exemplo, BLASTN e BLASTP podem ser usados os seguintes parâmetros padrão: código genético = padrão; filtro = nenhum; fita = ambos; incisão = 60; espera = 10; Matriz = BLOSUM62; Descrições = 50 sequências; classificar por = ALTA PONTUAÇÃO; Bases de dados = não-redundantes, translações GenBank+EMBL+DDBJ+PDB+GenBank CDS+Proteína Suíça+Spupdate +PIR. Detalhes desses programas podem ser encontrados no website GenBank.
[00146] Visto que várias alterações podem ser feitas nas células acima descritas e métodos sem sair do âmbito da invenção, pretende- se que toda a matéria contida na descrição acima e nos exemplos dados abaixo, deve ser interpretada como ilustrativa e não em um sentido limitante.
[00147] As seguintes modalidades enumeradas são apresentadas para ilustrar certos aspectos da presente invenção, e não se destinam a limitar seu escopo. 1. Composição compreendendo: (a) uma proteína de modificação de DNA programável ou ácido nucleico codificando a proteína de modificação de DNA programável; e (b) pelo menos uma proteína de ligação a DNA programável ou ácido nucleico codificando a pelo menos uma proteína de ligação a DNA programável. 2. A composição de modalidade 1, em que a proteína de modificação de DNA programável é um sistema de nuclease (Cas) (CRISPR/Cas) (CRISPR) associado a (CRISPR)/CRISPR de repetições palindrômicas curtas regularmente intercaladas agrupadas guiadas por RNA, um sistema de nicase dual CRISPR/Cas, uma nuclease dedo de zinco (ZFN), uma nuclease efetora semelhante a ativador de transcrição (TALEN), uma meganuclease, uma proteína de fusão compreendendo um domínio de ligação a DNA programável ligado a um domínio de nuclease, ou uma proteína de fusão compreendendo um domínio de ligação a DNA programável ligado a um domínio não nuclease. 3. A composição da modalidade 2, em que o domínio de ligação ao DNA programável da proteína de fusão é um sistema CRISPR/Cas cataliticamente inativo, uma meganuclease cataliticamente inativa, uma proteína dedo de zinco ou um efetor semelhante a um ativador de transcrição. 4. A composição de modalidade 2 ou 3, em que o domínio não-nuclease da proteína de fusão possui atividade de acetiltransferase, a atividade de desacetilase, a atividade de metiltransferase, atividade de desmetilase, a atividade de cinase, atividade de fosfatase, atividade de ubiquitina ligase, atividade de desubiquitinação, atividade de adenilação, atividade de desadenilação, atividade de SUMOilação, atividade de desSUMOilação, atividade de ribosilação, atividade de desribosilação, atividade de miristoilação, atividade de desmiristoilação, atividade de citrulinação, atividade de helicase, atividade de aminação, atividade de desaminação, a atividade de alquilação, atividade de desalquilação, a atividade de oxidação, atividade de ativação da transcrição, ou atividade de repressor transcricional. 5. Composição da modalidade 4, em que o domínio não nuclease da proteína de fusão tem atividade de citosina desaminase, atividade de histona acetiltransferase, atividade de ativação transcricional ou atividade de repressor transcricional. 6. A composição de qualquer uma das modalidades 1 a 5, em que a pelo menos uma proteína de ligação a DNA programável é uma proteína CRISPR/Cas cataliticamente inativa, uma meganucleasse cataliticamente inativa, uma proteína dedo de zinco, um efetor semelhante a ativador de transcrição, uma nicase CRISPR/Cas, uma nicase ZFN, uma nicase TALEN, ou uma nicase de meganuclease. 7. A composição de qualquer uma das modalidades 1 a 6, em que o ácido nucleico codificando a proteína de modificação de DNA programável e a pelo menos uma proteína de ligação a DNA programável é RNA ou DNA e/ou em que o referido ácido nucleico é parte de um vetor de plasmídeo ou um vetor viral. 8. A composição de qualquer uma das modalidades 1 a 6, em que a proteína de modificação de DNA programável é um sistema de nuclease CRISPR/Cas, um sistema de nicase dual CRISPR/Cas ou um sistema CRISPR/Cas cataliticamente inativo ligado a um domínio não nuclease, e a pelo menos uma proteína de ligação a DNA programável, é um sistema CRISPR/Cas cataliticamente inativo, em que cada sistema CRISPR/Cas compreende uma proteína CRISPR/Cas e um RNA guia. 9. A composição da modalidade 8, em que cada sistema de nuclease CRISPR/Cas é um sistema CRISPR/Cas tipo I, um sistema CRISPR/Cas tipo II, um sistema CRISPR/Cas tipo III ou um sistema CRISPR/Cas tipo V. 10. A composição da modalidade 9, em que cada sistema de nuclease CRISPR/Cas é um sistema CRISPR/Cas tipo II ou um sistema CRISPR/Cas tipo V. 11. A composição de qualquer uma das modalidades 8 a 10, em que o ácido nucleico codificando cada proteína CRISPR/Cas é mRNA ou DNA. 12. A composição de qualquer uma das modalidades 8 a 11, em que o ácido nucleico codificando cada proteína CRISPR/Cas e/ou ácido nucleico codificando cada RNA guia é parte de um vetor de plasmídeo ou um vetor viral. 13. A composição de qualquer uma das modalidades 8 a 11, em que o RNA guia de cada sistema CRISPR/Cas é enzimaticamente sintetizado. 14. A composição de qualquer uma das modalidades 8 a 11, em que o RNA guia de cada sistema CRISPR/Cas é pelo menos parcialmente quimicamente sintetizado. 15. Um Kit compreendendo a composição de qualquer uma das modalidades 1 a 14. 16. Um método para aumentar a eficiência e/ou especificidade de modificação do genoma-alvo em uma célula eucariótica, compreendendo o método a introdução na célula eucariótica: (a) uma proteína de modificação de DNA programável ou ácido nucleico codificando a proteína de modificação de DNA programável e; (b) pelo menos uma proteína de ligação a DNA programável ou ácido nucleico codificando a pelo menos uma proteína de ligação a DNA programável; em que a proteína de modificação de DNA programável é direcionada a uma sequência cromossômica alvo e cada pelo menos uma proteína de ligação a DNA programável é direcionada para um sítio proximal à sequência cromossômica alvo e a ligação da pelo menos uma proteína de ligação a DNA programável ao sítio proximal à sequência cromossômica alvo aumenta a acessibilidade da proteína de modificação de DNA programável à sequência cromossômica alvo, desse modo aumentando a eficiência e/ou especificidade de modificação do genoma-alvo. 17. Método da modalidade 16, em que o sítio proximal à sequência cromossômica alvo é localizado dentro de cerca de 250 pares de base em cada lado da sequência cromossômica alvo. 18. O método da modalidade 17, em que o sítio proximal à sequência cromossômica alvo está localizado dentro de cerca de 100 pares de base em quaisquer dos lados da sequência cromossômica alvo. 19. O método de modalidade 18, em que o sítio proximal à sequência cromossômica alvo está localizado dentro de cerca de 75 pares de base em cada lado da sequência cromossômica alvo. 20. O método de modalidade 19, em que o sítio proximal à sequência cromossômica alvo está localizado dentro de cerca de 50 pares de base em cada lado da sequência cromossômica alvo. 21. O método de modalidade 20, em que o sítio proximal à sequência cromossômica alvo está localizado dentro de cerca de 25 pares de base em cada lado da sequência cromossômica alvo. 22. Método de qualquer uma das modalidades 16 a 21, em que a proteína de modificação de DNA programável é um sistema de nuclease CRISPR/Cas, um sistema de nicase dual CRISPR/Cas, uma nuclease dedo de zinco (ZFN), uma nuclease efetora semelhante a ativador de transcrição (TALEN), uma meganuclease, uma proteína de fusão compreendendo um domínio de ligação a DNA programável ligado a um domínio de nuclease, ou uma proteína de fusão compreendendo um domínio de ligação a DNA programável ligado a um domínio não nuclease. 23. O método de modalidade 22, em que o domínio de ligação ao DNA programável da proteína de fusão é um sistema CRISPR/ Cas cataliticamente inativo, uma meganuclease cataliticamente inativa, uma proteína dedo de zinco ou um efetor semelhante a um ativador de transcrição. 24. Método de modalidade 22 ou 23, em que o domínio de modificação não nuclease da proteína de fusão tem atividade de acetiltransferase, atividade de desacetilase, atividade de metiltransferase, atividade de desmetilase, atividade de cinase, atividade de fosfatase, atividade de ubiquitina ligase, atividade de desubiquitinação, atividade de adenilação, atividade de desadenilação, atividade de SUMOilação, atividade de desSUMO-ilação, atividade de ribosilação, atividade de desribosilação, atividade de miristoilação, atividade de desmiristoilação, atividade de citrulinaçao, atividade de helicase, atividade de aminação, atividade de desaminação, atividade de alquilação, atividade de desalquilação, atividade de oxidação, atividade de ativação transcricional, ou atividade de repressor transcricional. 25. O método de modalidade 24, em que o domínio não nuclease da proteína de fusão tem atividade de citosina desaminase, atividade de histona acetiltransferase, atividade de ativação transcricional ou atividade de repressor transcricional. 26. O método de qualquer uma das modalidades 16 a 25, em que a pelo menos uma proteína de ligação a DNA programável, é um sistema CRISPR/Cas cataliticamente inativo, uma meganuclease cataliticamente inativa, uma proteína dedo de zinco, um efetor semelhante a ativador da transcrição, uma nicase CRISPR/Cas, uma nicase ZFN, uma nicase TALEN, ou uma nicase de meganuclease. 27. O método de qualquer uma das modalidades 16 a 26, em que a proteína de modificação de DNA programável é um sistema de nuclease CRISPR/Cas, um sistema de nicase dual CRISPR/Cas ou um sistema CRISPR/Cas cataliticamente inativo ligado a um domínio não nuclease, e pelo menos uma proteína de ligação a DNA programável é um sistema CRISPR/Cas cataliticamente inativo, em que cada sistema CRISPR/Cas compreende uma proteína CRISPR/Cas e um RNA guia. 28. O método de modalidade 27, em que o RNA guia de cada sistema CRISPR/Cas é pelo menos parcialmente quimicamente sintetizado. 29. O método da modalidade 27, em que o RNA guia de cada sistema CRISPR/Cas é enzimaticamente sintetizado. 30. O método de qualquer uma das modalidades 16 a 29, em que a célula eucariótica é in vitro. 31. O método de qualquer uma das modalidades 16 a 29, em que a célula eucariótica é in vivo. 32. O método de qualquer uma das modalidades 16 a 31, em que a célula eucariótica é uma célula mamífera. 33. O método de modalidade 32, em que a célula mamífera é uma célula humana. 34. O método de modalidade 32, em que a célula mamífera é uma célula não humana. 35. Um método para detectar uma sequência cromossômica em uma célula eucariótica, o método compreendendo: 1. introduzir na célula eucariótica (a) uma proteína de ligação a DNA programável compreendendo pelo menos um domínio marcador detectável ou ácido nucleico codificando a proteína de ligação a DNA programável compreendendo pelo menos um domínio marcador detectável; e (b) pelo menos uma proteína de ligação a DNA programável ou ácido nucleico codificando a pelo menos uma proteína de ligação a DNA programável, em que a proteína de ligação a DNA programável compreendendo pelo menos um domínio marcador detectável é direcionada a uma sequência cromossômica alvo e cada uma da pelo menos uma proteína de ligação a DNA programável é direcionada para um sítio proximal à sequência cromossômica alvo, e a ligação da pelo menos uma proteína de ligação a DNA programável ao sítio proximal à sequência cromossômica alvo aumenta a acessibilidade da proteína de ligação a DNA programável compreendendo pelo menos um domínio marcador detectável para a sequência cromossômica alvo; e 11. detectar a proteína de ligação a DNA programável compreendendo pelo menos um domínio marcador detectável ligado à sequência cromossômica alvo. 36. O método da modalidade 35, em que o sítio proximal à sequência cromossômica alvo está localizado dentro de cerca de 250 pares de base em cada lado da sequência cromossômica alvo. 37. O método de modalidade 36, em que o sítio proximal à sequência cromossômica alvo está localizado dentro de cerca de 100 pares de base em quaisquer dos lados da sequência cromossômica alvo. 38. O método de modalidade 37, em que o sítio proximal à sequência cromossômica alvo está localizado dentro de cerca de 75 pares de base em cada lado da sequência cromossômica alvo. 39. O método de modalidade 38, em que o sítio proximal à sequência cromossômica alvo está localizado dentro de cerca de 50 pares de base em cada lado da sequência cromossômica alvo. 40. O método de modalidade 39, em que o sítio proximal à sequência cromossômica alvo está localizado dentro de cerca de 25 pares de base em cada lado da sequência cromossômica alvo. 41. O método de qualquer uma das modalidades 35 a 40, em que o pelo menos um domínio marcador detectável da proteína de ligação a DNA programável, compreendendo pelo menos um domínio marcador detectável é uma proteína fluorescente, um marcador fluorescente, um marcador de epítopo, ou um epítopo de ocorrência natural dentro da proteína de ligação a DNA programável. 42. O método de qualquer uma das modalidades 35 a 41, em que a proteína de ligação a DNA programável, compreendendo pelo menos um domínio marcador detectável é um sistema CRISPR/Cas cataliticamente inativo ligado a pelo menos um domínio marcador detectável, uma meganuclease cataliticamente inativa ligada a pelo menos um domínio marcador detectável, uma proteína dedo de zinco ligada a pelo menos um domínio marcador detectável, ou um efetor semelhante a ativador de transcrição ligado a pelo menos um domínio marcador detectável. 43. O método de qualquer uma das modalidades 35 a 42, em que a pelo menos uma proteína de ligação a DNA programável é um sistema CRISPR/Cas cataliticamente inativo, uma meganucleasse cataliticamente inativa, uma proteína dedo de zinco, um efector semelhante a ativador de transcrição, uma nicase CRISPR/Cas, uma nicase ZFN, uma nicase TALEN, ou uma nicase de meganuclease. 44. O método de qualquer uma das modalidades 35 a 43, em que a proteína de ligação a DNA programável, compreendendo pelo menos um domínio marcador detectável é um sistema CRISPR/ Cas cataliticamente inativo ligado a pelo menos um domínio marcador detectável e a pelo menos uma proteína de ligação a DNA programável é um sistema CRISPR/Cas cataliticamente inativo, em que cada sistema CRISPR/Cas compreende uma proteína CRISPR/Cas e um RNA guia. 45. O método de modalidade 44, em que o RNA guia de cada sistema CRISPR/Cas é pelo menos parcialmente quimicamente sintetizado. 46. O método da modalidade 44, em que o RNA guia de cada sistema CRISPR/Cas é enzimaticamente sintetizado. 47. O método de qualquer uma das modalidades 35 a 46, em que a célula eucariótica é uma célula mamífera. 48. O método da modalidade 47, em que a célula mamífera é uma célula humana. 49. O método da modalidade 47, em que a célula mamífera é uma célula não humana. 50. O método de qualquer uma das modalidades 35 a 49, em que a célula eucariótica é viva ou fixa. 51. O método de qualquer uma das modalidades 35 a 50, em que a detecção compreende dinâmico imageamento de célula viva, microscopia fluorescente, microscopia confocal, imunofluorescência, imunodetecção, ligação de RNA-proteína ou ligação de proteína- proteína.
[00148] Os seguintes exemplos ilustram certos aspectos da invenção. Exemplo 1. Realce de edição de gene Francisella novicida CRISPR- Cas9 (FnCas9)
[00149] FnCas9 é um CRISPR-Cas9 tipo IIB. Ele exibe uma maior especificidade intrínseca do que o amplamente usado SpCas9, mas foi descoberto ser menos robusto do que SpCas9 em células humanas. Para determinar se a ligação de proteínas de ligação a DNA programável a sítios proximais poderia possibilitar a nuclease clivar um alvo de outro método inacessível (isto é, locus POR) em células humanas, células K562 foram transfectadas com 5,6 μg de DNA de plasmídeo FnCas9, 5 μg de DNA de plasmídeo SpCas9 cataliticamente morto (SpdCas9) e 3 μg de DNA de plasmídeo de cada sgRNA por um milhão de células (veja FIG. 2). O DNA genômico foi colhido 3 dias após a transfecção e a região alvo foi amplificada por PCR com o iniciador dianteiro 5'-CTCCCCTGCTTCTTGTCGTAT-3 '(SEQ ID NO: 9) e o iniciador reverso 5'- ACAGGTCGTGGACACTCACA-3' (SEQ ID NO: 10). Inserções / deleções direcionadas (indels) por FnCas9 no alvo foram determinadas por digestão de nuclease Cel-I e análise de gel de poliacrilamida.
[00150] Como mostrado na FIG. 2, a FnCas9 foi incapaz de clivar o alvo quando transfectada sozinha. Porém, quando foi transfectada em combinação com SpdCas9 para ajudar a romper a configuração da cromatina local, FnCas9 foi capaz de clivar o alvo em níveis robustos, com 10-11% de indels, quando SpdCas9 foi usado para ligar um sítio proximal. Quando SpdCas9 foi usado para ligar dois sítios proximais, a atividade de FnCas9 também aumentou para 28% dos indels. Estes resultados demonstram que o método aqui descrito pode possibilitar que uma endonuclease clivar eficientemente um alvo de outro método inacessível, e existe um efeito sinérgico entre dois sítios utilizados para romper a configuração da cromatina local.
[00151] CjCas9 é um CRISPR-Cas9 tipo IIC. É o menor Cas9 caracterizado até agora e tem um requisito único ACAY PAM. Mas a nuclease foi descoberta ser inativa na maioria dos alvos em células humanas. Para determinar se os métodos descritos aqui poderiam possibilitar que a proteína CjCas9 se ligasse a um alvo inacessível em células humanas, as células K562 foram transfectadas com 4,2 μg de DNA de plasmídeo CjCas9 (CjdCas9) cataliticamente morto marcado com Flag, 5 μg de DNA de plasmídeo SpCas9 (SpdCas9) cataliticamente morto e 3 μg de DNA de plasmídeo de cada sgRNA por um milhão de células (veja a FIG. 3A). As células foram fixadas em formaldeído 16 horas após a transfecção e a imunoprecipitação da cromatina (ChIP) foi realizada utilizando anticorpo anti-Flag. A ligação ao alvo por Flag-CjdCas9 foi determinada por PCR digital de gotículas (ddPCR).
[00152] Como mostrado na FIG. 3C, Flag-CjdCas9 foi capaz de se ligar a um alvo acessível anteriormente conhecido no locus AAVS1, porém foi incapaz de se ligar a um alvo inacessível no locus POR quando foi transfectado sozinho. No entanto, quando foi transfectada em combinação com SpdCas9 para romper a configuração da cromatina local, Flag-CjdCas9 foi capaz de ligar o alvo POR de forma ainda mais eficiente do que a sua ligação do alvo AAVS1.
[00153] Para examinar o efeito sobre a clivagem do DNA alvo, células K562 foram transfectadas com 4,2 μg de DNA de plasmídeo CjCas9, 5 μg de DNA de plasmídeo SpdCas9 e 3 μg de DNA de plasmídeo de cada sgRNA por um milhão de células. O DNA genômico foi colhido 3 dias após a transfecção e a região alvo foi amplificada por PCR com o iniciador dianteiro 5'-CTCCCCTGCTTCTTGTCGTAT-3 '(SEQ ID NO: 9) e o iniciador reverso 5'- ACAGGTCGTGGACACTCACA-3' (SEQ ID NO: 10). A atividade de clivagem de CjCas9 sobre o alvo de POR foi determinada por digestão por nuclease Cel-I e análise de gel de poliacrilamida. Como mostrado na FIG. 4, CjCas9 foi incapaz de clivar o alvo sem SpdCas9. Porém, quando foi transfectado em combinação com SpdCas9, CjCas9 foi capaz de clivar o alvo eficientemente com 34,1-37,9% de indels. Estes resultados demonstram que o método aqui descrito pode possibilitar que uma nuclease se ligue e clive eficientemente um alvo de outro modo inacessível.
[00154] FnCpf1 é um sistema CRISPR-Cas tipo V. Os sistemas Cpf1 são significativamente divergentes dos sistemas CRISPR-Cas9 tipo II. Ao contrário dos sistemas Cas9, os sistemas Cpf1 usam um PAM rico em 5' T e um RNA guia único para direcionamento sem um tracrRNA (Zetsche et al., Cell, 2015, 163: 1-13). Esses sistemas CRISPR "mais recentes" têm o potencial de tornar a prática de edição de gene ainda mais simples, porém muitos sistemas Cpf1 foram descobertos ser inativos em células humanas. Para determinar se os métodos aqui descritos poderiam possibilitar que a nuclease Cpf1 "inativa" divergente clivar alvos endógenos em células humanas, as células K562 foram transfectadas com 5 μg de DNA de plasmídeo FnCpfl, 5 μg de DNA de plasmídeo SpdCas9 e 3 μg de DNA de plasmídeo de cada sgRNA por um milhão de células (veja FIG. 5). O DNA genômico foi colhido 3 dias após a transfecção e a região alvo foi amplificada por PCR com o iniciador dianteiro 5'- CTCCCCTGCTTCTTGTCGTAT-3 '(SEQ ID NO: 9) e o iniciador reverso 5'-ACAGGTCGTGGACACTCACA-3' (SEQ ID NO: 10). A atividade de clivagem de FnCpf1 sobre um alvo de POR foi determinada por digestão de nuclease Cel-I e análise de gel de poliacrilamida.
[00155] Como mostrado na FIG. 5, FnCpf1 foi incapaz de clivar o alvo quando foi transfectada sozinha, mas foi capaz de clivar o alvo eficientemente quando foi transfectada em combinação de SpdCas9. Estes resultados demonstram que o método aqui descrito é aplicável a sistemas CRISPR-Cas do tipo V divergentes.
[00156] Dois alvos idênticos em humanos (isto é, HBB e HBD) foram usados para determinar se os métodos divulgados aqui poderiam facilitar a edição seletiva entre sítios idênticos em diferentes genes. As células K562 foram transfectadas com 4,2 μg de DNA de plasmídeo CjCas9, 5 μg de DNA de plasmídeo SpdCas9 e 3 μg de DNA de plasmídeo de cada sgRNA por um milhão de células (veja a FIG. 6). O DNA genômico foi colhido 3 dias após a transfecção e as duas regiões alvo foram amplificadas por PCR com o iniciador dianteiro 5'-CGGCTGTCATCACTTAGACCTCA-3 '(SEQ ID NO: 11) e o iniciador reverso 5'-GCAGCCTAAGGGTGGGAAAATAGA-3' (SEQ ID NO: 12) para HBB e o iniciador dianteiro 5'- AGGGCAAGTTAAGGGAAT AGTGGAA-3 '(SEQ ID NO: 13) e o iniciador reverso 5'-CCAAGGGTA GACCACCAGTAATCTG-3' (SEQ ID NO: 14) para HBD. A atividade de clivagem de CjCas9 nos alvos de HBB e HBD foi determinada por digestão de nuclease Cel-I e análise de gel de poliacrilamida.
[00157] Como mostrado na FIG. 6, quando foi transfectado sozinho, CjCas9 foi incapaz de clivar qualquer um dos alvos. Porém, quando foi transfectado em combinação com SpdCas9 direcionado para sítios proximais a HBB, CjCas9 clivou o alvo HBB eficientemente, porém ainda foi incapaz de clivar o alvo HBD idêntico. As duas faixas de digestão de nuclease Cel-I nas primeiras duas colunas foram causadas por SNPs presentes na população de células K562. Estes resultados demonstram a capacidade única do método descrito para melhorar a seletividade de edição de gene.
[00158] SpCas9 é um CRISPR-Cas9 do tipo IIA e tem sido amplamente utilizado na modificação do genoma devido à sua atividade robusta em células eucarióticas. No entanto, sua atividade pode também variar amplamente de alvo para alvo. Para determinar se os métodos aqui descritos também poderiam melhorar essa nuclease, as células K562 foram transfectadas com 5 μg de DNA de plasmídeo SpCas9, 5,6 μg de FnCas9 cataliticamente mortos (FndCas9) e 3 μg de DNA de plasmídeo de cada sgRNA por um milhão de células (veja a figura 7). O DNA genômico foi colhido 3 dias após a transfecção e a região alvo foi amplificada por PCR com o iniciador dianteiro 5'-CTCCCCTGCTT CTTGTCGTAT-3 '(SEQ ID NO: 9) e o iniciador reverso 5'- ACAGGTCGTGGACACTCACA-3' (SEQ ID NO: 10). A atividade de clivagem de SpCas9 no alvo de POR foi determinada por digestão de nuclease Cel-I e análise de gel de poliacrilamida.
[00159] Como mostrado na FIG. 7, a atividade de clivagem de SpCas9 aumentou significativamente quando foi transfectada em combinação com FndCas9, em comparação com quando foi transfectada sozinha. Estes resultados mostram que o método aqui descrito também pode ser aplicado a endonucleases robustas.
[00160] Células K562 foram transfectadas com 4,2 μg de DNA de plasmídeo CjCas9, 5 μg de DNA de plasmídeo SpdCas9, 3 μg de DNA de plasmídeo de cada sgRNA e 300 pmol de um doador oligo ssDNA 88-nt para integração direcionada de um sio de restrição EcoRI por um milhão de células. DNA genômico foi colhido 3 dias após a transfecção e a região alvo foi amplificada por PCR com o iniciador dianteiro 5'- CTCCCCTGCTTCTTGTCGTAT-3 '(SEQ ID NO: 9) e o iniciador reverso 5'-ACAGGTCGTGGACACTCACA-3' (SEQ ID NO: 10). A integração direcionada do sítio de restrição EcoRI foi determinada por digestão com enzima de restrição EcoRI e análise de gel de poliacrilamida. Como mostrado na FIG. 8, o sítio de restrição foi integrado eficientemente (28-37%) no locus de POR quando o doador de oligo ssDNA foi transfectado em conjunto com CjCas9 e SpdCas9, enquanto nenhuma integração foi detectada quando o oligo doador foi transfectado sozinho ou em combinação com CjCas9 sem o SpdCas9. Estes resultados demonstram que o método aqui descrito pode facilitar a edição eficiente de gene utilizando doador de oligo ssDNA em um alvo de outro método inacessível. Exemplo 7. Realce de detecção de DNA genômico específico de sequência em células vivas e fixadas.
[00161] A fusão de proteínas Cas9 a proteínas fluorescentes possibilitou a detecção das dinâmicas cromossômicas em células vivas (Chen et al., Cell, 2013, 155: 1479-91). Por conseguinte, acredita-se que as dinâmicas estruturais da cromatina influenciarão a capacidade de complexos do sistema CRISPR/Cas acessar a vários loci genômicos. Desse modo, acredita-se que a colocação de complexos CRISPR (dCas9) próximos daqueles que alojando dCas9- GFP realce a detecção de dinâmicas cromossômicas em uma extensão semelhante àquela observada no Exemplo 2 para a imunoprecipitação da cromatina. Por exemplo, CjdCas9 pode ser fundido a GFP e direcionado para uma região com um estado de cromatina que evita a ligação detectável de CjdCas9-GFP. O sistema com base em SpdCas9 pode então ser projetado em proximidade a alvos CjdCas9-GFP para produzir sinal detectável. Para regiões de cromatina que são resistentes à ligação e detecção de SpdCas9-GFP, uma molécula FndCas9 proximal pode ser utilizada para realçar a detecção em uma extensão similar àquela mostrada no Exemplo 5 para direcionamento proximal de SpCas9 e FndCas9 e realce da atividade de rompimento de fita dupla. Além disso, dado que estudos anteriores indicaram que a extensão de requisitos de hibridização entre RNA guia CRISPR e o DNA genômico pode ser menor para a ligação do que para a clivagem de fita dupla (Wu et al., Nature Biotechnology, 2014, 32 (7): 670-6), acredita-se que o uso de ligação de CRISPR proximal aumente as relações sinal-para-ruído para a detecção de DNA genômico em células.
[00162] Métodos semelhantes de detecção com base em CRISPR foram aplicados a células fixadas (Deng et al., Proc. Natl. Acad, Sci. USA, 2015, 112 (38): 11870-75). Desse modo, acredita-se que o direcionamento CRISPR proximal realçará a detecção de DNA fixo de um método semelhante ao descrito acima para as células vivas. Uma vez que as fitas de DNA genômico em células fixas são quimicamente reticulados, a interrogação de informação de sequência por hibridação de sondas de ácido nucleico requer tipicamente uma etapa de pré- tratamento com processamento térmico ou químico para separar as fitas de modo suficiente. Portanto, é possível que o direcionamento de CRISPR proximal tornará o DNA fixo mais acessível e reduzirá a extensão (ou requisito) para tratamento térmico ou químico de células fixas. Eliminação de tratamento térmico ou químico forneceria vantagens em simplificação de protocolo diagnóstico e manutenção de estruturas moleculares intracelulares que melhor refletem a biologia de células viva e, portanto, resultados diagnósticos mais informados.
[00163] Fusão de proteínas Cas9 a domínios de regulação transcricional possibilitou ativação e repressão de gene alvo (Konermann et al., Nature, 2014; 517(7536):583-8; Gilbert et al., Cell, 2014, 159(3) 547-661). Acredita-se que dinâmicas estruturais de cromatina influenciarão a capacidade do complexo CRISPR acessar vários loci genômicos e induzem ativação ou repressão. Desse modo, a colocação de complexos CRISPR (dCas9) proximais àqueles alojando dCas9 fundido a domínios de regulação de transcrição é acreditada realçar a regulação de gene alvo em uma extensão similar àquela observada no Exemplo 2 para imunoprecipitação de cromatina. Para regiões de cromatina que são resistentes à ligação e modificação por reguladores transcricionais de SpdCas9, uma molécula FndCas9 proximal pode ser usada para realçar a ativação ou repressão de gene em uma extensão similar àquela mostrada no Exemplo 5 para direcionamento proximal de SpCas9 e FndCas9 e realce de atividade de rompimento de fita dupla.
[00164] Fusão de proteínas Cas9 a domínios de modificação epigenética possibilitou modificações cromossômicas epigenéticas direcionadas, tal como acetilação de histona por p300 ou desaminação de citosina por citosina desaminase (Hilton et al., Nat. Biotechnol.; 2015, 33(5): 510-7; Komor et al., Nature, 2016, 533(7603):420-4. Acredita-se que dinâmicas estruturais de cromativa influenciarão a capacidade do complexo CRISPR acessar vários loci genômicos. Desse modo, a colocação de complexos CRISPR (dCas9) proximais àqueles alojando dCas9 fundidos a modificadores epigenéticos deve realçar a modificação epigenética direcionada de DNA cromossômico, proteínas locais, ou RNA local em uma extensão similar àquela observada no Exemplo 2 para imunoprecipitação de cromatina. Para regiões de cromatina que são resistentes à ligação e modificação por epi-modificadores SpdCas9, uma molécula FndCas9 proximal pode ser usada para realçar a detecção em uma extensão similar àquela mostrada no Exemplo 5 para direcionamento proximal de SpCas9 e FndCas9 e realce de atividade de rompimento de fita dupla.
Claims (24)
1. Composição, caracterizada pelo fato de que compreende: (a) um sistema de nuclease associado a repetições palindrômicas curtas regularmente intercaladas agrupadas (CRISPR) guiado por RNA, ou um ácido nucleico que codifica o referido sistema de nuclease CRISPR, em que o sistema de nuclease CRISPR compreende (i) uma proteína de modificação de DNA programável que é uma proteína CRISPR e (ii) um RNA guia; e (b) pelo menos um sistema CRISPR cataliticamente inativo ou ácido nucleico que codifica o referido pelo menos um sistema CRISPR cataliticamente inativo, em que cada sistema CRISPR cataliticamente inativo compreende (i) uma proteína de ligação ao DNA programável que é uma proteína CRISPR cataliticamente inativa e (ii) um RNA guia; e em que (c) a proteína de modificação de DNA programável é uma proteína CRISPR do tipo II e pelo menos uma proteína de ligação ao DNA programável é uma proteína CRISPR do tipo II, ou (d) a proteína de modificação de DNA programável é uma proteína CRISPR do tipo V e pelo menos uma proteína de ligação ao DNA programável é uma proteína CRISPR do tipo II; e em que a composição como definida acima não é revelada nos documentos WO2017/070598 ou WO2017/096328.
2. Composição, de acordo com a reivindicação 1, caracterizada pelo fato de que: (i) a proteína CRISPR do tipo II é selecionada a partir de Francisella novicida CRISPR-Cas9 (FnCas9), Campylobacter jejuni CRISPR-Cas9 (CjCas9) e Streptococcus pyogenes CRISPR-Cas9 (SpCas9); e/ou (ii) a proteína CRISPR do tipo V é Francisella novicida CRISPR-Cpf1 (FnCpf1).
3. Composição, de acordo com a reivindicação 1 ou 2, caracterizada pelo fato de que a pelo menos uma proteína de ligação ao DNA programável é uma proteína CRISPR Cas9 tipo II, em que a proteína Cas9 apresenta uma ou mais mutações em cada domínio do tipo RuvC e do domínio do tipo HNH.
4. Composição, de acordo com a reivindicação 3, caracterizada pelo fato de que: (i) as uma ou mais mutações no domínio do tipo RuvC são D10A, D8A, E762A e/ou D986A; e (ii) as uma ou mais mutações no domínio do tipo HNH são H840A, H559A, N854A, N856A e/ou N863A.
5. Composição, de acordo com qualquer uma das reivindicações 1 a 4, caracterizada pelo fato de que o ácido nucleico que codifica cada proteína CRISPR é mRNA ou DNA.
6. Composição, de acordo com qualquer uma das reivindicações 1 a 5, caracterizada pelo fato de que o ácido nucleico que codifica cada proteína CRISPR é parte de um vetor plasmídeo ou de um vetor viral.
7. Composição, de acordo com qualquer uma das reivindicações 1 a 6, caracterizada pelo fato de que o ácido nucleico que codifica cada RNA guia é parte de um vetor plasmídeo ou de um vetor viral.
8. Composição, de acordo com qualquer uma das reivindicações 1 a 7, caracterizada pelo fato de que o RNA guia de cada sistema CRISPR é: (a) enzimaticamente sintetizado ou (b) é pelo menos parcialmente quimicamente sintetizado.
9. Kit, caracterizado pelo fato de que compreende a composição, como definida em qualquer uma das reivindicações 1 a 8, e instruções para uso da composição em um método in vitro para aumentar a eficiência e/ou especificidade da modificação do genoma- alvo em uma célula eucariótica.
10. Método in vitro para aumentar a eficiência e/ou a especificidade da modificação do genoma-alvo em uma célula eucariótica, o método caracterizado pelo fato de que compreende introduzir na célula eucariótica uma composição que compreende: (a) um sistema de nuclease associado a repetições palindrômicas curtas regularmente intercaladas agrupadas (CRISPR) guiado por RNA, ou um ácido nucleico que codifica o referido sistema de nuclease CRISPR, em que o sistema de nuclease CRISPR compreende (i) uma proteína de modificação de DNA programável que é uma proteína CRISPR e (ii) um RNA guia; e (b) pelo menos um sistema CRISPR cataliticamente inativo ou ácido nucleico que codifica o referido pelo menos um sistema CRISPR cataliticamente inativo, em que cada sistema CRISPR cataliticamente inativo compreende (i) uma proteína de ligação ao DNA programável que é uma proteína CRISPR cataliticamente inativa e (ii) um RNA guia; e em que (c) a proteína de modificação de DNA programável é uma proteína CRISPR do tipo II e pelo menos uma proteína de ligação ao DNA programável é uma proteína CRISPR do tipo II, ou (d) a proteína de modificação de DNA programável é uma proteína CRISPR do tipo V e pelo menos uma proteína de ligação ao DNA programável é uma proteína CRISPR do tipo II; em que a proteína de modificação de DNA programável é direcionada a uma sequência cromossômica alvo e cada uma das pelo menos uma proteína de ligação ao DNA programável é direcionada a um sítio proximal à sequência cromossômica alvo e a ligação da pelo menos uma proteína de ligação ao DNA programável ao sítio proximal à sequência cromossômica alvo aumenta a acessibilidade da proteína de modificação de DNA programável à sequência cromossômica alvo, aumentando assim a eficiência e/ou a especificidade da modificação do genoma-alvo.
11. Método, de acordo com a reivindicação 10, caracterizado pelo fato de que o sítio proximal à sequência cromossômica alvo é localizado dentro de 250, 100, 75, 50 ou 25 pares de base em ambos os lados da sequência cromossômica alvo.
12. Método, de acordo com a reivindicação 10 ou 11, caracterizado pelo fato de que a célula eucariótica é uma célula de mamífero, em que a célula de mamífero é uma célula humana ou uma célula não humana.
13. Método, de acordo com qualquer uma das reivindicações 10 a 12, caracterizado pelo fato de que: (i) a proteína CRISPR do tipo II é selecionada a partir de Francisella novicida CRISPR-Cas9 (FnCas9), Campylobacter jejuni CRISPR-Cas9 (CjCas9) e Streptococcus pyogenes CRISPR-Cas9 (SpCas9); e/ou (ii) a proteína CRISPR do tipo V é Francisella novicida CRISPR-Cpfl (FnCpf1).
14. Método, de acordo com qualquer uma das reivindicações 10 a 13, caracterizado pelo fato de que a pelo menos uma proteína de ligação ao DNA programável é uma proteína CRISPR Cas9 tipo II, em que a proteína Cas9 apresenta uma ou mais mutações em cada um dos domínio do tipo RuvC e do domínio do tipo HNH.
15. Método, de acordo com a reivindicação 14, caracterizado pelo fato de que (i) as uma ou mais mutações no domínio do tipo RuvC são D10A, D8A, E762A e/ou D986A; e (ii) as uma ou mais mutações no domínio do tipo HNH são H840A, H559A, N854A, N856A e/ou N863A.
16. Método, de acordo com qualquer uma das reivindicações 10 a 15, caracterizado pelo fato de que o ácido nucleico que codifica cada proteína CRISPR é mRNA ou DNA.
17. Método, de acordo com qualquer uma das reivindicações 10 a 16, caracterizado pelo fato de que o ácido nucleico que codifica cada proteína CRISPR é parte de um vetor plasmídeo ou de um vetor viral.
18. Método, de acordo com qualquer uma das reivindicações 10 a 17, caracterizado pelo fato de que o ácido nucleico que codifica cada RNA guia é parte de um vetor plasmídeo ou vetor viral.
19. Método, de acordo com qualquer uma das reivindicações 10 a 18, caracterizado pelo fato de que o RNA guia de cada sistema CRISPR é (a) enzimaticamente sintetizado ou (b) é pelo menos parcialmente quimicamente sintetizado.
20. Composição, de acordo com qualquer uma das reivindicações 1 a 8, ou kit de acordo com a reivindicação 9, caracterizado pelo fato de que é para uso em terapia.
21. Composição, de acordo com qualquer uma das reivindicações 1 a 8, ou kit, de acordo com a reivindicação 9, caracterizado pelo fato de que é para uso no tratamento de doenças das células falciformes, talassemia, deficiência imunológica combinada grave (SCID), doença de Huntington ou retinite pigmentosa.
22. Método para detectar uma sequência cromossômica em uma célula eucariótica, caracterizado pelo fato de que compreende: (I) introduzir na célula eucariótica, (a) uma proteína de ligação ao DNA programável compreendendo pelo menos um domínio marcador detectável ou ácido nucleico codificando a proteína de ligação ao DNA programável compreendendo pelo menos um domínio marcador detectável; e (b) pelo menos uma proteína de ligação ao DNA programável ou ácido nucleico codificando a pelo menos uma proteína de ligação ao DNA programável, em que a proteína de ligação ao DNA programável compreendendo pelo menos um domínio marcador detectável é direcionada a uma sequência cromossômica alvo e cada uma da pelo menos uma proteína de ligação ao DNA programável é direcionada para um sítio proximal à sequência cromossômica alvo, e a ligação da pelo menos uma proteína de ligação ao DNA programável ao sítio proximal à sequência cromossômica alvo aumenta a acessibilidade da proteína de ligação ao DNA programável compreendendo pelo menos um domínio marcador detectável para a sequência cromossômica alvo; e (II) detectar a proteína de ligação ao DNA programável compreendendo pelo menos um domínio marcador detectável ligado à sequência cromossômica alvo.
23. Uso de: (a) um sistema de nuclease associado a repetições palindrômicas curtas regularmente intercaladas agrupadas (CRISPR) guiado por RNA, ou um ácido nucleico que codifica o referido sistema de nuclease CRISPR, em que o sistema de nuclease CRISPR compreende (i) uma proteína de modificação de DNA programável que é uma proteína CRISPR e (ii) um RNA guia; e (b) pelo menos um sistema CRISPR cataliticamente inativo ou ácido nucleico que codifica o referido pelo menos um sistema CRISPR cataliticamente inativo, em que cada sistema CRISPR cataliticamente inativo compreende (i) uma proteína de ligação ao DNA programável que é uma proteína CRISPR cataliticamente inativa e (ii) um RNA guia; e em que (c) a proteína de modificação de DNA programável é uma proteína CRISPR do tipo II e pelo menos uma proteína de ligação ao DNA programável é uma proteína CRISPR do tipo II, ou (d) a proteína de modificação de DNA programável é uma proteína CRISPR do tipo V e pelo menos uma proteína de ligação ao DNA programável é uma proteína CRISPR do tipo II, caracterizado pelo fato de que é na preparação de uma composição para uso em terapia.
24. Composição de acordo com qualquer uma das reivindicações 1 a 8, kit de acordo com a reivindicação 9, método de acordo com qualquer uma das reivindicações 10 a 19 e 22 ou uso de acordo com a reivindicação 23, caracterizado pelo fato de que: (i) o sistema CRISPR da subparte (a) é uma proteína CRISPR/Cas9 de Francisella novicida Tipo IIB e o pelo menos um sistema CRISPR da subparte (b) é uma proteína CRISPR/Cas9 de Streptococcus pyogenes Tipo IIA; (ii) o sistema CRISPR da subparte (a) é uma proteína CRISPR/Cas9 de S. pyogenes Tipo IIA e o pelo menos um sistema CRISPR da subparte (b) é uma proteína CRISPR/Cas9 de F. novicida Tipo IIB; (iii) o sistema CRISPR da subparte (a) é uma proteína CRISPR/Cas9 de Campylobacter jejuni Tipo IIC e o pelo menos um sistema CRISPR da subparte (b) é uma proteína CRISPR/Cas9 de S. pyogenes Tipo IIA; ou (iv) o sistema CRISPR da subparte (a) é uma proteína CRISPR/Cpf1 de F. novicida Tipo V e o pelo menos um sistema CRISPR da subparte (b) é uma proteína CRISPR/Cas9 de S. pyogenes Tipo IIA.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201662344858P | 2016-06-02 | 2016-06-02 | |
US62/344,858 | 2016-06-02 | ||
US201662358415P | 2016-07-05 | 2016-07-05 | |
US62/358,415 | 2016-07-05 | ||
PCT/US2017/018589 WO2017209809A1 (en) | 2016-06-02 | 2017-02-20 | Using programmable dna binding proteins to enhance targeted genome modification |
Publications (2)
Publication Number | Publication Date |
---|---|
BR112018074531A2 BR112018074531A2 (pt) | 2019-03-19 |
BR112018074531B1 true BR112018074531B1 (pt) | 2021-01-19 |
Family
ID=58108457
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
BR112018074531-6A BR112018074531B1 (pt) | 2016-06-02 | 2017-02-20 | composição que compreende um sistema de nuclease e seu uso, kit, método in vitro para aumentar a eficiência da modificação do genoma-alvo e método para detectar uma sequência cromossômica |
Country Status (17)
Country | Link |
---|---|
US (3) | US10266851B2 (pt) |
EP (3) | EP3907286A1 (pt) |
JP (3) | JP6878468B2 (pt) |
KR (2) | KR20220147710A (pt) |
CN (2) | CN109983124B (pt) |
AU (4) | AU2017274145B2 (pt) |
BR (1) | BR112018074531B1 (pt) |
CA (2) | CA3209273A1 (pt) |
DK (2) | DK3272867T3 (pt) |
ES (2) | ES2881355T3 (pt) |
GB (3) | GB2578802B8 (pt) |
IL (5) | IL289989B (pt) |
LT (1) | LT3604527T (pt) |
PL (2) | PL3272867T3 (pt) |
PT (2) | PT3272867T (pt) |
SG (1) | SG11201810003UA (pt) |
WO (1) | WO2017209809A1 (pt) |
Families Citing this family (79)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2734621B1 (en) | 2011-07-22 | 2019-09-04 | President and Fellows of Harvard College | Evaluation and improvement of nuclease cleavage specificity |
US9163284B2 (en) | 2013-08-09 | 2015-10-20 | President And Fellows Of Harvard College | Methods for identifying a target site of a Cas9 nuclease |
US9359599B2 (en) | 2013-08-22 | 2016-06-07 | President And Fellows Of Harvard College | Engineered transcription activator-like effector (TALE) domains and uses thereof |
US9340799B2 (en) | 2013-09-06 | 2016-05-17 | President And Fellows Of Harvard College | MRNA-sensing switchable gRNAs |
US9388430B2 (en) | 2013-09-06 | 2016-07-12 | President And Fellows Of Harvard College | Cas9-recombinase fusion proteins and uses thereof |
US9526784B2 (en) | 2013-09-06 | 2016-12-27 | President And Fellows Of Harvard College | Delivery system for functional nucleases |
US11053481B2 (en) | 2013-12-12 | 2021-07-06 | President And Fellows Of Harvard College | Fusions of Cas9 domains and nucleic acid-editing domains |
US10077453B2 (en) | 2014-07-30 | 2018-09-18 | President And Fellows Of Harvard College | CAS9 proteins including ligand-dependent inteins |
IL310721A (en) | 2015-10-23 | 2024-04-01 | Harvard College | Nucleobase editors and their uses |
US11293021B1 (en) | 2016-06-23 | 2022-04-05 | Inscripta, Inc. | Automated cell processing methods, modules, instruments, and systems |
CA3032699A1 (en) | 2016-08-03 | 2018-02-08 | President And Fellows Of Harvard College | Adenosine nucleobase editors and uses thereof |
US11078481B1 (en) | 2016-08-03 | 2021-08-03 | KSQ Therapeutics, Inc. | Methods for screening for cancer targets |
AU2017308889B2 (en) | 2016-08-09 | 2023-11-09 | President And Fellows Of Harvard College | Programmable Cas9-recombinase fusion proteins and uses thereof |
WO2018039438A1 (en) | 2016-08-24 | 2018-03-01 | President And Fellows Of Harvard College | Incorporation of unnatural amino acids into proteins using base editing |
US11078483B1 (en) | 2016-09-02 | 2021-08-03 | KSQ Therapeutics, Inc. | Methods for measuring and improving CRISPR reagent function |
CN110214180A (zh) | 2016-10-14 | 2019-09-06 | 哈佛大学的校长及成员们 | 核碱基编辑器的aav递送 |
WO2018119359A1 (en) | 2016-12-23 | 2018-06-28 | President And Fellows Of Harvard College | Editing of ccr5 receptor gene to protect against hiv infection |
EP3592853A1 (en) | 2017-03-09 | 2020-01-15 | President and Fellows of Harvard College | Suppression of pain by gene editing |
US11542496B2 (en) | 2017-03-10 | 2023-01-03 | President And Fellows Of Harvard College | Cytosine to guanine base editor |
CN110914426A (zh) | 2017-03-23 | 2020-03-24 | 哈佛大学的校长及成员们 | 包含核酸可编程dna结合蛋白的核碱基编辑器 |
WO2018209320A1 (en) | 2017-05-12 | 2018-11-15 | President And Fellows Of Harvard College | Aptazyme-embedded guide rnas for use with crispr-cas9 in genome editing and transcriptional activation |
US9982279B1 (en) | 2017-06-23 | 2018-05-29 | Inscripta, Inc. | Nucleic acid-guided nucleases |
US10011849B1 (en) | 2017-06-23 | 2018-07-03 | Inscripta, Inc. | Nucleic acid-guided nucleases |
HRP20220615T1 (hr) | 2017-06-30 | 2022-06-24 | Inscripta, Inc. | Postupci, moduli, instrumenti i sustavi za automatiziranu obradu stanica |
CN111801345A (zh) | 2017-07-28 | 2020-10-20 | 哈佛大学的校长及成员们 | 使用噬菌体辅助连续进化(pace)的进化碱基编辑器的方法和组合物 |
AU2018311695A1 (en) * | 2017-07-31 | 2020-01-16 | Sigma-Aldrich Co. Llc | Synthetic guide RNA for CRISPR/Cas activator systems |
US11319532B2 (en) | 2017-08-30 | 2022-05-03 | President And Fellows Of Harvard College | High efficiency base editors comprising Gam |
US11709155B2 (en) | 2017-09-18 | 2023-07-25 | Waters Technologies Corporation | Use of vapor deposition coated flow paths for improved chromatography of metal interacting analytes |
US11709156B2 (en) | 2017-09-18 | 2023-07-25 | Waters Technologies Corporation | Use of vapor deposition coated flow paths for improved analytical analysis |
AU2018352592A1 (en) | 2017-10-16 | 2020-06-04 | Beam Therapeutics, Inc. | Uses of adenosine base editors |
WO2019126709A1 (en) * | 2017-12-22 | 2019-06-27 | The Broad Institute, Inc. | Cas12b systems, methods, and compositions for targeted dna base editing |
WO2019126716A1 (en) * | 2017-12-22 | 2019-06-27 | The Broad Institute, Inc. | Cas12b systems, methods, and compositions for targeted rna base editing |
BR112020010479A2 (pt) * | 2018-02-15 | 2020-11-24 | Sigma-Aldrich Co. Llc | sistemas cas9 geneticamente modificados para modificação de genoma eucariótico |
WO2019200004A1 (en) | 2018-04-13 | 2019-10-17 | Inscripta, Inc. | Automated cell processing instruments comprising reagent cartridges |
US10526598B2 (en) | 2018-04-24 | 2020-01-07 | Inscripta, Inc. | Methods for identifying T-cell receptor antigens |
WO2019209926A1 (en) | 2018-04-24 | 2019-10-31 | Inscripta, Inc. | Automated instrumentation for production of peptide libraries |
US10858761B2 (en) | 2018-04-24 | 2020-12-08 | Inscripta, Inc. | Nucleic acid-guided editing of exogenous polynucleotides in heterologous cells |
WO2020028729A1 (en) | 2018-08-01 | 2020-02-06 | Mammoth Biosciences, Inc. | Programmable nuclease compositions and methods of use thereof |
US11142740B2 (en) | 2018-08-14 | 2021-10-12 | Inscripta, Inc. | Detection of nuclease edited sequences in automated modules and instruments |
US10532324B1 (en) | 2018-08-14 | 2020-01-14 | Inscripta, Inc. | Instruments, modules, and methods for improved detection of edited sequences in live cells |
IL292273B2 (en) | 2018-08-14 | 2023-10-01 | Inscripta Inc | Devices, modules and methods for improved detection of edited sequences in living cells |
KR20210046001A (ko) * | 2018-08-21 | 2021-04-27 | 시그마-알드리치 컴퍼니., 엘엘씨 | 시토졸 dna 센서 경로의 하향-조절 |
KR20210049124A (ko) * | 2018-08-23 | 2021-05-04 | 상가모 테라퓨틱스, 인코포레이티드 | 조작된 표적 특이적 염기 편집기 |
CA3108892A1 (en) | 2018-08-30 | 2020-04-23 | Inscripta, Inc. | Improved detection of nuclease edited sequences in automated modules and instruments |
WO2020086475A1 (en) | 2018-10-22 | 2020-04-30 | Inscripta, Inc. | Engineered enzymes |
US11214781B2 (en) | 2018-10-22 | 2022-01-04 | Inscripta, Inc. | Engineered enzyme |
WO2020142754A2 (en) * | 2019-01-04 | 2020-07-09 | Mammoth Biosciences, Inc. | Programmable nuclease improvements and compositions and methods for nucleic acid amplification and detection |
CN110804628B (zh) * | 2019-02-28 | 2023-05-12 | 中国科学院脑科学与智能技术卓越创新中心 | 高特异性无脱靶单碱基基因编辑工具 |
AU2020242032A1 (en) | 2019-03-19 | 2021-10-07 | Massachusetts Institute Of Technology | Methods and compositions for editing nucleotide sequences |
EP3947691A4 (en) | 2019-03-25 | 2022-12-14 | Inscripta, Inc. | SIMULTANEOUS MULTIPLEX GENOME EDITING IN A YEAST |
US11001831B2 (en) | 2019-03-25 | 2021-05-11 | Inscripta, Inc. | Simultaneous multiplex genome editing in yeast |
AU2020288623A1 (en) | 2019-06-06 | 2022-01-06 | Inscripta, Inc. | Curing for recursive nucleic acid-guided cell editing |
CN114008070A (zh) | 2019-06-21 | 2022-02-01 | 因思科瑞普特公司 | 导致大肠杆菌赖氨酸产量增加的全基因组合理设计的突变 |
US10927385B2 (en) | 2019-06-25 | 2021-02-23 | Inscripta, Inc. | Increased nucleic-acid guided cell editing in yeast |
EP3783104A1 (en) * | 2019-08-20 | 2021-02-24 | Kemijski Institut | Coiled-coil mediated tethering of crispr-cas and exonucleases for enhanced genome editing |
US11203762B2 (en) | 2019-11-19 | 2021-12-21 | Inscripta, Inc. | Methods for increasing observed editing in bacteria |
AU2020402526A1 (en) | 2019-12-10 | 2022-06-09 | Inscripta, Inc. | Novel mad nucleases |
US10704033B1 (en) | 2019-12-13 | 2020-07-07 | Inscripta, Inc. | Nucleic acid-guided nucleases |
CN115427579A (zh) * | 2019-12-17 | 2022-12-02 | 阿瑞迪思医药公司 | 增强和加速抗体表达的方法 |
US11008557B1 (en) | 2019-12-18 | 2021-05-18 | Inscripta, Inc. | Cascade/dCas3 complementation assays for in vivo detection of nucleic acid-guided nuclease edited cells |
US20230037794A1 (en) * | 2019-12-23 | 2023-02-09 | The Broad Institute, Inc. | Programmable dna nuclease-associated ligase and methods of use thereof |
US10689669B1 (en) | 2020-01-11 | 2020-06-23 | Inscripta, Inc. | Automated multi-module cell processing methods, instruments, and systems |
US11918936B2 (en) | 2020-01-17 | 2024-03-05 | Waters Technologies Corporation | Performance and dynamic range for oligonucleotide bioanalysis through reduction of non specific binding |
WO2021154706A1 (en) | 2020-01-27 | 2021-08-05 | Inscripta, Inc. | Electroporation modules and instrumentation |
US20210332388A1 (en) | 2020-04-24 | 2021-10-28 | Inscripta, Inc. | Compositions, methods, modules and instruments for automated nucleic acid-guided nuclease editing in mammalian cells |
CA3177481A1 (en) | 2020-05-08 | 2021-11-11 | David R. Liu | Methods and compositions for simultaneous editing of both strands of a target double-stranded nucleotide sequence |
US11787841B2 (en) | 2020-05-19 | 2023-10-17 | Inscripta, Inc. | Rationally-designed mutations to the thrA gene for enhanced lysine production in E. coli |
US11299731B1 (en) | 2020-09-15 | 2022-04-12 | Inscripta, Inc. | CRISPR editing to embed nucleic acid landing pads into genomes of live cells |
AU2021345339A1 (en) * | 2020-09-18 | 2023-06-01 | Institute For Basic Science | Targeted deaminase and base editing using same |
US11512297B2 (en) | 2020-11-09 | 2022-11-29 | Inscripta, Inc. | Affinity tag for recombination protein recruitment |
AU2021415461A1 (en) | 2021-01-04 | 2023-08-17 | Inscripta, Inc. | Mad nucleases |
EP4274890A1 (en) | 2021-01-07 | 2023-11-15 | Inscripta, Inc. | Mad nucleases |
WO2022163770A1 (ja) * | 2021-01-28 | 2022-08-04 | 国立研究開発法人理化学研究所 | ゲノム編集ツールの評価方法 |
US11884924B2 (en) | 2021-02-16 | 2024-01-30 | Inscripta, Inc. | Dual strand nucleic acid-guided nickase editing |
CN115261359B (zh) * | 2021-05-21 | 2023-06-30 | 山东舜丰生物科技有限公司 | 一种新型crispr酶和系统以及应用 |
CN114250172B (zh) * | 2021-12-09 | 2023-05-23 | 中国科学院海洋研究所 | 一种海运海杆菌及其应用 |
CN114507689B (zh) * | 2022-01-27 | 2024-01-16 | 山东大学 | 一种提高真核生物基因编辑效率的方法及其应用 |
CN114606251B (zh) * | 2022-03-30 | 2023-02-28 | 呈诺再生医学科技(珠海横琴新区)有限公司 | 以外泌体为载体的dna递送系统 |
WO2024063538A1 (ko) * | 2022-09-21 | 2024-03-28 | 기초과학연구원 | 식물세포 소기관 dna의 염기 교정 |
Family Cites Families (63)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS501B1 (pt) | 1970-05-19 | 1975-01-06 | ||
JP2610720B2 (ja) | 1991-06-24 | 1997-05-14 | 株式会社クボタ | 作業機のローリング制御装置 |
US6534261B1 (en) * | 1999-01-12 | 2003-03-18 | Sangamo Biosciences, Inc. | Regulation of endogenous gene expression in cells using zinc finger proteins |
GB9915126D0 (en) | 1999-06-30 | 1999-09-01 | Imp College Innovations Ltd | Control of gene expression |
EP1276865B1 (en) | 2000-04-28 | 2014-05-21 | Sangamo BioSciences, Inc. | Methods for binding an exogenous molecule to cellular chromatin |
MXPA04005010A (es) | 2001-11-26 | 2005-04-08 | Advanced Cell Tech Inc | METODO PARA HACER Y USAR NUCLEOS CELULARES SOMáTICOS METODOS PARA HACER Y USAR NUCLEOS CELULARES SOMáTICOS HUMANOS REPROGRAMADOS Y CELULAS DEL TALLO HUMANAS AUTOLOGAS E ISOGENICAS. |
WO2005014791A2 (en) * | 2003-08-08 | 2005-02-17 | Sangamo Biosciences, Inc. | Methods and compositions for targeted cleavage and recombination |
US7972854B2 (en) | 2004-02-05 | 2011-07-05 | Sangamo Biosciences, Inc. | Methods and compositions for targeted cleavage and recombination |
US20050220796A1 (en) | 2004-03-31 | 2005-10-06 | Dynan William S | Compositions and methods for modulating DNA repair |
CN101273141B (zh) | 2005-07-26 | 2013-03-27 | 桑格摩生物科学股份有限公司 | 外源核酸序列的靶向整合和表达 |
US8318155B2 (en) * | 2006-03-08 | 2012-11-27 | Kyoto University | Nucleic acid cleaving agent |
US8481272B2 (en) | 2006-08-04 | 2013-07-09 | Georgia State University Research Foundation, Inc. | Enzyme sensors, methods for preparing and using such sensors, and methods of detecting protease activity |
ES2719789T3 (es) | 2007-03-02 | 2019-07-16 | Dupont Nutrition Biosci Aps | Cultivos con resistencia mejorada a fagos |
GB0806086D0 (en) | 2008-04-04 | 2008-05-14 | Ulive Entpr Ltd | Dendrimer polymer hybrids |
WO2010011961A2 (en) | 2008-07-25 | 2010-01-28 | University Of Georgia Research Foundation, Inc. | Prokaryotic rnai-like system and methods of use |
US20100076057A1 (en) | 2008-09-23 | 2010-03-25 | Northwestern University | TARGET DNA INTERFERENCE WITH crRNA |
US9404098B2 (en) | 2008-11-06 | 2016-08-02 | University Of Georgia Research Foundation, Inc. | Method for cleaving a target RNA using a Cas6 polypeptide |
WO2010075424A2 (en) | 2008-12-22 | 2010-07-01 | The Regents Of University Of California | Compositions and methods for downregulating prokaryotic genes |
US20120192298A1 (en) | 2009-07-24 | 2012-07-26 | Sigma Aldrich Co. Llc | Method for genome editing |
WO2011100058A1 (en) | 2010-02-09 | 2011-08-18 | Sangamo Biosciences, Inc. | Targeted genomic modification with partially single-stranded donor molecules |
US10087431B2 (en) | 2010-03-10 | 2018-10-02 | The Regents Of The University Of California | Methods of generating nucleic acid fragments |
MX2012013037A (es) | 2010-05-10 | 2013-07-29 | Univ California | Composiciones de endorribonucleasa y metodos de uso de las mismas. |
WO2011146121A1 (en) | 2010-05-17 | 2011-11-24 | Sangamo Biosciences, Inc. | Novel dna-binding proteins and uses thereof |
CN103168101A (zh) | 2010-07-23 | 2013-06-19 | 西格马-奥尔德里奇有限责任公司 | 使用靶向核酸内切酶和单链核酸的基因组编辑 |
WO2012164565A1 (en) | 2011-06-01 | 2012-12-06 | Yeda Research And Development Co. Ltd. | Compositions and methods for downregulating prokaryotic genes |
JP6144691B2 (ja) | 2011-11-16 | 2017-06-07 | サンガモ セラピューティクス, インコーポレイテッド | 修飾されたdna結合タンパク質およびその使用 |
GB201122458D0 (en) | 2011-12-30 | 2012-02-08 | Univ Wageningen | Modified cascade ribonucleoproteins and uses thereof |
WO2013141680A1 (en) | 2012-03-20 | 2013-09-26 | Vilnius University | RNA-DIRECTED DNA CLEAVAGE BY THE Cas9-crRNA COMPLEX |
US9637739B2 (en) | 2012-03-20 | 2017-05-02 | Vilnius University | RNA-directed DNA cleavage by the Cas9-crRNA complex |
RU2650819C2 (ru) | 2012-05-07 | 2018-04-17 | Сангамо Терапьютикс, Инк. | Способы и композиции для опосредованной нуклеазой направленной интеграции трансгенов |
DE202013012242U1 (de) | 2012-05-25 | 2016-02-02 | Emmanuelle Charpentier | Zusammensetzungen für die durch RNA gesteuerte Modifikation einer Ziel-DNA und für die durch RNA gesteuerte Modulation der Transkription |
DE202013012597U1 (de) | 2012-10-23 | 2017-11-21 | Toolgen, Inc. | Zusammensetzung zum Spalten einer Ziel-DNA, umfassend eine für die Ziel-DNA spezifische guide-RNA und eine Cas-Protein-codierende Nukleinsäure oder ein Cas-Protein, sowie deren Verwendung |
PL3138910T3 (pl) * | 2012-12-06 | 2018-01-31 | Sigma Aldrich Co Llc | Oparta na CRISPR modyfikacja i regulacja genomu |
PL2931898T3 (pl) | 2012-12-12 | 2016-09-30 | Le Cong | Projektowanie i optymalizacja systemów, sposoby i kompozycje do manipulacji sekwencją z domenami funkcjonalnymi |
US8697359B1 (en) | 2012-12-12 | 2014-04-15 | The Broad Institute, Inc. | CRISPR-Cas systems and methods for altering expression of gene products |
WO2014099744A1 (en) | 2012-12-17 | 2014-06-26 | President And Fellows Of Harvard College | Rna-guided human genome engineering |
CN103233028B (zh) | 2013-01-25 | 2015-05-13 | 南京徇齐生物技术有限公司 | 一种无物种限制无生物安全性问题的真核生物基因打靶方法及螺旋结构dna序列 |
WO2014150624A1 (en) | 2013-03-14 | 2014-09-25 | Caribou Biosciences, Inc. | Compositions and methods of nucleic acid-targeting nucleic acids |
US20140273230A1 (en) | 2013-03-15 | 2014-09-18 | Sigma-Aldrich Co., Llc | Crispr-based genome modification and regulation |
KR102210319B1 (ko) * | 2013-03-15 | 2021-02-01 | 더 제너럴 하스피탈 코포레이션 | 특정 게놈 좌위에 대한 유전적 및 후성적 조절 단백질의 rna-안내 표적화 |
JP7065564B2 (ja) * | 2013-05-29 | 2022-05-12 | セレクティス | Cas9ニッカーゼ活性を用いて正確なdna切断をもたらすための方法 |
WO2014197568A2 (en) * | 2013-06-04 | 2014-12-11 | President And Fellows Of Harvard College | Rna-guideded transcriptional regulation |
EP3539573B1 (en) * | 2013-06-05 | 2024-02-14 | Duke University | Rna-guided gene editing and gene regulation |
CN103343120B (zh) | 2013-07-04 | 2015-03-04 | 中国科学院遗传与发育生物学研究所 | 一种小麦基因组定点改造方法 |
CN103388006B (zh) | 2013-07-26 | 2015-10-28 | 华东师范大学 | 一种基因定点突变的构建方法 |
WO2015021426A1 (en) | 2013-08-09 | 2015-02-12 | Sage Labs, Inc. | A crispr/cas system-based novel fusion protein and its application in genome editing |
US9388430B2 (en) * | 2013-09-06 | 2016-07-12 | President And Fellows Of Harvard College | Cas9-recombinase fusion proteins and uses thereof |
US10370680B2 (en) | 2014-02-24 | 2019-08-06 | Sangamo Therapeutics, Inc. | Method of treating factor IX deficiency using nuclease-mediated targeted integration |
US20170198268A1 (en) * | 2014-07-09 | 2017-07-13 | Gen9, Inc. | Compositions and Methods for Site-Directed DNA Nicking and Cleaving |
US10077453B2 (en) | 2014-07-30 | 2018-09-18 | President And Fellows Of Harvard College | CAS9 proteins including ligand-dependent inteins |
EP3686279B1 (en) * | 2014-08-17 | 2023-01-04 | The Broad Institute, Inc. | Genome editing using cas9 nickases |
SG11201701245QA (en) * | 2014-08-27 | 2017-03-30 | Caribou Biosciences Inc | Methods for increasing cas9-mediated engineering efficiency |
US10570418B2 (en) * | 2014-09-02 | 2020-02-25 | The Regents Of The University Of California | Methods and compositions for RNA-directed target DNA modification |
US20170306306A1 (en) * | 2014-10-24 | 2017-10-26 | Life Technologies Corporation | Compositions and Methods for Enhancing Homologous Recombination |
EP3215617B1 (en) * | 2014-11-07 | 2024-05-08 | Editas Medicine, Inc. | Systems for improving crispr/cas-mediated genome-editing |
US10190106B2 (en) * | 2014-12-22 | 2019-01-29 | Univesity Of Massachusetts | Cas9-DNA targeting unit chimeras |
GB201506509D0 (en) * | 2015-04-16 | 2015-06-03 | Univ Wageningen | Nuclease-mediated genome editing |
US9790490B2 (en) * | 2015-06-18 | 2017-10-17 | The Broad Institute Inc. | CRISPR enzymes and systems |
US10526590B2 (en) * | 2015-08-31 | 2020-01-07 | Agilent Technologies, Inc. | Compounds and methods for CRISPR/Cas-based genome editing by homologous recombination |
ES2699848T3 (es) * | 2015-10-23 | 2019-02-13 | Caribou Biosciences Inc | Acido nucleico CRISPR clase 2 de tipo cruzado modificado que se dirige a ácidos nucleicos |
CA3004757C (en) * | 2015-12-04 | 2020-07-21 | Caribou Biosciences, Inc. | Engineered nucleic-acid targeting nucleic acids |
US20170314002A1 (en) * | 2016-04-29 | 2017-11-02 | Bio-Rad Laboratories, Inc. | Dimeric proteins for specific targeting of nucleic acid sequences |
EP3872177A1 (en) * | 2016-05-27 | 2021-09-01 | Life Technologies Corporation | Compositions and methods for enhancing homologous recombination |
-
2017
- 2017-02-20 CA CA3209273A patent/CA3209273A1/en active Pending
- 2017-02-20 PT PT171570245T patent/PT3272867T/pt unknown
- 2017-02-20 GB GB1904166.4A patent/GB2578802B8/en active Active
- 2017-02-20 GB GB1702743.4A patent/GB2552861B/en active Active
- 2017-02-20 IL IL289989A patent/IL289989B/en unknown
- 2017-02-20 GB GB2010846.0A patent/GB2582731B8/en not_active Expired - Fee Related
- 2017-02-20 IL IL302238A patent/IL302238A/en unknown
- 2017-02-20 AU AU2017274145A patent/AU2017274145B2/en active Active
- 2017-02-20 JP JP2018562948A patent/JP6878468B2/ja active Active
- 2017-02-20 LT LTEP19186629.2T patent/LT3604527T/lt unknown
- 2017-02-20 EP EP21160880.7A patent/EP3907286A1/en active Pending
- 2017-02-20 DK DK17157024T patent/DK3272867T3/da active
- 2017-02-20 KR KR1020227036504A patent/KR20220147710A/ko active Application Filing
- 2017-02-20 SG SG11201810003UA patent/SG11201810003UA/en unknown
- 2017-02-20 EP EP19186629.2A patent/EP3604527B1/en active Active
- 2017-02-20 US US15/437,148 patent/US10266851B2/en active Active
- 2017-02-20 IL IL295358A patent/IL295358B2/en unknown
- 2017-02-20 ES ES19186629T patent/ES2881355T3/es active Active
- 2017-02-20 BR BR112018074531-6A patent/BR112018074531B1/pt active IP Right Grant
- 2017-02-20 CA CA3026321A patent/CA3026321C/en active Active
- 2017-02-20 DK DK19186629.2T patent/DK3604527T3/da active
- 2017-02-20 PL PL17157024T patent/PL3272867T3/pl unknown
- 2017-02-20 PL PL19186629T patent/PL3604527T3/pl unknown
- 2017-02-20 WO PCT/US2017/018589 patent/WO2017209809A1/en active Application Filing
- 2017-02-20 PT PT191866292T patent/PT3604527T/pt unknown
- 2017-02-20 KR KR1020187037407A patent/KR102458395B1/ko active IP Right Grant
- 2017-02-20 CN CN201780048469.4A patent/CN109983124B/zh active Active
- 2017-02-20 EP EP17157024.5A patent/EP3272867B1/en active Active
- 2017-02-20 ES ES17157024T patent/ES2760477T3/es active Active
- 2017-02-20 CN CN202211060110.8A patent/CN116064529A/zh active Pending
-
2018
- 2018-11-07 IL IL262854A patent/IL262854B/en active IP Right Grant
-
2019
- 2019-02-15 US US16/277,614 patent/US20190169650A1/en active Pending
- 2019-02-15 US US16/277,638 patent/US20190169651A1/en active Pending
-
2020
- 2020-06-09 IL IL275244A patent/IL275244B/en unknown
- 2020-09-30 AU AU2020244497A patent/AU2020244497B2/en active Active
-
2021
- 2021-02-01 AU AU2021200636A patent/AU2021200636B2/en active Active
- 2021-04-28 JP JP2021076124A patent/JP7220737B2/ja active Active
-
2023
- 2023-01-31 JP JP2023012725A patent/JP2023065365A/ja active Pending
- 2023-05-31 AU AU2023203391A patent/AU2023203391A1/en active Pending
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2021200636B2 (en) | Using programmable dna binding proteins to enhance targeted genome modification | |
KR102523217B1 (ko) | 표적된 게놈 변형을 개선하기 위한 뉴클레오솜 상호작용 단백질 도메인 사용 | |
BR112019028146A2 (pt) | rna guia sintético para sistemas ativadores de crispr/cas | |
BR112021016019A2 (pt) | Sistemas e proteínas de fusão crispr/cas |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
B06A | Patent application procedure suspended [chapter 6.1 patent gazette] | ||
B09A | Decision: intention to grant [chapter 9.1 patent gazette] | ||
B16A | Patent or certificate of addition of invention granted [chapter 16.1 patent gazette] |
Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 20/02/2017, OBSERVADAS AS CONDICOES LEGAIS. |