BR112021007229A2 - métodos para inserção dirigida de dna em genes - Google Patents
métodos para inserção dirigida de dna em genes Download PDFInfo
- Publication number
- BR112021007229A2 BR112021007229A2 BR112021007229-2A BR112021007229A BR112021007229A2 BR 112021007229 A2 BR112021007229 A2 BR 112021007229A2 BR 112021007229 A BR112021007229 A BR 112021007229A BR 112021007229 A2 BR112021007229 A2 BR 112021007229A2
- Authority
- BR
- Brazil
- Prior art keywords
- sequence
- transgene
- gene
- intron
- exon
- Prior art date
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 185
- 238000000034 method Methods 0.000 title claims abstract description 87
- 238000003780 insertion Methods 0.000 title abstract description 16
- 230000037431 insertion Effects 0.000 title abstract description 16
- 108091026890 Coding region Proteins 0.000 claims abstract description 123
- 108020004414 DNA Proteins 0.000 claims abstract description 80
- 108010042407 Endonucleases Proteins 0.000 claims abstract description 68
- 102000004533 Endonucleases Human genes 0.000 claims abstract description 68
- 102000008579 Transposases Human genes 0.000 claims abstract description 19
- 108010020764 Transposases Proteins 0.000 claims abstract description 19
- 108700019146 Transgenes Proteins 0.000 claims description 218
- 239000000370 acceptor Substances 0.000 claims description 118
- 102000004169 proteins and genes Human genes 0.000 claims description 50
- 150000007523 nucleic acids Chemical group 0.000 claims description 45
- 101150074725 Atxn3 gene Proteins 0.000 claims description 42
- 239000013598 vector Substances 0.000 claims description 42
- 230000002457 bidirectional effect Effects 0.000 claims description 34
- 239000013603 viral vector Substances 0.000 claims description 31
- 108091033409 CRISPR Proteins 0.000 claims description 30
- 101710163270 Nuclease Proteins 0.000 claims description 30
- 101150041164 Cacna1a gene Proteins 0.000 claims description 29
- 150000001413 amino acids Chemical class 0.000 claims description 27
- 238000010354 CRISPR gene editing Methods 0.000 claims description 23
- 230000001717 pathogenic effect Effects 0.000 claims description 23
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 23
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 17
- 108700004991 Cas12a Proteins 0.000 claims description 10
- 241000701161 unidentified adenovirus Species 0.000 claims description 7
- 241000713666 Lentivirus Species 0.000 claims description 6
- 108020004638 Circular DNA Proteins 0.000 claims description 3
- 241000702421 Dependoparvovirus Species 0.000 claims description 3
- 230000001594 aberrant effect Effects 0.000 claims description 3
- 239000000203 mixture Substances 0.000 abstract description 14
- 210000004027 cell Anatomy 0.000 description 69
- 230000010354 integration Effects 0.000 description 54
- 238000003776 cleavage reaction Methods 0.000 description 35
- 230000007017 scission Effects 0.000 description 35
- 239000013612 plasmid Substances 0.000 description 28
- 102000039446 nucleic acids Human genes 0.000 description 27
- 108020004707 nucleic acids Proteins 0.000 description 27
- 230000006801 homologous recombination Effects 0.000 description 26
- 238000002744 homologous recombination Methods 0.000 description 26
- 230000002441 reversible effect Effects 0.000 description 26
- 108010032947 Ataxin-3 Proteins 0.000 description 23
- 108700024394 Exon Proteins 0.000 description 23
- 230000006780 non-homologous end joining Effects 0.000 description 23
- 102000007371 Ataxin-3 Human genes 0.000 description 22
- 102000053602 DNA Human genes 0.000 description 16
- 229940024606 amino acid Drugs 0.000 description 16
- 238000001890 transfection Methods 0.000 description 15
- 101000935117 Homo sapiens Voltage-dependent P/Q-type calcium channel subunit alpha-1A Proteins 0.000 description 14
- 230000006870 function Effects 0.000 description 14
- 230000035772 mutation Effects 0.000 description 14
- 241000196324 Embryophyta Species 0.000 description 13
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 12
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 10
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 10
- 102000014817 CACNA1A Human genes 0.000 description 10
- 108020005004 Guide RNA Proteins 0.000 description 10
- 239000012091 fetal bovine serum Substances 0.000 description 10
- 108020004999 messenger RNA Proteins 0.000 description 10
- 239000002773 nucleotide Substances 0.000 description 10
- 125000003729 nucleotide group Chemical group 0.000 description 10
- 201000010099 disease Diseases 0.000 description 9
- 230000005782 double-strand break Effects 0.000 description 9
- 230000001404 mediated effect Effects 0.000 description 8
- DAEPDZWVDSPTHF-UHFFFAOYSA-M sodium pyruvate Chemical compound [Na+].CC(=O)C([O-])=O DAEPDZWVDSPTHF-UHFFFAOYSA-M 0.000 description 8
- 230000002103 transcriptional effect Effects 0.000 description 8
- 241000700605 Viruses Species 0.000 description 7
- -1 cell fusion Substances 0.000 description 7
- 230000014509 gene expression Effects 0.000 description 7
- 238000010362 genome editing Methods 0.000 description 7
- 230000008685 targeting Effects 0.000 description 7
- 238000012546 transfer Methods 0.000 description 7
- 230000003612 virological effect Effects 0.000 description 7
- 241000702423 Adeno-associated virus - 2 Species 0.000 description 6
- 108020004705 Codon Proteins 0.000 description 6
- 208000026350 Inborn Genetic disease Diseases 0.000 description 6
- 208000002569 Machado-Joseph Disease Diseases 0.000 description 6
- 108020005067 RNA Splice Sites Proteins 0.000 description 6
- 230000008901 benefit Effects 0.000 description 6
- 208000016361 genetic disease Diseases 0.000 description 6
- 150000002632 lipids Chemical class 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- 230000017105 transposition Effects 0.000 description 6
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 5
- 241001465754 Metazoa Species 0.000 description 5
- 201000003620 Spinocerebellar ataxia type 6 Diseases 0.000 description 5
- 230000037361 pathway Effects 0.000 description 5
- 102000004196 processed proteins & peptides Human genes 0.000 description 5
- 230000001105 regulatory effect Effects 0.000 description 5
- 230000008439 repair process Effects 0.000 description 5
- 208000011580 syndromic disease Diseases 0.000 description 5
- 101100260928 Escherichia coli tnsB gene Proteins 0.000 description 4
- 101100260929 Escherichia coli tnsC gene Proteins 0.000 description 4
- 241000282326 Felis catus Species 0.000 description 4
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 4
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 4
- 229930182816 L-glutamine Natural products 0.000 description 4
- 108091034057 RNA (poly(A)) Proteins 0.000 description 4
- 208000036834 Spinocerebellar ataxia type 3 Diseases 0.000 description 4
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 4
- 230000000295 complement effect Effects 0.000 description 4
- 230000002950 deficient Effects 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 4
- 230000002068 genetic effect Effects 0.000 description 4
- 239000008103 glucose Substances 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 239000002609 medium Substances 0.000 description 4
- 230000011987 methylation Effects 0.000 description 4
- 238000007069 methylation reaction Methods 0.000 description 4
- 239000002245 particle Substances 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 208000007056 sickle cell anemia Diseases 0.000 description 4
- 229940054269 sodium pyruvate Drugs 0.000 description 4
- 210000000130 stem cell Anatomy 0.000 description 4
- 239000013607 AAV vector Substances 0.000 description 3
- 108010077544 Chromatin Proteins 0.000 description 3
- 108010001831 LDL receptors Proteins 0.000 description 3
- 102100024640 Low-density lipoprotein receptor Human genes 0.000 description 3
- 108060001084 Luciferase Proteins 0.000 description 3
- 239000005089 Luciferase Substances 0.000 description 3
- 208000024556 Mendelian disease Diseases 0.000 description 3
- 208000002678 Mucopolysaccharidoses Diseases 0.000 description 3
- 229910019142 PO4 Inorganic materials 0.000 description 3
- 108700008625 Reporter Genes Proteins 0.000 description 3
- 208000009415 Spinocerebellar Ataxias Diseases 0.000 description 3
- 108091081024 Start codon Proteins 0.000 description 3
- 230000004075 alteration Effects 0.000 description 3
- 125000000539 amino acid group Chemical group 0.000 description 3
- 239000003153 chemical reaction reagent Substances 0.000 description 3
- 210000003483 chromatin Anatomy 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 208000035475 disorder Diseases 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000004520 electroporation Methods 0.000 description 3
- 210000001671 embryonic stem cell Anatomy 0.000 description 3
- 101150066555 lacZ gene Proteins 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 206010028093 mucopolysaccharidosis Diseases 0.000 description 3
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 3
- 239000010452 phosphate Substances 0.000 description 3
- 238000003752 polymerase chain reaction Methods 0.000 description 3
- 102000040430 polynucleotide Human genes 0.000 description 3
- 108091033319 polynucleotide Proteins 0.000 description 3
- 239000002157 polynucleotide Substances 0.000 description 3
- 229920001184 polypeptide Polymers 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000013518 transcription Methods 0.000 description 3
- 230000035897 transcription Effects 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- 238000011144 upstream manufacturing Methods 0.000 description 3
- 235000013311 vegetables Nutrition 0.000 description 3
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 2
- 230000005730 ADP ribosylation Effects 0.000 description 2
- 102100022900 Actin, cytoplasmic 1 Human genes 0.000 description 2
- 108010085238 Actins Proteins 0.000 description 2
- 241001634120 Adeno-associated virus - 5 Species 0.000 description 2
- 241000972680 Adeno-associated virus - 6 Species 0.000 description 2
- 241001164825 Adeno-associated virus - 8 Species 0.000 description 2
- 108010011170 Ala-Trp-Arg-His-Pro-Gln-Phe-Gly-Gly Proteins 0.000 description 2
- 102100026277 Alpha-galactosidase A Human genes 0.000 description 2
- 102000007610 Amino-acid N-acetyltransferase Human genes 0.000 description 2
- 108010032178 Amino-acid N-acetyltransferase Proteins 0.000 description 2
- 108091093088 Amplicon Proteins 0.000 description 2
- 108020005544 Antisense RNA Proteins 0.000 description 2
- 108700040066 Argininosuccinate lyases Proteins 0.000 description 2
- 102100022548 Beta-hexosaminidase subunit alpha Human genes 0.000 description 2
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 2
- 235000002566 Capsicum Nutrition 0.000 description 2
- 102000037115 Carbamoyl-phosphate synthase (ammonia) Human genes 0.000 description 2
- 108090000447 Carbamoyl-phosphate synthase (ammonia) Proteins 0.000 description 2
- 108090000994 Catalytic RNA Proteins 0.000 description 2
- 102000053642 Catalytic RNA Human genes 0.000 description 2
- 241000282693 Cercopithecidae Species 0.000 description 2
- 102100022641 Coagulation factor IX Human genes 0.000 description 2
- 102100023470 Cobalamin trafficking protein CblD Human genes 0.000 description 2
- 206010010099 Combined immunodeficiency Diseases 0.000 description 2
- 102100027591 Copper-transporting ATPase 2 Human genes 0.000 description 2
- 241000699802 Cricetulus griseus Species 0.000 description 2
- 241000195493 Cryptophyta Species 0.000 description 2
- 241000252233 Cyprinus carpio Species 0.000 description 2
- 201000003883 Cystic fibrosis Diseases 0.000 description 2
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 2
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 2
- 108010076282 Factor IX Proteins 0.000 description 2
- 108010054218 Factor VIII Proteins 0.000 description 2
- 102000001690 Factor VIII Human genes 0.000 description 2
- 108010080865 Factor XII Proteins 0.000 description 2
- 102000000429 Factor XII Human genes 0.000 description 2
- 108010071289 Factor XIII Proteins 0.000 description 2
- 208000015872 Gaucher disease Diseases 0.000 description 2
- 102000003638 Glucose-6-Phosphatase Human genes 0.000 description 2
- 108010086800 Glucose-6-Phosphatase Proteins 0.000 description 2
- 108010017544 Glucosylceramidase Proteins 0.000 description 2
- 102000004547 Glucosylceramidase Human genes 0.000 description 2
- 108010070675 Glutathione transferase Proteins 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- 235000010469 Glycine max Nutrition 0.000 description 2
- 102100030648 Glyoxylate reductase/hydroxypyruvate reductase Human genes 0.000 description 2
- 241000219146 Gossypium Species 0.000 description 2
- HVLSXIKZNLPZJJ-TXZCQADKSA-N HA peptide Chemical compound C([C@@H](C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HVLSXIKZNLPZJJ-TXZCQADKSA-N 0.000 description 2
- 102100029100 Hematopoietic prostaglandin D synthase Human genes 0.000 description 2
- 208000031220 Hemophilia Diseases 0.000 description 2
- 208000009292 Hemophilia A Diseases 0.000 description 2
- 101000977167 Homo sapiens Cobalamin trafficking protein CblD Proteins 0.000 description 2
- 108010053927 Iduronate Sulfatase Proteins 0.000 description 2
- 102000004627 Iduronidase Human genes 0.000 description 2
- 108010003381 Iduronidase Proteins 0.000 description 2
- 108090001030 Lipoproteins Proteins 0.000 description 2
- 102000004895 Lipoproteins Human genes 0.000 description 2
- 241000227653 Lycopersicon Species 0.000 description 2
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 2
- 241000220225 Malus Species 0.000 description 2
- 240000004658 Medicago sativa Species 0.000 description 2
- 235000017587 Medicago sativa ssp. sativa Nutrition 0.000 description 2
- 108010085747 Methylmalonyl-CoA Decarboxylase Proteins 0.000 description 2
- 206010056886 Mucopolysaccharidosis I Diseases 0.000 description 2
- 229930193140 Neomycin Natural products 0.000 description 2
- 102000007981 Ornithine carbamoyltransferase Human genes 0.000 description 2
- 101710198224 Ornithine carbamoyltransferase, mitochondrial Proteins 0.000 description 2
- 241000209094 Oryza Species 0.000 description 2
- 108010069013 Phenylalanine Hydroxylase Proteins 0.000 description 2
- 102100038223 Phenylalanine-4-hydroxylase Human genes 0.000 description 2
- 235000008331 Pinus X rigitaeda Nutrition 0.000 description 2
- 241000018646 Pinus brutia Species 0.000 description 2
- 235000011613 Pinus brutia Nutrition 0.000 description 2
- 239000002202 Polyethylene glycol Substances 0.000 description 2
- 241000288906 Primates Species 0.000 description 2
- 241000220324 Pyrus Species 0.000 description 2
- 241000192120 Scytonema Species 0.000 description 2
- 102100026842 Serine-pyruvate aminotransferase Human genes 0.000 description 2
- 108020004682 Single-Stranded DNA Proteins 0.000 description 2
- 235000002595 Solanum tuberosum Nutrition 0.000 description 2
- 244000061456 Solanum tuberosum Species 0.000 description 2
- 244000062793 Sorghum vulgare Species 0.000 description 2
- 208000022292 Tay-Sachs disease Diseases 0.000 description 2
- 230000021736 acetylation Effects 0.000 description 2
- 238000006640 acetylation reaction Methods 0.000 description 2
- 108010030291 alpha-Galactosidase Proteins 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- 208000005980 beta thalassemia Diseases 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 229910052791 calcium Inorganic materials 0.000 description 2
- 239000011575 calcium Substances 0.000 description 2
- 210000000234 capsid Anatomy 0.000 description 2
- 230000007910 cell fusion Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 102000021178 chitin binding proteins Human genes 0.000 description 2
- 108091011157 chitin binding proteins Proteins 0.000 description 2
- 208000016532 chronic granulomatous disease Diseases 0.000 description 2
- 238000000975 co-precipitation Methods 0.000 description 2
- 239000003184 complementary RNA Substances 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 238000005520 cutting process Methods 0.000 description 2
- 230000007812 deficiency Effects 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 210000003527 eukaryotic cell Anatomy 0.000 description 2
- 229960004222 factor ix Drugs 0.000 description 2
- 229960000301 factor viii Drugs 0.000 description 2
- 238000001415 gene therapy Methods 0.000 description 2
- 230000013595 glycosylation Effects 0.000 description 2
- 238000006206 glycosylation reaction Methods 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- 210000004263 induced pluripotent stem cell Anatomy 0.000 description 2
- 238000002347 injection Methods 0.000 description 2
- 239000007924 injection Substances 0.000 description 2
- 229960004927 neomycin Drugs 0.000 description 2
- 230000026731 phosphorylation Effects 0.000 description 2
- 238000006366 phosphorylation reaction Methods 0.000 description 2
- 108010025221 plasma protein Z Proteins 0.000 description 2
- 230000008488 polyadenylation Effects 0.000 description 2
- 229920001223 polyethylene glycol Polymers 0.000 description 2
- 229920000642 polymer Polymers 0.000 description 2
- 102000054765 polymorphisms of proteins Human genes 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 230000006798 recombination Effects 0.000 description 2
- 238000005215 recombination Methods 0.000 description 2
- 108091092562 ribozyme Proteins 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 235000000346 sugar Nutrition 0.000 description 2
- 238000002560 therapeutic procedure Methods 0.000 description 2
- 230000034512 ubiquitination Effects 0.000 description 2
- 238000010798 ubiquitination Methods 0.000 description 2
- FQVLRGLGWNWPSS-BXBUPLCLSA-N (4r,7s,10s,13s,16r)-16-acetamido-13-(1h-imidazol-5-ylmethyl)-10-methyl-6,9,12,15-tetraoxo-7-propan-2-yl-1,2-dithia-5,8,11,14-tetrazacycloheptadecane-4-carboxamide Chemical compound N1C(=O)[C@@H](NC(C)=O)CSSC[C@@H](C(N)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C)NC(=O)[C@@H]1CC1=CN=CN1 FQVLRGLGWNWPSS-BXBUPLCLSA-N 0.000 description 1
- 108020005345 3' Untranslated Regions Proteins 0.000 description 1
- GACSIVHAIFQKTC-OWOJBTEDSA-N 4-fumarylacetoacetic acid Chemical compound OC(=O)CC(=O)CC(=O)\C=C\C(O)=O GACSIVHAIFQKTC-OWOJBTEDSA-N 0.000 description 1
- MXCVHSXCXPHOLP-UHFFFAOYSA-N 4-oxo-6-propylchromene-2-carboxylic acid Chemical compound O1C(C(O)=O)=CC(=O)C2=CC(CCC)=CC=C21 MXCVHSXCXPHOLP-UHFFFAOYSA-N 0.000 description 1
- 101710163881 5,6-dihydroxyindole-2-carboxylic acid oxidase Proteins 0.000 description 1
- 101150114788 ARO4 gene Proteins 0.000 description 1
- 102100024643 ATP-binding cassette sub-family D member 1 Human genes 0.000 description 1
- 241001655883 Adeno-associated virus - 1 Species 0.000 description 1
- 241000202702 Adeno-associated virus - 3 Species 0.000 description 1
- 241000580270 Adeno-associated virus - 4 Species 0.000 description 1
- 241001164823 Adeno-associated virus - 7 Species 0.000 description 1
- 208000002485 Adiposis dolorosa Diseases 0.000 description 1
- 201000011452 Adrenoleukodystrophy Diseases 0.000 description 1
- 208000024341 Aicardi syndrome Diseases 0.000 description 1
- 108010033918 Alanine-glyoxylate transaminase Proteins 0.000 description 1
- 102100034035 Alcohol dehydrogenase 1A Human genes 0.000 description 1
- 235000003840 Amygdalus nana Nutrition 0.000 description 1
- 244000296825 Amygdalus nana Species 0.000 description 1
- 241000192537 Anabaena cylindrica Species 0.000 description 1
- 206010056292 Androgen-Insensitivity Syndrome Diseases 0.000 description 1
- 235000002198 Annona diversifolia Nutrition 0.000 description 1
- 102000004411 Antithrombin III Human genes 0.000 description 1
- 108090000935 Antithrombin III Proteins 0.000 description 1
- 101500018095 Apis mellifera APMGFYGTR-amide Proteins 0.000 description 1
- 240000007087 Apium graveolens Species 0.000 description 1
- 235000015849 Apium graveolens Dulce Group Nutrition 0.000 description 1
- 102000018616 Apolipoproteins B Human genes 0.000 description 1
- 108010027006 Apolipoproteins B Proteins 0.000 description 1
- 235000010591 Appio Nutrition 0.000 description 1
- 241000219194 Arabidopsis Species 0.000 description 1
- 102000004452 Arginase Human genes 0.000 description 1
- 102100021723 Arginase-1 Human genes 0.000 description 1
- 108700024123 Arginases Proteins 0.000 description 1
- 102000009042 Argininosuccinate Lyase Human genes 0.000 description 1
- 208000002150 Arrhythmogenic Right Ventricular Dysplasia Diseases 0.000 description 1
- 201000006058 Arrhythmogenic right ventricular cardiomyopathy Diseases 0.000 description 1
- 235000005340 Asparagus officinalis Nutrition 0.000 description 1
- 206010003591 Ataxia Diseases 0.000 description 1
- 241000282672 Ateles sp. Species 0.000 description 1
- 235000005781 Avena Nutrition 0.000 description 1
- 244000075850 Avena orientalis Species 0.000 description 1
- 235000000832 Ayote Nutrition 0.000 description 1
- 241000206761 Bacillariophyta Species 0.000 description 1
- 235000017166 Bambusa arundinacea Nutrition 0.000 description 1
- 235000017491 Bambusa tulda Nutrition 0.000 description 1
- 201000005943 Barth syndrome Diseases 0.000 description 1
- 235000016068 Berberis vulgaris Nutrition 0.000 description 1
- 241000335053 Beta vulgaris Species 0.000 description 1
- 101710124976 Beta-hexosaminidase A Proteins 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 241001536303 Botryococcus braunii Species 0.000 description 1
- 235000011331 Brassica Nutrition 0.000 description 1
- 241000219198 Brassica Species 0.000 description 1
- 240000002791 Brassica napus Species 0.000 description 1
- 235000004977 Brassica sinapistrum Nutrition 0.000 description 1
- 108090000312 Calcium Channels Proteins 0.000 description 1
- 102000003922 Calcium Channels Human genes 0.000 description 1
- 102100034279 Calcium-binding mitochondrial carrier protein Aralar2 Human genes 0.000 description 1
- 241000238097 Callinectes sapidus Species 0.000 description 1
- 208000022526 Canavan disease Diseases 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 240000008574 Capsicum frutescens Species 0.000 description 1
- 102000014914 Carrier Proteins Human genes 0.000 description 1
- 108010078791 Carrier Proteins Proteins 0.000 description 1
- 241000700198 Cavia Species 0.000 description 1
- 241001515796 Cebinae Species 0.000 description 1
- 241000195649 Chlorella <Chlorellales> Species 0.000 description 1
- 206010008723 Chondrodystrophy Diseases 0.000 description 1
- 235000007516 Chrysanthemum Nutrition 0.000 description 1
- 244000189548 Chrysanthemum x morifolium Species 0.000 description 1
- 241000722206 Chrysotila carterae Species 0.000 description 1
- 241000219109 Citrullus Species 0.000 description 1
- 241000207199 Citrus Species 0.000 description 1
- 102100023804 Coagulation factor VII Human genes 0.000 description 1
- 208000006992 Color Vision Defects Diseases 0.000 description 1
- 206010053138 Congenital aplastic anaemia Diseases 0.000 description 1
- 240000000491 Corchorus aestuans Species 0.000 description 1
- 235000011777 Corchorus aestuans Nutrition 0.000 description 1
- 235000010862 Corchorus capsularis Nutrition 0.000 description 1
- 102100023376 Corrinoid adenosyltransferase Human genes 0.000 description 1
- 229920000742 Cotton Polymers 0.000 description 1
- 206010011385 Cri-du-chat syndrome Diseases 0.000 description 1
- 241000699800 Cricetinae Species 0.000 description 1
- 241000219122 Cucurbita Species 0.000 description 1
- 240000004244 Cucurbita moschata Species 0.000 description 1
- 235000009854 Cucurbita moschata Nutrition 0.000 description 1
- 235000009804 Cucurbita pepo subsp pepo Nutrition 0.000 description 1
- 102100023381 Cyanocobalamin reductase / alkylcobalamin dealkylase Human genes 0.000 description 1
- 101710164985 Cyanocobalamin reductase / alkylcobalamin dealkylase Proteins 0.000 description 1
- 108010079245 Cystic Fibrosis Transmembrane Conductance Regulator Proteins 0.000 description 1
- 230000007018 DNA scission Effects 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 241000208175 Daucus Species 0.000 description 1
- 241001338022 Daucus carota subsp. sativus Species 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 241000195632 Dunaliella tertiolecta Species 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 241000132521 Erigeron Species 0.000 description 1
- 241000289659 Erinaceidae Species 0.000 description 1
- 108091029865 Exogenous DNA Proteins 0.000 description 1
- 208000024720 Fabry Disease Diseases 0.000 description 1
- 108010014172 Factor V Proteins 0.000 description 1
- 108010023321 Factor VII Proteins 0.000 description 1
- 108010014173 Factor X Proteins 0.000 description 1
- 108010074864 Factor XI Proteins 0.000 description 1
- 201000004939 Fanconi anemia Diseases 0.000 description 1
- 108010049003 Fibrinogen Proteins 0.000 description 1
- 102000008946 Fibrinogen Human genes 0.000 description 1
- 102100037362 Fibronectin Human genes 0.000 description 1
- 108010067306 Fibronectins Proteins 0.000 description 1
- 235000016623 Fragaria vesca Nutrition 0.000 description 1
- 240000009088 Fragaria x ananassa Species 0.000 description 1
- 235000011363 Fragaria x ananassa Nutrition 0.000 description 1
- 208000001914 Fragile X syndrome Diseases 0.000 description 1
- 201000011240 Frontotemporal dementia Diseases 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 101150094690 GAL1 gene Proteins 0.000 description 1
- 101150038242 GAL10 gene Proteins 0.000 description 1
- 208000027472 Galactosemias Diseases 0.000 description 1
- 102100028501 Galanin peptides Human genes 0.000 description 1
- 102100024637 Galectin-10 Human genes 0.000 description 1
- 102100039555 Galectin-7 Human genes 0.000 description 1
- 208000009796 Gangliosidoses Diseases 0.000 description 1
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 1
- 101000892220 Geobacillus thermodenitrificans (strain NG80-2) Long-chain-alcohol dehydrogenase 1 Proteins 0.000 description 1
- 241000699694 Gerbillinae Species 0.000 description 1
- 102000016354 Glucuronosyltransferase Human genes 0.000 description 1
- 108010092364 Glucuronosyltransferase Proteins 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 102000003886 Glycoproteins Human genes 0.000 description 1
- 108090000288 Glycoproteins Proteins 0.000 description 1
- 101710200205 Glyoxylate reductase/hydroxypyruvate reductase Proteins 0.000 description 1
- 235000009438 Gossypium Nutrition 0.000 description 1
- 244000020551 Helianthus annuus Species 0.000 description 1
- 235000003222 Helianthus annuus Nutrition 0.000 description 1
- 208000018565 Hemochromatosis Diseases 0.000 description 1
- 108010085686 Hemoglobin C Proteins 0.000 description 1
- 102100021519 Hemoglobin subunit beta Human genes 0.000 description 1
- 108091005904 Hemoglobin subunit beta Proteins 0.000 description 1
- 108090000481 Heparin Cofactor II Proteins 0.000 description 1
- 102100030500 Heparin cofactor 2 Human genes 0.000 description 1
- 208000002972 Hepatolenticular Degeneration Diseases 0.000 description 1
- 208000009889 Herpes Simplex Diseases 0.000 description 1
- 108010000487 High-Molecular-Weight Kininogen Proteins 0.000 description 1
- 241001272567 Hominoidea Species 0.000 description 1
- 101000780443 Homo sapiens Alcohol dehydrogenase 1A Proteins 0.000 description 1
- 101000752037 Homo sapiens Arginase-1 Proteins 0.000 description 1
- 101000936280 Homo sapiens Copper-transporting ATPase 2 Proteins 0.000 description 1
- 101001114650 Homo sapiens Corrinoid adenosyltransferase Proteins 0.000 description 1
- 101100121078 Homo sapiens GAL gene Proteins 0.000 description 1
- 101000608772 Homo sapiens Galectin-7 Proteins 0.000 description 1
- 101000976075 Homo sapiens Insulin Proteins 0.000 description 1
- 101000941071 Homo sapiens Lysosomal cobalamin transport escort protein LMBD1 Proteins 0.000 description 1
- 101001013648 Homo sapiens Methionine synthase Proteins 0.000 description 1
- 101001116314 Homo sapiens Methionine synthase reductase Proteins 0.000 description 1
- 101001114654 Homo sapiens Methylmalonic aciduria type A protein, mitochondrial Proteins 0.000 description 1
- 101001098982 Homo sapiens Propionyl-CoA carboxylase beta chain, mitochondrial Proteins 0.000 description 1
- 101001098868 Homo sapiens Proprotein convertase subtilisin/kexin type 9 Proteins 0.000 description 1
- 101000629622 Homo sapiens Serine-pyruvate aminotransferase Proteins 0.000 description 1
- 101000785978 Homo sapiens Sphingomyelin phosphodiesterase Proteins 0.000 description 1
- 101000800287 Homo sapiens Tubulointerstitial nephritis antigen-like Proteins 0.000 description 1
- 101000805941 Homo sapiens Usherin Proteins 0.000 description 1
- 241000209219 Hordeum Species 0.000 description 1
- 240000005979 Hordeum vulgare Species 0.000 description 1
- 235000007340 Hordeum vulgare Nutrition 0.000 description 1
- 208000023105 Huntington disease Diseases 0.000 description 1
- 208000015178 Hurler syndrome Diseases 0.000 description 1
- 208000025500 Hutchinson-Gilford progeria syndrome Diseases 0.000 description 1
- 108090001042 Hydro-Lyases Proteins 0.000 description 1
- 102000004867 Hydro-Lyases Human genes 0.000 description 1
- 206010049933 Hypophosphatasia Diseases 0.000 description 1
- 208000028547 Inborn Urea Cycle disease Diseases 0.000 description 1
- 102100023915 Insulin Human genes 0.000 description 1
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- 102100035792 Kininogen-1 Human genes 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 1
- 241000208822 Lactuca Species 0.000 description 1
- 235000003228 Lactuca sativa Nutrition 0.000 description 1
- 240000008415 Lactuca sativa Species 0.000 description 1
- 241000282838 Lama Species 0.000 description 1
- 208000008063 Langer mesomelic dysplasia Diseases 0.000 description 1
- 241000288903 Lemuridae Species 0.000 description 1
- 201000001779 Leukocyte adhesion deficiency Diseases 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 241000209510 Liliopsida Species 0.000 description 1
- 235000004431 Linum usitatissimum Nutrition 0.000 description 1
- 240000006240 Linum usitatissimum Species 0.000 description 1
- 241000209082 Lolium Species 0.000 description 1
- 235000002262 Lycopersicon Nutrition 0.000 description 1
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 1
- 208000030289 Lymphoproliferative disease Diseases 0.000 description 1
- 102100031335 Lysosomal cobalamin transport escort protein LMBD1 Human genes 0.000 description 1
- 208000015439 Lysosomal storage disease Diseases 0.000 description 1
- 241000218922 Magnoliophyta Species 0.000 description 1
- 235000011430 Malus pumila Nutrition 0.000 description 1
- 235000015103 Malus silvestris Nutrition 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 208000000916 Mandibulofacial dysostosis Diseases 0.000 description 1
- 240000003183 Manihot esculenta Species 0.000 description 1
- 208000001826 Marfan syndrome Diseases 0.000 description 1
- 108091027974 Mature messenger RNA Proteins 0.000 description 1
- 206010027145 Melanocytic naevus Diseases 0.000 description 1
- 108010049137 Member 1 Subfamily D ATP Binding Cassette Transporter Proteins 0.000 description 1
- 102100031551 Methionine synthase Human genes 0.000 description 1
- 102100024614 Methionine synthase reductase Human genes 0.000 description 1
- 102100023377 Methylmalonic aciduria type A protein, mitochondrial Human genes 0.000 description 1
- 108010058682 Mitochondrial Proteins Proteins 0.000 description 1
- 102000006404 Mitochondrial Proteins Human genes 0.000 description 1
- 201000002983 Mobius syndrome Diseases 0.000 description 1
- 208000034167 Moebius syndrome Diseases 0.000 description 1
- 208000001804 Monosomy 5p Diseases 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 241000282339 Mustela Species 0.000 description 1
- 208000000175 Nail-Patella Syndrome Diseases 0.000 description 1
- 208000009905 Neurofibromatoses Diseases 0.000 description 1
- 208000007256 Nevus Diseases 0.000 description 1
- 241000208125 Nicotiana Species 0.000 description 1
- 241001233986 Orychophragmus Species 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 206010031243 Osteogenesis imperfecta Diseases 0.000 description 1
- 241000282579 Pan Species 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 241000218196 Persea Species 0.000 description 1
- 240000007377 Petunia x hybrida Species 0.000 description 1
- 241000219833 Phaseolus Species 0.000 description 1
- 101710178747 Phosphatidate cytidylyltransferase 1 Proteins 0.000 description 1
- 101710178746 Phosphatidate cytidylyltransferase 2 Proteins 0.000 description 1
- 102100033126 Phosphatidate cytidylyltransferase 2 Human genes 0.000 description 1
- 244000082204 Phyllostachys viridis Species 0.000 description 1
- 235000015334 Phyllostachys viridis Nutrition 0.000 description 1
- 241000218657 Picea Species 0.000 description 1
- 208000000609 Pick Disease of the Brain Diseases 0.000 description 1
- 208000024571 Pick disease Diseases 0.000 description 1
- 241000758706 Piperaceae Species 0.000 description 1
- 241000219843 Pisum Species 0.000 description 1
- 108090000113 Plasma Kallikrein Proteins 0.000 description 1
- 206010035226 Plasma cell myeloma Diseases 0.000 description 1
- 102000013566 Plasminogen Human genes 0.000 description 1
- 108010051456 Plasminogen Proteins 0.000 description 1
- 108010022233 Plasminogen Activator Inhibitor 1 Proteins 0.000 description 1
- 108090000614 Plasminogen Activator Inhibitor 2 Proteins 0.000 description 1
- 102100039418 Plasminogen activator inhibitor 1 Human genes 0.000 description 1
- 102100039419 Plasminogen activator inhibitor 2 Human genes 0.000 description 1
- 235000016067 Polianthes tuberosa Nutrition 0.000 description 1
- 244000014047 Polianthes tuberosa Species 0.000 description 1
- 241000219000 Populus Species 0.000 description 1
- 241000097929 Porphyria Species 0.000 description 1
- 208000010642 Porphyrias Diseases 0.000 description 1
- 201000010769 Prader-Willi syndrome Diseases 0.000 description 1
- 208000007932 Progeria Diseases 0.000 description 1
- 102100039025 Propionyl-CoA carboxylase beta chain, mitochondrial Human genes 0.000 description 1
- 102100038955 Proprotein convertase subtilisin/kexin type 9 Human genes 0.000 description 1
- 229940124158 Protease/peptidase inhibitor Drugs 0.000 description 1
- 101800004937 Protein C Proteins 0.000 description 1
- 102000017975 Protein C Human genes 0.000 description 1
- 229940096437 Protein S Drugs 0.000 description 1
- 108010066124 Protein S Proteins 0.000 description 1
- 102000029301 Protein S Human genes 0.000 description 1
- 208000007531 Proteus syndrome Diseases 0.000 description 1
- 108010094028 Prothrombin Proteins 0.000 description 1
- 102100027378 Prothrombin Human genes 0.000 description 1
- 241000125945 Protoparvovirus Species 0.000 description 1
- 235000011432 Prunus Nutrition 0.000 description 1
- 235000014443 Pyrus communis Nutrition 0.000 description 1
- 241000220259 Raphanus Species 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 201000000582 Retinoblastoma Diseases 0.000 description 1
- 208000006289 Rett Syndrome Diseases 0.000 description 1
- 101001030849 Rhinella marina Mesotocin receptor Proteins 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- 241000220317 Rosa Species 0.000 description 1
- 206010039281 Rubinstein-Taybi syndrome Diseases 0.000 description 1
- 108091006418 SLC25A13 Proteins 0.000 description 1
- 240000000111 Saccharum officinarum Species 0.000 description 1
- 235000007201 Saccharum officinarum Nutrition 0.000 description 1
- 241000288961 Saguinus imperator Species 0.000 description 1
- 101800001700 Saposin-D Proteins 0.000 description 1
- 208000034189 Sclerosis Diseases 0.000 description 1
- 241001478233 Scytonema hofmannii Species 0.000 description 1
- 241000209056 Secale Species 0.000 description 1
- 102100031075 Serine/threonine-protein kinase Chk2 Human genes 0.000 description 1
- 241000700584 Simplexvirus Species 0.000 description 1
- 201000001388 Smith-Magenis syndrome Diseases 0.000 description 1
- 241000207763 Solanum Species 0.000 description 1
- 235000002634 Solanum Nutrition 0.000 description 1
- 241001291279 Solanum galapagense Species 0.000 description 1
- 235000002597 Solanum melongena Nutrition 0.000 description 1
- 244000061458 Solanum melongena Species 0.000 description 1
- 235000011684 Sorghum saccharatum Nutrition 0.000 description 1
- 108010061312 Sphingomyelin Phosphodiesterase Proteins 0.000 description 1
- 102100026263 Sphingomyelin phosphodiesterase Human genes 0.000 description 1
- 235000009337 Spinacia oleracea Nutrition 0.000 description 1
- 244000300264 Spinacia oleracea Species 0.000 description 1
- 208000027077 Stickler syndrome Diseases 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 210000001744 T-lymphocyte Anatomy 0.000 description 1
- 238000010459 TALEN Methods 0.000 description 1
- 102000003627 TRPC1 Human genes 0.000 description 1
- 102000003622 TRPC4 Human genes 0.000 description 1
- 208000002903 Thalassemia Diseases 0.000 description 1
- 108010000499 Thromboplastin Proteins 0.000 description 1
- 102000002262 Thromboplastin Human genes 0.000 description 1
- 102000003978 Tissue Plasminogen Activator Human genes 0.000 description 1
- 108090000373 Tissue Plasminogen Activator Proteins 0.000 description 1
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 1
- 108010073062 Transcription Activator-Like Effectors Proteins 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 108700029229 Transcriptional Regulatory Elements Proteins 0.000 description 1
- 201000003199 Treacher Collins syndrome Diseases 0.000 description 1
- 208000037280 Trisomy Diseases 0.000 description 1
- 241000209140 Triticum Species 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 240000000359 Triticum dicoccon Species 0.000 description 1
- 208000026928 Turner syndrome Diseases 0.000 description 1
- 241000196252 Ulva Species 0.000 description 1
- 102000003990 Urokinase-type plasminogen activator Human genes 0.000 description 1
- 108090000435 Urokinase-type plasminogen activator Proteins 0.000 description 1
- 208000014769 Usher Syndromes Diseases 0.000 description 1
- 102100037930 Usherin Human genes 0.000 description 1
- 241001416177 Vicugna pacos Species 0.000 description 1
- 241000219977 Vigna Species 0.000 description 1
- 235000009392 Vitis Nutrition 0.000 description 1
- 241000219095 Vitis Species 0.000 description 1
- 208000027276 Von Willebrand disease Diseases 0.000 description 1
- 208000026724 Waardenburg syndrome Diseases 0.000 description 1
- 206010049644 Williams syndrome Diseases 0.000 description 1
- 208000018839 Wilson disease Diseases 0.000 description 1
- 208000006110 Wiskott-Aldrich syndrome Diseases 0.000 description 1
- 206010068348 X-linked lymphoproliferative syndrome Diseases 0.000 description 1
- 241000209149 Zea Species 0.000 description 1
- 240000008042 Zea mays Species 0.000 description 1
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 1
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 1
- 208000008919 achondroplasia Diseases 0.000 description 1
- 201000000761 achromatopsia Diseases 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 102000010126 acid sphingomyelin phosphodiesterase activity proteins Human genes 0.000 description 1
- 201000009628 adenosine deaminase deficiency Diseases 0.000 description 1
- 210000004504 adult stem cell Anatomy 0.000 description 1
- 244000193174 agave Species 0.000 description 1
- 229930013930 alkaloid Natural products 0.000 description 1
- 208000006682 alpha 1-Antitrypsin Deficiency Diseases 0.000 description 1
- 201000006288 alpha thalassemia Diseases 0.000 description 1
- 102000003801 alpha-2-Antiplasmin Human genes 0.000 description 1
- 108090000183 alpha-2-Antiplasmin Proteins 0.000 description 1
- 102000016679 alpha-Glucosidases Human genes 0.000 description 1
- 108010028144 alpha-Glucosidases Proteins 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 238000010171 animal model Methods 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 229960005348 antithrombin iii Drugs 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 229940009098 aspartate Drugs 0.000 description 1
- 208000036556 autosomal recessive T cell-negative B cell-negative NK cell-negative due to adenosine deaminase deficiency severe combined immunodeficiency Diseases 0.000 description 1
- 239000011425 bamboo Substances 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 208000002352 blister Diseases 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 239000001390 capsicum minimum Substances 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 229910002091 carbon monoxide Inorganic materials 0.000 description 1
- 229920006317 cationic polymer Polymers 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000032823 cell division Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000007073 chemical hydrolysis Effects 0.000 description 1
- 210000003763 chloroplast Anatomy 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 235000020971 citrus fruits Nutrition 0.000 description 1
- 201000007254 color blindness Diseases 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 235000005822 corn Nutrition 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 238000002716 delivery method Methods 0.000 description 1
- 239000000412 dendrimer Substances 0.000 description 1
- 229920000736 dendritic polymer Polymers 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 206010012601 diabetes mellitus Diseases 0.000 description 1
- 235000014113 dietary fatty acids Nutrition 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- 235000004879 dioscorea Nutrition 0.000 description 1
- 208000002169 ectodermal dysplasia Diseases 0.000 description 1
- 208000031068 ectodermal dysplasia syndrome Diseases 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000007071 enzymatic hydrolysis Effects 0.000 description 1
- 238000006047 enzymatic hydrolysis reaction Methods 0.000 description 1
- 229940088598 enzyme Drugs 0.000 description 1
- 241001233957 eudicotyledons Species 0.000 description 1
- 229940012413 factor vii Drugs 0.000 description 1
- 229940012426 factor x Drugs 0.000 description 1
- 229940012444 factor xiii Drugs 0.000 description 1
- 229930195729 fatty acid Natural products 0.000 description 1
- 239000000194 fatty acid Substances 0.000 description 1
- 150000004665 fatty acids Chemical class 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 229940012952 fibrinogen Drugs 0.000 description 1
- 239000004459 forage Substances 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 239000000499 gel Substances 0.000 description 1
- 238000010363 gene targeting Methods 0.000 description 1
- 229930195712 glutamate Natural products 0.000 description 1
- 150000004676 glycans Chemical class 0.000 description 1
- 229910001385 heavy metal Inorganic materials 0.000 description 1
- 210000003958 hematopoietic stem cell Anatomy 0.000 description 1
- 208000034737 hemoglobinopathy Diseases 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 238000006460 hydrolysis reaction Methods 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 208000018337 inherited hemoglobinopathy Diseases 0.000 description 1
- 239000003999 initiator Substances 0.000 description 1
- 239000012212 insulator Substances 0.000 description 1
- 210000003292 kidney cell Anatomy 0.000 description 1
- 208000036546 leukodystrophy Diseases 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 208000004731 long QT syndrome Diseases 0.000 description 1
- 230000004777 loss-of-function mutation Effects 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 235000005739 manihot Nutrition 0.000 description 1
- 241001515942 marmosets Species 0.000 description 1
- 210000002901 mesenchymal stem cell Anatomy 0.000 description 1
- MYWUZJCMWCOHBA-VIFPVBQESA-N methamphetamine Chemical compound CN[C@@H](C)CC1=CC=CC=C1 MYWUZJCMWCOHBA-VIFPVBQESA-N 0.000 description 1
- 235000019713 millet Nutrition 0.000 description 1
- 210000003470 mitochondria Anatomy 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- VYQNWZOUAUKGHI-UHFFFAOYSA-N monobenzone Chemical compound C1=CC(O)=CC=C1OCC1=CC=CC=C1 VYQNWZOUAUKGHI-UHFFFAOYSA-N 0.000 description 1
- 208000005340 mucopolysaccharidosis III Diseases 0.000 description 1
- 208000011045 mucopolysaccharidosis type 3 Diseases 0.000 description 1
- 201000000050 myeloid neoplasm Diseases 0.000 description 1
- 239000002105 nanoparticle Substances 0.000 description 1
- 230000002988 nephrogenic effect Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 201000004931 neurofibromatosis Diseases 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 210000000287 oocyte Anatomy 0.000 description 1
- 210000003463 organelle Anatomy 0.000 description 1
- 210000001672 ovary Anatomy 0.000 description 1
- 230000035515 penetration Effects 0.000 description 1
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 210000005259 peripheral blood Anatomy 0.000 description 1
- 239000011886 peripheral blood Substances 0.000 description 1
- 150000002989 phenols Chemical class 0.000 description 1
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 1
- 208000030761 polycystic kidney disease Diseases 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 235000012015 potatoes Nutrition 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 229960000856 protein c Drugs 0.000 description 1
- 229940039716 prothrombin Drugs 0.000 description 1
- 235000014774 prunus Nutrition 0.000 description 1
- 235000015136 pumpkin Nutrition 0.000 description 1
- 102000005912 ran GTP Binding Protein Human genes 0.000 description 1
- 102000037983 regulatory factors Human genes 0.000 description 1
- 108091008025 regulatory factors Proteins 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000001177 retroviral effect Effects 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 108010060800 serine-pyruvate aminotransferase Proteins 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 206010043554 thrombocytopenia Diseases 0.000 description 1
- 229960000187 tissue plasminogen activator Drugs 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- 208000030954 urea cycle disease Diseases 0.000 description 1
- 229960005356 urokinase Drugs 0.000 description 1
- 239000003981 vehicle Substances 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
- 108091023044 voltage-gated calcium channel activity Proteins 0.000 description 1
- 102000038650 voltage-gated calcium channel activity Human genes 0.000 description 1
- 108010047303 von Willebrand Factor Proteins 0.000 description 1
- 208000012137 von Willebrand disease (hereditary or acquired) Diseases 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
- C12N15/864—Parvoviral vectors, e.g. parvovirus, densovirus
- C12N15/8645—Adeno-associated virus
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
- C12N15/907—Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2320/00—Applications; Uses
- C12N2320/30—Special therapeutic applications
- C12N2320/34—Allele or polymorphism specific uses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
- C12N2750/14143—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/80—Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2840/00—Vectors comprising a special translation-regulating system
- C12N2840/44—Vectors comprising a special translation-regulating system being a specific part of the splice mechanism, e.g. donor, acceptor
Landscapes
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Mycology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Virology (AREA)
- Cell Biology (AREA)
- Medicinal Chemistry (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
MÉTODOS PARA INSERÇÃO DIRIGIDA DE DNA EM GENES. Métodos e composições para modificar a sequência de codificação de genes endógenos usando endonucleases de corte raro e transposases. Os métodos e composições descritos neste documento podem ser usados para modificar a sequência de codificação de genes endógenos.
Description
[001] Este pedido reivindica o benefício de pedidos previamente depositados e copendentes USSN 62/746.497 depositado em 16 de outubro de 2018, USSN 62/830.654 depositado em 8 de abril de 2019 e ETSSN 62/864.432 depositado em 20 de junho de 2019, cujos teores estão incorporados neste documento a título de referência em sua totalidade.
[002] O presente pedido contém uma Listagem de Sequência que foi submetida em formato ASCII por meio de EFS-Web e está por meio disso incorporada por referência em sua totalidade. A dita cópia ASCII, criada em 14 de outubro de 2019, é denominada SEQUENCE_LISTING_BA2018- 4WO_Pl2987WOOO.txt e tem 517.036 bytes de tamanho.
[003] O presente documento está no campo de edição de genoma. Mais especificamente, este documento se refere a modificação direcionada de genes endógenos usando endonucleases de corte raro ou transposases.
[004] Distúrbios monogênicos são causados por uma ou mais mutações em um único gene, exemplos dos quais incluem doença da célula falciforme (gene beta-hemoglobina), fibrose cística (gene regulador de condutância transmembranar de fibrose cística), e doença de Tay-Sachs (gene beta- hexosaminidase A). Distúrbios monogênicos têm sido um interesse para terapia genética, já que substituição do gene defeituoso com uma cópia funcional poderia fornecer benefícios terapêuticos. Entretanto, um estrangulamento para gerar terapias eficazes inclui o tamanho da cópia funcional do gene. Muitos métodos de distribuição, incluindo aqueles que usam vírus, têm limitações tamanho que impedem a distribuição de grandes transgenes. Além disso, muitos genes têm padrões de splicing alternativos que resultam em um único gene que codifica para múltiplas proteínas. Métodos para corrigir regiões parciais de um gene defeituoso podem fornecer um meio alternativo para tratar distúrbios monogênicos.
[005] Edição de gene constitui uma promessa para corrigir mutações observadas em distúrbios genéticos; entretanto, muitos desafios permanecem para criar terapias eficazes para distúrbios individuais, incluindo aqueles que são causados por mutações de ganho de função, ou onde reparo preciso é necessário. Esses desafios são vistos com distúrbios tais como ataxia espinocerebelar 3 e ataxia espinocerebelar 6, em que o distúrbio é causado por mutações de ganho de função (repetição de trinucleotídeo expandido) na extremidade 3’ dos genes.
[006] Os métodos descritos neste documento fornecem abordagens inéditas para corrigir mutações encontradas na extremidade 3’ dos genes. A divulgação neste documento é baseada pelo menos em parte no projeto de transgenes bimódulos compatíveis com integração através de múltiplas vias de reparo. Os transgenes descritos neste documento podem ser integrados nos genes pela via de recombinação homóloga, da via de junção de extremidade não homóloga, ou tanto da via de junção de recombinação homóloga quanto da extremidade não homóloga, ou através de transposição. Além disso, o resultado de integração em qualquer caso (HR, NHEJ direta, NHEJ reverso; transposição direta, ou transposição reversa) pode resultar em correção/alteração precisa do produto da proteína do gene alvo. Os transgenes descritos neste documento podem ser usados para fixar ou introduzir mutações na região 3’ dos genes de interesse. Métodos são particularmente úteis em casos onde edição precisa dos genes é necessária, ou onde o gene endógeno mutado sendo direcionado não pode ser ‘substituído’ por uma cópia sintética em virtude de exceder a capacidade de tamanho de vetores padrões ou vetores virais. Os métodos descritos neste documento podem ser usados para pesquisa aplicada (por exemplo, terapia genética) ou pesquisa básica (por exemplo, criação de modelos animais, ou compreensão da função genética).
[007] Os métodos descritos neste documento são compatíveis com veículos de distribuição in vivo atuais (por exemplo, vetor viral adenoassociado e nanopartículas de lipídio), e eles abordam diversos desafios com obtenção de alteração precisa de produtos genéticos.
[008] Em uma modalidade, este documento caracteriza um método para integrar um transgene dentro de um gene endógeno. O método pode incluir distribuição de um transgene, onde o transgene aloja uma primeira e segunda sequência aceptora de splice, uma primeira e segunda sequência de codificação parcial, e um primeiro e segundo terminador. Em algumas modalidades, os primeiro e segundo terminadores podem ser substituídos com um único terminador bidirecional. O método adicional inclui administrar uma ou mais endonucleases de corte raro direcionadas para um sítio dentro do gene endógeno, onde o transgene é então integrado dentro do gene endógeno. O transgene pode ser direcionado para um sítio dentro de um íntron ou em uma junção do íntron-éxon. As primeira e segunda sequências de codificação parciais podem ser orientadas em uma orientação cauda-a-cauda, de maneira tal que integração do transgene em qualquer direção (isto é, direta ou reversa) por NHEJ pode resultar em alteração precisa do produto da proteína do gene. Em outras modalidades, o transgene pode incluir um braço de homologia esquerdo e direito para permitir integração por HR. Esses transgenes podem ser alojados em um vetor viral adenoassociado (AAV), em que o transgene pode ser integrado por meio de HR (através dos braços de homologia) ou por direção direta de NHEJ ou direção reversa de NHEJ (através de integração direta do vetor AAV em uma quebra de fita dupla direcionada). Em uma modalidade, vetores com uma primeira e segunda sequência de codificação e um braço de homologia esquerdo e direito pode incluir adicionalmente um primeiro e segundo sítios para clivagem por uma ou mais endonucleases de corte raro. Clivagem por uma ou mais endonucleases de corte raro pode resultar em liberação de um transgene linear com braços de homologia, capaz de integrar no genoma através de HR ou NHEJ. Em uma outra modalidade, vetores com uma primeira e segunda sequência de codificação podem ser flanqueados por um primeiro e segundo sítios para clivagem por uma ou mais endonucleases de corte raro. Clivagem por uma ou mais endonucleases de corte raro pode resultar em liberação de um transgene linear, capaz de integrar no genoma através de NHEJ. Em uma outra modalidade, vetores com uma primeira e segunda sequência de codificação podem ser flanqueados por uma extremidade de transposon esquerda e direita. Distribuição de uma transposase associado a CRISPR (por exemplo, Cas6/7/8 junto com TniQ, TnsA, TnsB, e TnsC) pode resultar em integração do transgene através de transposição.
[009] Os métodos podem ser usados para alterar o terminal C de proteínas produzidas por genes endógenos. Em algumas modalidades, o gene endógeno pode incluir o gene ATXN3 ou gene CACNA1A. ATXN3 é um gene que codifica a enzima ataxina-3. Ataxina-3 é um membro no sistema ubiquitina- proteassoma que facilita a destruição de proteínas em excesso ou danificadas. Ataxia espinocerebelar tipo 3 é um distúrbio genético causado por uma expansão da repetição de trinucleotídeo na extremidade 3’ do gene ATXN3. CACNA1A é um gene que codifica proteínas envolvidas na formação de canais de cálcio. Ataxia espinocerebelar tipo 6 é um distúrbio genético causado por mutações no gene CACNA1A. As mutações que causam SCA6 incluem uma expansão da repetição de trinucleotídeo na extremidade 3’ do gene CACNA1A. Em algumas modalidades, os métodos fornecidos neste documento podem ser usados para alterar a extremidade 3’ do gene ATXN3 ou gene CACNA1A endógeno. Em modalidades específicas, o alvo para integração dos transgenes descritos neste documento podem ser íntron 9 do gene ATXN3 ou íntron 46 do gene CACNA1A.
[0010] A menos que de outra forma definida, todos os termos técnicos e científicos usados neste documento têm o mesmo significado comumente entendido por um versado na técnica ao qual essa invenção pertence. Embora os métodos e materiais semelhantes ou equivalentes aos descritos neste documento possam ser usados para praticar a invenção, métodos e materiais adequados são descritos abaixo. Todas as publicações, pedidos de patente, patentes, e outras referências mencionadas neste documento estão incorporados por referência em sua totalidade para todos os propósitos. Em caso de conflito, o presente relatório descritivo, incluindo definições, prevalecerá. Além do mais os materiais, métodos, e exemplos são apenas ilustrativos e não destinados a ser limitativos.
[0011] Os detalhes de uma ou mais modalidades da invenção são apresentados na descrição abaixo. Outras características, objetivos, e vantagens da invenção ficarão aparentes a partir da descrição e das reivindicações.
[0012] A FIG. 1 é uma ilustração dos transgenes para a inserção direcionada em genes endógenos. TS1, sítio alvo 1; SA1, sítio aceptor de splice 1, CDS1, sequência de codificação 1; Tl, terminador 1, TS2, sítio alvo 2; SA2,
sítio aceptor de splice 2, CDS2, sequência de codificação 2; T2, terminador 2; HA1, braço de homologia 1; HA2, braço de homologia 2; BT1, terminador bidirecional 1; AS1, sequência adicional 1; AS2, sequência adicional 2.
[0013] FIG. 2 é uma ilustração mostrando integração de um transgene em um gene exemplificativo. O transgene compreende dois sítios alvos para uma ou mais endonucleases de corte raro, duas sequências aceptoras de splice, duas sequências de codificação (3.1 e 3.2) e dois terminadores (T). Integração se dá através de união de extremidade não homóloga (NHEJ).
[0014] A FIG. 3 é uma ilustração mostrando integração de um transgene em um gene exemplificativo. O transgene compreende dois braços de homologia, dois sítios alvos para uma ou mais endonucleases de corte raro, duas sequências aceptoras de splice, duas sequências de codificação (3.1 e 3.2) e dois terminadores. Integração se dá tanto através de recombinação homóloga (HR) quanto da união de extremidade não homóloga (NHEJ).
[0015] A FIG. 4 é uma ilustração de éxon 46, íntron 46 e íntron 47 do gene CACNA1A. É também mostrado o transgene pB101 1-D1 para integração no gene CACNA1A.
[0016] A FIG. 5 é uma ilustração dos resultados de integração para o transgene pB101 1-D1 no gene CACNA1A.
[0017] A FIG. 6 é uma ilustração de éxon 9, íntron 9, éxon 10, íntron 10 e éxon 11 do gene ATXN3. É também mostrado o transgene pBl0l2-D1 para integração no gene ATXN3.
[0018] A FIG. 7 é uma ilustração dos resultados de integração para o transgene pBl0l2-D1 no gene ATXN3.
[0019] A FIG. 8 são imagens de géis detectando integração de transgenes no gene ATXN3. 1, ladder 100 bp com faixa de cima correndo a 1.517 bp; 2, junção 5’ de pBAH35; 3, junção 5’ de pBAH36; 4, junção 5’ de pBAH37; 5,
junção 3’ de pBAH35; 6, junção 3’ de pBAH36; 7, junção 3’ de pBA1137; 8, ladder 1kb com faixas mais escuras correndo a 500 bp, 1.000 bp e 3.000 bp; 9, ladder 1kb com faixas mais escuras correndo a 500 bp, 1.000 bp e 3.000 bp; 10, junção 5’ invertida de pBA1135; 11, ladder 1kb com faixas mais escuras correndo a 500 bp, 1.000 bp e 3.000 bp; 12, junção 5’ invertida de pBA1136; 13, ladder 1kb com faixas mais escuras correndo a 500 bp, 1.000 bp e 3.000 bp; 14; par iniciador oNJB156+oNJB113; 15, par iniciador 114+162; 16, par iniciador oNJB1 I6+0NJBI 13; 17, par iniciador oNJB114+oNJB170; 18, par iniciador oNJB1 67+oNJB 170; 19, ladder 100 bp com a faixa escura correndo a 500 bp; 20, DNA genômico a partir de transfecção com pBA1135 e nuclease; 21, DNA genômico a partir de transfecção com pBA1136 e nuclease; 22, DNA genômico a partir de transfecção com pBA1137 e nuclease; 23, DNA genômico a partir de transfecção com água; 24, DNA sem controle.
[0020] Métodos e composições para modificar a sequência de codificação dos genes endógenos são divulgados neste documento. Em algumas modalidades, os métodos incluem inserir um transgene em um gene endógeno, em que o transgene fornece uma sequência de codificação parcial que é usada em substituição a sequência de codificação do gene endógeno.
[0021] Em uma modalidade, este documento caracteriza um método de integrar um transgene em um gene endógeno, o método incluindo administrar um transgene, em que o transgene compreende uma primeira e segunda sequência aceptora de splice, uma primeira e segunda sequência de codificação parcial, e um terminador bidirecional ou um primeiro e segundo terminador, e administrar uma ou mais endonuclease de corte raro direcionada para um sítio dentro do gene endógeno, em que o transgene é integrado dentro do gene endógeno. O método pode incluir projetar o transgene para ter o primeiro aceptor de splice operacionalmente ligado à primeira sequência de codificação parcial e o segundo aceptor de splice operacionalmente ligado à segunda sequência de codificação parcial.
O arranjo pode também incluir ter a primeira sequência de codificação parcial operacionalmente ligada ao primeiro terminador, e a segunda sequência de codificação parcial operacionalmente ligada ao segundo terminador.
Em uma modalidade, os dois terminadores podem ser substituídos com um único terminador bidirecional.
Em uma modalidade, transgenes com primeiro e segundo aceptores de splice, primeira e segunda sequências de codificação parciais, e primeiro e segundo terminadores podem ser orientados em uma orientação cauda-a-cauda.
Os transgenes com uma orientação cauda-a-cauda de sequências podem compreender ainda um primeiro e segundo sítios alvos para uma ou mais endonucleases de corte raro, em que os sítios alvos flanqueiam os primeiro e segundo aceptores de splice.
Em uma outra modalidade, os transgenes podem compreender um braço de homologia esquerdo e direito que flanqueia os primeiro e segundo aceptores de splice.
Nesta modalidade, o transgene pode ser alojado dentro de um vetor viral adenoassociado.
Em uma outra modalidade, o transgene pode compreender ainda um primeiro e segundo sítios alvos para uma ou mais endonucleases de corte raro, em que os sítios alvos flanqueiam os primeiro e segundo aceptores de splice.
Os primeiro e segundo sítios alvos podem flanquear os primeiro e segundo braços de homologia.
Em modalidades, os transgenes descritos neste documento podem ser integrados dentro de um íntron do gene endógeno ou em uma junção do íntron-éxon.
Os transgenes podem ser integrados dentro de um íntron, ou na junção do íntron-éxon do gene ATXN3 ou gene CACNA1A.
O transgene pode compreender uma primeira e segunda sequência de codificação parcial que codifica o peptídeo produzido pelo éxon 10 de um gene ATXN3 não patogênico e pode ser direcionado para o íntron 9, ou a junção do íntron 9 éxon 10, de um gene ATXN3 patogênico. O transgene pode compreender uma primeira e segunda sequência de codificação parcial que codifica o peptídeo produzido pelo éxon 47 de um gene CACNA1A não patogênico e pode ser direcionado para o íntron 46, ou a junção do íntron 46 éxon 47, de um gene CACNA1A patogênico. Em certas modalidades, a endonuclease de corte raro pode ser uma nuclease CRISPR/Cas12a ou uma nuclease CRISPR/Cas9. As primeira e segunda sequências de codificação parciais codificam os mesmos aminoácidos. Em uma modalidade, as primeira e segunda sequências de codificação podem diferir em sequência de ácido nucleico, mas codificam os mesmos aminoácidos. O transgene pode ser abrigado em um vetor, em que o formato do vetor é selecionado a partir de DNA linear de fita dupla, DNA circular de fita dupla, ou um vetor viral. O vetor viral pode incluir um vetor de adenovírus, um vetor viral adenoassociado, ou um vetor de lentivírus. Os métodos descritos neste documento podem ser usados com um transgene igual ou menor que 4,7 kb. O transgene pode compreender uma primeira e segunda sequência de codificação parcial que codifica um peptídeo parcial de uma proteína funcional produzida pelo gene endógeno alvo. O gene endógeno alvo pode ser aberrante.
[0022] Em uma outra modalidade, este documento fornece polinucleotídeos de DNA com uma primeira e segunda sequência aceptora de splice, uma primeira e segunda sequência de codificação parcial, um terminador bidirecional ou um primeiro e segundo terminador, opcionalmente, um primeiro e segundo braço de homologia, e, opcionalmente, um primeiro e segundo sítio alvo de endonuclease de corte raro. Os polinucleotídeos de DNA podem incluir um projeto tendo o primeiro aceptor de splice operacionalmente ligado à primeira sequência de codificação parcial e o segundo aceptor de splice operacionalmente ligado à segunda sequência de codificação.
O arranjo pode também incluir ter a primeira sequência de codificação parcial operacionalmente ligada ao primeiro terminador, e a segunda sequência de codificação parcial operacionalmente ligada ao segundo terminador.
Em uma modalidade, os dois terminadores podem ser substituídos com um único terminador bidirecional.
Em uma modalidade, polinucleotídeos de DNA com primeiro e segundo aceptores de splice, primeira e segunda sequências de codificação, e primeiro e segundo terminadores podem ser orientados em uma orientação cauda-a-cauda.
Os polinucleotídeos de DNA com uma orientação cauda-a-cauda de sequências podem compreender ainda um primeiro e segundo sítios alvos para uma ou mais endonucleases de corte raro, em que os sítios alvos flanqueiam os primeiro e segundo aceptores de splice.
Em uma outra modalidade, os polinucleotídeos de DNA podem compreender um braço de homologia esquerdo e direito que flanqueia os primeiro e segundo aceptores de splice.
Nesta modalidade, o polinucleotídeo de DNA pode ser alojado dentro de um vetor viral adenoassociado.
Em uma outra modalidade, os polinucleotídeos de DNA podem compreender ainda um primeiro e segundo sítios alvos para uma ou mais endonucleases de corte raro, em que os sítios alvos flanqueiam os primeiro e segundo aceptores de splice.
Os primeiro e segundo sítios alvos podem flanquear os primeiro e segundo braços de homologia.
Em modalidades, os polinucleotídeos de DNA descritos neste documento podem ser integrados dentro de um íntron do gene endógeno ou em uma junção do íntron-éxon.
Os polinucleotídeos de DNA podem ser integrados dentro de um íntron, ou na junção do íntron-éxon do gene ATXN3 ou gene CACNA1A.
O polinucleotídeo de DNA pode compreender uma primeira e segunda sequência de codificação parcial que codifica o peptídeo produzido pelo éxon 10 de um gene ATXN3 não patogênico.
O polinucleotídeo de DNA pode compreender uma primeira e segunda sequência de codificação parcial que codifica o peptídeo produzido pelo éxon 47 de um gene CACNA1A não patogênico. As primeira e segunda sequências de codificação parciais codificam os mesmos aminoácidos. Em uma modalidade, as primeira e segunda sequências de codificação podem diferir em sequência de ácido nucleico, mas codificam os mesmos aminoácidos. Os polinucleotídeos de DNA podem ser abrigados em um vetor, em que o formato do vetor é selecionado a partir de DNA linear de fita dupla, DNA circular de fita dupla, ou um vetor viral. O vetor viral pode ser selecionado a partir de um vetor de adenovírus, um vetor viral adenoassociado, ou um vetor de lentivírus. Os polinucleotídeos de DNA descritos neste documento podem ser iguais ou menores que 4,7 kb.
[0023] Em uma modalidade, este documento caracteriza um método para integrar um transgene em um gene endógeno, o método incluindo administrar um transgene, em que o transgene compreende uma extremidade de transposon esquerda e direita, uma primeira e segunda sequência aceptora de splice, uma primeira e segunda sequência de codificação parcial, e um terminador bidirecional ou um primeiro e segundo terminador, e administrar uma transposase direcionado para o gene endógeno, onde o transgene é integrado no gene endógeno. O método pode incluir projetar o transgene para ter o primeiro aceptor de splice operacionalmente ligado à primeira sequência de codificação parcial e o segundo aceptor de splice operacionalmente ligado à segunda sequência de codificação. O arranjo pode também incluir ter a primeira sequência de codificação parcial operacionalmente ligada ao primeiro terminador, e a segunda sequência de codificação parcial operacionalmente ligada ao segundo terminador. Em uma modalidade, os dois terminadores podem ser substituídos com um único terminador bidirecional. Em uma modalidade, transgenes com primeiro e segundo aceptores de splice, primeira e segunda sequências de codificação, e primeiro e segundo terminadores podem ser orientados em uma orientação cauda-a-cauda.
Os transgenes com uma orientação cauda-a-cauda de sequências podem compreender ainda uma extremidade de transposon esquerda e direita flanqueado os primeiro e segundo aceptores de splice.
Em modalidades, os transgenes descritos neste documento podem ser integrados dentro de um íntron do gene endógeno ou em uma junção do íntron-éxon.
Os transgenes podem ser integrados dentro de um íntron, ou na junção do íntron-éxon do gene ATXN3 ou gene CACNA1A.
O transgene pode compreender uma primeira e segunda sequência de codificação parcial que codifica o peptídeo produzido pelo éxon 10 de um gene ATXN3 não patogênico e pode ser direcionado para o íntron 9, ou a junção do íntron 9 éxon 10, de um gene ATXN3 patogênico.
O transgene pode compreender uma primeira e segunda sequência de codificação parcial que codifica o peptídeo produzido pelo éxon 47 de um gene CACNA1A não patogênico e pode ser direcionado para o íntron 46, ou a junção do íntron 46 éxon 47, de um gene CACNA1A patogênico.
A transposase pode ser uma transposase CRISPR, onde a transposase CRISPR compreende a proteína Cas12k ou Cas6. As primeira e segunda sequências de codificação parciais codificam os mesmos aminoácidos.
Em uma modalidade, as primeira e segunda sequências de codificação podem diferir em sequência de ácido nucleico, mas codificam os mesmos aminoácidos.
O transgene pode ser abrigado em um vetor, em que o formato do vetor é selecionado a partir de DNA linear de fita dupla, DNA circular de fita dupla, ou um vetor viral.
O vetor viral iscan inclui um vetor de adenovírus, um vetor viral adenoassociado, ou um vetor de lentivírus.
Os métodos descritos neste documento podem ser usados com um transgene igual ou menor que 4,7 kb.
A extremidade esquerda pode compreender a sequência mostrada em SEQ ID NO:41, e a extremidade direita pode compreender a sequência mostrada em SEQ ID NO: 13.
[0024] Em uma outra modalidade, este documento fornece polinucleotídeos de DNA com uma primeira e segunda sequência aceptora de splice, uma primeira e segunda sequência de codificação parcial, um terminador bidirecional ou um primeiro e segundo terminador, e uma extremidade de transposon esquerda e direita. Os polinucleotídeos de DNA podem incluir um projeto tendo o primeiro aceptor de splice operacionalmente ligado à primeira sequência de codificação parcial e o segundo aceptor de splice operacionalmente ligado à segunda sequência de codificação. O arranjo pode também incluir ter a primeira sequência de codificação parcial operacionalmente ligada ao primeiro terminador, e a segunda sequência de codificação parcial operacionalmente ligada ao segundo terminador. Em uma modalidade, os dois terminadores podem ser substituídos com um único terminador bidirecional. Em uma modalidade, polinucleotídeos de DNA com primeiro e segundo aceptores de splice, primeira e segunda sequências de codificação, e primeiro e segundo terminadores podem ser orientados em uma orientação cauda-a-cauda. Os polinucleotídeos de DNA com uma orientação cauda-a-cauda de sequências podem compreender ainda uma extremidade de transposon esquerda e direita que flanqueia os primeiro e segundo aceptores de splice. Em modalidades, os polinucleotídeos de DNA descritos neste documento podem ser integrados dentro de um íntron do gene endógeno ou em uma junção do íntron-éxon. Os polinucleotídeos de DNA podem ser integrados dentro de um íntron, ou na junção do íntron-éxon do gene ATXN3 ou gene CACNA1A. O polinucleotídeo de DNA pode compreender uma primeira e segunda sequência de codificação parcial que codifica o peptídeo produzido pelo éxon 10 de um gene ATXN3 não patogênico. O polinucleotídeo de DNA pode compreender uma primeira e segunda sequência de codificação parcial que codifica o peptídeo produzido pelo éxon 47 de um gene CACNA1A não patogênico. As primeira e segunda sequências de codificação parciais codificam os mesmos aminoácidos. Em uma modalidade, as primeira e segunda sequências de codificação podem diferir em sequência de ácido nucleico, mas codificam os mesmos aminoácidos. Os polinucleotídeos de DNA podem ser abrigados em um vetor, em que o formato do vetor é selecionado a partir de DNA linear de fita dupla, DNA circular de fita dupla, ou um vetor viral. O vetor viral pode ser selecionado dentre um vetor de adenovírus, um vetor viral adenoassociado, ou um vetor de lentivírus. Os polinucleotídeos de DNA descritos neste documento podem ser iguais ou menores que 4,7 kb. A extremidade esquerda pode compreender a sequência mostrada em SEQ ID NO:41, e a extremidade direita pode compreender a sequência mostrada em SEQ ID NO: 13.
[0025] Em uma modalidade, este documento caracteriza um método para integrar um transgene em um gene endógeno, o método incluindo administrar um transgene, em que o transgene compreende uma primeira e segunda sequência aceptora de splice, uma primeira e segunda sequência de codificação, um terminador bidirecional ou um primeiro e segundo terminador, e um primeiro e segundo braço de homologia, em que o transgene é integrado dentro do gene endógeno. O método pode incluir projetar o transgene para ter o primeiro aceptor de splice operacionalmente ligado à primeira sequência de codificação parcial e o segundo aceptor de splice operacionalmente ligado à segunda sequência de codificação. O arranjo pode também incluir ter a primeira sequência de codificação parcial operacionalmente ligada ao primeiro terminador, e a segunda sequência de codificação parcial operacionalmente ligada ao segundo terminador. Em uma modalidade, os dois terminadores podem ser substituídos com um único terminador bidirecional. Os braços de homologia podem flanquear as primeira e segunda sequências aceptoras de splice, as primeira e segunda sequências de codificação, o um terminador bidirecional ou os primeiro e segundo terminador. A sequência de codificação pode codificar uma sequência de codificação total ou uma sequência de codificação parcial. Em uma modalidade, transgenes com primeiro e segundo aceptores de splice, primeira e segunda sequências de codificação, e primeiro e segundo terminadores podem ser orientados em uma orientação cauda-a- cauda. Os transgenes com uma orientação cauda-a-cauda de sequências podem compreender ainda um primeiro e segundo sítios alvos para uma ou mais endonucleases de corte raro, em que os sítios alvos flanqueiam os primeiro e segundo aceptores de splice. Em uma outra modalidade, os transgenes podem compreender um braço de homologia esquerdo e direito que flanqueia os primeiro e segundo aceptores de splice. Nesta modalidade, o transgene pode ser alojado dentro de um vetor viral adenoassociado. Em uma outra modalidade, o transgene pode compreender ainda um primeiro e segundo sítios alvos para uma ou mais endonucleases de corte raro, em que os sítios alvos flanqueiam os primeiro e segundo aceptores de splice. Os primeiro e segundo sítios alvos podem flanquear os primeiro e segundo braços de homologia. Em modalidades, os transgenes descritos neste documento podem ser integrados dentro de um íntron do gene endógeno ou em uma junção do íntron-éxon.
[0026] Prática dos métodos, bem como preparação e uso das composições divulgados neste documento empregam, a menos que de outra forma indicada, técnicas convencionais em biologia molecular, bioquímica, estrutura e análise de cromatina, química computatconal, cultura celular, DNA recombinante e campos relacionados como estão de acordo com os versados da técnica. Essas técnicas são totalmente explicadas na literatura. Ver, por exemplo, Sambrook et al. MOLECULAR CLONING: A LABORATORY MANUAL, Segunda edição, Cold Spring Harbor Laboratory Press, 1989 e Terceira edição, 2001; Ausubel et al., CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, John Wiley & Sons, New York, 1987 e atualizações periódicas; as séries METHODS IN ENZYMOLOGY, Academic Press, San Diego; Wolffe, CROMATIN STRUCTURE AND FUNCTION, Terceira edição, Academic Press, San Diego, 1998; METHODS IN ENZYMOLOGY, Vol. 304, “Cromatin” (P. M. Wassarman e A. P. Wolffe, eds.), Academic Press, San Diego, 1999; e METHDS IN BIOLOGIA MOLECULAR, Vol. 119, “Cromatin Protocols” (P. B. Becker, ed.) Humana Press, Totowa, 1999.
[0027] Conforme usadas neste documento, as expressões “ácido nucleico” e “polinucleotídeo”, podem ser usadas intercambiavelmente. Ácido nucleico e polinucleotídeo podem se referir a um polímero de desoxi-ribonucleotídeo ou ribonucleotídeo, em conformação linear ou circular, e em forma de fita tanto única ou quanto dupla. Essas expressões não devem ser consideradas limitativas com referência ao comprimento de um polímero. A expressões podem englobar análogos conhecidos de nucleotídeos naturais, bem como nucleotídeos que são modificados nas frações de base, açúcar e/ou fosfato.
[0028] Os termos “polipeptídeo”, “peptídeo” e “proteína” podem ser usados intercambiavelmente para se referir a resíduos de aminoácido covalentemente ligados entre si. Os termos também se aplicam a proteínas nos quais um ou mais aminoácidos são análogos químicos ou derivados modificados de aminoácidos de ocorrência natural correspondentes.
[0029] Os termos “operacionalmente ligado” ou “operacionalmente ligado” são usados intercambiavelmente e se referem a uma justaposição de dois ou mais componentes (tais como elementos de sequência), nos quais os componentes são arranjados de maneira tal que ambos os componentes funcionem normalmente e permitam a possibilidade de que pelo menos um dos componentes pode medie uma função que é exercida mediante pelo menos um dos outros componentes. A título de ilustração, uma sequência regulatória transcricional, tal como uma promotora, é operacionalmente ligada a uma sequência de codificação se a sequência regulatória transcricional controlar o nível de transcrição da sequência de codificação em resposta à presença ou ausência de um ou mais fatores regulatórios transcricionais. Uma sequência regulatória transcricional é no geral operacionalmente ligada em cis com uma sequência de codificação, mas não precisa ser diretamente adjacente a ela. Por exemplo, um intensificador é uma sequência regulatória transcricional que é operacionalmente ligada a uma sequência de codificação, ainda que eles não sejam contíguos. Além disso, a título de exemplo, um aceptor de splice pode ser operacionalmente ligado a uma sequência de codificação parcial se o aceptor de splice permitir delineação de um limite 3’ do íntron, e se a tradução do mRNA maduro resultante resultar em incorporação da sequência de peptídeos codificada pela sequência de codificação parcial no produto da proteína final.
[0030] Conforme usado neste documento, o termo “clivagem” se refere á quebra da espinha dorsal covalente de uma molécula de ácido nucleico. A clivagem pode ser iniciada por uma variedade de métodos incluindo, mas não limitados a, hidrólise enzimática ou química de uma ligação de fosfodiéster. A clivagem pode se referir tanto a um corte de fita única quanto a uma quebra de fita dupla. Uma quebra de fita dupla pode ocorrer em decorrência de dois cortes de de fita única distintos. Clivagem de ácido nucleico pode resultar na produção tanto de extremidades rombas quanto extremidades desencontradas. Em certas modalidades, endonucleases de corte raro são usados para direcionar de de fita dupla ou de fita única DNA clivagem.
[0031] Uma molécula “exógena” pode se referir a uma pequena molécula
(por exemplo, açúcares, lipídios, aminoácidos, ácidos graxos, compostos fenólicos, alcalóides), ou uma macromolécula (por exemplo, proteína, ácido nucleico, carboidrato, lipídio, glicoproteína, lipoproteína, polissacarídeo), ou qualquer derivado modificado das moléculas acima, ou qualquer complexo compreendendo uma ou mais das moléculas acima, geradas ou presentes fora de uma célula, ou não normalmente presentes em uma célula. Moléculas exógenas podem ser introduzidas em células. Métodos para a introdução ou “administração” de moléculas exógenas em células pode incluir transferência mediada por lipídio, eletroporação, injeção direta, fusão celular, bombardeio de partícula, coprecipitação de cálcio e fosfato, Transferência mediada por dextrano-DEAE e transferência mediada por de vetor viral. Conforme definido neste documento, “administração” pode se referir à distribuição, ao fornecimento, ou à introdução de moléculas exógenas em uma célula. Se um transgene ou uma endonuclease de corte raro for administrada a uma célula, então o transgene ou endonuclease de corte raro é distribuída, fornecida, ou introduzida na célula. A endonuclease de corte raro pode ser administrada como proteína, ácido nucleico purificado, ou uma mistura de proteína e ácido nucleico purificado. O ácido nucleico (isto é, RNA ou DNA), pode codificar para o endonuclease de corte raro, ou uma parte de uma endonuclease de corte raro (por exemplo, um gRNA). A administração pode ser obtida por métodos tais como transferência mediada por lipídio, eletroporação, injeção direta, fusão celular, bombardeio de partícula, coprecipitação de cálcio e fosfato, transferência mediada por dextrano-DEAE, transferência mediada por de vetor viral, ou qualquer meio adequado de distribuir a proteína ou ácidos nucleicos purificados, ou uma mistura de proteína purificada e ácidos nucleicos, a uma célula.
[0032] Uma molécula “endógena” é uma molécula que está presente em uma célula particular em um estágio desenvolvimental particular em condições ambientais particulares. Uma molécula endógena pode ser um ácido nucleico, um cromossomo, o genoma de uma mitocôndria, cloroplasto ou outra organela, ou um ácido nucleico epissomal de ocorrência natural. Moléculas endógenas adicionais podem incluir proteínas, por exemplo, fatores de transcrição e enzimas.
[0033] Conforme usado neste documento, um “gene”, se refere a uma região de DNA codificante que codifica um produto genético, incluindo todas as regiões de DNA que regulam a produção do produto genético. Consequentemente, um gene inclui, mas não é necessariamente limitado a, sequências promotoras, terminadores, sequência regulatórias translacionais tais como sítios de ligação de ribossomo e sítios de entrada de ribossomo internos, intensificadores, silenciadores, isoladores, elementos limites, origens de replicação, matriz sítios de fixação e regiões de controle locus. Conforme usado neste documento, um “gene tipo selvagem” se refere a uma forma do gene que está presente na frequência mais alta em uma população particular.
[0034] Um "gene endógeno" se refere a uma região de DNA normalmente presente em uma célula particular que codifica um produto genético bem como todas as regiões de DNA que regulam a produção do produto genético.
[0035] “Expressão de gene” se refere a conversão da informação, contida em um gene, em um produto genético. Um produto genético pode ser o produto transcricional direto de um gene. Por exemplo, o produto genético pode ser, mas não limitado a, mRNA, tRNA, rRNA, RNA antissentido, ribozima, RNA estrutural, ou uma proteína produzida por tradução de um mRNA. Produtos genéticos também incluem RNAs que são modificados, por processos tais como capeamento, poliadenilação, metilação, e edição, e proteínas modificados, por exemplo, por metilação, acetilação, fosforilação,
ubiquitinação, ADP-ribosilação, miristilação e glicosilação.
[0036] “Codificação” se refere a conversão da informação contida em um ácido nucleico, em um produto, em que o produto pode resultar do produto transcricional direto de uma sequência de ácido nucleico. Por exemplo, o produto pode ser, mas não limitado a, mRNA, tRNA, rRNA, RNA antissentido, ribozima, RNA estrutural, ou uma proteína produzida por tradução de um mRNA. Produtos genéticos também incluem RNAs que são modificados, por processos tais como capeamento, poliadenilação, metilação, e edição, e proteínas modificados, por exemplo, por metilação, acetilação, fosforilação, ubiquitinação, ADP-ribosilação, miristilação e glicosilação.
[0037] Um “sítio alvo” ou “sequência alvo” define uma porção de um ácido nucleico na qual uma endonuclease de corte raro ou transposase associada a CRISPR se ligará, desde que exista condições suficientes para ligação.
[0038] Conforme usado neste documento, o termo “recombinação” se refere a um processo de troca de informação genética entre dois polinucleotídeos. A expressão “recombinação homóloga (HR)” se refere a uma forma especializada de recombinação que pode ocorrer, por exemplo, durante o reparo de quebras de fita dupla. Recombinação homóloga exige homologia de sequência de nucleotídeos presente em uma molécula “doadora”. A molécula doadora pode ser usada pela célula como um molde para reparo de uma quebra de fita dupla. Informação dentro da molécula doadora que difere da sequência genômica em ou próxima da quebra de fita dupla pode ser estavelmente incorporada dentro do DNA genômico da célula.
[0039] O termo “integração” conforme usado neste documento se refere ao processo de adicionar DNA a uma região alvo de DNA. Conforme descrito neste documento, integração pode ser facilitada por diversos meios diferentes,
incluindo união de extremidade não homóloga, recombinação homóloga, ou transposição direcionada. A título de exemplo, integração de uma molécula de DNA suprida pelo usuário em um gene alvo pode ser facilitada por união de extremidade não homóloga. Neste documento, uma quebra de fita dupla direcionada é feita dentro do gene alvo e uma molécula de DNA suprida pelo usuário é administrada. A molécula de DNA suprida pelo usuário pode compreender extremidades de DNA expostas para facilitar captura durante reparo do gene alvo por união de extremidade não homóloga. As extremidades expostas podem estar presentes na molécula de DNA mediante administração (isto é, administração de uma molécula de DNA linear) ou criada mediante administração para a célula (isto é, uma endonuclease de corte raro cliva a molécula de DNA suprida pelo usuário dentro da célula para expor as extremidades). Adicionalmente, a molécula de DNA suprida pelo usuário pode ser alojada em um vetor viral, incluindo um vetor viral adenoassociado. Em um outro exemplo, integração ocorre para recombinação homóloga. Neste documento, o DNA suprido pelo usuário pode alojar um braço de homologia esquerdo e direito. Em um outro exemplo, integração ocorre através de transposição. Neste documento, o DNA suprido pelo usuário aloja um transposon esquerdo e extremidade direita.
[0040] O termo “transgene” conforme usado neste documento se refere a uma sequência de ácidos nucleicos que pode ser transferida para um organismo ou célula. O transgene pode compreender um gene ou sequência de ácidos nucleicos normalmente não presentes no organismo ou célula alvo. Adicionalmente, o transgene pode compreender uma cópia de um gene ou sequência de ácidos nucleicos que normalmente está presente no organismo ou célula alvo. Um transgene pode ser uma sequência de DNA exógena introduzida no citoplasma ou núcleo de uma célula alvo. Em uma modalidade,
os transgenes descritos neste documento contêm sequências de codificação parciais, em que as sequências de codificação parciais codificam uma porção de uma proteína produzida por um gene na célula hospedeira.
[0041] Conforme usado neste documento, o termo “patogênico” se refere a qualquer coisa que possa causar doença. Uma mutação patogênica pode se referir a uma modificação em um gene que causa doença. Um gene patogênico se refere a um gene compreendendo uma modificação que causa doença. A título de exemplo, um gene ATXN3 patogênico em pacientes com ataxia espinocerebelar 3 se refere a um gene ATXN3 com uma repetição de trinucleotídeo CAG expandida, em que a repetição de trinucleotídeo CAG expandida causa a doença.
[0042] Conforme usado neste documento, a expressão “cauda-a-cauda” se refere a uma orientação de duas unidades em direções oposta e reversa. As duas unidades podem ser duas sequências em uma única molécula de ácido nucleico, onde as extremidades 3’ de cada sequência são colocadas adjacentes uma à outra. Por exemplo, um primeiro ácido nucleico tendo os elementos, em uma direção 5’ para 3’, [aceptor de splice 1] - [sequência de codificação parcial 1] - [terminador 1] e um segundo ácido nucleico tendo o elementos [aceptor de splice 2] - [sequência de codificação parcial 2] - [terminador 2] pode ser colocado em orientação cauda-a-cauda, resultando em [aceptor de splice 1] - [sequência de codificação parcial 1] -[terminador 1] - [terminador 2 RC] - [sequência de codificação parcial 2 RC] - [aceptor de splice 2 RC], onde RC se refere à colocação reversa.
[0043] A expressão “junção íntron-éxon” se refere a uma localização específica em um gene. A localização específica é entre o último nucleotídeo em um íntron e o primeiro nucleotídeo do éxon seguinte. Durante integração de um transgene descrito neste documento, o transgene pode ser integrado na
“junção do íntron-éxon”. Se o transgene compreender cargo, o cargo será integrado imediatamente após o último nucleotídeo no íntron. Em alguns casos, a integração de um transgene na junção do íntron-éxon pode resultar na remoção da sequência no éxon (por exemplo, integração por meio de HR e substituição de sequência no éxon com o cargo no transgene).
[0044] O termo “homóloga” conforme usado neste documento se refere a uma sequência de ácidos nucleicos ou aminoácidos tendo similaridade com uma segunda sequência de ácidos nucleicos ou aminoácidos. Em algumas modalidades, as sequências homólogas podem ter pelo menos 80% de identidade de sequência (por exemplo, 81%, 85%, 90%, 95%, 96%, 97%, 98%, ou 99% de identidade de sequência) uma com a outra.
[0045] O termo “sequência de codificação parcial” conforme usado neste documento se refere a uma sequência de ácidos nucleicos que codifica uma proteína parcial. A sequência de codificação parcial pode codificar uma proteína que compreende um ou menos aminoácido comparada à proteína tipo selvagem ou proteína funcional. A sequência de codificação parcial pode codificar uma proteína parcial com homologia com a proteína tipo selvagem ou proteína funcional. A expressão “sequência de codificação parcial” quando se refere a ATXN3 se refere a uma sequência de ácidos nucleicos que codifica uma proteína ATXN3 parcial. A proteína ATXN3 parcial tem um ou menos aminoácido comparada a uma proteína ATXN3 tipo selvagem. Se modificar a extremidade 3’ do gene, um ou menos aminoácido pode ser da extremidade N- terminal da proteína. Se o gene ATXN3 tiver 11 éxons, então a sequência de codificação parcial pode compreender sequência que codifica o peptídeo produzida pelo éxons 2-11, ou 3-11 ou 4-11, ou 5-11, ou 6-11, ou 7-11, ou 8-11, ou 9-11, ou 10-11, ou 11.
[0046] Os métodos e composições descritos neste documento podem usar transgenes tendo uma sequência cargo. O termo “cargo” pode se referir a elementos tais como a sequência de codificação completa ou parcial de um gene, uma sequência parcial de um gene alojando polimorfismos de nucleotídeo simples relativo a WT ou alvo alterado, um aceptor de splice, um terminador, um elemento regulatório transcricional, tags de purificação (por exemplo, glutationa-S-transferase, poli(His), proteína de ligação a maltose, Strep-tag, Myc-tag, AviTag, HA-tag, ou proteína de ligação a quitina) ou genes repórteres (por exemplo, GFP, RFP, lacZ, cat, luciferase, puro, neomicina). Conforme definido neste documento, “cargo” pode se referir à sequência em uma transgene que é integrada em um sítio alvo. Por exemplo, “cargo” pode se referir à sequência em um transgene entre dois braços de homologia, dois sítios alvos endonuclease de corte raro, ou uma extremidade de transposon esquerda e direita.
[0047] A expressão “sequência de homologia” se refere a uma sequência de ácidos nucleicos que compreende homologia com um segundo ácido nucleico. A sequência de homologia, por exemplo, pode estar presente em uma molécula doadora como um “braço da homologia” ou “braço de homologia”. Um braço de homologia pode ser uma sequência de ácidos nucleicos em uma molécula doadora que facilita a recombinação homóloga com o segundo ácido nucleico. Conforme definido neste documento, um braço de homologia pode também ser referido como um “braço”. Em uma molécula doadora com dois braços de homologia, os braços de homologia podem ser referidos como “braço 1” e “braço 2”. Em um aspecto, uma sequência cargo pode ser flanqueada com primeiro e segundo braços de homologia.
[0048] O termo “terminador bidirecional” se refere a um terminador que pode terminar a transcrição de RNA polimerase em tanto na direção sentido quanto antissentido. Ao contrário de dois terminadores unidirecionais em orientação cauda-a-cauda, um terminador bidirecional pode compreender uma sequência de DNA não quimérica. Exemplos de terminadores bidirecionais incluem o terminador ARO4, TRP1, TRP4, ADH1, CYC1, GAL1, GAL7 e GAL10.
[0049] Uma extremidade 5’ ou 3’ de uma molécula de ácido nucleico se referencia à direcionalidade e orientação química do ácido nucleico. Conforme definido neste documento, a “extremidade 5’ de um gene” pode compreender o éxon com o códon de início, mas não o éxon com o códon de parada. Conforme definido neste documento, a “extremidade 3’ de um gene” pode compreender o éxon com o códon de parada, mas não o éxon com o códon de início.
[0050] O termo “ATXN3” gene se refere a um gene que codifica a enzima ataxina-3. Uma sequência representativa do gene ATXN3 pode ser encontrada com Sequência de Referência NCBI: NG 008198.2 e SEQ ID NO:42 correspondente. Os limites de éxon e íntron pode ser definido com a sequência fornecida em SEQ ID NO:42. Especificamente, o éxon 1 inclui a sequência de 1 a
54. O éxon 2 inclui a sequência de 9745 a 9909. O éxon 3 inclui a sequência de 10446 a 10490. O éxon 4 inclui a sequência de 12752 a 12837. O éxon 5 inclui a sequência de 13265 a 13331. O éxon 6 inclui a sequência de 17766 a 17853. O O éxon 7 inclui a sequência de 23325 a 23457. O éxon 8 inclui a sequência de 24117 a 24283. O éxon 9 inclui a sequência de 25522 a 25618. O éxon 10 inclui a sequência de 35530 a 35648. O éxon 11 inclui a sequência de 42169 a 48031. O íntron 1 inclui a sequência de 55 a 9744. O íntron 2 inclui a sequência de 9910 a 10445. O íntron 3 inclui a sequência de 10491 a 12751. O íntron 4 inclui a sequência de 12838 a 13264. O íntron 5 inclui a sequência de 13332 a 17765. O íntron 6 inclui a sequência de 17854 a 23324. O íntron 7 inclui a sequência de 23458 a 24116. O íntron 8 inclui a sequência de 24284 a 25521. O íntron 9 inclui a sequência de 25619 a 35529. O íntron 10 inclui a sequência de 35649 a
42168.
[0051] O termo gene “CACNA1A” se refere a um gene que codifica o canal de cálcio controlado por tensão subunidade proteína alfa1A. Uma sequência representativa do gene CACNA1A pode ser encontrada com Sequência de Referência NCBI: NG 011569.1 e SEQ ID NO:43 correspondente. Os limites de éxon e íntron podem ser definidos com a sequência fornecida em SEQ ID NO:43. Especificamente, o éxon 1 inclui a sequência de 1 a 529. O éxon 2 inclui a sequência de 51249 a 51354. O éxon 3 inclui a sequência de 53446 a 53585. O éxon 4 inclui a sequência de 134682 a 134773. O éxon 5 inclui a sequência de 140992 a 141144. O éxon 6 inclui a sequência de 146662 a 146855. O éxon 7 inclui a sequência de 170552 a 170655. O éxon 8 inclui a sequência de 171968 a
172083. O éxon 9 inclui a sequência de 173536 a 173592. O éxon 10 inclui a sequência de 176125 a 176217. O éxon 11 inclui a sequência de 189140 a
189349. O éxon 12 inclui a sequência de 193680 a 193792. O éxon 13 inclui a sequência de 197933 a 198045. O éxon 14 inclui a sequência de 198210 a
198341. O éxon 15 inclui a sequência de 198607 a 198679. O éxon 16 inclui a sequência de 202577 a 202694. O éxon 17 inclui a sequência de 202848 a
202915. O éxon 18 inclui a sequência de 205805 a 205911. O éxon 19 inclui a sequência de 207108 a 207917. O éxon 20 inclui a sequência de 219495 a
219958. O éxon 21 inclui a sequência de 221255 a 221393. O éxon 22 inclui a sequência de 223065 a 223194. O éxon 23 inclui a sequência de 229333 a
229392. O éxon 24 inclui a sequência de 230505 a 230611. O éxon 25 inclui a sequência de 243628 a 243727. O éxon 26 inclui a sequência de 244851 a
245011. O éxon 27 inclui a sequência de 246760 a 246897. O éxon 28 inclui a sequência de 248910 a 249111. O éxon 29 inclui a sequência de 251202 a
251366. O éxon 30 inclui a sequência de 253360 a 253470. O éxon 31 inclui a sequência de 261196 a 261279. O éxon 32 inclui a sequência de 270731 a
270847. O éxon 33 inclui a sequência de 271187 a 271252. O éxon 34 inclui a sequência de 271425 a 271540. O éxon 35 inclui a sequência de 274601 a
274751. O éxon 36 inclui a sequência de 276252 a 276379. O éxon 37 inclui a sequência de 277666 a 277762. O éxon 38 inclui a sequência de 281689 a
281794. O éxon 39 inclui a sequência de 291853 a 291960. O éxon 40 inclui a sequência de 292128 a 292228. O éxon 41 inclui a sequência de 293721 a
293830. O éxon 42 inclui a sequência de 293939 a 294077. O éxon 43 inclui a sequência de 294245 a 294358. O éxon 44 inclui a sequência de 295809 a
295844. O éxon 45 inclui a sequência de 296963 a 297149. O éxon 46 inclui a sequência de 297452 a 297705. O éxon 47 inclui a sequência de 298413 a
300019. O íntron 1 inclui a sequência de 530 a 51248. O íntron 2 inclui a sequência de 51355 a 53445. O íntron 3 inclui a sequência de 53586 a 134681. O íntron 4 inclui a sequência de 134774 a 140991. O íntron 5 inclui a sequência de 141145 a 146661. O íntron 6 inclui a sequência de 146856 a 170551. O íntron 7 inclui a sequência de 170656 a 171967. O íntron 8 inclui a sequência de 172084 a 173535. O íntron 9 inclui a sequência de 173593 a 176124. O íntron 10 inclui a sequência de 176218 a 189139. O íntron 11 inclui a sequência de 189350 a 193679. O íntron 12 inclui a sequência de 193793 a 197932. O íntron 13 inclui a sequência de 198046 a 198209. O íntron 14 inclui a sequência de 198342 a 198606. O íntron 15 inclui a sequência de 198680 a 202576. O íntron 16 inclui a sequência de 202695 a 202847. O íntron 17 inclui a sequência de 202916 a 205804. O íntron 18 inclui a sequência de 205912 a 207107. O íntron 19 inclui a sequência de 207918 a 219494. O íntron 20 inclui a sequência de 219959 a 221254. O íntron 21 inclui a sequência de 221394 a 223064. O íntron 22 inclui a sequência de 223195 a 229332. O íntron 23 inclui a sequência de 229393 a 230504. O íntron 24 inclui a sequência de 230612 a 243627. O íntron 25 inclui a sequência de 243728 a 244850. O íntron 26 inclui a sequência de
245012 a 246759. O íntron 27 inclui a sequência de 246898 a 248909. O íntron 28 inclui a sequência de 249112 a 251201. O íntron 29 inclui a sequência de 251367 a 253359. O íntron 30 inclui a sequência de 253471 a 261195. O íntron 31 inclui a sequência de 261280 a 270730. O íntron 32 inclui a sequência de 270848 a 271186. O íntron 33 inclui a sequência de 271253 a 271424. O íntron 34 inclui a sequência de 271541 a 274600. O íntron 35 inclui a sequência de 274752 a 276251. O íntron 36 inclui a sequência de 276380 a 277665. O íntron 37 inclui a sequência de 277763 a 281688. O íntron 38 inclui a sequência de 281795 a 291852. O íntron 39 inclui a sequência de 291961 a 292127. O íntron 40 inclui a sequência de 292229 a 293720. O íntron 41 inclui a sequência de 293831 a 293938. O íntron 42 inclui a sequência de 294078 a 294244. O íntron 43 inclui a sequência de 294359 a 295808. O íntron 44 inclui a sequência de 295845 a 296962. O íntron 45 inclui a sequência de 297150 a 297451. O íntron 46 inclui a sequência de 297706 a 298412.
[0052] A porcentagem de identidade de sequência entre uma sequência de ácidos nucleicos ou aminoácidos particulares e uma sequência referenciada por um número de identificação de sequência particular é determinado como se segue. Primeiro, uma sequência de ácidos nucleicos ou aminoácidos é comparada à sequência apresentada em um número de identificação de sequência particular usando o programa BLAST 2 Sequences (Bl2seq) da versão independente de BLASTZ contendo BLASTN versão 2.0.14 e BLASTP versão
2.0.14. Essa versão independente de BLASTZ pode ser obtida online em fir.com/blast ou at ncbi.nlm.nih.gov. Instruções explicando como usar o programa Bl2seq podem ser encontradas no arquivo readme que acompanha o BLASTZ. Bl2seq realiza uma comparação entre duas sequências usando tanto o BLASTN quanto o algoritmo BLASTP. BLASTN é usado para comparar sequência de ácidos nucleicos, enquanto BLASTP é usado para comparar sequências de aminoácidos. Para comparar duas sequências de ácidos nucleicos, as opções são apresentadas a seguir: -i é definido em um arquivo contendo a primeira sequência de ácidos nucleicos a ser comparada (por exemplo, C:\seql.txt); -j é definido em um arquivo contendo a segunda sequência de ácidos nucleicos a ser comparada (por exemplo, C:\seq2.txt); -p é definido em blastn; -o é definido em qualquer nome de arquivo desejado (por exemplo, C:\output.txt); - q é definido em -1; -r é definido em 2; e todas as outras opções são deixadas em suas definições padrões. Por exemplo, o comando seguinte pode ser usado para gerar um arquivo de saída contendo uma comparação entre duas sequências: C:\Bl2seq -i c:\seql.txt -j c:\seq2.txt -p blastn -o c:\output.txt -q -1 - r 2. Para comparar duas sequências de aminoácidos, as opções de Bl2seq são definidas como se segue: -i é definido em um arquivo contendo o primeiro aminoácido sequência a ser comparada (por exemplo, C:\seql.txt); -j é definido em um arquivo contendo a segunda sequência de aminoácidos a ser comparada (por exemplo, C:\seq2.txt); -p é definido em blastp; -o é definido em qualquer nome de arquivo desejado (por exemplo, C:\output.txt); e todas as outras opções são deixadas em suas definições padrões. Por exemplo, o comando seguinte pode ser usado para gerar um arquivo de saída contendo uma comparação entre duas sequências de aminoácidos: C:\Bl2seq -i c:\seql.txt -j c:\seq2.txt -p blastp -o c:\output.txt. Se as duas sequências comparadas compartilharem homologia, então o arquivo de saída designado apresentará essas regiões de homologia como sequências alinhadas. Se as duas sequências comparadas não compartilharem homologia, então o arquivo de saída designado não apresentará sequências alinhadas.
[0053] Uma vez alinhadas, o número de correspondências é determinado por contagem do número de posições onde um resíduo de nucleotídeo ou aminoácido idêntico é apresentado em ambas as sequências. A porcentagem de identidade de sequência é determinada dividindo o número de correspondências tanto pelo comprimento das sequências apresentadas na sequência identificada, quanto por um comprimento articulado (por exemplo, 100 resíduos de nucleotídeos ou aminoácidos consecutivos de uma sequência apresentada em uma sequência identificada), seguida pela multiplicação do valor resultante por 100. O valor da porcentagem de identidade de sequência é arredondado para a dezena mais próxima.
[0054] Em uma modalidade, este documento caracteriza métodos para modificar a extremidade 3’ dos genes endógenos, onde genes endógenos têm pelo menos um íntron entre dois éxons de codificação. O íntron pode ser qualquer íntron que é removido do RNA mensageiro precursor por maquinário de processamento de RNA mensageiro normal. O íntron pode ser entre 20 bp e >500 kb e compreender elementos incluindo um sítio doador de splice, sequência de ramificação, e sítio aceitador. Os transgenes divulgados neste documento para a modificação da extremidade 3’ dos genes endógenos podem compreender múltiplos elementos funcionais, incluindo sítios alvos para endonucleases de corte raro, braços de homologia, sequências aceptoras de splice, sequências de codificação e terminadores de transcrição (FIG. 1).
[0055] Em uma modalidade, o transgene compreende dois sítios alvos para uma ou mais endonucleases de corte raro. Os sítios alvos podem ser uma sequência adequada e comprimento para clivagem por um endonuclease de corte raro. O sítio alvo pode ser acessível a clivagem por sistemas CRISPR, nucleases com efetor TAL, nucleases dedo de zinco ou meganucleases, ou uma combinação de sistemas CRISPR, nucleases TALE, nucleases dedo de zinco ou meganucleases, ou qualquer outra nuclease específica do sítio. Os sítios alvos podem ser posicionados de maneira tal que a clivagem pela endonuclease de corte raro resulte em liberação de um transgene de um vetor. O vetor pode incluir vetores virais (por exemplo, vetores adenoassociados) ou vetores não virais (por exemplo, plasmídeos, vetores minicírculo). Se o transgene compreender dois sítios alvos, os sítios alvos podem ser a mesma sequência (isto é, direcionados pela mesma endonuclease de corte raro) ou eles podem ser diferentes sequências (isto é, direcionados por duas ou mais diferentes endonucleases de corte raro).
[0056] Em uma modalidade, o transgene compreende um primeiro e segundo sítios alvos para uma ou mais endonucleases de corte raro junto com um primeiro e segundo braço de homologia. Os primeiro e segundo braços de homologia podem incluir sequência que é homóloga a uma sequência genômica em ou próxima ao sítio de integração desejado. Os braços de homologia podem ser um comprimento adequado para participar em recombinação homóloga com sequência em ou próxima ao sítio de integração desejado. O comprimento de cada braço de homologia pode ser entre 20 nt e
10.000 nt (por exemplo, 20 nt, 30 nt, 40 nt, 50 nt, 100 nt, 200 nt, 300 nt, 400 nt, 500 nt, 600 nt, 700 nt, 800 nt, 900 nt, 1.000 nt, 2.000 nt, 3.000 nt, 4.000 nt,
5.000 nt, 6.000 nt, 7.000 nt, 8.000 nt, 9.000 nt, 10.000 nt). Em uma modalidade, braços de homologia podem compreender elementos funcionais, incluindo um sítio alvo para uma endonuclease de corte raro e/ou uma sequência aceptora de splice. Em uma modalidade, um primeiro braço de homologia (por exemplo, um braço de homologia esquerdo) pode compreender sequência homóloga ao íntron sendo direcionado, que inclui o sítio aceptor de splice do íntron sendo direcionado. Em uma outra modalidade, um segundo braço de homologia pode compreender sequência homóloga à sequência genômica á jusante do íntron sendo direcionado (por exemplo, sequência éxon, sequência UTR 3’). Entretanto, o segundo braço de homologia não deve possuir funções aceptoras de splice na direção de complemento inversa. Para determinar se uma sequência compreende funções aceptoras de splice, diversas etapas podem ser adotadas, incluindo em análise em silico e testes experimentais. Para determinar se existe potencial para funções aceptoras de splice, a sequência desejada para segundo braço de homologia pode ser pesquisada quanto as sequências de ramificação de consenso (por exemplo, YTRAC) e sítio aceptor de splices (por exemplo, NCAGG rico em Y). Se ramificação ou sequências aceptoras de splice estiverem presentes, polimorfismos de único nucleotídeo podem ser introduzidos para destruir a função, ou uma sequência diferente, mas adjacente não compreendendo tais sequências podem ser selecionada. Preferivelmente, a janela de sequência que pode ser usada para um segundo braço de homologia se estende de 1 bp a 10kb á jusante do íntron sendo direcionado para integração. Para determinar experimentalmente se a segunda homologia possui função aceptora de splice, um construto sintético compreendendo o segundo braço de homologia dentro de um íntron dentro de um gene repórter pode ser construído. O construto pode então ser administrado a um tipo de célula apropriado e monitorado quanto a função de splicing.
[0057] Em uma modalidade, o transgene compreende duas sequências aceptoras de splice, referidas neste documento como as primeira e segunda sequências aceptoras de splice. As primeira e segunda sequências aceptoras de splice são posicionados no transgene em direções opostas (isto é, em orientações cauda-a-cauda) e sequências internas flanqueadas (isto é, sequências de codificação e terminadores). Quando o transgene é integrado dentro de um íntron em direções direta ou reversas, as sequências aceptoras de splice facilitam a remoção da sequência de íntron adjacente/à montante durante processamento de mRNA. As primeira e segunda sequências aceptoras de splice podem ser as mesmas sequências ou sequências diferentes. Uma ou ambas as sequências aceptoras de splice podem ser a sequência aceptora de splice do íntron onde o transgene deve ser integrado. Uma ou ambas as sequências aceptoras de splice pode ser uma sequência aceptora de splice sintética ou uma sequência aceptora de splice de um íntron de um gene diferente.
[0058] Em uma modalidade, o transgene compreende uma primeira e segunda sequência de codificação operacionalmente ligadas à primeira e segunda sequências aceptoras de splice. As primeira e segunda sequências de codificação são posicionadas no transgene em direções opostas (isto é, em orientações cauda-a-cauda). Quando o transgene é integrado em um gene endógeno em direções direta ou reversas, as primeira ou segunda sequências de codificação são transcritas em mRNA pelo promotor do gene endógeno. As sequências de codificação podem ser projetadas para corrigir sequências de codificação defeituosas, introduzir mutações, ou introduzir sequências de peptídeos inéditas. As primeira e segunda sequências de codificação podem ser a mesma sequência de ácidos nucleicos e codificar para a mesma proteína. Alternativamente, as primeira e segunda sequências de codificação podem ser diferentes sequências de ácidos nucleicos e codificar para a mesma proteína (isto é, usando a degeneração de códons). A sequência de codificação pode codificar tags de purificação (por exemplo, glutationa-S-transferase, poli(His), proteína de ligação a maltose, Strep-tag, Myc-tag, AviTag, HA-tag, ou proteína de ligação a quitina) ou proteínas repórteres (por exemplo, GFP, RFP, lacZ, cat, luciferase, puro, neomicina). Em uma modalidade, o transgene compreende uma primeira e segunda sequência de codificação parcial operáveis ligadas a uma primeira e segunda sequência aceptora de splice, e o transgene não compreende um promotor.
[0059] Em uma modalidade, o transgene pode compreender um terminador bidirecional, ou um primeiro e segundo terminador, operacionalmente ligado a uma primeira e segunda sequência de codificação. O terminador bidirecional, ou os primeiro e segundo terminadores são posicionados no transgene em direções opostas (isto é, em orientações cauda- a-cauda). Quando o transgene é integrado em um gene endógeno em direções direta ou reversas, o terminador bidirecional, ou primeiro e segundo terminadores, terminam a transcrição do promotor do gene endógeno. Os primeiro e segundo terminadores podem ser os mesmos terminadores ou terminadores diferentes.
[0060] Em uma modalidade, este documento fornece um transgene compreendendo um primeiro e segundo sítio alvo de endonuclease de corte raro, uma primeira e segunda sequência aceptora de splice, uma primeira e segunda sequência de codificação, e um terminador bidirecional ou um primeiro e segundo terminador. O transgene pode ser integrado em genes endógenos por meio de métodos dependentes de não homologia, incluindo união de extremidade não homóloga e união de extremidade não homóloga alternativa ou por união de extremidade mediada por micro-homologia. Em um aspecto, o transgene é integrado dentro de um íntron no gene endógeno (FIG. 2).
[0061] Em uma outra modalidade, este documento fornece um transgene compreendendo um primeiro e segundo braço de homologia, um primeiro e segundo sítio alvo de endonuclease de corte raro, uma primeira e segunda sequência aceptora de splice, uma primeira e segunda sequência de codificação, e um terminador bidirecional ou um primeiro e segundo terminador. O transgene pode ser integrado em genes endógenos por meio tanto de métodos dependentes de homologia (por exemplo, anelamento de fita dependente de síntese e união de extremidade mediada por micro-
homologia) e métodos dependentes de não homologia (por exemplo, união de extremidade não homóloga e união de extremidade não homóloga alternativa). Em um aspecto, o transgene é integrado dentro de um íntron no gene endógeno (FIG. 3). Em um outro aspecto, o transgene é integrado na extremidade do íntron ou o começando do éxon á jusante (FIG. 3).
[0062] Em uma outra modalidade, este documento fornece um transgene compreendendo um primeiro e segundo braço de homologia, uma primeira e segunda sequência de codificação, uma primeira e segunda sequência aceptora de splice, e um terminador bidirecional ou um primeiro e segundo terminador (FIG. 1). Em uma outra modalidade, este documento fornece um transgene compreendendo, uma primeira e segunda sequência de codificação, uma primeira e segunda sequência aceptora de splice, e um terminador bidirecional ou um primeiro e segundo terminador.
[0063] Em uma outra modalidade, este documento fornece um transgene compreendendo um primeiro e segundo braço de homologia, uma primeira e segunda sequência de codificação, uma primeira e segunda sequência aceptora de splice, um terminador bidirecional ou um primeiro e segundo terminador, e uma primeira e segunda sequência adicional (FIG. 1). Em certas modalidades, a sequência adicional pode ser qualquer sequência adicional que está presente no transgene nas extremidades 5’ e 3’, entretanto, a sequência adicional não deve compreender nenhum elemento que funcione como um aceptor de splice. A sequência adicional pode ser, por exemplo, repetições de terminal invertidas de um genoma do vírus. A sequência adicional pode estar presente em um transgene tendo um formato linear. O formato linear permite integração por NHEJ. Por exemplo, um transgene alojado em um vetor viral adenoassociado, em que a sequência adicional é as repetições de terminal invertidas, pode ser diretamente integrado por NHEJ em um sítio alvo após clivagem por uma endonuclease de corte raro (isto é, não é necessário processamento do transgene). Em um outro exemplo, a sequência adicional é uma extremidade de transposon esquerda e direita.
[0064] Em uma outra modalidade, este documento fornece transgenes nos vetores virais, incluindo vírus e adenovírus adenoassociados, onde o transgene compreende uma primeira e segunda sequência aceptora de splice, uma primeira e segunda sequência de codificação, e um terminador bidirecional ou um primeiro e segundo terminador. Devido às repetições de terminal invertidas dos vetores virais, os transgenes também compreendem uma primeira e segunda sequência adicional.
[0065] Em uma outra modalidade, este documento fornece transgenes nos vetores virais, incluindo vírus e adenovírus adenoassociados, onde o transgene compreende um primeiro e segundo braço de homologia, uma primeira e segunda sequência aceptora de splice, uma primeira e segunda sequência de codificação, e um terminador bidirecional ou um primeiro e segundo terminador. Devido às repetições de terminal invertidas dos vetores virais, os transgenes também compreendem uma primeira e segunda sequência adicional.
[0066] Em algumas modalidades, os transgenes fornecidos neste documento podem ser integrados com transposases. As transposases podem incluir transposases CRISPR (Strecker et al., Science 10.1126/science.aax9l81, 2019; Klompe et al., Nature, 10.1038/s41586-019-1323-z, 2019). As transposases podem ser usadas em combinação com um transgene compreendendo, uma primeira e segunda sequência aceptora de splice, uma primeira e segunda sequência de codificação, um terminador bidirecional ou um primeiro e segundo terminador (FIG. 1), e uma extremidade esquerda e extremidade direita de transposon. AS transposases CRISPR podem incluir a proteína CRISPR TypeV-U5, C2C5, Cas12k, junto com proteínas tnsB, tnsC, e tniQ. Em algumas modalidades, o Cas12k pode ser de Scytonema hofinanni (SEQ ID NO:30) ou Anabaena cylindrica (SEQ ID NO:3 l). Em uma modalidade, os transgenes descritos neste documento compreendendo uma extremidade esquerda (SEQ ID NO:32) e direita (SEQ ID NO:33) de transposon podem ser administradas nas células junto com ShCas12k, tnsB, tnsC, TniQ e um gRNA (SEQ ID NO: 14). Alternativamente, a transposase CRISPR pode incluir a proteína Cas6, junto com proteínas auxiliares incluindo Cas7, Cas8 e TniQ. Em uma modalidade, os transgenes descritos neste documento compreendendo uma extremidade esquerda (SEQ ID NO:41) e direita (SEQ ID NO: 13) de transposon podem ser administradas nas células eucarióticas junto com Cas6 (SEQ ID NO: 37), Cas7 (SEQ ID NO: 37), Cas8 (SEQ ID NO: 37), TniQ (SEQ ID NO: 37), TnsA (SEQ ID NO: 37), TnsB (SEQ ID NO: 37), TnsC (SEQ ID NO:37) e um gRNA (SEQ ID NO: 12). As proteínas podem ser administradas nas células diretamente como proteína purificada ou codificada em RNA ou DNA. Se codificada em RNA ou DNA, a sequência pode ser códon otimizada para expressão em células eucarióticas. O gRNA (SEQ ID NO: 12) pode ser colocado á jusante de um promotor polIII de RNA e terminado com um terminador poli(T).
[0067] Em algumas modalidades, os transgenes descritos neste documento podem ter uma combinação de elementos incluindo aceptores de splice, sequências de codificação parciais, terminadores, braços de homologia, extremidades de transposase esquerda e direita e sítios para clivagem por endonucleases de corte raro. Em uma modalidade, a combinação pode ser, de 5’ a 3’, [aceptor de splice 1] - [sequência de codificação parcial 1] - [terminador 1] - [terminador 2 RC] - [sequência de codificação parcial 2 RC] - [aceptor de splice 2 RC], onde RC quer dizer complemento reverso. Essa combinação pode ser alojada em uma molécula de DNA linear ou molécula AAV e pode ser integrada por NHEJ através de uma quebra direcionada no gene alvo.
Em uma outra modalidade, a combinação pode ser, de 5’ a 3’, [sítio de clivagem 1 de endonuclease de corte raro] - [aceptor de splice 1] - [sequência de codificação parcial 1] - [terminador 1] -[terminador 2 RC] - [sequência de codificação parcial 2 RC] - [aceptor de splice 2 RC] - [sítio de clivagem 1 de endonuclease de corte raro]. Em uma outra modalidade, a combinação pode ser, de 5’ a 3’, [sítio de clivagem 1 de endonuclease de corte raro] - [braço de homologia 1] - [aceptor de splice 1] - [sequência de codificação parcial 1] - [terminador 1] - [terminador 2 RC] - [sequência de codificação parcial 2 RC] - [aceptor de splice 2 RC] - [braço de homologia 2] - [sítio de clivagem 2 de endonuclease de corte raro]. Nessa combinação uma ou mais endonucleases de corte raro podem ser usadas para facilitar HR e NHEJ.
Por exemplo, uma única nuclease de corte raro pode clivar o gene alvo (isto é, um íntron desejado) e os sítios de clivagem que flanqueiam os braços de homologia podem ser projetados para ser a mesma sequência alvo dentro do íntron.
Em uma outra modalidade, a combinação pode ser, de 5’ a 3’, [braço de homologia 1 + sítio de clivagem 1 de endonuclease de corte raro] - [aceptor de splice 1] - [sequência de codificação parcial 1] -[terminador 1] - [terminador 2 RC] - [sequência de codificação parcial 2 RC] - [aceptor de splice 2 RC] - [braço de homologia 2] - [sítio de clivagem 1 de endonuclease de corte raro]. Nessa combinação, uma ou mais endonucleases de corte raro pode facilitar HR e NHEJ.
Por exemplo, uma única nuclease de corte raro pode clivar no braço de homologia 1, á jusante de braço de homologia 2, e no sítio alvo genômico (isto é, no sítio com homologia para a sequência no braço de homologia 1). Em uma outra modalidade, a combinação pode ser de 5’ a 3’, [extremidade esquerda para uma transposase] - [aceptor de splice 1] - [sequência de codificação parcial 1] -[terminador 1] - [terminador 2 RC] - [sequência de codificação parcial 2 RC] - [aceptor de splice 2 RC] -
[extremidade direita para uma transposase]. Em todas as modalidades, o aceptor de splice 1 e aceptor de splice 2 podem ser as mesmas ou diferentes sequências; a sequência de codificação parcial 1 e sequência de codificação parcial 2 podem ser as mesmas ou diferentes sequências; o terminador 1 e terminador 2 pode ser as mesmas ou diferentes sequências.
[0068] Em modalidades, um transgene compreendendo a estrutura [sítio de clivagem 1 de endonuclease de corte raro] - [braço de homologia 1] - [aceptor de splice 1] - [sequência de codificação parcial 1] -[terminador 1] - [terminador 2 RC] - [sequência de codificação parcial 2 RC] - [aceptor de splice 2 RC] - [braço de homologia 2] - [sítio de clivagem 2 de endonuclease de corte raro] pode ser integrado no DNA através de administração de uma ou mais endonucleases de corte raro. Se uma endonuclease de corte raro for administrada, a endonuclease de corte raro pode liberar o transgene por clivagem no sítio de clivagem 1 e 2 de endonuclease de corte raro. Além disso, a mesma endonuclease de corte raro pode criar uma quebra no gene alvo, simulando inserção através de HR ou NHEJ.
[0069] Em outras modalidades, um transgene compreendendo a estrutura [braço de homologia 1 + sítio de clivagem 1 de endonuclease de corte raro] - [aceptor de splice 1] - [sequência de codificação parcial 1] - [terminador 1] - [terminador 2 RC] - [sequência de codificação parcial 2 RC] - [aceptor de splice 2 RC] - [braço de homologia 2] - [sítio de clivagem 1 de endonuclease de corte raro] pode ser integrado no DNA através de distribuição de uma ou mais endonucleases de corte raro. Se uma endonuclease de corte raro for administrada, a endonuclease de corte raro pode liberar o transgene por clivagem no sítio de clivagem 1 e 2 de endonuclease de corte raro. Além disso, a mesma endonuclease de corte raro pode criar uma quebra no gene alvo, simulando inserção através de HR ou NHEJ. Integração por HR pode ocorrer quando clivagem é à montante do sítio de integração (isto é, em um braço de homologia).
[0070] Em modalidades, a localização para integração de transgenes pode ser um íntron ou uma junção do íntron-éxon. Quando alveja um íntron, a sequência de codificação parcial pode compreender sequência que codifica o peptídeo produzido pelos éxons seguintes no gene endógeno. Por exemplo, se o transgene for projetado para ser integrado em íntron 9 de um gene endógeno com 11 éxons, então a sequência de codificação parcial pode compreender sequência que codifica o peptídeo produzido pelo éxons 10 e 11 do gene endógeno. Quando alveja uma junção do íntron-éxon, o transgene pode ser projetado para compreender braços de homologia com sequência homóloga ao 3’ do dito íntron.
[0071] Em algumas modalidades, as sequências de codificação parciais podem ser sequências de codificação total. A sequência de codificação total pode codificar um gene endógeno (por exemplo, Fator VIII, Fator IX, ou INS), ou genes repórteres (por exemplo, RFP, GFP, cat, lacZ, luciferase). As sequências de codificação total podem ser operacionalmente ligadas aos aceptores de splice e terminadores e colocadas em um transgene em uma orientação cauda- a-cauda.
[0072] Os métodos e composições fornecidos neste documento podem ser usados para modificar genes endógenos em células. Os genes endógenos podem incluir, fibrinogênio, protrombina, fator de tecido, Fator V, Fator VII, Fator VIII, Fator IX, Fator X, Fator XI, Fator XII (fator Hageman), Fator XIII (fator de estabilização de fibrina), fator de von Willebrand, pré-calicreína, cininógeno de alto peso molecular de (fator de Fitzgerald), fibronectina, antitrombina III, cofator II de heparina, proteína C, proteína S, proteína Z, inibidor de protease relacionada a proteína Z, plasminogênio, alfa 2-antiplasmina, ativador de plasminogênio de tecido, uroquinase, inibidor-1 do ativador de plasminogênio, inibidor-2 do ativador de plasminogênio, glucocerebrosidase (GBA), ɑ- galactosidase A (GLA), iduronato sulfatase (IDS), iduronidase (IDUA), ácido esfingomielinase (SMPD1), MMAA, MMAB, MMACHC, MMADHC (C2orf25), MTRR, LMBRD1, MTR, propionil-CoA carboxilase (PCC) (subunidades de PCCA e/ou PCCB), uma proteína transportadora de glicose-6-fosfato (G6PT) ou glicose-6-fosfatase (G6Pase), um receptor de LDL (LDLR), ApoB, LDLRAP-1, um PCSK9, uma proteína mitocondrial tais como NAGS (N-acetilglutamata sintetase), CPS1 (carbamoil fosfato sintetase I), e OTC (ornitina transcarbamilase), ASS (ácido argininosuccínico sintetase), ASL (ácido argininosuccinase liase) e/ou ARG1 (arginase), e/ou uma família de carreador de soluto 25 (SLC25A13, uma proteína carreadoar de aspartato/glutamato), um UGTlAl ou polipeptídeo A1 UDP glucuronsiltransferase, um fumarilacetoacetato hidroliase (FAH), uma proteína alanina-glioxilato aminotransferase (AGXT), uma proteína glioxilato redutase/hidroxipiruvato redutase (GRHPR), uma proteína do gene transtrietina (TTR), uma proteína ATP7B, uma proteína fenilalanina hidroxilase (PAH), uma proteína USH2A, uma proteína ATXN, e uma proteína lipoproteína liase (LPL).
[0073] O transgene pode incluir sequência para modificar a sequência que codifica um polipeptídeo que está faltando não funcional ou tendo uma mutação de ganho de função no sujeito tendo um doença genética, incluindo mas não limitados ás seguintes doenças genéticas: acondroplasia, acromatopsia, deficiência de ácido maltase, deficiência de adenosina deaminase, adrenoleucodistrofia, síndrome de Aicardi, deficiência de alfa-1 antitripsina, alfa-talassemia, síndrome da insensibilidade androgênica, síndrome de Pert, displasia ventricular direito arritmogênica, ataxia telangictasia, síndrome de Barth, beta-talassemia, síndrome de Blue Rubber
Bleb Nevus, doença de Canavan, doenças granulomatosas crônicas (CGD), síndrome de Cri-Du-Chat, fibrose cística, doença de Dercum, displasia ectodérmica, anemia de Fanconi, fibrodisplasia ossificante progressiva, síndrome do X frágil, galactosemia, doença Gaucher, gangliosidoses generalizadas (por exemplo, GM1), hemocromatose, a mutação de hemoglobina C no 6o códon de beta-globina (HbC), hemofilia, doença de Huntington, Síndrome de Hurler, hipofosfatasia, síndrome de Klinefleter, Doença de Krabbes, Síndrome de Langer-Giedion, deficiência de adesão de leucócito, lleucodistrofia, síndrome do QT longo, síndrome de Marfan, síndrome de Moebius, mucopolissacaridose (MPS), síndrome de Nail-Patella, diabetes insipdius nefrogênico, neurofibromatose, doença de Neimann-Pick, osteogênese imperfeita, porfiria, síndrome de Prader-Willi, progeria, síndrome de Proteus, retinoblastoma, síndrome de Rett, síndrome de Rubinstein-Taybi, síndrome de Sanfilippo, imunodeficiência combinada grave (SCID), síndrome de Shwachman, doença da célula falciforme (anemia da célula falciforme), síndrome de Smith-Magenis, síndrome de Stickler, doença de Tay-Sachs, síndrome da Trombocitopenia e Ausência de Rádio (TAR), síndrome de Treacher Collins, trissomia, esclerose tuberosa, síndrome de Turner, distúrbio do ciclo de ureia, doença de von Hippel-Landau, síndrome de Waardenburg, síndrome de Williams, doença de Wilson, síndrome de Wiskott-Aldrich, síndrome linfoproliferativa ligada a X, doenças de armazenamento lisossomal (por exemplo, doença de Gaucher, GM1, doença de Fabry e doença de Tay- Sachs), mucopolissacaridose (por exemplo doença d Hunter, doença de Hurler), hemoglobinopatias (por exemplo, doenças da célula falciforme, HbC, ɑ- talassemia, β-thalassemia) e hemofilias.
[0074] Doenças adicionais que podem ser tratadas por integração direcionada incluem doença de von Willebrand, síndrome de Usher, doença do rim policístico, ataxia espinocerebelar tipo 3 e ataxia espinocerebelar tipo 6.
[0075] Em uma modalidade, a modificação genômica é a inserção de um transgene na sequência genômica CACNA1A endógena. O transgene pode incluir uma sequência de codificação sintética e parcial para a proteína CACNA1A. A sequência de codificação parcial pode ser homóloga à sequência de codificação em um gene CACNA1A tipo selvagem, ou uma variante funcional do gene CACNA1A tipo selvagem, ou um mutante do gene CACNA1A tipo selvagem. Em uma modalidade, o transgene que codifica a proteína CACNA1A parcial é inserido no íntron 46 ou no início do éxon 47.
[0076] Em uma outra modalidade, a modificação genômica é a inserção de um transgene na sequência genômica ATXN3 endógena. O transgene pode incluir uma sequência de codificação sintética e parcial para a proteína ATXN3. A sequência de codificação parcial pode ser homóloga à sequência de codificação dentro de um gene tipo selvagem ATXN3, ou uma variante funcional do gene tipo selvagem ATXN3, ou um mutante do gene tipo selvagem ATXN3. Em uma modalidade, o transgene que codifica a proteína ATXN3 parcial é inserido no íntron 9 ou no início do éxon 10.
[0077] Em uma modalidade, os métodos e composições descritos neste documento podem ser usados para modificar a extremidade 3’ de um gene endógeno, por meio disso resultando em modificação do terminal C da proteína codificada pelo gene endógeno. A modificação da extremidade 3’ da sequência de codificação do gene endógeno pode incluir a substituição do éxon de codificação final (isto é, o éxon compreendendo o códon de parada), até um éxon que é entre o éxon com a codificação de início e o éxon final. Conforme definido neste documento “substituição” se refere a inserção de DNA em um gene, em que o DNA inserido fornece a informação para produzir o mRNA e proteína de 1 ou mais éxons. Substituição pode ocorrer integrando um transgene dentro do gene endógeno, em que o transgene compreende uma ou mais sequências de codificação operacionalmente ligado a um aceptor de splice.
A inserção pode ou não resultar na deleção de sequência no gene endógeno (por exemplo, deleção de introns e éxons). Por exemplo, se um gene compreender 72 éxons, e o códon de início estiver dentro do éxon 1, a modificação pode incluir substituição de éxons 2-72, 3-72, 4-72, 5-72, 6-72, 7- 72, 8-72, 9-72, 10-72, 11-72, 12-72, 13-72, 14-72, 15-72, 16-72, 17-72, 18-72, 19-72, 20-72, 21-72, 22-72, ou 23-72, ou 24-72, ou 25-72, ou 26-72, ou 27-72, ou 28-72, ou 29-72, ou 30-72, ou 31-72, ou 32-72, ou 33-72, ou 34-72, ou 35- 72, ou 36-72, ou 37-72, ou 38-72, ou 39-72, ou 40-72, ou 41-72, ou 42-72, ou 43-72, ou 44-72, ou 45-72, ou 46-72, ou 47-72, ou 48-72, ou 49-72, ou 50-72, ou 51-72, ou 52-72, ou 53-72, ou 54-72, ou 55-72, ou 56-72, ou 57-72, ou 58- 72, ou 59-72, ou 60-72, ou 61-72, ou 62-72, ou 63-72, ou 64-72, ou 65-72, ou 66-72, ou 67-72, ou 68-72, ou 69-72, ou 70-72, ou 71-72 ou 72. Em uma modalidade, os éxons do gene endógeno podem ser substituídos integrando um transgene dentro do gene endógeno, em que o transgene compreende uma primeira e segunda sequência de codificação parcial, em que as primeira e segunda sequências de codificação parcial codificam um peptídeo produzido pelos genes endógenos éxons.
Por exemplo, as primeira e segunda sequências de codificação do transgene podem codificar um peptídeo que é produzido pelos éxons do gene endógeno 2-72, 3-72, 4-72, 5-72, 6-72, 7-72, 8-72, 9-72, 10-72, 11-72, 12-72, 13-72, 14-72, 15-72, 16-72, 17-72, 18-72, 19-72, 20-72, 21- 72, 22-72, ou 23-72, ou 24-72, ou 25-72, ou 26-72, ou 27-72, ou 28-72, ou 29- 72, ou 30-72, ou 31-72, ou 32-72, ou 33-72, ou 34-72, ou 35-72, ou 36-72, ou 37-72, ou 38-72, ou 39-72, ou 40-72, ou 41-72, ou 42-72, ou 43-72, ou 44-72, ou 45-72, ou 46-72, ou 47-72, ou 48-72, ou 49-72, ou 50-72, ou 51-72, ou 52- 72, ou 53-72, ou 54-72, ou 55-72, ou 56-72, ou 57-72, ou 58-72, ou 59-72, ou
60-72, ou 61-72, ou 62-72, ou 63-72, ou 64-72, ou 65-72, ou 66-72, ou 67-72, ou 68-72, ou 69-72, ou 70-72, ou 71-72 ou 72. O transgene pode ser integrado dentro do gene endógeno no íntron à montante ou no início do éxon correspondente ao primeiro éxon na sequência de codificação parcial de transgene (FIG. 2). O transgene pode ser projetado para ser 4,7kb ou menor, e incorporado em um vetor AAV e partícula, e administrado in vivo nas células alvos.
[0078] Em uma modalidade, o transgene é uma sequência de DNA que aloja uma primeira e segunda sequência de codificação parcial, em que as sequências de codificação parciais codificam uma proteína parcial, em que a proteína parcial é homóloga a uma região correspondente em uma proteína funcional produzida a partir de um gene tipo selvagem. O gene hospedeiro ou gene endógeno é um nos quais expressão da proteína é aberrante, em outras palavras, não é expressa, é expressa a níveis baixos ou é expressa, mas o mRNA ou produto da proteína ou porção do mesmo não é funcional, tem função reduzida, ou tem um ganho de função, resultando em um distúrbio no hospedeiro.
[0079] Conforme descrito neste documento, a molécula doadora pode ser em um vetor viral ou não viral. Os vetores podem ser na forma de DNA de fita dupla ou fita única circular ou linear. A molécula doadora pode ser conjugada ou associada com um reagente que facilita estabilidade ou atualização celular. O reagente pode ser lipídios, cálcio fosfato, polímeros catiônicos, DEAE- dextrano, dendrímeros, polietileno glicol (PEG) peptídeos de penetração de célula, microbolhas encapsuladas a gás ou grânulos magnéticos. A molécula doadora pode ser incorporada em uma partícula viral. O vírus pode ser retroviral, adenoviral, vetores adenoassociados (AAV), herpes simplex, pox vírus, vetor adenoviral híbrido, vírus epstein-bar, lentivírus, ou vírus da herpes simplex.
[0080] Em certas modalidades, os vetores AAV conforme descrito neste documento podem ser derivados de qualquer AAV. Em certas modalidades, o vetor AAV é derivado do vírus tipo 2 adenoassociado parvovírus defeituoso e não patogênico. Todos tais vetores são derivados de um plasmídeo que retém apenas as repetições de terminal invertidas 145 bp AAV flanqueando o cassete de expressão de transgene. Transferência genética eficiente e administração de transgene estável devido a integração nos genomas da célula transduzida são características chaves para esse sistema de vetor. (Wagner et al., Lancet 351 :9117 1702-3, 1998; Kearns et al., Gene Ther. 9:748-55, 1996). Outros serotipos de AAV, incluindo AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9 e AAVrh.10 e qualquer serotipo de AAV inédito podem também ser usados de acordo com a presente invenção. Em algumas modalidades, AAV quimérico é usado onde as origens virais das sequências de repetição de terminal longo (LTR) do ácido nucleico viral são heterólogas à origem viral das sequências de capsídeo. Exemplos não limitativos incluem vírus quimérico com LTRs derivados de AAV2 e capsídeos derivados de AAV5, AAV6, AAV8 ou AAV9 (isto é, AAV2/5, AAV2/6, AAV2/8 e AAV2/9, respectivamente).
[0081] Os construtos descritos neste documento podem também ser incorporados em um sistema de vetor adenoviral. Vetores com base adenoviral são capazes de eficiência de transdução muito alta em muitos tipos de célula e não exigem divisão celular. Com tais vetores, alto titulador e altos níveis de expressão podem ser obtidos.
[0082] Os métodos e composições descritos neste documento são aplicáveis a qualquer organismo eucariótico no qual é desejado alterar o organismo através de modificação genômica. Os organismos eucarióticos incluem plantas, algas, animais, fungos e protistas. Os organismos eucarióticos podem também incluir células de planta, células de algas, células de animal, células fúngicas e células protistas.
[0083] Células de mamífero exemplificativas incluem, mas são não limitadas a, oócitos, células K562, células CHO (ovário de hamster chinês), células HEP-G2, células BaF-3, células de Schneider, células COS (células de rim de macaco que expressam antígeno T SV40), células CV-1, células HuTu80, células NTERA2, células NB4, células HL-60 e células HeLa, células 293 (ver, por exemplo, Graham et al. (1977) J. Gen. Virol. 36:59), e células de mieloma tipo SP2 ou NSO (ver, por exemplo, Galfre and Milstein (1981) Meth. Enzymol. 73(B):3 46). Mononucleócitos do sangue periférico (PBMCs) ou células T podem também ser usados, como pode células-tronco embriônicas e adultas. Por exemplo, células-tronco que podem ser usadas incluem células-tronco embriônicas (ES), células-tronco pluripotentes induzidas (iPSC), células-tronco mesenquimais, células-tronco hematopoiéticas, células-tronco do fígado, células-tronco da pele e células-tronco neuronais.
[0084] Os métodos e composições da invenção podem ser usados na produção de organismos modificados. Os organismos modificados podem ser pequenos mamíferos, animais domésticos, animais de fazenda, e primatas. Exemplos não limitativos de roedores podem incluir camundongos, ratos, hamsters, gerbos e porquinhos-da-índia. Exemplos não limitativos de animais domésticos podem incluir gatos, cães, coelhos, ouriços e furões. Exemplos não limitativos de animais de fazenda podem incluir cavalos, cabras, ovelha, porco, lhamas, alpacas e gado. Exemplos não limitativos de primatas podem incluir macacos-prego, chimpanzés, lêmures, símio, micos, saguins, macacos-aranha, e macacos de cara preta. Métodos e composições da invenção podem ser usados em humanos.
[0085] Plantas e células de planta exemplificativas que podem ser modificadas usando os métodos descritos neste documento incluem, mas não são limitados a, plantas monocotiledôneas (por exemplo, trigo, milho, arroz, painço, cevada, cana de açúcar), plantas dicotiledôneas (por exemplo, soja, batata, tomate, alfalfa), culturas de fruta (por exemplo, tomate, maçã, pera, morango, laranja), culturas de forragem (por exemplo, alfafa), culturas de vegetais de raiz (por exemplo, cenoura, batata, beterrabas, inhame), culturas vegetais folhosos (por exemplo, alface, espinafre); culturas vegetativas para consumo (por exemplo soja e outros legumes, abóbora, pimentas, berinjela, aipo etc.), plantas floríferas (por exemplo, petúnia, rosa, crisântemo), árvores coníferas e pinho (por exemplo, pinheiro, abeto); álamos (por exemplo P. tremulaxP.
Alba); culturas de fibra (algodão, juta, linho, bambu) plantas usadas em fito-remediação (por exemplo, plantas que acumulam metal pesado); culturas de óleo (por exemplo, girassol, semente de colza) e plantas usadas para propósitos experimentais (por exemplo, Arabidopsis). Métodos divulgados neste documento pode ser usado nos gêneros Asparagus, Avena, Brassica, Citrus, Citrullus, Capsicum, Cucurbita, Daucus, Erigeron, Glycine, Gossypium, Hordeum, Lactuca, Lolium, Lycopersicon, Malus, Manihot, Nicotiana, orychophragmus, oryza, Persea, Phaseolus, Pisum, Pyrus, Prunus, Raphanus, Secale, Solanum, Sorghum, Triticum, Vitis, Vigna, e Zea.
A expressão células de planta inclui células de planta isoladas bem como plantas totais ou porções de plantas totais tais como sementes, caules, folhas e raízes.
A presente divulgação também engloba sementes das plantas descritas acima em que a semente foi modificada usando as composições e/ou os métodos descritos neste documento.
A presente divulgação engloba ainda a progênie, clones, linhagens celulares ou células das plantas transgênicas descritas acima em que a dita progênie, clone, linhagem celular ou célula tem o transgene ou construto genético.
Espécies exemplificativas de algas incluem microalgas, diátomos,
Botryococcus braunii, Chlorella, Dunaliella tertiolecta, Gracileria, Pleurochrysis carterae, Sorgassum e Ulva.
[0086] Os métodos descritos neste documento podem incluir o uso de endonucleases de corte raro para estimular recombinação homóloga ou integração não homóloga de uma molécula de transgene em um gene endógeno. A endonuclease de corte raro pode incluir CRISPR, TALENs, ou nucleases dedo de zinco (ZFNs). O sistema CRISPR pode incluir CRISPR/Cas9 ou CRISPR/Cas12a (Cpfl). O sistema CRISPR pode incluir variantes que exibem ampla capacidade PAM (Hu et al., Nature 556, 57-63, 2018; Nishimasu et al., Science DOI: 10.1126, 2018) ou maior ligação ao alvo ou atividade de clivagem (Kleinstiver et al., Nature 529:490-495, 2016). O reagente de edição de gene pode ser no formato de uma nuclease (Mali et al., Science 339:823-826, 2013; Christian et al., Genetics 186:757-761, 2010), nickase (Cong et al., Science 339:819-823, 2013; Wu et al., Biochemical and Biophysical Research Communications 1:261-266, 2014), dímeros CRISPR-FokI (Tsai et al., Nature Biotechnology 32:569-576, 2014), ou nickases CRISPR pareados (Ran et al., Cell 154:1380-1389, 2013).
[0087] Os métodos e composições descritos neste documento podem ser usados em uma circunstância onde é desejado modificar a extremidade 3’ da sequência de codificação de um gene endógeno. Por exemplo, pacientes com SCA3 ou SCA6 expandiram repetições CAG em éxons 10 (segundo até o último éxon) e éxon 47 (último éxon), respectivamente. Pacientes com SCA3 ou SCA6 podem se beneficiar de substituição de éxons 10-11 e éxon 47, respectivamente. Em outros exemplos, pacientes com distúrbios genéticos devido a perda de mutações de função na extremidade 3’ de um gene endógeno se beneficiaria de substituição dos éxons finais do dito gene.
[0088] A invenção será ainda descrita nos seguintes exemplos, que não limitam o escopo da invenção descritos nas reivindicações.
EXEMPLOS Exemplo 1: Integração direcionada de DNA no gene ATXN3
[0089] Três plasmídeos foram construídos com transgenes projetados para integrar no gene ATXN3 em células humanas. Todos os transgenes foram projetados para ser inseridos no íntron 9 ou na junção de íntron 9 e éxon 10 do gene ATXN3 e todos os transgenes foram projetados para inserir pelo menos um aceptor de splice e pelo menos uma sequência de codificação funcional para éxons 10 e 11 do gene ATXN3. O primeiro plasmídeo, designado pBA1135, compreendeu um braço de homologia esquerdo e direito com sequência homóloga à extremidade 3’ de íntron 9 e extremidade 5’ de íntron 10 (isto é, alvejamento de gene bem sucedido resultará em remoção de éxon 10 e substituição com a sequência cargo em pBA1135). Entre os braços de homologia, de 5’ a 3’, foi um aceptor de splice (aceptor de splice de ATXN3 íntron 9), sequência de codificação para éxons 10 e 11 de ATXN3, SV40 terminador, terminador BGH reverso, sequência de codificação reversa para éxons 10 e 11 (ajustado por códon), e aceptor de splice reverso. A sequência para o transgene pBA1135 é mostrada em SEQ ID NO: 17. Uma nuclease Cas9 correspondente foi projetada para clivar i) dentro do íntron 9 do gene ATXN3, ii) no braço de homologia esquerdo de pBA1135, e iii) na extremidade 3’ do braço de homologia direito de pBA1135. Esperou-se que a clivagem bem- sucedida do plasmídeo liberasse o transgene, por meio disso permitindo que a sequência fosse usada como um molde para HR ou para integração por meio de NHEJ. O sítio alvo de gRNA Cas9 é mostrado em SEQ ID NO: 18. Os elementos individuais em pBA1135 são mostrados em SEQ ID NOS:44-5l. SEQ ID NO:44 compreende o braço de homologia esquerdo, sítio alvo de nuclease, e aceptor de splice. SEQ ID NO:45 compreende a sequência de codificação parcial
(éxon 10 e 11) de um gene ATXN3 não patogênico. SEQ ID NO:46 compreende a sequência terminadora SV40 p(A). SEQ ID NO:47 compreende o terminador BGH em complemento reverso. SEQ ID NO:48 compreende o complemento reverso, sequência de codificação parcial ajustada por códon (éxon 10 e 11) de um gene ATXN3 não patogênico. SEQ ID NO:49 compreende a sequência para o aceptor de splice. SEQ ID NO:50 compreende a sequência para o braço de homologia direito. SEQ ID NO:5l compreende a sequência de sítio alvo para a nuclease. O segundo plasmídeo, designado pBA1136, compreendeu o mesmo cargo de pBA1135, entretanto, os braços de homologia foram removidos. Sítios alvos de nuclease foram mantidos para facilitar a liberação do transgene do plasmídeo. Esperou-se que a clivagem bem-sucedida do plasmídeo liberasse o transgene, por meio disso permitindo que a sequência fosse usada para integração por NHEJ dentro do gene ATXN3. A sequência de pBA1136 é mostrada em SEQ ID NO: 19. O terceiro plasmídeo, designado pBA1137, compreendeu a mesma sequência de pBA1135, exceto para o sequências reversas e sítio alvo de nuclease (isto é, terminador reverso, sequência de codificação reversa e aceptor de splice reverso). Plasmídeo pBA1137 foi usado como um controle para métodos baseados em HR convencionais. A sequência de pBA1137 é mostrada em SEQ ID NO:20.
[0090] A transfecção foi realizada usando células HEK293T. As células HEK293T foram mantidas a 37°C e 5% de CO2 em DMEM alto suplementado com 10% de soro bovino fetal (FBS). As células HEK293T foram transfectadas com 2 ug de doador, 2 ug de RNA guia (formato de RNA) e 2 ug de Cas9 (formato de RNA). As transfecções foram realizadas usando eletroporação. DNA genômico foi isolado 72 horas pós-transfecção e avaliado quanto a eventos de integração. Uma lista de iniciadores usados para detectar integração ou DNA genômico é mostrada na Tabela 1.
Tabela 1: Iniciadores para detectar integração de transgenes em ATXN3. Nome do iniciador Sequência (5’ a 3’) SEQ ID NO: oNJB043 CAAAGGTGCCCTTGAGGTT 21 oNJB044 AGGAGAAGTCTGCCGTTACT 22 oNJB113 GGACAAACCACAACTAGAATGC 23 oNJB114 TAGGAAAGGACAGTGGGAGT 24 oNJB116 CCATTATGTCTCAGTTGTTCAGTG 25 oNJB156 CCAGACCATCTCAGACACC 26 oNJB162 GGCTGGGCTTCCACTTAC 27 oNJB167 GTGGTTTGTCCAAACTCATCAA 28 oNJB170 AGTAACTCTGCACTTCCCATTG 29
[0091] Para detectar a integração de pBA1135, pBA1136 e pBA1137, PCRs foram realizadas no DNA genômico. Com referência a pBA1137, o transgene foi projetado para ser integrado precisamente por HR. Consequentemente, faixas foram detectadas nas PCRs de junção 5’ e 3’, que indicam inserção precisa dentro do éxon 10 (FIG. 8 pistas 4 e 7). Os tamanhos de faixa esperados foram
1.520 bp para a junção 5’ e 786 bp para a junção 3’. Iniciadores oNJB113 e oNJB116 foram usados para a PCR de junção 5’. Iniciadores oNJB167 e oNJB170 foram usados para a PCR de junção 3’. Com referência a pBA1136, uma vez que nenhum braço de homologia estava presente, foi predito que o transgene inserisse por meio de inserção de NHEJ. Faixas de tamanho apropriadas foram observadas para a integração de transgene nas direções direta e reversa. Integração na direção direta pode ser vista na FIG. 8 pistas 3 (tamanho esperado aproximadamente 1.520 bp) e 6 (tamanho esperado aproximadamente 1.519 bp). Integração na direção reversa pode ser vista na FIG. 8 pista 12 (tamanho esperado aproximadamente 1.520 bp). Iniciadores oNJB113 e oNJB116 foram usados para a PCR de junção 5’. Iniciadores oNJB114 e oNJB170 foram usados para a PCR de junção 3’. Iniciadores oNJB116 e oNJB114 foram usados para a PCR de junção 5’ inversa. Com referência a ppBA1135, tanto braços de homologia quanto sítios de clivagem de nuclease estavam presentes no transgene. Integração por HR foi observada detectando faixas nas PCRs de junção 5’ e 3’ (FIG. 8 pistas 2 e 5). Além disso, integração por NHEJ foi observada detectando faixas em uma PCR de junção 5’ inversa (FIG. 8 pista 10). Tamanho esperado para a PCR de junção 5’ foi 1.520 bp. Tamanho esperado para a PCR de junção 3’ foi 1.157 bp. Tamanho esperado para a PCR de junção 5’ inversa foi aproximadamente 1.520 bp. Iniciadores oNJB113 e oNJB116 foram usados para a PCR de junção 5’. Iniciadores oNJB114 e oNJB170 foram usados para a PCR de junção 3’. Iniciadores oNJB116 e oNJB114 foram usados para a PCR de junção 5’ inversa.
[0092] Os resultados mostram que os transgenes descritos compreendendo sequências de codificação parciais bidirecionais podem ser integrados no DNA genômico através de múltiplas diferentes vias de reparo. Exemplo 2: Integração direcionada de DNA no gene CACNA1A
[0093] Um transgene direcionado para CACNA1A é projetado para substituir a extremidade 3’ da sequência de codificação CACNA1A. Um plasmídeo é construído com um transgene projetado para integrar sequência de codificação WT dentro do íntron 46 ou no início de éxon 47 (FIG. 4). O transgene compreende um primeiro braço de homologia que é homólogo à sequência imediatamente após o sítio doador de splice em íntron 46. O primeiro braço de homologia também compreende o sítio alvo para uma nuclease (SEQ ID NO: 9) e uma sequência aceptora de splice. O primeiro braço de homologia é seguido por uma primeira sequência de codificação compreendendo o éxon 47 CACNA1A e uma sequência de repetição CAG não expandida (SEQ ID NO:3). Após a primeira sequência de codificação é uma sequência de terminação SV40 poli(A) (SEQ ID NO:4). Em uma orientação cauda-a-cauda, um segundo conjunto de elementos funcionais está presente. O início do segundo conjunto de elementos compreende um sítio alvo para a nuclease (SEQ ID NO:9) seguido por um segundo braço de homologia. O segundo braço de homologia aloja 446 bp que é homólogo à sequência imediatamente após a codificação de parada (SEQ ID NO:8). Essa sequência foi determinada como sem ramificação de consenso ou sequências aceptoras de splice por meio de análise em silico. Após o segundo braço de homologia está um segundo aceptor de splice de íntron 1 de beta-actina de carpa (SEQ ID NO:7). Após o aceptor de splice está uma versão códon otimizada do éxon 47 CACNA1A (SEQ ID NO:6) e um terminador bGH poli(A) (SEQ ID NO:5).
[0094] Uma nuclease Cas12a correspondente é projetada para criar três quebras de fita dupla após-transfecção de o plasmídeo: i) dentro do íntron 46 do gene endógeno CACNA1A, 2) dentro do primeiro braço de homologia no transgene pBA1011-D1, e 3) após o segundo braço de homologia em o transgene pBA1011-D1. A sequência alvo para a nuclease Cas12a é mostrada em SEQ ID NO:9.
[0095] Confirmação da função do transgene e vetores CRISPR é obtida por transfecção de células HEK293. As células HEK293 são mantidas a 37°C e 5% de CO2 em DMEM alta glicose sem L-glutamina sem meio de piruvato de sódio suplementado com 10% de soro bovino fetal (FBS) e 1% de solução de penicilina-estreptomicina (PS) 100X. As células HEK293 são transfectadas com cada um dos construtos de plasmídeo e combinações dos mesmos usando Lipofectamina 3000. Dois dias pós-transfecção, DNA é extraído e avaliado quanto a mutações e inserções direcionadas no gene CACNA1A. Atividade de nuclease é analisada usando o ensaio Cel-I ou por sequenciamento de profundidade de amplicons compreendendo a sequência alvo CRISPR/Cas12a.
Integração bem-sucedida do transgene é analisada usando PCR (FIG. 5). Exemplo 3: Integração direcionada de DNA no gene ATXN3
[0096] Um transgene direcionando ATXN3 é projetado para substituir a extremidade 3’ da sequência de codificação ATXN (éxons 10 e 11). Um plasmídeo é construído com um transgene projetado para integrar sequência de codificação WT dentro do íntron 9 ou no início de éxon 10 (FIG. 5). O transgene compreende um primeiro braço de homologia que é homólogo à sequência íntron 9 (SEQ ID NO: 10). O primeiro braço de homologia também compreende o sítio alvo para uma nuclease Cas12a e uma sequência aceptora de splice. O primeiro braço de homologia é seguido por uma primeira sequência de codificação compreendendo o éxon 10 e 11 ATXN3 e uma sequência de repetição CAG não expandida. Após a primeira sequência de codificação está uma sequência de terminação SV40 poli(A). Em uma orientação cauda-a-cauda, um segundo conjunto de elementos funcionais está presente. O início do segundo conjunto de elementos compreende um sítio alvo para o nuclease Cas12a seguido por um segundo braço de homologia. O segundo braço de homologia aloja 379 bp que é homólogo à sequência imediatamente após a extremidade de éxon 10 (isto é, o início de íntron 10). Essa sequência foi determinada por meio de análise em silico ter um número limitado de ramificação potencial ou sequências aceptoras de splice. Após o segundo braço de homologia é um segundo aceptor de splice de íntron 1 de beta-actina de carpa. Após o aceptor de splice está uma versão códon otimizada dos éxons 10 e 11 ATXN3 e um terminador bGH poli(A).
[0097] Uma nuclease Cas12a correspondente é projetada para criar três quebras de fita dupla após-transfecção do plasmídeo: i) dentro do íntron 9 do gene endógeno ATXN3, 2) dentro do primeiro braço de homologia no transgene pBA1012-D1, e 3) após o segundo braço de homologia no transgene pBA1012-D1. A sequência alvo para a nuclease Cas12a é mostrada em SEQ ID NO: 11.
[0098] A confirmação da função do transgene e vetores CRISPR é obtida por transfecção de células HEK293. As células HEK293 são mantidas a 37°C e 5% de CO2 em DMEM alta glicose sem L-glutamina sem meio de piruvato de sódio suplementado com 10% de soro bovino fetal (FBS) e 1% de solução de penicilina-estreptomicina (PS) 100X. As células HEK293 são transfectadas com cada um dos construtos de plasmídeo e combinações dos mesmos usando Lipofectamina 3000. Dois dias pós-transfecção, DNA é extraído e avaliado quanto a mutações e inserções direcionadas no gene ATXN3. Atividade de nuclease é analisada usando o ensaio Cel-I ou por sequenciamento de profundidade de amplicons compreendendo a sequência alvo CRISPR/. Integração bem-sucedida do transgene é analisada usando PCR (FIG. 7). Exemplo 4: Integração direcionada de DNA no gene ATXN3 usando transposases Cas12k
[0099] Um transgene direcionando ATXN3 é projetado para substituir a extremidade 3’ da sequência de codificação ATXN (éxons 10 e 11). Um plasmídeo é construído com um transgene projetado para integrar sequência de codificação WT dentro do íntron 9 ou no início de éxon 10. O transgene compreende uma extremidade direita e extremidade esquerda de transposon, um primeiro e segundo aceptor de splice, uma primeira e segunda sequência de codificação (que codifica aminoácidos de éxons 10 e 11), e um primeiro e segundo terminador. A sequência entre as extremidades direita e esquerda de transposon é mostrada em SEQ ID NO: 17.
[00100] Plasmídeos são modificados para expressar o Scytonema hoftnanni tnsB, tnsC, tniQ e Cas12k (SEQ ID NO:30) usando promotores eucarióticos. Um segundo plasmídeo é modificado para expressar o RNA guia
Cas12k correspondente (SEQ ID NO: 14). O RNA guia direcionou a sequência CCGCCCGACCTTTCACTTTC (SEQ ID NO: 15). Os plasmídeos transposon Cas12k são cotransformados em células HEK293 com um plasmídeo alojando o transgene direcionando ATXN3. As células HEK293 são mantidas a 37°C e 5% de CO2 em DMEM alta glicose sem L-glutamina sem meio de piruvato de sódio suplementado com 10% de soro bovino fetal (FBS) e solução de penicilina- estreptomicina 1% (PS) 100X. As células HEK293 são transfectadas com cada um dos construtos de plasmídeo e combinações dos mesmos usando Lipofectamina 3000. Dois dias pós-transfecção, DNA é extraído e avaliado quanto a inserções direcionadas no gene ATXN3. Integração do transgene é analisada usando PCR. Exemplo 5: Integração direcionada de DNA no gene CACNA1A
[00101] Um transgene direcionado para CACNA1A é projetado para substituir a extremidade 3’ da sequência de codificação CACNA1A. Um plasmídeo é construído com um transgene projetado para integrar a sequência de codificação WT dentro do íntron 46 ou no início de éxon 47. O transgene compreende uma extremidade direita e extremidade esquerda de transposon, um primeiro e segundo aceptor de splice, uma primeira e segunda sequência de codificação (que codifica aminoácidos do éxon 47), e um primeiro e segundo terminador.
[00102] Plasmídeos são modificados para expressar o Scytonema hofmanni tnsB, tnsC, tniQ e Cas12k (SEQ ID NO:30) usando promotores eucarióticos. Um segundo plasmídeo é modificado para expressar o RNA guia Cas12k correspondente (SEQ ID NO: 14). O RNA guia é projetado para direcionar a sequência CCCGGATCCCGGCTGTGACC (SEQ ID NO: 16). Os plasmídeos transposon Cas12k são cotransformados em células HEK293 com um plasmídeo alojando o transgene direcionando ATXN3. As células HEK293 são mantidas a 37°C e 5% de CO2 em DMEM alta glicose sem L-glutamina sem meio de piruvato de sódio suplementado com 10% de soro bovino fetal (FBS) e 1% de solução de penicilina-estreptomicina (PS) 100X. As células HEK293 são transfectadas com cada um dos construtos de plasmídeo e combinações dos mesmos usando Lipofectamina 3000. Dois dias pós-transfecção, DNA é extraído e avaliado quanto a inserções direcionadas no gene ATXN3. Integração do transgene é analisada usando PCR.
[00103] Deve-se entender que, embora a invenção tenha sido descrita em combinação com a descrição da mesma, a descrição anterior é destinada a ilustrar e não limitar o escopo da invenção, que é definida pelo escopo das reivindicações anexas. Outros aspectos, vantagens e modificações estão dentro do escopo das reivindicações seguintes.
Claims (26)
1. Método de integrar um transgene em um gene endógeno, o método caracterizado pelo fato de que compreende: a. administrar um transgene, em que o transgene compreende: i. uma primeira e segunda sequência aceptora de splice, ii. uma primeira e segunda sequência de codificação parcial, e iii. um terminador bidirecional ou um primeiro e segundo terminador; b. administrar pelo menos uma endonuclease de corte raro direcionada para um sítio dentro do gene endógeno, em que o transgene é integrado no gene endógeno.
2. Método de acordo com a reivindicação 1, caracterizado pelo fato de que o primeiro aceptor de splice é ligado de forma operacional à primeira sequência de codificação parcial e o segundo aceptor de splice é ligado de forma operacional à segunda sequência de codificação parcial.
3. Método de acordo com a reivindicação 2, caracterizado pelo fato de que a primeira sequência de codificação parcial é ligada de forma operacional ao primeiro terminador, e a segunda sequência de codificação parcial é ligada de forma operacional ao segundo terminador.
4. Método de acordo com a reivindicação 2, caracterizado pelo fato de que as primeira e segunda sequências de codificação parcial são ligadas de forma operacional ao terminador bidirecional.
5. Método de acordo com a reivindicação 3, caracterizado pelo fato de que os primeiro e segundo aceptores de splice, primeira e segunda sequências de codificação, e primeiro e segundo terminadores são orientados em uma orientação cauda-a-cauda.
6. Método de acordo com a reivindicação 5, caracterizado pelo fato de que o transgene compreende ainda um primeiro e segundo sítio alvo para uma ou mais endonucleases de corte raro em que os sítios alvo flanqueiam o primeiro e segundo aceptores de splice.
7. Método de acordo com a reivindicação 5, caracterizado pelo fato de que o transgene compreende ainda um braço de homologia esquerdo e direito que flanqueia o primeiro e segundo aceptores de splice.
8. Método de acordo com a reivindicação 7, caracterizado pelo fato de que o transgene é abrigado dentro de um vetor viral adenoassociado.
9. Método de acordo com a reivindicação 7, caracterizado pelo fato de que o transgene compreende ainda um primeiro e segundo sítio alvo para as uma ou mais endonucleases de corte raro, em que os sítios alvo flanqueiam o primeiro e segundo aceptores de splice.
10. Método de acordo com a reivindicação 9, caracterizado pelo fato de que os primeiro e segundo sítios alvo flanqueiam os primeiro e segundo braços de homologia.
11. Método de acordo com a reivindicação 1, caracterizado pelo fato de que o transgene é integrado dentro de um íntron do gene endógeno ou em uma junção íntron-éxon.
12. Método de acordo com a reivindicação 1, caracterizado pelo fato de que o transgene é integrado dentro de um íntron, ou na junção íntron-éxon do gene ATXN3 ou gene CACNA1A.
13. Método de acordo com a reivindicação 12, caracterizado pelo fato de que o transgene compreende uma primeira e segunda sequência de codificação parcial que codifica o peptídeo produzido pelo éxon 10 de um gene ATXN3 não patogênico e é direcionado para o íntron 9, ou a junção do íntron 9 éxon 10, de um gene ATXN3 patogênico.
14. Método de acordo com a reivindicação 12, caracterizado pelo fato de que o transgene compreende uma primeira e segunda sequência de codificação parcial que codifica o peptídeo produzido pelo éxon 47 de um gene CACNA1A não patogênico e é direcionado para o íntron 46, ou a junção de íntron 46 éxon 47, de um gene CACNA1A patogênico.
15. Método de acordo com a reivindicação 1, caracterizado pelo fato de que a nuclease é uma nuclease CRISPR/Cas12a ou uma nuclease CRISPR/Cas9.
16. Método de acordo com a reivindicação 1, caracterizado pelo fato de que as primeira e segunda sequências de codificação parciais codificam os mesmos aminoácidos.
17. Método de acordo com a reivindicação 1, caracterizado pelo fato de que as primeira e segunda sequências de codificação diferem na sequência de ácido nucleico, mas codificam os mesmos aminoácidos.
18. Método de acordo com a reivindicação 1, caracterizado pelo fato de que o transgene é abrigado em um vetor, em que o formato do vetor é selecionado a partir de DNA linear de fita dupla, DNA circular de fita dupla, ou um vetor viral.
19. Método de acordo com a reivindicação 18, caracterizado pelo fato de que o vetor viral é selecionado a partir de um vetor de adenovírus, um vetor de vírus adenoassociado, ou um vetor de lentivírus.
20. Método de acordo com a reivindicação 19, caracterizado pelo fato de que o transgene é igual ou menor que 4,7 kb.
21. Método de acordo com a reivindicação 1, caracterizado pelo fato de que o dito gene endógeno é o gene tipo selvagem das ditas sequências de codificação parciais.
22. Método de acordo com a reivindicação 21, caracterizado pelo fato de que o dito gene endógeno é aberrante e as sequências de codificação parciais codificam uma proteína parcial de uma versão funcional do dito gene endógeno.
23. Polinucleotídeo de DNA, caracterizado pelo fato de que compreende:
a. uma primeira e segunda sequência aceptora de splice, b. uma primeira e segunda sequência de codificação parcial, c. um terminador bidirecional ou um primeiro e segundo terminador, d. opcionalmente, um primeiro e segundo braço de homologia, e e. opcionalmente, um primeiro e segundo sítio alvo de endonuclease de corte raro.
24. Método de integrar um transgene em um gene endógeno, o método caracterizado pelo fato de que compreende: a. administrar um transgene, em que o transgene compreende i. uma extremidade de transposon esquerda e direita, ii. uma primeira e segunda sequência aceptora de splice, iii. uma primeira e segunda sequência de codificação parcial, e iv. um terminador bidirecional ou um primeiro e segundo terminador; b. administrar uma transposase em que o transgene é integrado no gene endógeno.
25. Método de integrar um transgene em um gene endógeno, o método caracterizado pelo fato de que compreende: a. administrar um transgene, em que o transgene compreende i. uma primeira e segunda sequência aceptora de splice, ii. uma primeira e segunda sequência de codificação, e iii. um terminador bidirecional ou um primeiro e segundo terminador; b. administrar pelo menos uma endonuclease de corte raro direcionada para um sítio dentro do gene endógeno, em que o transgene é integrado no gene endógeno.
26. Método de integrar um transgene em um gene endógeno, o método caracterizado pelo fato de que compreende: a. administrar um transgene, em que o transgene compreende i. uma primeira e segunda sequência aceptora de splice, ii. uma primeira e segunda sequência de codificação, iii. um terminador bidirecional ou um primeiro e segundo terminador, e iv. um primeiro e segundo braço de homologia em que o transgene é integrado no gene endógeno.
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862746497P | 2018-10-16 | 2018-10-16 | |
US62/746,497 | 2018-10-16 | ||
US201962830654P | 2019-04-08 | 2019-04-08 | |
US62/830,654 | 2019-04-08 | ||
US201962864432P | 2019-06-20 | 2019-06-20 | |
US62/864,432 | 2019-06-20 | ||
PCT/US2019/056083 WO2020081438A1 (en) | 2018-10-16 | 2019-10-14 | Methods for targeted insertion of dna in genes |
Publications (1)
Publication Number | Publication Date |
---|---|
BR112021007229A2 true BR112021007229A2 (pt) | 2021-08-10 |
Family
ID=68393107
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
BR112021007229-2A BR112021007229A2 (pt) | 2018-10-16 | 2019-10-14 | métodos para inserção dirigida de dna em genes |
Country Status (13)
Country | Link |
---|---|
US (12) | US20200115700A1 (pt) |
EP (1) | EP3867372A1 (pt) |
JP (1) | JP7460643B2 (pt) |
KR (1) | KR20210091167A (pt) |
CN (1) | CN113166754A (pt) |
AU (2) | AU2019360182B2 (pt) |
BR (1) | BR112021007229A2 (pt) |
CA (1) | CA3116553A1 (pt) |
DE (1) | DE112019005166T5 (pt) |
GB (2) | GB2611929B (pt) |
IL (1) | IL282290A (pt) |
SG (1) | SG11202103917VA (pt) |
WO (1) | WO2020081438A1 (pt) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US12054754B2 (en) | 2017-11-02 | 2024-08-06 | Arbor Biotechnologies, Inc. | CRISPR-associated transposon systems and components |
KR20210091167A (ko) * | 2018-10-16 | 2021-07-21 | 블루알렐, 엘엘씨 | 유전자에서 dna의 표적화 삽입을 위한 방법 |
TW202027797A (zh) | 2018-10-18 | 2020-08-01 | 美商英特利亞醫療公司 | 用於治療α-1抗胰蛋白酶不足的組成物及方法 |
JP7472121B2 (ja) * | 2018-10-18 | 2024-04-22 | インテリア セラピューティクス,インコーポレーテッド | アルブミン遺伝子座からの導入遺伝子発現のための組成物及び方法 |
SG11202103734PA (en) * | 2018-10-18 | 2021-05-28 | Intellia Therapeutics Inc | Compositions and methods for expressing factor ix |
EP3867376A1 (en) | 2018-10-18 | 2021-08-25 | Intellia Therapeutics, Inc. | Nucleic acid constructs and methods of use |
US20230212538A1 (en) * | 2020-03-30 | 2023-07-06 | Blueallele, Llc | Methods for integrating dna into genes with gain-of-function or loss-of-function mutations |
KR20230123460A (ko) * | 2020-09-29 | 2023-08-23 | 뉴엑셀 테라퓨틱스 아이엔씨. | Neurod1 벡터 |
US20240018493A1 (en) * | 2020-11-10 | 2024-01-18 | The Board Of Trustees Of The Leland Stanford Junior University | Knock-in of large dna for long-term high genomic expression |
Family Cites Families (81)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SG48698A1 (en) | 1993-04-21 | 1998-05-18 | Univ Edinburgh | Expression of heterologous genes |
JP2001507577A (ja) | 1996-12-31 | 2001-06-12 | ジョージ エイ ガイタナリス | 哺乳動物の遺伝子に変異を導入するためのベクターおよび方法 |
US7316923B1 (en) * | 1997-09-26 | 2008-01-08 | Athersys, Inc. | Compositions and methods for non-targeted activation of endogenous genes |
CA2474486C (en) * | 2002-01-23 | 2013-05-14 | The University Of Utah Research Foundation | Targeted chromosomal mutagenesis using zinc finger nucleases |
US20040106566A1 (en) | 2002-05-17 | 2004-06-03 | Shi-Lung Lin | RNA-splicing and processing-directed gene silencing and the relative applications thereof |
US7888121B2 (en) * | 2003-08-08 | 2011-02-15 | Sangamo Biosciences, Inc. | Methods and compositions for targeted cleavage and recombination |
US20140271782A1 (en) | 2013-03-15 | 2014-09-18 | Dermazone Solutions, Inc. | Method for preparing nanolipids with encapsulated alcohol |
GB0903207D0 (en) * | 2009-02-25 | 2009-04-08 | Ucb Pharma Sa | Method for expressing multimeric proteins |
EP2425000B1 (en) | 2009-04-30 | 2019-02-20 | The Trustees Of The University Of Pennsylvania | Compositions for targeting conducting airway cells comprising adeno-associated virus constructs |
WO2013012729A2 (en) * | 2011-07-15 | 2013-01-24 | E. I. Du Pont De Nemours And Company | Novel plant terminator sequences |
WO2013075008A1 (en) | 2011-11-16 | 2013-05-23 | University Of Florida Research Foundation Inc. | Aav dual vector systems for gene therapy |
EP2825652B1 (en) | 2012-03-15 | 2018-09-05 | Omeros Corporation | Composition and method for diversification of target sequences |
ES2828663T3 (es) | 2012-04-18 | 2021-05-27 | Univ Leland Stanford Junior | Dirección genética no disruptiva |
JP6559063B2 (ja) | 2012-05-07 | 2019-08-14 | サンガモ セラピューティクス, インコーポレイテッド | 導入遺伝子のヌクレアーゼ媒介標的化組み込みのための方法および組成物 |
UA119135C2 (uk) | 2012-09-07 | 2019-05-10 | ДАУ АГРОСАЙЄНСІЗ ЕлЕлСі | Спосіб отримання трансгенної рослини |
AU2013355327A1 (en) | 2012-12-05 | 2015-06-11 | Sangamo Therapeutics, Inc. | Methods and compositions for regulation of metabolic disorders |
BR112015012375A2 (pt) | 2012-12-06 | 2017-09-26 | Sigma Aldrich Co Llc | modificação e regulação de genoma à base de crispr |
WO2014144155A1 (en) | 2013-03-15 | 2014-09-18 | Regents Of The University Of Minnesota | Engineering plant genomes using crispr/cas systems |
EP2986709A4 (en) | 2013-04-16 | 2017-03-15 | University Of Washington Through Its Center For Commercialization | Activating an alternative pathway for homology-directed repair to stimulate targeted gene correction and genome engineering |
US9944925B2 (en) | 2013-08-02 | 2018-04-17 | Enevolv, Inc. | Processes and host cells for genome, pathway, and biomolecular engineering |
RU2668819C2 (ru) | 2013-09-04 | 2018-10-02 | ДАУ АГРОСАЙЕНСИЗ ЭлЭлСи | Быстрый направленный анализ сельскохозяйственных культур для определения донорной вставки |
AR098283A1 (es) | 2013-11-04 | 2016-05-26 | Dow Agrosciences Llc | Polinucleótido donante universal para reconocimiento de genes |
EP3071695A2 (en) | 2013-11-18 | 2016-09-28 | Crispr Therapeutics AG | Crispr-cas system materials and methods |
KR20160097331A (ko) * | 2013-12-12 | 2016-08-17 | 더 브로드 인스티튜트, 인코퍼레이티드 | 뉴클레오티드 반복 장애에서의 crispr-cas 시스템의 조성물 및 방법 및 용도 |
EP3114227B1 (en) | 2014-03-05 | 2021-07-21 | Editas Medicine, Inc. | Crispr/cas-related methods and compositions for treating usher syndrome and retinitis pigmentosa |
EP3122880B1 (en) | 2014-03-26 | 2021-05-05 | Editas Medicine, Inc. | Crispr/cas-related methods and compositions for treating sickle cell disease |
EP3126495A1 (en) | 2014-04-02 | 2017-02-08 | Editas Medicine, Inc. | Crispr/cas-related methods and compositions for treating primary open angle glaucoma |
WO2015157070A2 (en) | 2014-04-09 | 2015-10-15 | Editas Medicine, Inc. | Crispr/cas-related methods and compositions for treating cystic fibrosis |
GB201407852D0 (en) | 2014-05-02 | 2014-06-18 | Iontas Ltd | Preparation of libraries od protein variants expressed in eukaryotic cells and use for selecting binding molecules |
US20170088819A1 (en) | 2014-05-16 | 2017-03-30 | Vrije Universiteit Brussel | Genetic correction of myotonic dystrophy type 1 |
WO2016033246A1 (en) | 2014-08-27 | 2016-03-03 | Caribou Biosciences, Inc. | Methods for increasing cas9-mediated engineering efficiency |
EP3204513A2 (en) | 2014-10-09 | 2017-08-16 | Life Technologies Corporation | Crispr oligonucleotides and gene editing |
CA2963820A1 (en) | 2014-11-07 | 2016-05-12 | Editas Medicine, Inc. | Methods for improving crispr/cas-mediated genome-editing |
KR102350405B1 (ko) | 2014-12-16 | 2022-01-11 | 다니스코 유에스 인크. | 진균 게놈 변형 시스템 및 사용 방법 |
WO2016109840A2 (en) * | 2014-12-31 | 2016-07-07 | Synthetic Genomics, Inc. | Compositions and methods for high efficiency in vivo genome editing |
EP3274454B1 (en) | 2015-03-25 | 2021-08-25 | Editas Medicine, Inc. | Crispr/cas-related methods, compositions and components |
WO2016154579A2 (en) | 2015-03-26 | 2016-09-29 | Editas Medicine, Inc. | Crispr/cas-mediated gene conversion |
AU2016244033A1 (en) | 2015-04-01 | 2017-10-19 | Editas Medicine, Inc. | CRISPR/CAS-related methods and compositions for treating Duchenne Muscular Dystrophy and Becker Muscular Dystrophy |
US11180793B2 (en) | 2015-04-24 | 2021-11-23 | Editas Medicine, Inc. | Evaluation of Cas9 molecule/guide RNA molecule complexes |
JP6851319B2 (ja) | 2015-04-27 | 2021-03-31 | ザ・トラステイーズ・オブ・ザ・ユニバーシテイ・オブ・ペンシルベニア | ヒト疾患のCRISPR/Cas9媒介性の修正のためのデュアルAAVベクター系 |
WO2016183236A1 (en) | 2015-05-11 | 2016-11-17 | Editas Medicine, Inc. | Crispr/cas-related methods and compositions for treating hiv infection and aids |
CA2986310A1 (en) | 2015-05-11 | 2016-11-17 | Editas Medicine, Inc. | Optimized crispr/cas9 systems and methods for gene editing in stem cells |
EP3307887A1 (en) | 2015-06-09 | 2018-04-18 | Editas Medicine, Inc. | Crispr/cas-related methods and compositions for improving transplantation |
US11555207B2 (en) | 2015-06-17 | 2023-01-17 | The Uab Research Foundation | CRISPR/Cas9 complex for introducing a functional polypeptide into cells of blood cell lineage |
KR102691636B1 (ko) | 2015-08-31 | 2024-08-02 | 애질런트 테크놀로지스, 인크. | 상동 재조합에 의한 crispr/cas-기반 게놈 편집을 위한 화합물 및 방법 |
WO2017048995A1 (en) | 2015-09-15 | 2017-03-23 | Mirimus, Inc. | Inducible crispr/cas9 and rnai systems and methods of use |
EP3786294A1 (en) | 2015-09-24 | 2021-03-03 | Editas Medicine, Inc. | Use of exonucleases to improve crispr/cas-mediated genome editing |
DK3350327T3 (en) | 2015-10-23 | 2019-01-21 | Caribou Biosciences Inc | CONSTRUCTED CRISPR CLASS-2-NUCLEIC ACID TARGETING-NUCLEIC ACID |
US10240145B2 (en) | 2015-11-25 | 2019-03-26 | The Board Of Trustees Of The Leland Stanford Junior University | CRISPR/Cas-mediated genome editing to treat EGFR-mutant lung cancer |
WO2017155408A1 (en) | 2016-03-11 | 2017-09-14 | Erasmus University Medical Center Rotterdam | Improved crispr-cas9 genome editing tool |
WO2017155407A1 (en) | 2016-03-11 | 2017-09-14 | Wageningen Universiteit | Improved crispr-cpf1 genome editing tool |
EP3443086B1 (en) | 2016-04-13 | 2021-11-24 | Editas Medicine, Inc. | Cas9 fusion molecules, gene editing systems, and methods of use thereof |
JP7075597B2 (ja) | 2016-05-05 | 2022-05-26 | デューク ユニバーシティ | デュシェンヌ型筋ジストロフィーを治療するためのcrispr/cas関連の方法および組成物 |
EP3464587B1 (en) | 2016-05-27 | 2020-12-16 | Life Technologies Corporation | Compositions and methods for enhancing homologous recombination |
EP3472321A2 (en) | 2016-06-17 | 2019-04-24 | Genesis Technologies Limited | Crispr-cas system, materials and methods |
MX2019000251A (es) | 2016-07-05 | 2019-10-09 | Univ Johns Hopkins | Composiciones y metodos que comprenden mejoras de los arn guias de crispr usando el promotor h1. |
EP3481434A4 (en) | 2016-07-05 | 2020-06-24 | The Johns Hopkins University | CRISPR / CAS9 COMPOSITIONS AND METHODS FOR TREATING RETINE DEGENERENCES |
JP6829761B2 (ja) | 2016-09-29 | 2021-02-10 | エフ.ホフマン−ラ ロシュ アーゲーF. Hoffmann−La Roche Aktiengesellschaft | 遺伝子編集モジュールおよび遺伝子送達アプローチを解析および最適化するための方法 |
JP7215716B2 (ja) * | 2017-01-13 | 2023-01-31 | 学校法人自治医科大学 | 肝臓ゲノム上の凝固関連因子遺伝子を破壊するためのaavベクター |
WO2018152325A1 (en) | 2017-02-15 | 2018-08-23 | Bluebird Bio, Inc. | Donor repair templates multiplex genome editing |
US20180362590A1 (en) | 2017-04-14 | 2018-12-20 | Synthetic Genomics, Inc. | Polypeptides with type v crispr activity and uses thereof |
US11773409B2 (en) | 2017-04-21 | 2023-10-03 | The Board Of Trustees Of The Leland Stanford Junior University | CRISPR/Cas 9-mediated integration of polynucleotides by sequential homologous recombination of AAV donor vectors |
WO2018197020A1 (en) | 2017-04-27 | 2018-11-01 | Novozymes A/S | Genome editing by crispr-cas9 using short donor oligonucleotides |
WO2019005851A1 (en) | 2017-06-26 | 2019-01-03 | Arizona Board Of Regents On Behalf Of Arizona State University | UNIVERSAL PLATFORM FOR ENHANCED CRISPR GENE EDITION FOR IN VIVO THERAPIES |
US20200231974A1 (en) * | 2017-07-18 | 2020-07-23 | Genovie Ab | A two-component vector library system for rapid assembly and diversification of full-length t-cell receptor open reading frames |
KR20200033259A (ko) | 2017-07-31 | 2020-03-27 | 리제너론 파마슈티칼스 인코포레이티드 | 생체내에서 CRISPR/Cas-매개된 파괴 또는 삭제 및 외인성 도너 핵산과의 CRISPR/Cas-유도된 재조합을 평가하기 위한 방법 및 조성물 |
US20190032156A1 (en) | 2017-07-31 | 2019-01-31 | Regeneron Pharmaceuticals, Inc. | Methods and compositions for assessing crispr/cas-induced recombination with an exogenous donor nucleic acid in vivo |
EP3707155A2 (en) | 2017-11-09 | 2020-09-16 | Vertex Pharmaceuticals Incorporated | Crispr/cas systems for treatment of dmd |
AU2018378479A1 (en) | 2017-12-05 | 2020-06-18 | Vertex Pharmaceuticals Incorporated | CRISPR-Cas9 modified CD34+ human hematopoietic stem and progenitor cells and uses thereof |
EP3723813A4 (en) | 2017-12-15 | 2021-10-06 | Regents of the University of Minnesota | CRISPR-MEDIATED GENOME EDITING WITH VECTORS |
KR20200119239A (ko) | 2018-02-08 | 2020-10-19 | 지머젠 인코포레이티드 | 코리네박테리움에서 crispr을 사용하는 게놈 편집 |
CN118345049A (zh) | 2018-03-13 | 2024-07-16 | 明尼苏达大学董事会 | 使用Cas9碱基编辑器的淋巴造血改造 |
CA3092088A1 (en) | 2018-03-15 | 2019-09-19 | Igtx, Llc | Synthetic dna vectors and methods of use |
JP7334178B2 (ja) | 2018-03-19 | 2023-08-28 | リジェネロン・ファーマシューティカルズ・インコーポレイテッド | CRISPR/Cas系を使用した動物での転写モジュレーション |
CN112469823A (zh) | 2018-04-27 | 2021-03-09 | 西雅图儿童医院d/b/a西雅图儿童研究所 | 布鲁顿氏酪氨酸激酶的基于talen和基于crispr/cas的基因编辑 |
US11827877B2 (en) * | 2018-06-28 | 2023-11-28 | Crispr Therapeutics Ag | Compositions and methods for genomic editing by insertion of donor polynucleotides |
KR20210091167A (ko) * | 2018-10-16 | 2021-07-21 | 블루알렐, 엘엘씨 | 유전자에서 dna의 표적화 삽입을 위한 방법 |
EP3867376A1 (en) | 2018-10-18 | 2021-08-25 | Intellia Therapeutics, Inc. | Nucleic acid constructs and methods of use |
JP7472121B2 (ja) * | 2018-10-18 | 2024-04-22 | インテリア セラピューティクス,インコーポレーテッド | アルブミン遺伝子座からの導入遺伝子発現のための組成物及び方法 |
TW202027797A (zh) | 2018-10-18 | 2020-08-01 | 美商英特利亞醫療公司 | 用於治療α-1抗胰蛋白酶不足的組成物及方法 |
SG11202103734PA (en) | 2018-10-18 | 2021-05-28 | Intellia Therapeutics Inc | Compositions and methods for expressing factor ix |
-
2019
- 2019-10-14 KR KR1020217014640A patent/KR20210091167A/ko unknown
- 2019-10-14 CA CA3116553A patent/CA3116553A1/en active Pending
- 2019-10-14 EP EP19795751.7A patent/EP3867372A1/en active Pending
- 2019-10-14 DE DE112019005166.0T patent/DE112019005166T5/de active Pending
- 2019-10-14 GB GB2300487.2A patent/GB2611929B/en active Active
- 2019-10-14 GB GB2106906.7A patent/GB2593353B/en active Active
- 2019-10-14 US US16/601,144 patent/US20200115700A1/en not_active Abandoned
- 2019-10-14 CN CN201980079879.4A patent/CN113166754A/zh active Pending
- 2019-10-14 JP JP2021546192A patent/JP7460643B2/ja active Active
- 2019-10-14 WO PCT/US2019/056083 patent/WO2020081438A1/en unknown
- 2019-10-14 AU AU2019360182A patent/AU2019360182B2/en active Active
- 2019-10-14 BR BR112021007229-2A patent/BR112021007229A2/pt unknown
- 2019-10-14 SG SG11202103917VA patent/SG11202103917VA/en unknown
-
2020
- 2020-02-25 US US16/800,444 patent/US11091756B2/en active Active
-
2021
- 2021-04-13 IL IL282290A patent/IL282290A/en unknown
- 2021-07-02 US US17/366,290 patent/US11254930B2/en active Active
-
2022
- 2022-02-01 US US17/590,613 patent/US11365407B2/en active Active
- 2022-06-01 US US17/830,011 patent/US12054706B2/en active Active
-
2023
- 2023-05-09 AU AU2023202878A patent/AU2023202878A1/en active Pending
- 2023-12-01 US US18/526,713 patent/US20240141317A1/en active Pending
- 2023-12-01 US US18/526,772 patent/US20240141320A1/en active Pending
- 2023-12-01 US US18/526,826 patent/US20240141323A1/en active Pending
- 2023-12-01 US US18/526,808 patent/US20240141322A1/en active Pending
- 2023-12-01 US US18/526,758 patent/US20240141319A1/en active Pending
- 2023-12-01 US US18/526,745 patent/US11993770B2/en active Active
- 2023-12-01 US US18/526,794 patent/US20240141321A1/en active Pending
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11993770B2 (en) | Methods for targeted insertion of DNA in genes | |
US20200140893A1 (en) | Methods for altering gene expression for genetic disorders | |
US20230190962A1 (en) | Methods for treating gain-of-function disorders combining gene editing and gene therapy | |
US20200140854A1 (en) | Methods for comparing efficacy of donor molecules | |
US20230212538A1 (en) | Methods for integrating dna into genes with gain-of-function or loss-of-function mutations | |
US20210317436A1 (en) | Methods and compositions for modifying the von willebrand factor gene |