KR20240005950A - 벡터 시스템 - Google Patents
벡터 시스템 Download PDFInfo
- Publication number
- KR20240005950A KR20240005950A KR1020237042749A KR20237042749A KR20240005950A KR 20240005950 A KR20240005950 A KR 20240005950A KR 1020237042749 A KR1020237042749 A KR 1020237042749A KR 20237042749 A KR20237042749 A KR 20237042749A KR 20240005950 A KR20240005950 A KR 20240005950A
- Authority
- KR
- South Korea
- Prior art keywords
- vector
- sequence
- transgene
- intron
- terminal portion
- Prior art date
Links
- 239000013598 vector Substances 0.000 title claims abstract description 451
- 108700019146 Transgenes Proteins 0.000 claims abstract description 222
- 108091026890 Coding region Proteins 0.000 claims abstract description 49
- 238000002744 homologous recombination Methods 0.000 claims abstract description 25
- 230000006801 homologous recombination Effects 0.000 claims abstract description 25
- 239000002773 nucleotide Substances 0.000 claims description 73
- 125000003729 nucleotide group Chemical group 0.000 claims description 73
- 241000829100 Macaca mulatta polyomavirus 1 Species 0.000 claims description 43
- 239000013607 AAV vector Substances 0.000 claims description 40
- 238000000034 method Methods 0.000 claims description 37
- 239000012634 fragment Substances 0.000 claims description 35
- 230000008488 polyadenylation Effects 0.000 claims description 32
- 238000011282 treatment Methods 0.000 claims description 17
- 208000014769 Usher Syndromes Diseases 0.000 claims description 14
- 241000700605 Viruses Species 0.000 claims description 14
- 239000013603 viral vector Substances 0.000 claims description 12
- 238000002560 therapeutic procedure Methods 0.000 claims description 7
- 208000036956 Usher syndrome type 1B Diseases 0.000 claims description 6
- 102000003505 Myosin Human genes 0.000 claims description 5
- 108060008487 Myosin Proteins 0.000 claims description 5
- 230000002265 prevention Effects 0.000 claims description 3
- 230000002463 transducing effect Effects 0.000 claims description 2
- 210000004027 cell Anatomy 0.000 description 81
- 150000007523 nucleic acids Chemical group 0.000 description 74
- 108020004414 DNA Proteins 0.000 description 71
- 108091028043 Nucleic acid sequence Proteins 0.000 description 67
- 108090000623 proteins and genes Proteins 0.000 description 55
- 230000006870 function Effects 0.000 description 45
- 239000000370 acceptor Substances 0.000 description 43
- 101000801643 Homo sapiens Retinal-specific phospholipid-transporting ATPase ABCA4 Proteins 0.000 description 38
- 102100033617 Retinal-specific phospholipid-transporting ATPase ABCA4 Human genes 0.000 description 38
- 210000000234 capsid Anatomy 0.000 description 29
- 230000009977 dual effect Effects 0.000 description 25
- 239000003623 enhancer Substances 0.000 description 25
- 239000002245 particle Substances 0.000 description 23
- 238000001262 western blot Methods 0.000 description 23
- 241001164825 Adeno-associated virus - 8 Species 0.000 description 22
- 235000018102 proteins Nutrition 0.000 description 22
- 102000004169 proteins and genes Human genes 0.000 description 22
- 239000013612 plasmid Substances 0.000 description 19
- 210000003583 retinal pigment epithelium Anatomy 0.000 description 19
- 108090000565 Capsid Proteins Proteins 0.000 description 18
- 102100023321 Ceruloplasmin Human genes 0.000 description 18
- 230000003612 virological effect Effects 0.000 description 18
- 235000001014 amino acid Nutrition 0.000 description 16
- 239000000203 mixture Substances 0.000 description 16
- 239000002609 medium Substances 0.000 description 15
- 208000002267 Anti-neutrophil cytoplasmic antibody-associated vasculitis Diseases 0.000 description 14
- 201000007737 Retinal degeneration Diseases 0.000 description 14
- 239000007924 injection Substances 0.000 description 14
- 238000002347 injection Methods 0.000 description 14
- 230000004258 retinal degeneration Effects 0.000 description 14
- 241000702423 Adeno-associated virus - 2 Species 0.000 description 13
- 241000699670 Mus sp. Species 0.000 description 13
- 229940024606 amino acid Drugs 0.000 description 13
- 150000001413 amino acids Chemical group 0.000 description 13
- 239000012537 formulation buffer Substances 0.000 description 13
- 238000006467 substitution reaction Methods 0.000 description 13
- 125000003275 alpha amino acid group Chemical group 0.000 description 12
- 108020004707 nucleic acids Proteins 0.000 description 12
- 102000039446 nucleic acids Human genes 0.000 description 12
- 101000834253 Gallus gallus Actin, cytoplasmic 1 Proteins 0.000 description 11
- 238000002105 Southern blotting Methods 0.000 description 11
- 238000012217 deletion Methods 0.000 description 11
- 230000037430 deletion Effects 0.000 description 11
- 210000002780 melanosome Anatomy 0.000 description 11
- 239000003795 chemical substances by application Substances 0.000 description 10
- 108090000765 processed proteins & peptides Proteins 0.000 description 10
- NCYCYZXNIZJOKI-UHFFFAOYSA-N vitamin A aldehyde Natural products O=CC=C(C)C=CC=C(C)C=CC1=C(C)CCCC1(C)C NCYCYZXNIZJOKI-UHFFFAOYSA-N 0.000 description 10
- 108020004705 Codon Proteins 0.000 description 9
- 201000003533 Leber congenital amaurosis Diseases 0.000 description 9
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 9
- 208000027073 Stargardt disease Diseases 0.000 description 9
- 239000000356 contaminant Substances 0.000 description 9
- 238000003780 insertion Methods 0.000 description 9
- 230000037431 insertion Effects 0.000 description 9
- 108091008695 photoreceptors Proteins 0.000 description 9
- 238000011002 quantification Methods 0.000 description 9
- 230000006798 recombination Effects 0.000 description 9
- 238000005215 recombination Methods 0.000 description 9
- 230000002207 retinal effect Effects 0.000 description 9
- 238000001890 transfection Methods 0.000 description 9
- 241000702421 Dependoparvovirus Species 0.000 description 8
- 101001040800 Homo sapiens Integral membrane protein GPR180 Proteins 0.000 description 8
- 102100021244 Integral membrane protein GPR180 Human genes 0.000 description 8
- 241000699666 Mus <mouse, genus> Species 0.000 description 8
- -1 USH2a Proteins 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 8
- 201000010099 disease Diseases 0.000 description 8
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 8
- 230000035772 mutation Effects 0.000 description 8
- 238000002360 preparation method Methods 0.000 description 8
- 230000010076 replication Effects 0.000 description 8
- 239000000523 sample Substances 0.000 description 8
- 208000007014 Retinitis pigmentosa Diseases 0.000 description 7
- 102100040756 Rhodopsin Human genes 0.000 description 7
- 108010006025 bovine growth hormone Proteins 0.000 description 7
- 230000001965 increasing effect Effects 0.000 description 7
- 208000017532 inherited retinal dystrophy Diseases 0.000 description 7
- 102000040430 polynucleotide Human genes 0.000 description 7
- 108091033319 polynucleotide Proteins 0.000 description 7
- 239000002157 polynucleotide Substances 0.000 description 7
- 229920001184 polypeptide Polymers 0.000 description 7
- 102000004196 processed proteins & peptides Human genes 0.000 description 7
- 239000002904 solvent Substances 0.000 description 7
- 108091092195 Intron Proteins 0.000 description 6
- 241001465754 Metazoa Species 0.000 description 6
- 238000001415 gene therapy Methods 0.000 description 6
- 238000000338 in vitro Methods 0.000 description 6
- 238000004519 manufacturing process Methods 0.000 description 6
- 238000005259 measurement Methods 0.000 description 6
- 108020004999 messenger RNA Proteins 0.000 description 6
- 239000013642 negative control Substances 0.000 description 6
- 238000004806 packaging method and process Methods 0.000 description 6
- 210000001525 retina Anatomy 0.000 description 6
- 239000000243 solution Substances 0.000 description 6
- 238000011144 upstream manufacturing Methods 0.000 description 6
- 241001634120 Adeno-associated virus - 5 Species 0.000 description 5
- 241001164823 Adeno-associated virus - 7 Species 0.000 description 5
- 102000004168 Dysferlin Human genes 0.000 description 5
- 238000000540 analysis of variance Methods 0.000 description 5
- 108010048367 enhanced green fluorescent protein Proteins 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 5
- 238000001727 in vivo Methods 0.000 description 5
- 230000001404 mediated effect Effects 0.000 description 5
- 239000008194 pharmaceutical composition Substances 0.000 description 5
- 201000005932 Alstrom Syndrome Diseases 0.000 description 4
- 238000011740 C57BL/6 mouse Methods 0.000 description 4
- 102100022509 Cadherin-23 Human genes 0.000 description 4
- 108090000620 Dysferlin Proteins 0.000 description 4
- 101000899442 Homo sapiens Cadherin-23 Proteins 0.000 description 4
- 108020005202 Viral DNA Proteins 0.000 description 4
- 238000007792 addition Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 231100000673 dose–response relationship Toxicity 0.000 description 4
- 230000002068 genetic effect Effects 0.000 description 4
- 208000015181 infectious disease Diseases 0.000 description 4
- 239000003550 marker Substances 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- YBYRMVIVWMBXKQ-UHFFFAOYSA-N phenylmethanesulfonyl fluoride Chemical compound FS(=O)(=O)CC1=CC=CC=C1 YBYRMVIVWMBXKQ-UHFFFAOYSA-N 0.000 description 4
- 239000002953 phosphate buffered saline Substances 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 239000011780 sodium chloride Substances 0.000 description 4
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 3
- NCYCYZXNIZJOKI-IOUUIBBYSA-N 11-cis-retinal Chemical compound O=C/C=C(\C)/C=C\C=C(/C)\C=C\C1=C(C)CCCC1(C)C NCYCYZXNIZJOKI-IOUUIBBYSA-N 0.000 description 3
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 3
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 3
- 241001655883 Adeno-associated virus - 1 Species 0.000 description 3
- 241000202702 Adeno-associated virus - 3 Species 0.000 description 3
- 241000580270 Adeno-associated virus - 4 Species 0.000 description 3
- 241000972680 Adeno-associated virus - 6 Species 0.000 description 3
- 241000649045 Adeno-associated virus 10 Species 0.000 description 3
- 241000649046 Adeno-associated virus 11 Species 0.000 description 3
- 102100036799 Adhesion G-protein coupled receptor V1 Human genes 0.000 description 3
- 102100032360 Alstrom syndrome protein 1 Human genes 0.000 description 3
- 102100035673 Centrosomal protein of 290 kDa Human genes 0.000 description 3
- 101710198317 Centrosomal protein of 290 kDa Proteins 0.000 description 3
- 108091028732 Concatemer Proteins 0.000 description 3
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 3
- LYCAIKOWRPUZTN-UHFFFAOYSA-N Ethylene glycol Chemical compound OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 description 3
- 241000282412 Homo Species 0.000 description 3
- 101000928167 Homo sapiens Adhesion G-protein coupled receptor V1 Proteins 0.000 description 3
- 101000797795 Homo sapiens Alstrom syndrome protein 1 Proteins 0.000 description 3
- 101710128836 Large T antigen Proteins 0.000 description 3
- DNIAPMSPPWPWGF-UHFFFAOYSA-N Propylene glycol Chemical compound CC(O)CO DNIAPMSPPWPWGF-UHFFFAOYSA-N 0.000 description 3
- 102000004330 Rhodopsin Human genes 0.000 description 3
- 108090000820 Rhodopsin Proteins 0.000 description 3
- 241000700584 Simplexvirus Species 0.000 description 3
- 108020004566 Transfer RNA Proteins 0.000 description 3
- 125000000539 amino acid group Chemical group 0.000 description 3
- 210000004369 blood Anatomy 0.000 description 3
- 239000008280 blood Substances 0.000 description 3
- 239000003085 diluting agent Substances 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 239000003446 ligand Substances 0.000 description 3
- 239000007788 liquid Substances 0.000 description 3
- 238000011068 loading method Methods 0.000 description 3
- 208000002780 macular degeneration Diseases 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 230000025609 melanosome localization Effects 0.000 description 3
- 238000009126 molecular therapy Methods 0.000 description 3
- 239000000546 pharmaceutical excipient Substances 0.000 description 3
- 239000013641 positive control Substances 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 238000007619 statistical method Methods 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 230000001225 therapeutic effect Effects 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 241000701161 unidentified adenovirus Species 0.000 description 3
- 239000003981 vehicle Substances 0.000 description 3
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 2
- 241000710929 Alphavirus Species 0.000 description 2
- 229920003319 Araldite® Polymers 0.000 description 2
- 238000000035 BCA protein assay Methods 0.000 description 2
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 2
- 108091035707 Consensus sequence Proteins 0.000 description 2
- 230000004543 DNA replication Effects 0.000 description 2
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 2
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 2
- 108700024394 Exon Proteins 0.000 description 2
- 102000013366 Filamin Human genes 0.000 description 2
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 2
- 101001028804 Homo sapiens Protein eyes shut homolog Proteins 0.000 description 2
- 101001128468 Homo sapiens Unconventional myosin-VIIa Proteins 0.000 description 2
- 239000012741 Laemmli sample buffer Substances 0.000 description 2
- 241000713666 Lentivirus Species 0.000 description 2
- 208000035719 Maculopathy Diseases 0.000 description 2
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- 241001529936 Murinae Species 0.000 description 2
- 241000709664 Picornaviridae Species 0.000 description 2
- 229940124158 Protease/peptidase inhibitor Drugs 0.000 description 2
- 102100037166 Protein eyes shut homolog Human genes 0.000 description 2
- 239000012083 RIPA buffer Substances 0.000 description 2
- 108020005067 RNA Splice Sites Proteins 0.000 description 2
- 239000008156 Ringer's lactate solution Substances 0.000 description 2
- 101710185500 Small t antigen Proteins 0.000 description 2
- 108010067390 Viral Proteins Proteins 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 239000004480 active ingredient Substances 0.000 description 2
- AIYUHDOJVYHVIT-UHFFFAOYSA-M caesium chloride Chemical compound [Cl-].[Cs+] AIYUHDOJVYHVIT-UHFFFAOYSA-M 0.000 description 2
- 125000002091 cationic group Chemical group 0.000 description 2
- 238000002659 cell therapy Methods 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 238000003776 cleavage reaction Methods 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 230000009089 cytolysis Effects 0.000 description 2
- 230000002950 deficient Effects 0.000 description 2
- 229940009976 deoxycholate Drugs 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 2
- 239000003937 drug carrier Substances 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000012091 fetal bovine serum Substances 0.000 description 2
- 239000000499 gel Substances 0.000 description 2
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 102000048893 human MYO7A Human genes 0.000 description 2
- 238000003119 immunoblot Methods 0.000 description 2
- 239000012139 lysis buffer Substances 0.000 description 2
- 210000004962 mammalian cell Anatomy 0.000 description 2
- 238000010172 mouse model Methods 0.000 description 2
- 210000004940 nucleus Anatomy 0.000 description 2
- 238000001543 one-way ANOVA Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 230000004242 retinal defects Effects 0.000 description 2
- 230000001177 retroviral effect Effects 0.000 description 2
- 230000007017 scission Effects 0.000 description 2
- 238000002864 sequence alignment Methods 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 238000013268 sustained release Methods 0.000 description 2
- 239000012730 sustained-release form Substances 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- 229950003937 tolonium Drugs 0.000 description 2
- HNONEKILPDHFOL-UHFFFAOYSA-M tolonium chloride Chemical compound [Cl-].C1=C(C)C(N)=CC2=[S+]C3=CC(N(C)C)=CC=C3N=C21 HNONEKILPDHFOL-UHFFFAOYSA-M 0.000 description 2
- 238000003151 transfection method Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 230000032258 transport Effects 0.000 description 2
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 description 2
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 1
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 1
- 108020005065 3' Flanking Region Proteins 0.000 description 1
- 108020005029 5' Flanking Region Proteins 0.000 description 1
- 101150039555 ABCA4 gene Proteins 0.000 description 1
- HRPVXLWXLXDGHG-UHFFFAOYSA-N Acrylamide Chemical compound NC(=O)C=C HRPVXLWXLXDGHG-UHFFFAOYSA-N 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 101100524317 Adeno-associated virus 2 (isolate Srivastava/1982) Rep40 gene Proteins 0.000 description 1
- 101100524319 Adeno-associated virus 2 (isolate Srivastava/1982) Rep52 gene Proteins 0.000 description 1
- 101100524321 Adeno-associated virus 2 (isolate Srivastava/1982) Rep68 gene Proteins 0.000 description 1
- 101100524324 Adeno-associated virus 2 (isolate Srivastava/1982) Rep78 gene Proteins 0.000 description 1
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 1
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 1
- XWFWAXPOLRTDFZ-FXQIFTODSA-N Ala-Pro-Ser Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O XWFWAXPOLRTDFZ-FXQIFTODSA-N 0.000 description 1
- SSQHYGLFYWZWDV-UVBJJODRSA-N Ala-Val-Trp Chemical compound CC(C)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O SSQHYGLFYWZWDV-UVBJJODRSA-N 0.000 description 1
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 1
- 206010068783 Alstroem syndrome Diseases 0.000 description 1
- 206010002091 Anaesthesia Diseases 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- WCFCYFDBMNFSPA-ACZMJKKPSA-N Asp-Asp-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(O)=O WCFCYFDBMNFSPA-ACZMJKKPSA-N 0.000 description 1
- GHODABZPVZMWCE-FXQIFTODSA-N Asp-Glu-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GHODABZPVZMWCE-FXQIFTODSA-N 0.000 description 1
- DWOGMPWRQQWPPF-GUBZILKMSA-N Asp-Leu-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O DWOGMPWRQQWPPF-GUBZILKMSA-N 0.000 description 1
- UMHUHHJMEXNSIV-CIUDSAMLSA-N Asp-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UMHUHHJMEXNSIV-CIUDSAMLSA-N 0.000 description 1
- FQHBAQLBIXLWAG-DCAQKATOSA-N Asp-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N FQHBAQLBIXLWAG-DCAQKATOSA-N 0.000 description 1
- DJCAHYVLMSRBFR-QXEWZRGKSA-N Asp-Met-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CC(O)=O DJCAHYVLMSRBFR-QXEWZRGKSA-N 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 102100022794 Bestrophin-1 Human genes 0.000 description 1
- 201000004569 Blindness Diseases 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 101150044789 Cap gene Proteins 0.000 description 1
- 108010078791 Carrier Proteins Proteins 0.000 description 1
- 241000700198 Cavia Species 0.000 description 1
- 102000000844 Cell Surface Receptors Human genes 0.000 description 1
- 108010001857 Cell Surface Receptors Proteins 0.000 description 1
- 108700010070 Codon Usage Proteins 0.000 description 1
- 208000003322 Coinfection Diseases 0.000 description 1
- 241000701022 Cytomegalovirus Species 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 206010011878 Deafness Diseases 0.000 description 1
- SHIBSTMRCDJXLN-UHFFFAOYSA-N Digoxigenin Natural products C1CC(C2C(C3(C)CCC(O)CC3CC2)CC2O)(O)C2(C)C1C1=CC(=O)OC1 SHIBSTMRCDJXLN-UHFFFAOYSA-N 0.000 description 1
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 1
- 108010067770 Endopeptidase K Proteins 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 1
- CTKXFMQHOOWWEB-UHFFFAOYSA-N Ethylene oxide/propylene oxide copolymer Chemical compound CCCOC(C)COCCO CTKXFMQHOOWWEB-UHFFFAOYSA-N 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 108060002900 Filamin Proteins 0.000 description 1
- 108091004242 G-Protein-Coupled Receptor Kinase 1 Proteins 0.000 description 1
- 102000004437 G-Protein-Coupled Receptor Kinase 1 Human genes 0.000 description 1
- XQDGOJPVMSWZSO-SRVKXCTJSA-N Gln-Pro-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N XQDGOJPVMSWZSO-SRVKXCTJSA-N 0.000 description 1
- NKLRYVLERDYDBI-FXQIFTODSA-N Glu-Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKLRYVLERDYDBI-FXQIFTODSA-N 0.000 description 1
- WRNAXCVRSBBKGS-BQBZGAKWSA-N Glu-Gly-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O WRNAXCVRSBBKGS-BQBZGAKWSA-N 0.000 description 1
- GMAGZGCAYLQBKF-NHCYSSNCSA-N Glu-Met-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O GMAGZGCAYLQBKF-NHCYSSNCSA-N 0.000 description 1
- MFYLRRCYBBJYPI-JYJNAYRXSA-N Glu-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O MFYLRRCYBBJYPI-JYJNAYRXSA-N 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 1
- UPOJUWHGMDJUQZ-IUCAKERBSA-N Gly-Arg-Arg Chemical compound NC(=N)NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UPOJUWHGMDJUQZ-IUCAKERBSA-N 0.000 description 1
- XEJTYSCIXKYSHR-WDSKDSINSA-N Gly-Asp-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN XEJTYSCIXKYSHR-WDSKDSINSA-N 0.000 description 1
- WZSHYFGOLPXPLL-RYUDHWBXSA-N Gly-Phe-Glu Chemical compound NCC(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CCC(O)=O)C(O)=O WZSHYFGOLPXPLL-RYUDHWBXSA-N 0.000 description 1
- 108010009504 Gly-Phe-Leu-Gly Proteins 0.000 description 1
- TVTZEOHWHUVYCG-KYNKHSRBSA-N Gly-Thr-Thr Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O TVTZEOHWHUVYCG-KYNKHSRBSA-N 0.000 description 1
- 101000903449 Homo sapiens Bestrophin-1 Proteins 0.000 description 1
- 101000899111 Homo sapiens Hemoglobin subunit beta Proteins 0.000 description 1
- 108091006905 Human Serum Albumin Proteins 0.000 description 1
- 102000008100 Human Serum Albumin Human genes 0.000 description 1
- HJDZMPFEXINXLO-QPHKQPEJSA-N Ile-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N HJDZMPFEXINXLO-QPHKQPEJSA-N 0.000 description 1
- 108700005091 Immunoglobulin Genes Proteins 0.000 description 1
- 238000012404 In vitro experiment Methods 0.000 description 1
- YQEZLKZALYSWHR-UHFFFAOYSA-N Ketamine Chemical compound C=1C=CC=C(Cl)C=1C1(NC)CCCCC1=O YQEZLKZALYSWHR-UHFFFAOYSA-N 0.000 description 1
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- 201000008886 Leber congenital amaurosis 14 Diseases 0.000 description 1
- VKOAHIRLIUESLU-ULQDDVLXSA-N Leu-Arg-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VKOAHIRLIUESLU-ULQDDVLXSA-N 0.000 description 1
- BPANDPNDMJHFEV-CIUDSAMLSA-N Leu-Asp-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O BPANDPNDMJHFEV-CIUDSAMLSA-N 0.000 description 1
- HYMLKESRWLZDBR-WEDXCCLWSA-N Leu-Gly-Thr Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HYMLKESRWLZDBR-WEDXCCLWSA-N 0.000 description 1
- OZTZJMUZVAVJGY-BZSNNMDCSA-N Leu-Tyr-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N OZTZJMUZVAVJGY-BZSNNMDCSA-N 0.000 description 1
- PSVAVKGDUAKZKU-BZSNNMDCSA-N Lys-Tyr-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCCCN)N)O PSVAVKGDUAKZKU-BZSNNMDCSA-N 0.000 description 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 101150002793 MYO7A gene Proteins 0.000 description 1
- 108091027974 Mature messenger RNA Proteins 0.000 description 1
- 208000024556 Mendelian disease Diseases 0.000 description 1
- DGNZGCQSVGGYJS-BQBZGAKWSA-N Met-Gly-Asp Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O DGNZGCQSVGGYJS-BQBZGAKWSA-N 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 208000025174 PANDAS Diseases 0.000 description 1
- 208000021155 Paediatric autoimmune neuropsychiatric disorders associated with streptococcal infection Diseases 0.000 description 1
- 229930040373 Paraformaldehyde Natural products 0.000 description 1
- ULECEJGNDHWSKD-QEJZJMRPSA-N Phe-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 ULECEJGNDHWSKD-QEJZJMRPSA-N 0.000 description 1
- NHCKESBLOMHIIE-IRXDYDNUSA-N Phe-Gly-Phe Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 NHCKESBLOMHIIE-IRXDYDNUSA-N 0.000 description 1
- 239000002202 Polyethylene glycol Substances 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- VJLJGKQAOQJXJG-CIUDSAMLSA-N Pro-Asp-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJLJGKQAOQJXJG-CIUDSAMLSA-N 0.000 description 1
- LGSANCBHSMDFDY-GARJFASQSA-N Pro-Glu-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)O)C(=O)N2CCC[C@@H]2C(=O)O LGSANCBHSMDFDY-GARJFASQSA-N 0.000 description 1
- JMVQDLDPDBXAAX-YUMQZZPRSA-N Pro-Gly-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 JMVQDLDPDBXAAX-YUMQZZPRSA-N 0.000 description 1
- MRYUJHGPZQNOAD-IHRRRGAJSA-N Pro-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 MRYUJHGPZQNOAD-IHRRRGAJSA-N 0.000 description 1
- AWJGUZSYVIVZGP-YUMQZZPRSA-N Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 AWJGUZSYVIVZGP-YUMQZZPRSA-N 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 230000007022 RNA scission Effects 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- NCYCYZXNIZJOKI-OVSJKPMPSA-N Retinaldehyde Chemical compound O=C\C=C(/C)\C=C\C=C(/C)\C=C\C1=C(C)CCCC1(C)C NCYCYZXNIZJOKI-OVSJKPMPSA-N 0.000 description 1
- 102100038247 Retinol-binding protein 3 Human genes 0.000 description 1
- 108090000799 Rhodopsin kinases Proteins 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- BNFVPSRLHHPQKS-WHFBIAKZSA-N Ser-Asp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O BNFVPSRLHHPQKS-WHFBIAKZSA-N 0.000 description 1
- QKQDTEYDEIJPNK-GUBZILKMSA-N Ser-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CO QKQDTEYDEIJPNK-GUBZILKMSA-N 0.000 description 1
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- VMHLLURERBWHNL-UHFFFAOYSA-M Sodium acetate Chemical compound [Na+].CC([O-])=O VMHLLURERBWHNL-UHFFFAOYSA-M 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 230000024932 T cell mediated immunity Effects 0.000 description 1
- GFDUZZACIWNMPE-KZVJFYERSA-N Thr-Ala-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O GFDUZZACIWNMPE-KZVJFYERSA-N 0.000 description 1
- KRGDDWVBBDLPSJ-CUJWVEQBSA-N Thr-His-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O KRGDDWVBBDLPSJ-CUJWVEQBSA-N 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 238000010162 Tukey test Methods 0.000 description 1
- FDKDGFGTHGJKNV-FHWLQOOXSA-N Tyr-Phe-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N FDKDGFGTHGJKNV-FHWLQOOXSA-N 0.000 description 1
- ITDWWLTTWRRLCC-KJEVXHAQSA-N Tyr-Thr-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 ITDWWLTTWRRLCC-KJEVXHAQSA-N 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- HMNZFMSWFCAGGW-XPWSMXQVSA-N [3-[hydroxy(2-hydroxyethoxy)phosphoryl]oxy-2-[(e)-octadec-9-enoyl]oxypropyl] (e)-octadec-9-enoate Chemical compound CCCCCCCC\C=C\CCCCCCCC(=O)OCC(COP(O)(=O)OCCO)OC(=O)CCCCCCC\C=C\CCCCCCCC HMNZFMSWFCAGGW-XPWSMXQVSA-N 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 239000012190 activator Substances 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 239000011543 agarose gel Substances 0.000 description 1
- 201000002543 age related macular degeneration 2 Diseases 0.000 description 1
- 125000001931 aliphatic group Chemical group 0.000 description 1
- 230000037005 anaesthesia Effects 0.000 description 1
- 239000010775 animal oil Substances 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 239000003963 antioxidant agent Substances 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 108010068380 arginylarginine Proteins 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 229920000249 biocompatible polymer Polymers 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 230000037396 body weight Effects 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- BPKIGYQJPYCAOW-FFJTTWKXSA-I calcium;potassium;disodium;(2s)-2-hydroxypropanoate;dichloride;dihydroxide;hydrate Chemical compound O.[OH-].[OH-].[Na+].[Na+].[Cl-].[Cl-].[K+].[Ca+2].C[C@H](O)C([O-])=O BPKIGYQJPYCAOW-FFJTTWKXSA-I 0.000 description 1
- BMLSTPRTEKLIPM-UHFFFAOYSA-I calcium;potassium;disodium;hydrogen carbonate;dichloride;dihydroxide;hydrate Chemical compound O.[OH-].[OH-].[Na+].[Na+].[Cl-].[Cl-].[K+].[Ca+2].OC([O-])=O BMLSTPRTEKLIPM-UHFFFAOYSA-I 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- YTRQFSDWAXHJCC-UHFFFAOYSA-N chloroform;phenol Chemical compound ClC(Cl)Cl.OC1=CC=CC=C1 YTRQFSDWAXHJCC-UHFFFAOYSA-N 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 208000003904 cone-rod dystrophy 3 Diseases 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 210000004087 cornea Anatomy 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000009109 curative therapy Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001212 derivatisation Methods 0.000 description 1
- 239000008121 dextrose Substances 0.000 description 1
- 235000005911 diet Nutrition 0.000 description 1
- 230000037213 diet Effects 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- QONQRTHLHBTMGP-UHFFFAOYSA-N digitoxigenin Natural products CC12CCC(C3(CCC(O)CC3CC3)C)C3C11OC1CC2C1=CC(=O)OC1 QONQRTHLHBTMGP-UHFFFAOYSA-N 0.000 description 1
- SHIBSTMRCDJXLN-KCZCNTNESA-N digoxigenin Chemical compound C1([C@@H]2[C@@]3([C@@](CC2)(O)[C@H]2[C@@H]([C@@]4(C)CC[C@H](O)C[C@H]4CC2)C[C@H]3O)C)=CC(=O)OC1 SHIBSTMRCDJXLN-KCZCNTNESA-N 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 239000000890 drug combination Substances 0.000 description 1
- 210000002969 egg yolk Anatomy 0.000 description 1
- 238000001493 electron microscopy Methods 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 210000001671 embryonic stem cell Anatomy 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000006862 enzymatic digestion Effects 0.000 description 1
- 230000029142 excretion Effects 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 238000000799 fluorescence microscopy Methods 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 125000000524 functional group Chemical group 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 108010078144 glutaminyl-glycine Proteins 0.000 description 1
- 150000002334 glycols Chemical class 0.000 description 1
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 1
- 230000010370 hearing loss Effects 0.000 description 1
- 231100000888 hearing loss Toxicity 0.000 description 1
- 208000016354 hearing loss disease Diseases 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 210000003917 human chromosome Anatomy 0.000 description 1
- 230000005847 immunogenicity Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000007901 in situ hybridization Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000002458 infectious effect Effects 0.000 description 1
- 108010048996 interstitial retinol-binding protein Proteins 0.000 description 1
- 239000007928 intraperitoneal injection Substances 0.000 description 1
- 229960003299 ketamine Drugs 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 230000033001 locomotion Effects 0.000 description 1
- 238000011866 long-term treatment Methods 0.000 description 1
- 229910001629 magnesium chloride Inorganic materials 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- HRLIOXLXPOHXTA-UHFFFAOYSA-N medetomidine Chemical compound C=1C=CC(C)=C(C)C=1C(C)C1=CN=C[N]1 HRLIOXLXPOHXTA-UHFFFAOYSA-N 0.000 description 1
- 229960002140 medetomidine Drugs 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 108010068488 methionylphenylalanine Proteins 0.000 description 1
- 239000003094 microcapsule Substances 0.000 description 1
- 239000002480 mineral oil Substances 0.000 description 1
- 235000010446 mineral oil Nutrition 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 210000005157 neural retina Anatomy 0.000 description 1
- 230000003472 neutralizing effect Effects 0.000 description 1
- 201000006790 nonsyndromic deafness Diseases 0.000 description 1
- 231100000252 nontoxic Toxicity 0.000 description 1
- 230000003000 nontoxic effect Effects 0.000 description 1
- 239000003921 oil Substances 0.000 description 1
- 235000019198 oils Nutrition 0.000 description 1
- 238000002515 oligonucleotide synthesis Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000036407 pain Effects 0.000 description 1
- 238000002638 palliative care Methods 0.000 description 1
- 229920002866 paraformaldehyde Polymers 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 239000003208 petroleum Substances 0.000 description 1
- 108010074082 phenylalanyl-alanyl-lysine Proteins 0.000 description 1
- 239000002504 physiological saline solution Substances 0.000 description 1
- 229920001983 poloxamer Polymers 0.000 description 1
- 229920001993 poloxamer 188 Polymers 0.000 description 1
- 229940044519 poloxamer 188 Drugs 0.000 description 1
- 229920001223 polyethylene glycol Polymers 0.000 description 1
- 238000013105 post hoc analysis Methods 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 239000003755 preservative agent Substances 0.000 description 1
- 230000037452 priming Effects 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 108010053725 prolylvaline Proteins 0.000 description 1
- 238000011321 prophylaxis Methods 0.000 description 1
- 230000002285 radioactive effect Effects 0.000 description 1
- 230000009257 reactivity Effects 0.000 description 1
- 238000003753 real-time PCR Methods 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000008521 reorganization Effects 0.000 description 1
- 101150066583 rep gene Proteins 0.000 description 1
- 238000009256 replacement therapy Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 201000010680 retinitis pigmentosa 19 Diseases 0.000 description 1
- 238000007480 sanger sequencing Methods 0.000 description 1
- 208000027653 severe early-childhood-onset retinal dystrophy Diseases 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 239000001632 sodium acetate Substances 0.000 description 1
- 235000017281 sodium acetate Nutrition 0.000 description 1
- 239000008354 sodium chloride injection Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 239000003381 stabilizer Substances 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 239000004094 surface-active agent Substances 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 230000002195 synergetic effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000011287 therapeutic dose Methods 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 241000701447 unidentified baculovirus Species 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 235000015112 vegetable and seed oil Nutrition 0.000 description 1
- 239000008158 vegetable oil Substances 0.000 description 1
- 208000020938 vitelliform macular dystrophy 2 Diseases 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/005—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P27/00—Drugs for disorders of the senses
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
- C07K14/4701—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
- C07K14/4716—Muscle proteins, e.g. myosin, actin
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/705—Receptors; Cell surface antigens; Cell surface determinants
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y306/00—Hydrolases acting on acid anhydrides (3.6)
- C12Y306/03—Hydrolases acting on acid anhydrides (3.6) acting on acid anhydrides; catalysing transmembrane movement of substances (3.6.3)
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2217/00—Genetically modified animals
- A01K2217/07—Animals genetically altered by homologous recombination
- A01K2217/075—Animals genetically altered by homologous recombination inducing loss of function, i.e. knock out
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2227/00—Animals characterised by species
- A01K2227/10—Mammal
- A01K2227/105—Murine
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
- C12N2750/14143—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14151—Methods of production or purification of viral material
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14171—Demonstrated in vivo effect
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/40—Systems of functionally co-operating vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/42—Vector systems having a special element relevant for transcription being an intron or intervening sequence for splicing and/or stability of RNA
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/50—Vector systems having a special element relevant for transcription regulating RNA stability, not being an intron, e.g. poly A signal
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Medicinal Chemistry (AREA)
- Wood Science & Technology (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Animal Behavior & Ethology (AREA)
- Veterinary Medicine (AREA)
- Public Health (AREA)
- Pharmacology & Pharmacy (AREA)
- Microbiology (AREA)
- Gastroenterology & Hepatology (AREA)
- Toxicology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Virology (AREA)
- Epidemiology (AREA)
- General Chemical & Material Sciences (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Cell Biology (AREA)
- Immunology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Complex Calculations (AREA)
- Vehicle Body Suspensions (AREA)
- Ultra Sonic Daignosis Equipment (AREA)
Abstract
세포에서 트랜스진을 발현시키기 위한 벡터 시스템으로서, 벡터 시스템이 제1 벡터 및 제2 벡터를 포함하고, 여기서 (a) 제1 벡터는 5'에서 3' 방향으로 프로모터; 인트론; 트랜스진 코딩 서열(CDS)의 5' 말단 부분; 스플라이스 공여체 서열; 및 제1 재조합원성 영역을 포함하고; (b) 제2 벡터가 5'에서 3' 방향으로 제2 재조합원성 영역; 스플라이스 수용체 서열; 및 트랜스진 CDS의 3' 말단 부분을 포함하고; 여기서 5' 말단 부분 및 3' 말단 부분은 함께 트랜스진 CDS를 구성하고, 인트론은 스플라이스 공여체 서열과 상동성 재조합할 수 없어 트랜스진 CDS의 5' 말단 부분을 절제한다.
Description
발명의 분야
본 발명은 벡터 및 벡터 시스템, 특히 표적 세포에 큰 트랜스진의 전달을 가능하게 하는 벡터 및 벡터 시스템에 관한 것이다. 본 발명은 또한 유전자 요법에서 벡터 및 벡터 시스템의 용도에 관한 것이다.
본 발명에 따른 배경
예를 들어, 아데노-관련 바이러스(AAV) 벡터를 사용한 유전자 요법은 많은 유전성 망막 변성(IRD)의 치료를 위한 유망한 접근법을 대표한다. 실제로, 다양한 IRD에 대한 수년간의 전임상 연구 및 임상 시험은 질병에 걸린 망막 층(예를 들어, 광수용기(PR) 및 망막 색소 상피(RPE))에 치료 유전자를 효율적으로 전달하는 AAV의 능력을 보여주었고 이들의 인간에서 우수한 안전성 및 효능 프로파일을 강조하였다. 그러나, AAV 유전자 요법 벡터를 이용하는 데 있어 주요 장애물 중 하나는 트랜스진을 패키징하는 이들의 능력이며, 이는 최대 약 5kb로 제한될 수 있다. 이는 5 kb 초과의 코딩 서열(CDS)을 갖는 유전자의 돌연변이로 인해 발생하는 질병, 예를 들어, IRD에 대한 유전자 대체 요법의 개발에 대한 제한 인자일 수 있다.
AAV의 용량을 증가시키기 위한 전략의 확인에 상당한 관심이 집중되어 왔다. 예를 들어, 분자간 재조합을 통해 연쇄동일서열화하는 AAV 게놈의 능력에 기반한 이중 AAV 벡터는 이 문제를 해결하기 위해 성공적으로 이용되었다. 이중 AAV 벡터는 큰 트랜스진 CDS를 별도의 부분으로 분할하고 각각을 단일 정상 크기(NS; < 5 kb) AAV 벡터로 패키징함으로써 생성될 수 있다. 전장 트랜스진 CDS의 재구성은 두 이중 AAV 벡터 모두에 의한 동일한 세포의 공동-감염에 이어 i) 2개의 벡터 게놈의 역 말단 반복부(ITR-)-매개된 테일-투-헤드 연쇄동일서열화 후 스플라이싱(이중 AAV 트랜스-스플라이싱, TS)(Duan et al. (2001) Molecular Therapy: Journal of the American Society of Gene Therapy 4: 383-391); ii) 2개의 벡터 게놈에 함유된 중첩 영역 사이의 상동성 재조합(이중 AAV 중첩, OV)((Duan et al. (2001) Molecular Therapy : Journal of the American Society of Gene Therapy 4: 383-391)); 또는 iii) 이 둘의 조합(이중 AAV 하이브리드)(Ghosh et al. (2008) Molecular Therapy : the journal of the American Society of Gene Therapy 16: 124-130)시 달성될 수 있다.
이중 AAV 하이브리드 벡터와 관련하여 가장 많이 사용되는 재조합원성 영역은 높은 수준의 이중 AAV 하이브리드 벡터 재구성을 부여하는 것으로 밝혀진 인간 알칼리성 포스파타제 cDNA의 중간 1/3의 872 bp 서열로부터 유래된다. 또한, F1 파지 게놈(AK)으로부터의 77 bp 서열은 시험관내 및 생체내 실험에서 고도로 재조합원성인 것으로 밝혀졌다.
연구는 관심 조직에서 큰 트랜스진의 전달 및 재구성을 위한 AAV 벡터 시스템과 같은 이중 벡터 시스템의 가능성이 강조되었지만, 임상 용도로의 이들의 번역은 상당한 충족되지 않은 요구로 남아 있다.
발명의 개요
큰 트랜스진(예를 들어, Myosin7A, MYO7A)의 전달을 위한 이중 벡터 시스템의 개발 동안, 본 발명자들은 트랜스진 CDS의 5' 말단 부분을 함유하는 벡터의 제조에서 일관된 오염물을 예상치 못하게 발견하였다. 본 발명자들은 서던 블롯으로 제조물을 분석하고 예상된 벡터에 상응하는 밴드를 확인하였고 놀랍게도 또한 오염물에 상응하는 약 1.3 kb의 더 작은 크기의 밴드를 발견하였다.
이후, 본 발명자들은 벡터를 추가로 연구하고, 벡터에서 사용된 스플라이싱 공여체(SD) 부위와 키메라 프로모터 인트론 사이의 상동성 영역을 확인하였다. 정제된 바이러스 DNA의 추가 시퀀싱 분석은, 상동성 재조합 사건이 작제물 내에 이러한 상동성 영역의 존재로 인해 발생하여, AAV 역 말단 반복부(ITR)를 유지하면서 인트론의 나머지 부분, 트랜스진 CDS의 5' 말단 부분 및 SD 부위의 결실을 초래하며, 이에 따라 벡터 생성을 지원함을 확인시켜 주었다.
일 양태에서, 본 발명은 세포에서 트랜스진을 발현시키기 위한 벡터 시스템을 제공하며, 상기 벡터 시스템은 제1 벡터 및 제2 벡터를 포함하고, 여기서
(a)
제1 벡터는 5'에서 3' 방향으로 인트론; 트랜스진 코딩 서열(CDS)의 5' 말단 부분; 및 스플라이스 공여체 서열을 포함하며;
(b)
제2 벡터는 5'에서 3' 방향으로 스플라이스 수용체 서열; 및 트랜스진 CDS의 3' 말단 부분을 포함하며;
여기서 5' 말단 부분 및 3' 말단 부분은 함께 트랜스진 CDS를 구성하고, 인트론은 스플라이스 공여체 서열과 상동성 재조합할 수 없어 트랜스진 CDS의 5' 말단 부분을 절제한다.
또 다른 양태에서, 본 발명은 세포에서 트랜스진을 발현시키기 위한 벡터 시스템을 제공하며, 상기 벡터 시스템은 제1 벡터 및 제2 벡터를 포함하고, 여기서
(a)
제1 벡터는 5'에서 3' 방향으로 프로모터; 인트론; 트랜스진 코딩 서열(CDS)의 5' 말단 부분; 및 스플라이스 공여체 서열을 포함하며;
(b)
제2 벡터는 5'에서 3' 방향으로 스플라이스 수용체 서열; 및 트랜스진 CDS의 3' 말단 부분을 포함하며;
여기서 5' 말단 부분 및 3' 말단 부분은 함께 트랜스진 CDS를 구성하고, 인트론은 스플라이스 공여체 서열과 상동성 재조합할 수 없어 트랜스진 CDS의 5' 말단 부분을 절제한다.
또 다른 양태에서, 본 발명은 세포에서 트랜스진을 발현시키기 위한 벡터 시스템을 제공하며, 벡터 시스템은 제1 벡터 및 제2 벡터를 포함하고, 여기서
(a)
제1 벡터는 5'에서 3' 방향으로 프로모터; 인트론; 트랜스진 코딩 서열(CDS)의 5' 말단 부분; 스플라이스 공여체 서열; 및 제1 재조합 영역을 포함하며;
(b)
제2 벡터는 5'에서 3' 방향으로 제2 재조합 영역; 스플라이스 수용체 서열; 및 트랜스진 CDS의 3' 말단 부분을 포함하며;
여기서 5' 말단 부분 및 3' 말단 부분은 함께 트랜스진 CDS를 구성하고, 인트론은 스플라이스 공여체 서열과 상동성 재조합할 수 없어 트랜스진 CDS의 5' 말단 부분을 절제한다.
바람직한 구체예에서, 인트론은 시미안 바이러스 40(SV40) 인트론이다. SV40 인트론은 변형된 SV40 인트론일 수 있다.
일부 구체예에서, 인트론은 미닛 바이러스 마우스(MVM) 인트론이다.
일부 구체예에서, 인트론은 SEQ ID NO: 3 또는 4에 대해 적어도 95% 서열 동일성(예를 들어, 적어도 96%, 97%, 98% 또는 99% 서열 동일성, 또는 100% 서열 동일성)을 갖는 뉴클레오티드 서열을 포함한다. 바람직한 구체예에서, 인트론은 SEQ ID NO: 3에 대해 적어도 95% 서열 동일성(예를 들어, 적어도 96%, 97%, 98% 또는 99% 서열 동일성, 또는 100% 서열 동일성)을 갖는 뉴클레오티드 서열을 포함한다.
일부 구체예에서, 스플라이스 공여체 서열은 SEQ ID NO: 5와 적어도 95% 서열 동일성을 갖는 뉴클레오티드 서열을 포함한다.
바람직한 구체예에서, 제1 재조합원성 영역 및 제2 재조합원성 영역은 동일하다.
일부 구체예에서, 제1 재조합원성 영역 및 제2 재조합원성 영역은 둘 모두 F1 파지 재조합원성 영역 또는 이의 단편이다.
일부 구체예에서, 제1 재조합원성 영역 및 제2 재조합원성 영역 둘 모두는 SEQ ID NO: 7에 대해 적어도 95% 서열 동일성을 갖는 뉴클레오티드 서열 또는 이의 단편을 포함한다.
일부 구체예에서, 제1 벡터 및 제2 벡터는 바이러스 벡터이다. 바이러스 벡터는 아데노-관련 바이러스(AAV) 벡터, 아데노바이러스 벡터, 레트로바이러스 벡터, 렌티바이러스 벡터, 단순 포진 바이러스 벡터, 피코르나바이러스 벡터 또는 알파바이러스 벡터일 수 있다. 일부 구체예에서, 제1 벡터 및 제2 벡터는 플라스미드이다. 제1 및/또는 제2 플라스미드는, 예를 들어, 제1 및/또는 제2 바이러스 벡터 입자를 생성하는데 사용될 수 있다(예를 들어, 조성물에서 별도로 또는 함께).
바람직한 구체예에서, 제1 벡터 및 제2 벡터는 AAV 벡터이다.
일부 구체예에서, AAV 벡터는 동일한 혈청형이다(예를 들어, 동일한 혈청형의 캡시드를 포함한다). 일부 구체예에서, AAV 벡터는 상이한 혈청형이다(예를 들어, 상이한 혈청형의 캡시드를 포함한다).
일부 구체예에서, 제1 벡터 및 제2 벡터는 AAV2, AAV8, AAV5, AAV7, AAV9, AAV-PhP.B 및 AAV-PhP.eB로 구성된 군으로부터 선택된다. 일부 구체예에서, 제1 벡터 및 제2 벡터는 hu68(예를 들어, WO 2018/160582 참조), Anc 라이브러리(예를 들어, WO 2015/054653 및 WO 2017/019994 참조) 및 AAV2-TT(예를 들어, WO 2015/121501 참조)로 구성된 군으로부터 선택된다.
일부 구체예에서, 제1 벡터 및 제2 벡터는 AAV2 벡터이다. 일부 구체예에서, 제1 벡터 및 제2 벡터는 AAV8 벡터이다.
일부 구체예에서, 제1 벡터 및 제2 벡터는 AAV2, AAV8, AAV5, AAV7, AAV9, AAV-PhP.B 및 AAV-PhP.eB로 구성된 군으로부터 선택되는 캡시드를 포함한다. 일부 구체예에서, 제1 벡터 및 제2 벡터는 hu68(예를 들어, WO 2018/160582 참조), Anc 라이브러리(예를 들어, WO 2015/054653 및 WO 2017/019994 참조) 및 AAV2-TT(예를 들어, WO 2015/121501 참조)로 구성된 군으로부터 선택되는 캡시드를 포함한다.
일부 구체예에서, 제1 벡터 및 제2 벡터는 AAV2 캡시드를 포함한다. 일부 구체예에서, 제1 벡터 및 제2 벡터는 AAV8 캡시드를 포함한다.
일부 구체예에서, 제1 벡터는 5' ITR 및 3' ITR을 추가로 포함한다. 일부 구체예에서, 제2 벡터는 5' ITR 및 3' ITR을 추가로 포함한다. 바람직한 구체예에서, 제1 벡터는 5' ITR 및 3' ITR을 추가로 포함하고, 제2 벡터는 5' ITR 및 3' ITR을 추가로 포함한다.
바람직한 구체예에서, ITR은 AAV ITR, 바람직하게는 AAV2 ITR이다. 일부 구체예에서, ITR은 AAV8 ITR이다.
바람직한 구체예에서, 제1 벡터 및 제2 벡터는 AAV2/8 벡터이다.
일부 구체예에서, ITR은 동일한 AAV 혈청형으로부터 유래된다. 일부 구체예에서, ITR은 상이한 AAV 혈청형으로부터 유래된다.
바람직한 구체예에서, 제1 벡터의 3' ITR 및 제2 벡터의 5' ITR은 동일한 AAV 혈청형으로부터 유래된다.
바람직한 구체예에서, 제1 벡터의 5' ITR 및 제2 벡터의 5' ITR은 동일한 AAV 혈청형으로부터 유래된다. 바람직한 구체예에서, 제1 벡터의 3' ITR 및 제2 벡터의 3' ITR은 동일한 AAV 혈청형으로부터 유래된다.
바람직한 구체예에서, 제1 벡터의 5' ITR 및 제2 벡터의 5' ITR은 AAV2 5' ITR이고, 제1 벡터의 3' ITR 및 제2 벡터의 3' ITR은 AAV2 3' ITR이다.
일부 구체예에서, 제1 벡터의 5' ITR 및 제2 벡터의 5' ITR은 AAV8 5' ITR이고, 제1 벡터의 3' ITR 및 제2 벡터의 3' ITR은 AAV8 3' ITR이다.
일부 구체예에서, 제1 벡터의 5' ITR 및 제2 벡터의 5' ITR은 상이한 AAV 혈청형으로부터 유래된다. 일부 구체예에서, 제1 벡터의 3' ITR 및 제2 벡터의 3' ITR은 상이한 AAV 혈청형으로부터 유래된다. 일부 구체예에서, 제1 벡터의 5' ITR 및 제2 벡터의 5' ITR은 상이한 AAV 혈청형으로부터 유래되고, 제1 벡터의 3' ITR 및 제2 벡터의 3' ITR은 상이한 AAV 혈청형으로부터 유래된다.
일부 구체예에서, 제1 벡터의 5' ITR 및 제2 벡터의 3' ITR은 상이한 AAV 혈청형으로부터 유래된다.
일부 구체예에서, 제1 벡터 및 제2 벡터는 바이러스 벡터 입자이다.
일부 구체예에서, 프로모터는 CBA 프로모터 또는 이의 단편이다.
일부 구체예에서, 제1 벡터는 인핸서 서열을 추가로 포함한다. 바람직한 구체예에서, 인핸서는 CMV 인핸서이다.
일부 구체예에서, 제2 벡터는 트랜스진 CDS의 3' 말단 부분의 다운스트림에 폴리아데닐화 서열을 추가로 포함한다. 바람직한 구체예에서, 폴리아데닐화 서열은 소 성장 호르몬(bGH) 폴리아데닐화 서열이다.
일부 구체예에서, 트랜스진은 Myosin 7A(MYO7A), ABCA4, CEP290, CDH23, EYS, USH2a, GPR98 및 ALMS1로 구성된 군으로부터 선택된다.
바람직한 구체예에서, 트랜스진은 Myosin 7A(MYO7A) 트랜스진이다. 일부 구체예에서, 트랜스진은 ABCA4 트랜스진이다. 일부 구체예에서, 트랜스진 CDS는 야생형 서열이다. 일부 구체예에서, 트랜스진 CDS는 코돈 최적화된다(예를 들어, 인간에서 발현을 위해 최적화된 코돈).
바람직한 구체예에서:
(a)
제1 벡터는 SEQ ID NO: 14에 대해 적어도 95% 서열 동일성을 갖는 뉴클레오티드 서열을 포함하고/거나;
(b)
제2 벡터는 SEQ ID NO: 15에 대해 적어도 95% 서열 동일성을 갖는 뉴클레오티드 서열을 포함한다.
특히 바람직한 구체예에서:
(a)
제1 벡터는 SEQ ID NO: 14의 뉴클레오티드 서열을 포함하고/거나;
(b)
제2 벡터는 SEQ ID NO: 15의 뉴클레오티드 서열을 포함한다.
일부 구체예에서, 제1 벡터 및 제2 벡터는 1:1 게놈 복사체 비율로 존재한다.
또 다른 양태에서, 본 발명은 세포에서 트랜스진을 발현시키기 위한 방법으로서, 트랜스진이 세포에서 발현되도록 본원에 개시된 바와 같은 제1 벡터 및 제2 벡터로 세포를 형질도입 또는 형질감염시키는 것을 포함하는, 방법을 제공한다.
또 다른 양태에서, 본 발명은 본원에 개시된 바와 같은 제1 벡터 및 제2 벡터를 포함하는 세포를 제공한다.
또 다른 양태에서, 본 발명은 본원에 개시된 바와 같은 제1 벡터 및 제2 벡터로 형질도입되거나 형질감염된 세포를 제공한다.
일부 구체예에서, 세포는 포유동물 세포, 인간 세포, 망막 세포 또는 비배아 줄기 세포이다.
또 다른 양태에서, 본 발명은 벡터가 본원에 개시된 바와 같은 제1 벡터인 벡터를 제공한다.
또 다른 양태에서, 본 발명은 벡터가 본원에 개시된 바와 같은 제2 벡터인 벡터를 제공한다.
또 다른 양태에서, 본 발명은 5'에서 3' 방향으로 인트론; 트랜스진 코딩 서열(CDS)의 5' 말단 부분; 및 스플라이스 공여체 서열을 포함는 벡터로서, 인트론은 스플라이스 공여체 서열과 상동성 재조합할 수 없어 트랜스진 CDS의 5' 말단 부분을 절제하는, 벡터를 제공한다.
또 다른 양태에서, 본 발명은 5'에서 3' 방향으로 프로모터; 인트론; 트랜스진 코딩 서열(CDS)의 5' 말단 부분; 및 스플라이스 공여체 서열을 포함는 벡터로서, 인트론은 스플라이스 공여체 서열과 상동성 재조합할 수 없어 트랜스진 CDS의 5' 말단 부분을 절제하는, 벡터를 제공한다.
또 다른 양태에서, 본 발명은 5'에서 3' 방향으로 프로모터; 인트론; 트랜스진 코딩 서열(CDS)의 5' 말단 부분; 스플라이스 공여체 서열; 및 재조합원성 영역을 포함는 벡터로서, 인트론은 스플라이스 공여체 서열과 상동성 재조합할 수 없어 트랜스진 CDS의 5' 말단 부분을 절제하는, 벡터를 제공한다.
일부 구체예에서, 벡터는 5' ITR 및 3' ITR을 추가로 포함한다. 바람직한 구체예에서, ITR은 AAV ITR, 바람직하게는 AAV2 ITR이다.
일부 구체예에서, ITR은 동일한 AAV 혈청형으로부터 유래된다. 일부 구체예에서, ITR은 상이한 AAV 혈청형으로부터 유래된다.
또 다른 양태에서, 본 발명은 5'에서 3' 방향으로 스플라이스 수용체 서열; 및 트랜스진 코딩 서열(CDS)의 3' 말단 부분을 포함하는 벡터를 제공한다.
또 다른 양태에서, 본 발명은 5'에서 3' 방향으로 재조합원성 영역; 스플라이스 수용체 서열; 및 트랜스진 코딩 서열(CDS)의 3' 말단 부분을 포함하는 벡터를 제공한다.
일부 구체예에서, 벡터는 SEQ ID NO: 14에 대해 적어도 95% 서열 동일성을 갖는 뉴클레오티드 서열을 포함한다.
바람직한 구체예에서, 벡터는 SEQ ID NO: 14의 뉴클레오티드 서열을 포함한다.
또 다른 양태에서, 본 발명은 본원에 개시된 바와 같은 제1 벡터 및 본원에 개시된 바와 같은 제2 벡터를 포함하는 키트를 제공한다.
또 다른 양태에서, 본 발명은 본원에 개시된 바와 같은 제1 벡터 및 본원에 개시된 바와 같은 제2 벡터를 포함하는 조성물을 제공한다.
일부 구체예에서, 제1 벡터 및 제2 벡터는 1:1 게놈 복사체 비율로 존재한다.
바람직한 구체예에서, 조성물은 약학적으로 허용되는 담체, 희석제 또는 부형제를 포함하는 약학적 조성물이다.
또 다른 양태에서, 본 발명은 요법에 사용하기 위한 본 발명의 벡터 시스템, 벡터, 키트 또는 조성물을 제공한다.
또 다른 양태에서, 본 발명은 망막 변성의 치료에 사용하기 위한 본 발명의 벡터 시스템, 벡터, 키트 또는 조성물을 제공한다. 바람직하게는, 망막 변성은 유전성 망막 변성이다.
또 다른 양태에서, 본 발명은 요법에 사용하기 위한 본원에 개시된 바와 같은 제1 벡터로서, 여기서 제1 벡터는 본원에 개시된 바와 같은 제2 벡터와 함께 동시에, 순차적으로 또는 별도로 투여되는, 제1 벡터를 제공한다.
또 다른 양태에서, 본 발명은 망막 변성의 치료에 사용하기 위한 본원에 개시된 바와 같은 제1 벡터로서, 제1 벡터는 본원에 개시된 바와 같은 제2 벡터와 함께 동시에, 순차적으로 또는 별도로 투여되는, 제1 벡터를 제공한다. 바람직하게는, 망막 변성은 유전성 망막 변성이다.
또 다른 양태에서, 본 발명은 요법에 사용하기 위한 본원에 개시된 바와 같은 제2 벡터로서, 여기서 제2 벡터는 본원에 개시된 바와 같은 제1 벡터와 함께 동시에, 순차적으로 또는 별도로 투여되는, 제2 벡터를 제공한다.
또 다른 양태에서, 본 발명은 망막 변성의 치료에 사용하기 위한 본원에 개시된 바와 같은 제2 벡터로서, 제2 벡터는 본원에 개시된 바와 같은 제1 벡터와 함께 동시에, 순차적으로 또는 별도로 투여되는, 제2 벡터를 제공한다. 바람직하게는, 망막 변성은 유전성 망막 변성이다.
일부 구체예에서, 용도는 어셔 증후군, 색소성 망막염, 레버 선천성 흑암시(LCA), 스타가르트병, 알스트롬 증후군 또는 ABCA4-관련 질병의 치료 또는 예방에 있다.
또 다른 양태에서, 본 발명은 어셔 증후군의 치료에 사용하기 위한 본 발명의 벡터 시스템, 벡터, 키트 또는 조성물을 제공한다.
또 다른 양태에서, 본 발명은 유효량의 본 발명의 벡터 시스템, 벡터, 키트 또는 조성물을 이를 필요로 하는 대상체에게 투여하는 것을 포함하는 망막 변성을 치료 또는 예방하는 방법을 제공한다. 바람직하게는, 망막 변성은 유전성 망막 변성이다.
또 다른 양태에서, 본 발명은 유효량의 본 발명의 벡터 시스템, 벡터, 키트 또는 조성물을 이를 필요로 하는 대상체에게 투여하는 것을 포함하는 어셔 증후군을 치료 또는 예방하는 방법을 제공한다.
도면의 설명
도 1. 오염 벡터의 확인.
(A) AAV-5'hMYO7A(상단 화살표로 표시됨) 및 오염물 벡터(하단 화살표로 표시됨)에 상응하는 게놈을 보여주는 서던 블롯 이미지. DNAse: 오염된 외부 DNA의 분해를 위한 DNAse로의 처리; 플라스미드: AAV8-CBA-키메라 인트론-5'hMYO7A를 생성하기 위한 DNA 서열을 함유하는 플라스미드 DNA; 5'AAV 게놈-CI: AAV8-CBA 프로모터-키메라 인트론-5'hMYO7A로부터 추출된 게놈 DNA; 킬로베이스로 표현된 분자량 마커; bp = 염기쌍. CI: 키메라 인트론. (B) 서던 블롯 프로브에 의해 인식되는 서열을 나타내는 AAV-5'hMYO7A 게놈의 묘사. (C) 키메라 프로모터의 인트론과 SD 신호 사이의 페어링 메커니즘(점선으로 표시됨). (D) 서던 블롯 프로브에 의해 인식되는 서열을 나타내는 오염물 벡터 게놈의 묘사. (E) 하기 발현 카세트를 포함하는 AAV 제조물의 서던 블롯 분석: 1. 5'CMV ABCA4 AK(이중 하이브리드); 2. 5'CMV ABCA4 TS(이중 트랜스-스플라이싱); 3. 5'CMV NO INTR ABCA4 OV(이중 중첩); 4. 5'CMV NO INTR ABCA4 AK(이중 하이브리드); 5. 5'VMD2 ABCA4 AK(이중 하이브리드); 6. 5'RHO ABCA4 AK(이중 하이브리드); 7. 5'RHO ABCA4 TS(이중 트랜스-스플라이싱). 키메라 인트론은 벡터 1 및 2에 존재하고 벡터 3 내지 7에는 존재하지 않는다. 점선 상자는 예상 크기의 전장 게놈을 나타내고; 실선 박스는 짧고 절두된 게놈을 나타낸다.
도 2. EGFP 형광에 의한 키메라 인트론, SV40 인트론, MVM 인트론 및 인트론 부재의 시험관내 비교.
(A) 키메라 인트론, SV40 인트론 또는 MVM 인트론을 갖거나 인트론이 없는 EGFP를 인코딩하는 플라스미드의 묘사. (B) 형질감염된 HEK293 세포의 대표적인 현미경 형광 사진(10X 배율, 스케일 바 100 μm). CI: 키메라 인트론; SV40: 시미안 바이러스 40; MVM: 미닛 바이러스 마우스.
도 3. 웨스턴 블롯 분석에 의한 키메라 인트론, SV40 인트론, MVM 인트론 및 인트론 부재의 시험관내 비교.
A) 이중 AAV2-키메라 인트론-hMYO7A, 이중 AAV2-SV40 인트론-hMYO7A, 이중 AAV2-MVM 인트론-hMYO7A, 이중 AAV2-인트론 부재-hMYO7A 또는 벡터 부재로의 감염 후 72시간째 HEK293 세포의 웨스턴 블롯 분석. 화살표는 전장 단백질을 나타내고, 60 μg의 단백질을 각 레인에 로딩하였고, 각 웨스턴 블롯에 있어서 분자 마커는 왼쪽에 보고된다. 실험 번호는 샘플의 각 세트 아래에 보고되어 있다. 음성 대조군: 이중 AAV2-hMYO7A를 수용하지 않은 세포; @MYO7A: 항-Myosin7A(MYO7A) 항체를 이용한 웨스턴 블롯; @Filamin: 로딩 대조군으로 사용된 항-Filamin 항체를 이용한 웨스턴 블롯. SV40 인트론: 변형된 시미안 바이러스 40 인트론; MVM 인트론: 미닛 바이러스 마우스 인트론.
B) HEK293에서 이중 AAV2-키메라 인트론-hMYO7A, 이중 AAV2-SV40 인트론-hMYO7A, 이중 AAV2-MVM 인트론-hMYO7A 또는 이중 AAV2-인트론 부재-hMYO7A로의 감염시 발현된 hMYO7A 수준의 정량화. hMYO7A의 수준은 이중 AAV2-키메라 인트론-hMYO7A에 의해 발현되는 hMYO7A에 상대적이다. 각 흑색 사각형은 해당 군의 각 샘플에 대해 정량화된 값을 나타낸다. 항-MYO7A 항체를 사용하여 웨스턴 블롯 분석에 의해 정량화를 수행하고, 인간 MYO7A 밴드 강도의 측정치를 Filamin으로 표준화하였다. 평균 값은 각 그룹의 히스토그램 내에 보고된다. SV40 인트론: 변형된 시미안 바이러스 40 인트론; MVM 인트론: 미닛 바이러스 마우스 인트론.
도 4. 키메라 인트론, SV40 인트론 및 MVM 인트론의 비교.
AAV8-5'hMYO7A에 의해 운반되는 발현 카세트의 묘사. 상단: AAV8-5'hMYO7A 키메라 인트론; 중간: AAV8-5'hMYO7A SV40 인트론; 하단: AAV8-5'hMYO7A MVM 인트론. (B) AAV8-5'hMYO7A 키메라 인트론, AAV8-5'hMYO7A SV40 인트론 및 AAV8-5'hMYO7A MVM 인트론으로부터의 바이러스 게놈의 서던 블롯. 모든 샘플을 DNAse로 처리하여 오염된 외부 DNA를 분해한 다음, 바이러스 게놈 DNA를 추출하였다. 5'AAV 게놈-CI: AAV8-CBA 프로모터-키메라 인트론-5'hMYO7A로부터 추출된 바이러스 게놈 DNA; 5'AAV 게놈-SV40: AAV8-CBA 프로모터-SV40 인트론-5'hMYO7A로부터 추출된 바이러스 게놈 DNA; 5'AAV 게놈-MVM: AAV8-CBA 프로모터-SV40 인트론-5'hMYO7A로부터 추출된 바이러스 게놈 DNA; 킬로베이스로 표현된 분자량 마커; bp = 염기쌍. CI: 키메라 인트론; SV40: 시미안 바이러스 40 인트론; MVM: 미닛 바이러스 마우스 인트론. (C) AAV8-3'hMYO7A-3XFLAG, 또는 부형제와 조합된 AAV8-5'hMYO7A 키메라 인트론, AAV8-5'hMYO7A SV40 인트론 또는 AAV8-5'hMYO7A MVM 인트론의 망막하 주사 후 2주째 C57BL/6 아이컵의 대표적인 웨스턴 블롯 분석. 화살표는 전장 단백질을 나타내고, 각 레인에 150 μg의 단백질을 로딩하였다. 음성 대조군: 부형제가 주사된 눈; @Flag: 전장 Myosin7A-3XFlag를 인식하기 위한 항-플래그를 갖는 웨스턴 블롯; @Dysferlin: 로딩 대조군으로 사용된 항-Dysferlin 항체로의 웨스턴 블롯. (D) 망막하 주사된 C57BL/6 아이컵에서 AAV8-3'hMYO7A-3XFLAG와 조합된 AAV8-5'hMYO7A 키메라 인트론, AAV8-5'hMYO7A SV40 인트론 또는 AAV8-5'hMYO7A MVM 인트론으로부터 발현된 hMYO7A 수준의 정량화. hMYO7A-3XFLAG의 수준은 AAV8-3'hMYO7A-3XFLAG와 조합된 AAV8-5'hMYO7A 키메라 인트론에 의해 발현되는 hMYO7A-3XFLAG에 상대적이다. hMYO7A-3XFLAG에 대한 양성 눈의 수(n)는 각 막대 아래에 묘사되어 있다. 항-Flag 항체를 사용하여 웨스턴 블롯 분석(패널 C)에 의해 정량화를 수행하고, Dysferlin에 대해 표준화된 hMYO7A-3XFLAG 밴드 강도의 측정을 수행하였다. 평균 값은 상응하는 막대 위에 묘사되어 있다. 값은 평균 ± 평균의 표준 오차(s.e.m.)로 표시된다.
도 5. 셰이커 마우스에서 정단 멜라노솜 국소화 및 hMYO7A 단백질 재구성의 용량-의존적 개선.
(A) 음성 대조군으로서 용매, 또는 이중 AAV8.hMYO7A(용량 1.37E+10, 4.4E+9 또는 1.37E+9 총 GC/눈)의 망막하 주사를 수용하는 sh1-/- 및 양성 대조군으로서 용매의 망막하 주사를 수용하는 sh1 +/-를 나타내는 톨루이딘 블루로 염색된 반-얇은 망막 절편. 눈금 막대(백색 막대)는 10 μm이다. 검은색 화살표는 올바르게 국소화된 멜라노솜을 가리킨다. (B) 이중 AAV8.hMYO7A의 망막하 전달 후 3개월째 sh1 마우스의 전체 망막 섹션의 RPE 융모에서 멜라노솜 국소화의 정량화. 정단 멜라노솜의 수/100 μm의 RPE가 보고된다. 데이터는 각 눈(점)에 대한 단일 측정 및 평균 ± s.e.m(열)으로 표시된다. 일원 ANOVA에 이어 Tukey 사후 테스트를 사용하여 통계적 분석을 수행하였다. P 값 대 용매가 투여된 sh1-/-는 다음과 같다: ** p<0.01; **** p <0.0001. (C) 1.37E+10, 4.4E+9 또는 1.37E+9 총 GC/눈의 용량에서 이중 AAV8.hMYO7A의 망막하 전달 후 5주째에 sh1-/- 아이컵의 대표적인 웨스턴 블롯 분석. 양성 및 음성 대조군으로서, sh1 +/- 및 sh1-/-는 각각 용매의 망막하 주사(이중 AAV와 동일한 부피)를 투여받았다. α-MYO7A, 항-Myosin 7A 항체를 이용한 웨스턴 블롯; α-Dysferlin: 로딩 대조군으로 사용된 항-Dysferlin 항체를 이용한 웨스턴 블롯. (D) 용매가 주사된 한배새끼 sh1+/- 눈에서 발현된 내인성 Myo7a의 백분율(%)로서 이중 AAV8 벡터의 망막하 주사 후 5주째에 sh1-/- 아이컵에서 발현된 인간 MYO7A 수준의 정량화. 항-MYO7A 항체를 사용하여 웨스턴 블롯 분석에 의해 정량화를 수행하고, MYO7A 및 Myo7a 밴드 강도의 측정치를 Dysferlin에 대해 표준화하였다. 데이터는 평균 ± s.e.m으로 표시된다(평균 값은 상응하는 막대 위에 도시된다).
도 1. 오염 벡터의 확인.
(A) AAV-5'hMYO7A(상단 화살표로 표시됨) 및 오염물 벡터(하단 화살표로 표시됨)에 상응하는 게놈을 보여주는 서던 블롯 이미지. DNAse: 오염된 외부 DNA의 분해를 위한 DNAse로의 처리; 플라스미드: AAV8-CBA-키메라 인트론-5'hMYO7A를 생성하기 위한 DNA 서열을 함유하는 플라스미드 DNA; 5'AAV 게놈-CI: AAV8-CBA 프로모터-키메라 인트론-5'hMYO7A로부터 추출된 게놈 DNA; 킬로베이스로 표현된 분자량 마커; bp = 염기쌍. CI: 키메라 인트론. (B) 서던 블롯 프로브에 의해 인식되는 서열을 나타내는 AAV-5'hMYO7A 게놈의 묘사. (C) 키메라 프로모터의 인트론과 SD 신호 사이의 페어링 메커니즘(점선으로 표시됨). (D) 서던 블롯 프로브에 의해 인식되는 서열을 나타내는 오염물 벡터 게놈의 묘사. (E) 하기 발현 카세트를 포함하는 AAV 제조물의 서던 블롯 분석: 1. 5'CMV ABCA4 AK(이중 하이브리드); 2. 5'CMV ABCA4 TS(이중 트랜스-스플라이싱); 3. 5'CMV NO INTR ABCA4 OV(이중 중첩); 4. 5'CMV NO INTR ABCA4 AK(이중 하이브리드); 5. 5'VMD2 ABCA4 AK(이중 하이브리드); 6. 5'RHO ABCA4 AK(이중 하이브리드); 7. 5'RHO ABCA4 TS(이중 트랜스-스플라이싱). 키메라 인트론은 벡터 1 및 2에 존재하고 벡터 3 내지 7에는 존재하지 않는다. 점선 상자는 예상 크기의 전장 게놈을 나타내고; 실선 박스는 짧고 절두된 게놈을 나타낸다.
도 2. EGFP 형광에 의한 키메라 인트론, SV40 인트론, MVM 인트론 및 인트론 부재의 시험관내 비교.
(A) 키메라 인트론, SV40 인트론 또는 MVM 인트론을 갖거나 인트론이 없는 EGFP를 인코딩하는 플라스미드의 묘사. (B) 형질감염된 HEK293 세포의 대표적인 현미경 형광 사진(10X 배율, 스케일 바 100 μm). CI: 키메라 인트론; SV40: 시미안 바이러스 40; MVM: 미닛 바이러스 마우스.
도 3. 웨스턴 블롯 분석에 의한 키메라 인트론, SV40 인트론, MVM 인트론 및 인트론 부재의 시험관내 비교.
A) 이중 AAV2-키메라 인트론-hMYO7A, 이중 AAV2-SV40 인트론-hMYO7A, 이중 AAV2-MVM 인트론-hMYO7A, 이중 AAV2-인트론 부재-hMYO7A 또는 벡터 부재로의 감염 후 72시간째 HEK293 세포의 웨스턴 블롯 분석. 화살표는 전장 단백질을 나타내고, 60 μg의 단백질을 각 레인에 로딩하였고, 각 웨스턴 블롯에 있어서 분자 마커는 왼쪽에 보고된다. 실험 번호는 샘플의 각 세트 아래에 보고되어 있다. 음성 대조군: 이중 AAV2-hMYO7A를 수용하지 않은 세포; @MYO7A: 항-Myosin7A(MYO7A) 항체를 이용한 웨스턴 블롯; @Filamin: 로딩 대조군으로 사용된 항-Filamin 항체를 이용한 웨스턴 블롯. SV40 인트론: 변형된 시미안 바이러스 40 인트론; MVM 인트론: 미닛 바이러스 마우스 인트론.
B) HEK293에서 이중 AAV2-키메라 인트론-hMYO7A, 이중 AAV2-SV40 인트론-hMYO7A, 이중 AAV2-MVM 인트론-hMYO7A 또는 이중 AAV2-인트론 부재-hMYO7A로의 감염시 발현된 hMYO7A 수준의 정량화. hMYO7A의 수준은 이중 AAV2-키메라 인트론-hMYO7A에 의해 발현되는 hMYO7A에 상대적이다. 각 흑색 사각형은 해당 군의 각 샘플에 대해 정량화된 값을 나타낸다. 항-MYO7A 항체를 사용하여 웨스턴 블롯 분석에 의해 정량화를 수행하고, 인간 MYO7A 밴드 강도의 측정치를 Filamin으로 표준화하였다. 평균 값은 각 그룹의 히스토그램 내에 보고된다. SV40 인트론: 변형된 시미안 바이러스 40 인트론; MVM 인트론: 미닛 바이러스 마우스 인트론.
도 4. 키메라 인트론, SV40 인트론 및 MVM 인트론의 비교.
AAV8-5'hMYO7A에 의해 운반되는 발현 카세트의 묘사. 상단: AAV8-5'hMYO7A 키메라 인트론; 중간: AAV8-5'hMYO7A SV40 인트론; 하단: AAV8-5'hMYO7A MVM 인트론. (B) AAV8-5'hMYO7A 키메라 인트론, AAV8-5'hMYO7A SV40 인트론 및 AAV8-5'hMYO7A MVM 인트론으로부터의 바이러스 게놈의 서던 블롯. 모든 샘플을 DNAse로 처리하여 오염된 외부 DNA를 분해한 다음, 바이러스 게놈 DNA를 추출하였다. 5'AAV 게놈-CI: AAV8-CBA 프로모터-키메라 인트론-5'hMYO7A로부터 추출된 바이러스 게놈 DNA; 5'AAV 게놈-SV40: AAV8-CBA 프로모터-SV40 인트론-5'hMYO7A로부터 추출된 바이러스 게놈 DNA; 5'AAV 게놈-MVM: AAV8-CBA 프로모터-SV40 인트론-5'hMYO7A로부터 추출된 바이러스 게놈 DNA; 킬로베이스로 표현된 분자량 마커; bp = 염기쌍. CI: 키메라 인트론; SV40: 시미안 바이러스 40 인트론; MVM: 미닛 바이러스 마우스 인트론. (C) AAV8-3'hMYO7A-3XFLAG, 또는 부형제와 조합된 AAV8-5'hMYO7A 키메라 인트론, AAV8-5'hMYO7A SV40 인트론 또는 AAV8-5'hMYO7A MVM 인트론의 망막하 주사 후 2주째 C57BL/6 아이컵의 대표적인 웨스턴 블롯 분석. 화살표는 전장 단백질을 나타내고, 각 레인에 150 μg의 단백질을 로딩하였다. 음성 대조군: 부형제가 주사된 눈; @Flag: 전장 Myosin7A-3XFlag를 인식하기 위한 항-플래그를 갖는 웨스턴 블롯; @Dysferlin: 로딩 대조군으로 사용된 항-Dysferlin 항체로의 웨스턴 블롯. (D) 망막하 주사된 C57BL/6 아이컵에서 AAV8-3'hMYO7A-3XFLAG와 조합된 AAV8-5'hMYO7A 키메라 인트론, AAV8-5'hMYO7A SV40 인트론 또는 AAV8-5'hMYO7A MVM 인트론으로부터 발현된 hMYO7A 수준의 정량화. hMYO7A-3XFLAG의 수준은 AAV8-3'hMYO7A-3XFLAG와 조합된 AAV8-5'hMYO7A 키메라 인트론에 의해 발현되는 hMYO7A-3XFLAG에 상대적이다. hMYO7A-3XFLAG에 대한 양성 눈의 수(n)는 각 막대 아래에 묘사되어 있다. 항-Flag 항체를 사용하여 웨스턴 블롯 분석(패널 C)에 의해 정량화를 수행하고, Dysferlin에 대해 표준화된 hMYO7A-3XFLAG 밴드 강도의 측정을 수행하였다. 평균 값은 상응하는 막대 위에 묘사되어 있다. 값은 평균 ± 평균의 표준 오차(s.e.m.)로 표시된다.
도 5. 셰이커 마우스에서 정단 멜라노솜 국소화 및 hMYO7A 단백질 재구성의 용량-의존적 개선.
(A) 음성 대조군으로서 용매, 또는 이중 AAV8.hMYO7A(용량 1.37E+10, 4.4E+9 또는 1.37E+9 총 GC/눈)의 망막하 주사를 수용하는 sh1-/- 및 양성 대조군으로서 용매의 망막하 주사를 수용하는 sh1 +/-를 나타내는 톨루이딘 블루로 염색된 반-얇은 망막 절편. 눈금 막대(백색 막대)는 10 μm이다. 검은색 화살표는 올바르게 국소화된 멜라노솜을 가리킨다. (B) 이중 AAV8.hMYO7A의 망막하 전달 후 3개월째 sh1 마우스의 전체 망막 섹션의 RPE 융모에서 멜라노솜 국소화의 정량화. 정단 멜라노솜의 수/100 μm의 RPE가 보고된다. 데이터는 각 눈(점)에 대한 단일 측정 및 평균 ± s.e.m(열)으로 표시된다. 일원 ANOVA에 이어 Tukey 사후 테스트를 사용하여 통계적 분석을 수행하였다. P 값 대 용매가 투여된 sh1-/-는 다음과 같다: ** p<0.01; **** p <0.0001. (C) 1.37E+10, 4.4E+9 또는 1.37E+9 총 GC/눈의 용량에서 이중 AAV8.hMYO7A의 망막하 전달 후 5주째에 sh1-/- 아이컵의 대표적인 웨스턴 블롯 분석. 양성 및 음성 대조군으로서, sh1 +/- 및 sh1-/-는 각각 용매의 망막하 주사(이중 AAV와 동일한 부피)를 투여받았다. α-MYO7A, 항-Myosin 7A 항체를 이용한 웨스턴 블롯; α-Dysferlin: 로딩 대조군으로 사용된 항-Dysferlin 항체를 이용한 웨스턴 블롯. (D) 용매가 주사된 한배새끼 sh1+/- 눈에서 발현된 내인성 Myo7a의 백분율(%)로서 이중 AAV8 벡터의 망막하 주사 후 5주째에 sh1-/- 아이컵에서 발현된 인간 MYO7A 수준의 정량화. 항-MYO7A 항체를 사용하여 웨스턴 블롯 분석에 의해 정량화를 수행하고, MYO7A 및 Myo7a 밴드 강도의 측정치를 Dysferlin에 대해 표준화하였다. 데이터는 평균 ± s.e.m으로 표시된다(평균 값은 상응하는 막대 위에 도시된다).
발명의 상세한 설명
본원에서 사용되는 용어 "포함하는", "포함하는" 및 "~로 구성된"은 "포함하는" 또는 "포함하다"; 또는 "함유하는" 또는 "함유하다"와 동의어이며, 포괄적이거나 개방적이며, 언급되지 않은 추가의 구성원, 요소 또는 단계를 배제하지 않는다. 용어 "포함하는", "포함하다" 및 "로 구성된다"는 또한 용어 "로 구성되는"을 포함한다.
벡터 시스템
일 양태에서, 본 발명은 세포에서 트랜스진을 발현시키기 위한 벡터 시스템을 제공하며, 상기 벡터 시스템은 제1 벡터 및 제2 벡터를 포함하고, 여기서
(a)
제1 벡터는 5'에서 3' 방향으로 인트론; 트랜스진 코딩 서열(CDS)의 5' 말단 부분; 및 스플라이스 공여체 서열을 포함하며;
(b)
제2 벡터는 5'에서 3' 방향으로 스플라이스 수용체 서열; 및 트랜스진 CDS의 3' 말단 부분을 포함하며;
여기서 5' 말단 부분 및 3' 말단 부분은 함께 트랜스진 CDS를 구성하고, 인트론은 스플라이스 공여체 서열과 상동성 재조합할 수 없어 트랜스진 CDS의 5' 말단 부분을 절제한다.
또 다른 양태에서, 본 발명은 세포에서 트랜스진을 발현시키기 위한 벡터 시스템을 제공하며, 상기 벡터 시스템은 제1 벡터 및 제2 벡터를 포함하고, 여기서
(a)
제1 벡터는 5'에서 3' 방향으로 프로모터; 인트론; 트랜스진 코딩 서열(CDS)의 5' 말단 부분; 및 스플라이스 공여체 서열을 포함하며;
(b)
제2 벡터는 5'에서 3' 방향으로 스플라이스 수용체 서열; 및 트랜스진 CDS의 3' 말단 부분을 포함하며;
여기서 5' 말단 부분 및 3' 말단 부분은 함께 트랜스진 CDS를 구성하고, 인트론은 스플라이스 공여체 서열과 상동성 재조합할 수 없어 트랜스진 CDS의 5' 말단 부분을 절제한다.
또 다른 양태에서, 본 발명은 세포에서 트랜스진을 발현시키기 위한 벡터 시스템을 제공하며, 상기 벡터 시스템은 제1 벡터 및 제2 벡터를 포함하고, 여기서
(a)
제1 벡터는 5'에서 3' 방향으로 프로모터; 인트론; 트랜스진 코딩 서열(CDS)의 5' 말단 부분; 스플라이스 공여체 서열; 및 제1 재조합원성 영역을 포함하며;
(b)
제2 벡터는 5'에서 3' 방향으로 제2 재조합 영역; 스플라이스 수용체 서열; 및 트랜스진 CDS의 3' 말단 부분을 포함하며;
여기서 5' 말단 부분 및 3' 말단 부분은 함께 트랜스진 CDS를 구성하고, 인트론은 스플라이스 공여체 서열과 상동성 재조합할 수 없어 트랜스진 CDS의 5' 말단 부분을 절제한다.
또 다른 양태에서, 본 발명은 세포에서 트랜스진을 발현시키기 위한 벡터 시스템을 제공하며, 상기 벡터 시스템은 제1 벡터 및 제2 벡터를 포함하고, 여기서
(a)
제1 벡터는 5'에서 3' 방향으로 트랜스진 코딩 서열(CDS)의 5' 말단 부분; 및 스플라이스 공여체 서열을 포함하며;
(b)
제2 벡터는 5'에서 3' 방향으로 스플라이스 수용체 서열; 및 트랜스진 CDS의 3' 말단 부분을 포함하며;
여기서 5' 말단 부분 및 3' 말단 부분은 함께 트랜스진 CDS를 구성한다.
또 다른 양태에서, 본 발명은 세포에서 트랜스진을 발현시키기 위한 벡터 시스템을 제공하며, 상기 벡터 시스템은 제1 벡터 및 제2 벡터를 포함하고, 여기서
(a)
제1 벡터는 5'에서 3' 방향으로 프로모터; 트랜스진 코딩 서열(CDS)의 5' 말단 부분; 및 스플라이스 공여체 서열을 포함하며;
(b)
제2 벡터는 5'에서 3' 방향으로: 스플라이스 수용체 서열; 및 트랜스진 CDS의 3' 말단 부분을 포함하며;
여기서 5' 말단 부분 및 3' 말단 부분은 함께 트랜스진 CDS를 구성한다.
또 다른 양태에서, 본 발명은 세포에서 트랜스진을 발현시키기 위한 벡터 시스템을 제공하며, 상기 벡터 시스템은 제1 벡터 및 제2 벡터를 포함하고, 여기서
(a)
제1 벡터는 5'에서 3' 방향으로 프로모터; 트랜스진 코딩 서열(CDS)의 5' 말단 부분; 스플라이스 공여체 서열; 및 제1 재조합원성 영역을 포함하며;
(b)
제2 벡터는 5'에서 3' 방향으로 제2 재조합원성 영역; 스플라이스 수용체 서열; 및 트랜스진 CDS의 3' 말단 부분을 포함하며;
여기서 5' 말단 부분 및 3' 말단 부분은 함께 트랜스진 CDS를 구성한다.
또 다른 양태에서, 본 발명은 세포에서 트랜스진을 발현시키기 위한 벡터의 조합물을 제공하며, 상기 조합물은 제1 벡터 및 제2 벡터를 포함하고, 여기서
(a)
제1 벡터는 5'에서 3' 방향으로 인트론; 트랜스진 코딩 서열(CDS)의 5' 말단 부분; 및 스플라이스 공여체 서열을 포함하며;
(b)
제2 벡터는 5'에서 3' 방향으로 스플라이스 수용체 서열; 및 트랜스진 CDS의 3' 말단 부분을 포함하며;
여기서 5' 말단 부분 및 3' 말단 부분은 함께 트랜스진 CDS를 구성하고, 인트론은 스플라이스 공여체 서열과 상동성 재조합할 수 없어 트랜스진 CDS의 5' 말단 부분을 절제한다.
또 다른 양태에서, 본 발명은 세포에서 트랜스진을 발현시키기 위한 벡터의 조합물을 제공하며, 상기 조합물은 제1 벡터 및 제2 벡터를 포함하고, 여기서
(a)
제1 벡터는 5'에서 3' 방향으로 프로모터; 인트론; 트랜스진 코딩 서열(CDS)의 5' 말단 부분; 및 스플라이스 공여체 서열을 포함하며;
(b)
제2 벡터는 5'에서 3' 방향으로 스플라이스 수용체 서열; 및 트랜스진 CDS의 3' 말단 부분을 포함하며;
여기서 5' 말단 부분 및 3' 말단 부분은 함께 트랜스진 CDS를 구성하고, 인트론은 스플라이스 공여체 서열과 상동성 재조합할 수 없어 트랜스진 CDS의 5' 말단 부분을 절제한다.
또 다른 양태에서, 본 발명은 세포에서 트랜스진을 발현시키기 위한 벡터의 조합물을 제공하며, 상기 조합물은 제1 벡터 및 제2 벡터를 포함하고, 여기서
(a)
제1 벡터는 5'에서 3' 방향으로 프로모터; 인트론; 트랜스진 코딩 서열(CDS)의 5' 말단 부분; 스플라이스 공여체 서열; 및 제1 재조합 영역을 포함하며;
(b)
제2 벡터는 5'에서 3' 방향으로 제2 재조합원성 영역; 스플라이스 수용체 서열; 및 트랜스진 CDS의 3' 말단 부분을 포함하며;
여기서 5' 말단 부분 및 3' 말단 부분은 함께 트랜스진 CDS를 구성하고, 인트론은 스플라이스 공여체 서열과 상동성 재조합할 수 없어 트랜스진 CDS의 5' 말단 부분을 절제한다.
또 다른 양태에서, 본 발명은 세포에서 트랜스진을 발현시키기 위한 벡터의 조합물을 제공하며, 상기 벡터 시스템은 제1 벡터 및 제2 벡터를 포함하고, 여기서
(a)
제1 벡터는 5'에서 3' 방향으로 트랜스진 코딩 서열(CDS)의 5' 말단 부분; 및 스플라이스 공여체 서열을 포함하며;
(b)
제2 벡터는 5'에서 3' 방향으로 스플라이스 수용체 서열; 및 트랜스진 CDS의 3' 말단 부분을 포함하며;
여기서 5' 말단 부분 및 3' 말단 부분은 함께 트랜스진 CDS를 구성한다.
또 다른 양태에서, 본 발명은 세포에서 트랜스진을 발현시키기 위한 벡터의 조합물을 제공하며, 상기 벡터 시스템은 제1 벡터 및 제2 벡터를 포함하고, 여기서
(a)
제1 벡터는 5'에서 3' 방향으로 프로모터; 트랜스진 코딩 서열(CDS)의 5' 말단 부분; 및 스플라이스 공여체 서열을 포함하며;
(b)
제2 벡터는 5'에서 3' 방향으로 스플라이스 수용체 서열; 및 트랜스진 CDS의 3' 말단 부분을 포함하며;
여기서 5' 말단 부분 및 3' 말단 부분은 함께 트랜스진 CDS를 구성한다.
또 다른 양태에서, 본 발명은 세포에서 트랜스진을 발현시키기 위한 벡터의 조합물을 제공하며, 상기 벡터 시스템은 제1 벡터 및 제2 벡터를 포함하고, 여기서
(a)
제1 벡터는 5'에서 3' 방향으로 프로모터; 트랜스진 코딩 서열(CDS)의 5' 말단 부분; 스플라이스 공여체 서열; 및 제1 재조합원성 영역을 포함하며;
(b)
제2 벡터는 5'에서 3' 방향으로 제2 재조합원성 영역; 스플라이스 수용체 서열; 및 트랜스진 CDS의 3' 말단 부분을 포함하며;
여기서 5' 말단 부분 및 3' 말단 부분은 함께 트랜스진 CDS를 구성한다.
본 발명의 벡터 시스템 또는 벡터의 조합물은, 예를 들어, 벡터의 크기 제약으로 인해 트랜스진이 단일 벡터에 의해 패키징될 수 없는 경우 트랜스진을 세포에 전달하는데 사용될 수 있다. 예를 들어, AAV 벡터는 최대 약 5 kb로 제한된 트랜스진을 패키징하기 위한 용량을 가질 수 있다.
제1 벡터 및 제2 벡터가 세포에 도입될 때, 트랜스진 CDS는 5' 및 3' 말단 부분으로부터 재구성될 수 있다. 재구성된 트랜스진은 세포에서 발현될 수 있다.
예를 들어, 전장 트랜스진 CDS의 재구성은 i) 2개의 벡터 게놈의 역 말단 반복부(ITR-)-매개 테일-투-헤드 연쇄동일서열화에 이은 스플라이싱(이중 벡터 트랜스-스플라이싱, TS); ii) 2개의 벡터 게놈에 함유된 중첩 영역 사이의 상동성 재조합(이중 벡터 중첩, OV); 또는 iii) 둘의 조합(이중 벡터 하이브리드)에 의해 제1 및 제2 벡터 둘 모두의 동일한 세포로의 도입시 달성될 수 있다.
일부 구체예에서, 트랜스진 CDS의 부분(예를 들어, 5' 및/또는 3' 말단 부분)은 10 kb 이하, 예를 들어, 9.5 kb, 9 kb, 8.5 kb, 8 kb, 7.5 kb, 7 kb, 6.5 kb, 6 kb, 5.5 kb, 5 kb 또는 4.5 kb 이하이다. 바람직한 구체예에서, 트랜스진 CDS의 부분(예를 들어, 5' 및/또는 3' 말단 부분)은 5 kb 이하이다.
일부 구체예에서, 5' 말단 부분 및 3' 말단 부분은 중첩 서열을 포함하지 않는다.
일부 구체예에서, 트랜스진 CDS는 천연 엑손-엑손 접합부에서 5' 말단 부분 및 3' 말단 부분으로 분할된다.
본원에서 사용되는 용어 "상동성 재조합할 수 없는"은 벡터가 표준 조건(예를 들어, AAV 벡터 입자의 경우, (a) 벡터 게놈; (b) Rep 및 Cap 단백질; 및 (c) AAV 생산에 필요한 아데노바이러스 헬퍼 유전자(예를 들어, E2, E4 및/또는 VARNA)를 인코딩하는 플라스미드로 HEK293 세포의 트랜스펙션에 이은 예를 들어, 본원의 실시예에 개시된 바와 같은 정제) 하에 제조되는 경우 상동성 재조합이 검출가능하지 않거나 실질적으로 전혀 검출가능하지 않음을 의미할 수 있다(예를 들어, 본원의 실시예에 개시된 바와 같은 서던 블롯 분석을 사용하여). 인트론이 스플라이스 공여체 서열과 상동성 재조합할 수 없는 경우, 트랜스진 CDS의 5' 말단 부분의 절제는 최소화되거나 방지될 수 있으며, 예를 들어, 이에 의해 제1 및 제2 벡터가 세포에 도입될 때 5' 및 3' 말단 부분으로부터 재구성되는 트린스진 CDS의 양을 증가시킨다.
일부 구체예에서, 인트론은 스플라이스 공여체 서열의 영역에 대해 적어도 95%, 96%, 97%, 98%, 99% 또는 100%(바람직하게는 100%) 서열 동일성을 갖는 적어도 20, 30, 40, 50, 60, 70, 80, 90 또는 100개의 인접 뉴클레오티드의 영역을 포함하지 않는다. 인트론은 스플라이스 공여체 서열과 상동성을 공유하지 않기 때문에, 이는 그 서열과 상동성 재조합할 수 없다.
또 다른 양태에서, 본 발명은 세포에서 트랜스진을 발현시키기 위한 벡터 시스템을 제공하며, 상기 벡터 시스템은 제1 벡터 및 제2 벡터를 포함하고, 여기서
(a)
제1 벡터는 5'에서 3' 방향으로 인트론; 트랜스진 코딩 서열(CDS)의 5' 말단 부분; 및 스플라이스 공여체 서열을 포함하며;
(b)
제2 벡터는 5'에서 3' 방향으로 스플라이스 수용체 서열; 및 트랜스진 CDS의 3' 말단 부분을 포함하며;
여기서, 5' 말단 부분 및 3' 말단 부분은 함께 트린스진 CDS를 구성하며, 인트론은 스플라이스 공여체 서열의 영역에 대해 적어도 95%, 96%, 97%, 98%, 99% 또는 100%(바람직하게는 100%) 서열 동일성을 갖는 적어도 20, 30, 40, 50, 60, 70, 80, 90 또는 100개의 인접 뉴클레오티드의 영역을 포함하지 않는다.
또 다른 양태에서, 본 발명은 세포에서 트랜스진을 발현시키기 위한 벡터 시스템을 제공하며, 상기 벡터 시스템은 제1 벡터 및 제2 벡터를 포함하고, 여기서
(a)
제1 벡터는 5'에서 3' 방향으로 프로모터; 인트론; 트랜스진 코딩 서열(CDS)의 5' 말단 부분; 및 스플라이스 공여체 서열을 포함하며;
(b)
제2 벡터는 5'에서 3' 방향으로 스플라이스 수용체 서열; 및 트랜스진 CDS의 3' 말단 부분을 포함하며;
여기서, 5' 말단 부분 및 3' 말단 부분은 함께 트린스진 CDS를 구성하며, 인트론은 스플라이스 공여체 서열의 영역에 대해 적어도 95%, 96%, 97%, 98%, 99% 또는 100%(바람직하게는 100%) 서열 동일성을 갖는 적어도 20, 30, 40, 50, 60, 70, 80, 90 또는 100개의 인접 뉴클레오티드의 영역을 포함하지 않는다.
또 다른 양태에서, 본 발명은 세포에서 트랜스진을 발현시키기 위한 벡터 시스템을 제공하며, 상기 벡터 시스템은 제1 벡터 및 제2 벡터를 포함하고, 여기서
(a)
제1 벡터는 5'에서 3' 방향으로 프로모터; 인트론; 트랜스진 코딩 서열(CDS)의 5' 말단 부분; 스플라이스 공여체 서열; 및 제1 재조합원성 영역을 포함하며;
(b)
제2 벡터는 5'에서 3' 방향으로 제2 재조합원성 영역; 스플라이스 수용체 서열; 및 트랜스진 CDS의 3' 말단 부분을 포함하며;
여기서, 5' 말단 부분 및 3' 말단 부분은 함께 트린스진 CDS를 구성하며, 인트론은 스플라이스 공여체 서열의 영역에 대해 적어도 95%, 96%, 97%, 98%, 99% 또는 100%(바람직하게는 100%) 서열 동일성을 갖는 적어도 20, 30, 40, 50, 60, 70, 80, 90 또는 100개의 인접 뉴클레오티드의 영역을 포함하지 않는다.
또 다른 양태에서, 본 발명은 세포에서 트랜스진을 발현시키기 위한 벡터의 조합물을 제공하며, 상기 조합물은 제1 벡터 및 제2 벡터를 포함하고, 여기서
(a)
제1 벡터는 5'에서 3' 방향으로 인트론; 트랜스진 코딩 서열(CDS)의 5' 말단 부분; 및 스플라이스 공여체 서열을 포함하며;
(b)
제2 벡터는 5'에서 3' 방향으로 스플라이스 수용체 서열; 및 트랜스진 CDS의 3' 말단 부분을 포함하며;
여기서, 5' 말단 부분 및 3' 말단 부분은 함께 트린스진 CDS를 구성하며, 인트론은 스플라이스 공여체 서열의 영역에 대해 적어도 95%, 96%, 97%, 98%, 99% 또는 100%(바람직하게는 100%) 서열 동일성을 갖는 적어도 20, 30, 40, 50, 60, 70, 80, 90 또는 100개의 인접 뉴클레오티드의 영역을 포함하지 않는다.
또 다른 양태에서, 본 발명은 세포에서 트랜스진을 발현시키기 위한 벡터의 조합물을 제공하며, 상기 조합물은 제1 벡터 및 제2 벡터를 포함하고, 여기서
(a)
제1 벡터는 5'에서 3' 방향으로 프로모터; 인트론; 트랜스진 코딩 서열(CDS)의 5' 말단 부분; 및 스플라이스 공여체 서열을 포함하며;
(b)
제2 벡터는 5'에서 3' 방향으로 스플라이스 수용체 서열; 및 트랜스진 CDS의 3' 말단 부분을 포함하며;
여기서, 5' 말단 부분 및 3' 말단 부분은 함께 트린스진 CDS를 구성하며, 인트론은 스플라이스 공여체 서열의 영역에 대해 적어도 95%, 96%, 97%, 98%, 99% 또는 100%(바람직하게는 100%) 서열 동일성을 갖는 적어도 20, 30, 40, 50, 60, 70, 80, 90 또는 100개의 인접 뉴클레오티드의 영역을 포함하지 않는다.
또 다른 양태에서, 본 발명은 세포에서 트랜스진을 발현시키기 위한 벡터의 조합물을 제공하며, 상기 조합물은 제1 벡터 및 제2 벡터를 포함하고, 여기서
(a)
제1 벡터는 5'에서 3' 방향으로 프로모터; 인트론; 트랜스진 코딩 서열(CDS)의 5' 말단 부분; 스플라이스 공여체 서열; 및 제1 재조합원성 영역을 포함하며;
(b)
제2 벡터는 5'에서 3' 방향으로 제2 재조합원성 영역; 스플라이스 수용체 서열; 및 트랜스진 CDS의 3' 말단 부분을 포함하며;
여기서 5' 말단 부분 및 3' 말단 부분은 함께 트린스진 CDS를 구성하며, 인트론은 스플라이스 공여체 서열의 영역에 대해 적어도 95%, 96%, 97%, 98%, 99% 또는 100%(바람직하게는 100%)의 서열 동일성을 갖는 적어도 20, 30, 40, 50, 60, 70, 80, 90 또는 100개의 인접 뉴클레오티드의 영역을 포함하지 않는다.
프로모터 및 인핸서
본 발명의 벡터는 프로모터를 포함할 수 있다. 적합하게는, 트랜스진 CDS의 5' 말단 부분은 프로모터에 작동 가능하게 연결된다. 본원에서 사용되는 용어 "작동가능하게 연결된"은 부분들(예를 들어, 트랜스진 및 프로모터)이 둘 모두가 실질적으로 방해받지 않고 이들의 기능을 수행할 수 있는 방식으로 함께 연결되는 것을 의미한다.
임의의 적합한 프로모터가 사용될 수 있으며, 이들의 선택은 당업자에 의해 용이하게 이루어질 수 있다. 프로모터 서열은 구성적으로 활성일 수 있거나(즉, 임의의 숙주 세포 배경에서 작동 가능함), 대안적으로 특정 숙주 세포 환경에서만 활성일 수 있어, 특정 세포 유형(예를 들어, 조직-특이적 프로모터)에서 트랜스진의 표적화된 발현을 허용할 수 있다. 프로모터는 또 다른 인자, 예를 들어, 숙주 세포에 존재하는 인자의 존재에 반응하여 유도성 발현을 나타낼 수 있다. 벡터가 요법을 위해 투여되는 경우, 프로모터는 표적 세포(예를 들어, 망막 세포)에서 기능성인 것이 바람직하다.
일부 구체예에서, 프로모터는 사이토메갈로바이러스 프로모터, 로돕신 프로모터, 로돕신 키나제 프로모터, 광수용체간 레티노이드 결합 단백질 프로모터, 및 난황 황반 이영양증 2 프로모터; 또는 이의 단편으로 구성된 군으로부터 선택된다.
바람직한 구체예에서, 프로모터는 닭 β-액틴(CBA) 프로모터 또는 이의 단편이다.
예시적인 CBA 프로모터 서열은 다음을 포함한다:
(SEQ ID NO: 1)
(SEQ ID NO: 28)
일부 구체예에서, 프로모터는 SEQ ID NO: 1에 대해 적어도 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 뉴클레오티드 동일성을 갖는 핵산 서열 또는 이의 단편을 포함하거나 이로 구성되며, 바람직하게는 프로모터는 SEQ ID NO: 1의 프로모터의 천연 기능을 실질적으로 보유한다.
일부 구체예에서, 프로모터는 SEQ ID NO: 28에 대해 적어도 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 뉴클레오티드 동일성을 갖는 핵산 서열 또는 이의 단편을 포함하거나 이로 구성되며, 바람직하게는 프로모터는 SEQ ID NO: 28의 프로모터의 천연 기능을 실질적으로 보유한다.
바람직한 구체예에서, 프로모터는 SEQ ID NO: 1의 핵산 서열 또는 이의 단편을 포함하거나 이로 구성된다.
바람직한 구체예에서, 제1 벡터는 SEQ ID NO: 1의 핵산 서열 또는 이의 단편을 포함하거나 이로 구성되는 프로모터를 포함한다.
로돕신(Rho) 프로모터 서열의 예는 다음과 같다:
(SEQ ID NO: 29)
일부 구체예에서, 프로모터는 SEQ ID NO: 29에 대해 적어도 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 뉴클레오티드 동일성을 갖는 핵산 서열 또는 이의 단편을 포함하거나 이로 구성되며, 바람직하게는 프로모터는 SEQ ID NO: 29의 프로모터의 천연 기능을 실질적으로 보유한다.
예시적인 난황 황반 이영양증 2(VMD2) 프로모터 서열은 다음과 같다:
(SEQ ID NO: 30)
일부 구체예에서, 프로모터는 SEQ ID NO: 30에 대해 적어도 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 뉴클레오티드 동일성을 갖는 핵산 서열 또는 이의 단편을 포함하거나 이로 구성되며, 바람직하게는 프로모터는 SEQ ID NO: 30의 프로모터의 천연 기능을 실질적으로 보유한다.
본 발명의 벡터는 인핸서를 포함할 수 있다. 적합하게는, 트랜스진 CDS의 5' 말단 부분은 인핸서에 작동 가능하게 연결된다.
일부 구체예에서, 인핸서는 프로모터의 업스트림(즉, 벡터의 5' 종결 말단쪽으로)에 있다.
"인핸서"는 특정 유전자의 전사가 일어날 가능성을 증가시키기 위해 단백질(활성화제)에 의해 결합될 수 있는 DNA의 영역이다. 인핸서는 시스-작용한다. 이들은 유전자로부터 최대 1 Mbp(1,000,000 bp) 떨어져 출발 부위로부터 업스트림 또는 다운스트림에 위치할 수 있다.
바람직한 구체예에서, 인핸서는 CMV 인핸서이다.
예시적인 CMV 인핸서 서열은 다음과 같다:
(SEQ ID NO: 2)
일부 구체예에서, 인핸서는 SEQ ID NO: 2에 대해 적어도 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 뉴클레오티드 동일성을 갖는 핵산 서열 또는 이의 단편을 포함하거나 이로 구성되며, 바람직하게는 인핸서는 SEQ ID NO: 2의 인핸서의 천연 기능을 실질적으로 보유한다.
바람직한 구체예에서, 인핸서는 SEQ ID NO: 2의 핵산 서열 또는 이의 단편을 포함하거나 이로 구성된다.
바람직한 구체예에서, 제1 벡터는 SEQ ID NO: 2의 핵산 서열 또는 이의 단편을 포함하거나 이로 구성되는 인핸서를 포함한다.
인트론
인트론은 트랜스진 발현을 증가시키기 위해 벡터에 포함될 수 있다. 임의의 적합한 인트론이 사용될 수 있고, 이의 선택은 당업자에 의해 용이하게 이루어질 수 있으며, 단, 제1 벡터의 인트론은 스플라이스 공여체 서열과 상동성 재조합할 수 없어 트랜스진 CDS의 5' 말단 부분을 절제한다.
예시적인 인트론 서열은 다음을 포함한다:
(SEQ ID NO: 31; 야생형 작은 T 항원 인트론)
(SEQ ID NO: 32; 야생형 큰 T 항원 인트론)
(SEQ ID NO: 33; SV40 인트론, 예를 들어, 업스트림 서열은 큰 T 항원 인트론으로부터 유래되고, 다운스트림 서열은 SV40 cds로부터 유래됨)
일부 구체예에서, 인트론은 SEQ ID NO: 31, 32 또는 33에 대해 적어도 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 뉴클레오티드 동일성을 갖는 핵산 서열을 포함하거나 이로 구성되며, 바람직하게는 인트론은 각각 SEQ ID NO: 31, 32 또는 33의 인트론의 천연 기능을 실질적으로 보유한다.
바람직한 구체예에서, 인트론은 시미안 바이러스 40(SV40) 인트론이다. SV40 인트론은 변형된 SV40 인트론일 수 있다(예를 들어, 문헌[Nathwani et al. (2006) Blood 107: 2653-2661] 참조).
일부 구체예에서, 인트론은 미닛 바이러스 마우스(MVM) 인트론이다.
예시적인 SV40 인트론 서열은 다음과 같다:
(SEQ ID NO: 3; 변형된 SV40 인트론)
바람직한 구체예에서, 인트론은 SEQ ID NO: 3에 대해 적어도 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 뉴클레오티드 동일성을 갖는 핵산 서열을 포함하거나 이로 구성되며, 바람직하게는 인트론은 SEQ ID NO: 3의 인트론의 천연 기능을 실질적으로 보유한다.
일부 구체예에서, 인트론은 SEQ ID NO: 3의 핵산 서열, 또는 4, 3, 2 또는 1개의 뉴클레오티드 치환, 부가 또는 결실을 갖는 이의 변이체를 포함하거나 이로 구성되며, 바람직하게는 여기서 인트론은 SEQ ID NO: 3의 인트론의 천연 기능을 실질적으로 보유한다.
바람직한 구체예에서, 인트론은 SEQ ID NO: 3의 핵산 서열을 포함하거나 이로 구성된다.
바람직한 구체예에서, 제1 벡터는 SEQ ID NO: 3의 핵산 서열을 포함하거나 이로 구성되는 인트론을 포함한다.
예시적인 MVM 인트론 서열은 다음과 같다:
(SEQ ID NO: 4)
일부 구체예에서, 인트론은 SEQ ID NO: 4에 대해 적어도 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 뉴클레오티드 동일성을 갖는 핵산 서열을 포함하거나 이로 구성되며, 바람직하게는 인트론은 SEQ ID NO: 4의 인트론의 천연 기능을 실질적으로 보유한다.
일부 구체예에서, 인트론은 SEQ ID NO: 4의 핵산 서열, 또는 4, 3, 2 또는 1개의 뉴클레오티드 치환, 부가 또는 결실을 갖는 이의 변이체를 포함하거나 이로 구성되며, 바람직하게는 인트론은 SEQ ID NO: 4의 인트론의 천연 기능을 실질적으로 보유한다.
바람직한 구체예에서, 인트론은 SEQ ID NO: 4의 핵산 서열을 포함하거나 이로 이루어진다.
바람직한 구체예에서, 제1 벡터는 SEQ ID NO: 4의 핵산 서열을 포함하거나 이로 구성되는 인트론을 포함한다.
또 다른 양태에서, 본 발명은 세포에서 트랜스진을 발현시키기 위한 벡터 시스템을 제공하며, 상기 벡터 시스템은 제1 벡터 및 제2 벡터를 포함하고, 여기서
(a)
제1 벡터는 5'에서 3' 방향으로 인트론; 트랜스진 코딩 서열(CDS)의 5' 말단 부분; 및 스플라이스 공여체 서열을 포함하며;
(b)
제2 벡터는 5'에서 3' 방향으로 스플라이스 수용체 서열; 및 트랜스진 CDS의 3' 말단 부분을 포함하며;
여기서 5' 말단 부분 및 3' 말단 부분은 함께 트랜스진 CDS를 구성하고, 인트론은 SEQ ID NO: 3 또는 4에 대한 적어도 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 뉴클레오티드 동일성을 갖는 핵산 서열을 포함하거나 이로 구성되며, 바람직하게는 인트론은 각각 SEQ ID NO: 3 또는 4의 인트론의 천연 기능을 실질적으로 보유한다.
또 다른 양태에서, 본 발명은 세포에서 트랜스진을 발현시키기 위한 벡터 시스템을 제공하며, 상기 벡터 시스템은 제1 벡터 및 제2 벡터를 포함하고, 여기서
(a)
제1 벡터는 5'에서 3' 방향으로 프로모터; 인트론; 트랜스진 코딩 서열(CDS)의 5' 말단 부분; 및 스플라이스 공여체 서열을 포함하며;
(b)
제2 벡터는 5'에서 3' 방향으로 스플라이스 수용체 서열; 및 트랜스진 CDS의 3' 말단 부분을 포함하며;
여기서 5' 말단 부분 및 3' 말단 부분은 함께 트랜스진 CDS를 구성하고, 인트론은 SEQ ID NO: 3 또는 4에 대한 적어도 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 뉴클레오티드 동일성을 갖는 핵산 서열을 포함하거나 이로 구성되며, 바람직하게는 인트론은 각각 SEQ ID NO: 3 또는 4의 인트론의 천연 기능을 실질적으로 보유한다.
또 다른 양태에서, 본 발명은 세포에서 트랜스진을 발현시키기 위한 벡터 시스템을 제공하며, 상기 벡터 시스템은 제1 벡터 및 제2 벡터를 포함하고, 여기서
(a)
제1 벡터는 5'에서 3' 방향으로 프로모터; 인트론; 트랜스진 코딩 서열(CDS)의 5' 말단 부분; 스플라이스 공여체 서열; 및 제1 재조합원성 영역을 포함하며;
(b)
제2 벡터는 5'에서 3' 방향으로 제2 재조합원성 영역; 스플라이스 수용체 서열; 및 트랜스진 CDS의 3' 말단 부분을 포함하며;
여기서 5' 말단 부분 및 3' 말단 부분은 함께 트랜스진 CDS를 구성하고, 인트론은 SEQ ID NO: 3 또는 4에 대한 적어도 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 뉴클레오티드 동일성을 갖는 핵산 서열을 포함하거나 이로 구성되며, 바람직하게는 인트론은 각각 SEQ ID NO: 3 또는 4의 인트론의 천연 기능을 실질적으로 보유한다.
스플라이스 공여체 및 수용체
RNA 스플라이싱은 새로 만들어진 전구체 메신저 RNA(프리-mRNA) 전사체가 성숙 메신저 RNA(mRNA)로 형질전환되는 RNA 프로세싱의 한 형태이다. 스플라이싱 동안, 인트론(비코딩 영역)이 제거되고 엑손(코딩 영역)이 함께 연결된다.
인트론 내에서, 스플라이싱을 위해 공여체 부위(인트론의 5' 말단), 분지 부위(인트론의 3' 말단 부근) 및 수용체 부위(인트론의 3' 말단)가 필요하다. 스플라이스 공여체 부위는 더 크고 덜 고도로 보존된 영역 내에서 인트론의 5' 말단에 거의 불변인 서열 GU를 포함한다. 인트론의 3' 말단에서 스플라이스 수용체 부위는 거의 불변의 AG 서열로 인트론을 종결시킨다. AG로부터 상류(5'-방향)에는 피리미딘(C 및 U), 또는 폴리피리미딘 트랙이 높은 영역이 있다. 폴리피리미딘 트랙으로부터 추가 업스트림는 분지점이다.
"스플라이스 공여체 서열"은 인트론의 5' 말단에서 공여체 부위로서 기능할 수 있는 뉴클레오티드 서열이다. 인간 스플라이스 부위 영역의 컨센서스 서열 및 빈도는 문헌[Ma et al. (2015) PLoS One 10(6): p.e0130729]에 기술되어 있다.
"스플라이스 수용체 서열"은 인트론의 3' 말단에서 수용체 부위로서 기능할 수 있는 뉴클레오티드 서열이다. 인간 스플라이스 부위 영역의 컨센서스 서열 및 빈도는 문헌[Ma et al. (2015) PLoS One 10(6): p.e0130729]에 기술되어 있다.
예시적인 스플라이스 공여체 서열은 다음과 같다:
(SEQ ID NO: 5)
일부 구체예에서, 스플라이스 공여체 서열은 SEQ ID NO: 5에 대해 적어도 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 뉴클레오티드 동일성을 갖는 핵산 서열을 포함하거나 이로 구성되며, 바람직하게는 스플라이스 공여체 서열은 SEQ ID NO: 5의 스플라이스 공여체 서열의 천연 기능을 실질적으로 보유한다.
바람직한 구체예에서, 스플라이스 공여체 서열은 SEQ ID NO: 5의 핵산 서열을 포함하거나 이로 구성된다.
바람직한 구체예에서, 제1 벡터는 SEQ ID NO: 5의 핵산 서열을 포함하거나 이로 구성되는 스플라이스 공여체 서열을 포함한다.
예시적인 스플라이스 수용체 서열은 다음과 같다:
(SEQ ID NO: 6)
일부 구체예에서, 스플라이스 수용체 서열은 SEQ ID NO: 6에 대해 적어도 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 뉴클레오티드 동일성을 갖는 핵산 서열을 포함하거나 이로 구성되며, 바람직하게는 스플라이스 수용체 서열은 SEQ ID NO: 6의 스플라이스 수용체 서열의 천연 기능을 실질적으로 보유한다.
바람직한 구체예에서, 스플라이스 수용체 서열은 SEQ ID NO: 6의 핵산 서열을 포함하거나 이로 이루어진다.
바람직한 구체예에서, 제2 벡터는 SEQ ID NO: 6의 핵산 서열을 포함하거나 이로 구성되는 스플라이스 수용체 서열을 포함한다.
재조합 영역
재조합을 증가시키기 위해 재조합원성 영역이 이중 벡터에 첨가될 수 있다. 바람직하게는, 제1 재조합원성 영역은 제1 벡터에서 스플라이스 공여체 서열의 다운스트림에 위치하고, 제2 재조합원성 영역은 제2 벡터에서 스플라이스 수용체 서열의 업스트림에 위치한다.
바람직한 구체예에서, 제1 재조합원성 영역 및 제2 재조합원성 영역은 동일하다.
일부 구체예에서, 제1 재조합원성 영역 및 제2 재조합원성 영역은 둘 모두 F1 파지 재조합원성 영역 또는 이의 단편이다. 바람직한 구체예에서, 제1 재조합원성 영역 및 제2 재조합원성 영역은 둘 모두 AK 재조합원성 영역 또는 이의 단편이다.
예시적인 재조합원성 영역 서열(AK)은 다음을 포함한다:
(SEQ ID NO: 7)
(SEQ ID NO: 34)
일부 구체예에서, 재조합원성 영역(예를 들어, 제1 재조합원성 영역 및 제2 재조합원성 영역)은 SEQ ID NO: 7에 대해 적어도 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 뉴클레오티드 동일성을 갖는 핵산 서열 또는 이의 단편을 포함하거나 이로 구성되며, 바람직하게는 여기서 재조합원성 영역은 SEQ ID NO: 7의 재조합원성 영역의 천연 기능을 실질적으로 보유한다.
일부 구체예에서, 재조합원성 영역(예를 들어, 제1 재조합원성 영역 및 제2 재조합원성 영역)은 SEQ ID NO: 34에 대해 적어도 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 뉴클레오티드 동일성을 갖는 핵산 서열 또는 이의 단편을 포함하거나 이로 구성되며, 바람직하게는 여기서 재조합원성 영역은 SEQ ID NO: 34의 재조합원성 영역의 천연 기능을 실질적으로 보유한다.
바람직한 구체예에서, 재조합원성 영역(예를 들어, 제1 재조합원성 영역 및 제2 재조합원성 영역)은 SEQ ID NO: 7의 핵산 서열 또는 이의 단편을 포함하거나 이로 구성된다.
바람직한 구체예에서, 제1 벡터는 SEQ ID NO: 7의 핵산 서열 또는 이의 단편을 포함하거나 이로 구성되는 재조합원성 영역을 포함한다.
바람직한 구체예에서, 제2 벡터는 SEQ ID NO: 7의 핵산 서열 또는 이의 단편을 포함하거나 이로 구성되는 재조합원성 영역을 포함한다.
일부 구체예에서, 제1 재조합원성 영역 및 제2 재조합원성 영역 둘 모두는 알칼리성 포스파타제 유전자, 예컨대, AP(NM 001632, bp 823-1100, SEQ ID NO: 35); AP1(XM 005246439.2, bp 1802-1516, SEQ ID NO: 36); AP2(XM_005246439.2, bp 1225-938, SEQ ID NO: 37)로부터 유래된다.
예시적인 AP 재조합원성 영역 서열은 다음을 포함한다:
(SEQ ID NO: 35; AP)
(SEQ ID NO: 36; AP1)
(SEQ ID NO: 37; AP2)
일부 구체예에서, 재조합원성 영역(예를 들어, 제1 재조합원성 영역 및 제2 재조합원성 영역)은 SEQ ID NO: 35에 대해 적어도 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 뉴클레오티드 동일성을 갖는 핵산 서열 또는 이의 단편을 포함하거나 이로 구성되며, 바람직하게는 여기서 재조합원성 영역은 SEQ ID NO: 35의 재조합원성 영역의 천연 기능을 실질적으로 보유한다.
일부 구체예에서, 재조합원성 영역(예를 들어, 제1 재조합원성 영역 및 제2 재조합원성 영역)은 SEQ ID NO: 36에 대해 적어도 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 뉴클레오티드 동일성을 갖는 핵산 서열 또는 이의 단편을 포함하거나 이로 구성되며, 바람직하게는 여기서 재조합원성 영역은 SEQ ID NO: 36의 재조합원성 영역의 천연 기능을 실질적으로 보유한다.
일부 구체예에서, 재조합원성 영역(예를 들어, 제1 재조합원성 영역 및 제2 재조합원성 영역)은 SEQ ID NO: 37에 대해 적어도 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 뉴클레오티드 동일성을 갖는 핵산 서열 또는 이의 단편을 포함하거나 이로 구성되며, 바람직하게는 여기서 재조합원성 영역은 SEQ ID NO: 37의 재조합원성 영역의 천연 기능을 실질적으로 보유한다.
폴리아데닐화 서열
본 발명의 벡터는 폴리아데닐화 서열을 포함할 수 있다. 적합하게는, 트랜스진은 폴리아데닐화 서열에 작동 가능하게 연결된다. 폴리아데닐화 서열은 트랜스진 발현을 개선시키기 위해 트랜스진의 다운스트림에 삽입될 수 있다.
폴리아데닐화 서열은 전형적으로 폴리아데닐화 신호, 폴리아데닐화 부위 및 다운스트림 요소를 포함한다: 폴리아데닐화 신호는 RNA 절단 복합체에 의해 인식되는 서열 모티프를 포함하고; 폴리아데닐화 부위는 폴리-A 테일이 mRNA에 첨가되는 절단 부위이고; 다운스트림 요소는 일반적으로 폴리아데닐화 부위의 바로 다운스트림에 있는 GT-풍부 영역이며, 이는 효율적인 프로세싱에 중요하다.
일부 구체예에서, 제2 벡터는 트랜스진 CDS의 3' 말단 부분의 다운스트림에 폴리아데닐화 서열을 추가로 포함한다.
일부 구체예에서, 폴리아데닐화 서열은 소 성장 호르몬(bGH) 폴리아데닐화 서열 또는 SV40 폴리아데닐화 서열이다.
바람직한 구체예에서, 폴리아데닐화 서열은 소 성장 호르몬(bGH) 폴리아데닐화 서열이다.
예시적인 폴리아데닐화 서열은 다음을 포함한다:
(SEQ ID NO: 8)
(SEQ ID NO: 38)
일부 구체예에서, 폴리아데닐화 서열은 SEQ ID NO: 8에 대해 적어도 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 뉴클레오티드 동일성을 갖는 핵산 서열을 포함하거나 이로 구성되며, 바람직하게는 폴리아데닐화 서열은 SEQ ID NO: 8의 폴리아데닐화 서열의 천연 기능을 실질적으로 보유한다.
일부 구체예에서, 폴리아데닐화 서열은 SEQ ID NO: 38에 대해 적어도 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 뉴클레오티드 동일성을 갖는 핵산 서열을 포함하거나 이로 구성되며, 바람직하게는 폴리아데닐화 서열은 SEQ ID NO: 38의 폴리아데닐화 서열의 천연 기능을 실질적으로 보유한다.
바람직한 구체예에서, 폴리아데닐화 수용체 서열은 SEQ ID NO: 8의 핵산 서열을 포함하거나 구성된다.
바람직한 구체예에서, 제2 벡터는 SEQ ID NO: 8의 핵산 서열을 포함하거나 이로 구성되는 폴리아데닐화 서열을 포함한다.
벡터
벡터는 하나의 환경에서 다른 환경으로의 실체의 이동을 허용하거나 용이하게 하는 도구이다. 본 발명에 따르면, 예로서, 재조합 핵산 기술에 사용되는 일부 벡터는 실체, 예를 들어, 핵산의 세그먼트(예를 들어, 이종성 DNA 세그먼트, 예컨대, 이종성 cDNA 세그먼트)가 표적 세포 내로 이동되게 한다. 벡터는 세포 내에서 이종성 핵산(DNA 또는 RNA)을 유지하거나, 핵산의 세그먼트를 포함하는 벡터의 복제를 용이하게 하거나, 핵산의 세그먼트에 의해 인코딩된 단백질의 발현을 용이하게 하는 목적을 제공할 수 있다. 벡터는 비바이러스 또는 바이러스 벡터일 수 있다. 재조합 핵산 기술에 사용되는 벡터의 예는 플라스미드, mRNA 분자(예를 들어, 시험관내 전사된 mRNA), 염색체, 인공 염색체 및 바이러스를 포함하나, 이에 제한되지 않는다. 벡터는 또한, 예를 들어, 네이키드 핵산(예를 들어, DNA)일 수 있다. 가장 간단한 형태로, 벡터는 그 자체가 관심 뉴클레오티드일 수 있다.
벡터는 형질감염, 형질전환 및 형질도입과 같은 당 분야에 공지된 다양한 기술을 사용하여 세포 내로 도입될 수 있다. 이러한 여러 기술, 예를 들어, 재조합 바이러스 벡터, 예컨대, 레트로바이러스, 렌티바이러스(예를 들어, 통합-결함 렌티바이러스), 아데노바이러스, 아데노-관련 바이러스, 배큘로바이러스 및 단순 포진 바이러스 벡터로의 감염; 핵산의 직접 주입 및 생물학적 형질전환이 당업계에 공지되어 있다.
비-바이러스 전달 시스템은 DNA 형질감염 방법을 포함하나 이에 제한되지 않는다. 여기서, 형질감염은 표적 세포에 유전자를 전달하기 위해 비-바이러스 벡터를 사용하는 공정을 포함한다. 전형적인 형질감염 방법은 전기천공, DNA 바이오리스틱, 지질-매개 형질감염, 압축된 DNA-매개 형질감염, 리포솜, 면역리포솜, 리포펙틴, 양이온성 제제-매개 형질감염, 양이온성 안면 양친매성 분자(CFA)(Nat. Biotechnol. (1996) 14: 556) 및 이들의 조합을 포함한다.
바이러스 벡터
바람직한 구체예에서, 벡터는 바이러스 벡터이고, 예를 들어, 바이러스(바람직하게는 AAV) 벡터 게놈을 포함한다. 바이러스 벡터는 바이러스 벡터 입자의 형태일 수 있다.
바이러스 벡터는 아데노-관련 바이러스(AAV) 벡터, 아데노바이러스 벡터, 레트로바이러스 벡터, 렌티바이러스 벡터, 단순 포진 바이러스 벡터, 피코르나바이러스 벡터 또는 알파바이러스 벡터일 수 있다.
바람직한 구체예에서, 제1 벡터 및 제2 벡터는 AAV 벡터이다. AAV 벡터는 AAV 벡터 입자의 형태일 수 있다.
아데노-관련 바이러스 벡터
AAV 벡터 또는 AAV 벡터 입자는 AAV 게놈 또는 이의 단편 또는 유도체를 포함할 수 있다. AAV 게놈은 AAV 입자의 생성에 필요한 기능을 인코딩할 수 있는 폴리뉴클레오티드 서열이다. 이러한 기능은 AAV 입자로의 AAV 게놈의 캡시드화를 포함하여, 숙주 세포에서 AAV의 복제 및 패키징 사이클에서 작동하는 것을 포함한다. 자연 발생 AAV는 복제-결핍이며, 복제 및 패키징 사이클의 완료를 위해 트랜스로 헬퍼 기능의 제공에 의존한다. 따라서, AAV 게놈은 전형적으로 복제-결핍이다.
AAV 게놈은 양성 또는 음성-센스의 단일-가닥 형태 또는 대안적으로 이중-가닥 형태일 수 있다. 이중 가닥 형태의 사용은 표적 세포에서 DNA 복제 단계의 우회를 가능하게 하여 트랜스진 발현을 가속화시킬 수 있다.
자연에서 발생하는 AAV는 다양한 생물학적 시스템에 따라 분류될 수 있다. AAV 게놈은 AAV의 임의의 천연 유래된 혈청형, 분리물 또는 클레이드로부터 유래될 수 있다.
AAV는 이들의 혈청형과 관련하여 언급될 수 있다. 혈청형은 캡시드 표면 항원의 발현 프로파일로 인해 다른 변이체 아종과 구별하는데 사용될 수 있는 독특한 반응성을 갖는 AAV의 변이체 아종에 상응한다. 전형적으로, 특정 AAV 혈청형을 갖는 AAV 벡터 입자는 임의의 다른 AAV 혈청형에 특이적인 중화 항체와 효율적으로 교차-반응하지 않는다. AAV 혈청형은 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV-PhP.B 및 AAV-PhP.eB을 포함한다.
AAV는 또한 클레이드 또는 클론과 관련하여 언급될 수 있다. 이는 자연 유래된 AAV의 계통발생적 관계, 및 전형적으로 공통 조상으로 역추적될 수 있는 AAV의 계통발생적 그룹을 지칭하고, 이의 모든 후손을 포함한다. 또한, AAV는 특정 분리물, 즉, 자연에서 발견되는 특정 AAV의 유전적 분리물과 관련하여 언급될 수 있다. 용어 유전적 분리물은 다른 자연 발생 AAV와 제한된 유전적 혼합을 거친 AAV의 집단을 기술함으로써, 유전자 수준에서 인식가능하게 별개의 집단을 정의한다.
전형적으로, AAV의 자연 유래된 혈청형, 분리물 또는 클레이드의 AAV 게놈은 적어도 하나의 역 말단 반복 서열(ITR)을 포함한다. ITR 서열은 시스로 작용하여 기능적 복제 기점을 제공하고 세포의 게놈으로부터 벡터의 통합 및 절제를 가능하게 한다. 적합하게는, 하나 이상의 ITR 서열은 트랜스진 또는 이의 부분에 측접한다.
AAV 게놈은 또한 AAV 입자에 대한 패키징 기능을 인코딩하는 rep 및/또는 cap 유전자와 같은 패키징 유전자를 포함할 수 있다. 프로모터는 각각의 패키징 유전자에 작동가능하게 연결될 수 있다. 이러한 프로모터의 특정 예는 p5, p19 및 p40 프로모터를 포함한다. 예를 들어, p5 및 p19 프로모터는 일반적으로 rep 유전자를 발현하는데 사용되는 반면, p40 프로모터는 일반적으로 cap 유전자를 발현하는데 사용된다. rep 유전자는 단백질 Rep78, Rep68, Rep52 및 Rep40 중 하나 이상 또는 이의 변이체를 인코딩한다. cap 유전자는 하나 이상의 캡시드 단백질, 예컨대, VP1, VP2 및 VP3 또는 이의 변이체를 인코딩한다.
AAV 게놈은 자연 발생 AAV의 전체 게놈일 수 있다. 예를 들어, 전체 AAV 게놈을 포함하는 벡터는 AAV 벡터 또는 벡터 입자를 제조하는데 사용될 수 있다.
적합하게는, AAV 게놈은 환자에게 투여할 목적으로 유도체화된다. 이러한 유도체화는 당 분야의 표준이며, 본 발명은 AAV 게놈의 임의의 공지된 유도체, 및 당 분야에 공지된 기술을 적용함으로써 생성될 수 있는 유도체의 사용을 포함한다. AAV 게놈은 임의의 자연 발생 AAV의 유도체일 수 있다. 적합하게는, AAV 게놈은 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10 또는 AAV11의 유도체이다.
AAV 게놈의 유도체는 생체내에서 본 발명의 AAV 벡터로부터 트랜스진의 발현을 가능하게 하는 임의의 절두된 또는 변형된 형태의 AAV 게놈을 포함한다. 전형적으로, 최소 바이러스 서열을 포함하면서도 상기 기능을 여전히 유지하기 위해 AAV 게놈을 유의하게 절두하는 것이 가능하다. 이는 벡터와 야생형 바이러스의 재조합 위험을 감소시킬 수 있고, 표적 세포에서 바이러스 유전자 단백질의 존재에 의해 세포 면역 반응을 촉발시키는 것을 피할 수 있다.
전형적으로, 유도체는 적어도 하나의 역 말단 반복 서열(ITR), 임의적으로 하나 초과의 ITR, 예를 들어, 2개 이상의 ITR을 포함할 것이다. ITR 중 하나 이상은 상이한 혈청형을 갖는 AAV 게놈으로부터 유래될 수 있거나, 키메라 또는 돌연변이체 ITR일 수 있다. 적합한 돌연변이체 ITR은 trs(말단 분해 부위)가 결실된 것이다. 이러한 결실은 코딩 및 상보적 서열 둘 모두를 함유하는 단일-가닥 게놈, 즉, 자가-상보적 AAV 게놈을 생성하기 위해 게놈의 지속적인 복제를 가능하게 한다. 이는 표적 세포에서 DNA 복제의 우회를 가능하게 하여, 가속화된 트랜스진 발현을 가능하게 한다.
AAV 게놈은 AAV 또는 이의 변이체의 임의의 자연 유래된 혈청형, 분리물 또는 클레이드로부터의 하나 이상의 ITR 서열을 포함할 수 있다. AAV 게놈은 적어도 하나, 예컨대, 2개의 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10 또는 AAV11 ITR 또는 이의 변이체를 포함할 수 있다.
하나 이상의 ITR은 어느 한쪽 말단에서 트랜스진 또는 이의 일부에 측접할 수 있다. 하나 이상의 ITR의 포함은 예를 들어, 숙주 세포 DNA 폴리머라제의 작용에 의해 단일-가닥 벡터 DNA의 이중-가닥 DNA로의 전환 후, 숙주 세포의 핵에서 AAV 벡터의 연쇄동일서열 형성을 도울 수 있다. 이러한 에피솜 연쇄동일서열의 형성은 숙주 세포의 수명 동안 AAV 벡터를 보호하여, 생체내에서 트랜스진의 연장된 발현을 가능하게 한다.
적합하게는, ITR 요소는 유도체에서 자연 AAV 게놈으로부터 보유된 유일한 서열일 것이다. 적합하게는, 유도체는 천연 게놈의 rep 및/또는 cap 유전자 및 천연 게놈의 임의의 다른 서열을 포함하지 않을 수 있다. 이는 벡터가 숙주 세포 게놈으로 통합될 가능성을 감소시킬 수 있다. 또한, AAV 게놈의 크기를 감소시키는 것은 트랜스진 또는 이의 일부에 추가하여 벡터 내에 다른 서열 요소(예를 들어, 조절 요소)를 혼입하는데 있어서 증가된 유연성을 허용한다.
따라서, 하기 부분이 본 발명의 유도체에서 제거될 수 있다: 하나의 역 말단 반복부(ITR) 서열, 복제(rep) 및 캡시드(cap) 유전자. 그러나, 유도체는 AAV 게놈의 하나 이상의 rep 및/또는 cap 유전자 또는 다른 바이러스 서열을 추가로 포함할 수 있다. 자연 발생 AAV는 인간 염색체 19 상의 특정 부위에서 높은 빈도로 통합되고, AAV 벡터에서 통합 능력의 보유가 치료 환경에서 허용될 수 있도록 무시할 만한 무작위 통합 빈도를 나타낸다.
본 발명은 추가로 천연 AAV 게놈의 것과 상이한 순서 및 구성의 AAV 게놈의 서열의 제공을 포함한다. 본 발명은 또한 하나 이상의 AAV 서열 또는 유전자를 또 다른 바이러스로부터의 서열로 또는 하나 초과의 바이러스로부터의 서열로 구성된 키메라 유전자로 대체하는 것을 포함한다. 이러한 키메라 유전자는 상이한 바이러스 종의 2개 이상의 관련된 바이러스 단백질로부터의 서열로 구성될 수 있다.
AAV 벡터 입자는 캡시드 단백질에 의해 캡시드화될 수 있다. 적합하게는, AAV 벡터 입자는 트랜스캡시드화된 형태일 수 있고, 여기서 하나의 혈청형의 ITR을 갖는 AAV 게놈 또는 유도체는 상이한 혈청형의 캡시드에 패키징된다. AAV 벡터 입자는 또한 2개 이상의 상이한 혈청형으로부터의 비변형된 캡시드 단백질의 혼합물이 바이러스 캡시드를 구성하는 모자이크 형태를 포함한다. AAV 벡터 입자는 또한 캡시드 표면에 흡착된 리간드를 보유하는 화학적으로 변형된 형태를 포함한다. 예를 들어, 이러한 리간드는 특정 세포 표면 수용체를 표적화하기 위한 항체를 포함할 수 있다.
유도체가 캡시드 단백질, 즉, VP1, VP2 및/또는 VP3을 포함하는 경우, 유도체는 하나 이상의 자연 발생 AAV의 키메라, 셔플된 또는 캡시드-변형된 유도체일 수 있다. 특히, 본 발명은 동일한 벡터(즉, 슈도타입화된 벡터) 내의 AAV의 상이한 혈청형, 클레이드, 클론 또는 분리물로부터의 캡시드 단백질 서열의 제공을 포함한다. AAV 벡터는 슈도타입화된 AAV 벡터 입자의 형태일 수 있다.
키메라, 셔플된 또는 캡시드-변형된 유도체는 전형적으로 AAV 벡터에 대한 하나 이상의 요망되는 작용기를 제공하도록 선택될 것이다. 따라서, 이러한 유도체는 자연 발생 AAV 게놈을 포함하는 AAV 벡터와 비교하여 증가된 유전자 전달 효율 및/또는 감소된 면역원성(체액 또는 세포)을 나타낼 수 있다. 유전자 전달의 증가된 효율은 예를 들어, 세포 표면에서 개선된 수용체 또는 공동-수용체 결합, 개선된 내재화, 세포 내 및 핵으로의 개선된 트래피킹, 바이러스 입자의 개선된 언코팅 및 단일-가닥 게놈의 이중 가닥 형태로의 개선된 전환에 의해 달성될 수 있다.
키메라 캡시드 단백질은 자연 발생 AAV 혈청형의 2개 이상의 캡시드 코딩 서열 사이의 재조합에 의해 생성된 것들을 포함한다. 이는 예를 들어, 한 혈청형의 비-감염성 캡시드 서열이 상이한 혈청형의 캡시드 서열로 공동-형질감염되고, 지시된 선택이 요망되는 특성을 갖는 캡시드 서열을 선택하기 위해 사용되는 마커 구조 접근법에 의해 수행될 수 있다. 상이한 혈청형의 캡시드 서열은 세포 내에서 상동성 재조합에 의해 변경되어 신규한 키메라 캡시드 단백질을 생성할 수 있다.
키메라 캡시드 단백질은 또한 2개 이상의 캡시드 단백질 사이, 예를 들어, 상이한 혈청형의 2개 이상의 캡시드 단백질 사이에 특정 캡시드 단백질 도메인, 표면 루프 또는 특정 아미노산 잔기를 전달하기 위해 캡시드 단백질 서열의 조작에 의해 생성된 것들을 포함한다.
셔플링된 또는 키메라 캡시드 단백질은 또한 DNA 셔플링 또는 오류-유발 PCR에 의해 생성될 수 있다. 하이브리드 AAV 캡시드 유전자는 관련된 AAV 유전자의 서열, 예를 들어, 다수의 상이한 혈청형의 캡시드 단백질을 인코딩하는 서열을 무작위로 단편화한 다음, 후속하여 서열 상동성 영역에서 크로스오버를 또한 유발할 수 있는 자가-프라이밍 폴리머라제 반응에서 단편을 재조립함으로써 생성될 수 있다. 여러 혈청형의 캡시드 유전자를 셔플링함으로써 이러한 방식으로 생성된 하이브리드 AAV 유전자의 라이브러리는 요망되는 작용성을 갖는 바이러스 클론을 확인하기 위해 스크리닝될 수 있다. 유사하게, 오류가 발생하기 쉬운 PCR은 AAV 캡시드 유전자를 무작위로 돌연변이시켜 다양한 변이체 라이브러리를 생성하는데 사용될 수 있으며 이후 원하는 특성에 대해 선택될 수 있다.
캡시드 유전자의 서열은 또한 천연 야생형 서열과 관련하여 특정 결실, 치환 또는 삽입을 도입하도록 유전적으로 변형될 수 있다. 특히, 캡시드 유전자는 캡시드 코딩 서열의 오픈 리딩 프레임 내에, 또는 캡시드 코딩 서열의 N- 및/또는 C-말단에서 관련되지 않은 단백질 또는 펩티드의 서열의 삽입에 의해 변형될 수 있다. 관련되지 않은 단백질 또는 펩티드는 유리하게는 특정 세포 유형에 대한 리간드로서 작용함으로써 표적 세포에 대한 향상된 결합을 부여하거나 특정 세포 집단에 대한 벡터의 표적화 특이성을 향상시키는 것일 수 있다. 관련되지 않은 단백질은 또한 생성 공정의 일부로서 바이러스 입자의 정제를 돕는 것, 즉, 에피토프 또는 친화성 태그일 수 있다. 삽입 부위는 전형적으로 바이러스 입자의 다른 기능, 예를 들어, 바이러스 입자의 내재화, 트래피킹을 방해하지 않도록 선택될 것이다.
캡시드 단백질은 인공 또는 돌연변이체 캡시드 단백질일 수 있다. 본원에서 사용되는 용어 "인공 캡시드"는 캡시드 입자가 자연에서 발생하지 않거나 자연 발생 캡시드 아미노산 서열로부터 조작된(예를 들어, 변형된) 아미노산 서열을 포함하는 아미노산 서열을 포함하는 것을 의미한다. 다시 말해서, 인공 캡시드 단백질은 인공 캡시드 아미노산 서열과 모 캡시드 아미노산 서열이 정렬되는 경우, 인공 캡시드 단백질이 유래된 모 캡시드의 서열과 비교하여 아미노산 서열의 돌연변이 또는 변이를 포함한다.
일부 구체예에서, 제1 벡터 및 제2 벡터는 hu68(예를 들어, WO 2018/160582 참조), Anc 라이브러리(예를 들어, WO 2015/054653 및 WO 2017/019994 참조) 및 AAV2-TT(예를 들어, WO 2015/121501 참조)로 구성된 군으로부터 선택된다.
예시적인 5' ITR 서열은 다음과 같다:
(SEQ ID NO: 9)
일부 구체예에서, 5' ITR은 SEQ ID NO: 9에 대해 적어도 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 뉴클레오티드 동일성을 갖는 핵산 서열을 포함하거나 이로 구성되며, 바람직하게는 5'ITR은 SEQ ID NO: 9의 5'ITR의 천연 기능을 실질적으로 보유한다.
바람직한 구체예에서, 5'ITR은 SEQ ID NO: 9의 핵산 서열을 포함하거나 이로 구성된다.
바람직한 구체예에서, 제1 벡터 및 제2 벡터는 SEQ ID NO: 9의 핵산 서열을 포함하거나 이로 구성된 5' ITR을 포함한다.
예시적인 3' ITR 서열은 다음과 같다:
(SEQ ID NO: 10)
일부 구체예에서, 3' ITR은 SEQ ID NO: 10에 대해 적어도 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 뉴클레오티드 동일성을 갖는 핵산 서열을 포함하거나 이로 구성되며, 바람직하게는 3'ITR은 SEQ ID NO: 10의 3'ITR의 천연 기능을 실질적으로 보유한다.
바람직한 구체예에서, 3'ITR은 SEQ ID NO: 10의 핵산 서열을 포함하거나 이로 구성된다.
바람직한 구체예에서, 제1 벡터 및 제2 벡터는 SEQ ID NO: 10의 핵산 서열을 포함하거나 이로 구성된 3' ITR을 포함한다.
트랜스진
일부 구체예에서, 트랜스진은 Myosin 7A(MYO7A), ABCA4, CEP290, CDH23, EYS, USH2a, GPR98 및 ALMS1로 구성된 군으로부터 선택된다.
바람직한 구체예에서, 트랜스진은 Myosin 7A(MYO7A) 트랜스진이다.
예시적인 MYO7A 뉴클레오티드 서열은 다음과 같다:
(SEQ ID NO: 11)
MYO7A 트랜스진의 예시적인 5' 말단 부분은 다음과 같다:
(SEQ ID NO: 12)
일부 구체예에서, 트랜스진의 5' 말단 부분은 SEQ ID NO: 12에 대한 적어도 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 뉴클레오티드 동일성을 갖는 핵산 서열을 포함하거나 이로 구성되며, 바람직하게는 트랜스진의 5' 말단 부분이 SEQ ID NO: 12의 트랜스진의 5' 말단 부분의 천연 기능을 실질적으로 유지한다.
바람직한 구체예에서, 트랜스진의 5' 말단 부분은 SEQ ID NO: 12의 핵산 서열을 포함하거나 이로 구성된다.
바람직한 구체예에서, 제1 벡터는 SEQ ID NO: 12의 핵산 서열을 포함하거나 이로 구성되는 트랜스진의 5' 말단 부분을 포함한다.
MYO7A 트랜스진의 예시적인 3' 말단 부분은 다음과 같다:
(SEQ ID NO: 13)
일부 구체예에서, 트랜스진의 3' 말단 부분은 SEQ ID NO: 13에 대한 적어도 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 뉴클레오티드 동일성을 갖는 핵산 서열을 포함하거나 이로 구성되며, 바람직하게는 트랜스진의 3' 말단 부분은 SEQ ID NO: 13의 트랜스진의 3' 말단 부분의 천연 기능을 실질적으로 유지한다.
바람직한 구체예에서, 트랜스진의 3' 말단 부분은 SEQ ID NO: 13의 핵산 서열을 포함하거나 이로 구성된다.
바람직한 구체예에서, 제1 벡터는 SEQ ID NO: 13의 핵산 서열을 포함하거나 이로 구성되는 트랜스진의 3' 말단 부분을 포함한다.
추가의 예시적인 MYO7A 뉴클레오티드 서열은 다음과 같다:
(SEQ ID NO: 39; NM_000260.3 뉴클레오티드 273-6920)
MYO7A 트랜스진의 추가의 예시적인 5' 말단 부분은 다음과 같다:
(SEQ ID NO: 40; NM_000260.3 뉴클레오티드 273-3380)
일부 구체예에서, 트랜스진의 5' 말단 부분은 SEQ ID NO: 40에 대해 적어도 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 뉴클레오티드 동일성을 갖는 핵산 서열을 포함하거나 이로 구성되며, 바람직하게는 트랜스진의 5' 말단 부분은 SEQ ID NO: 40의 트랜스진의 5' 말단 부분의 천연 기능을 실질적으로 유지한다.
바람직한 구체예에서, 트랜스진의 5' 말단 부분은 SEQ ID NO: 40의 핵산 서열을 포함하거나 이로 구성된다.
바람직한 구체예에서, 제1 벡터는 SEQ ID NO: 40의 핵산 서열을 포함하거나 이로 구성되는 트랜스진의 5' 말단 부분을 포함한다.
MYO7A 트랜스진의 예시적인 3' 말단 부분은 다음과 같다:
(SEQ ID NO: 41; NM_000260.3 뉴클레오티드 3381-6920)
일부 구체예에서, 트랜스진의 3' 말단 부분은 SEQ ID NO: 41에 대해 적어도 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 뉴클레오티드 동일성을 갖는 핵산 서열을 포함하거나 이로 구성되며, 바람직하게는 트랜스진의 3' 말단 부분은 SEQ ID NO: 41의 트랜스진의 3' 말단 부분의 천연 기능을 실질적으로 유지한다.
바람직한 구체예에서, 트랜스진의 3' 말단 부분은 SEQ ID NO: 41의 핵산 서열을 포함하거나 이로 구성된다.
바람직한 구체예에서, 제1 벡터는 SEQ ID NO: 41의 핵산 서열을 포함하거나 이로 구성되는 트랜스진의 3' 말단 부분을 포함한다.
일부 구체예에서, 트랜스진은 ABCA4 트랜스진이다.
예시적인 ABCA4 뉴클레오티드 서열은 다음과 같다:
(SEQ ID NO: 42)
ABCA4 트랜스진의 예시적인 5' 말단 부분은 다음과 같다:
(SEQ ID NO: 43)
일부 구체예에서, 트랜스진의 5' 말단 부분은 SEQ ID NO: 43에 대해 적어도 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 뉴클레오티드 동일성을 갖는 핵산 서열을 포함하거나 이로 구성되며, 바람직하게는 트랜스진의 5' 말단 부분은 SEQ ID NO: 43의 트랜스진의 5' 말단 부분의 천연 기능을 실질적으로 유지한다.
ABCA4 트랜스진의 예시적인 3' 말단 부분은 다음과 같다:
(SEQ ID NO: 44)
일부 구체예에서, 트랜스진의 3' 말단 부분은 SEQ ID NO: 44에 대해 적어도 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 뉴클레오티드 동일성을 갖는 핵산 서열을 포함하거나 이로 구성되며, 바람직하게는 트랜스진의 5' 말단 부분은 SEQ ID NO: 44의 트랜스진의 5' 말단 부분의 천연 기능을 실질적으로 유지한다.
본 발명에서 사용되는 폴리뉴클레오티드는 코돈-최적화될 수 있다. 일부 구체예에서, 트랜스진은 코돈 최적화된다. 코돈 최적화는 WO 1999/41397 및 WO 2001/79518에 이미 기재되어 있다. 상이한 세포는 특정 코돈의 사용이 상이하다. 이러한 코돈 편향은 세포 유형에서 특정 tRNA의 상대적 풍부도에서의 편향에 상응한다. 상응하는 tRNA의 상대적 존재비와 일치하도록 맞춤화되게 서열의 코돈을 변경함으로써, 발현을 증가시키는 것이 가능하다. 동일한 토큰으로, 상응하는 tRNA가 특정 세포 유형에서 드문 것으로 알려진 코돈을 의도적으로 선택함으로써 발현을 감소시키는 것이 가능하다. 따라서, 추가적인 정도의 번역 제어가 가능하다. 코돈 사용 표는 포유동물 세포뿐만 아니라 다양한 다른 유기체에 대해 당 분야에 공지되어 있다.
예시적인 벡터
본 발명의 제1 벡터의 예시적인 서열은 다음과 같다:
(SEQ ID NO: 14)
5' ITR
CMV 인핸서
CBA 프로모터
변형된 SV40 인트론
MYO7A 트랜스진의 5' 말단 부분
3' ITR
일부 구체예에서, 제1 벡터는 SEQ ID NO: 14에 대해 적어도 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 뉴클레오티드 동일성을 갖는 핵산 서열을 포함하거나 이로 구성되며, 바람직하게는 제1 벡터는 SEQ ID NO: 14의 제1 벡터의 천연 기능을 실질적으로 보유한다.
바람직한 구체예에서, 제1 벡터는 SEQ ID NO: 14의 핵산 서열을 포함하거나 이로 구성된다.
본 발명의 제2 벡터의 예시적인 서열은 다음과 같다:
(SEQ ID NO: 15)
5' ITR
MYO7A 트랜스진의 3' 말단 부분
bGH 폴리아데닐화 서열
3' ITR
일부 구체예에서, 제2 벡터는 SEQ ID NO: 15에 대해 적어도 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 뉴클레오티드 동일성을 갖는 핵산 서열을 포함하거나 이로 구성되며, 바람직하게는 제2 벡터는 SEQ ID NO: 15의 제2 벡터의 천연 기능을 실질적으로 보유한다.
바람직한 구체예에서, 제2 벡터는 SEQ ID NO: 15의 핵산 서열을 포함하거나 이로 구성된다.
특히 바람직한 구체예에서, 제1 벡터는 SEQ ID NO: 14의 핵산 서열을 포함하거나 이로 구성되고, 제2 벡터는 SEQ ID NO: 15의 핵산 서열을 포함하거나 이로 구성된다.
조성물
본 발명의 벡터, 벡터 시스템 및 세포는 약학적으로 허용되는 담체, 희석제 또는 부형제와 함께 대상체에 투여하기 위해 제형화될 수 있다. 적합한 담체 및 희석제는 등장성 염수 용액, 예를 들어, 포스페이트-완충된 염수를 포함하고, 잠재적으로 인간 혈청 알부민을 함유한다.
약학적 조성물을 제형화하는데 사용되는 물질은 무독성이어야 하고 활성 성분의 효능을 방해하지 않아야 한다. 담체 또는 다른 물질의 정확한 성질은 투여 경로에 따라 당업자에 의해 결정될 수 있다.
약학적 조성물은 전형적으로 액체 형태이다. 액체 약학적 조성물은 일반적으로 물, 석유, 동물성 또는 식물성 오일, 광유 또는 합성 오일과 같은 액체 담체를 포함한다. 생리학적 염수 용액, 마그네슘 클로라이드, 덱스트로스 또는 다른 사카라이드 용액, 또는 글리콜, 예컨대, 에틸렌 글리콜, 프로필렌 글리콜 또는 폴리에틸렌 글리콜이 포함될 수 있다. 일부 경우에, 계면활성제, 예컨대 플루론산(PF68) 0.001%가 사용될 수 있다.
주사를 위해, 활성 성분은 발열원이 없고 적합한 pH, 등장성 및 안정성을 갖는 수용액의 형태일 수 있다. 당업자는, 예를 들어, 등장성 비히클, 예컨대, 소듐 클로라이드 주사, 링거 주사 또는 락테이트 링거 주사를 사용하여 적합한 용액을 잘 제조할 수 있다. 보존제, 안정화제, 완충제, 항산화제 및/또는 다른 첨가제가 필요에 따라 포함될 수 있다.
지연 방출을 위해, 의약은 생체적합성 중합체로부터 형성된 마이크로캡슐 또는 당 분야에 공지된 방법에 따라 리포솜 담체 시스템과 같이 서방형을 위해 제형화되는 약학적 조성물에 포함될 수 있다.
세포 요법 생성물의 취급은 바람직하게는, 세포 요법에 대한 FACT-JACIE 국제 표준에 따라 수행된다.
치료 방법
일 양태에서, 본 발명은 요법에 사용하기 위한 본 발명의 벡터 시스템, 벡터, 키트 또는 조성물을 제공한다.
또 다른 양태에서, 본 발명은 망막 변성의 치료에 사용하기 위한 본 발명의 벡터 시스템, 벡터, 키트 또는 조성물을 제공한다. 바람직하게는, 망막 변성은 유전성 망막 변성이다.
일부 구체예에서, 용도는 어셔 증후군, 색소성 망막염, 레버 선천성 흑암시(LCA), 스타가르트병, 알스트롬 증후군 또는 ABCA4-관련 질병의 치료 또는 예방에 있다.
또 다른 양태에서, 본 발명은 어셔 증후군의 치료에 사용하기 위한 본 발명의 벡터 시스템, 벡터, 키트 또는 조성물을 제공한다.
바람직한 구체예에서, 어셔 증후군은 어셔 증후군 타입 1B이다.
또 다른 양태에서, 본 발명은 유효량의 본 발명의 벡터 시스템, 벡터, 키트 또는 조성물을 이를 필요로 하는 대상체에게 투여하는 것을 포함하는 망막 변성을 치료 또는 예방하는 방법을 제공한다. 바람직하게는, 망막 변성은 유전성 망막 변성이다.
또 다른 양태에서, 본 발명은 유효량의 본 발명의 벡터 시스템, 벡터, 키트 또는 조성물을 이를 필요로 하는 대상체에게 투여하는 것을 포함하는 어셔 증후군을 치료 또는 예방하는 방법을 제공한다.
일부 구체예에서, 망막 색소 상피(RPE) 정단 융모로의 멜라노솜의 국소화는 증가되거나 표준화된다(예를 들어, 건강한 대상체와 거의 동일한 수준으로 증가한다). 증가는 본 발명에 따라 치료되지 않은 눈(예를 들어, 질환을 앓지만 달리 실질적으로 동일한 조건 하에 있는 대상체로부터의 눈임)으로부터의 RPE 정단 융모와 비교할 수 있다. 증가(예를 들어, 100 μm 당 수)는 예를 들어, 적어도 2배, 적어도 3배, 적어도 4배, 적어도 5배, 적어도 6배, 적어도 7배, 적어도 8배, 적어도 9배 또는 적어도 10배의 증가일 수 있다. 증가는 예를 들어, 멜라노솜의 수(예를 들어, 100 μm 당 수)를 건강항 대상체에 대한 수의 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95% 또는 99% 이내로 증가시킬 수 있다. 멜라노솜을 분석하기 위한 방법은 당업자에게 잘 알려져 있으며, 예를 들어, 본원에 개시된 방법을 포함한다.
1/2,000의 전반적인 글로벌 유병률을 갖는 유전성 망막 변성(IRD)은 전세계적으로 실명의 주요 원인이다. 가장 빈번하고 중증인 IRD 중에는 색소성 망막염(RP), 레버 선천성 흑암시(LCA) 및 스타가르트병(STGD)이 있으며, 이들은 대부분 단일원성 질환으로 유전된다. IRD를 유발하는 돌연변이의 대부분은 망막의 뉴런 광수용기(PR), 간상체 및/또는 원추체에서 발현되는 유전자에서 발생한다.
AAV 벡터는 단일 망막하 투여시 장기 치료를 위해 PR 및 망막 색소 상피(RPE) 둘 모두를 표적화하는데 가장 효율적인 벡터 중 하나이다. 본 발명은 단일 AAV 벡터(이는 약 5kb의 최대 카고 용량을 가질 수 있음)로 치료하기 어려울 수 있는 하기 표에 열거된 것과 같은 질병의 치료를 가능하게 한다:
질환 | 유전자 | CDS | 발현 |
어셔 1B | MYO7A | 6.7Kb | RPE 및 PR |
스타가르트병 | ABCA4 | 6.8Kb | 간상체 & 원추체 PR |
레버 선천성 흑암시 | CEP290 | 7.5 Kb | 주로 PR(범망막) |
어셔1D, 비증후군성 난청, 상염색체 열성(DFNB12) | CDH23 | 10.1Kb | PR |
색소성 망막염 | EYS | 9.4 Kb | PR ECM |
어셔 2A | USH2a | 15.6 Kb | 간상체 & 원추체 PR |
어셔 2C | GPR98 | 18.0 Kb | 주로 PR |
알스트롬 증후군 | ALMS1 | 12.5 Kb | 간상체 & 원추체 PR |
어셔 증후군 유형 IB(USH1B)는 망막 내의 PR 및 RPE 둘 모두에서 발현되는 액틴-기반 모터인 비통상적인 MYO7A를 인코딩하는 MYO7A 유전자(CDS: 6648 bp)의 돌연변이에 의해 야기되는 가장 심각한 형태의 RP 및 난청이다.
스타가르트병(STGD)은 PR 외부 세그먼트에 위치한 올-트랜스 망막 수송체를 인코딩하는 ABCA4 유전자(CDS: 6822 bp)의 돌연변이에 의해 야기되는 유전성 황반 변성의 가장 흔한 형태이다.
원추-간상 이영양증 타입 3, 안저 플라비마쿨라투스(fundus flavimaculatus), 연령-관련 황반 변성 타입 2, 조기-발병 중증 망막 이영양증 및 색소성 망막염 타입 19는 또한 ABCA4 돌연변이(ABCA4-관련 질환)와 관련이 있다.
치료에 대한 본원의 모든 언급은 치유적, 고식적 및 예방적 치료를 포함한다. 포유동물, 특히 인간의 치료가 바람직하다. 인간 및 수의학적 치료 둘 모두는 본 발명의 범위 내에 있다.
투여
일부 구체예에서, 벡터, 벡터 시스템 또는 세포는 대상체에게 국소적으로 투여된다.
일부 구체예에서, 벡터, 벡터 시스템 또는 세포는 대상체의 눈에 투여된다. 투여는 주사, 예를 들어, 망막하 주사에 의한 것일 수 있다.
제1 벡터 및 제2 벡터는 동시에, 순차적으로 또는 개별적으로 조합하여 투여될 수 있다.
본원에서 사용되는 용어 "조합", 또는 용어 "조합하여", "조합하여 사용되는" 또는 "조합된 제조물"은 2개 이상의 제제를 동시에, 순차적으로 또는 개별적으로 조합 투여하는 것을 지칭할 수 있다.
본원에서 사용되는 용어 "동시"는 제제가 동시에, 즉, 동시에 투여되는 것을 의미한다.
본원에서 사용되는 용어 "순차적"은 제제가 차례로 투여되는 것을 의미한다.
본원에서 사용되는 용어 "분리된"은 제제가 서로 독립적으로, 그러나 제제가 조합된, 바람직하게는 상승적인 효과를 나타내도록 하는 시간 간격 내에 투여되는 것을 의미한다. 따라서, "별도의" 투여는 하나의 제제가, 예를 들어, 다른 제제 후 1분, 5분 또는 10분 이내에 투여되도록 할 수 있다.
투여량
당업자는 대상체에게 투여하기 위한 본 발명의 제제의 적절한 용량을 용이하게 결정할 수 있다. 전형적으로, 의사는 개별 환자에게 가장 적합할 실제 투여량을 결정할 것이며, 이는 사용된 특정 화합물의 활성, 그 화합물의 대사 안정성 및 작용 길이, 연령, 체중, 일반적인 건강, 성별, 식이, 투여 방식 및 시간, 배설 속도, 약물 조합, 특정 병태의 중증도, 및 요법을 받는 개체를 포함하는 다양한 인자에 의존적일 것이다. 물론 더 높거나 더 낮은 투여량 범위가 적합한 개별적인 경우가 있을 수 있으며, 이는 본 발명의 범위 내에 있다.
용량은 예를 들어, 망막 변성을 치료하거나 예방하기에 충분할 수 있다. 용량은 예를 들어, 어셔 증후군, 색소성 망막염, 레버 선천성 흑암시(LCA), 스타가르트병, 알스트롬 증후군 또는 ABCA4-관련 질병을 치료하거나 예방하기에 충분할 수 있다.
일부 구체예에서, 용량은 눈 당 1×109 내지 1.5×1010개의 총 게놈 복사체이다. 일부 구체예에서, 용량은 눈 당 4×109 내지 1.5×1010개의 총 게놈 복사체이다. 일부 구체예에서, 용량은 눈 당 1x109 내지 8x109 총 게놈 복사체, 눈 당 2x109 내지 7x109 총 게놈 복사체, 눈 당 3x109 내지 6x109 총 게놈 복사체 또는 눈 당 4x109 내지 5x109 총 게놈 복사체이다. 일부 구체예에서, 용량은 눈 당 7x109 내지 5x1010 총 게놈 복사체, 눈 당 8x109 내지 4x1010 총 게놈 복사체, 눈 당 9x109 내지 3x1010 총 게놈 복사체 또는 눈 당 1x1010 내지 2x1010 총 게놈 복사체이다.
인간 대상체에 최적화된 등가 용량이 사용될 수 있다. 일부 구체예에서, 용량은 눈 당 1×109 내지 2×1012개의 총 게놈 복사체이다. 일부 구체예에서, 용량은 눈 당 1×1010 내지 2×1012개의 총 게놈 복사체이다. 일부 구체예에서, 용량은 눈 당 1×1011 내지 2×1012개의 총 게놈 복사체이다.
일부 구체예에서, 용량은 눈 당 1×1011 내지 1.5×1012개의 총 게놈 복사체이다. 일부 구체예에서, 용량은 눈 당 4×1011 내지 1.5×1012개의 총 게놈 복사체이다. 일부 구체예에서, 용량은 눈 당 1x1011 내지 8x1011 총 게놈 복사체, 눈 당 2x1011 내지 7x1011 총 게놈 복사체, 눈 당 3x1011 내지 6x1011 총 게놈 복사체 또는 눈 당 4x1011 내지 5x1011 총 게놈 복사체이다. 일부 구체예에서, 용량은 눈 당 7x1011 내지 5x1012 총 게놈 복사체, 눈 당 8x1011 내지 4x1012 총 게놈 복사체, 눈 당 9x1011 내지 3x1012 총 게놈 복사체 또는 눈 당 1x1011 내지 2x1012 총 게놈 복사체이다.
다양한 인간외 대상체에 최적화된 등가 용량이 사용될 수 있다.
대상체
본원에서 사용되는 용어 "대상체"는 인간 또는 비인간 동물을 지칭한다.
비인간 동물의 예는 척추동물, 예를 들어, 비인간 영장류(특히 고등 영장류), 개, 설치류(예를 들어, 마우스, 래트 또는 기니피그), 돼지 및 고양이와 같은 포유동물을 포함한다. 비인간 동물은 반려 동물일 수 있다.
바람직하게는, 대상체는 인간이다.
변이체, 유도체, 유사체 및 단편
본원에 언급된 특정 단백질 및 폴리뉴클레오티드 이외에, 본 발명은 또한 이의 변이체, 유도체 및 단편을 포함한다.
본 발명의 맥락에서, 임의의 주어진 서열의 "변이체"는 잔기의 특정 서열이 (아미노산 또는 핵산 잔기이든) 해당 폴리펩티드 또는 폴리뉴클레오티드가 이의 내인성 기능 중 적어도 하나를 보유하는 방식으로 변형된 서열이다. 변이체 서열은 자연 발생 폴리펩티드 또는 폴리뉴클레오티드에 존재하는 적어도 하나의 잔기의 첨가, 결실, 치환, 변형, 대체 및/또는 변이에 의해 수득될 수 있다.
본 발명의 단백질 또는 폴리펩티드와 관련하여 본원에서 사용되는 용어 "유도체"는 생성된 단백질 또는 폴리펩티드가 이의 내인성 기능 중 적어도 하나를 유지하는 한, 서열로부터의 또는 서열로의 하나(또는 그 초과)의 아미노산 잔기의 임의의 치환, 변이, 변형, 대체, 결실 및/또는 부가를 포함한다.
전형적으로, 아미노산 치환은 예를 들어, 1, 2 또는 3, 내지 10 또는 20개의 치환이 이루어질 수 있으며, 단, 변형된 서열은 요구되는 활성 또는 능력을 보유한다. 아미노산 치환은 비-자연 발생 유사체의 사용을 포함할 수 있다.
본 발명에서 사용되는 단백질은 또한 침묵 변화를 생성하고 기능적으로 동등한 단백질을 생성하는 아미노산 잔기의 결실, 삽입 또는 치환을 가질 수 있다. 고의적인 아미노산 치환은 내인성 기능이 유지되는 한 잔기의 극성, 전하, 용해도, 소수성, 친수성 및/또는 양친매성 성질의 유사성에 기초하여 이루어질 수 있다. 예를 들어, 음으로 하전된 아미노산은 아스파르트산 및 글루탐산을 포함하고; 양으로 하전된 아미노산은 리신 및 아르기닌을 포함하고; 유사한 친수성 값을 갖는 하전되지 않은 극성 헤드 기를 갖는 아미노산은 아스파라긴, 글루타민, 세린, 트레오닌 및 티로신을 포함한다.
보존적 치환은 예를 들어, 하기 표에 따라 이루어질 수 있다. 제2 컬럼의 동일한 블록 및 제3 컬럼의 동일한 라인에 있는 아미노산은 서로 치환될 수 있다:
지방족 | 비극성 | G A P |
I L V | ||
극성 - 비하전됨 | C S T M | |
N Q | ||
극성-하전됨 | D E | |
K R H | ||
방향족 | F W Y |
전형적으로, 변이체는 야생형 아미노산 서열 또는 야생형 뉴클레오티드 서열과 특정 동일성을 가질 수 있다.
본 문맥에서, 변이 서열은 대상체 서열과 적어도 50%, 55%, 65%, 75%, 85% 또는 90% 동일할 수 있는, 적합하게는 적어도 95%, 96% 또는 97% 또는 98% 또는 99% 동일할 수 있는 아미노산 서열을 포함하는 것으로 간주된다. 변이체는 또한 유사성(즉, 유사한 화학적 특성/기능을 갖는 아미노산 잔기)의 관점에서 고려될 수 있지만, 본 발명의 맥락에서, 서열 동일성의 관점에서 표현하는 것이 바람직하다.
본 문맥에서, 변이 서열은 대상체 서열에 대해 적어도 50%, 55%, 65%, 75%, 85% 또는 90% 동일할 수 있는, 적합하게는 적어도 95%, 96% 또는 97% 또는 98% 또는 99% 동일할 수 있는 뉴클레오티드 서열을 포함하는 것으로 간주된다. 변이체는 또한 유사성 측면에서 고려될 수 있지만, 본 발명의 맥락에서, 서열 동일성 측면에서 이를 표현하는 것이 바람직하다.
적합하게는, 본원에 상세히 기재된 SEQ ID NO 중 어느 하나에 대해 퍼센트 동일성을 갖는 서열에 대한 언급은 언급된 SEQ ID NO의 전체 길이에 걸쳐 언급된 퍼센트 동일성을 갖는 서열을 지칭한다.
서열 동일성 비교는 눈으로, 또는 보다 일반적으로 용이하게 이용 가능한 서열 비교 프로그램의 도움으로 수행될 수 있다. 이러한 상업적으로 이용 가능한 컴퓨터 프로그램은 2개 이상의 서열 사이의 동일성 퍼센트를 계산할 수 있다.
동일성 퍼센트는 인접한 서열에 대해 계산될 수 있고, 즉, 하나의 서열은 다른 서열과 정렬되고, 한 서열의 각 아미노산 또는 뉴클레오티드는 한 번에 하나의 잔기로 다른 서열의 상응하는 아미노산 또는 뉴클레오티드와 직접 비교된다. 이것을 "갭핑되지 않은" 정렬이라 한다. 전형적으로, 이러한 갭핑되지 않은 정렬은 비교적 짧은 수의 잔기에 대해서만 수행된다.
이는 매우 간단하고 일관된 방법이지만, 예를 들어, 달리 동일한 서열 쌍에서, 아미노산 또는 뉴클레오티드 서열에서 하나의 삽입 또는 결실이 다음 잔기 또는 코돈이 정렬을 이탈되게 하여 전체 정렬이 수행될 때 잠재적으로 동일성 퍼센트의 큰 감소를 초래할 수 있음은 고려되지 않았다. 결과적으로, 대부분의 서열 비교 방법은 전체 동일성 스코어에 부당한 페널티를 주지 않으면서 가능한 삽입 및 결실을 고려하는 최적의 정렬을 생성하도록 설계된다. 이는 국소 동일성을 최대화하기 위해 서열 정렬에 "갭"을 삽입함으로써 달성된다.
그러나, 이러한 보다 복잡한 방법은 정렬에서 발생하는 각 갭에 "갭 페널티"를 할당하여, 동일한 수의 동일한 아미노산 또는 뉴클레오티드에 있어서, 비교된 두 서열 사이의 더 높은 관련성을 반영하여 가능한 한 적은 갭을 갖는 서열 정렬이 많은 갭을 갖는 것보다 더 높은 스코어를 달성할 것이다. "아핀 갭 코스트(Affine gap cost)"는 전형적으로 갭의 존재에 대해 비교적 높은 코스트를 부과하고 갭의 각각의 후속 잔기에 대해 더 적은 패널티를 부과하는 데 사용된다. 이것은 가장 일반적으로 사용되는 갭 스코어링 시스템이다. 높은 갭 패널티는 물론 더 적은 갭을 갖는 최적화된 정렬을 생성할 것이다. 대부분의 정렬 프로그램은 갭 페널티가 수정될 수 있도록 한다. 그러나, 서열 비교를 위해 이러한 소프트웨어를 사용할 때 디폴트 값을 사용하는 것이 바람직하다. 예를 들어, GCG Wisconsin Bestfit 패키지를 사용할 때, 아미노산 서열에 대한 디폴트 갭 패널티는 갭의 경우 -12이고 각 연장부의 경우 -4이다.
따라서, 최대 동일성 퍼센트의 계산은 갭 페널티를 고려하여 먼저 최적의 정렬의 생성을 필요로 한다. 이러한 정렬을 수행하기에 적합한 컴퓨터 프로그램은 GCG Wisconsin Bestfit 패키지이다(University of Wisconsin, USA; Devereux et al. (1984) Nucleic Acids Research 12: 387). 서열 비교를 수행할 수 있는 다른 소프트웨어의 예는 비제한적으로, BLAST 패키지(문헌 [Ausubel et al. (1999) ibid - Ch. 18] 참조), FASTA(Atschul et al. (1990) J. Mol. Biol. 403-410), EMBOSS Needle (Madeira, F., et al., 2019. Nucleic acids research, 47(W1), pp.W636-W641) 및 비교 툴의 GENEWORKS 수트를 포함한다. BLAST 및 FASTA 둘 모두는 오프라인 및 온라인 검색에 이용 가능하다(문헌 [Ausubel et al. (1999) ibid, pages 7-58 to 7-60] 참조). 그러나, 일부 적용의 경우, GCG Bestfit 프로그램을 사용하는 것이 바람직하다. 또 다른 도구인 BLAST 2 Sequences는 또한 단백질 및 뉴클레오티드 서열을 비교하는데 이용 가능하다(FEMS Microbiol. Lett. (1999) 174(2):247-50; FEMS Microbiol. Lett. (1999) 177(1):187-8).
최종 동일성 퍼센트는 측정될 수 있지만, 정렬 과정 자체는 전형적으로 모두-또는-전무(all-or-nothing) 쌍 비교를 기반으로 하지 않는다. 대신, 화학적 유사성 또는 진화적 거리에 기반하여 각각의 쌍별 비교에 스코어를 할당하는 스케일링된 유사성 스코어 매트릭스가 일반적으로 사용된다. 일반적으로 사용되는 이러한 매트릭스의 예는 BLOSUM62 매트릭스(BLAST 슈트 프로그램에 대한 디폴트 매트릭스)이다. GCG 위스콘신 프로그램은 일반적으로 공개 디폴트 값 또는 제공되는 경우 사용자 정의 기호 비교 표를 사용한다(자세한 내용은 사용자 설명서 참조). 일부 적용의 경우, GCG 패키지에 있어서 공개 디폴트 값을 사용하거나, 다른 소프트웨어의 경우, BLOSUM62와 같은 디폴트 매트릭스를 사용하는 것이 바람직하다.
소프트웨어가 최적의 정렬을 생성하면, 서열 동일성 퍼센트를 계산하는 것이 가능하다. 소프트웨어는 전형적으로 서열 비교의 일부로서 이를 수행하고 수치 결과를 생성한다. 퍼센트 서열 동일성은 언급된 SEQ ID NO에서 총 잔기의 백분율로서 동일한 잔기의 수로서 계산될 수 있다.
"단편"은 또한 변이체이고, 용어는 전형적으로 기능적으로 또는, 예를 들어, 검정에서 관심 있는 폴리펩티드 또는 폴리뉴클레오티드의 선택된 영역을 지칭한다. 따라서, "단편"은 전장 폴리펩티드 또는 폴리뉴클레오티드의 일부인 아미노산 또는 핵산 서열을 지칭한다.
이러한 변이체, 유도체 및 단편은 부위-지정 돌연변이유발과 같은 표준 재조합 DNA 기술을 사용하여 제조될 수 있다. 삽입이 이루어질 경우, 삽입 부위의 어느 한 쪽에 자연-발생 서열에 상응하는 5' 및 3' 측접 영역과 함께 삽입부를 인코딩하는 합성 DNA가 만들어질 수 있다. 측접 영역은 자연 발생 서열의 부위에 상응하는 편리한 제한 부위를 함유하여 서열이 적절한 효소(들)로 절단되고 합성 DNA가 절단부에 리게이션될 수 있다. 이후, DNA는 본 발명에 따라 발현되어 인코딩된 단백질을 제조한다. 이러한 방법은 DNA 서열의 조작을 위해 당 분야에 공지된 수많은 표준 기술의 예시일 뿐이며, 다른 공지된 기술이 또한 사용될 수 있다.
당업자는 개시된 바와 같은 본 발명의 범위를 벗어나지 않으면서 본원에 개시된 본 발명의 모든 특징을 조합할 수 있음을 이해할 것이다.
본 발명의 바람직한 특징 및 구체예는 이제 비제한적인 실시예에 의해 기술될 것이다.
본 발명의 실시는 달리 지시되지 않는 한, 당업자의 능력 내에 있는 화학, 생화학, 분자 생물학, 미생물학 및 면역학의 통상적인 기술을 이용할 것이다. 이러한 기술은 문헌에 설명되어 있다. 예를 들어, 하기 문헌 참조: Sambrook, J., Fritsch, E.F. and Maniatis, T. (1989) Molecular Cloning: A Laboratory Manual, 2nd Edition, Cold Spring Harbor Laboratory Press; Ausubel, F.M. et al. (1995 and periodic supplements) Current Protocols in Molecular Biology, Ch. 9, 13 and 16, John Wiley & Sons; Roe, B., Crabtree, J. and Kahn, A. (1996) DNA Isolation and Sequencing: Essential Techniques, John Wiley & Sons; Polak, J.M. and McGee, J.O'D. (1990) In Situ Hybridization: Principles and Practice, Oxford University Press; Gait, M.J. (1984) Oligonucleotide Synthesis: A Practical Approach, IRL Press; and Lilley, D.M. and Dahlberg, J.E. (1992) Methods in Enzymology: DNA Structures Part A: Synthesis and Physical Analysis of DNA, Academic Press. 이러한 일반적인 텍스트 각각은 본원에 참조로 포함된다.
실시예
실시예 1
결과 및 논의
이중 아데노-관련 바이러스(AAV) 벡터의 최적화
인간 Myosin7A(hMYO7A)의 전달을 위한 이중 AAV8 벡터의 특성화 동안, 본 발명자들은 트랜스진 코딩 서열 CDS(AAV8-5'hMYO7A)의 5' 말단 부분을 포함하는 벡터의 제조물에서 오염물 벡터를 발견하였다.
벡터에 사용된 닭 베타-액틴(CBA) 프로모터를 인식하는 프로브를 사용하여 개발된 서던 블롯 분석은 예상되는 AAV8-5'hMYO7A에 상응하는 더 큰 밴드 및 오염물에 상응하는 약 1.3 Kb의 더 작은 밴드를 나타내었다( 도 1a, b).
더 작은 게놈 오염물은 벡터 제조물에 일관되게 존재하였으나, 이들을 생성하는 데 사용된 플라스미드에는 없었다. 따라서, 본 발명자들은 문제가 바이러스 게놈과 관련이 있고, 원래의 플라스미드 게놈이 명백히 손상되지 않았기 때문에 벡터 입자의 제조시 또는 제조 후에 더 작은 생성물의 생성이 발생하였다고 가정하였다.
그 후, 본 발명자들은 2개의 서열: 키메라 프로모터 인트론 및 스플라이싱 공여체(SD) 신호 사이의 82개 염기쌍 상동성 영역을 확인하였다(도 1c, 하기 서열 참조).
키메라 인트론(Bothwell et al. (1981) Cell 24: 625-637):
(SEQ ID NO: 16)
스플라이싱 공여체(SD) 서열:
(SEQ ID NO: 17)
밑줄 친 서열은 동일하다: SD 서열은 키메라 인트론의 뉴클레오티드 1-82와 동일하다.
정제된 바이러스 DNA의 서브클로닝 및 Sanger 시퀀싱을 사용하여, 본 발명자들은 작제물 내의 상동성 영역의 존재로 인해 상동성 재조합 사건이 발생함을 확인하였다. 이는 인트론의 나머지 부분, 5'hMYO7A 서열 및 SD 신호의 결실을 초래하는 한편, 새로운 작제물은 여전히 AAV 역 말단 반복부(ITR)를 유지하여, 벡터 생성을 지원한다(도 1d).
인트론 서열 및 SD 서열을 함유하는 다른 벡터(예를 들어, 다른 트랜스진 및 프로모터 포함)에서 유사한 오염물이 관찰되었고(도 1e), 인트론 서열을 제거함으로써 폐기되었다.
이어서, 본 발명자들은 키메라 인트론을 SD 서열과 상동성이 아닌 서열로 치환하였다. 본 발명자들은 형질감염에 의한 HEK293 세포에서 EGFP 발현의 관점에서 비교하기 위해 시미안 바이러스 40(SV40) 인트론의 변형된 버전인 키메라 인트론(Nathwani et al. (2006) Blood 107: 2653-2661), 또는 미닛 바이러스 마우스(MVM) 인트론(Wu et al. (2008) Mol. Ther. 16: 280-289)을 갖거나 인트론이 부재하는 향상된 녹색 형광 단백질(EGFP)를 인코딩하는 플라스미드를 클로닝하였다. 형광 영상화(도 2b)는 SV40 인트론 또는 MVM 인트론을 함유하는 작제물로부터의 EGFP 발현이 키메라 인트론을 함유하는 것과 유사하다는 것을 보여준다.
SV40 및 MVM 인트론을 클로닝한 후, 본 발명자들은 hMYO7A CDS의 5' 말단 부분을 포함하는 각각의 AAV2 벡터(AAV2-SV40 인트론-5'hMYO7A 및 AAV2-MVM 인트론-5'hMYO7A)를 생성하여 AAV2-키메라 인트론-5'hMYO7A 및 AAV2-인트론 부재-5'hMYO7A에 대한 MYO7A 발현에 의한 HEK293 세포에서 시험관내에서 제2 비교를 수행하였다.
웨스턴 블롯 분석은 SV40 및 MVM 인트론 둘 모두가 시험관내에서 hMYO7A의 필적할만한 발현 수준을 유도함을 보여준다(도 3).
마지막으로, 본 발명자들은 hMYO7A CDS의 5' 말단 부분을 포함하는 각각의 AAV8 벡터(AAV8-SV40 인트론-5'hMYO7A 및 AAV8-MVM 인트론-5'hMYO7A)를 생성하였다. 이어서, 본 발명자들은 정제된 바이러스 DNA의 서던 블롯에 의해 AAV8-키메라 인트론-5'hMYO7A에 대한 제3 비교를 수행하였고, 또한 웨스턴 블롯 분석에 의해 hMYO7A 발현 수준을 평가하기 위해 AAV8-3'hMYO7A-3XFlag를 함께 C57BL/6 마우스에 망막하 주사하였다.
본 발명자들은 SV40 및 MVM 인트론 둘 모두가 오염물 벡터의 형성을 피하고 생체내에서 유사한 hMYO7A 발현 수준을 달성한다는 것을 발견하였다(도 4). 본 발명자들은 비임상 및 임상 연구에 사용하기 위해 이중 AAV8-5'hMYO7A의 생성을 위해 AAV8-SV40 인트론-5'hMYO7A를 사용하기로 결정하였다.
재료 및 방법
AAV 벡터 플라스미드의 생성
AAV 벡터 생성에 사용된 플라스미드는 AAV 혈청형 2의 역 말단 반복부(ITR)를 함유하였다. 이중 AAV 벡터를 생성하는데 필요한 2개의 AAV 벡터 플라스미드(5' 및 3')는 여러 요소를 함유하였다. 5' 플라스미드는 다음을 함유하였다: 인간 β-글로빈 유전자 및 분지의 제1 인트론으로부터의 5'-공여체 부위 및 면역글로불린 유전자 중쇄 가변 영역의 본체와 리더 사이에 있는 인트론으로부터의 3'-수용체 부위로 구성된 키메라 프로모터 인트론(Bothwell et al. (1981) Cell 24: 625-637), 시미안 바이러스 40 프로모터 인트론(SV40)의 변형된 버젼(Nathwani et al. (2006) Blood 107: 2653-2661) 또는 미닛 바이러스 마우스 인트론(Wu et al. (2008) Mol. Ther. 16: 280-289)과 결합된 닭 베타-액틴 프로모터(CBA) 및 CMV 인핸서; 트랜스진 코딩 서열(CDS)의 N-말단 부분; 스플라이스 공여체 서열. 3' 플라스미드는 다음을 함유하였다: 스플라이스 수용체 서열 및 트린스진 CDS의 C-말단 부분에 이은 BGH 폴리A. 일부 실험에 있어서, C-종결 말단에 3XFlag-태그를 갖는 hMYO7A의 3' 부분을 사용하였다.
hMYO7A CDS를 엑손 24-25 사이의 천연 엑손-엑손 접합부에서 분할하였다(5' 절반: NM_000260.3, bp 273-3380; 3' 절반: NM_000260.3, bp 3381-6920).
이중 AAV 벡터 플라스미드에 함유된 스플라이스 공여체(SD) 및 스플라이스 수용체(SA) 서열은 다음과 같다:
SD:
(SEQ ID NO: 18)
SA:
(SEQ ID NO: 19)
하이브리드 AK 벡터 플라스미드에 함유된 재조합원성 서열은 파아지 F1 게놈으로부터 유래되었다(Gene Bank 수탁 번호: J02448.1; bp 5850-5926). AK 서열은 다음과 같다:
(SEQ ID NO: 20)
AAV 벡터 생성 및 특성화
이중 AAV-hMYO7A 벡터는 TIGEM AAV 벡터 코어에 의해 생성되었다. 벡터는 HEK293 세포의 삼중 형질감염 후 2회 CsCl2 정제에 의해 생성되었다(Grimm et al. (1998) Hum. Gene Ther. 2760: 2745-2760; Liu et al.(2003) Biotechniques 34: 184-189; Salvetti). et al. (1998) Hum. Gene Ther. 9: 695-706; Zolotukhin et al.(1999) Gene Ther. 6: 973-985). 각각의 바이러스 제조물에 있어서, 물리적 역가[게놈 복사체(GC)/ml]를 TaqMan 정량적 PCR(Applied Biosystems, Carlsbad, CA, USA)에 의해 결정하였다. 프라이머 및 프로브는 AAV-5'hMYO7a의 경우 5'-hMYO7A 및 AAV-3'hMYO7A의 경우 BGH pA에서 어닐링되도록 설계되었다. AAV-5'hMYO7A에 대한 알칼리성 서던 블롯 분석을 하기와 같이 수행하였다: 3E+10 GC의 바이러스 DNA를 AAV 입자로부터 추출하였다. 패키징되지 않은 게놈을 분해하기 위해, 벡터 용액을 37℃에서 2h 동안 pH 7.9에서 40 mM TRIS-HCl, 10 mM NaCl, 6 mM MgCl2, 1 mM CaCl2를 함유하는 300 μL의 총 부피 중 1 U/μL의 DNase I(Roche, Milan, Italy)과 함께 인큐베이션하였다. 이어서, DNase I을 50 mM EDTA로 불활성화시킨 다음, 프로테이나제 K 및 2.5% N-라우로일-사르코실 용액과 함께 50℃에서 45분 동안 인큐베이션하여 캡시드를 용해시켰다. DNA를 페놀-클로로포름으로 2회 추출하고, 2 부피의 무수 에탄올 및 10% 소듐 아세테이트(3 M, pH 7)로 침전시켰다. 정제된 DNA를 알칼리성 아가로스 겔에서 작동시키고, 디곡시제닌 비-방사성 방법(Roche, Milan, Italy)을 사용하여 영상화하였다. 10 μL의 1 kb DNA 래더(N3232L; New England Biolabs, Ipswich, MA, USA)를 분자량 마커로서 로딩하였다. 서던 블롯 프로브는 544 염기쌍 프로브를 추출하고 정제하기 위해 KpnI-XhoI를 사용한 5'AAV 플라스미드 DNA의 효소적 분해에 의해 수득되었다.
세포 배양 및 형질감염
HEK293 세포를 10% 우태아 혈청(FBS)이 보충된 DMEM에서 유지시켰다(Gibco, Thermo Fisher Scientific, Waltham, MA, USA). 세포를 6-웰 플레이트(HEK293 1E+6 세포/웰)에 플레이팅하고, 24시간 후에 웰을 칼슘 포스페이트 + 1.5 μg의 상응하는 플라스미드를 사용하여 형질감염시켰다. 4시간 후, 배지를 2 mL의 새로운 예열된 배지로 교체하였다. 세포를 수확하고 형질감염 후 72시간째에 용해시켰다.
마우스에서 AAV 벡터의 망막하 주사
이 연구는 안과 및 시력 연구에서 동물의 사용에 대한 시력 및 안과 연구 협회 및 동물 시술에 대한 이탈리아 보건부 규정(승인 번호 301/2020-PR)에 따라 수행되었다.
C57BL/6 및 쉐이커 -/- 마우스를 TIGEM 동물 하우스(Pozzuoli, Italy)에 수용하고 12h 명/암 주기(광 페이스 동안 10-50 lux 노출) 하에 유지하였다. 수술은 마취 하에 수행되었고 고통을 최소화하기 위해 모든 노력을 기울였다. 성체 마우스를 2 mL/100 g 체중의 케타민/메데토미딘의 복강내 주사로 마취시켰다. 동일한 부피의 벡터 용액 또는 부형제를 리앙 등(Liang et al. (2000) Vis. Res. Protoc. 47: 125-139)에 기술된 바와 같이 후방 경공막 경맥락막 접근법을 통해 망막하로 전달하였다.
웨스턴 블롯 분석
웨스턴 블롯(Wb) 분석을 위한 세포 및 아이컵(컵 + 망막)을 RIPA 완충제(50 mM Tris-HCl pH 8.0, 150 mM NaCl, 1% NP40, 0.5% Na-데옥시콜레이트, 1 mM EDTA pH 8.0, 0.1% SDS)에서 용해시켜 MYO7A를 추출하였다. 용해 완충제에 0.5% 페닐메틸설포닐 플루오라이드(PSMF)(Sigma-Aldrich, St. Louis, Missouri, USA) 및 1% 완전 EDTA-비함유 프로테아제 억제제 칵테일(Roche, Milan, Italy)을 보충하였다. Pierce BCA 단백질 검정 키트(Thermo-Scientific)를 사용하여 단백질 농도를 결정하였다. 용해 후, 샘플을 β-메르캅토에탄올이 보충된 4X Laemmli 샘플 완충제(Bio-rad, Milan, Italy) 1:10에서 99℃에서 5분 동안 변성시켰다. 샘플을 7% 아크릴아미드 겔에서 분리하였다. 면역-블롯팅에 사용된 항체는 하기와 같았다: 전장 hMYO7A-3XFlag를 인식하기 위한 항-3XFlag(1:1000, 모노클로날, A8592; Sigma); 항-Dysferlin (1:500, MONX10795; Tebu-bio, Le Perray-en-Yveline, France). Wb 밴드의 정량화는 ImageJ 소프트웨어를 사용하여 수행되었고, hMYO7A 발현은 Dysferlin의 발현에 대해 표준화되었다.
벡터 서열
실험에 사용된 MYO7A-인코딩 벡터의 서열은 본원에서 SEQ ID NO: 14 및 15로서 개시된다.
실험에 사용된 추가 벡터의 서열은 다음과 같다:
5'CMV-
ABCA4
-AK
(SEQ ID NO: 21)
5' ITR
CMV 즉시-초기 인핸서/프로모터
키메라 인트론
ABCA4의 5' 말단 부분
3' ITR
5'CMV-
ABCA4
-TS
(SEQ ID NO: 22)
5' ITR
CMV 즉시-초기 인핸서/프로모터
키메라 인트론
ABCA4의 5' 말단 부분
3' ITR
5'CMV NO INTRON
ABCA4
OV
(SEQ ID NO: 23)
5' ITR
CMV 즉시-초기 인핸서/프로모터
ABCA4의 5' 말단 부분
3' ITR
5'CMV NO INTRON
ABCA4
-AK
(SEQ ID NO: 24)
5' ITR
CMV 즉시-초기 인핸서/프로모터
ABCA4의 5' 말단 부분
3' ITR
5'VMD2
ABCA4
-AK
(SEQ ID NO: 25)
5' ITR
인핸서
VMD2 프로모터
ABCA4의 5' 말단 부분
3' ITR
5'RHO
ABCA4
-AK
(SEQ ID NO: 26)
5' ITR
인핸서
RHO 프로모터
ABCA4의 5' 말단 부분
3' ITR
5'RHO
ABCA4
-TS
(SEQ ID NO: 27)
5' ITR
인핸서
RHO 프로모터
ABCA4의 5' 말단 부분
3' ITR
실시예 2. 이중 AAV8.hMYO7A 반응 연구
SV40 인트론을 갖는 AAV8.5'MYO7A를 포함하는 이중 AAV8.MYO7A의 치료 효능을 어셔 1b의 마우스 모델인 쉐이커1-/- (sh1 -/-) 마우스에서 생체내 시험하였다. 어셔 증후군 타입 1B(USH1B) 대상체에서 사용될 용량을 선택하기 위해, 본 발명자들은 우수한 제조-유사 관행(즉, tox 로트) 하에 생산된 이중 AAV8.hMYO7A를 사용하여 용량 반응 연구를 수행하였다. USH1B의 마우스 모델인 망막하 주사된 sh1-/- 마우스를 망막 결함의 구조 및 단백질 hMYO7A 수준에 대해 분석하였다. 본 발명자들은 3개의 상이한 용량을 선택하였다: 1,37E+9(저용량 또는 LD), 4,4E+9(중간 용량 또는 MD), 및 1,37E+10(고용량 또는 HD) 총 GC/눈. AAV 용매(NaCl 35 mM 및 0.001% 폴록사머 188이 보충된 포스페이트 완충된 염수)만 주사된 비이환된 이형접합성 마우스 및 이환된 마우스를 각각 양성 및 음성 대조군으로 사용하였다. Sh1-/- 마우스는 망막 색소 상피(RPE) 정단 융모에 멜라노솜이 거의 위치하지 않기 때문에 망막의 초미세구조 결함을 나타낸다. 주사 후 3개월에, 본 발명자들은 RPE 정단 융모에 정확하게 국소화된 멜라노솜의 수를 측정함으로써 용량-의존적 효과를 확인하였다(도 5a-b). 이중 AAV8.hMYO7A의 HD 및 MD의 주사는 용매만을 수용한 sh1-/-와 비교하여 망막 결함을 유의하게 구제하였다; 또한, HD로 처리된 비이환된 눈과 이환된 눈 사이에는 통계적 차이가 없었다(도 5b, pANOVA 값: 제형 완충제로 주사된 이환된 sh1-/- vs 제형 완충제로 주사된 비이환된 sh1+/- < 0.0001, 고용량으로 처리된 sh1-/ - < 0.0001, 중간 용량으로 처리된 sh1-/- < 0.01 또는 저용량으로 처리된 sh1-/- = 0.313; 고용량으로 처리된 sh1-/- vs 제형 완충제로 주사된 비이환된 sh1+/- = 0.105, 중간 용량으로 처리된 sh1-/- = 0.113 또는 저용량으로 처리된 sh1-/- < 0.01; 중간 용량으로 처리된 sh1-/- vs 제형 완충제가 주사된 비이환된 sh1+/- < 0.001 또는 저용량으로 처리된 sh1-/- = 0.442; 제형 완충제로 주사된 비이환된 sh1+/- vs 저용량으로 처리된 sh1-/- < 0.0001). Sh1-/- LD-처리된 눈은 또한 음성 대조군과 비교하여 망막 표현형의 교정을 나타내었다. 비이환된 sh1+/- 그룹 내에서 통계적 분석에 영향을 미치는 약간의 변동성이 있었고, 따라서 본 발명자들은 비이환된 sh1+/- 부재하에 ANOVA 분석을 반복하고 LD에 대해서도 통계적 유의성에 도달하였다(도 5b, pANOVA 값: 제형 완충제로 주사된 이환된 sh1-/- vs 고용량으로 처리된 sh1-/- < 0.0001, 중간 용량으로 처리된 sh1-/- <0.0001 또는 저용량으로 처리된 sh1-/- < 0.01; 고용량으로 처리된 sh1-/- vs 중간 용량으로 처리된 sh1-/- < 0.001 또는 저용량으로 처리된 sh1-/- < 0.0001; 중간 용량으로 처리된 sh1-/- vs 저용량으로 처리된 sh1-/- < 0.05). 망막하 주사 후 5주째에 sh1-/- 마우스로부터의 용해된 아이컵(RPE + 신경 망막)의 웨스턴 블롯 분석은 이중 AAV8.hMYO7A의 모든 선택된 용량에 대한 전장 hMYO7A의 발현을 나타낸다(도 5c-d). 더 많은 수의 눈이 LD와 비교하여 HD 및 MD를 사용한 hMYO7A 발현에 대해 양성이었다(도 5d). 인간 망막이 뮤린 망막의 100X임을 고려하면(Panda-Jonas et al. (1994) Ophthalmology 101: 519-523; Remtulla et al. (1985) Vision Res. 25: 21-31), 본 발명자들은 인간에서 해당 치료 용량이 이중 AAV8.hMYO7A의 1.37E+11 내지 1.37E+12 총 GC/눈 범위일 수 있다고 추론할 수 있다.
재료 및 방법
웨스턴 블롯 분석
웨스턴 블롯(WB) 분석을 위한 아이컵(컵 + 망막)을 RIPA 완충제(50 mM Tris-HCl pH 8.0, 150 mM NaCl, 1% NP40, 0.5% Na-데옥시콜레이트, 1 mM EDTA pH 8.0, 0.1% SDS)에서 용해시켰다. 용해 완충제에 0.5% 페닐메틸설포닐 플루오라이드(PSMF)(Sigma-Aldrich, St. Louis, Missouri) 및 1% 완전 EDTA-비함유 프로테아제 억제제 칵테일(Roche, Milan, Italy)을 보충하였다. Pierce BCA 단백질 검정 키트(Thermo-Scientific, Waltham, Massachusetts)를 사용하여 단백질 농도를 결정하였다. 용해 후, 샘플을 1:10 희석된 β-메르캅토에탄올(Sigma-Aldrich)이 보충된 4X Laemmli 샘플 완충제(Bio-rad, Milan, Italy)에서 99℃에서 5분 동안 변성시켰다. 4-20% 구배 사전-캐스트 TGX 겔(Bio-rad)에 대한 MYO7A 분석을 위한 샘플. 하기 항체를 면역-블롯팅에 사용하였다: hMYO7A 단백질의 아미노산 941-1070에 상응하는 펩티드(DMVDKMFGFLGTSGGLPGQEGQAPSGFEDLERGRREMVEEDLDAALPLPDEDEEDLSEYKFAKFAATYFQGTTTHSYTRRPLKQPLLYHDDEGDQLAALAVWITILRFMGDLPEPKYHTAMSDGSEKIPV; 밀줄친 아미노산은 뮤린 Myo7A에서 상이하다(1.6%))를 인식하는 맞춤형 항-hMYO7A(1:200, 폴리클로날; Primm Srl, Milan, Italy); 항-Dysferlin (1:500, MONX10795; Tebu-bio, Le Perray-en-Yveline, France). WB 밴드의 정량화는 ImageJ 소프트웨어를 사용하여 수행되었다. hMYO7A 발현은 Dysferlin의 발현에 대해 표준화되었다.
멜라노솜 국소화 분석
착색된 sh1 마우스(+/- 또는 -/-)의 눈을 AAV 주사 후 3개월에 적출하고 각막의 측두부에서 소작되었다. 0.1 M PBS 중 2% 글루타르알데하이드-2% 파라포름알데하이드를 사용하여 밤새 고정을 수행하고, 0.1 M PBS에서 린싱하고, 광학 현미경으로 해부하였다. 아이컵의 측두 부분은 Araldite 502/EMbed 812(Araldite 502/EMbed 812 KIT, 카탈로그 #13940; Electron Microscopy Sciences, Hatfield, PA, USA)에 포매시켰다. 반-얇은(0.5 μm) 섹션을 Leica Ultramicrotome RM2235(Leica Microsystems, Bannockburn, IL, USA)에서 가로로 절단하고, 슬라이드에 탑재하고, 톨루이딘 블루 및 보라스(borace) 염색으로 염색하였다. 멜라노솜을 100X 배율로 Zeiss Apotome(Carl Zeiss, Oberkochen, Germany)을 사용하여 중첩 필드의 획득을 통해 수득된 전체 망막 섹션의 몽타주에서 마스킹된 오퍼레이터에 의해 계수하였으며; 이후, 전체 망막 섹션을 Photoshop 소프트웨어(Adobe, San Jose, California)에서 재구성하였다. 멜라노솜 수 및 망막 색소 상피(RPE) 측정을 ImageJ 소프트웨어를 사용하여 수행하였다. 멜라노솜 수를 100 μm로 나눈 RPE의 길이에 걸쳐 표준화하였다.
통계학적 분석
일원 분산 분석(ANOVA)에 이은 Tuckey 사후 분석을 이용하여 도 5에서 그룹 사이의 다중 쌍 비교를 수행하였다. 도 5: 망막 색소 상피에 대해 정확하게 국소화된 멜라노솜에 대한 용량-의존적 효과: ANOVA p-값은 다음과 같다. 제형 완충제로 주사된 이환된 sh1-/- vs 제형 완충제로 주사된 비이환된 sh1+/-(pANOVA < 0.0001), 고용량으로 처리된 sh1-/-(pANOVA < 0.0001), 중간 용량으로 처리된 sh1-/-(pANOVA <0.01) 또는 저용량으로 처리된 sh1-/-(pANOVA = 0.313); 고용량으로 처리된 sh1-/- vs 제형 완충제로 주사된 비이환된 sh1+/-(pANOVA = 0.105), 중간 용량으로 처리된 sh1-/-(pANOVA = 0.113) 또는 저용량으로 처리된 sh1-/-(pANOVA < 0.01); 중간 용량으로 처리된 sh1-/- vs 제형 완충제가 주사된 비이환된 sh1+/-(pANOVA < 0.001) 또는 저용량으로 처리된 sh1-/-(pANOVA 0.442); 제형 완충제가 주사된 비이환된 sh1+/- vs 저용량으로 처리된 sh1-/-(pANOVA < 0.0001). ANOVA 분석에 영향을 미치는 제형 완충제로 주사된 sh1+/-의 가변성으로 인해, 비이환된 대조군 없이 비교를 다시 분석하였고, ANOVA p-값은 다음과 같다: 제형 완충제가 주사된 이환된 sh1-/- Vs 고용량으로 처리된 sh1-/- (pANOVA < 0.0001), 중간 용량으로 처리된 sh1-/-(pANOVA <0.0001) 또는 저용량으로 처리된 sh1-/-(pANOVA < 0.01); 고용량으로 처리된 sh1-/- Vs 중간 용량으로 처리된 sh1-/-(pANOVA < 0.001) 또는 저용량으로 처리된 sh1-/-(pANOVA < 0.0001); 중간 용량으로 처리된 sh1-/- Vs 저용량으로 처리된 sh1-/-(pANOVA < 0.05). 데이터는 독립적인 시험관내 실험 또는 눈의 수를 사용하여 계산된 평균[± 평균의 표준 오차(s.e.m.)]으로 제시된다(동일한 샘플의 반복 측정이 아님). 통계적 p-값 ≤ 0.05는 유의한 것으로 간주되었다.
상기 명세서에 언급된 모든 간행물은 본원에 참조로 포함된다. 본 발명의 개시된 벡터, 시스템, 방법 및 용도의 다양한 변경 및 변형은 본 발명의 범위 및 사상을 벗어나지 않으면서 당업자에게 명백할 것이다. 본 발명이 특정 바람직한 구체예와 관련하여 개시되었지만, 청구된 바와 같은 본 발명은 이러한 특정 구체예로 과도하게 제한되어서는 안된다는 것이 이해되어야 한다. 실제로, 당업자에게 명백한 본 발명을 수행하기 위한 개시된 모드의 다양한 변형은 하기 청구범위의 범위 내에 있는 것으로 의도된다.
SEQUENCE LISTING
<110> Fondazione Telethon
<120> VECTOR SYSTEM
<130> P122384PCT
<140> PCT/EP2022/062989
<141> 2022-05-12
<150> EP21173687.1
<151> 2021-05-12
<160> 45
<170> PatentIn version 3.5
<210> 1
<211> 227
<212> DNA
<213> Artificial Sequence
<220>
<223> Exemplary CBA promoter
<400> 1
gaggtgagcc ccacgttctg cttcactctc cccatctccc ccccctcccc acccccaatt 60
ttgtatttat ttatttttta attattttgt gcagcgatgg gggcggggcg gggcgaggcg 120
gagaggtgcg gcggcagcca atcggagcgg cgcgctccga aagtttcctt ttatggcgag 180
gcggcggcgg cggcggctct ataaaaagcg aagcgcgcgg cgggcgg 227
<210> 2
<211> 378
<212> DNA
<213> Artificial Sequence
<220>
<223> example CMV enhancer
<400> 2
gacattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 60
catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120
acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180
ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg gcagtacatc 240
aagtgtatca tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300
ggcattatgc ccagtacatg accttatggg actttcctac ttggcagtac atctacgtat 360
tagtcatcgc tattacca 378
<210> 3
<211> 93
<212> DNA
<213> Artificial Sequence
<220>
<223> example SV40 intron sequence
<400> 3
ctctaaggta aatataaaat ttttaagtgt ataatgtgtt aaactactga ttctaattgt 60
ttctctcttt tagattccaa cctttggaac tga 93
<210> 4
<211> 92
<212> DNA
<213> Artificial Sequence
<220>
<223> example MVM intron sequence
<400> 4
aagaggtaag ggtttaaggg atggttggtt ggtggggtat taatgtttaa ttacctggag 60
cacctgcctg aaatcacttt ttttcaggtt gg 92
<210> 5
<211> 82
<212> DNA
<213> Artificial Sequence
<220>
<223> example splice donor sequence
<400> 5
gtaagtatca aggttacaag acaggtttaa ggagaccaat agaaactggg cttgtcgaga 60
cagagaagac tcttgcgttt ct 82
<210> 6
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> example splice acceptor sequence
<400> 6
gataggcacc tattggtctt actgacatcc actttgcctt tctctccaca g 51
<210> 7
<211> 77
<212> DNA
<213> Artificial Sequence
<220>
<223> Exemplary recombinogenic region sequence (AK)
<400> 7
gggatttttc cgatttcggc ctattggtta aaaaatgagc tgatttaaca aaaatttaac 60
gcgaatttta acaaaat 77
<210> 8
<211> 208
<212> DNA
<213> Artificial Sequence
<220>
<223> Exemplary polyadenylation sequence
<400> 8
ctgtgccttc tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc 60
tggaaggtgc cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc 120
tgagtaggtg tcattctatt ctggggggtg gggtggggca ggacagcaag ggggaggatt 180
gggaagacaa tagcaggcat gctgggga 208
<210> 9
<211> 130
<212> DNA
<213> Artificial Sequence
<220>
<223> example 5' ITR
<400> 9
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct 130
<210> 10
<211> 130
<212> DNA
<213> Artificial Sequence
<220>
<223> example 3' ITR
<400> 10
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120
gagcgcgcag 130
<210> 11
<211> 6648
<212> DNA
<213> Artificial Sequence
<220>
<223> example MYO7A nucleotide sequence
<400> 11
atggtgattc ttcagcaggg ggaccatgtg tggatggacc tgagattggg gcaggagttc 60
gacgtgccca tcggggcggt ggtgaagctc tgcgactctg ggcaggtcca ggtggtggat 120
gatgaagaca atgaacactg gatctctccg cagaacgcaa cgcacatcaa gcctatgcac 180
cccacgtcgg tccacggcgt ggaggacatg atccgcctgg gggacctcaa cgaggcgggc 240
atcttgcgca acctgcttat ccgctaccgg gaccacctca tctacacgta tacgggctcc 300
atcctggtgg ctgtgaaccc ctaccagctg ctctccatct actcgccaga gcacatccgc 360
cagtatacca acaagaagat tggggagatg cccccccaca tctttgccat tgctgacaac 420
tgctacttca acatgaaacg caacagccga gaccagtgct gcatcatcag tggggaatct 480
ggggccggga agacggagag cacaaagctg atcctgcagt tcctggcagc catcagtggg 540
cagcactcgt ggattgagca gcaggtcttg gaggccaccc ccattctgga agcatttggg 600
aatgccaaga ccatccgcaa tgacaactca agccgtttcg gaaagtacat cgacatccac 660
ttcaacaagc ggggcgccat cgagggcgcg aagattgagc agtacctgct ggaaaagtca 720
cgtgtctgtc gccaggccct ggatgaaagg aactaccacg tgttctactg catgctggag 780
ggcatgagtg aggatcagaa gaagaagctg ggcttgggcc aggcctctga ctacaactac 840
ttggccatgg gtaactgcat aacctgtgag ggccgggtgg acagccagga gtacgccaac 900
atccgctccg ccatgaaggt gctcatgttc actgacaccg agaactggga gatctcgaag 960
ctcctggctg ccatcctgca cctgggcaac ctgcagtatg aggcacgcac atttgaaaac 1020
ctggatgcct gtgaggttct cttctcccca tcgctggcca cagctgcatc cctgcttgag 1080
gtgaaccccc cagacctgat gagctgcctg actagccgca ccctcatcac ccgcggggag 1140
acggtgtcca ccccactgag cagggaacag gcactggacg tgcgcgacgc cttcgtaaag 1200
gggatctacg ggcggctgtt cgtgtggatt gtggacaaga tcaacgcagc aatttacaag 1260
cctccctccc aggatgtgaa gaactctcgc aggtccatcg gcctcctgga catctttggg 1320
tttgagaact ttgctgtgaa cagctttgag cagctctgca tcaacttcgc caatgagcac 1380
ctgcagcagt tctttgtgcg gcacgtgttc aagctggagc aggaggaata tgacctggag 1440
agcattgact ggctgcacat cgagttcact gacaaccagg atgccctgga catgattgcc 1500
aacaagccca tgaacatcat ctccctcatc gatgaggaga gcaagttccc caagggcaca 1560
gacaccacca tgttacacaa gctgaactcc cagcacaagc tcaacgccaa ctacatcccc 1620
cccaagaaca accatgagac ccagtttggc atcaaccatt ttgcaggcat cgtctactat 1680
gagacccaag gcttcctgga gaagaaccga gacaccctgc atggggacat tatccagctg 1740
gtccactcct ccaggaacaa gttcatcaag cagatcttcc aggccgatgt cgccatgggc 1800
gccgagacca ggaagcgctc gcccacactt agcagccagt tcaagcggtc actggagctg 1860
ctgatgcgca cgctgggtgc ctgccagccc ttctttgtgc gatgcatcaa gcccaatgag 1920
ttcaagaagc ccatgctgtt cgaccggcac ctgtgcgtgc gccagctgcg gtactcagga 1980
atgatggaga ccatccgaat ccgccgagct ggctacccca tccgctacag cttcgtagag 2040
tttgtggagc ggtaccgtgt gctgctgcca ggtgtgaagc cggcctacaa gcagggcgac 2100
ctccgcggga cttgccagcg catggctgag gctgtgctgg gcacccacga tgactggcag 2160
ataggcaaaa ccaagatctt tctgaaggac caccatgaca tgctgctgga agtggagcgg 2220
gacaaagcca tcaccgacag agtcatcctc cttcagaaag tcatccgggg attcaaagac 2280
aggtctaact ttctgaagct gaagaacgct gccacactga tccagaggca ctggcggggt 2340
cacaactgta ggaagaacta cgggctgatg cgtctgggct tcctgcggct gcaggccctg 2400
caccgctccc ggaagctgca ccagcagtac cgcctggccc gccagcgcat catccagttc 2460
caggcccgct gccgcgccta tctggtgcgc aaggccttcc gccaccgcct ctgggctgtg 2520
ctcaccgtgc aggcctatgc ccggggcatg atcgcccgca ggctgcacca acgcctcagg 2580
gctgagtatc tgtggcgcct cgaggctgag aaaatgcggc tggcggagga agagaagctt 2640
cggaaggaga tgagcgccaa gaaggccaag gaggaggccg agcgcaagca tcaggagcgc 2700
ctggcccagc tggctcgtga ggacgctgag cgggagctga aggagaagga ggccgctcgg 2760
cggaagaagg agctcctgga gcagatggaa agggcccgcc atgagcctgt caatcactca 2820
gacatggtgg acaagatgtt tggcttcctg gggacttcag gtggcctgcc aggccaggag 2880
ggccaggcac ctagtggctt tgaggacctg gagcgagggc ggagggagat ggtggaggag 2940
gacctggatg cagccctgcc cctgcctgac gaggatgagg aggacctctc tgagtataaa 3000
tttgccaagt tcgcggccac ctacttccag gggacaacta cgcactccta cacccggcgg 3060
ccactcaaac agccactgct ctaccatgac gacgagggtg accagctggc agccctggcg 3120
gtctggatca ccatcctccg cttcatgggg gacctccctg agcccaagta ccacacagcc 3180
atgagtgatg gcagtgagaa gatccctgtg atgaccaaga tttatgagac cctgggcaag 3240
aagacgtaca agagggagct gcaggccctg cagggcgagg gcgaggccca gctccccgag 3300
ggccagaaga agagcagtgt gaggcacaag ctggtgcatt tgactctgaa aaagaagtcc 3360
aagctcacag aggaggtgac caagaggctg catgacgggg agtccacagt gcagggcaac 3420
agcatgctgg aggaccggcc cacctccaac ctggagaagc tgcacttcat catcggcaat 3480
ggcatcctgc ggccagcact ccgggacgag atctactgcc agatcagcaa gcagctgacc 3540
cacaacccct ccaagagcag ctatgcccgg ggctggattc tcgtgtctct ctgcgtgggc 3600
tgtttcgccc cctccgagaa gtttgtcaag tacctgcgga acttcatcca cgggggcccg 3660
cccggctacg ccccgtactg tgaggagcgc ctgagaagga cctttgtcaa tgggacacgg 3720
acacagccgc ccagctggct ggagctgcag gccaccaagt ccaagaagcc aatcatgttg 3780
cccgtgacat tcatggatgg gaccaccaag accctgctga cggactcggc aaccacggcc 3840
aaggagctct gcaacgcgct ggccgacaag atctctctca aggaccggtt cgggttctcc 3900
ctctacattg ccctgtttga caaggtgtcc tccctgggca gcggcagtga ccacgtcatg 3960
gacgccatct cccagtgcga gcagtacgcc aaggagcagg gcgcccagga gcgcaacgcc 4020
ccctggaggc tcttcttccg caaagaggtc ttcacgccct ggcacagccc ctccgaggac 4080
aacgtggcca ccaacctcat ctaccagcag gtggtgcgag gagtcaagtt tggggagtac 4140
aggtgtgaga aggaggacga cctggctgag ctggcctccc agcagtactt tgtagactat 4200
ggctctgaga tgatcctgga gcgcctcctg aacctcgtgc ccacctacat ccccgaccgc 4260
gagatcacgc ccctgaagac gctggagaag tgggcccagc tggccatcgc cgcccacaag 4320
aaggggattt atgcccagag gagaactgat gcccagaagg tcaaagagga tgtggtcagt 4380
tatgcccgct tcaagtggcc cttgctcttc tccaggtttt atgaagccta caaattctca 4440
ggccccagtc tccccaagaa cgacgtcatc gtggccgtca actggacggg tgtgtacttt 4500
gtggatgagc aggagcaggt acttctggag ctgtccttcc cagagatcat ggccgtgtcc 4560
agcagcaggg agtgccgtgt ctggctctca ctgggctgct ctgatcttgg ctgtgctgcg 4620
cctcactcag gctgggcagg actgaccccg gcggggccct gttctccgtg ttggtcctgc 4680
aggggagcga aaacgacggc ccccagcttc acgctggcca ccatcaaggg ggacgaatac 4740
accttcacct ccagtaatgc tgaggacatt cgtgacctgg tggtcacctt cctagagggg 4800
ctccggaaga gatctaagta tgttgtggcc ctgcaggata accccaaccc cgcaggcgag 4860
gagtcaggct tcctcagctt tgccaaggga gacctcatca tcctggacca tgacacgggc 4920
gagcaggtca tgaactcggg ctgggccaac ggcatcaatg agaggaccaa gcagcgtggg 4980
gacttcccca ccgactgtgt gtacgtcatg cccactgtca ccatgccacc tcgtgagatt 5040
gtggccctgg tcaccatgac tcccgatcag aggcaggacg ttgtccggct cttgcagctg 5100
cgaacggcgg agcccgaggt gcgtgccaag ccctacacgc tggaggagtt ttcctatgac 5160
tacttcaggc ccccacccaa gcacacgctg agccgtgtca tggtgtccaa ggcccgaggc 5220
aaggaccggc tgtggagcca cacgcgggaa ccgctcaagc aggcgctgct caagaagctc 5280
ctgggcagtg aggagctctc gcaggaggcc tgcctggcct tcattgctgt gctcaagtac 5340
atgggcgact acccgtccaa gaggacacgc tccgtcaatg agctcaccga ccagatcttt 5400
gagggtcccc tgaaagccga gcccctgaag gacgaggcat atgtgcagat cctgaagcag 5460
ctgaccgaca accacatcag gtacagcgag gagcggggtt gggagctgct ctggctgtgc 5520
acgggccttt tcccacccag caacatcctc ctgccccacg tgcagcgctt cctgcagtcc 5580
cgaaagcact gcccactcgc catcgactgc ctgcaacggc tccagaaagc cctgagaaac 5640
gggtcccgga agtaccctcc gcacctggtg gaggtggagg ccatccagca caagaccacc 5700
cagattttcc acaaggtcta cttccctgat gacactgacg aggccttcga agtggagtcc 5760
agcaccaagg ccaaggactt ctgccagaac atcgccacca ggctgctcct caagtcctca 5820
gagggattca gcctctttgt caaaattgca gacaaggtca tcagcgttcc tgagaatgac 5880
ttcttctttg actttgttcg acacttgaca gactggataa agaaagctcg gcccatcaag 5940
gacggaattg tgccctcact cacctaccag gtgttcttca tgaagaagct gtggaccacc 6000
acggtgccag ggaaggatcc catggccgat tccatcttcc actattacca ggagttgccc 6060
aagtatctcc gaggctacca caagtgcacg cgggaggagg tgctgcagct gggggcgctg 6120
atctacaggg tcaagttcga ggaggacaag tcctacttcc ccagcatccc caagctgctg 6180
cgggagctgg tgccccagga ccttatccgg caggtctcac ctgatgactg gaagcggtcc 6240
atcgtcgcct acttcaacaa gcacgcaggg aagtccaagg aggaggccaa gctggccttc 6300
ctgaagctca tcttcaagtg gcccaccttt ggctcagcct tcttcgaggt gaagcaaact 6360
acggagccaa acttccctga gatcctccta attgccatca acaagtatgg ggtcagcctc 6420
atcgatccca aaacgaagga tatcctcacc actcatccct tcaccaagat ctccaactgg 6480
agcagcggca acacctactt ccacatcacc attgggaact tggtgcgcgg gagcaaactg 6540
ctctgcgaga cgtcactggg ctacaagatg gatgacctcc tgacttccta cattagccag 6600
atgctcacag ccatgagcaa acagcggggc tccaggagcg gcaagtga 6648
<210> 12
<211> 3108
<212> DNA
<213> Artificial Sequence
<220>
<223> example 5' end portion of a MYO7A transgene
<400> 12
atggtgattc ttcagcaggg ggaccatgtg tggatggacc tgagattggg gcaggagttc 60
gacgtgccca tcggggcggt ggtgaagctc tgcgactctg ggcaggtcca ggtggtggat 120
gatgaagaca atgaacactg gatctctccg cagaacgcaa cgcacatcaa gcctatgcac 180
cccacgtcgg tccacggcgt ggaggacatg atccgcctgg gggacctcaa cgaggcgggc 240
atcttgcgca acctgcttat ccgctaccgg gaccacctca tctacacgta tacgggctcc 300
atcctggtgg ctgtgaaccc ctaccagctg ctctccatct actcgccaga gcacatccgc 360
cagtatacca acaagaagat tggggagatg cccccccaca tctttgccat tgctgacaac 420
tgctacttca acatgaaacg caacagccga gaccagtgct gcatcatcag tggggaatct 480
ggggccggga agacggagag cacaaagctg atcctgcagt tcctggcagc catcagtggg 540
cagcactcgt ggattgagca gcaggtcttg gaggccaccc ccattctgga agcatttggg 600
aatgccaaga ccatccgcaa tgacaactca agccgtttcg gaaagtacat cgacatccac 660
ttcaacaagc ggggcgccat cgagggcgcg aagattgagc agtacctgct ggaaaagtca 720
cgtgtctgtc gccaggccct ggatgaaagg aactaccacg tgttctactg catgctggag 780
ggcatgagtg aggatcagaa gaagaagctg ggcttgggcc aggcctctga ctacaactac 840
ttggccatgg gtaactgcat aacctgtgag ggccgggtgg acagccagga gtacgccaac 900
atccgctccg ccatgaaggt gctcatgttc actgacaccg agaactggga gatctcgaag 960
ctcctggctg ccatcctgca cctgggcaac ctgcagtatg aggcacgcac atttgaaaac 1020
ctggatgcct gtgaggttct cttctcccca tcgctggcca cagctgcatc cctgcttgag 1080
gtgaaccccc cagacctgat gagctgcctg actagccgca ccctcatcac ccgcggggag 1140
acggtgtcca ccccactgag cagggaacag gcactggacg tgcgcgacgc cttcgtaaag 1200
gggatctacg ggcggctgtt cgtgtggatt gtggacaaga tcaacgcagc aatttacaag 1260
cctccctccc aggatgtgaa gaactctcgc aggtccatcg gcctcctgga catctttggg 1320
tttgagaact ttgctgtgaa cagctttgag cagctctgca tcaacttcgc caatgagcac 1380
ctgcagcagt tctttgtgcg gcacgtgttc aagctggagc aggaggaata tgacctggag 1440
agcattgact ggctgcacat cgagttcact gacaaccagg atgccctgga catgattgcc 1500
aacaagccca tgaacatcat ctccctcatc gatgaggaga gcaagttccc caagggcaca 1560
gacaccacca tgttacacaa gctgaactcc cagcacaagc tcaacgccaa ctacatcccc 1620
cccaagaaca accatgagac ccagtttggc atcaaccatt ttgcaggcat cgtctactat 1680
gagacccaag gcttcctgga gaagaaccga gacaccctgc atggggacat tatccagctg 1740
gtccactcct ccaggaacaa gttcatcaag cagatcttcc aggccgatgt cgccatgggc 1800
gccgagacca ggaagcgctc gcccacactt agcagccagt tcaagcggtc actggagctg 1860
ctgatgcgca cgctgggtgc ctgccagccc ttctttgtgc gatgcatcaa gcccaatgag 1920
ttcaagaagc ccatgctgtt cgaccggcac ctgtgcgtgc gccagctgcg gtactcagga 1980
atgatggaga ccatccgaat ccgccgagct ggctacccca tccgctacag cttcgtagag 2040
tttgtggagc ggtaccgtgt gctgctgcca ggtgtgaagc cggcctacaa gcagggcgac 2100
ctccgcggga cttgccagcg catggctgag gctgtgctgg gcacccacga tgactggcag 2160
ataggcaaaa ccaagatctt tctgaaggac caccatgaca tgctgctgga agtggagcgg 2220
gacaaagcca tcaccgacag agtcatcctc cttcagaaag tcatccgggg attcaaagac 2280
aggtctaact ttctgaagct gaagaacgct gccacactga tccagaggca ctggcggggt 2340
cacaactgta ggaagaacta cgggctgatg cgtctgggct tcctgcggct gcaggccctg 2400
caccgctccc ggaagctgca ccagcagtac cgcctggccc gccagcgcat catccagttc 2460
caggcccgct gccgcgccta tctggtgcgc aaggccttcc gccaccgcct ctgggctgtg 2520
ctcaccgtgc aggcctatgc ccggggcatg atcgcccgca ggctgcacca acgcctcagg 2580
gctgagtatc tgtggcgcct cgaggctgag aaaatgcggc tggcggagga agagaagctt 2640
cggaaggaga tgagcgccaa gaaggccaag gaggaggccg agcgcaagca tcaggagcgc 2700
ctggcccagc tggctcgtga ggacgctgag cgggagctga aggagaagga ggccgctcgg 2760
cggaagaagg agctcctgga gcagatggaa agggcccgcc atgagcctgt caatcactca 2820
gacatggtgg acaagatgtt tggcttcctg gggacttcag gtggcctgcc aggccaggag 2880
ggccaggcac ctagtggctt tgaggacctg gagcgagggc ggagggagat ggtggaggag 2940
gacctggatg cagccctgcc cctgcctgac gaggatgagg aggacctctc tgagtataaa 3000
tttgccaagt tcgcggccac ctacttccag gggacaacta cgcactccta cacccggcgg 3060
ccactcaaac agccactgct ctaccatgac gacgagggtg accagctg 3108
<210> 13
<211> 3540
<212> DNA
<213> Artificial Sequence
<220>
<223> example 3' end portion of a MYO7A transgene
<400> 13
gcagccctgg cggtctggat caccatcctc cgcttcatgg gggacctccc tgagcccaag 60
taccacacag ccatgagtga tggcagtgag aagatccctg tgatgaccaa gatttatgag 120
accctgggca agaagacgta caagagggag ctgcaggccc tgcagggcga gggcgaggcc 180
cagctccccg agggccagaa gaagagcagt gtgaggcaca agctggtgca tttgactctg 240
aaaaagaagt ccaagctcac agaggaggtg accaagaggc tgcatgacgg ggagtccaca 300
gtgcagggca acagcatgct ggaggaccgg cccacctcca acctggagaa gctgcacttc 360
atcatcggca atggcatcct gcggccagca ctccgggacg agatctactg ccagatcagc 420
aagcagctga cccacaaccc ctccaagagc agctatgccc ggggctggat tctcgtgtct 480
ctctgcgtgg gctgtttcgc cccctccgag aagtttgtca agtacctgcg gaacttcatc 540
cacgggggcc cgcccggcta cgccccgtac tgtgaggagc gcctgagaag gacctttgtc 600
aatgggacac ggacacagcc gcccagctgg ctggagctgc aggccaccaa gtccaagaag 660
ccaatcatgt tgcccgtgac attcatggat gggaccacca agaccctgct gacggactcg 720
gcaaccacgg ccaaggagct ctgcaacgcg ctggccgaca agatctctct caaggaccgg 780
ttcgggttct ccctctacat tgccctgttt gacaaggtgt cctccctggg cagcggcagt 840
gaccacgtca tggacgccat ctcccagtgc gagcagtacg ccaaggagca gggcgcccag 900
gagcgcaacg ccccctggag gctcttcttc cgcaaagagg tcttcacgcc ctggcacagc 960
ccctccgagg acaacgtggc caccaacctc atctaccagc aggtggtgcg aggagtcaag 1020
tttggggagt acaggtgtga gaaggaggac gacctggctg agctggcctc ccagcagtac 1080
tttgtagact atggctctga gatgatcctg gagcgcctcc tgaacctcgt gcccacctac 1140
atccccgacc gcgagatcac gcccctgaag acgctggaga agtgggccca gctggccatc 1200
gccgcccaca agaaggggat ttatgcccag aggagaactg atgcccagaa ggtcaaagag 1260
gatgtggtca gttatgcccg cttcaagtgg cccttgctct tctccaggtt ttatgaagcc 1320
tacaaattct caggccccag tctccccaag aacgacgtca tcgtggccgt caactggacg 1380
ggtgtgtact ttgtggatga gcaggagcag gtacttctgg agctgtcctt cccagagatc 1440
atggccgtgt ccagcagcag ggagtgccgt gtctggctct cactgggctg ctctgatctt 1500
ggctgtgctg cgcctcactc aggctgggca ggactgaccc cggcggggcc ctgttctccg 1560
tgttggtcct gcaggggagc gaaaacgacg gcccccagct tcacgctggc caccatcaag 1620
ggggacgaat acaccttcac ctccagtaat gctgaggaca ttcgtgacct ggtggtcacc 1680
ttcctagagg ggctccggaa gagatctaag tatgttgtgg ccctgcagga taaccccaac 1740
cccgcaggcg aggagtcagg cttcctcagc tttgccaagg gagacctcat catcctggac 1800
catgacacgg gcgagcaggt catgaactcg ggctgggcca acggcatcaa tgagaggacc 1860
aagcagcgtg gggacttccc caccgactgt gtgtacgtca tgcccactgt caccatgcca 1920
cctcgtgaga ttgtggccct ggtcaccatg actcccgatc agaggcagga cgttgtccgg 1980
ctcttgcagc tgcgaacggc ggagcccgag gtgcgtgcca agccctacac gctggaggag 2040
ttttcctatg actacttcag gcccccaccc aagcacacgc tgagccgtgt catggtgtcc 2100
aaggcccgag gcaaggaccg gctgtggagc cacacgcggg aaccgctcaa gcaggcgctg 2160
ctcaagaagc tcctgggcag tgaggagctc tcgcaggagg cctgcctggc cttcattgct 2220
gtgctcaagt acatgggcga ctacccgtcc aagaggacac gctccgtcaa tgagctcacc 2280
gaccagatct ttgagggtcc cctgaaagcc gagcccctga aggacgaggc atatgtgcag 2340
atcctgaagc agctgaccga caaccacatc aggtacagcg aggagcgggg ttgggagctg 2400
ctctggctgt gcacgggcct tttcccaccc agcaacatcc tcctgcccca cgtgcagcgc 2460
ttcctgcagt cccgaaagca ctgcccactc gccatcgact gcctgcaacg gctccagaaa 2520
gccctgagaa acgggtcccg gaagtaccct ccgcacctgg tggaggtgga ggccatccag 2580
cacaagacca cccagatttt ccacaaggtc tacttccctg atgacactga cgaggccttc 2640
gaagtggagt ccagcaccaa ggccaaggac ttctgccaga acatcgccac caggctgctc 2700
ctcaagtcct cagagggatt cagcctcttt gtcaaaattg cagacaaggt catcagcgtt 2760
cctgagaatg acttcttctt tgactttgtt cgacacttga cagactggat aaagaaagct 2820
cggcccatca aggacggaat tgtgccctca ctcacctacc aggtgttctt catgaagaag 2880
ctgtggacca ccacggtgcc agggaaggat cccatggccg attccatctt ccactattac 2940
caggagttgc ccaagtatct ccgaggctac cacaagtgca cgcgggagga ggtgctgcag 3000
ctgggggcgc tgatctacag ggtcaagttc gaggaggaca agtcctactt ccccagcatc 3060
cccaagctgc tgcgggagct ggtgccccag gaccttatcc ggcaggtctc acctgatgac 3120
tggaagcggt ccatcgtcgc ctacttcaac aagcacgcag ggaagtccaa ggaggaggcc 3180
aagctggcct tcctgaagct catcttcaag tggcccacct ttggctcagc cttcttcgag 3240
gtgaagcaaa ctacggagcc aaacttccct gagatcctcc taattgccat caacaagtat 3300
ggggtcagcc tcatcgatcc caaaacgaag gatatcctca ccactcatcc cttcaccaag 3360
atctccaact ggagcagcgg caacacctac ttccacatca ccattgggaa cttggtgcgc 3420
gggagcaaac tgctctgcga gacgtcactg ggctacaaga tggatgacct cctgacttcc 3480
tacattagcc agatgctcac agccatgagc aaacagcggg gctccaggag cggcaagtga 3540
<210> 14
<211> 4488
<212> DNA
<213> Artificial Sequence
<220>
<223> vector
<400> 14
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180
aggaagatcc ttatcgggaa ttcgccctta agctagcgtg ccacctggtc gacattgatt 240
attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc catatatgga 300
gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca acgacccccg 360
cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga ctttccattg 420
acgtcaatgg gtggagtatt tacggtaaac tgcccacttg gcagtacatc aagtgtatca 480
tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct ggcattatgc 540
ccagtacatg accttatggg actttcctac ttggcagtac atctacgtat tagtcatcgc 600
tattaccatg gtcgaggtga gccccacgtt ctgcttcact ctccccatct cccccccctc 660
cccaccccca attttgtatt tatttatttt ttaattattt tgtgcagcga tgggggcggg 720
gcggggcgag gcggagaggt gcggcggcag ccaatcggag cggcgcgctc cgaaagtttc 780
cttttatggc gaggcggcgg cggcggcggc tctataaaaa gcgaagcgcg cggcgggcgg 840
ctgcagaagt tggtcgtgag gcactgggca gctctaaggt aaatataaaa tttttaagtg 900
tataatgtgt taaactactg attctaattg tttctctctt ttagattcca acctttggaa 960
ctgagtgtcc aggcggccgc catggtgatt cttcagcagg gggaccatgt gtggatggac 1020
ctgagattgg ggcaggagtt cgacgtgccc atcggggcgg tggtgaagct ctgcgactct 1080
gggcaggtcc aggtggtgga tgatgaagac aatgaacact ggatctctcc gcagaacgca 1140
acgcacatca agcctatgca ccccacgtcg gtccacggcg tggaggacat gatccgcctg 1200
ggggacctca acgaggcggg catcttgcgc aacctgctta tccgctaccg ggaccacctc 1260
atctacacgt atacgggctc catcctggtg gctgtgaacc cctaccagct gctctccatc 1320
tactcgccag agcacatccg ccagtatacc aacaagaaga ttggggagat gcccccccac 1380
atctttgcca ttgctgacaa ctgctacttc aacatgaaac gcaacagccg agaccagtgc 1440
tgcatcatca gtggggaatc tggggccggg aagacggaga gcacaaagct gatcctgcag 1500
ttcctggcag ccatcagtgg gcagcactcg tggattgagc agcaggtctt ggaggccacc 1560
cccattctgg aagcatttgg gaatgccaag accatccgca atgacaactc aagccgtttc 1620
ggaaagtaca tcgacatcca cttcaacaag cggggcgcca tcgagggcgc gaagattgag 1680
cagtacctgc tggaaaagtc acgtgtctgt cgccaggccc tggatgaaag gaactaccac 1740
gtgttctact gcatgctgga gggcatgagt gaggatcaga agaagaagct gggcttgggc 1800
caggcctctg actacaacta cttggccatg ggtaactgca taacctgtga gggccgggtg 1860
gacagccagg agtacgccaa catccgctcc gccatgaagg tgctcatgtt cactgacacc 1920
gagaactggg agatctcgaa gctcctggct gccatcctgc acctgggcaa cctgcagtat 1980
gaggcacgca catttgaaaa cctggatgcc tgtgaggttc tcttctcccc atcgctggcc 2040
acagctgcat ccctgcttga ggtgaacccc ccagacctga tgagctgcct gactagccgc 2100
accctcatca cccgcgggga gacggtgtcc accccactga gcagggaaca ggcactggac 2160
gtgcgcgacg ccttcgtaaa ggggatctac gggcggctgt tcgtgtggat tgtggacaag 2220
atcaacgcag caatttacaa gcctccctcc caggatgtga agaactctcg caggtccatc 2280
ggcctcctgg acatctttgg gtttgagaac tttgctgtga acagctttga gcagctctgc 2340
atcaacttcg ccaatgagca cctgcagcag ttctttgtgc ggcacgtgtt caagctggag 2400
caggaggaat atgacctgga gagcattgac tggctgcaca tcgagttcac tgacaaccag 2460
gatgccctgg acatgattgc caacaagccc atgaacatca tctccctcat cgatgaggag 2520
agcaagttcc ccaagggcac agacaccacc atgttacaca agctgaactc ccagcacaag 2580
ctcaacgcca actacatccc ccccaagaac aaccatgaga cccagtttgg catcaaccat 2640
tttgcaggca tcgtctacta tgagacccaa ggcttcctgg agaagaaccg agacaccctg 2700
catggggaca ttatccagct ggtccactcc tccaggaaca agttcatcaa gcagatcttc 2760
caggccgatg tcgccatggg cgccgagacc aggaagcgct cgcccacact tagcagccag 2820
ttcaagcggt cactggagct gctgatgcgc acgctgggtg cctgccagcc cttctttgtg 2880
cgatgcatca agcccaatga gttcaagaag cccatgctgt tcgaccggca cctgtgcgtg 2940
cgccagctgc ggtactcagg aatgatggag accatccgaa tccgccgagc tggctacccc 3000
atccgctaca gcttcgtaga gtttgtggag cggtaccgtg tgctgctgcc aggtgtgaag 3060
ccggcctaca agcagggcga cctccgcggg acttgccagc gcatggctga ggctgtgctg 3120
ggcacccacg atgactggca gataggcaaa accaagatct ttctgaagga ccaccatgac 3180
atgctgctgg aagtggagcg ggacaaagcc atcaccgaca gagtcatcct ccttcagaaa 3240
gtcatccggg gattcaaaga caggtctaac tttctgaagc tgaagaacgc tgccacactg 3300
atccagaggc actggcgggg tcacaactgt aggaagaact acgggctgat gcgtctgggc 3360
ttcctgcggc tgcaggccct gcaccgctcc cggaagctgc accagcagta ccgcctggcc 3420
cgccagcgca tcatccagtt ccaggcccgc tgccgcgcct atctggtgcg caaggccttc 3480
cgccaccgcc tctgggctgt gctcaccgtg caggcctatg cccggggcat gatcgcccgc 3540
aggctgcacc aacgcctcag ggctgagtat ctgtggcgcc tcgaggctga gaaaatgcgg 3600
ctggcggagg aagagaagct tcggaaggag atgagcgcca agaaggccaa ggaggaggcc 3660
gagcgcaagc atcaggagcg cctggcccag ctggctcgtg aggacgctga gcgggagctg 3720
aaggagaagg aggccgctcg gcggaagaag gagctcctgg agcagatgga aagggcccgc 3780
catgagcctg tcaatcactc agacatggtg gacaagatgt ttggcttcct ggggacttca 3840
ggtggcctgc caggccagga gggccaggca cctagtggct ttgaggacct ggagcgaggg 3900
cggagggaga tggtggagga ggacctggat gcagccctgc ccctgcctga cgaggatgag 3960
gaggacctct ctgagtataa atttgccaag ttcgcggcca cctacttcca ggggacaact 4020
acgcactcct acacccggcg gccactcaaa cagccactgc tctaccatga cgacgagggt 4080
gaccagctgg taagtatcaa ggttacaaga caggtttaag gagaccaata gaaactgggc 4140
ttgtcgagac agagaagact cttgcgtttc tgggattttt ccgatttcgg cctattggtt 4200
aaaaaatgag ctgatttaac aaaaatttaa cgcgaatttt aacaaaatat taacgtttat 4260
aatttcaggt ggcatctttc caattgaagg gcgaattccg atcttcctag agcatggcta 4320
cgtagataag tagcatggcg ggttaatcat taactacaag gaacccctag tgatggagtt 4380
ggccactccc tctctgcgcg ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg 4440
acgcccgggc tttgcccggg cggcctcagt gagcgagcga gcgcgcag 4488
<210> 15
<211> 4383
<212> DNA
<213> Artificial Sequence
<220>
<223> vector
<400> 15
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180
aggaagatcg gaattcgccc ttatatgatc agggattttt ccgatttcgg cctattggtt 240
aaaaaatgag ctgatttaac aaaaatttaa cgcgaatttt aacaaaatat taacgtttat 300
aatttcaggt ggcatctttc gataggcacc tattggtctt actgacatcc actttgcctt 360
tctctccaca ggcagccctg gcggtctgga tcaccatcct ccgcttcatg ggggacctcc 420
ctgagcccaa gtaccacaca gccatgagtg atggcagtga gaagatccct gtgatgacca 480
agatttatga gaccctgggc aagaagacgt acaagaggga gctgcaggcc ctgcagggcg 540
agggcgaggc ccagctcccc gagggccaga agaagagcag tgtgaggcac aagctggtgc 600
atttgactct gaaaaagaag tccaagctca cagaggaggt gaccaagagg ctgcatgacg 660
gggagtccac agtgcagggc aacagcatgc tggaggaccg gcccacctcc aacctggaga 720
agctgcactt catcatcggc aatggcatcc tgcggccagc actccgggac gagatctact 780
gccagatcag caagcagctg acccacaacc cctccaagag cagctatgcc cggggctgga 840
ttctcgtgtc tctctgcgtg ggctgtttcg ccccctccga gaagtttgtc aagtacctgc 900
ggaacttcat ccacgggggc ccgcccggct acgccccgta ctgtgaggag cgcctgagaa 960
ggacctttgt caatgggaca cggacacagc cgcccagctg gctggagctg caggccacca 1020
agtccaagaa gccaatcatg ttgcccgtga cattcatgga tgggaccacc aagaccctgc 1080
tgacggactc ggcaaccacg gccaaggagc tctgcaacgc gctggccgac aagatctctc 1140
tcaaggaccg gttcgggttc tccctctaca ttgccctgtt tgacaaggtg tcctccctgg 1200
gcagcggcag tgaccacgtc atggacgcca tctcccagtg cgagcagtac gccaaggagc 1260
agggcgccca ggagcgcaac gccccctgga ggctcttctt ccgcaaagag gtcttcacgc 1320
cctggcacag cccctccgag gacaacgtgg ccaccaacct catctaccag caggtggtgc 1380
gaggagtcaa gtttggggag tacaggtgtg agaaggagga cgacctggct gagctggcct 1440
cccagcagta ctttgtagac tatggctctg agatgatcct ggagcgcctc ctgaacctcg 1500
tgcccaccta catccccgac cgcgagatca cgcccctgaa gacgctggag aagtgggccc 1560
agctggccat cgccgcccac aagaagggga tttatgccca gaggagaact gatgcccaga 1620
aggtcaaaga ggatgtggtc agttatgccc gcttcaagtg gcccttgctc ttctccaggt 1680
tttatgaagc ctacaaattc tcaggcccca gtctccccaa gaacgacgtc atcgtggccg 1740
tcaactggac gggtgtgtac tttgtggatg agcaggagca ggtacttctg gagctgtcct 1800
tcccagagat catggccgtg tccagcagca gggagtgccg tgtctggctc tcactgggct 1860
gctctgatct tggctgtgct gcgcctcact caggctgggc aggactgacc ccggcggggc 1920
cctgttctcc gtgttggtcc tgcaggggag cgaaaacgac ggcccccagc ttcacgctgg 1980
ccaccatcaa gggggacgaa tacaccttca cctccagtaa tgctgaggac attcgtgacc 2040
tggtggtcac cttcctagag gggctccgga agagatctaa gtatgttgtg gccctgcagg 2100
ataaccccaa ccccgcaggc gaggagtcag gcttcctcag ctttgccaag ggagacctca 2160
tcatcctgga ccatgacacg ggcgagcagg tcatgaactc gggctgggcc aacggcatca 2220
atgagaggac caagcagcgt ggggacttcc ccaccgactg tgtgtacgtc atgcccactg 2280
tcaccatgcc acctcgtgag attgtggccc tggtcaccat gactcccgat cagaggcagg 2340
acgttgtccg gctcttgcag ctgcgaacgg cggagcccga ggtgcgtgcc aagccctaca 2400
cgctggagga gttttcctat gactacttca ggcccccacc caagcacacg ctgagccgtg 2460
tcatggtgtc caaggcccga ggcaaggacc ggctgtggag ccacacgcgg gaaccgctca 2520
agcaggcgct gctcaagaag ctcctgggca gtgaggagct ctcgcaggag gcctgcctgg 2580
ccttcattgc tgtgctcaag tacatgggcg actacccgtc caagaggaca cgctccgtca 2640
atgagctcac cgaccagatc tttgagggtc ccctgaaagc cgagcccctg aaggacgagg 2700
catatgtgca gatcctgaag cagctgaccg acaaccacat caggtacagc gaggagcggg 2760
gttgggagct gctctggctg tgcacgggcc ttttcccacc cagcaacatc ctcctgcccc 2820
acgtgcagcg cttcctgcag tcccgaaagc actgcccact cgccatcgac tgcctgcaac 2880
ggctccagaa agccctgaga aacgggtccc ggaagtaccc tccgcacctg gtggaggtgg 2940
aggccatcca gcacaagacc acccagattt tccacaaggt ctacttccct gatgacactg 3000
acgaggcctt cgaagtggag tccagcacca aggccaagga cttctgccag aacatcgcca 3060
ccaggctgct cctcaagtcc tcagagggat tcagcctctt tgtcaaaatt gcagacaagg 3120
tcatcagcgt tcctgagaat gacttcttct ttgactttgt tcgacacttg acagactgga 3180
taaagaaagc tcggcccatc aaggacggaa ttgtgccctc actcacctac caggtgttct 3240
tcatgaagaa gctgtggacc accacggtgc cagggaagga tcccatggcc gattccatct 3300
tccactatta ccaggagttg cccaagtatc tccgaggcta ccacaagtgc acgcgggagg 3360
aggtgctgca gctgggggcg ctgatctaca gggtcaagtt cgaggaggac aagtcctact 3420
tccccagcat ccccaagctg ctgcgggagc tggtgcccca ggaccttatc cggcaggtct 3480
cacctgatga ctggaagcgg tccatcgtcg cctacttcaa caagcacgca gggaagtcca 3540
aggaggaggc caagctggcc ttcctgaagc tcatcttcaa gtggcccacc tttggctcag 3600
ccttcttcga ggtgaagcaa actacggagc caaacttccc tgagatcctc ctaattgcca 3660
tcaacaagta tggggtcagc ctcatcgatc ccaaaacgaa ggatatcctc accactcatc 3720
ccttcaccaa gatctccaac tggagcagcg gcaacaccta cttccacatc accattggga 3780
acttggtgcg cgggagcaaa ctgctctgcg agacgtcact gggctacaag atggatgacc 3840
tcctgacttc ctacattagc cagatgctca cagccatgag caaacagcgg ggctccagga 3900
gcggcaagtg accgcggcct gctgccggct ctgcggcctc ttccgcgtct tcgagatctg 3960
cctcgactgt gccttctagt tgccagccat ctgttgtttg cccctccccc gtgccttcct 4020
tgaccctgga aggtgccact cccactgtcc tttcctaata aaatgaggaa attgcatcgc 4080
attgtctgag taggtgtcat tctattctgg ggggtggggt ggggcaggac agcaaggggg 4140
aggattggga agacaatagc aggcatgctg gggactcgag caattcccga taaggatctt 4200
cctagagcat ggctacgtag ataagtagca tggcgggtta atcattaact acaaggaacc 4260
cctagtgatg gagttggcca ctccctctct gcgcgctcgc tcgctcactg aggccgggcg 4320
accaaaggtc gcccgacgcc cgggctttgc ccgggcggcc tcagtgagcg agcgagcgcg 4380
cag 4383
<210> 16
<211> 133
<212> DNA
<213> Artificial Sequence
<220>
<223> chimeric intron
<400> 16
gtaagtatca aggttacaag acaggtttaa ggagaccaat agaaactggg cttgtcgaga 60
cagagaagac tcttgcgttt ctgataggca cctattggtc ttactgacat ccactttgcc 120
tttctctcca cag 133
<210> 17
<211> 82
<212> DNA
<213> Artificial Sequence
<220>
<223> Splicing donor (SD) sequence
<400> 17
gtaagtatca aggttacaag acaggtttaa ggagaccaat agaaactggg cttgtcgaga 60
cagagaagac tcttgcgttt ct 82
<210> 18
<211> 82
<212> DNA
<213> Artificial Sequence
<220>
<223> splice donor
<400> 18
gtaagtatca aggttacaag acaggtttaa ggagaccaat agaaactggg cttgtcgaga 60
cagagaagac tcttgcgttt ct 82
<210> 19
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> splice acceptor
<400> 19
gataggcacc tattggtctt actgacatcc actttgcctt tctctccaca g 51
<210> 20
<211> 77
<212> DNA
<213> Artificial Sequence
<220>
<223> AK sequence
<400> 20
gggatttttc cgatttcggc ctattggtta aaaaatgagc tgatttaaca aaaatttaac 60
gcgaatttta acaaaat 77
<210> 21
<211> 4540
<212> DNA
<213> Artificial Sequence
<220>
<223> 5'CMV-ABCA4-AK
<400> 21
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180
aggaagatct tcaatattgg ccattagcca tattattcat tggttatata gcataaatca 240
atattggcta ttggccattg catacgttgt atctatatca taatatgtac atttatattg 300
gctcatgtcc aatatgaccg ccatgttggc attgattatt gactagttat taatagtaat 360
caattacggg gtcattagtt catagcccat atatggagtt ccgcgttaca taacttacgg 420
taaatggccc gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt 480
atgttcccat agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac 540
ggtaaactgc ccacttggca gtacatcaag tgtatcatat gccaagtccg ccccctattg 600
acgtcaatga cggtaaatgg cccgcctggc attatgccca gtacatgacc ttacgggact 660
ttcctacttg gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt 720
ggcagtacac caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc 780
ccattgacgt caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc 840
gtaataaccc cgccccgttg acgcaaatgg gcggtaggcg tgtacggtgg gaggtctata 900
taagcagagc tcgtttagtg aaccgtcaga tcactagaag ctttattgcg gtagtttatc 960
acagttaaat tgctaacgca gtcagtgctt ctgacacaac agtctcgaac ttaagctgca 1020
gaagttggtc gtgaggcact gggcaggtaa gtatcaaggt tacaagacag gtttaaggag 1080
accaatagaa actgggcttg tcgagacaga gaagactctt gcgtttctga taggcaccta 1140
ttggtcttac tgacatccac tttgcctttc tctccacagg tgtccactcc cagttcaatt 1200
acagctctta aggctagagt acttaatacg actcactata ggctagcctc gagaattcac 1260
gcgtggtacc tctagagtcg acccgggcgg ccgccatggg cttcgtgaga cagatacagc 1320
ttttgctctg gaagaactgg accctgcgga aaaggcaaaa gattcgcttt gtggtggaac 1380
tcgtgtggcc tttatcttta tttctggtct tgatctggtt aaggaatgcc aacccgctct 1440
acagccatca tgaatgccat ttccccaaca aggcgatgcc ctcagcagga atgctgccgt 1500
ggctccaggg gatcttctgc aatgtgaaca atccctgttt tcaaagcccc accccaggag 1560
aatctcctgg aattgtgtca aactataaca actccatctt ggcaagggta tatcgagatt 1620
ttcaagaact cctcatgaat gcaccagaga gccagcacct tggccgtatt tggacagagc 1680
tacacatctt gtcccaattc atggacaccc tccggactca cccggagaga attgcaggaa 1740
gaggaattcg aataagggat atcttgaaag atgaagaaac actgacacta tttctcatta 1800
aaaacatcgg cctgtctgac tcagtggtct accttctgat caactctcaa gtccgtccag 1860
agcagttcgc tcatggagtc ccggacctgg cgctgaagga catcgcctgc agcgaggccc 1920
tcctggagcg cttcatcatc ttcagccaga gacgcggggc aaagacggtg cgctatgccc 1980
tgtgctccct ctcccagggc accctacagt ggatagaaga cactctgtat gccaacgtgg 2040
acttcttcaa gctcttccgt gtgcttccca cactcctaga cagccgttct caaggtatca 2100
atctgagatc ttggggagga atattatctg atatgtcacc aagaattcaa gagtttatcc 2160
atcggccgag tatgcaggac ttgctgtggg tgaccaggcc cctcatgcag aatggtggtc 2220
cagagacctt tacaaagctg atgggcatcc tgtctgacct cctgtgtggc taccccgagg 2280
gaggtggctc tcgggtgctc tccttcaact ggtatgaaga caataactat aaggcctttc 2340
tggggattga ctccacaagg aaggatccta tctattctta tgacagaaga acaacatcct 2400
tttgtaatgc attgatccag agcctggagt caaatccttt aaccaaaatc gcttggaggg 2460
cggcaaagcc tttgctgatg ggaaaaatcc tgtacactcc tgattcacct gcagcacgaa 2520
ggatactgaa gaatgccaac tcaacttttg aagaactgga acacgttagg aagttggtca 2580
aagcctggga agaagtaggg ccccagatct ggtacttctt tgacaacagc acacagatga 2640
acatgatcag agataccctg gggaacccaa cagtaaaaga ctttttgaat aggcagcttg 2700
gtgaagaagg tattactgct gaagccatcc taaacttcct ctacaagggc cctcgggaaa 2760
gccaggctga cgacatggcc aacttcgact ggagggacat atttaacatc actgatcgca 2820
ccctccgcct tgtcaatcaa tacctggagt gcttggtcct ggataagttt gaaagctaca 2880
atgatgaaac tcagctcacc caacgtgccc tctctctact ggaggaaaac atgttctggg 2940
ccggagtggt attccctgac atgtatccct ggaccagctc tctaccaccc cacgtgaagt 3000
ataagatccg aatggacata gacgtggtgg agaaaaccaa taagattaaa gacaggtatt 3060
gggattctgg tcccagagct gatcccgtgg aagatttccg gtacatctgg ggcgggtttg 3120
cctatctgca ggacatggtt gaacagggga tcacaaggag ccaggtgcag gcggaggctc 3180
cagttggaat ctacctccag cagatgccct acccctgctt cgtggacgat tctttcatga 3240
tcatcctgaa ccgctgtttc cctatcttca tggtgctggc atggatctac tctgtctcca 3300
tgactgtgaa gagcatcgtc ttggagaagg agttgcgact gaaggagacc ttgaaaaatc 3360
agggtgtctc caatgcagtg atttggtgta cctggttcct ggacagcttc tccatcatgt 3420
cgatgagcat cttcctcctg acgatattca tcatgcatgg aagaatccta cattacagcg 3480
acccattcat cctcttcctg ttcttgttgg ctttctccac tgccaccatc atgctgtgct 3540
ttctgctcag caccttcttc tccaaggcca gtctggcagc agcctgtagt ggtgtcatct 3600
atttcaccct ctacctgcca cacatcctgt gcttcgcctg gcaggaccgc atgaccgctg 3660
agctgaagaa ggctgtgagc ttactgtctc cggtggcatt tggatttggc actgagtacc 3720
tggttcgctt tgaagagcaa ggcctggggc tgcagtggag caacatcggg aacagtccca 3780
cggaagggga cgaattcagc ttcctgctgt ccatgcagat gatgctcctt gatgctgctg 3840
tctatggctt actcgcttgg taccttgatc aggtgtttcc aggagactat ggaaccccac 3900
ttccttggta ctttcttcta caagagtcgt attggcttgg cggtgaaggg tgttcaacca 3960
gagaagaaag agccctggaa aagaccgagc ccctaacaga ggaaacggag gatccagagc 4020
acccagaagg aatacacgac tccttctttg aacgtgagca tccagggtgg gttcctgggg 4080
tatgcgtgaa gaatctggta aagatttttg agccctgtgg ccggccagct gtggaccgtc 4140
tgaacatcac cttctacgag aaccagatca ccgcattcct gggccacaat ggagctggga 4200
aaaccaccac cttgtaagta tcaaggttac aagacaggtt taaggagacc aatagaaact 4260
gggcttgtcg agacagagaa gactcttgcg tttctgggat ttttccgatt tcggcctatt 4320
ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa atattaacgt 4380
ttataatttc aggtggcatc tttccaattg aggaacccct agtgatggag ttggccactc 4440
cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg 4500
gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag 4540
<210> 22
<211> 4431
<212> DNA
<213> Artificial Sequence
<220>
<223> 5'CMV-ABCA4-TS
<400> 22
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180
aggaagatct tcaatattgg ccattagcca tattattcat tggttatata gcataaatca 240
atattggcta ttggccattg catacgttgt atctatatca taatatgtac atttatattg 300
gctcatgtcc aatatgaccg ccatgttggc attgattatt gactagttat taatagtaat 360
caattacggg gtcattagtt catagcccat atatggagtt ccgcgttaca taacttacgg 420
taaatggccc gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt 480
atgttcccat agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac 540
ggtaaactgc ccacttggca gtacatcaag tgtatcatat gccaagtccg ccccctattg 600
acgtcaatga cggtaaatgg cccgcctggc attatgccca gtacatgacc ttacgggact 660
ttcctacttg gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt 720
ggcagtacac caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc 780
ccattgacgt caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc 840
gtaataaccc cgccccgttg acgcaaatgg gcggtaggcg tgtacggtgg gaggtctata 900
taagcagagc tcgtttagtg aaccgtcaga tcactagaag ctttattgcg gtagtttatc 960
acagttaaat tgctaacgca gtcagtgctt ctgacacaac agtctcgaac ttaagctgca 1020
gaagttggtc gtgaggcact gggcaggtaa gtatcaaggt tacaagacag gtttaaggag 1080
accaatagaa actgggcttg tcgagacaga gaagactctt gcgtttctga taggcaccta 1140
ttggtcttac tgacatccac tttgcctttc tctccacagg tgtccactcc cagttcaatt 1200
acagctctta aggctagagt acttaatacg actcactata ggctagcctc gagaattcac 1260
gcgtggtacc tctagagtcg acccgggcgg ccgccatggg cttcgtgaga cagatacagc 1320
ttttgctctg gaagaactgg accctgcgga aaaggcaaaa gattcgcttt gtggtggaac 1380
tcgtgtggcc tttatcttta tttctggtct tgatctggtt aaggaatgcc aacccgctct 1440
acagccatca tgaatgccat ttccccaaca aggcgatgcc ctcagcagga atgctgccgt 1500
ggctccaggg gatcttctgc aatgtgaaca atccctgttt tcaaagcccc accccaggag 1560
aatctcctgg aattgtgtca aactataaca actccatctt ggcaagggta tatcgagatt 1620
ttcaagaact cctcatgaat gcaccagaga gccagcacct tggccgtatt tggacagagc 1680
tacacatctt gtcccaattc atggacaccc tccggactca cccggagaga attgcaggaa 1740
gaggaattcg aataagggat atcttgaaag atgaagaaac actgacacta tttctcatta 1800
aaaacatcgg cctgtctgac tcagtggtct accttctgat caactctcaa gtccgtccag 1860
agcagttcgc tcatggagtc ccggacctgg cgctgaagga catcgcctgc agcgaggccc 1920
tcctggagcg cttcatcatc ttcagccaga gacgcggggc aaagacggtg cgctatgccc 1980
tgtgctccct ctcccagggc accctacagt ggatagaaga cactctgtat gccaacgtgg 2040
acttcttcaa gctcttccgt gtgcttccca cactcctaga cagccgttct caaggtatca 2100
atctgagatc ttggggagga atattatctg atatgtcacc aagaattcaa gagtttatcc 2160
atcggccgag tatgcaggac ttgctgtggg tgaccaggcc cctcatgcag aatggtggtc 2220
cagagacctt tacaaagctg atgggcatcc tgtctgacct cctgtgtggc taccccgagg 2280
gaggtggctc tcgggtgctc tccttcaact ggtatgaaga caataactat aaggcctttc 2340
tggggattga ctccacaagg aaggatccta tctattctta tgacagaaga acaacatcct 2400
tttgtaatgc attgatccag agcctggagt caaatccttt aaccaaaatc gcttggaggg 2460
cggcaaagcc tttgctgatg ggaaaaatcc tgtacactcc tgattcacct gcagcacgaa 2520
ggatactgaa gaatgccaac tcaacttttg aagaactgga acacgttagg aagttggtca 2580
aagcctggga agaagtaggg ccccagatct ggtacttctt tgacaacagc acacagatga 2640
acatgatcag agataccctg gggaacccaa cagtaaaaga ctttttgaat aggcagcttg 2700
gtgaagaagg tattactgct gaagccatcc taaacttcct ctacaagggc cctcgggaaa 2760
gccaggctga cgacatggcc aacttcgact ggagggacat atttaacatc actgatcgca 2820
ccctccgcct tgtcaatcaa tacctggagt gcttggtcct ggataagttt gaaagctaca 2880
atgatgaaac tcagctcacc caacgtgccc tctctctact ggaggaaaac atgttctggg 2940
ccggagtggt attccctgac atgtatccct ggaccagctc tctaccaccc cacgtgaagt 3000
ataagatccg aatggacata gacgtggtgg agaaaaccaa taagattaaa gacaggtatt 3060
gggattctgg tcccagagct gatcccgtgg aagatttccg gtacatctgg ggcgggtttg 3120
cctatctgca ggacatggtt gaacagggga tcacaaggag ccaggtgcag gcggaggctc 3180
cagttggaat ctacctccag cagatgccct acccctgctt cgtggacgat tctttcatga 3240
tcatcctgaa ccgctgtttc cctatcttca tggtgctggc atggatctac tctgtctcca 3300
tgactgtgaa gagcatcgtc ttggagaagg agttgcgact gaaggagacc ttgaaaaatc 3360
agggtgtctc caatgcagtg atttggtgta cctggttcct ggacagcttc tccatcatgt 3420
cgatgagcat cttcctcctg acgatattca tcatgcatgg aagaatccta cattacagcg 3480
acccattcat cctcttcctg ttcttgttgg ctttctccac tgccaccatc atgctgtgct 3540
ttctgctcag caccttcttc tccaaggcca gtctggcagc agcctgtagt ggtgtcatct 3600
atttcaccct ctacctgcca cacatcctgt gcttcgcctg gcaggaccgc atgaccgctg 3660
agctgaagaa ggctgtgagc ttactgtctc cggtggcatt tggatttggc actgagtacc 3720
tggttcgctt tgaagagcaa ggcctggggc tgcagtggag caacatcggg aacagtccca 3780
cggaagggga cgaattcagc ttcctgctgt ccatgcagat gatgctcctt gatgctgctg 3840
tctatggctt actcgcttgg taccttgatc aggtgtttcc aggagactat ggaaccccac 3900
ttccttggta ctttcttcta caagagtcgt attggcttgg cggtgaaggg tgttcaacca 3960
gagaagaaag agccctggaa aagaccgagc ccctaacaga ggaaacggag gatccagagc 4020
acccagaagg aatacacgac tccttctttg aacgtgagca tccagggtgg gttcctgggg 4080
tatgcgtgaa gaatctggta aagatttttg agccctgtgg ccggccagct gtggaccgtc 4140
tgaacatcac cttctacgag aaccagatca ccgcattcct gggccacaat ggagctggga 4200
aaaccaccac cttgtaagta tcaaggttac aagacaggtt taaggagacc aatagaaact 4260
gggcttgtcg agacagagaa gactcttgcg tttctcaatt gaggaacccc tagtgatgga 4320
gttggccact ccctctctgc gcgctcgctc gctcactgag gccgggcgac caaaggtcgc 4380
ccgacgcccg ggctttgccc gggcggcctc agtgagcgag cgagcgcgca g 4431
<210> 23
<211> 4536
<212> DNA
<213> Artificial Sequence
<220>
<223> 5'CMV NO INTRON ABCA4 OV
<400> 23
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180
aggaagatct tcaatattgg ccattagcca tattattcat tggttatata gcataaatca 240
atattggcta ttggccattg catacgttgt atctatatca taatatgtac atttatattg 300
gctcatgtcc aatatgaccg ccatgttggc attgattatt gactagttat taatagtaat 360
caattacggg gtcattagtt catagcccat atatggagtt ccgcgttaca taacttacgg 420
taaatggccc gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt 480
atgttcccat agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac 540
ggtaaactgc ccacttggca gtacatcaag tgtatcatat gccaagtccg ccccctattg 600
acgtcaatga cggtaaatgg cccgcctggc attatgccca gtacatgacc ttacgggact 660
ttcctacttg gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt 720
ggcagtacac caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc 780
ccattgacgt caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc 840
gtaataaccc cgccccgttg acgcaaatgg gcggtaggcg tgtacggtgg gaggtctata 900
taagcagagc tcggcggccg ccatgggctt cgtgagacag atacagcttt tgctctggaa 960
gaactggacc ctgcggaaaa ggcaaaagat tcgctttgtg gtggaactcg tgtggccttt 1020
atctttattt ctggtcttga tctggttaag gaatgccaac ccgctctaca gccatcatga 1080
atgccatttc cccaacaagg cgatgccctc agcaggaatg ctgccgtggc tccaggggat 1140
cttctgcaat gtgaacaatc cctgttttca aagccccacc ccaggagaat ctcctggaat 1200
tgtgtcaaac tataacaact ccatcttggc aagggtatat cgagattttc aagaactcct 1260
catgaatgca ccagagagcc agcaccttgg ccgtatttgg acagagctac acatcttgtc 1320
ccaattcatg gacaccctcc ggactcaccc ggagagaatt gcaggaagag gaattcgaat 1380
aagggatatc ttgaaagatg aagaaacact gacactattt ctcattaaaa acatcggcct 1440
gtctgactca gtggtctacc ttctgatcaa ctctcaagtc cgtccagagc agttcgctca 1500
tggagtcccg gacctggcgc tgaaggacat cgcctgcagc gaggccctcc tggagcgctt 1560
catcatcttc agccagagac gcggggcaaa gacggtgcgc tatgccctgt gctccctctc 1620
ccagggcacc ctacagtgga tagaagacac tctgtatgcc aacgtggact tcttcaagct 1680
cttccgtgtg cttcccacac tcctagacag ccgttctcaa ggtatcaatc tgagatcttg 1740
gggaggaata ttatctgata tgtcaccaag aattcaagag tttatccatc ggccgagtat 1800
gcaggacttg ctgtgggtga ccaggcccct catgcagaat ggtggtccag agacctttac 1860
aaagctgatg ggcatcctgt ctgacctcct gtgtggctac cccgagggag gtggctctcg 1920
ggtgctctcc ttcaactggt atgaagacaa taactataag gcctttctgg ggattgactc 1980
cacaaggaag gatcctatct attcttatga cagaagaaca acatcctttt gtaatgcatt 2040
gatccagagc ctggagtcaa atcctttaac caaaatcgct tggagggcgg caaagccttt 2100
gctgatggga aaaatcctgt acactcctga ttcacctgca gcacgaagga tactgaagaa 2160
tgccaactca acttttgaag aactggaaca cgttaggaag ttggtcaaag cctgggaaga 2220
agtagggccc cagatctggt acttctttga caacagcaca cagatgaaca tgatcagaga 2280
taccctgggg aacccaacag taaaagactt tttgaatagg cagcttggtg aagaaggtat 2340
tactgctgaa gccatcctaa acttcctcta caagggccct cgggaaagcc aggctgacga 2400
catggccaac ttcgactgga gggacatatt taacatcact gatcgcaccc tccgccttgt 2460
caatcaatac ctggagtgct tggtcctgga taagtttgaa agctacaatg atgaaactca 2520
gctcacccaa cgtgccctct ctctactgga ggaaaacatg ttctgggccg gagtggtatt 2580
ccctgacatg tatccctgga ccagctctct accaccccac gtgaagtata agatccgaat 2640
ggacatagac gtggtggaga aaaccaataa gattaaagac aggtattggg attctggtcc 2700
cagagctgat cccgtggaag atttccggta catctggggc gggtttgcct atctgcagga 2760
catggttgaa caggggatca caaggagcca ggtgcaggcg gaggctccag ttggaatcta 2820
cctccagcag atgccctacc cctgcttcgt ggacgattct ttcatgatca tcctgaaccg 2880
ctgtttccct atcttcatgg tgctggcatg gatctactct gtctccatga ctgtgaagag 2940
catcgtcttg gagaaggagt tgcgactgaa ggagaccttg aaaaatcagg gtgtctccaa 3000
tgcagtgatt tggtgtacct ggttcctgga cagcttctcc atcatgtcga tgagcatctt 3060
cctcctgacg atattcatca tgcatggaag aatcctacat tacagcgacc cattcatcct 3120
cttcctgttc ttgttggctt tctccactgc caccatcatg ctgtgctttc tgctcagcac 3180
cttcttctcc aaggccagtc tggcagcagc ctgtagtggt gtcatctatt tcaccctcta 3240
cctgccacac atcctgtgct tcgcctggca ggaccgcatg accgctgagc tgaagaaggc 3300
tgtgagctta ctgtctccgg tggcatttgg atttggcact gagtacctgg ttcgctttga 3360
agagcaaggc ctggggctgc agtggagcaa catcgggaac agtcccacgg aaggggacga 3420
attcagcttc ctgctgtcca tgcagatgat gctccttgat gctgctgtct atggcttact 3480
cgcttggtac cttgatcagg tgtttccagg agactatgga accccacttc cttggtactt 3540
tcttctacaa gagtcgtatt ggcttggcgg tgaagggtgt tcaaccagag aagaaagagc 3600
cctggaaaag accgagcccc taacagagga aacggaggat ccagagcacc cagaaggaat 3660
acacgactcc ttctttgaac gtgagcatcc agggtgggtt cctggggtat gcgtgaagaa 3720
tctggtaaag atttttgagc cctgtggccg gccagctgtg gaccgtctga acatcacctt 3780
ctacgagaac cagatcaccg cattcctggg ccacaatgga gctgggaaaa ccaccacctt 3840
gtccatcctg acgggtctgt tgccaccaac ctctgggact gtgctcgttg ggggaaggga 3900
cattgaaacc agcctggatg cagtccggca gagccttggc atgtgtccac agcacaacat 3960
cctgttccac cacctcacgg tggctgagca catgctgttc tatgcccagc tgaaaggaaa 4020
gtcccaggag gaggcccagc tggagatgga agccatgttg gaggacacag gcctccacca 4080
caagcggaat gaagaggctc aggacctatc aggtggcatg cagagaaagc tgtcggttgc 4140
cattgccttt gtgggagatg ccaaggtggt gattctggac gaacccacct ctggggtgga 4200
cccttactcg agacgctcaa tctgggatct gctcctgaag tatcgctcag gcagaaccat 4260
catcatgtcc actcaccaca tggacgaggc cgacctcctt ggggaccgca ttgccatcat 4320
tgcccaggga aggctctact gctcaggcac cccactcttc ctgaagaact gctttggcac 4380
aggcttgtac ttaaccttgg tgcgcaagga acccctagtg atggagttgg ccactccctc 4440
tctgcgcgct cgctcgctca ctgaggccgg gcgaccaaag gtcgcccgac gcccgggctt 4500
tgcccgggcg gcctcagtga gcgagcgagc gcgcag 4536
<210> 24
<211> 4167
<212> DNA
<213> Artificial Sequence
<220>
<223> 5'CMV NO INTRON ABCA4-AK
<400> 24
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180
aggaagatct tcaatattgg ccattagcca tattattcat tggttatata gcataaatca 240
atattggcta ttggccattg catacgttgt atctatatca taatatgtac atttatattg 300
gctcatgtcc aatatgaccg ccatgttggc attgattatt gactagttat taatagtaat 360
caattacggg gtcattagtt catagcccat atatggagtt ccgcgttaca taacttacgg 420
taaatggccc gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt 480
atgttcccat agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac 540
ggtaaactgc ccacttggca gtacatcaag tgtatcatat gccaagtccg ccccctattg 600
acgtcaatga cggtaaatgg cccgcctggc attatgccca gtacatgacc ttacgggact 660
ttcctacttg gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt 720
ggcagtacac caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc 780
ccattgacgt caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc 840
gtaataaccc cgccccgttg acgcaaatgg gcggtaggcg tgtacggtgg gaggtctata 900
taagcagagc tcggcggccg ccatgggctt cgtgagacag atacagcttt tgctctggaa 960
gaactggacc ctgcggaaaa ggcaaaagat tcgctttgtg gtggaactcg tgtggccttt 1020
atctttattt ctggtcttga tctggttaag gaatgccaac ccgctctaca gccatcatga 1080
atgccatttc cccaacaagg cgatgccctc agcaggaatg ctgccgtggc tccaggggat 1140
cttctgcaat gtgaacaatc cctgttttca aagccccacc ccaggagaat ctcctggaat 1200
tgtgtcaaac tataacaact ccatcttggc aagggtatat cgagattttc aagaactcct 1260
catgaatgca ccagagagcc agcaccttgg ccgtatttgg acagagctac acatcttgtc 1320
ccaattcatg gacaccctcc ggactcaccc ggagagaatt gcaggaagag gaattcgaat 1380
aagggatatc ttgaaagatg aagaaacact gacactattt ctcattaaaa acatcggcct 1440
gtctgactca gtggtctacc ttctgatcaa ctctcaagtc cgtccagagc agttcgctca 1500
tggagtcccg gacctggcgc tgaaggacat cgcctgcagc gaggccctcc tggagcgctt 1560
catcatcttc agccagagac gcggggcaaa gacggtgcgc tatgccctgt gctccctctc 1620
ccagggcacc ctacagtgga tagaagacac tctgtatgcc aacgtggact tcttcaagct 1680
cttccgtgtg cttcccacac tcctagacag ccgttctcaa ggtatcaatc tgagatcttg 1740
gggaggaata ttatctgata tgtcaccaag aattcaagag tttatccatc ggccgagtat 1800
gcaggacttg ctgtgggtga ccaggcccct catgcagaat ggtggtccag agacctttac 1860
aaagctgatg ggcatcctgt ctgacctcct gtgtggctac cccgagggag gtggctctcg 1920
ggtgctctcc ttcaactggt atgaagacaa taactataag gcctttctgg ggattgactc 1980
cacaaggaag gatcctatct attcttatga cagaagaaca acatcctttt gtaatgcatt 2040
gatccagagc ctggagtcaa atcctttaac caaaatcgct tggagggcgg caaagccttt 2100
gctgatggga aaaatcctgt acactcctga ttcacctgca gcacgaagga tactgaagaa 2160
tgccaactca acttttgaag aactggaaca cgttaggaag ttggtcaaag cctgggaaga 2220
agtagggccc cagatctggt acttctttga caacagcaca cagatgaaca tgatcagaga 2280
taccctgggg aacccaacag taaaagactt tttgaatagg cagcttggtg aagaaggtat 2340
tactgctgaa gccatcctaa acttcctcta caagggccct cgggaaagcc aggctgacga 2400
catggccaac ttcgactgga gggacatatt taacatcact gatcgcaccc tccgccttgt 2460
caatcaatac ctggagtgct tggtcctgga taagtttgaa agctacaatg atgaaactca 2520
gctcacccaa cgtgccctct ctctactgga ggaaaacatg ttctgggccg gagtggtatt 2580
ccctgacatg tatccctgga ccagctctct accaccccac gtgaagtata agatccgaat 2640
ggacatagac gtggtggaga aaaccaataa gattaaagac aggtattggg attctggtcc 2700
cagagctgat cccgtggaag atttccggta catctggggc gggtttgcct atctgcagga 2760
catggttgaa caggggatca caaggagcca ggtgcaggcg gaggctccag ttggaatcta 2820
cctccagcag atgccctacc cctgcttcgt ggacgattct ttcatgatca tcctgaaccg 2880
ctgtttccct atcttcatgg tgctggcatg gatctactct gtctccatga ctgtgaagag 2940
catcgtcttg gagaaggagt tgcgactgaa ggagaccttg aaaaatcagg gtgtctccaa 3000
tgcagtgatt tggtgtacct ggttcctgga cagcttctcc atcatgtcga tgagcatctt 3060
cctcctgacg atattcatca tgcatggaag aatcctacat tacagcgacc cattcatcct 3120
cttcctgttc ttgttggctt tctccactgc caccatcatg ctgtgctttc tgctcagcac 3180
cttcttctcc aaggccagtc tggcagcagc ctgtagtggt gtcatctatt tcaccctcta 3240
cctgccacac atcctgtgct tcgcctggca ggaccgcatg accgctgagc tgaagaaggc 3300
tgtgagctta ctgtctccgg tggcatttgg atttggcact gagtacctgg ttcgctttga 3360
agagcaaggc ctggggctgc agtggagcaa catcgggaac agtcccacgg aaggggacga 3420
attcagcttc ctgctgtcca tgcagatgat gctccttgat gctgctgtct atggcttact 3480
cgcttggtac cttgatcagg tgtttccagg agactatgga accccacttc cttggtactt 3540
tcttctacaa gagtcgtatt ggcttggcgg tgaagggtgt tcaaccagag aagaaagagc 3600
cctggaaaag accgagcccc taacagagga aacggaggat ccagagcacc cagaaggaat 3660
acacgactcc ttctttgaac gtgagcatcc agggtgggtt cctggggtat gcgtgaagaa 3720
tctggtaaag atttttgagc cctgtggccg gccagctgtg gaccgtctga acatcacctt 3780
ctacgagaac cagatcaccg cattcctggg ccacaatgga gctgggaaaa ccaccacctt 3840
gtaagtatca aggttacaag acaggtttaa ggagaccaat agaaactggg cttgtcgaga 3900
cagagaagac tcttgcgttt ctgggatttt tccgatttcg gcctattggt taaaaaatga 3960
gctgatttaa caaaaattta acgcgaattt taacaaaata ttaacgttta taatttcagg 4020
tggcatcttt ccaattgagg aacccctagt gatggagttg gccactccct ctctgcgcgc 4080
tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga cgcccgggct ttgcccgggc 4140
ggcctcagtg agcgagcgag cgcgcag 4167
<210> 25
<211> 4289
<212> DNA
<213> Artificial Sequence
<220>
<223> 5'VMD2 ABCA4-AK
<400> 25
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180
aggaagatct tcaatattgg ccattagcca tattattcat tggttatata gcataaatca 240
atattggcta ttggccattg catacgttgt atctatatca taatatgtac atttatattg 300
gctcatgtcc aatatgaccg ccatgttggc attgattatt gactagtaac ggccgccagt 360
gtgctggaat tcgcccttaa taacttaagc gtcagcatat gcagaattct gtcattttac 420
tagggtgatg aaattcccaa gcaacaccat ccttttcaga taagggcact gaggctgaga 480
gaggagctga aacctacccg gggtcaccac acacaggtgg caaggctggg accagaaacc 540
aggactgttg actgcagccc ggtattcatt ctttccatag cccacagggc tgtcaaagac 600
cccagggcct agtcagaggc tcctccttcc tggagagttc ctggcacaga agttgaagct 660
cagcacagcc ccctaacccc caactctctc tgcaaggcct caggggtcag aacactggtg 720
gagcagatcc tttagcctct ggattttagg gccatggtag agggggtgtt gccctaaatt 780
ccagccctgg tctcagccca acaccctcca agaagaaatt agaggggcca tggccaggct 840
gtgctagccg ttgcttctga gcagattaca agaagggact aagacaagga ctcctttgtg 900
gaggtcctgg cttagggagt caagtgacgg cggctcagca ctcacgtggg cagtgccagc 960
ctctaagagt gggcaggggc actggccaca gagtcccagg gagtcccacc agcctagtcg 1020
ccagaccttc tgtgggcggc cgccatgggc ttcgtgagac agatacagct tttgctctgg 1080
aagaactgga ccctgcggaa aaggcaaaag attcgctttg tggtggaact cgtgtggcct 1140
ttatctttat ttctggtctt gatctggtta aggaatgcca acccgctcta cagccatcat 1200
gaatgccatt tccccaacaa ggcgatgccc tcagcaggaa tgctgccgtg gctccagggg 1260
atcttctgca atgtgaacaa tccctgtttt caaagcccca ccccaggaga atctcctgga 1320
attgtgtcaa actataacaa ctccatcttg gcaagggtat atcgagattt tcaagaactc 1380
ctcatgaatg caccagagag ccagcacctt ggccgtattt ggacagagct acacatcttg 1440
tcccaattca tggacaccct ccggactcac ccggagagaa ttgcaggaag aggaattcga 1500
ataagggata tcttgaaaga tgaagaaaca ctgacactat ttctcattaa aaacatcggc 1560
ctgtctgact cagtggtcta ccttctgatc aactctcaag tccgtccaga gcagttcgct 1620
catggagtcc cggacctggc gctgaaggac atcgcctgca gcgaggccct cctggagcgc 1680
ttcatcatct tcagccagag acgcggggca aagacggtgc gctatgccct gtgctccctc 1740
tcccagggca ccctacagtg gatagaagac actctgtatg ccaacgtgga cttcttcaag 1800
ctcttccgtg tgcttcccac actcctagac agccgttctc aaggtatcaa tctgagatct 1860
tggggaggaa tattatctga tatgtcacca agaattcaag agtttatcca tcggccgagt 1920
atgcaggact tgctgtgggt gaccaggccc ctcatgcaga atggtggtcc agagaccttt 1980
acaaagctga tgggcatcct gtctgacctc ctgtgtggct accccgaggg aggtggctct 2040
cgggtgctct ccttcaactg gtatgaagac aataactata aggcctttct ggggattgac 2100
tccacaagga aggatcctat ctattcttat gacagaagaa caacatcctt ttgtaatgca 2160
ttgatccaga gcctggagtc aaatccttta accaaaatcg cttggagggc ggcaaagcct 2220
ttgctgatgg gaaaaatcct gtacactcct gattcacctg cagcacgaag gatactgaag 2280
aatgccaact caacttttga agaactggaa cacgttagga agttggtcaa agcctgggaa 2340
gaagtagggc cccagatctg gtacttcttt gacaacagca cacagatgaa catgatcaga 2400
gataccctgg ggaacccaac agtaaaagac tttttgaata ggcagcttgg tgaagaaggt 2460
attactgctg aagccatcct aaacttcctc tacaagggcc ctcgggaaag ccaggctgac 2520
gacatggcca acttcgactg gagggacata tttaacatca ctgatcgcac cctccgcctt 2580
gtcaatcaat acctggagtg cttggtcctg gataagtttg aaagctacaa tgatgaaact 2640
cagctcaccc aacgtgccct ctctctactg gaggaaaaca tgttctgggc cggagtggta 2700
ttccctgaca tgtatccctg gaccagctct ctaccacccc acgtgaagta taagatccga 2760
atggacatag acgtggtgga gaaaaccaat aagattaaag acaggtattg ggattctggt 2820
cccagagctg atcccgtgga agatttccgg tacatctggg gcgggtttgc ctatctgcag 2880
gacatggttg aacaggggat cacaaggagc caggtgcagg cggaggctcc agttggaatc 2940
tacctccagc agatgcccta cccctgcttc gtggacgatt ctttcatgat catcctgaac 3000
cgctgtttcc ctatcttcat ggtgctggca tggatctact ctgtctccat gactgtgaag 3060
agcatcgtct tggagaagga gttgcgactg aaggagacct tgaaaaatca gggtgtctcc 3120
aatgcagtga tttggtgtac ctggttcctg gacagcttct ccatcatgtc gatgagcatc 3180
ttcctcctga cgatattcat catgcatgga agaatcctac attacagcga cccattcatc 3240
ctcttcctgt tcttgttggc tttctccact gccaccatca tgctgtgctt tctgctcagc 3300
accttcttct ccaaggccag tctggcagca gcctgtagtg gtgtcatcta tttcaccctc 3360
tacctgccac acatcctgtg cttcgcctgg caggaccgca tgaccgctga gctgaagaag 3420
gctgtgagct tactgtctcc ggtggcattt ggatttggca ctgagtacct ggttcgcttt 3480
gaagagcaag gcctggggct gcagtggagc aacatcggga acagtcccac ggaaggggac 3540
gaattcagct tcctgctgtc catgcagatg atgctccttg atgctgctgt ctatggctta 3600
ctcgcttggt accttgatca ggtgtttcca ggagactatg gaaccccact tccttggtac 3660
tttcttctac aagagtcgta ttggcttggc ggtgaagggt gttcaaccag agaagaaaga 3720
gccctggaaa agaccgagcc cctaacagag gaaacggagg atccagagca cccagaagga 3780
atacacgact ccttctttga acgtgagcat ccagggtggg ttcctggggt atgcgtgaag 3840
aatctggtaa agatttttga gccctgtggc cggccagctg tggaccgtct gaacatcacc 3900
ttctacgaga accagatcac cgcattcctg ggccacaatg gagctgggaa aaccaccacc 3960
ttgtaagtat caaggttaca agacaggttt aaggagacca atagaaactg ggcttgtcga 4020
gacagagaag actcttgcgt ttctgggatt tttccgattt cggcctattg gttaaaaaat 4080
gagctgattt aacaaaaatt taacgcgaat tttaacaaaa tattaacgtt tataatttca 4140
ggtggcatct ttccaattga ggaaccccta gtgatggagt tggccactcc ctctctgcgc 4200
gctcgctcgc tcactgaggc cgggcgacca aaggtcgccc gacgcccggg ctttgcccgg 4260
gcggcctcag tgagcgagcg agcgcgcag 4289
<210> 26
<211> 4436
<212> DNA
<213> Artificial Sequence
<220>
<223> 5'RHOABCA4-AK
<400> 26
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180
aggaagatct tcaatattgg ccattagcca tattattcat tggttatata gcataaatca 240
atattggcta ttggccattg catacgttgt atctatatca taatatgtac atttatattg 300
gctcatgtcc aatatgaccg ccatgttggc attgattatt gactagcaga tcttccccac 360
ctagccacct ggcaaactgc tccttctctc aaaggcccaa acatggcctc ccagactgca 420
acccccaggc agtcaggccc tgtctccaca acctcacagc caccctggac ggaatctgct 480
tcttcccaca tttgagtcct cctcagcccc tgagctcctc tgggcagggc tgtttctttc 540
catctttgta ttcccagggg cctgcaaata aatgtttaat gaacgaacaa gagagtgaat 600
tccaattcca tgcaacaagg attgggctcc tgggccctag gctatgtgtc tggcaccaga 660
aacggaagct gcaggttgca gcccctgccc tcatggagct cctcctgtca gaggagtgtg 720
gggactggat gactccagag gtaacttgtg ggggaacgaa caggtaaggg gctgtgtgac 780
gagatgagag actgggagaa taaaccagaa agtctctagc tgtccagagg acatagcaca 840
gaggcccatg gtccctattt caaacccagg ccaccagact gagctgggac cttgggacag 900
acaagtcatg cagaagttag gggaccttct cctccctttt cctggatcct gagtacctct 960
cctccctgac ctcaggcttc ctcctagtgt caccttggcc cctcttagaa gccaattagg 1020
ccctcagttt ctgcagcggg gattaatatg attatgaaca cccccaatct cccagatgct 1080
gattcagcca ggagcttagg agggggaggt cactttataa gggtctgggg gggtcagaac 1140
ccagagtcat ccgcctgaat tctgcagata tccatcacac tggcggccgc catgggcttc 1200
gtgagacaga tacagctttt gctctggaag aactggaccc tgcggaaaag gcaaaagatt 1260
cgctttgtgg tggaactcgt gtggccttta tctttatttc tggtcttgat ctggttaagg 1320
aatgccaacc cgctctacag ccatcatgaa tgccatttcc ccaacaaggc gatgccctca 1380
gcaggaatgc tgccgtggct ccaggggatc ttctgcaatg tgaacaatcc ctgttttcaa 1440
agccccaccc caggagaatc tcctggaatt gtgtcaaact ataacaactc catcttggca 1500
agggtatatc gagattttca agaactcctc atgaatgcac cagagagcca gcaccttggc 1560
cgtatttgga cagagctaca catcttgtcc caattcatgg acaccctccg gactcacccg 1620
gagagaattg caggaagagg aattcgaata agggatatct tgaaagatga agaaacactg 1680
acactatttc tcattaaaaa catcggcctg tctgactcag tggtctacct tctgatcaac 1740
tctcaagtcc gtccagagca gttcgctcat ggagtcccgg acctggcgct gaaggacatc 1800
gcctgcagcg aggccctcct ggagcgcttc atcatcttca gccagagacg cggggcaaag 1860
acggtgcgct atgccctgtg ctccctctcc cagggcaccc tacagtggat agaagacact 1920
ctgtatgcca acgtggactt cttcaagctc ttccgtgtgc ttcccacact cctagacagc 1980
cgttctcaag gtatcaatct gagatcttgg ggaggaatat tatctgatat gtcaccaaga 2040
attcaagagt ttatccatcg gccgagtatg caggacttgc tgtgggtgac caggcccctc 2100
atgcagaatg gtggtccaga gacctttaca aagctgatgg gcatcctgtc tgacctcctg 2160
tgtggctacc ccgagggagg tggctctcgg gtgctctcct tcaactggta tgaagacaat 2220
aactataagg cctttctggg gattgactcc acaaggaagg atcctatcta ttcttatgac 2280
agaagaacaa catccttttg taatgcattg atccagagcc tggagtcaaa tcctttaacc 2340
aaaatcgctt ggagggcggc aaagcctttg ctgatgggaa aaatcctgta cactcctgat 2400
tcacctgcag cacgaaggat actgaagaat gccaactcaa cttttgaaga actggaacac 2460
gttaggaagt tggtcaaagc ctgggaagaa gtagggcccc agatctggta cttctttgac 2520
aacagcacac agatgaacat gatcagagat accctgggga acccaacagt aaaagacttt 2580
ttgaataggc agcttggtga agaaggtatt actgctgaag ccatcctaaa cttcctctac 2640
aagggccctc gggaaagcca ggctgacgac atggccaact tcgactggag ggacatattt 2700
aacatcactg atcgcaccct ccgccttgtc aatcaatacc tggagtgctt ggtcctggat 2760
aagtttgaaa gctacaatga tgaaactcag ctcacccaac gtgccctctc tctactggag 2820
gaaaacatgt tctgggccgg agtggtattc cctgacatgt atccctggac cagctctcta 2880
ccaccccacg tgaagtataa gatccgaatg gacatagacg tggtggagaa aaccaataag 2940
attaaagaca ggtattggga ttctggtccc agagctgatc ccgtggaaga tttccggtac 3000
atctggggcg ggtttgccta tctgcaggac atggttgaac aggggatcac aaggagccag 3060
gtgcaggcgg aggctccagt tggaatctac ctccagcaga tgccctaccc ctgcttcgtg 3120
gacgattctt tcatgatcat cctgaaccgc tgtttcccta tcttcatggt gctggcatgg 3180
atctactctg tctccatgac tgtgaagagc atcgtcttgg agaaggagtt gcgactgaag 3240
gagaccttga aaaatcaggg tgtctccaat gcagtgattt ggtgtacctg gttcctggac 3300
agcttctcca tcatgtcgat gagcatcttc ctcctgacga tattcatcat gcatggaaga 3360
atcctacatt acagcgaccc attcatcctc ttcctgttct tgttggcttt ctccactgcc 3420
accatcatgc tgtgctttct gctcagcacc ttcttctcca aggccagtct ggcagcagcc 3480
tgtagtggtg tcatctattt caccctctac ctgccacaca tcctgtgctt cgcctggcag 3540
gaccgcatga ccgctgagct gaagaaggct gtgagcttac tgtctccggt ggcatttgga 3600
tttggcactg agtacctggt tcgctttgaa gagcaaggcc tggggctgca gtggagcaac 3660
atcgggaaca gtcccacgga aggggacgaa ttcagcttcc tgctgtccat gcagatgatg 3720
ctccttgatg ctgctgtcta tggcttactc gcttggtacc ttgatcaggt gtttccagga 3780
gactatggaa ccccacttcc ttggtacttt cttctacaag agtcgtattg gcttggcggt 3840
gaagggtgtt caaccagaga agaaagagcc ctggaaaaga ccgagcccct aacagaggaa 3900
acggaggatc cagagcaccc agaaggaata cacgactcct tctttgaacg tgagcatcca 3960
gggtgggttc ctggggtatg cgtgaagaat ctggtaaaga tttttgagcc ctgtggccgg 4020
ccagctgtgg accgtctgaa catcaccttc tacgagaacc agatcaccgc attcctgggc 4080
cacaatggag ctgggaaaac caccaccttg taagtatcaa ggttacaaga caggtttaag 4140
gagaccaata gaaactgggc ttgtcgagac agagaagact cttgcgtttc tgggattttt 4200
ccgatttcgg cctattggtt aaaaaatgag ctgatttaac aaaaatttaa cgcgaatttt 4260
aacaaaatat taacgtttat aatttcaggt ggcatctttc caattgagga acccctagtg 4320
atggagttgg ccactccctc tctgcgcgct cgctcgctca ctgaggccgg gcgaccaaag 4380
gtcgcccgac gcccgggctt tgcccgggcg gcctcagtga gcgagcgagc gcgcag 4436
<210> 27
<211> 4327
<212> DNA
<213> Artificial Sequence
<220>
<223> 5'RHO ABCA4-TS
<400> 27
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180
aggaagatct tcaatattgg ccattagcca tattattcat tggttatata gcataaatca 240
atattggcta ttggccattg catacgttgt atctatatca taatatgtac atttatattg 300
gctcatgtcc aatatgaccg ccatgttggc attgattatt gactagcaga tcttccccac 360
ctagccacct ggcaaactgc tccttctctc aaaggcccaa acatggcctc ccagactgca 420
acccccaggc agtcaggccc tgtctccaca acctcacagc caccctggac ggaatctgct 480
tcttcccaca tttgagtcct cctcagcccc tgagctcctc tgggcagggc tgtttctttc 540
catctttgta ttcccagggg cctgcaaata aatgtttaat gaacgaacaa gagagtgaat 600
tccaattcca tgcaacaagg attgggctcc tgggccctag gctatgtgtc tggcaccaga 660
aacggaagct gcaggttgca gcccctgccc tcatggagct cctcctgtca gaggagtgtg 720
gggactggat gactccagag gtaacttgtg ggggaacgaa caggtaaggg gctgtgtgac 780
gagatgagag actgggagaa taaaccagaa agtctctagc tgtccagagg acatagcaca 840
gaggcccatg gtccctattt caaacccagg ccaccagact gagctgggac cttgggacag 900
acaagtcatg cagaagttag gggaccttct cctccctttt cctggatcct gagtacctct 960
cctccctgac ctcaggcttc ctcctagtgt caccttggcc cctcttagaa gccaattagg 1020
ccctcagttt ctgcagcggg gattaatatg attatgaaca cccccaatct cccagatgct 1080
gattcagcca ggagcttagg agggggaggt cactttataa gggtctgggg gggtcagaac 1140
ccagagtcat ccgcctgaat tctgcagata tccatcacac tggcggccgc catgggcttc 1200
gtgagacaga tacagctttt gctctggaag aactggaccc tgcggaaaag gcaaaagatt 1260
cgctttgtgg tggaactcgt gtggccttta tctttatttc tggtcttgat ctggttaagg 1320
aatgccaacc cgctctacag ccatcatgaa tgccatttcc ccaacaaggc gatgccctca 1380
gcaggaatgc tgccgtggct ccaggggatc ttctgcaatg tgaacaatcc ctgttttcaa 1440
agccccaccc caggagaatc tcctggaatt gtgtcaaact ataacaactc catcttggca 1500
agggtatatc gagattttca agaactcctc atgaatgcac cagagagcca gcaccttggc 1560
cgtatttgga cagagctaca catcttgtcc caattcatgg acaccctccg gactcacccg 1620
gagagaattg caggaagagg aattcgaata agggatatct tgaaagatga agaaacactg 1680
acactatttc tcattaaaaa catcggcctg tctgactcag tggtctacct tctgatcaac 1740
tctcaagtcc gtccagagca gttcgctcat ggagtcccgg acctggcgct gaaggacatc 1800
gcctgcagcg aggccctcct ggagcgcttc atcatcttca gccagagacg cggggcaaag 1860
acggtgcgct atgccctgtg ctccctctcc cagggcaccc tacagtggat agaagacact 1920
ctgtatgcca acgtggactt cttcaagctc ttccgtgtgc ttcccacact cctagacagc 1980
cgttctcaag gtatcaatct gagatcttgg ggaggaatat tatctgatat gtcaccaaga 2040
attcaagagt ttatccatcg gccgagtatg caggacttgc tgtgggtgac caggcccctc 2100
atgcagaatg gtggtccaga gacctttaca aagctgatgg gcatcctgtc tgacctcctg 2160
tgtggctacc ccgagggagg tggctctcgg gtgctctcct tcaactggta tgaagacaat 2220
aactataagg cctttctggg gattgactcc acaaggaagg atcctatcta ttcttatgac 2280
agaagaacaa catccttttg taatgcattg atccagagcc tggagtcaaa tcctttaacc 2340
aaaatcgctt ggagggcggc aaagcctttg ctgatgggaa aaatcctgta cactcctgat 2400
tcacctgcag cacgaaggat actgaagaat gccaactcaa cttttgaaga actggaacac 2460
gttaggaagt tggtcaaagc ctgggaagaa gtagggcccc agatctggta cttctttgac 2520
aacagcacac agatgaacat gatcagagat accctgggga acccaacagt aaaagacttt 2580
ttgaataggc agcttggtga agaaggtatt actgctgaag ccatcctaaa cttcctctac 2640
aagggccctc gggaaagcca ggctgacgac atggccaact tcgactggag ggacatattt 2700
aacatcactg atcgcaccct ccgccttgtc aatcaatacc tggagtgctt ggtcctggat 2760
aagtttgaaa gctacaatga tgaaactcag ctcacccaac gtgccctctc tctactggag 2820
gaaaacatgt tctgggccgg agtggtattc cctgacatgt atccctggac cagctctcta 2880
ccaccccacg tgaagtataa gatccgaatg gacatagacg tggtggagaa aaccaataag 2940
attaaagaca ggtattggga ttctggtccc agagctgatc ccgtggaaga tttccggtac 3000
atctggggcg ggtttgccta tctgcaggac atggttgaac aggggatcac aaggagccag 3060
gtgcaggcgg aggctccagt tggaatctac ctccagcaga tgccctaccc ctgcttcgtg 3120
gacgattctt tcatgatcat cctgaaccgc tgtttcccta tcttcatggt gctggcatgg 3180
atctactctg tctccatgac tgtgaagagc atcgtcttgg agaaggagtt gcgactgaag 3240
gagaccttga aaaatcaggg tgtctccaat gcagtgattt ggtgtacctg gttcctggac 3300
agcttctcca tcatgtcgat gagcatcttc ctcctgacga tattcatcat gcatggaaga 3360
atcctacatt acagcgaccc attcatcctc ttcctgttct tgttggcttt ctccactgcc 3420
accatcatgc tgtgctttct gctcagcacc ttcttctcca aggccagtct ggcagcagcc 3480
tgtagtggtg tcatctattt caccctctac ctgccacaca tcctgtgctt cgcctggcag 3540
gaccgcatga ccgctgagct gaagaaggct gtgagcttac tgtctccggt ggcatttgga 3600
tttggcactg agtacctggt tcgctttgaa gagcaaggcc tggggctgca gtggagcaac 3660
atcgggaaca gtcccacgga aggggacgaa ttcagcttcc tgctgtccat gcagatgatg 3720
ctccttgatg ctgctgtcta tggcttactc gcttggtacc ttgatcaggt gtttccagga 3780
gactatggaa ccccacttcc ttggtacttt cttctacaag agtcgtattg gcttggcggt 3840
gaagggtgtt caaccagaga agaaagagcc ctggaaaaga ccgagcccct aacagaggaa 3900
acggaggatc cagagcaccc agaaggaata cacgactcct tctttgaacg tgagcatcca 3960
gggtgggttc ctggggtatg cgtgaagaat ctggtaaaga tttttgagcc ctgtggccgg 4020
ccagctgtgg accgtctgaa catcaccttc tacgagaacc agatcaccgc attcctgggc 4080
cacaatggag ctgggaaaac caccaccttg taagtatcaa ggttacaaga caggtttaag 4140
gagaccaata gaaactgggc ttgtcgagac agagaagact cttgcgtttc tcaattgagg 4200
aacccctagt gatggagttg gccactccct ctctgcgcgc tcgctcgctc actgaggccg 4260
ggcgaccaaa ggtcgcccga cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag 4320
cgcgcag 4327
<210> 28
<211> 277
<212> DNA
<213> Artificial Sequence
<220>
<223> Exemplary CBA promoter
<400> 28
tcgaggtgag ccccacgttc tgcttcactc tccccatctc ccccccctcc ccacccccaa 60
ttttgtattt atttattttt taattatttt gtgcagcgat gggggcgggg gggggggggg 120
cgcgcgccag gcggggcggg gcggggcgag gggcggggcg gggcgaggcg gagaggtgcg 180
gcggcagcca atcagagcgg cgcgctccga aagtttcctt ttatggcgag gcggcggcgg 240
cggcggccct ataaaaagcg aagcgcgcgg cgggcgg 277
<210> 29
<211> 835
<212> DNA
<213> Artificial Sequence
<220>
<223> example rhodopsin (Rho) promoter
<400> 29
agatcttccc cacctagcca cctggcaaac tgctccttct ctcaaaggcc caaacatggc 60
ctcccagact gcaaccccca ggcagtcagg ccctgtctcc acaacctcac agccaccctg 120
gacggaatct gcttcttccc acatttgagt cctcctcagc ccctgagctc ctctgggcag 180
ggctgtttct ttccatcttt gtattcccag gggcctgcaa ataaatgttt aatgaacgaa 240
caagagagtg aattccaatt ccatgcaaca aggattgggc tcctgggccc taggctatgt 300
gtctggcacc agaaacggaa gctgcaggtt gcagcccctg ccctcatgga gctcctcctg 360
tcagaggagt gtggggactg gatgactcca gaggtaactt gtgggggaac gaacaggtaa 420
ggggctgtgt gacgagatga gagactggga gaataaacca gaaagtctct agctgtccag 480
aggacatagc acagaggccc atggtcccta tttcaaaccc aggccaccag actgagctgg 540
gaccttggga cagacaagtc atgcagaagt taggggacct tctcctccct tttcctggat 600
cctgagtacc tctcctccct gacctcaggc ttcctcctag tgtcaccttg gcccctctta 660
gaagccaatt aggccctcag tttctgcagc ggggattaat atgattatga acacccccaa 720
tctcccagat gctgattcag ccaggagctt aggaggggga ggtcacttta taagggtctg 780
ggggggtcag aacccagagt catccgcctg aattctgcag atatccatca cactg 835
<210> 30
<211> 688
<212> DNA
<213> Artificial Sequence
<220>
<223> example vitelliform macular dystrophy 2 (VMD2) promoter
<400> 30
aacggccgcc agtgtgctgg aattcgccct taataactta agcgtcagca tatgcagaat 60
tctgtcattt tactagggtg atgaaattcc caagcaacac catccttttc agataagggc 120
actgaggctg agagaggagc tgaaacctac ccggggtcac cacacacagg tggcaaggct 180
gggaccagaa accaggactg ttgactgcag cccggtattc attctttcca tagcccacag 240
ggctgtcaaa gaccccaggg cctagtcaga ggctcctcct tcctggagag ttcctggcac 300
agaagttgaa gctcagcaca gccccctaac ccccaactct ctctgcaagg cctcaggggt 360
cagaacactg gtggagcaga tcctttagcc tctggatttt agggccatgg tagagggggt 420
gttgccctaa attccagccc tggtctcagc ccaacaccct ccaagaagaa attagagggg 480
ccatggccag gctgtgctag ccgttgcttc tgagcagatt acaagaaggg actaagacaa 540
ggactccttt gtggaggtcc tggcttaggg agtcaagtga cggcggctca gcactcacgt 600
gggcagtgcc agcctctaag agtgggcagg ggcactggcc acagagtccc agggagtccc 660
accagcctag tcgccagacc ttctgtgg 688
<210> 31
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> wild-type small T antigen intron
<400> 31
taaatataaa atttttaagt gtataatgtg ttaaactact gattctaatt gtttgtgtat 60
tttag 65
<210> 32
<211> 346
<212> DNA
<213> Artificial Sequence
<220>
<223> wild-type large T antigen intron
<400> 32
gtatttgctt cttccttaaa tcctggtgtt gatgcaatgt actgcaaaca atggcctgag 60
tgtgcaaaga aaatgtctgc taactgcata tgcttgctgt gcttactgag gatgaagcat 120
gaaaatagaa aattatacag gaaagatcca cttgtgtggg ttgattgcta ctgcttcgat 180
tgctttagaa tgtggtttgg acttgatctt tgtgaaggaa ccttacttct gtggtgtgac 240
ataattggac aaactaccta cagagattta aagctctaag gtaaatataa aatttttaag 300
tgtataatgt gttaaactac tgattctaat tgtttgtgta ttttag 346
<210> 33
<211> 93
<212> DNA
<213> Artificial Sequence
<220>
<223> SV40 intron
<400> 33
ctctaaggta aatataaaat ttttaagtgt ataatgtgtt aaactactga ttctaattgt 60
ttgtgtattt tagattccaa cctatggaac tga 93
<210> 34
<211> 77
<212> DNA
<213> Artificial Sequence
<220>
<223> Exemplary recombinogenic region sequence (AK)
<400> 34
gggattttgc cgatttcggc ctattggtta aaaaatgagc tgatttaaca aaaatttaac 60
gcgaatttta acaaaat 77
<210> 35
<211> 278
<212> DNA
<213> Artificial Sequence
<220>
<223> AP
<400> 35
gtgatcctag gtggaggccg aaagtacatg tttcgcatgg gaaccccaga ccctgagtac 60
ccagatgact acagccaagg tgggaccagg ctggacggga agaatctggt gcaggaatgg 120
ctggcgaagc gccagggtgc ccggtacgtg tggaaccgca ctgagctcat gcaggcttcc 180
ctggacccgt ctgtgaccca tctcatgggt ctctttgagc ctggagacat gaaatacgag 240
atccaccgag actccacact ggacccctcc ctgatgga 278
<210> 36
<211> 287
<212> DNA
<213> Artificial Sequence
<220>
<223> AP1
<400> 36
ccccgggtgc gcggcgtcgg tggtgccggc ggggggcgcc aggtcgcagg cggtgtaggg 60
ctccaggcag gcggcgaagg ccatgacgtg cgctatgaag gtctgctcct gcacgccgtg 120
aaccaggtgc gcctgcgggc cgcgcgcgaa caccgccacg tcctcgcctg cgtgggtctc 180
ttcgtccagg ggcactgctg actgctgccg atactcgggg ctcccgctct cgctctcggt 240
aacatccggc cgggcgccgt ccttgagcac atagcctgga ccgtttc 287
<210> 37
<211> 288
<212> DNA
<213> Artificial Sequence
<220>
<223> AP2
<400> 37
cgcagggcag cctctgtcat ctccatcagg gaggggtcca gtgtggagtc tcggtggatc 60
tcgtatttca tgtctccagg ctcaaagaga cccatgagat gggtcacaga cgggtccagg 120
gaagcctgca tgagctcagt gcggttccac acataccggg caccctggcg cttcgccagc 180
cattcctgca ccagattctt cccgtccagc ctggtcccac cttggctgta gtcatctggg 240
tactcagggt ctggggttcc catgcgaaac atgtactttc ggcctcca 288
<210> 38
<211> 261
<212> DNA
<213> Artificial Sequence
<220>
<223> Exemplary polyadenylation sequence
<400> 38
ttcgagcaga catgataaga tacattgatg agtttggaca aaccacaact agaatgcagt 60
gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc tttatttgta accattataa 120
gctgcaataa acaagttaac aacaacaatt gcattcattt tatgtttcag gttcaggggg 180
agatgtggga ggttttttaa agcaagtaaa acctctacaa atgtggtaaa atcgataagg 240
atcttcctag agcatggcta c 261
<210> 39
<211> 6648
<212> DNA
<213> Artificial Sequence
<220>
<223> example MYO7A nucleotide sequence
<400> 39
atggtgattc ttcagcaggg ggaccatgtg tggatggacc tgagattggg gcaggagttc 60
gacgtgccca tcggggcggt ggtgaagctc tgcgactctg ggcaggtcca ggtggtggat 120
gatgaagaca atgaacactg gatctctccg cagaacgcaa cgcacatcaa gcctatgcac 180
cccacgtcgg tccacggcgt ggaggacatg atccgcctgg gggacctcaa cgaggcgggc 240
atcttgcgca acctgcttat ccgctaccgg gaccacctca tctacacgta tacgggctcc 300
atcctggtgg ctgtgaaccc ctaccagctg ctctccatct actcgccaga gcacatccgc 360
cagtatacca acaagaagat tggggagatg cccccccaca tctttgccat tgctgacaac 420
tgctacttca acatgaaacg caacagccga gaccagtgct gcatcatcag tggggaatct 480
ggggccggga agacggagag cacaaagctg atcctgcagt tcctggcagc catcagtggg 540
cagcactcgt ggattgagca gcaggtcttg gaggccaccc ccattctgga agcatttggg 600
aatgccaaga ccatccgcaa tgacaactca agccgtttcg gaaagtacat cgacatccac 660
ttcaacaagc ggggcgccat cgagggcgcg aagattgagc agtacctgct ggaaaagtca 720
cgtgtctgtc gccaggccct ggatgaaagg aactaccacg tgttctactg catgctggag 780
ggtatgagtg aggatcagaa gaagaagctg ggcttgggcc aggcctctga ctacaactac 840
ttggccatgg gtaactgcat aacctgtgag ggccgggtgg acagccagga gtacgccaac 900
atccgctccg ccatgaaggt gctcatgttc actgacaccg agaactggga gatctcgaag 960
ctcctggctg ccatcctgca cctgggcaac ctgcagtatg aggcacgcac atttgaaaac 1020
ctggatgcct gtgaggttct cttctcccca tcgctggcca cagctgcatc cctgcttgag 1080
gtgaaccccc cagacctgat gagctgcctg actagccgca ccctcatcac ccgcggggag 1140
acggtgtcca ccccactgag cagggaacag gcactggacg tgcgcgacgc cttcgtaaag 1200
gggatctacg ggcggctgtt cgtgtggatt gtggacaaga tcaacgcagc aatttacaag 1260
cctccctccc aggatgtgaa gaactctcgc aggtccatcg gcctcctgga catctttggg 1320
tttgagaact ttgctgtgaa cagctttgag cagctctgca tcaacttcgc caatgagcac 1380
ctgcagcagt tctttgtgcg gcacgtgttc aagctggagc aggaggaata tgacctggag 1440
agcattgact ggctgcacat cgagttcact gacaaccagg atgccctgga catgattgcc 1500
aacaagccca tgaacatcat ctccctcatc gatgaggaga gcaagttccc caagggcaca 1560
gacaccacca tgttacacaa gctgaactcc cagcacaagc tcaacgccaa ctacatcccc 1620
cccaagaaca accatgagac ccagtttggc atcaaccatt ttgcaggcat cgtctactat 1680
gagacccaag gcttcctgga gaagaaccga gacaccctgc atggggacat tatccagctg 1740
gtccactcct ccaggaacaa gttcatcaag cagatcttcc aggccgatgt cgccatgggc 1800
gccgagacca ggaagcgctc gcccacactt agcagccagt tcaagcggtc actggagctg 1860
ctgatgcgca cgctgggtgc ctgccagccc ttctttgtgc gatgcatcaa gcccaatgag 1920
ttcaagaagc ccatgctgtt cgaccggcac ctgtgcgtgc gccagctgcg gtactcagga 1980
atgatggaga ccatccgaat ccgccgagct ggctacccca tccgctacag cttcgtagag 2040
tttgtggagc ggtaccgtgt gctgctgcca ggtgtgaagc cggcctacaa gcagggcgac 2100
ctccgcggga cttgccagcg catggctgag gctgtgctgg gcacccacga tgactggcag 2160
ataggcaaaa ccaagatctt tctgaaggac caccatgaca tgctgctgga agtggagcgg 2220
gacaaagcca tcaccgacag agtcatcctc cttcagaaag tcatccgggg attcaaagac 2280
aggtctaact ttctgaagct gaagaacgct gccacactga tccagaggca ctggcggggt 2340
cacaactgta ggaagaacta cgggctgatg cgtctgggct tcctgcggct gcaggccctg 2400
caccgctccc ggaagctgca ccagcagtac cgcctggccc gccagcgcat catccagttc 2460
caggcccgct gccgcgccta tctggtgcgc aaggccttcc gccaccgcct ctgggctgtg 2520
ctcaccgtgc aggcctatgc ccggggcatg atcgcccgca ggctgcacca acgcctcagg 2580
gctgagtatc tgtggcgcct cgaggctgag aaaatgcggc tggcggagga agagaagctt 2640
cggaaggaga tgagcgccaa gaaggccaag gaggaggccg agcgcaagca tcaggagcgc 2700
ctggcccagc tggctcgtga ggacgctgag cgggagctga aggagaagga ggccgctcgg 2760
cggaagaagg agctcctgga gcagatggaa agggcccgcc atgagcctgt caatcactca 2820
gacatggtgg acaagatgtt tggcttcctg gggacttcag gtggcctgcc aggccaggag 2880
ggccaggcac ctagtggctt tgaggacctg gagcgagggc ggagggagat ggtggaggag 2940
gacctggatg cagccctgcc cctgcctgac gaggatgagg aggacctctc tgagtataaa 3000
tttgccaagt tcgcggccac ctacttccag gggacaacca cgcactccta cacccggcgg 3060
ccactcaaac agccactgct ctaccatgac gacgagggtg accagctggc agccctggcg 3120
gtctggatca ccatcctccg cttcatgggg gacctccctg agcccaagta ccacacagcc 3180
atgagtgatg gcagtgagaa gatccctgtg atgaccaaga tttatgagac cctgggcaag 3240
aagacgtaca agagggagct gcaggccctg cagggcgagg gcgaggccca gctccccgag 3300
ggccagaaga agagcagtgt gaggcacaag ctggtgcatt tgactctgaa aaagaagtcc 3360
aagctcacag aggaggtgac caagaggctg catgacgggg agtccacagt gcagggcaac 3420
agcatgctgg aggaccggcc cacctccaac ctggagaagc tgcacttcat catcggcaat 3480
ggcatcctgc ggccagcact ccgggacgag atctactgcc agatcagcaa gcagctgacc 3540
cacaacccct ccaagagcag ctatgcccgg ggctggattc tcgtgtctct ctgcgtgggc 3600
tgtttcgccc cctccgagaa gtttgtcaag tacctgcgga acttcatcca cgggggcccg 3660
cccggctacg ccccgtactg tgaggagcgc ctgagaagga cctttgtcaa tgggacacgg 3720
acacagccgc ccagctggct ggagctgcag gccaccaagt ccaagaagcc aatcatgttg 3780
cccgtgacat tcatggatgg gaccaccaag accctgctga cggactcggc aaccacggcc 3840
aaggagctct gcaacgcgct ggccgacaag atctctctca aggaccggtt cgggttctcc 3900
ctctacattg ccctgtttga caaggtgtcc tccctgggca gcggcagtga ccacgtcatg 3960
gacgccatct cccagtgcga gcagtacgcc aaggagcagg gcgcccagga gcgcaacgcc 4020
ccctggaggc tcttcttccg caaagaggtc ttcacgccct ggcacagccc ctccgaggac 4080
aacgtggcca ccaacctcat ctaccagcag gtggtgcgag gagtcaagtt tggggagtac 4140
aggtgtgaga aggaggacga cctggctgag ctggcctccc agcagtactt tgtagactat 4200
ggctctgaga tgatcctgga gcgcctcctg aacctcgtgc ccacctacat ccccgaccgc 4260
gagatcacgc ccctgaagac gctggagaag tgggcccagc tggccatcgc cgcccacaag 4320
aaggggattt atgcccagag gagaactgat gcccagaagg tcaaagagga tgtggtcagt 4380
tatgcccgct tcaagtggcc cttgctcttc tccaggtttt atgaagccta caaattctca 4440
ggccccagtc tccccaagaa cgacgtcatc gtggccgtca actggacggg tgtgtacttt 4500
gtggatgagc aggagcaggt acttctggag ctgtccttcc cagagatcat ggccgtgtcc 4560
agcagcaggg agtgccgtgt ctggctctca ctgggctgct ctgatcttgg ctgtgctgcg 4620
cctcactcag gctgggcagg actgaccccg gcggggccct gttctccgtg ttggtcctgc 4680
aggggagcga aaacgacggc ccccagcttc acgctggcca ccatcaaggg ggacgaatac 4740
accttcacct ccagcaatgc tgaggacatt cgtgacctgg tggtcacctt cctagagggg 4800
ctccggaaga gatctaagta tgttgtggcc ctgcaggata accccaaccc cgcaggcgag 4860
gagtcaggct tcctcagctt tgccaaggga gacctcatca tcctggacca tgacacgggc 4920
gagcaggtca tgaactcggg ctgggccaac ggcatcaatg agaggaccaa gcagcgtggg 4980
gacttcccca ccgacagtgt gtacgtcatg cccactgtca ccatgccacc gcgggagatt 5040
gtggccctgg tcaccatgac tcccgatcag aggcaggacg ttgtccggct cttgcagctg 5100
cgaacggcgg agcccgaggt gcgtgccaag ccctacacgc tggaggagtt ttcctatgac 5160
tacttcaggc ccccacccaa gcacacgctg agccgtgtca tggtgtccaa ggcccgaggc 5220
aaggaccggc tgtggagcca cacgcgggaa ccgctcaagc aggcgctgct caagaagctc 5280
ctgggcagtg aggagctctc gcaggaggcc tgcctggcct tcattgctgt gctcaagtac 5340
atgggcgact acccgtccaa gaggacacgc tccgtcaacg agctcaccga ccagatcttt 5400
gagggtcccc tgaaagccga gcccctgaag gacgaggcat atgtgcagat cctgaagcag 5460
ctgaccgaca accacatcag gtacagcgag gagcggggtt gggagctgct ctggctgtgc 5520
acgggccttt tcccacccag caacatcctc ctgccccacg tgcagcgctt cctgcagtcc 5580
cgaaagcact gcccactcgc catcgactgc ctgcaacggc tccagaaagc cctgagaaac 5640
gggtcccgga agtaccctcc gcacctggtg gaggtggagg ccatccagca caagaccacc 5700
cagattttcc acaaagtcta cttccctgat gacactgacg aggccttcga agtggagtcc 5760
agcaccaagg ccaaggactt ctgccagaac atcgccacca ggctgctcct caagtcctca 5820
gagggattca gcctctttgt caaaattgca gacaaggtcc tcagcgttcc tgagaatgac 5880
ttcttctttg actttgttcg acacttgaca gactggataa agaaagctcg gcccatcaag 5940
gacggaattg tgccctcact cacctaccag gtgttcttca tgaagaagct gtggaccacc 6000
acggtgccag ggaaggatcc catggccgat tccatcttcc actattacca ggagttgccc 6060
aagtatctcc gaggctacca caagtgcacg cgggaggagg tgctgcagct gggggcgctg 6120
atctacaggg tcaagttcga ggaggacaag tcctacttcc ccagcatccc caagctgctg 6180
cgggagctgg tgccccagga ccttatccgg caggtctcac ctgatgactg gaagcggtcc 6240
atcgtcgcct acttcaacaa gcacgcaggg aagtccaagg aggaggccaa gctggccttc 6300
ctgaagctca tcttcaagtg gcccaccttt ggctcagcct tcttcgaggt gaagcaaact 6360
acggagccaa acttccctga gatcctccta attgccatca acaagtatgg ggtcagcctc 6420
atcgatccca aaacgaagga tatcctcacc actcatccct tcaccaagat ctccaactgg 6480
agcagcggca acacctactt ccacatcacc attgggaact tggtgcgcgg gagcaaactg 6540
ctctgcgaga cgtcactggg ctacaagatg gatgacctcc tgacttccta cattagccag 6600
atgctcacag ccatgagcaa acagcggggc tccaggagcg gcaagtga 6648
<210> 40
<211> 3108
<212> DNA
<213> Artificial Sequence
<220>
<223> example 5' end portion of a MYO7A transgene
<400> 40
atggtgattc ttcagcaggg ggaccatgtg tggatggacc tgagattggg gcaggagttc 60
gacgtgccca tcggggcggt ggtgaagctc tgcgactctg ggcaggtcca ggtggtggat 120
gatgaagaca atgaacactg gatctctccg cagaacgcaa cgcacatcaa gcctatgcac 180
cccacgtcgg tccacggcgt ggaggacatg atccgcctgg gggacctcaa cgaggcgggc 240
atcttgcgca acctgcttat ccgctaccgg gaccacctca tctacacgta tacgggctcc 300
atcctggtgg ctgtgaaccc ctaccagctg ctctccatct actcgccaga gcacatccgc 360
cagtatacca acaagaagat tggggagatg cccccccaca tctttgccat tgctgacaac 420
tgctacttca acatgaaacg caacagccga gaccagtgct gcatcatcag tggggaatct 480
ggggccggga agacggagag cacaaagctg atcctgcagt tcctggcagc catcagtggg 540
cagcactcgt ggattgagca gcaggtcttg gaggccaccc ccattctgga agcatttggg 600
aatgccaaga ccatccgcaa tgacaactca agccgtttcg gaaagtacat cgacatccac 660
ttcaacaagc ggggcgccat cgagggcgcg aagattgagc agtacctgct ggaaaagtca 720
cgtgtctgtc gccaggccct ggatgaaagg aactaccacg tgttctactg catgctggag 780
ggtatgagtg aggatcagaa gaagaagctg ggcttgggcc aggcctctga ctacaactac 840
ttggccatgg gtaactgcat aacctgtgag ggccgggtgg acagccagga gtacgccaac 900
atccgctccg ccatgaaggt gctcatgttc actgacaccg agaactggga gatctcgaag 960
ctcctggctg ccatcctgca cctgggcaac ctgcagtatg aggcacgcac atttgaaaac 1020
ctggatgcct gtgaggttct cttctcccca tcgctggcca cagctgcatc cctgcttgag 1080
gtgaaccccc cagacctgat gagctgcctg actagccgca ccctcatcac ccgcggggag 1140
acggtgtcca ccccactgag cagggaacag gcactggacg tgcgcgacgc cttcgtaaag 1200
gggatctacg ggcggctgtt cgtgtggatt gtggacaaga tcaacgcagc aatttacaag 1260
cctccctccc aggatgtgaa gaactctcgc aggtccatcg gcctcctgga catctttggg 1320
tttgagaact ttgctgtgaa cagctttgag cagctctgca tcaacttcgc caatgagcac 1380
ctgcagcagt tctttgtgcg gcacgtgttc aagctggagc aggaggaata tgacctggag 1440
agcattgact ggctgcacat cgagttcact gacaaccagg atgccctgga catgattgcc 1500
aacaagccca tgaacatcat ctccctcatc gatgaggaga gcaagttccc caagggcaca 1560
gacaccacca tgttacacaa gctgaactcc cagcacaagc tcaacgccaa ctacatcccc 1620
cccaagaaca accatgagac ccagtttggc atcaaccatt ttgcaggcat cgtctactat 1680
gagacccaag gcttcctgga gaagaaccga gacaccctgc atggggacat tatccagctg 1740
gtccactcct ccaggaacaa gttcatcaag cagatcttcc aggccgatgt cgccatgggc 1800
gccgagacca ggaagcgctc gcccacactt agcagccagt tcaagcggtc actggagctg 1860
ctgatgcgca cgctgggtgc ctgccagccc ttctttgtgc gatgcatcaa gcccaatgag 1920
ttcaagaagc ccatgctgtt cgaccggcac ctgtgcgtgc gccagctgcg gtactcagga 1980
atgatggaga ccatccgaat ccgccgagct ggctacccca tccgctacag cttcgtagag 2040
tttgtggagc ggtaccgtgt gctgctgcca ggtgtgaagc cggcctacaa gcagggcgac 2100
ctccgcggga cttgccagcg catggctgag gctgtgctgg gcacccacga tgactggcag 2160
ataggcaaaa ccaagatctt tctgaaggac caccatgaca tgctgctgga agtggagcgg 2220
gacaaagcca tcaccgacag agtcatcctc cttcagaaag tcatccgggg attcaaagac 2280
aggtctaact ttctgaagct gaagaacgct gccacactga tccagaggca ctggcggggt 2340
cacaactgta ggaagaacta cgggctgatg cgtctgggct tcctgcggct gcaggccctg 2400
caccgctccc ggaagctgca ccagcagtac cgcctggccc gccagcgcat catccagttc 2460
caggcccgct gccgcgccta tctggtgcgc aaggccttcc gccaccgcct ctgggctgtg 2520
ctcaccgtgc aggcctatgc ccggggcatg atcgcccgca ggctgcacca acgcctcagg 2580
gctgagtatc tgtggcgcct cgaggctgag aaaatgcggc tggcggagga agagaagctt 2640
cggaaggaga tgagcgccaa gaaggccaag gaggaggccg agcgcaagca tcaggagcgc 2700
ctggcccagc tggctcgtga ggacgctgag cgggagctga aggagaagga ggccgctcgg 2760
cggaagaagg agctcctgga gcagatggaa agggcccgcc atgagcctgt caatcactca 2820
gacatggtgg acaagatgtt tggcttcctg gggacttcag gtggcctgcc aggccaggag 2880
ggccaggcac ctagtggctt tgaggacctg gagcgagggc ggagggagat ggtggaggag 2940
gacctggatg cagccctgcc cctgcctgac gaggatgagg aggacctctc tgagtataaa 3000
tttgccaagt tcgcggccac ctacttccag gggacaacca cgcactccta cacccggcgg 3060
ccactcaaac agccactgct ctaccatgac gacgagggtg accagctg 3108
<210> 41
<211> 3540
<212> DNA
<213> Artificial Sequence
<220>
<223> example 3' end portion of a MYO7A transgene
<400> 41
gcagccctgg cggtctggat caccatcctc cgcttcatgg gggacctccc tgagcccaag 60
taccacacag ccatgagtga tggcagtgag aagatccctg tgatgaccaa gatttatgag 120
accctgggca agaagacgta caagagggag ctgcaggccc tgcagggcga gggcgaggcc 180
cagctccccg agggccagaa gaagagcagt gtgaggcaca agctggtgca tttgactctg 240
aaaaagaagt ccaagctcac agaggaggtg accaagaggc tgcatgacgg ggagtccaca 300
gtgcagggca acagcatgct ggaggaccgg cccacctcca acctggagaa gctgcacttc 360
atcatcggca atggcatcct gcggccagca ctccgggacg agatctactg ccagatcagc 420
aagcagctga cccacaaccc ctccaagagc agctatgccc ggggctggat tctcgtgtct 480
ctctgcgtgg gctgtttcgc cccctccgag aagtttgtca agtacctgcg gaacttcatc 540
cacgggggcc cgcccggcta cgccccgtac tgtgaggagc gcctgagaag gacctttgtc 600
aatgggacac ggacacagcc gcccagctgg ctggagctgc aggccaccaa gtccaagaag 660
ccaatcatgt tgcccgtgac attcatggat gggaccacca agaccctgct gacggactcg 720
gcaaccacgg ccaaggagct ctgcaacgcg ctggccgaca agatctctct caaggaccgg 780
ttcgggttct ccctctacat tgccctgttt gacaaggtgt cctccctggg cagcggcagt 840
gaccacgtca tggacgccat ctcccagtgc gagcagtacg ccaaggagca gggcgcccag 900
gagcgcaacg ccccctggag gctcttcttc cgcaaagagg tcttcacgcc ctggcacagc 960
ccctccgagg acaacgtggc caccaacctc atctaccagc aggtggtgcg aggagtcaag 1020
tttggggagt acaggtgtga gaaggaggac gacctggctg agctggcctc ccagcagtac 1080
tttgtagact atggctctga gatgatcctg gagcgcctcc tgaacctcgt gcccacctac 1140
atccccgacc gcgagatcac gcccctgaag acgctggaga agtgggccca gctggccatc 1200
gccgcccaca agaaggggat ttatgcccag aggagaactg atgcccagaa ggtcaaagag 1260
gatgtggtca gttatgcccg cttcaagtgg cccttgctct tctccaggtt ttatgaagcc 1320
tacaaattct caggccccag tctccccaag aacgacgtca tcgtggccgt caactggacg 1380
ggtgtgtact ttgtggatga gcaggagcag gtacttctgg agctgtcctt cccagagatc 1440
atggccgtgt ccagcagcag ggagtgccgt gtctggctct cactgggctg ctctgatctt 1500
ggctgtgctg cgcctcactc aggctgggca ggactgaccc cggcggggcc ctgttctccg 1560
tgttggtcct gcaggggagc gaaaacgacg gcccccagct tcacgctggc caccatcaag 1620
ggggacgaat acaccttcac ctccagcaat gctgaggaca ttcgtgacct ggtggtcacc 1680
ttcctagagg ggctccggaa gagatctaag tatgttgtgg ccctgcagga taaccccaac 1740
cccgcaggcg aggagtcagg cttcctcagc tttgccaagg gagacctcat catcctggac 1800
catgacacgg gcgagcaggt catgaactcg ggctgggcca acggcatcaa tgagaggacc 1860
aagcagcgtg gggacttccc caccgacagt gtgtacgtca tgcccactgt caccatgcca 1920
ccgcgggaga ttgtggccct ggtcaccatg actcccgatc agaggcagga cgttgtccgg 1980
ctcttgcagc tgcgaacggc ggagcccgag gtgcgtgcca agccctacac gctggaggag 2040
ttttcctatg actacttcag gcccccaccc aagcacacgc tgagccgtgt catggtgtcc 2100
aaggcccgag gcaaggaccg gctgtggagc cacacgcggg aaccgctcaa gcaggcgctg 2160
ctcaagaagc tcctgggcag tgaggagctc tcgcaggagg cctgcctggc cttcattgct 2220
gtgctcaagt acatgggcga ctacccgtcc aagaggacac gctccgtcaa cgagctcacc 2280
gaccagatct ttgagggtcc cctgaaagcc gagcccctga aggacgaggc atatgtgcag 2340
atcctgaagc agctgaccga caaccacatc aggtacagcg aggagcgggg ttgggagctg 2400
ctctggctgt gcacgggcct tttcccaccc agcaacatcc tcctgcccca cgtgcagcgc 2460
ttcctgcagt cccgaaagca ctgcccactc gccatcgact gcctgcaacg gctccagaaa 2520
gccctgagaa acgggtcccg gaagtaccct ccgcacctgg tggaggtgga ggccatccag 2580
cacaagacca cccagatttt ccacaaagtc tacttccctg atgacactga cgaggccttc 2640
gaagtggagt ccagcaccaa ggccaaggac ttctgccaga acatcgccac caggctgctc 2700
ctcaagtcct cagagggatt cagcctcttt gtcaaaattg cagacaaggt cctcagcgtt 2760
cctgagaatg acttcttctt tgactttgtt cgacacttga cagactggat aaagaaagct 2820
cggcccatca aggacggaat tgtgccctca ctcacctacc aggtgttctt catgaagaag 2880
ctgtggacca ccacggtgcc agggaaggat cccatggccg attccatctt ccactattac 2940
caggagttgc ccaagtatct ccgaggctac cacaagtgca cgcgggagga ggtgctgcag 3000
ctgggggcgc tgatctacag ggtcaagttc gaggaggaca agtcctactt ccccagcatc 3060
cccaagctgc tgcgggagct ggtgccccag gaccttatcc ggcaggtctc acctgatgac 3120
tggaagcggt ccatcgtcgc ctacttcaac aagcacgcag ggaagtccaa ggaggaggcc 3180
aagctggcct tcctgaagct catcttcaag tggcccacct ttggctcagc cttcttcgag 3240
gtgaagcaaa ctacggagcc aaacttccct gagatcctcc taattgccat caacaagtat 3300
ggggtcagcc tcatcgatcc caaaacgaag gatatcctca ccactcatcc cttcaccaag 3360
atctccaact ggagcagcgg caacacctac ttccacatca ccattgggaa cttggtgcgc 3420
gggagcaaac tgctctgcga gacgtcactg ggctacaaga tggatgacct cctgacttcc 3480
tacattagcc agatgctcac agccatgagc aaacagcggg gctccaggag cggcaagtga 3540
<210> 42
<211> 6822
<212> DNA
<213> Artificial Sequence
<220>
<223> example ABCA4 nucleotide sequence
<400> 42
atgggcttcg tgagacagat acagcttttg ctctggaaga actggaccct gcggaaaagg 60
caaaagattc gctttgtggt ggaactcgtg tggcctttat ctttatttct ggtcttgatc 120
tggttaagga atgccaaccc gctctacagc catcatgaat gccatttccc caacaaggcg 180
atgccctcag caggaatgct gccgtggctc caggggatct tctgcaatgt gaacaatccc 240
tgttttcaaa gccccacccc aggagaatct cctggaattg tgtcaaacta taacaactcc 300
atcttggcaa gggtatatcg agattttcaa gaactcctca tgaatgcacc agagagccag 360
caccttggcc gtatttggac agagctacac atcttgtccc aattcatgga caccctccgg 420
actcacccgg agagaattgc aggaagagga attcgaataa gggatatctt gaaagatgaa 480
gaaacactga cactatttct cattaaaaac atcggcctgt ctgactcagt ggtctacctt 540
ctgatcaact ctcaagtccg tccagagcag ttcgctcatg gagtcccgga cctggcgctg 600
aaggacatcg cctgcagcga ggccctcctg gagcgcttca tcatcttcag ccagagacgc 660
ggggcaaaga cggtgcgcta tgccctgtgc tccctctccc agggcaccct acagtggata 720
gaagacactc tgtatgccaa cgtggacttc ttcaagctct tccgtgtgct tcccacactc 780
ctagacagcc gttctcaagg tatcaatctg agatcttggg gaggaatatt atctgatatg 840
tcaccaagaa ttcaagagtt tatccatcgg ccgagtatgc aggacttgct gtgggtgacc 900
aggcccctca tgcagaatgg tggtccagag acctttacaa agctgatggg catcctgtct 960
gacctcctgt gtggctaccc cgagggaggt ggctctcggg tgctctcctt caactggtat 1020
gaagacaata actataaggc ctttctgggg attgactcca caaggaagga tcctatctat 1080
tcttatgaca gaagaacaac atccttttgt aatgcattga tccagagcct ggagtcaaat 1140
cctttaacca aaatcgcttg gagggcggca aagcctttgc tgatgggaaa aatcctgtac 1200
actcctgatt cacctgcagc acgaaggata ctgaagaatg ccaactcaac ttttgaagaa 1260
ctggaacacg ttaggaagtt ggtcaaagcc tgggaagaag tagggcccca gatctggtac 1320
ttctttgaca acagcacaca gatgaacatg atcagagata ccctggggaa cccaacagta 1380
aaagactttt tgaataggca gcttggtgaa gaaggtatta ctgctgaagc catcctaaac 1440
ttcctctaca agggccctcg ggaaagccag gctgacgaca tggccaactt cgactggagg 1500
gacatattta acatcactga tcgcaccctc cgccttgtca atcaatacct ggagtgcttg 1560
gtcctggata agtttgaaag ctacaatgat gaaactcagc tcacccaacg tgccctctct 1620
ctactggagg aaaacatgtt ctgggccgga gtggtattcc ctgacatgta tccctggacc 1680
agctctctac caccccacgt gaagtataag atccgaatgg acatagacgt ggtggagaaa 1740
accaataaga ttaaagacag gtattgggat tctggtccca gagctgatcc cgtggaagat 1800
ttccggtaca tctggggcgg gtttgcctat ctgcaggaca tggttgaaca ggggatcaca 1860
aggagccagg tgcaggcgga ggctccagtt ggaatctacc tccagcagat gccctacccc 1920
tgcttcgtgg acgattcttt catgatcatc ctgaaccgct gtttccctat cttcatggtg 1980
ctggcatgga tctactctgt ctccatgact gtgaagagca tcgtcttgga gaaggagttg 2040
cgactgaagg agaccttgaa aaatcagggt gtctccaatg cagtgatttg gtgtacctgg 2100
ttcctggaca gcttctccat catgtcgatg agcatcttcc tcctgacgat attcatcatg 2160
catggaagaa tcctacatta cagcgaccca ttcatcctct tcctgttctt gttggctttc 2220
tccactgcca ccatcatgct gtgctttctg ctcagcacct tcttctccaa ggccagtctg 2280
gcagcagcct gtagtggtgt catctatttc accctctacc tgccacacat cctgtgcttc 2340
gcctggcagg accgcatgac cgctgagctg aagaaggctg tgagcttact gtctccggtg 2400
gcatttggat ttggcactga gtacctggtt cgctttgaag agcaaggcct ggggctgcag 2460
tggagcaaca tcgggaacag tcccacggaa ggggacgaat tcagcttcct gctgtccatg 2520
cagatgatgc tccttgatgc tgctgtctat ggcttactcg cttggtacct tgatcaggtg 2580
tttccaggag actatggaac cccacttcct tggtactttc ttctacaaga gtcgtattgg 2640
cttggcggtg aagggtgttc aaccagagaa gaaagagccc tggaaaagac cgagccccta 2700
acagaggaaa cggaggatcc agagcaccca gaaggaatac acgactcctt ctttgaacgt 2760
gagcatccag ggtgggttcc tggggtatgc gtgaagaatc tggtaaagat ttttgagccc 2820
tgtggccggc cagctgtgga ccgtctgaac atcaccttct acgagaacca gatcaccgca 2880
ttcctgggcc acaatggagc tgggaaaacc accaccttgt ccatcctgac gggtctgttg 2940
ccaccaacct ctgggactgt gctcgttggg ggaagggaca ttgaaaccag cctggatgca 3000
gtccggcaga gccttggcat gtgtccacag cacaacatcc tgttccacca cctcacggtg 3060
gctgagcaca tgctgttcta tgcccagctg aaaggaaagt cccaggagga ggcccagctg 3120
gagatggaag ccatgttgga ggacacaggc ctccaccaca agcggaatga agaggctcag 3180
gacctatcag gtggcatgca gagaaagctg tcggttgcca ttgcctttgt gggagatgcc 3240
aaggtggtga ttctggacga acccacctct ggggtggacc cttactcgag acgctcaatc 3300
tgggatctgc tcctgaagta tcgctcaggc agaaccatca tcatgtccac tcaccacatg 3360
gacgaggccg acctccttgg ggaccgcatt gccatcattg cccagggaag gctctactgc 3420
tcaggcaccc cactcttcct gaagaactgc tttggcacag gcttgtactt aaccttggtg 3480
cgcaagatga aaaacatcca gagccaaagg aaaggcagtg aggggacctg cagctgctcg 3540
tctaagggtt tctccaccac gtgtccagcc cacgtcgatg acctaactcc agaacaagtc 3600
ctggatgggg atgtaaatga gctgatggat gtagttctcc accatgttcc agaggcaaag 3660
ctggtggagt gcattggtca agaacttatc ttccttcttc caaataagaa cttcaagcac 3720
agagcatatg ccagcctttt cagagagctg gaggagacgc tggctgacct tggtctcagc 3780
agttttggaa tttctgacac tcccctggaa gagatttttc tgaaggtcac ggaggattct 3840
gattcaggac ctctgtttgc gggtggcgct cagcagaaaa gagaaaacgt caacccccga 3900
cacccctgct tgggtcccag agagaaggct ggacagacac cccaggactc caatgtctgc 3960
tccccagggg cgccggctgc tcacccagag ggccagcctc ccccagagcc agagtgccca 4020
ggcccgcagc tcaacacggg gacacagctg gtcctccagc atgtgcaggc gctgctggtc 4080
aagagattcc aacacaccat ccgcagccac aaggacttcc tggcgcagat cgtgctcccg 4140
gctacctttg tgtttttggc tctgatgctt tctattgtta tccctccttt tggcgaatac 4200
cccgctttga cccttcaccc ctggatatat gggcagcagt acaccttctt cagcatggat 4260
gaaccaggca gtgagcagtt cacggtactt gcagacgtcc tcctgaataa gccaggcttt 4320
ggcaaccgct gcctgaagga agggtggctt ccggagtacc cctgtggcaa ctcaacaccc 4380
tggaagactc cttctgtgtc cccaaacatc acccagctgt tccagaagca gaaatggaca 4440
caggtcaacc cttcaccatc ctgcaggtgc agcaccaggg agaagctcac catgctgcca 4500
gagtgccccg agggtgccgg gggcctcccg cccccccaga gaacacagcg cagcacggaa 4560
attctacaag acctgacgga caggaacatc tccgacttct tggtaaaaac gtatcctgct 4620
cttataagaa gcagcttaaa gagcaaattc tgggtcaatg aacagaggta tggaggaatt 4680
tccattggag gaaagctccc agtcgtcccc atcacggggg aagcacttgt tgggttttta 4740
agcgaccttg gccggatcat gaatgtgagc gggggcccta tcactagaga ggcctctaaa 4800
gaaatacctg atttccttaa acatctagaa actgaagaca acattaaggt gtggtttaat 4860
aacaaaggct ggcatgccct ggtcagcttt ctcaatgtgg cccacaacgc catcttacgg 4920
gccagcctgc ctaaggacag aagccccgag gagtatggaa tcaccgtcat tagccaaccc 4980
ctgaacctga ccaaggagca gctctcagag attacagtgc tgaccacttc agtggatgct 5040
gtggttgcca tctgcgtgat tttctccatg tccttcgtcc cagccagctt tgtcctttat 5100
ttgatccagg agcgggtgaa caaatccaag cacctccagt ttatcagtgg agtgagcccc 5160
accacctact gggtaaccaa cttcctctgg gacatcatga attattccgt gagtgctggg 5220
ctggtggtgg gcatcttcat cgggtttcag aagaaagcct acacttctcc agaaaacctt 5280
cctgcccttg tggcactgct cctgctgtat ggatgggcgg tcattcccat gatgtaccca 5340
gcatccttcc tgtttgatgt ccccagcaca gcctatgtgg ctttatcttg tgctaatctg 5400
ttcatcggca tcaacagcag tgctattacc ttcatcttgg aattatttga gaataaccgg 5460
acgctgctca ggttcaacgc cgtgctgagg aagctgctca ttgtcttccc ccacttctgc 5520
ctgggccggg gcctcattga ccttgcactg agccaggctg tgacagatgt ctatgcccgg 5580
tttggtgagg agcactctgc aaatccgttc cactgggacc tgattgggaa gaacctgttt 5640
gccatggtgg tggaaggggt ggtgtacttc ctcctgaccc tgctggtcca gcgccacttc 5700
ttcctctccc aatggattgc cgagcccact aaggagccca ttgttgatga agatgatgat 5760
gtggctgaag aaagacaaag aattattact ggtggaaata aaactgacat cttaaggcta 5820
catgaactaa ccaagattta tccaggcacc tccagcccag cagtggacag gctgtgtgtc 5880
ggagttcgcc ctggagagtg ctttggcctc ctgggagtga atggtgccgg caaaacaacc 5940
acattcaaga tgctcactgg ggacaccaca gtgacctcag gggatgccac cgtagcaggc 6000
aagagtattt taaccaatat ttctgaagtc catcaaaata tgggctactg tcctcagttt 6060
gatgcaatcg atgagctgct cacaggacga gaacatcttt acctttatgc ccggcttcga 6120
ggtgtaccag cagaagaaat cgaaaaggtt gcaaactgga gtattaagag cctgggcctg 6180
actgtctacg ccgactgcct ggctggcacg tacagtgggg gcaacaagcg gaaactctcc 6240
acagccatcg cactcattgg ctgcccaccg ctggtgctgc tggatgagcc caccacaggg 6300
atggaccccc aggcacgccg catgctgtgg aacgtcatcg tgagcatcat cagagaaggg 6360
agggctgtgg tcctcacatc ccacagcatg gaagaatgtg aggcactgtg tacccggctg 6420
gccatcatgg taaagggcgc ctttcgatgt atgggcacca ttcagcatct caagtccaaa 6480
tttggagatg gctatatcgt cacaatgaag atcaaatccc cgaaggacga cctgcttcct 6540
gacctgaacc ctgtggagca gttcttccag gggaacttcc caggcagtgt gcagagggag 6600
aggcactaca acatgctcca gttccaggtc tcctcctcct ccctggcgag gatcttccag 6660
ctcctcctct cccacaagga cagcctgctc atcgaggagt actcagtcac acagaccaca 6720
ctggaccagg tgtttgtaaa ttttgctaaa cagcagactg aaagtcatga cctccctctg 6780
caccctcgag ctgctggagc cagtcgacaa gcccaggact ga 6822
<210> 43
<211> 2918
<212> DNA
<213> Artificial Sequence
<220>
<223> example 5' end portion of a ABCA4 transgene
<400> 43
atgggcttcg tgagacagat acagcttttg ctctggaaga actggaccct gcggaaaagg 60
caaaagattc gctttgtggt ggaactcgtg tggcctttat ctttatttct ggtcttgatc 120
tggttaagga atgccaaccc gctctacagc catcatgaat gccatttccc caacaaggcg 180
atgccctcag caggaatgct gccgtggctc caggggatct tctgcaatgt gaacaatccc 240
tgttttcaaa gccccacccc aggagaatct cctggaattg tgtcaaacta taacaactcc 300
atcttggcaa gggtatatcg agattttcaa gaactcctca tgaatgcacc agagagccag 360
caccttggcc gtatttggac agagctacac atcttgtccc aattcatgga caccctccgg 420
actcacccgg agagaattgc aggaagagga attcgaataa gggatatctt gaaagatgaa 480
gaaacactga cactatttct cattaaaaac atcggcctgt ctgactcagt ggtctacctt 540
ctgatcaact ctcaagtccg tccagagcag ttcgctcatg gagtcccgga cctggcgctg 600
aaggacatcg cctgcagcga ggccctcctg gagcgcttca tcatcttcag ccagagacgc 660
ggggcaaaga cggtgcgcta tgccctgtgc tccctctccc agggcaccct acagtggata 720
gaagacactc tgtatgccaa cgtggacttc ttcaagctct tccgtgtgct tcccacactc 780
ctagacagcc gttctcaagg tatcaatctg agatcttggg gaggaatatt atctgatatg 840
tcaccaagaa ttcaagagtt tatccatcgg ccgagtatgc aggacttgct gtgggtgacc 900
aggcccctca tgcagaatgg tggtccagag acctttacaa agctgatggg catcctgtct 960
gacctcctgt gtggctaccc cgagggaggt ggctctcggg tgctctcctt caactggtat 1020
gaagacaata actataaggc ctttctgggg attgactcca caaggaagga tcctatctat 1080
tcttatgaca gaagaacaac atccttttgt aatgcattga tccagagcct ggagtcaaat 1140
cctttaacca aaatcgcttg gagggcggca aagcctttgc tgatgggaaa aatcctgtac 1200
actcctgatt cacctgcagc acgaaggata ctgaagaatg ccaactcaac ttttgaagaa 1260
ctggaacacg ttaggaagtt ggtcaaagcc tgggaagaag tagggcccca gatctggtac 1320
ttctttgaca acagcacaca gatgaacatg atcagagata ccctggggaa cccaacagta 1380
aaagactttt tgaataggca gcttggtgaa gaaggtatta ctgctgaagc catcctaaac 1440
ttcctctaca agggccctcg ggaaagccag gctgacgaca tggccaactt cgactggagg 1500
gacatattta acatcactga tcgcaccctc cgccttgtca atcaatacct ggagtgcttg 1560
gtcctggata agtttgaaag ctacaatgat gaaactcagc tcacccaacg tgccctctct 1620
ctactggagg aaaacatgtt ctgggccgga gtggtattcc ctgacatgta tccctggacc 1680
agctctctac caccccacgt gaagtataag atccgaatgg acatagacgt ggtggagaaa 1740
accaataaga ttaaagacag gtattgggat tctggtccca gagctgatcc cgtggaagat 1800
ttccggtaca tctggggcgg gtttgcctat ctgcaggaca tggttgaaca ggggatcaca 1860
aggagccagg tgcaggcgga ggctccagtt ggaatctacc tccagcagat gccctacccc 1920
tgcttcgtgg acgattcttt catgatcatc ctgaaccgct gtttccctat cttcatggtg 1980
ctggcatgga tctactctgt ctccatgact gtgaagagca tcgtcttgga gaaggagttg 2040
cgactgaagg agaccttgaa aaatcagggt gtctccaatg cagtgatttg gtgtacctgg 2100
ttcctggaca gcttctccat catgtcgatg agcatcttcc tcctgacgat attcatcatg 2160
catggaagaa tcctacatta cagcgaccca ttcatcctct tcctgttctt gttggctttc 2220
tccactgcca ccatcatgct gtgctttctg ctcagcacct tcttctccaa ggccagtctg 2280
gcagcagcct gtagtggtgt catctatttc accctctacc tgccacacat cctgtgcttc 2340
gcctggcagg accgcatgac cgctgagctg aagaaggctg tgagcttact gtctccggtg 2400
gcatttggat ttggcactga gtacctggtt cgctttgaag agcaaggcct ggggctgcag 2460
tggagcaaca tcgggaacag tcccacggaa ggggacgaat tcagcttcct gctgtccatg 2520
cagatgatgc tccttgatgc tgctgtctat ggcttactcg cttggtacct tgatcaggtg 2580
tttccaggag actatggaac cccacttcct tggtactttc ttctacaaga gtcgtattgg 2640
cttggcggtg aagggtgttc aaccagagaa gaaagagccc tggaaaagac cgagccccta 2700
acagaggaaa cggaggatcc agagcaccca gaaggaatac acgactcctt ctttgaacgt 2760
gagcatccag ggtgggttcc tggggtatgc gtgaagaatc tggtaaagat ttttgagccc 2820
tgtggccggc cagctgtgga ccgtctgaac atcaccttct acgagaacca gatcaccgca 2880
ttcctgggcc acaatggagc tgggaaaacc accacctt 2918
<210> 44
<211> 3904
<212> DNA
<213> Artificial Sequence
<220>
<223> example 3' end portion of a ABCA4 transgene
<400> 44
gtccatcctg acgggtctgt tgccaccaac ctctgggact gtgctcgttg ggggaaggga 60
cattgaaacc agcctggatg cagtccggca gagccttggc atgtgtccac agcacaacat 120
cctgttccac cacctcacgg tggctgagca catgctgttc tatgcccagc tgaaaggaaa 180
gtcccaggag gaggcccagc tggagatgga agccatgttg gaggacacag gcctccacca 240
caagcggaat gaagaggctc aggacctatc aggtggcatg cagagaaagc tgtcggttgc 300
cattgccttt gtgggagatg ccaaggtggt gattctggac gaacccacct ctggggtgga 360
cccttactcg agacgctcaa tctgggatct gctcctgaag tatcgctcag gcagaaccat 420
catcatgtcc actcaccaca tggacgaggc cgacctcctt ggggaccgca ttgccatcat 480
tgcccaggga aggctctact gctcaggcac cccactcttc ctgaagaact gctttggcac 540
aggcttgtac ttaaccttgg tgcgcaagat gaaaaacatc cagagccaaa ggaaaggcag 600
tgaggggacc tgcagctgct cgtctaaggg tttctccacc acgtgtccag cccacgtcga 660
tgacctaact ccagaacaag tcctggatgg ggatgtaaat gagctgatgg atgtagttct 720
ccaccatgtt ccagaggcaa agctggtgga gtgcattggt caagaactta tcttccttct 780
tccaaataag aacttcaagc acagagcata tgccagcctt ttcagagagc tggaggagac 840
gctggctgac cttggtctca gcagttttgg aatttctgac actcccctgg aagagatttt 900
tctgaaggtc acggaggatt ctgattcagg acctctgttt gcgggtggcg ctcagcagaa 960
aagagaaaac gtcaaccccc gacacccctg cttgggtccc agagagaagg ctggacagac 1020
accccaggac tccaatgtct gctccccagg ggcgccggct gctcacccag agggccagcc 1080
tcccccagag ccagagtgcc caggcccgca gctcaacacg gggacacagc tggtcctcca 1140
gcatgtgcag gcgctgctgg tcaagagatt ccaacacacc atccgcagcc acaaggactt 1200
cctggcgcag atcgtgctcc cggctacctt tgtgtttttg gctctgatgc tttctattgt 1260
tatccctcct tttggcgaat accccgcttt gacccttcac ccctggatat atgggcagca 1320
gtacaccttc ttcagcatgg atgaaccagg cagtgagcag ttcacggtac ttgcagacgt 1380
cctcctgaat aagccaggct ttggcaaccg ctgcctgaag gaagggtggc ttccggagta 1440
cccctgtggc aactcaacac cctggaagac tccttctgtg tccccaaaca tcacccagct 1500
gttccagaag cagaaatgga cacaggtcaa cccttcacca tcctgcaggt gcagcaccag 1560
ggagaagctc accatgctgc cagagtgccc cgagggtgcc gggggcctcc cgccccccca 1620
gagaacacag cgcagcacgg aaattctaca agacctgacg gacaggaaca tctccgactt 1680
cttggtaaaa acgtatcctg ctcttataag aagcagctta aagagcaaat tctgggtcaa 1740
tgaacagagg tatggaggaa tttccattgg aggaaagctc ccagtcgtcc ccatcacggg 1800
ggaagcactt gttgggtttt taagcgacct tggccggatc atgaatgtga gcgggggccc 1860
tatcactaga gaggcctcta aagaaatacc tgatttcctt aaacatctag aaactgaaga 1920
caacattaag gtgtggttta ataacaaagg ctggcatgcc ctggtcagct ttctcaatgt 1980
ggcccacaac gccatcttac gggccagcct gcctaaggac agaagccccg aggagtatgg 2040
aatcaccgtc attagccaac ccctgaacct gaccaaggag cagctctcag agattacagt 2100
gctgaccact tcagtggatg ctgtggttgc catctgcgtg attttctcca tgtccttcgt 2160
cccagccagc tttgtccttt atttgatcca ggagcgggtg aacaaatcca agcacctcca 2220
gtttatcagt ggagtgagcc ccaccaccta ctgggtaacc aacttcctct gggacatcat 2280
gaattattcc gtgagtgctg ggctggtggt gggcatcttc atcgggtttc agaagaaagc 2340
ctacacttct ccagaaaacc ttcctgccct tgtggcactg ctcctgctgt atggatgggc 2400
ggtcattccc atgatgtacc cagcatcctt cctgtttgat gtccccagca cagcctatgt 2460
ggctttatct tgtgctaatc tgttcatcgg catcaacagc agtgctatta ccttcatctt 2520
ggaattattt gagaataacc ggacgctgct caggttcaac gccgtgctga ggaagctgct 2580
cattgtcttc ccccacttct gcctgggccg gggcctcatt gaccttgcac tgagccaggc 2640
tgtgacagat gtctatgccc ggtttggtga ggagcactct gcaaatccgt tccactggga 2700
cctgattggg aagaacctgt ttgccatggt ggtggaaggg gtggtgtact tcctcctgac 2760
cctgctggtc cagcgccact tcttcctctc ccaatggatt gccgagccca ctaaggagcc 2820
cattgttgat gaagatgatg atgtggctga agaaagacaa agaattatta ctggtggaaa 2880
taaaactgac atcttaaggc tacatgaact aaccaagatt tatccaggca cctccagccc 2940
agcagtggac aggctgtgtg tcggagttcg ccctggagag tgctttggcc tcctgggagt 3000
gaatggtgcc ggcaaaacaa ccacattcaa gatgctcact ggggacacca cagtgacctc 3060
aggggatgcc accgtagcag gcaagagtat tttaaccaat atttctgaag tccatcaaaa 3120
tatgggctac tgtcctcagt ttgatgcaat cgatgagctg ctcacaggac gagaacatct 3180
ttacctttat gcccggcttc gaggtgtacc agcagaagaa atcgaaaagg ttgcaaactg 3240
gagtattaag agcctgggcc tgactgtcta cgccgactgc ctggctggca cgtacagtgg 3300
gggcaacaag cggaaactct ccacagccat cgcactcatt ggctgcccac cgctggtgct 3360
gctggatgag cccaccacag ggatggaccc ccaggcacgc cgcatgctgt ggaacgtcat 3420
cgtgagcatc atcagagaag ggagggctgt ggtcctcaca tcccacagca tggaagaatg 3480
tgaggcactg tgtacccggc tggccatcat ggtaaagggc gcctttcgat gtatgggcac 3540
cattcagcat ctcaagtcca aatttggaga tggctatatc gtcacaatga agatcaaatc 3600
cccgaaggac gacctgcttc ctgacctgaa ccctgtggag cagttcttcc aggggaactt 3660
cccaggcagt gtgcagaggg agaggcacta caacatgctc cagttccagg tctcctcctc 3720
ctccctggcg aggatcttcc agctcctcct ctcccacaag gacagcctgc tcatcgagga 3780
gtactcagtc acacagacca cactggacca ggtgtttgta aattttgcta aacagcagac 3840
tgaaagtcat gacctccctc tgcaccctcg agctgctgga gccagtcgac aagcccagga 3900
ctga 3904
<210> 45
<211> 130
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic polypeptide
<400> 45
Asp Met Val Asp Lys Met Phe Gly Phe Leu Gly Thr Ser Gly Gly Leu
1 5 10 15
Pro Gly Gln Glu Gly Gln Ala Pro Ser Gly Phe Glu Asp Leu Glu Arg
20 25 30
Gly Arg Arg Glu Met Val Glu Glu Asp Leu Asp Ala Ala Leu Pro Leu
35 40 45
Pro Asp Glu Asp Glu Glu Asp Leu Ser Glu Tyr Lys Phe Ala Lys Phe
50 55 60
Ala Ala Thr Tyr Phe Gln Gly Thr Thr Thr His Ser Tyr Thr Arg Arg
65 70 75 80
Pro Leu Lys Gln Pro Leu Leu Tyr His Asp Asp Glu Gly Asp Gln Leu
85 90 95
Ala Ala Leu Ala Val Trp Ile Thr Ile Leu Arg Phe Met Gly Asp Leu
100 105 110
Pro Glu Pro Lys Tyr His Thr Ala Met Ser Asp Gly Ser Glu Lys Ile
115 120 125
Pro Val
130
Claims (17)
- 세포에서 트랜스진을 발현시키기 위한 벡터 시스템으로서, 벡터 시스템은 제1 벡터 및 제2 벡터를 포함하고, 여기서
(a) 제1 벡터는 5'에서 3' 방향으로 프로모터; 인트론; 트랜스진 코딩 서열(CDS)의 5' 말단 부분; 스플라이스 공여체 서열; 및 제1 재조합원성 영역을 포함하며;
(b) 제2 벡터는 5'에서 3' 방향으로 제2 재조합원성 영역; 스플라이스 수용체 서열; 및 트랜스진 CDS의 3' 말단 부분을 포함하며;
여기서 5' 말단 부분 및 3' 말단 부분은 함께 트랜스진 CDS를 구성하고, 인트론은 스플라이스 공여체 서열과 상동성 재조합할 수 없어 트랜스진 CDS의 5' 말단 부분을 절제하는, 벡터 시스템. - 제1항에 있어서, 인트론이 스플라이스 공여체 서열의 영역에 대해 적어도 95%, 96%, 97%, 98%, 99% 또는 100%(바람직하게는 100%) 서열 동일성을 갖는 적어도 20, 30, 40, 50, 60, 70, 80, 90 또는 100개의 인접 뉴클레오티드의 영역을 포함하지 않는, 벡터 시스템.
- 제1항 또는 제2항에 있어서, 인트론이
(a) 시미안 바이러스 40(SV40) 인트론 또는 미닛 바이러스 마우스(MVM) 인트론이고/거나;
(b) SEQ ID NO: 3 또는 4에 대해 적어도 95% 서열 동일성을 갖는 뉴클레오티드 서열을 포함하는, 벡터 시스템. - 제1항 내지 제3항 중 어느 한 항에 있어서, 스플라이스 공여체 서열이 SEQ ID NO: 5에 대해 적어도 95% 서열 동일성을 갖는 뉴클레오티드 서열을 포함하는, 벡터 시스템.
- 제1항 내지 제4항 중 어느 한 항에 있어서, 제1 재조합원성 영역 및 제2 재조합원성 영역이
(a) 둘 모두 F1 파지 재조합원성 영역 또는 이의 단편이고/거나;
(b) 둘 모두 SEQ ID NO: 7에 대해 적어도 95% 서열 동일성을 갖는 뉴클레오티드 서열 또는 이의 단편을 포함하는, 벡터 시스템. - 제1항 내지 제5항 중 어느 한 항에 있어서, 제1 벡터 및 제2 벡터가 바이러스 벡터인, 벡터 시스템.
- 제1항 내지 제6항 중 어느 한 항에 있어서, 제1 벡터 및 제2 벡터가 AAV 벡터이고, 임의적으로 제1 벡터는 5' ITR 및 3' ITR을 추가로 포함하고, 제2 벡터는 5' ITR 및 3' ITR을 추가로 포함하는, 벡터 시스템.
- 제1항 내지 제7항 중 어느 한 항에 있어서, 프로모터가 CBA 프로모터 또는 이의 단편인, 벡터 시스템.
- 제1항 내지 제8항 중 어느 한 항에 있어서, 제2 벡터가 트랜스진 CDS의 3' 말단 부분의 다운스트림에 폴리아데닐화 서열을 추가로 포함하는, 벡터 시스템.
- 제1항 내지 제9항 중 어느 한 항에 있어서, 트랜스진이 Myosin 7A(MYO7A) 트랜스진인, 벡터 시스템.
- 제1항 내지 제10항 중 어느 한 항에 있어서,
(a) 제1 벡터가 SEQ ID NO: 14에 대해 적어도 95% 서열 동일성을 갖는 뉴클레오티드 서열을 포함하고/거나;
(b) 제2 벡터는 SEQ ID NO: 15에 대해 적어도 95% 서열 동일성을 갖는 뉴클레오티드 서열을 포함하는, 벡터 시스템. - 세포에서 트랜스진을 발현시키기 위한 방법으로서, 트랜스진이 세포에서 발현되도록 제1항 내지 제11항 중 어느 한 항에 정의된 바와 같은 제1 벡터 및 제2 벡터로 세포를 형질도입 또는 형질감염시키는 것을 포함하는, 방법.
- 5'에서 3' 방향으로 프로모터; 인트론; 트랜스진 코딩 서열(CDS)의 5' 말단 부분; 스플라이스 공여체 서열; 및 재조합원성 영역을 포함는 벡터로서, 인트론은 스플라이스 공여체 서열과 상동성 재조합할 수 없어 트랜스진 CDS의 5' 말단 부분을 절제하는, 벡터.
- 제13항에 있어서, 벡터가 SEQ ID NO: 14에 대해 적어도 95% 서열 동일성을 갖는 뉴클레오티드 서열을 포함하는, 벡터.
- 제1항 내지 제11항 중 어느 한 항에 있어서, 요법에 사용하기 위한 벡터 시스템.
- 제1항 내지 제11항 중 어느 한 항에 있어서, 어셔 증후군, 임의적으로 어셔 증후군 타입 1B의 치료에 사용하기 위한 벡터 시스템.
- 유효량의 제1항 내지 제11항 중 어느 한 항의 벡터 시스템을 어셔 증후군의 치료 또는 예방을 필요로 하는 대상체에게 투여하는 것을 포함하는 어셔 증후군을 치료 또는 예방하는 방법으로서, 임의적으로 어셔 증후군이 어셔 증후군 타입 1B인, 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP21173687.1 | 2021-05-12 | ||
EP21173687 | 2021-05-12 | ||
PCT/EP2022/062989 WO2022238556A1 (en) | 2021-05-12 | 2022-05-12 | Vector system |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20240005950A true KR20240005950A (ko) | 2024-01-12 |
Family
ID=75919220
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237042749A KR20240005950A (ko) | 2021-05-12 | 2022-05-12 | 벡터 시스템 |
Country Status (11)
Country | Link |
---|---|
US (1) | US20220389450A1 (ko) |
EP (1) | EP4337779A1 (ko) |
JP (1) | JP2024517957A (ko) |
KR (1) | KR20240005950A (ko) |
CN (1) | CN117377771A (ko) |
AU (1) | AU2022274162A1 (ko) |
BR (1) | BR112023023599A2 (ko) |
CA (1) | CA3218631A1 (ko) |
IL (1) | IL308356A (ko) |
MX (1) | MX2023013393A (ko) |
WO (1) | WO2022238556A1 (ko) |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB9803351D0 (en) | 1998-02-17 | 1998-04-15 | Oxford Biomedica Ltd | Anti-viral vectors |
GB0009760D0 (en) | 2000-04-19 | 2000-06-07 | Oxford Biomedica Ltd | Method |
AU2014255665B2 (en) * | 2013-04-18 | 2018-08-02 | Fondazione Telethon | Effective delivery of large genes by dual AAV vectors |
CN106232618A (zh) | 2013-10-11 | 2016-12-14 | 马萨诸塞眼科耳科诊所 | 预测祖先病毒序列的方法及其用途 |
GB201403684D0 (en) | 2014-03-03 | 2014-04-16 | King S College London | Vector |
CA2979495A1 (en) * | 2015-03-17 | 2016-09-22 | Vrije Universiteit Brussel | Optimized liver-specific expression systems for fviii and fix |
US10738087B2 (en) | 2015-07-30 | 2020-08-11 | Massachusetts Eye And Ear Infirmary | Ancestral virus sequences and uses thereof |
SG11201907714UA (en) | 2017-02-28 | 2019-09-27 | Univ Pennsylvania | Adeno-associated virus (aav) clade f vector and uses therefor |
-
2022
- 2022-05-12 BR BR112023023599A patent/BR112023023599A2/pt unknown
- 2022-05-12 AU AU2022274162A patent/AU2022274162A1/en active Pending
- 2022-05-12 CA CA3218631A patent/CA3218631A1/en active Pending
- 2022-05-12 EP EP22729146.5A patent/EP4337779A1/en active Pending
- 2022-05-12 MX MX2023013393A patent/MX2023013393A/es unknown
- 2022-05-12 JP JP2023570159A patent/JP2024517957A/ja active Pending
- 2022-05-12 IL IL308356A patent/IL308356A/en unknown
- 2022-05-12 CN CN202280034858.2A patent/CN117377771A/zh active Pending
- 2022-05-12 WO PCT/EP2022/062989 patent/WO2022238556A1/en active Application Filing
- 2022-05-12 KR KR1020237042749A patent/KR20240005950A/ko unknown
- 2022-05-12 US US17/742,924 patent/US20220389450A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
BR112023023599A2 (pt) | 2024-03-12 |
IL308356A (en) | 2024-01-01 |
US20220389450A1 (en) | 2022-12-08 |
AU2022274162A1 (en) | 2023-11-30 |
CA3218631A1 (en) | 2022-11-17 |
WO2022238556A1 (en) | 2022-11-17 |
EP4337779A1 (en) | 2024-03-20 |
MX2023013393A (es) | 2023-12-08 |
JP2024517957A (ja) | 2024-04-23 |
CN117377771A (zh) | 2024-01-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102240180B1 (ko) | 다중 벡터 시스템 및 이의 용도 | |
AU2017257169B2 (en) | Evasion of neutralizing antibodies by a recombinant adeno-associated virus | |
RU2764919C2 (ru) | Оптимизированные гены и экспрессионные кассеты cln1, и их применение | |
KR20200107949A (ko) | 조작된 dna 결합 단백질 | |
JP7303816B2 (ja) | Aavベクター | |
CN114126665A (zh) | 眼底黄色斑点症(abca4)的基因疗法 | |
KR20220140537A (ko) | Cdkl5 결핍 장애를 치료하기 위한 유전자 요법 | |
CN111936172A (zh) | 用于治疗视网膜病症的组合物和方法 | |
WO2013102904A1 (en) | Methods and compositions for gene delivery | |
CN116685329A (zh) | 核酸构建体及其用于治疗脊髓性肌肉萎缩症的用途 | |
AU2019304569B2 (en) | Treatment of neuropathy with DNA constructs expressing IGF-1 isoforms | |
KR20220093163A (ko) | 안구 유전자 전달을 위한 aav 벡터 변이체 | |
CN114127296A (zh) | Ube3a基因和表达盒及其应用 | |
KR20210132109A (ko) | Dna-결합 도메인 전사활성화제 및 이의 용도 | |
KR20240005950A (ko) | 벡터 시스템 | |
CN112601454B (zh) | 用于治疗杜兴肌营养不良的组合物和方法 | |
CN116568814A (zh) | 载体化抗体和其用途 | |
KR20220145838A (ko) | Gm1 강글리오사이드증을 치료하는 데 유용한 조성물 | |
KR20210057720A (ko) | Clrn1 관련된 청력 손실 및/또는 시력 손실의 치료 방법 | |
CN111926021B (zh) | 重组人norrin胱氨酸结生长因子表达载体及其应用 | |
CN117836420A (zh) | 重组tert编码病毒基因组和运载体 | |
RU2793112C2 (ru) | Векторы aav | |
WO2024044725A2 (en) | Recombinant adeno-associated viruses and uses thereof | |
WO2023178171A2 (en) | Cassettes of anti-complement component 3 antibody, vectorization and theraputic application | |
TW202313981A (zh) | 用於增強視覺功能之組成物和方法 |