KR20220112283A - Hunter 질환 치료용 아데노-연합된 바이러스 벡터 - Google Patents
Hunter 질환 치료용 아데노-연합된 바이러스 벡터 Download PDFInfo
- Publication number
- KR20220112283A KR20220112283A KR1020227022896A KR20227022896A KR20220112283A KR 20220112283 A KR20220112283 A KR 20220112283A KR 1020227022896 A KR1020227022896 A KR 1020227022896A KR 20227022896 A KR20227022896 A KR 20227022896A KR 20220112283 A KR20220112283 A KR 20220112283A
- Authority
- KR
- South Korea
- Prior art keywords
- raav
- vector
- subject
- administration
- activity
- Prior art date
Links
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 title description 27
- 201000010099 disease Diseases 0.000 title description 19
- 239000013603 viral vector Substances 0.000 title description 3
- 101710096421 Iduronate 2-sulfatase Proteins 0.000 claims abstract description 293
- 102100029199 Iduronate 2-sulfatase Human genes 0.000 claims abstract description 293
- 239000013598 vector Substances 0.000 claims abstract description 115
- 238000000034 method Methods 0.000 claims abstract description 57
- 101000840540 Homo sapiens Iduronate 2-sulfatase Proteins 0.000 claims abstract description 44
- 241000702421 Dependoparvovirus Species 0.000 claims abstract description 36
- 208000022018 mucopolysaccharidosis type 2 Diseases 0.000 claims abstract description 36
- 201000002273 mucopolysaccharidosis II Diseases 0.000 claims abstract description 28
- 102000004190 Enzymes Human genes 0.000 claims abstract description 17
- 108090000790 Enzymes Proteins 0.000 claims abstract description 17
- 210000000234 capsid Anatomy 0.000 claims abstract description 13
- 150000007523 nucleic acids Chemical group 0.000 claims abstract description 12
- 230000002255 enzymatic effect Effects 0.000 claims abstract description 11
- 241001164825 Adeno-associated virus - 8 Species 0.000 claims abstract description 9
- 108091028043 Nucleic acid sequence Proteins 0.000 claims abstract description 8
- 239000013608 rAAV vector Substances 0.000 claims description 114
- 229920002683 Glycosaminoglycan Polymers 0.000 claims description 108
- 241000282414 Homo sapiens Species 0.000 claims description 90
- 230000000694 effects Effects 0.000 claims description 84
- 210000002966 serum Anatomy 0.000 claims description 70
- 241000699670 Mus sp. Species 0.000 claims description 62
- 210000004185 liver Anatomy 0.000 claims description 58
- 210000004556 brain Anatomy 0.000 claims description 42
- 230000001105 regulatory effect Effects 0.000 claims description 42
- 229920002971 Heparan sulfate Polymers 0.000 claims description 39
- HTTJABKRGRZYRN-UHFFFAOYSA-N Heparin Chemical compound OC1C(NC(=O)C)C(O)OC(COS(O)(=O)=O)C1OC1C(OS(O)(=O)=O)C(O)C(OC2C(C(OS(O)(=O)=O)C(OC3C(C(O)C(O)C(O3)C(O)=O)OS(O)(=O)=O)C(CO)O2)NS(O)(=O)=O)C(C(O)=O)O1 HTTJABKRGRZYRN-UHFFFAOYSA-N 0.000 claims description 38
- 210000003734 kidney Anatomy 0.000 claims description 36
- 101710192607 Formylglycine-generating enzyme Proteins 0.000 claims description 33
- 229920000045 Dermatan sulfate Polymers 0.000 claims description 29
- 102100028875 Formylglycine-generating enzyme Human genes 0.000 claims description 27
- AVJBPWGFOQAPRH-FWMKGIEWSA-L dermatan sulfate Chemical compound CC(=O)N[C@H]1[C@H](O)O[C@H](CO)[C@H](OS([O-])(=O)=O)[C@@H]1O[C@H]1[C@H](O)[C@@H](O)[C@H](O)[C@H](C([O-])=O)O1 AVJBPWGFOQAPRH-FWMKGIEWSA-L 0.000 claims description 27
- 229940051593 dermatan sulfate Drugs 0.000 claims description 27
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 claims description 21
- 241000700605 Viruses Species 0.000 claims description 14
- 210000003169 central nervous system Anatomy 0.000 claims description 13
- 230000001124 posttranscriptional effect Effects 0.000 claims description 11
- 241001492404 Woodchuck hepatitis virus Species 0.000 claims description 10
- 210000001320 hippocampus Anatomy 0.000 claims description 10
- 210000001103 thalamus Anatomy 0.000 claims description 10
- 210000001638 cerebellum Anatomy 0.000 claims description 9
- 238000011144 upstream manufacturing Methods 0.000 claims description 8
- 238000003556 assay Methods 0.000 claims description 7
- 210000001577 neostriatum Anatomy 0.000 claims description 7
- 210000000877 corpus callosum Anatomy 0.000 claims description 6
- 238000011969 continuous reassessment method Methods 0.000 claims description 5
- 101150044687 crm gene Proteins 0.000 claims description 5
- 210000002569 neuron Anatomy 0.000 claims description 4
- 230000028993 immune response Effects 0.000 claims description 3
- 102000018616 Apolipoproteins B Human genes 0.000 claims description 2
- 108010027006 Apolipoproteins B Proteins 0.000 claims description 2
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 claims 2
- 229910052698 phosphorus Inorganic materials 0.000 claims 2
- 239000011574 phosphorus Substances 0.000 claims 2
- 241001529936 Murinae Species 0.000 claims 1
- 210000001519 tissue Anatomy 0.000 description 59
- 230000014509 gene expression Effects 0.000 description 58
- 241001465754 Metazoa Species 0.000 description 50
- 108700019146 Transgenes Proteins 0.000 description 39
- 108090000623 proteins and genes Proteins 0.000 description 39
- 210000004027 cell Anatomy 0.000 description 35
- 102000057422 human IDS Human genes 0.000 description 33
- 210000002216 heart Anatomy 0.000 description 28
- 210000000952 spleen Anatomy 0.000 description 26
- 108020004414 DNA Proteins 0.000 description 25
- 241000699666 Mus <mouse, genus> Species 0.000 description 25
- 230000009467 reduction Effects 0.000 description 25
- 238000001727 in vivo Methods 0.000 description 23
- 108010009254 Lysosomal-Associated Membrane Protein 1 Proteins 0.000 description 21
- 102100035133 Lysosome-associated membrane glycoprotein 1 Human genes 0.000 description 21
- 239000013612 plasmid Substances 0.000 description 21
- 108091033319 polynucleotide Proteins 0.000 description 20
- 102000040430 polynucleotide Human genes 0.000 description 20
- 239000002157 polynucleotide Substances 0.000 description 20
- 102000004169 proteins and genes Human genes 0.000 description 20
- 230000001225 therapeutic effect Effects 0.000 description 20
- 150000001413 amino acids Chemical class 0.000 description 19
- 230000001965 increasing effect Effects 0.000 description 19
- 230000002829 reductive effect Effects 0.000 description 19
- 210000004072 lung Anatomy 0.000 description 17
- 239000002773 nucleotide Substances 0.000 description 17
- 125000003729 nucleotide group Chemical group 0.000 description 17
- 239000007924 injection Substances 0.000 description 16
- 238000002347 injection Methods 0.000 description 16
- 238000004519 manufacturing process Methods 0.000 description 15
- 108090000765 processed proteins & peptides Proteins 0.000 description 15
- 230000003247 decreasing effect Effects 0.000 description 13
- 238000010186 staining Methods 0.000 description 13
- 230000000392 somatic effect Effects 0.000 description 12
- 238000002965 ELISA Methods 0.000 description 11
- 210000000988 bone and bone Anatomy 0.000 description 11
- 125000003275 alpha amino acid group Chemical group 0.000 description 10
- 230000002132 lysosomal effect Effects 0.000 description 10
- 239000013642 negative control Substances 0.000 description 10
- 229920001184 polypeptide Polymers 0.000 description 10
- 102000004196 processed proteins & peptides Human genes 0.000 description 10
- 108091092195 Intron Proteins 0.000 description 9
- 210000001185 bone marrow Anatomy 0.000 description 9
- 239000002243 precursor Substances 0.000 description 9
- 101150044789 Cap gene Proteins 0.000 description 8
- 108020004705 Codon Proteins 0.000 description 8
- 208000035475 disorder Diseases 0.000 description 8
- 208000024891 symptom Diseases 0.000 description 8
- 238000001415 gene therapy Methods 0.000 description 7
- 239000002245 particle Substances 0.000 description 7
- 239000013641 positive control Substances 0.000 description 7
- 238000003860 storage Methods 0.000 description 7
- 230000003612 virological effect Effects 0.000 description 7
- 239000013607 AAV vector Substances 0.000 description 6
- 230000004071 biological effect Effects 0.000 description 6
- 230000000875 corresponding effect Effects 0.000 description 6
- 238000002641 enzyme replacement therapy Methods 0.000 description 6
- 150000002632 lipids Chemical class 0.000 description 6
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 6
- 210000000056 organ Anatomy 0.000 description 6
- 239000000126 substance Substances 0.000 description 6
- 108091026890 Coding region Proteins 0.000 description 5
- 238000009825 accumulation Methods 0.000 description 5
- 210000005013 brain tissue Anatomy 0.000 description 5
- 238000013461 design Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000000338 in vitro Methods 0.000 description 5
- 108020004999 messenger RNA Proteins 0.000 description 5
- 239000002105 nanoparticle Substances 0.000 description 5
- 238000005457 optimization Methods 0.000 description 5
- 101150066583 rep gene Proteins 0.000 description 5
- 230000002459 sustained effect Effects 0.000 description 5
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 4
- 241000238631 Hexapoda Species 0.000 description 4
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 4
- 208000015439 Lysosomal storage disease Diseases 0.000 description 4
- 238000011887 Necropsy Methods 0.000 description 4
- 241000288906 Primates Species 0.000 description 4
- 108091023040 Transcription factor Proteins 0.000 description 4
- 102000040945 Transcription factor Human genes 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 230000018109 developmental process Effects 0.000 description 4
- 238000009826 distribution Methods 0.000 description 4
- 239000012537 formulation buffer Substances 0.000 description 4
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 4
- 208000015181 infectious disease Diseases 0.000 description 4
- 108010009298 lysylglutamic acid Proteins 0.000 description 4
- 238000010603 microCT Methods 0.000 description 4
- 239000000203 mixture Substances 0.000 description 4
- 238000001543 one-way ANOVA Methods 0.000 description 4
- 238000004806 packaging method and process Methods 0.000 description 4
- 108010031719 prolyl-serine Proteins 0.000 description 4
- 238000013518 transcription Methods 0.000 description 4
- 230000035897 transcription Effects 0.000 description 4
- 210000003462 vein Anatomy 0.000 description 4
- 210000004885 white matter Anatomy 0.000 description 4
- 241000283690 Bos taurus Species 0.000 description 3
- 108700010070 Codon Usage Proteins 0.000 description 3
- 241000282412 Homo Species 0.000 description 3
- 108060003951 Immunoglobulin Proteins 0.000 description 3
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 3
- 241000880493 Leptailurus serval Species 0.000 description 3
- AUEJLPRZGVVDNU-UHFFFAOYSA-N N-L-tyrosyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-UHFFFAOYSA-N 0.000 description 3
- 108010076504 Protein Sorting Signals Proteins 0.000 description 3
- ROLGIBMFNMZANA-GVXVVHGQSA-N Val-Glu-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N ROLGIBMFNMZANA-GVXVVHGQSA-N 0.000 description 3
- 108010008355 arginyl-glutamine Proteins 0.000 description 3
- 108010093581 aspartyl-proline Proteins 0.000 description 3
- 108010092854 aspartyllysine Proteins 0.000 description 3
- 239000000090 biomarker Substances 0.000 description 3
- 239000003795 chemical substances by application Substances 0.000 description 3
- 230000007812 deficiency Effects 0.000 description 3
- 239000003814 drug Substances 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 108010050848 glycylleucine Proteins 0.000 description 3
- 108010087823 glycyltyrosine Proteins 0.000 description 3
- 210000002758 humerus Anatomy 0.000 description 3
- 102000018358 immunoglobulin Human genes 0.000 description 3
- 238000011532 immunohistochemical staining Methods 0.000 description 3
- 238000001990 intravenous administration Methods 0.000 description 3
- 210000005228 liver tissue Anatomy 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 102000039446 nucleic acids Human genes 0.000 description 3
- 108020004707 nucleic acids Proteins 0.000 description 3
- 108010029020 prolylglycine Proteins 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 238000006467 substitution reaction Methods 0.000 description 3
- 230000005030 transcription termination Effects 0.000 description 3
- 230000002103 transcriptional effect Effects 0.000 description 3
- 210000000216 zygoma Anatomy 0.000 description 3
- OEANUJAFZLQYOD-CXAZCLJRSA-N (2r,3s,4r,5r,6r)-6-[(2r,3r,4r,5r,6r)-5-acetamido-3-hydroxy-2-(hydroxymethyl)-6-methoxyoxan-4-yl]oxy-4,5-dihydroxy-3-methoxyoxane-2-carboxylic acid Chemical compound CC(=O)N[C@H]1[C@H](OC)O[C@H](CO)[C@H](O)[C@@H]1O[C@H]1[C@H](O)[C@@H](O)[C@H](OC)[C@H](C(O)=O)O1 OEANUJAFZLQYOD-CXAZCLJRSA-N 0.000 description 2
- COEXAQSTZUWMRI-STQMWFEESA-N (2s)-1-[2-[[(2s)-2-amino-3-(4-hydroxyphenyl)propanoyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound C([C@H](N)C(=O)NCC(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=C(O)C=C1 COEXAQSTZUWMRI-STQMWFEESA-N 0.000 description 2
- 108010036211 5-HT-moduline Proteins 0.000 description 2
- 241000702423 Adeno-associated virus - 2 Species 0.000 description 2
- FXKNPWNXPQZLES-ZLUOBGJFSA-N Ala-Asn-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O FXKNPWNXPQZLES-ZLUOBGJFSA-N 0.000 description 2
- GSHKMNKPMLXSQW-KBIXCLLPSA-N Ala-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C)N GSHKMNKPMLXSQW-KBIXCLLPSA-N 0.000 description 2
- HHRAXZAYZFFRAM-CIUDSAMLSA-N Ala-Leu-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O HHRAXZAYZFFRAM-CIUDSAMLSA-N 0.000 description 2
- GHBSKQGCIYSCNS-NAKRPEOUSA-N Ala-Leu-Asp-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O GHBSKQGCIYSCNS-NAKRPEOUSA-N 0.000 description 2
- KQESEZXHYOUIIM-CQDKDKBSSA-N Ala-Lys-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KQESEZXHYOUIIM-CQDKDKBSSA-N 0.000 description 2
- 108010011667 Ala-Phe-Ala Proteins 0.000 description 2
- XRUJOVRWNMBAAA-NHCYSSNCSA-N Ala-Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 XRUJOVRWNMBAAA-NHCYSSNCSA-N 0.000 description 2
- CUOMGDPDITUMIJ-HZZBMVKVSA-N Ala-Phe-Thr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 CUOMGDPDITUMIJ-HZZBMVKVSA-N 0.000 description 2
- FQNILRVJOJBFFC-FXQIFTODSA-N Ala-Pro-Asp Chemical compound C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N FQNILRVJOJBFFC-FXQIFTODSA-N 0.000 description 2
- AOAKQKVICDWCLB-UWJYBYFXSA-N Ala-Tyr-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N AOAKQKVICDWCLB-UWJYBYFXSA-N 0.000 description 2
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 2
- OTCJMMRQBVDQRK-DCAQKATOSA-N Arg-Asp-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OTCJMMRQBVDQRK-DCAQKATOSA-N 0.000 description 2
- NKBQZKVMKJJDLX-SRVKXCTJSA-N Arg-Glu-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NKBQZKVMKJJDLX-SRVKXCTJSA-N 0.000 description 2
- ATABBWFGOHKROJ-GUBZILKMSA-N Arg-Pro-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O ATABBWFGOHKROJ-GUBZILKMSA-N 0.000 description 2
- YNSUUAOAFCVINY-OSUNSFLBSA-N Arg-Thr-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YNSUUAOAFCVINY-OSUNSFLBSA-N 0.000 description 2
- YXVAESUIQFDBHN-SRVKXCTJSA-N Asn-Phe-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O YXVAESUIQFDBHN-SRVKXCTJSA-N 0.000 description 2
- YRTOMUMWSTUQAX-FXQIFTODSA-N Asn-Pro-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O YRTOMUMWSTUQAX-FXQIFTODSA-N 0.000 description 2
- MYTHOBCLNIOFBL-SRVKXCTJSA-N Asn-Ser-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MYTHOBCLNIOFBL-SRVKXCTJSA-N 0.000 description 2
- ILQCHXURSRRIRY-YUMQZZPRSA-N Asp-His-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)O)N ILQCHXURSRRIRY-YUMQZZPRSA-N 0.000 description 2
- GBSUGIXJAAKZOW-GMOBBJLQSA-N Asp-Ile-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GBSUGIXJAAKZOW-GMOBBJLQSA-N 0.000 description 2
- YFSLJHLQOALGSY-ZPFDUUQYSA-N Asp-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N YFSLJHLQOALGSY-ZPFDUUQYSA-N 0.000 description 2
- ZVGRHIRJLWBWGJ-ACZMJKKPSA-N Asp-Ser-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZVGRHIRJLWBWGJ-ACZMJKKPSA-N 0.000 description 2
- 108091029430 CpG site Proteins 0.000 description 2
- 206010012559 Developmental delay Diseases 0.000 description 2
- 241000283073 Equus caballus Species 0.000 description 2
- 241000282326 Felis catus Species 0.000 description 2
- WUAYFMZULZDSLB-ACZMJKKPSA-N Gln-Ala-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O WUAYFMZULZDSLB-ACZMJKKPSA-N 0.000 description 2
- GHAXJVNBAKGWEJ-AVGNSLFASA-N Gln-Ser-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O GHAXJVNBAKGWEJ-AVGNSLFASA-N 0.000 description 2
- RNPGPFAVRLERPP-QEJZJMRPSA-N Gln-Trp-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(O)=O RNPGPFAVRLERPP-QEJZJMRPSA-N 0.000 description 2
- 108010044091 Globulins Proteins 0.000 description 2
- 102000006395 Globulins Human genes 0.000 description 2
- CKRUHITYRFNUKW-WDSKDSINSA-N Glu-Asn-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CKRUHITYRFNUKW-WDSKDSINSA-N 0.000 description 2
- FQFWFZWOHOEVMZ-IHRRRGAJSA-N Glu-Phe-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O FQFWFZWOHOEVMZ-IHRRRGAJSA-N 0.000 description 2
- QNJNPKSWAHPYGI-JYJNAYRXSA-N Glu-Phe-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=CC=C1 QNJNPKSWAHPYGI-JYJNAYRXSA-N 0.000 description 2
- RQZGFWKQLPJOEQ-YUMQZZPRSA-N Gly-Arg-Gln Chemical compound C(C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)CN)CN=C(N)N RQZGFWKQLPJOEQ-YUMQZZPRSA-N 0.000 description 2
- DTPOVRRYXPJJAZ-FJXKBIBVSA-N Gly-Arg-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N DTPOVRRYXPJJAZ-FJXKBIBVSA-N 0.000 description 2
- JUBDONGMHASUCN-IUCAKERBSA-N Gly-Glu-His Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O JUBDONGMHASUCN-IUCAKERBSA-N 0.000 description 2
- JNGJGFMFXREJNF-KBPBESRZSA-N Gly-Glu-Trp Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O JNGJGFMFXREJNF-KBPBESRZSA-N 0.000 description 2
- UFPXDFOYHVEIPI-BYPYZUCNSA-N Gly-Gly-Asp Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O UFPXDFOYHVEIPI-BYPYZUCNSA-N 0.000 description 2
- WDXLKVQATNEAJQ-BQBZGAKWSA-N Gly-Pro-Asp Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O WDXLKVQATNEAJQ-BQBZGAKWSA-N 0.000 description 2
- 102100021519 Hemoglobin subunit beta Human genes 0.000 description 2
- 108091005904 Hemoglobin subunit beta Proteins 0.000 description 2
- DCRODRAURLJOFY-XPUUQOCRSA-N His-Ala-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)NCC(O)=O DCRODRAURLJOFY-XPUUQOCRSA-N 0.000 description 2
- QCBYAHHNOHBXIH-UWVGGRQHSA-N His-Pro-Gly Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)NCC(O)=O)C1=CN=CN1 QCBYAHHNOHBXIH-UWVGGRQHSA-N 0.000 description 2
- 101000772194 Homo sapiens Transthyretin Proteins 0.000 description 2
- HERITAGIPLEJMT-GVARAGBVSA-N Ile-Ala-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HERITAGIPLEJMT-GVARAGBVSA-N 0.000 description 2
- FJWALBCCVIHZBS-QXEWZRGKSA-N Ile-Met-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)NCC(=O)O)N FJWALBCCVIHZBS-QXEWZRGKSA-N 0.000 description 2
- PXKACEXYLPBMAD-JBDRJPRFSA-N Ile-Ser-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PXKACEXYLPBMAD-JBDRJPRFSA-N 0.000 description 2
- 108010065920 Insulin Lispro Proteins 0.000 description 2
- MMEDVBWCMGRKKC-GARJFASQSA-N Leu-Asp-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N MMEDVBWCMGRKKC-GARJFASQSA-N 0.000 description 2
- QCSFMCFHVGTLFF-NHCYSSNCSA-N Leu-Asp-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O QCSFMCFHVGTLFF-NHCYSSNCSA-N 0.000 description 2
- LOLUPZNNADDTAA-AVGNSLFASA-N Leu-Gln-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LOLUPZNNADDTAA-AVGNSLFASA-N 0.000 description 2
- QJUWBDPGGYVRHY-YUMQZZPRSA-N Leu-Gly-Cys Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N QJUWBDPGGYVRHY-YUMQZZPRSA-N 0.000 description 2
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 2
- GNRPTBRHRRZCMA-RWMBFGLXSA-N Leu-Met-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N1CCC[C@@H]1C(=O)O)N GNRPTBRHRRZCMA-RWMBFGLXSA-N 0.000 description 2
- RDFIVFHPOSOXMW-ACRUOGEOSA-N Leu-Tyr-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RDFIVFHPOSOXMW-ACRUOGEOSA-N 0.000 description 2
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 2
- UGJBHEZMOKVTIM-UHFFFAOYSA-N N-formylglycine Chemical compound OC(=O)CNC=O UGJBHEZMOKVTIM-UHFFFAOYSA-N 0.000 description 2
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 2
- 102100027661 N-sulphoglucosamine sulphohydrolase Human genes 0.000 description 2
- 241000283973 Oryctolagus cuniculus Species 0.000 description 2
- 241001494479 Pecora Species 0.000 description 2
- 241000009328 Perro Species 0.000 description 2
- UHRNIXJAGGLKHP-DLOVCJGASA-N Phe-Ala-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O UHRNIXJAGGLKHP-DLOVCJGASA-N 0.000 description 2
- GNUCSNWOCQFMMC-UFYCRDLUSA-N Phe-Arg-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 GNUCSNWOCQFMMC-UFYCRDLUSA-N 0.000 description 2
- UMKYAYXCMYYNHI-AVGNSLFASA-N Phe-Gln-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N UMKYAYXCMYYNHI-AVGNSLFASA-N 0.000 description 2
- ODGNUUUDJONJSC-UFYCRDLUSA-N Phe-Pro-Tyr Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O ODGNUUUDJONJSC-UFYCRDLUSA-N 0.000 description 2
- VPEVBAUSTBWQHN-NHCYSSNCSA-N Pro-Glu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O VPEVBAUSTBWQHN-NHCYSSNCSA-N 0.000 description 2
- BFXZQMWKTYWGCF-PYJNHQTQSA-N Pro-His-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BFXZQMWKTYWGCF-PYJNHQTQSA-N 0.000 description 2
- LGMBKOAPPTYKLC-JYJNAYRXSA-N Pro-Phe-Arg Chemical compound C([C@@H](C(=O)N[C@@H](CCCNC(=N)N)C(O)=O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 LGMBKOAPPTYKLC-JYJNAYRXSA-N 0.000 description 2
- BUEIYHBJHCDAMI-UFYCRDLUSA-N Pro-Phe-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BUEIYHBJHCDAMI-UFYCRDLUSA-N 0.000 description 2
- OFSZYRZOUMNCCU-BZSNNMDCSA-N Pro-Trp-Met Chemical compound N([C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCSC)C(O)=O)C(=O)[C@@H]1CCCN1 OFSZYRZOUMNCCU-BZSNNMDCSA-N 0.000 description 2
- SHTKRJHDMNSKRM-ULQDDVLXSA-N Pro-Tyr-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O SHTKRJHDMNSKRM-ULQDDVLXSA-N 0.000 description 2
- 241000700159 Rattus Species 0.000 description 2
- KAAPNMOKUUPKOE-SRVKXCTJSA-N Ser-Asn-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KAAPNMOKUUPKOE-SRVKXCTJSA-N 0.000 description 2
- QPFJSHSJFIYDJZ-GHCJXIJMSA-N Ser-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CO QPFJSHSJFIYDJZ-GHCJXIJMSA-N 0.000 description 2
- CJNCVBHTDXKTMJ-CYDGBPFRSA-N Ser-Asp-Lys-Pro Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(O)=O CJNCVBHTDXKTMJ-CYDGBPFRSA-N 0.000 description 2
- GZBKRJVCRMZAST-XKBZYTNZSA-N Ser-Glu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZBKRJVCRMZAST-XKBZYTNZSA-N 0.000 description 2
- UBRMZSHOOIVJPW-SRVKXCTJSA-N Ser-Leu-Lys Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O UBRMZSHOOIVJPW-SRVKXCTJSA-N 0.000 description 2
- KJKQUQXDEKMPDK-FXQIFTODSA-N Ser-Met-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O KJKQUQXDEKMPDK-FXQIFTODSA-N 0.000 description 2
- WOJYIMBIKTWKJO-KKUMJFAQSA-N Ser-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CO)N WOJYIMBIKTWKJO-KKUMJFAQSA-N 0.000 description 2
- UPLYXVPQLJVWMM-KKUMJFAQSA-N Ser-Phe-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UPLYXVPQLJVWMM-KKUMJFAQSA-N 0.000 description 2
- RWDVVSKYZBNDCO-MELADBBJSA-N Ser-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CO)N)C(=O)O RWDVVSKYZBNDCO-MELADBBJSA-N 0.000 description 2
- ANOQEBQWIAYIMV-AEJSXWLSSA-N Ser-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N ANOQEBQWIAYIMV-AEJSXWLSSA-N 0.000 description 2
- NRUPKQSXTJNQGD-XGEHTFHBSA-N Thr-Cys-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NRUPKQSXTJNQGD-XGEHTFHBSA-N 0.000 description 2
- GKWNLDNXMMLRMC-GLLZPBPUSA-N Thr-Glu-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O GKWNLDNXMMLRMC-GLLZPBPUSA-N 0.000 description 2
- KCRQEJSKXAIULJ-FJXKBIBVSA-N Thr-Gly-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O KCRQEJSKXAIULJ-FJXKBIBVSA-N 0.000 description 2
- GMXIJHCBTZDAPD-QPHKQPEJSA-N Thr-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N GMXIJHCBTZDAPD-QPHKQPEJSA-N 0.000 description 2
- AUYYCJSJGJYCDS-LBPRGKRZSA-N Thyrolar Chemical class IC1=CC(C[C@H](N)C(O)=O)=CC(I)=C1OC1=CC=C(O)C(I)=C1 AUYYCJSJGJYCDS-LBPRGKRZSA-N 0.000 description 2
- 108700029229 Transcriptional Regulatory Elements Proteins 0.000 description 2
- NMCBVGFGWSIGSB-NUTKFTJISA-N Trp-Ala-Leu Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N NMCBVGFGWSIGSB-NUTKFTJISA-N 0.000 description 2
- ICNFHVUVCNWUAB-SZMVWBNQSA-N Trp-Arg-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N ICNFHVUVCNWUAB-SZMVWBNQSA-N 0.000 description 2
- AKLNEFNQWLHIGY-QWRGUYRKSA-N Tyr-Gly-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)O)C(=O)O)N)O AKLNEFNQWLHIGY-QWRGUYRKSA-N 0.000 description 2
- WVGKPKDWYQXWLU-BZSNNMDCSA-N Tyr-His-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CCCCN)C(=O)O)N)O WVGKPKDWYQXWLU-BZSNNMDCSA-N 0.000 description 2
- PSALWJCUIAQKFW-ACRUOGEOSA-N Tyr-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N PSALWJCUIAQKFW-ACRUOGEOSA-N 0.000 description 2
- MNWINJDPGBNOED-ULQDDVLXSA-N Tyr-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=C(O)C=C1 MNWINJDPGBNOED-ULQDDVLXSA-N 0.000 description 2
- QPOUERMDWKKZEG-HJPIBITLSA-N Tyr-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 QPOUERMDWKKZEG-HJPIBITLSA-N 0.000 description 2
- OBKOPLHSRDATFO-XHSDSOJGSA-N Tyr-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N OBKOPLHSRDATFO-XHSDSOJGSA-N 0.000 description 2
- 108010064997 VPY tripeptide Proteins 0.000 description 2
- YODDULVCGFQRFZ-ZKWXMUAHSA-N Val-Asp-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O YODDULVCGFQRFZ-ZKWXMUAHSA-N 0.000 description 2
- SCBITHMBEJNRHC-LSJOCFKGSA-N Val-Asp-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N SCBITHMBEJNRHC-LSJOCFKGSA-N 0.000 description 2
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 2
- 125000000539 amino acid group Chemical group 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 108010024668 arginyl-glutamyl-aspartyl-valine Proteins 0.000 description 2
- 108010091092 arginyl-glycyl-proline Proteins 0.000 description 2
- 108010068380 arginylarginine Proteins 0.000 description 2
- 108010077245 asparaginyl-proline Proteins 0.000 description 2
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 2
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 2
- 108010038633 aspartylglutamate Proteins 0.000 description 2
- 108010047857 aspartylglycine Proteins 0.000 description 2
- 238000002869 basic local alignment search tool Methods 0.000 description 2
- 238000003766 bioinformatics method Methods 0.000 description 2
- 108010006025 bovine growth hormone Proteins 0.000 description 2
- 230000003197 catalytic effect Effects 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 108010060199 cysteinylproline Proteins 0.000 description 2
- 108010069495 cysteinyltyrosine Proteins 0.000 description 2
- 230000006378 damage Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 239000003085 diluting agent Substances 0.000 description 2
- 108010054813 diprotin B Proteins 0.000 description 2
- 231100000673 dose–response relationship Toxicity 0.000 description 2
- 239000000839 emulsion Substances 0.000 description 2
- 230000003511 endothelial effect Effects 0.000 description 2
- 210000001808 exosome Anatomy 0.000 description 2
- 238000010362 genome editing Methods 0.000 description 2
- 108010078144 glutaminyl-glycine Proteins 0.000 description 2
- 108010015792 glycyllysine Proteins 0.000 description 2
- 210000002443 helper t lymphocyte Anatomy 0.000 description 2
- 108010040030 histidinoalanine Proteins 0.000 description 2
- 108010045383 histidyl-glycyl-glutamic acid Proteins 0.000 description 2
- 108010092114 histidylphenylalanine Proteins 0.000 description 2
- 108010085325 histidylproline Proteins 0.000 description 2
- 102000056556 human TTR Human genes 0.000 description 2
- 238000001802 infusion Methods 0.000 description 2
- 238000011813 knockout mouse model Methods 0.000 description 2
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 2
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 2
- 108010057821 leucylproline Proteins 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 210000003712 lysosome Anatomy 0.000 description 2
- 230000001868 lysosomic effect Effects 0.000 description 2
- 210000004962 mammalian cell Anatomy 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000009126 molecular therapy Methods 0.000 description 2
- 210000004789 organ system Anatomy 0.000 description 2
- 230000007170 pathology Effects 0.000 description 2
- 239000008194 pharmaceutical composition Substances 0.000 description 2
- 108010084572 phenylalanyl-valine Proteins 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 108010077112 prolyl-proline Proteins 0.000 description 2
- 238000003753 real-time PCR Methods 0.000 description 2
- 108010026333 seryl-proline Proteins 0.000 description 2
- 210000001082 somatic cell Anatomy 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- QAOWNCQODCNURD-UHFFFAOYSA-L sulfate group Chemical group S(=O)(=O)([O-])[O-] QAOWNCQODCNURD-UHFFFAOYSA-L 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 229940124597 therapeutic agent Drugs 0.000 description 2
- 238000002560 therapeutic procedure Methods 0.000 description 2
- 239000005495 thyroid hormone Substances 0.000 description 2
- 229940036555 thyroid hormone Drugs 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 108010071635 tyrosyl-prolyl-arginine Proteins 0.000 description 2
- 241000701161 unidentified adenovirus Species 0.000 description 2
- 241000701447 unidentified baculovirus Species 0.000 description 2
- 241001529453 unidentified herpesvirus Species 0.000 description 2
- 108010015385 valyl-prolyl-proline Proteins 0.000 description 2
- 210000002845 virion Anatomy 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 108020005345 3' Untranslated Regions Proteins 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- 241000251468 Actinopterygii Species 0.000 description 1
- 241001655883 Adeno-associated virus - 1 Species 0.000 description 1
- 241000202702 Adeno-associated virus - 3 Species 0.000 description 1
- 241000580270 Adeno-associated virus - 4 Species 0.000 description 1
- 241001634120 Adeno-associated virus - 5 Species 0.000 description 1
- 241000972680 Adeno-associated virus - 6 Species 0.000 description 1
- 241001164823 Adeno-associated virus - 7 Species 0.000 description 1
- 241000649045 Adeno-associated virus 10 Species 0.000 description 1
- 241000649046 Adeno-associated virus 11 Species 0.000 description 1
- 101100524317 Adeno-associated virus 2 (isolate Srivastava/1982) Rep40 gene Proteins 0.000 description 1
- 101100524319 Adeno-associated virus 2 (isolate Srivastava/1982) Rep52 gene Proteins 0.000 description 1
- 101100524321 Adeno-associated virus 2 (isolate Srivastava/1982) Rep68 gene Proteins 0.000 description 1
- 101100524324 Adeno-associated virus 2 (isolate Srivastava/1982) Rep78 gene Proteins 0.000 description 1
- 208000010370 Adenoviridae Infections Diseases 0.000 description 1
- 206010060931 Adenovirus infection Diseases 0.000 description 1
- NXSFUECZFORGOG-CIUDSAMLSA-N Ala-Asn-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXSFUECZFORGOG-CIUDSAMLSA-N 0.000 description 1
- SHYYAQLDNVHPFT-DLOVCJGASA-N Ala-Asn-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SHYYAQLDNVHPFT-DLOVCJGASA-N 0.000 description 1
- NHLAEBFGWPXFGI-WHFBIAKZSA-N Ala-Gly-Asn Chemical compound C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N NHLAEBFGWPXFGI-WHFBIAKZSA-N 0.000 description 1
- BEMGNWZECGIJOI-WDSKDSINSA-N Ala-Gly-Glu Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O BEMGNWZECGIJOI-WDSKDSINSA-N 0.000 description 1
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 1
- YYAVDNKUWLAFCV-ACZMJKKPSA-N Ala-Ser-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O YYAVDNKUWLAFCV-ACZMJKKPSA-N 0.000 description 1
- NHWYNIZWLJYZAG-XVYDVKMFSA-N Ala-Ser-His Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N NHWYNIZWLJYZAG-XVYDVKMFSA-N 0.000 description 1
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 1
- 108010088751 Albumins Proteins 0.000 description 1
- 102000009027 Albumins Human genes 0.000 description 1
- PBSOQGZLPFVXPU-YUMQZZPRSA-N Arg-Glu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PBSOQGZLPFVXPU-YUMQZZPRSA-N 0.000 description 1
- BNYNOWJESJJIOI-XUXIUFHCSA-N Arg-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCN=C(N)N)N BNYNOWJESJJIOI-XUXIUFHCSA-N 0.000 description 1
- OVQJAKFLFTZDNC-GUBZILKMSA-N Arg-Pro-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O OVQJAKFLFTZDNC-GUBZILKMSA-N 0.000 description 1
- ICRHGPYYXMWHIE-LPEHRKFASA-N Arg-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O ICRHGPYYXMWHIE-LPEHRKFASA-N 0.000 description 1
- SUEIIIFUBHDCCS-PBCZWWQYSA-N Asn-His-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SUEIIIFUBHDCCS-PBCZWWQYSA-N 0.000 description 1
- IBLAOXSULLECQZ-IUKAMOBKSA-N Asn-Ile-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC(N)=O IBLAOXSULLECQZ-IUKAMOBKSA-N 0.000 description 1
- KAZKWIKPEPABOO-IHRRRGAJSA-N Asn-Met-Tyr Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N KAZKWIKPEPABOO-IHRRRGAJSA-N 0.000 description 1
- PUUPMDXIHCOPJU-HJGDQZAQSA-N Asn-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O PUUPMDXIHCOPJU-HJGDQZAQSA-N 0.000 description 1
- CBHVAFXKOYAHOY-NHCYSSNCSA-N Asn-Val-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O CBHVAFXKOYAHOY-NHCYSSNCSA-N 0.000 description 1
- PBVLJOIPOGUQQP-CIUDSAMLSA-N Asp-Ala-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O PBVLJOIPOGUQQP-CIUDSAMLSA-N 0.000 description 1
- SBHUBSDEZQFJHJ-CIUDSAMLSA-N Asp-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O SBHUBSDEZQFJHJ-CIUDSAMLSA-N 0.000 description 1
- QXHVOUSPVAWEMX-ZLUOBGJFSA-N Asp-Asp-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXHVOUSPVAWEMX-ZLUOBGJFSA-N 0.000 description 1
- HRGGPWBIMIQANI-GUBZILKMSA-N Asp-Gln-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HRGGPWBIMIQANI-GUBZILKMSA-N 0.000 description 1
- QCVXMEHGFUMKCO-YUMQZZPRSA-N Asp-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O QCVXMEHGFUMKCO-YUMQZZPRSA-N 0.000 description 1
- JOCQXVJCTCEFAZ-CIUDSAMLSA-N Asp-His-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(O)=O JOCQXVJCTCEFAZ-CIUDSAMLSA-N 0.000 description 1
- MFTVXYMXSAQZNL-DJFWLOJKSA-N Asp-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)O)N MFTVXYMXSAQZNL-DJFWLOJKSA-N 0.000 description 1
- SPKCGKRUYKMDHP-GUDRVLHUSA-N Asp-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N SPKCGKRUYKMDHP-GUDRVLHUSA-N 0.000 description 1
- QNIACYURSSCLRP-GUBZILKMSA-N Asp-Lys-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O QNIACYURSSCLRP-GUBZILKMSA-N 0.000 description 1
- YRZIYQGXTSBRLT-AVGNSLFASA-N Asp-Phe-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O YRZIYQGXTSBRLT-AVGNSLFASA-N 0.000 description 1
- YFGUZQQCSDZRBN-DCAQKATOSA-N Asp-Pro-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O YFGUZQQCSDZRBN-DCAQKATOSA-N 0.000 description 1
- WMLFFCRUSPNENW-ZLUOBGJFSA-N Asp-Ser-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O WMLFFCRUSPNENW-ZLUOBGJFSA-N 0.000 description 1
- HRVQDZOWMLFAOD-BIIVOSGPSA-N Asp-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N)C(=O)O HRVQDZOWMLFAOD-BIIVOSGPSA-N 0.000 description 1
- QOCFFCUFZGDHTP-NUMRIWBASA-N Asp-Thr-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O QOCFFCUFZGDHTP-NUMRIWBASA-N 0.000 description 1
- HCOQNGIHSXICCB-IHRRRGAJSA-N Asp-Tyr-Arg Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)O HCOQNGIHSXICCB-IHRRRGAJSA-N 0.000 description 1
- XWKBWZXGNXTDKY-ZKWXMUAHSA-N Asp-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O XWKBWZXGNXTDKY-ZKWXMUAHSA-N 0.000 description 1
- MFDPBZAFCRKYEY-LAEOZQHASA-N Asp-Val-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MFDPBZAFCRKYEY-LAEOZQHASA-N 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 108090000565 Capsid Proteins Proteins 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 102100023321 Ceruloplasmin Human genes 0.000 description 1
- 208000028698 Cognitive impairment Diseases 0.000 description 1
- 241000938605 Crocodylia Species 0.000 description 1
- PKNIZMPLMSKROD-BIIVOSGPSA-N Cys-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CS)N PKNIZMPLMSKROD-BIIVOSGPSA-N 0.000 description 1
- CLDCTNHPILWQCW-CIUDSAMLSA-N Cys-Arg-Glu Chemical compound C(C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CS)N)CN=C(N)N CLDCTNHPILWQCW-CIUDSAMLSA-N 0.000 description 1
- XBELMDARIGXDKY-GUBZILKMSA-N Cys-Pro-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CS)N XBELMDARIGXDKY-GUBZILKMSA-N 0.000 description 1
- 101150026402 DBP gene Proteins 0.000 description 1
- 101150066038 E4 gene Proteins 0.000 description 1
- 101710091045 Envelope protein Proteins 0.000 description 1
- 101000834253 Gallus gallus Actin, cytoplasmic 1 Proteins 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- JSYULGSPLTZDHM-NRPADANISA-N Gln-Ala-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O JSYULGSPLTZDHM-NRPADANISA-N 0.000 description 1
- LZRMPXRYLLTAJX-GUBZILKMSA-N Gln-Arg-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O LZRMPXRYLLTAJX-GUBZILKMSA-N 0.000 description 1
- SXIJQMBEVYWAQT-GUBZILKMSA-N Gln-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N SXIJQMBEVYWAQT-GUBZILKMSA-N 0.000 description 1
- LPYPANUXJGFMGV-FXQIFTODSA-N Gln-Gln-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N LPYPANUXJGFMGV-FXQIFTODSA-N 0.000 description 1
- JTWZNMUVQWWGOX-SOUVJXGZSA-N Gln-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCC(=O)N)N)C(=O)O JTWZNMUVQWWGOX-SOUVJXGZSA-N 0.000 description 1
- QGWXAMDECCKGRU-XVKPBYJWSA-N Gln-Val-Gly Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(N)=O)C(=O)NCC(O)=O QGWXAMDECCKGRU-XVKPBYJWSA-N 0.000 description 1
- VYOILACOFPPNQH-UMNHJUIQSA-N Gln-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N VYOILACOFPPNQH-UMNHJUIQSA-N 0.000 description 1
- UTKUTMJSWKKHEM-WDSKDSINSA-N Glu-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O UTKUTMJSWKKHEM-WDSKDSINSA-N 0.000 description 1
- VAZZOGXDUQSVQF-NUMRIWBASA-N Glu-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N)O VAZZOGXDUQSVQF-NUMRIWBASA-N 0.000 description 1
- CKOFNWCLWRYUHK-XHNCKOQMSA-N Glu-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O CKOFNWCLWRYUHK-XHNCKOQMSA-N 0.000 description 1
- NKLRYVLERDYDBI-FXQIFTODSA-N Glu-Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKLRYVLERDYDBI-FXQIFTODSA-N 0.000 description 1
- HPJLZFTUUJKWAJ-JHEQGTHGSA-N Glu-Gly-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HPJLZFTUUJKWAJ-JHEQGTHGSA-N 0.000 description 1
- NWOUBJNMZDDGDT-AVGNSLFASA-N Glu-Leu-His Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 NWOUBJNMZDDGDT-AVGNSLFASA-N 0.000 description 1
- ILWHFUZZCFYSKT-AVGNSLFASA-N Glu-Lys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ILWHFUZZCFYSKT-AVGNSLFASA-N 0.000 description 1
- AQNYKMCFCCZEEL-JYJNAYRXSA-N Glu-Lys-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AQNYKMCFCCZEEL-JYJNAYRXSA-N 0.000 description 1
- RJIVPOXLQFJRTG-LURJTMIESA-N Gly-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N RJIVPOXLQFJRTG-LURJTMIESA-N 0.000 description 1
- XRTDOIOIBMAXCT-NKWVEPMBSA-N Gly-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)CN)C(=O)O XRTDOIOIBMAXCT-NKWVEPMBSA-N 0.000 description 1
- YYPFZVIXAVDHIK-IUCAKERBSA-N Gly-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN YYPFZVIXAVDHIK-IUCAKERBSA-N 0.000 description 1
- ZQIMMEYPEXIYBB-IUCAKERBSA-N Gly-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN ZQIMMEYPEXIYBB-IUCAKERBSA-N 0.000 description 1
- BXICSAQLIHFDDL-YUMQZZPRSA-N Gly-Lys-Asn Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O BXICSAQLIHFDDL-YUMQZZPRSA-N 0.000 description 1
- OQQKUTVULYLCDG-ONGXEEELSA-N Gly-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)CN)C(O)=O OQQKUTVULYLCDG-ONGXEEELSA-N 0.000 description 1
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 1
- 101150064935 HELI gene Proteins 0.000 description 1
- 102100027685 Hemoglobin subunit alpha Human genes 0.000 description 1
- 108091005902 Hemoglobin subunit alpha Proteins 0.000 description 1
- 208000029433 Herpesviridae infectious disease Diseases 0.000 description 1
- MJNWEIMBXKKCSF-XVYDVKMFSA-N His-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N MJNWEIMBXKKCSF-XVYDVKMFSA-N 0.000 description 1
- PZAJPILZRFPYJJ-SRVKXCTJSA-N His-Ser-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O PZAJPILZRFPYJJ-SRVKXCTJSA-N 0.000 description 1
- XHQYFGPIRUHQIB-PBCZWWQYSA-N His-Thr-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CN=CN1 XHQYFGPIRUHQIB-PBCZWWQYSA-N 0.000 description 1
- FBOMZVOKCZMDIG-XQQFMLRXSA-N His-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N FBOMZVOKCZMDIG-XQQFMLRXSA-N 0.000 description 1
- 101000651201 Homo sapiens N-sulphoglucosamine sulphohydrolase Proteins 0.000 description 1
- 206010020880 Hypertrophy Diseases 0.000 description 1
- UDLAWRKOVFDKFL-PEFMBERDSA-N Ile-Asp-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N UDLAWRKOVFDKFL-PEFMBERDSA-N 0.000 description 1
- QZZIBQZLWBOOJH-PEDHHIEDSA-N Ile-Ile-Val Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(=O)O QZZIBQZLWBOOJH-PEDHHIEDSA-N 0.000 description 1
- BATWGBRIZANGPN-ZPFDUUQYSA-N Ile-Pro-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(=O)N)C(=O)O)N BATWGBRIZANGPN-ZPFDUUQYSA-N 0.000 description 1
- MLSUZXHSNRBDCI-CYDGBPFRSA-N Ile-Pro-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)O)N MLSUZXHSNRBDCI-CYDGBPFRSA-N 0.000 description 1
- KBDIBHQICWDGDL-PPCPHDFISA-N Ile-Thr-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N KBDIBHQICWDGDL-PPCPHDFISA-N 0.000 description 1
- BCISUQVFDGYZBO-QSFUFRPTSA-N Ile-Val-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O BCISUQVFDGYZBO-QSFUFRPTSA-N 0.000 description 1
- 102000006496 Immunoglobulin Heavy Chains Human genes 0.000 description 1
- 108010019476 Immunoglobulin Heavy Chains Proteins 0.000 description 1
- 102100034349 Integrase Human genes 0.000 description 1
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 1
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 1
- 125000000174 L-prolyl group Chemical group [H]N1C([H])([H])C([H])([H])C([H])([H])[C@@]1([H])C(*)=O 0.000 description 1
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 1
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 1
- OXKYZSRZKBTVEY-ZPFDUUQYSA-N Leu-Asn-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OXKYZSRZKBTVEY-ZPFDUUQYSA-N 0.000 description 1
- CLVUXCBGKUECIT-HJGDQZAQSA-N Leu-Asp-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CLVUXCBGKUECIT-HJGDQZAQSA-N 0.000 description 1
- HUEBCHPSXSQUGN-GARJFASQSA-N Leu-Cys-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)N1CCC[C@@H]1C(=O)O)N HUEBCHPSXSQUGN-GARJFASQSA-N 0.000 description 1
- QDSKNVXKLPQNOJ-GVXVVHGQSA-N Leu-Gln-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O QDSKNVXKLPQNOJ-GVXVVHGQSA-N 0.000 description 1
- YVKSMSDXKMSIRX-GUBZILKMSA-N Leu-Glu-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YVKSMSDXKMSIRX-GUBZILKMSA-N 0.000 description 1
- HQUXQAMSWFIRET-AVGNSLFASA-N Leu-Glu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HQUXQAMSWFIRET-AVGNSLFASA-N 0.000 description 1
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 1
- QLDHBYRUNQZIJQ-DKIMLUQUSA-N Leu-Ile-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QLDHBYRUNQZIJQ-DKIMLUQUSA-N 0.000 description 1
- IFMPDNRWZZEZSL-SRVKXCTJSA-N Leu-Leu-Cys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(O)=O IFMPDNRWZZEZSL-SRVKXCTJSA-N 0.000 description 1
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 1
- FAELBUXXFQLUAX-AJNGGQMLSA-N Leu-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(C)C FAELBUXXFQLUAX-AJNGGQMLSA-N 0.000 description 1
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 1
- FOBUGKUBUJOWAD-IHPCNDPISA-N Leu-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 FOBUGKUBUJOWAD-IHPCNDPISA-N 0.000 description 1
- REPBGZHJKYWFMJ-KKUMJFAQSA-N Leu-Lys-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N REPBGZHJKYWFMJ-KKUMJFAQSA-N 0.000 description 1
- BJWKOATWNQJPSK-SRVKXCTJSA-N Leu-Met-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N BJWKOATWNQJPSK-SRVKXCTJSA-N 0.000 description 1
- KQFZKDITNUEVFJ-JYJNAYRXSA-N Leu-Phe-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(C)C)CC1=CC=CC=C1 KQFZKDITNUEVFJ-JYJNAYRXSA-N 0.000 description 1
- UHNQRAFSEBGZFZ-YESZJQIVSA-N Leu-Phe-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N UHNQRAFSEBGZFZ-YESZJQIVSA-N 0.000 description 1
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 1
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 1
- BRTVHXHCUSXYRI-CIUDSAMLSA-N Leu-Ser-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O BRTVHXHCUSXYRI-CIUDSAMLSA-N 0.000 description 1
- ISSAURVGLGAPDK-KKUMJFAQSA-N Leu-Tyr-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O ISSAURVGLGAPDK-KKUMJFAQSA-N 0.000 description 1
- AXVIGSRGTMNSJU-YESZJQIVSA-N Leu-Tyr-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N AXVIGSRGTMNSJU-YESZJQIVSA-N 0.000 description 1
- FBNPMTNBFFAMMH-AVGNSLFASA-N Leu-Val-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-AVGNSLFASA-N 0.000 description 1
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 1
- VKVDRTGWLVZJOM-DCAQKATOSA-N Leu-Val-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O VKVDRTGWLVZJOM-DCAQKATOSA-N 0.000 description 1
- FACUGMGEFUEBTI-SRVKXCTJSA-N Lys-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCCCN FACUGMGEFUEBTI-SRVKXCTJSA-N 0.000 description 1
- NNCDAORZCMPZPX-GUBZILKMSA-N Lys-Gln-Ser Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N NNCDAORZCMPZPX-GUBZILKMSA-N 0.000 description 1
- MXMDJEJWERYPMO-XUXIUFHCSA-N Lys-Ile-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MXMDJEJWERYPMO-XUXIUFHCSA-N 0.000 description 1
- VUTWYNQUSJWBHO-BZSNNMDCSA-N Lys-Leu-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VUTWYNQUSJWBHO-BZSNNMDCSA-N 0.000 description 1
- LJADEBULDNKJNK-IHRRRGAJSA-N Lys-Leu-Val Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LJADEBULDNKJNK-IHRRRGAJSA-N 0.000 description 1
- MTBLFIQZECOEBY-IHRRRGAJSA-N Lys-Met-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(O)=O MTBLFIQZECOEBY-IHRRRGAJSA-N 0.000 description 1
- XYLSGAWRCZECIQ-JYJNAYRXSA-N Lys-Tyr-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 XYLSGAWRCZECIQ-JYJNAYRXSA-N 0.000 description 1
- TXTZMVNJIRZABH-ULQDDVLXSA-N Lys-Val-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 TXTZMVNJIRZABH-ULQDDVLXSA-N 0.000 description 1
- 208000037490 Medically Unexplained Symptoms Diseases 0.000 description 1
- 208000036626 Mental retardation Diseases 0.000 description 1
- OGAZPKJHHZPYFK-GARJFASQSA-N Met-Glu-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N OGAZPKJHHZPYFK-GARJFASQSA-N 0.000 description 1
- LCPUWQLULVXROY-RHYQMDGZSA-N Met-Lys-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LCPUWQLULVXROY-RHYQMDGZSA-N 0.000 description 1
- XIGAHPDZLAYQOS-SRVKXCTJSA-N Met-Pro-Pro Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 XIGAHPDZLAYQOS-SRVKXCTJSA-N 0.000 description 1
- GGXZOTSDJJTDGB-GUBZILKMSA-N Met-Ser-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O GGXZOTSDJJTDGB-GUBZILKMSA-N 0.000 description 1
- RMLWDZINJUDMEB-IHRRRGAJSA-N Met-Tyr-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N RMLWDZINJUDMEB-IHRRRGAJSA-N 0.000 description 1
- WYBVBIHNJWOLCJ-UHFFFAOYSA-N N-L-arginyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCCN=C(N)N WYBVBIHNJWOLCJ-UHFFFAOYSA-N 0.000 description 1
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 1
- 108010006140 N-sulfoglucosamine sulfohydrolase Proteins 0.000 description 1
- 108010066427 N-valyltryptophan Proteins 0.000 description 1
- 206010060860 Neurological symptom Diseases 0.000 description 1
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 206010053159 Organ failure Diseases 0.000 description 1
- OJUMUUXGSXUZJZ-SRVKXCTJSA-N Phe-Asp-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O OJUMUUXGSXUZJZ-SRVKXCTJSA-N 0.000 description 1
- KOUUGTKGEQZRHV-KKUMJFAQSA-N Phe-Gln-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O KOUUGTKGEQZRHV-KKUMJFAQSA-N 0.000 description 1
- KAGCQPSEVAETCA-JYJNAYRXSA-N Phe-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N KAGCQPSEVAETCA-JYJNAYRXSA-N 0.000 description 1
- XOHJOMKCRLHGCY-UNQGMJICSA-N Phe-Pro-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOHJOMKCRLHGCY-UNQGMJICSA-N 0.000 description 1
- IAOZOFPONWDXNT-IXOXFDKPSA-N Phe-Ser-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IAOZOFPONWDXNT-IXOXFDKPSA-N 0.000 description 1
- 108091036407 Polyadenylation Proteins 0.000 description 1
- 108010071690 Prealbumin Proteins 0.000 description 1
- OLHDPZMYUSBGDE-GUBZILKMSA-N Pro-Arg-Cys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O OLHDPZMYUSBGDE-GUBZILKMSA-N 0.000 description 1
- ICTZKEXYDDZZFP-SRVKXCTJSA-N Pro-Arg-Pro Chemical compound N([C@@H](CCCN=C(N)N)C(=O)N1[C@@H](CCC1)C(O)=O)C(=O)[C@@H]1CCCN1 ICTZKEXYDDZZFP-SRVKXCTJSA-N 0.000 description 1
- ZSKJPKFTPQCPIH-RCWTZXSCSA-N Pro-Arg-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZSKJPKFTPQCPIH-RCWTZXSCSA-N 0.000 description 1
- SGCZFWSQERRKBD-BQBZGAKWSA-N Pro-Asp-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 SGCZFWSQERRKBD-BQBZGAKWSA-N 0.000 description 1
- SFECXGVELZFBFJ-VEVYYDQMSA-N Pro-Asp-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SFECXGVELZFBFJ-VEVYYDQMSA-N 0.000 description 1
- LHALYDBUDCWMDY-CIUDSAMLSA-N Pro-Glu-Ala Chemical compound C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O LHALYDBUDCWMDY-CIUDSAMLSA-N 0.000 description 1
- NMELOOXSGDRBRU-YUMQZZPRSA-N Pro-Glu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(=O)O)NC(=O)[C@@H]1CCCN1 NMELOOXSGDRBRU-YUMQZZPRSA-N 0.000 description 1
- UUHXBJHVTVGSKM-BQBZGAKWSA-N Pro-Gly-Asn Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O UUHXBJHVTVGSKM-BQBZGAKWSA-N 0.000 description 1
- GURGCNUWVSDYTP-SRVKXCTJSA-N Pro-Leu-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GURGCNUWVSDYTP-SRVKXCTJSA-N 0.000 description 1
- HFNPOYOKIPGAEI-SRVKXCTJSA-N Pro-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 HFNPOYOKIPGAEI-SRVKXCTJSA-N 0.000 description 1
- BRJGUPWVFXKBQI-XUXIUFHCSA-N Pro-Leu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRJGUPWVFXKBQI-XUXIUFHCSA-N 0.000 description 1
- JLMZKEQFMVORMA-SRVKXCTJSA-N Pro-Pro-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 JLMZKEQFMVORMA-SRVKXCTJSA-N 0.000 description 1
- KBUAPZAZPWNYSW-SRVKXCTJSA-N Pro-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KBUAPZAZPWNYSW-SRVKXCTJSA-N 0.000 description 1
- AFWBWPCXSWUCLB-WDSKDSINSA-N Pro-Ser Chemical compound OC[C@@H](C([O-])=O)NC(=O)[C@@H]1CCC[NH2+]1 AFWBWPCXSWUCLB-WDSKDSINSA-N 0.000 description 1
- GOMUXSCOIWIJFP-GUBZILKMSA-N Pro-Ser-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GOMUXSCOIWIJFP-GUBZILKMSA-N 0.000 description 1
- MKGIILKDUGDRRO-FXQIFTODSA-N Pro-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 MKGIILKDUGDRRO-FXQIFTODSA-N 0.000 description 1
- YHUBAXGAAYULJY-ULQDDVLXSA-N Pro-Tyr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O YHUBAXGAAYULJY-ULQDDVLXSA-N 0.000 description 1
- VEUACYMXJKXALX-IHRRRGAJSA-N Pro-Tyr-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O VEUACYMXJKXALX-IHRRRGAJSA-N 0.000 description 1
- OOZJHTXCLJUODH-QXEWZRGKSA-N Pro-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 OOZJHTXCLJUODH-QXEWZRGKSA-N 0.000 description 1
- ZMLRZBWCXPQADC-TUAOUCFPSA-N Pro-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 ZMLRZBWCXPQADC-TUAOUCFPSA-N 0.000 description 1
- 101710188315 Protein X Proteins 0.000 description 1
- 101710150114 Protein rep Proteins 0.000 description 1
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 1
- 241001068295 Replication defective viruses Species 0.000 description 1
- 101710152114 Replication protein Proteins 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- YQHZVYJAGWMHES-ZLUOBGJFSA-N Ser-Ala-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YQHZVYJAGWMHES-ZLUOBGJFSA-N 0.000 description 1
- HBOABDXGTMMDSE-GUBZILKMSA-N Ser-Arg-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O HBOABDXGTMMDSE-GUBZILKMSA-N 0.000 description 1
- OJPHFSOMBZKQKQ-GUBZILKMSA-N Ser-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CO OJPHFSOMBZKQKQ-GUBZILKMSA-N 0.000 description 1
- VDVYTKZBMFADQH-AVGNSLFASA-N Ser-Gln-Tyr Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 VDVYTKZBMFADQH-AVGNSLFASA-N 0.000 description 1
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 1
- KCGIREHVWRXNDH-GARJFASQSA-N Ser-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N KCGIREHVWRXNDH-GARJFASQSA-N 0.000 description 1
- JLKWJWPDXPKKHI-FXQIFTODSA-N Ser-Pro-Asn Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CC(=O)N)C(=O)O JLKWJWPDXPKKHI-FXQIFTODSA-N 0.000 description 1
- GYDFRTRSSXOZCR-ACZMJKKPSA-N Ser-Ser-Glu Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GYDFRTRSSXOZCR-ACZMJKKPSA-N 0.000 description 1
- VLMIUSLQONKLDV-HEIBUPTGSA-N Ser-Thr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VLMIUSLQONKLDV-HEIBUPTGSA-N 0.000 description 1
- PLQWGQUNUPMNOD-KKUMJFAQSA-N Ser-Tyr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O PLQWGQUNUPMNOD-KKUMJFAQSA-N 0.000 description 1
- JZRYFUGREMECBH-XPUUQOCRSA-N Ser-Val-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O JZRYFUGREMECBH-XPUUQOCRSA-N 0.000 description 1
- BQCADISMDOOEFD-UHFFFAOYSA-N Silver Chemical compound [Ag] BQCADISMDOOEFD-UHFFFAOYSA-N 0.000 description 1
- 102000005262 Sulfatase Human genes 0.000 description 1
- 241000282898 Sus scrofa Species 0.000 description 1
- 108700005078 Synthetic Genes Proteins 0.000 description 1
- VFEHSAJCWWHDBH-RHYQMDGZSA-N Thr-Arg-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O VFEHSAJCWWHDBH-RHYQMDGZSA-N 0.000 description 1
- YUPVPKZBKCLFLT-QTKMDUPCSA-N Thr-His-Val Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](C(C)C)C(=O)O)N)O YUPVPKZBKCLFLT-QTKMDUPCSA-N 0.000 description 1
- YJCVECXVYHZOBK-KNZXXDILSA-N Thr-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H]([C@@H](C)O)N YJCVECXVYHZOBK-KNZXXDILSA-N 0.000 description 1
- NCXVJIQMWSGRHY-KXNHARMFSA-N Thr-Leu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O NCXVJIQMWSGRHY-KXNHARMFSA-N 0.000 description 1
- FWTFAZKJORVTIR-VZFHVOOUSA-N Thr-Ser-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O FWTFAZKJORVTIR-VZFHVOOUSA-N 0.000 description 1
- QYDKSNXSBXZPFK-ZJDVBMNYSA-N Thr-Thr-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYDKSNXSBXZPFK-ZJDVBMNYSA-N 0.000 description 1
- YRJOLUDFVAUXLI-GSSVUCPTSA-N Thr-Thr-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O YRJOLUDFVAUXLI-GSSVUCPTSA-N 0.000 description 1
- BTAJAOWZCWOHBU-HSHDSVGOSA-N Thr-Val-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)O)C(C)C)C(O)=O)=CNC2=C1 BTAJAOWZCWOHBU-HSHDSVGOSA-N 0.000 description 1
- 102000009190 Transthyretin Human genes 0.000 description 1
- XQMGDVVKFRLQKH-BBRMVZONSA-N Trp-Val-Gly Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O)=CNC2=C1 XQMGDVVKFRLQKH-BBRMVZONSA-N 0.000 description 1
- DYEGCOJHFNJBKB-UFYCRDLUSA-N Tyr-Arg-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 DYEGCOJHFNJBKB-UFYCRDLUSA-N 0.000 description 1
- WPVGRKLNHJJCEN-BZSNNMDCSA-N Tyr-Asp-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 WPVGRKLNHJJCEN-BZSNNMDCSA-N 0.000 description 1
- ARJASMXQBRNAGI-YESZJQIVSA-N Tyr-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N ARJASMXQBRNAGI-YESZJQIVSA-N 0.000 description 1
- PLVVHGFEMSDRET-IHPCNDPISA-N Tyr-Ser-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC3=CC=C(C=C3)O)N PLVVHGFEMSDRET-IHPCNDPISA-N 0.000 description 1
- JHDZONWZTCKTJR-KJEVXHAQSA-N Tyr-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JHDZONWZTCKTJR-KJEVXHAQSA-N 0.000 description 1
- ABSXSJZNRAQDDI-KJEVXHAQSA-N Tyr-Val-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ABSXSJZNRAQDDI-KJEVXHAQSA-N 0.000 description 1
- 101150008036 UL29 gene Proteins 0.000 description 1
- 101150099617 UL5 gene Proteins 0.000 description 1
- 101150011902 UL52 gene Proteins 0.000 description 1
- 101150033561 UL8 gene Proteins 0.000 description 1
- 101150049278 US20 gene Proteins 0.000 description 1
- SLLKXDSRVAOREO-KZVJFYERSA-N Val-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N)O SLLKXDSRVAOREO-KZVJFYERSA-N 0.000 description 1
- CWSIBTLMMQLPPZ-FXQIFTODSA-N Val-Cys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](C(C)C)N CWSIBTLMMQLPPZ-FXQIFTODSA-N 0.000 description 1
- XJFXZQKJQGYFMM-GUBZILKMSA-N Val-Cys-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)O)N XJFXZQKJQGYFMM-GUBZILKMSA-N 0.000 description 1
- CFSSLXZJEMERJY-NRPADANISA-N Val-Gln-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CFSSLXZJEMERJY-NRPADANISA-N 0.000 description 1
- JTWIMNMUYLQNPI-WPRPVWTQSA-N Val-Gly-Arg Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N JTWIMNMUYLQNPI-WPRPVWTQSA-N 0.000 description 1
- MDYSKHBSPXUOPV-JSGCOSHPSA-N Val-Gly-Phe Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N MDYSKHBSPXUOPV-JSGCOSHPSA-N 0.000 description 1
- VHIZXDZMTDVFGX-DCAQKATOSA-N Val-Ser-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N VHIZXDZMTDVFGX-DCAQKATOSA-N 0.000 description 1
- HWNYVQMOLCYHEA-IHRRRGAJSA-N Val-Ser-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N HWNYVQMOLCYHEA-IHRRRGAJSA-N 0.000 description 1
- USXYVSTVPHELAF-RCWTZXSCSA-N Val-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](C(C)C)N)O USXYVSTVPHELAF-RCWTZXSCSA-N 0.000 description 1
- 210000001766 X chromosome Anatomy 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 101150063416 add gene Proteins 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 208000011589 adenoviridae infectious disease Diseases 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 108010087924 alanylproline Proteins 0.000 description 1
- 239000005557 antagonist Substances 0.000 description 1
- 108010062796 arginyllysine Proteins 0.000 description 1
- 238000011888 autopsy Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000001574 biopsy Methods 0.000 description 1
- 230000037396 body weight Effects 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000000423 cell based assay Methods 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 230000004186 co-expression Effects 0.000 description 1
- 208000010877 cognitive disease Diseases 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 1
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003937 drug carrier Substances 0.000 description 1
- 230000004064 dysfunction Effects 0.000 description 1
- 239000012636 effector Substances 0.000 description 1
- 210000002472 endoplasmic reticulum Anatomy 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 238000011067 equilibration Methods 0.000 description 1
- 238000013401 experimental design Methods 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 108010013768 glutamyl-aspartyl-proline Proteins 0.000 description 1
- 108010089804 glycyl-threonine Proteins 0.000 description 1
- 108010081551 glycylphenylalanine Proteins 0.000 description 1
- 210000003494 hepatocyte Anatomy 0.000 description 1
- 229960000027 human factor ix Drugs 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 230000005847 immunogenicity Effects 0.000 description 1
- 229960003444 immunosuppressant agent Drugs 0.000 description 1
- 239000003018 immunosuppressive agent Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 229910052738 indium Inorganic materials 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000002458 infectious effect Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000007912 intraperitoneal administration Methods 0.000 description 1
- 108010012058 leucyltyrosine Proteins 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 238000012317 liver biopsy Methods 0.000 description 1
- 210000005229 liver cell Anatomy 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 210000002418 meninge Anatomy 0.000 description 1
- 239000004005 microsphere Substances 0.000 description 1
- 238000001823 molecular biology technique Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 210000003205 muscle Anatomy 0.000 description 1
- 210000000653 nervous system Anatomy 0.000 description 1
- 230000004770 neurodegeneration Effects 0.000 description 1
- 230000000926 neurological effect Effects 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 239000000546 pharmaceutical excipient Substances 0.000 description 1
- 108010072637 phenylalanyl-arginyl-phenylalanine Proteins 0.000 description 1
- 108010018625 phenylalanylarginine Proteins 0.000 description 1
- 108010051242 phenylalanylserine Proteins 0.000 description 1
- 239000002953 phosphate buffered saline Substances 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 230000003389 potentiating effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000004064 recycling Methods 0.000 description 1
- 210000005084 renal tissue Anatomy 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 108010048818 seryl-histidine Proteins 0.000 description 1
- 229910052709 silver Inorganic materials 0.000 description 1
- 239000004332 silver Substances 0.000 description 1
- 210000003625 skull Anatomy 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 239000008174 sterile solution Substances 0.000 description 1
- 238000007920 subcutaneous administration Methods 0.000 description 1
- 108060007951 sulfatase Proteins 0.000 description 1
- 230000009885 systemic effect Effects 0.000 description 1
- 230000008719 thickening Effects 0.000 description 1
- 108010061238 threonyl-glycine Proteins 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 238000003146 transient transfection Methods 0.000 description 1
- 239000002753 trypsin inhibitor Substances 0.000 description 1
- 108010080629 tryptophan-leucine Proteins 0.000 description 1
- 108010020532 tyrosyl-proline Proteins 0.000 description 1
- 108010078580 tyrosylleucine Proteins 0.000 description 1
- 239000000080 wetting agent Substances 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/005—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
- A61K38/16—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- A61K38/43—Enzymes; Proenzymes; Derivatives thereof
- A61K38/46—Hydrolases (3)
- A61K38/465—Hydrolases (3) acting on ester bonds (3.1), e.g. lipases, ribonucleases
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/005—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
- A61K48/0058—Nucleic acids adapted for tissue specific expression, e.g. having tissue specific promoters as part of a contruct
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K9/00—Medicinal preparations characterised by special physical form
- A61K9/0012—Galenical forms characterised by the site of application
- A61K9/0019—Injectable compositions; Intramuscular, intravenous, arterial, subcutaneous administration; Compositions to be administered through the skin in an invasive manner
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2217/00—Genetically modified animals
- A01K2217/07—Animals genetically altered by homologous recombination
- A01K2217/075—Animals genetically altered by homologous recombination inducing loss of function, i.e. knock out
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2227/00—Animals characterised by species
- A01K2227/10—Mammal
- A01K2227/105—Murine
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2267/00—Animals characterised by purpose
- A01K2267/03—Animal model, e.g. for test or diseases
- A01K2267/0306—Animal model for genetic diseases
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14132—Use of virus as therapeutic agent, other than vaccine, e.g. as cytolytic agent
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
- C12N2750/14143—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/22—Vectors comprising a coding region that has been codon optimised for expression in a respective host
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/008—Vector systems having a special element relevant for transcription cell type or tissue specific enhancer/promoter combination
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/42—Vector systems having a special element relevant for transcription being an intron or intervening sequence for splicing and/or stability of RNA
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/48—Vector systems having a special element relevant for transcription regulating transport or export of RNA, e.g. RRE, PRE, WPRE, CTE
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2840/00—Vectors comprising a special translation-regulating system
- C12N2840/20—Vectors comprising a special translation-regulating system translation of more than one cistron
- C12N2840/203—Vectors comprising a special translation-regulating system translation of more than one cistron having an IRES
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y301/00—Hydrolases acting on ester bonds (3.1)
- C12Y301/06—Sulfuric ester hydrolases (3.1.6)
- C12Y301/06013—Iduronate-2-sulfatase (3.1.6.13)
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Organic Chemistry (AREA)
- General Health & Medical Sciences (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Medicinal Chemistry (AREA)
- Biochemistry (AREA)
- Molecular Biology (AREA)
- Veterinary Medicine (AREA)
- Pharmacology & Pharmacy (AREA)
- Epidemiology (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Virology (AREA)
- Dermatology (AREA)
- Immunology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Gastroenterology & Hepatology (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
본 명세서는 그 중에서도, AAV8 또는 AAV9 캡시드 및 코돈-최적화된 인간 이두로네이트-2-설파타제 (I2S) 효소를 인코딩하는 서열을 포함하는 재조합 아데노-연합된 바이러스 (rAAV) 벡터를 제공한다. 본 명세서는 또한 Hunter 증후군 (MPS II)을 갖는 대상체를 치료하는 방법을 제공하는데, 이 방법은 AAV8 또는 AAV9 캡시드, 및 이두로네이트-2-설파타제 (I2S)를 인코드하는 핵산 서열에 작동가능하도록 연계된 프로모터를 포함하는 재조합 아데노-연합된 바이러스 (rAAV) 벡터를 이를 필요로 하는 대상체에게 투여하는 것을 포함하고, 이때 투여로 해당 대상체에서 I2S 효소적 활성이 증가된다.
Description
관련 출원에 대한 상호-참조
본 출원은 2019년 12월 10일자로 출원된 U.S. 일련 번호 62/945,920의 우선권의 이익을 주장하며, 그 내용은 전문이 본원에 편입된다.
배경
점맥다당증 유형 II (MPS II)라고도 알려진 Hunter 증후군은 이두로네이트-2-설파타제(I2S) 효소의 결핍 또는 부재로 인해 발생하는 리소좀 축적 질환이다. 이두로네이트-2-설파타제는 글리코사미노글리칸 또는 GAG로도 알려진 특이적 점액다당류의 분해 및 재활용에 관여한다. 결과적으로, Hunter 증후군에서 GAG는 전신 세포에 축적되어, 이는 다시 신체의 다양한 세포와 기관의 정상적인 기능을 방해함으로써, 여러 심각한 증상을 유발한다. Hunter 증후군의 많은 경우에 있어서, 이 병에 걸린 개체의 신경 세포 및 뇌막에 다량의 GAGs의 축적이 있고, 이는 다양한 형태의 중추 신경계(CNS) 증상, 인지 능력 손상 및 발달 지체로 이어진다.
효소 대체 요법(ERT)을 비롯한, 다양한 치료 옵션이 헌터 증후군 관리에 사용되어 왔었다. 승인된 치료적 ERT 치료에는 재조합 I2S 효소의 정맥내 투여가 내포된다. 그러나, 정맥으로 투여된 I2S 효소는 CNS의 세포 및 조직으로의 분포가 잘 되지 않고, 심장, 폐, 뼈와 같은 심부 체세포의 세포로의 분포가 잘 되지 않는 것을 비롯하여, 다양한 제약을 갖는다. Hunter 증후군의 치료는 여전히 과제로 남아 있다.
질환의 치료에 있어서 생체 내에서 치료요법적 단백질을 생산하는 벡터의 사용이 바람직하지만, 그러나 생체 내에서 원하는 치료요법적 단백질이 잘 만들어지지 않는 것을 비롯하여 다양한 요인들에 의해 제한적이다.
요약
본 발명은 I2S (본 명세서를 통하여 I2S 또는 IDS로 지칭됨)를 인코드하는 효과적이고, 강력한 재조합 아데노-연합된 바이러스 (rAAV) 벡터들을 제공한다. 본 발명은 I2S 서열을 포함하는 최적화된 rAAV 벡터가 생체내에서 강력한 I2S 발현을 초래한다는 놀라운 발견에 부분적으로 기초한다.
일부 측면들에 있어서, 본 발명은 AAV8 캡시드 및 인간 이두로네이트-2-설파타제 (I2S) 효소를 인코딩하는 서열을 포함하는 재조합 아데노-연합된 바이러스 (rAAV) 벡터를 제공한다.
일부 측면들에 있어서, 본 발명은 AAV9 캡시드 및 인간 이두로네이트-2 설파타제 (I2S) 효소를 인코딩하는 서열을 포함하는 재조합 아데노-연합된 바이러스 (rAAV) 벡터를 제공한다.
일부 구체예들에서, 상기 rAAV는 코돈-최적화된 인간 I2S 효소를 인코드한다. 일부 구체예들에서, 상기 코돈-최적화된 인간 I2S는 서열 식별 번호: 11 또는 12로부터 선택된 뉴클레오티드 서열을 갖는다.
일부 구체예들에서, 인간 I2S 효소를 인코딩하는 서열은 서열 식별 번호:6에 대해 적어도 약 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 동일성을 갖는 서열을 포함한다. 일부 구체예들에서, 상기 인간 I2S 효소는 서열 식별 번호:6에 대해 적어도 약 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 동일성의 뉴클레오티드 서열에 의해 인코드된다. 일부 구체예들에서, 상기 인간 I2S 효소는 서열 식별 번호: 6의 뉴클레오티드 서열에 의해 인코드된다.
일부 구체예들에서, 인간 I2S 효소의 아미노산 서열은 서열 식별 번호: 1에 대해 동일한 서열을 포함한다. 일부 구체예들에서, 인간 I2S 효소의 아미노산 서열은 서열 식별 번호: 1에 대해 동일한 서열이다.
일부 구체예들에서, 인간 I2S 효소의 아미노산 서열은 서열 식별 번호:2에 대해 적어도 약 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 동일성을 갖는 서열을 포함한다.
일부 구체예들에서, 인간 I2S 효소를 인코딩하는 서열은 서열 식별 번호: 2에 대해 동일한 서열을 포함한다. 일부 구체예들에서, 인간 I2S 효소의 아미노산 서열은 서열 식별 번호: 2에 대해 동일한 서열이다.
일부 구체예들에서, 인간 I2S 효소를 인코딩하는 상기 코돈-최적화된 서열은 서열 식별 번호: 11 또는 12에 대해 적어도 약 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 동일성을 갖는 서열을 포함한다. 일부 구체예들에서, 인간 I2S 효소를 인코딩하는 상기 코돈-최적화된 서열은 서열 식별 번호: 11 또는 12에 대해 동일한 서열을 포함한다.
일부 구체예들에서, 상기 벡터는 간-특이적 프로모터를 더 포함한다.
일부 구체예들에서, 상기 간-특이적 프로모터는 트랜스레틴(transthyretin) 프로모터 (TTR)이다.
일부 구체예들에서, 상기 벡터는 5' 및 3' 역전된 말단 반복부 (ITR), I2S 서열의 상류 인트론, 및 시스-작용 조절 모듈 (CRM)을 더 포함한다.
일부 구체예들에서, 상기 벡터는 산재된(ubiquitous) 프로모터를 더 포함한다.
일부 구체예들에서, 상기 벡터는 5' 및 3' 역전된 말단 반복부, I2S 서열의 상류 인트론, 및 시스-작용 조절 모듈 (CRM)을 더 포함한다.
일부 구체예들에서, 상기 rAAV 벡터는 설파타제 변형 인자 1 (SUMF1)을 포함한다.
일부 구체예들에서, SUMF1 앞에는 내부 리보솜 진입 부위 (IRES)가 있다.
일부 구체예들에서, 상기 벡터는 WPRE 서열을 더 포함한다. 일부 구체예들에서, 상기 WPRE 서열은 변이체 WPRE 서열 또는 최적화된 WPRE 서열이다. 일부 구체예들에서, 상기 WPRE 서열은 서열 식별 번호:7에 대해 적어도 약 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 동일성의 뉴클레오티드 서열에 의해 인코드된다. 일부 구체예들에서, 상기 WPRE 서열은 서열 식별 번호: 7을 갖는 뉴클레오티드 서열에 의해 인코드된다.
일부 구체예들에서, 상기 인트론은 마우스의 극미한(minute) 바이러스 (MVM) 또는 SV40 인트론이다. 일부 구체예들에서, 상기 인트론은 β-글로빈/IgG 키메라 인트론이다.
일부 구체예들에서, 상기 CRM은 간-특이적 CRM이다.
일부 구체예들에서, 상기 CRM은 신경-특이적 CRM이다. 일부 구체예들에서, 상기 CRM은 근육-특이적 CRM이다.
일부 구체예들에서, 상기 CRM은 CRM8이다.
일부 구체예들에서, 상기 벡터는 적어도 세 개의 CRMs을 포함한다.
일부 측면들에 있어서, 본 발명은 AAV8 캡시드를 포함하는 재조합 아데노-연합된 바이러스 (rAAV) 및 rAAV 벡터를 제공하며, 전술한 벡터는 다음을 포함한다: a) 5' 역전된 말단 반복부 (ITR); b.) 시스-작용 조절 모듈 (CRM); c.) 간 특이적 프로모터; d) 마우스의 극미한 바이러스 (MVM); e. 인간 이두로네이트-2-설파타제 (I2S) 효소를 인코딩하는 서열; f.) woodchuck 간염 바이러스 전사-후 조절 요소 (WPRE); 그리고 g.) 3' ITR.
일부 구체예들에서, 인간 I2S 효소를 인코딩하는 서열은 야생형 서열 또는 코돈-최적화된 서열이다.
일부 구체예들에서, 인간 I2S 효소를 인코딩하는 뉴클레오티드 서열은 서열 식별 번호: 6에 대해 적어도 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% 동일성을 갖는 서열이다. 일부 구체예들에서, 인간 I2S를 인코딩하는 뉴클레오티드 서열은 서열 식별 번호: 6과 동일하다. 일부 구체예들에서, 인간 I2S 효소를 인코딩하는 뉴클레오티드 서열은 서열 식별 번호: 11 또는 12에 대해 적어도 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% 동일성을 갖는 서열이다. 일부 구체예들에서, 인간 I2S 효소를 인코딩하는 뉴클레오티드 서열은 서열 식별 번호: 11 또는 12에 대해 동일한 서열이다.
일부 구체예들에서, 설파타제 변형 인자 1 (SUMF1) 및 내부 리보솜 진입 부위 (IRES)를 포함하는 서열을 포함한다.
일부 측면들에 있어서, 본 발명은 AAV9 캡시드를 포함하는 재조합 아데노-연합된 바이러스 (rAAV) 및 rAAV 벡터를 제공하며, 전술한 벡터는 다음을 포함한다: a.) 5' 역전된 말단 반복부 (ITR); b.) 시스-작용 조절 모듈 (CRM); c) 산재된 프로모터; d.) 마우스의 극미한 바이러스 (MVM); e.) 인간 이두로네이트-2-설파타제 (I2S) 효소를 인코딩하는 서열; f.) woodchuck 간염 바이러스 전사-후 조절 요소(WPRE); 그리고 g.) 3' ITR.
일부 구체예들에서, 인간 I2S 효소를 인코딩하는 서열은 야생형 서열 또는 코돈-최적화된 서열이다.
일부 구체예들에서, 설파타제 변형 인자 1 (SUMF1) 및 내부 리보솜 진입 부위 (IRES)를 포함하는 서열을 포함한다.
일부 구체예들에서, 상기 rAAV 벡터는 ApoB를 포함하지 않는다.
Hunter 증후군 (MPS II)을 갖는 대상체를 치료하는 방법, 이 방법은 전술한 청구항들중 임의의 한 항에 따른 rAAV를 이를 필요로 하는 대상체에게 투여하는 것을 포함한다.
Hunter 증후군 (MPS II)을 갖는 대상체를 치료하는 방법, 이 방법은 AAV8 또는 AAV9 캡시드, 및 이두로네이트-2-설파타제 (I2S)를 인코드하는 핵산 서열에 작동가능하도록 연계된 프로모터를 포함하는 재조합 아데노-연합된 바이러스 (rAAV) 벡터를 이를 필요로 하는 대상체에게 투여하는 것을 포함하고, 이때 투여로 해당 대상체에서 I2S 효소적 활성이 증가된다.
일부 구체예들에서, I2S 활성의 증가는 해당 대상체의 혈청에서 검출된다.
일부 구체예들에서, I2S 활성의 증가는 해당 대상체의 간에서 검출된다.
일부 구체예들에서, I2S 활성은 중추 신경계 (CNS)에서 증가된다.
일부 구체예들에서, I2S 활성의 증가는 해당 대상체의 뇌에서 검출된다.
일부 구체예들에서, I2S 활성의 증가는 해마, 시상, 뇌량, 피질, 소뇌 또는 뇌의 선조체(stratum)에서 검출된다.
일부 구체예들에서, I2S 활성의 증가는 해당 대상체의 신장 등에서 검출된다. 일부 구체예들에서, I2S 활성의 증가는 해당 대상체의 심장에서 검출된다. 일부 구체예들에서, I2S 활성의 증가는 해당 대상체의 폐에서 검출된다. 일부 구체예들에서, I2S 활성의 증가는 해당 대상체의 골수에서 검출된다. 일부 구체예들에서, I2S 활성의 증가는 해당 대상체의 신장에서 검출된다.
일부 구체예들에서, I2S 활성의 증가는 단일 투여 후, 적어도 30일, 60일, 90일, 120일, 150일, 180일 또는 그 이상 동안 유지된다.
일부 구체예들에서, I2S 활성 수준은 헤파린 설페이트 분석으로 측정된다.
일부 구체예들에서, I2S 활성 수준은 데르마탄 설페이트 분석으로 측정된다.
일부 구체예들에서, 상기 AAV의 투여로 글리코사미노글리칸 (GAG)의 수준이 해당 대상체에서 감소된다.
일부 구체예들에서, 상기 AAV의 투여로 GAG 수준이 해당 대상체의 혈청에서 감소된다.
일부 구체예들에서, 상기 AAV의 투여로 GAG 수준이 상기 해당 대상체의 간에서 감소된다.
일부 구체예들에서, 상기 AAV의 투여로 GAG 수준이 해당 대상체의 신장 등에서 감소된다. 일부 구체예들에서, 상기 AAV의 투여로 GAG 수준이 해당 대상체의 심장에서 감소된다. 일부 구체예들에서, 상기 AAV의 투여로 GAG 수준이 해당 대상체의 폐에서 감소된다. 일부 구체예들에서, 상기 AAV의 투여로 GAG 수준이 해당 대상체의 골수에서 감소된다. 일부 구체예들에서, 상기 AAV의 투여로 GAG 수준이 해당 대상체의 신장에서 감소된다.
일부 구체예들에서, 상기 AAV의 투여로 GAG 수준이 해당 대상체의 CNS에서 감소된다.
일부 구체예들에서, 상기 AAV의 투여로 GAG 수준이 해당 대상체의 뇌에서 감소된다.
일부 구체예들에서, 상기 AAV의 투여로 GAG 수준이 해마, 시상, 뇌량, 피질, 소뇌, 또는 뇌의 선조체에서 감소된다.
일부 구체예들에서, 상기 AAV는 정맥내로 투여된다.
일부 구체예들에서, 상기 AAV는 경막 내로 투여된다.
일부 구체예들에서, 상기 AAV는 약 5 x 109 vg의 투여분량으로 투여된다.
일부 구체예들에서, 상기 rAAV 투여로 면역 반응이 야기되지 않는다.
본 발명의 각종 측면들을 다음의 단락들에서 상세하게 설명한다. 섹션의 사용으로 본 발명을 제한하려는 것이 아니다. 각 섹션은 본 발명의 모든 측면에 적용될 수 있다. 본 출원에서, "또는"이란 명시적으로 다른 언급이 없는 한, "및/또는"을 말한다. 본원에서 사용된 바와 같이, 단수("a", "an" 및 "the")형은 다른 명시적인 언급이 없는 한, 단수 개념 및 복수 개념 모두가 내포된다.
도면의 간단한 설명
도 1A는 hIDS 발현시키는 벡터를 위한 발현 구조체를 나타내는 도식이다. 도 1B는 hIDS-WPRE의 최적화된 발현 구조체들을 보여주는 일련의 도식이다. ITR: 역전된 말단 반복부; pTBG: 갑상샘 호르몬-결합 글로불린 프로모터; hTTR: 인간 트랜스레틴 프로모터; CRM: 시스-작용 조절 모듈; MVM 인트론: 마우스 인트론의 극미한 바이러스; WPRE: Woodchuck 간염 바이러스 (WHV) 전사-후 조절 요소; BGH pA: 소의 성장 호르몬 종료자 + polyA; COOLopt: COOL에 의해 코돈-최적화됨 (Codon Optimization Online) 플랫폼; AUSopt: 내부 코돈 사용 빈도 테이블에 의해 최적화된 코돈.
도 2는 hIDS-IRES-SUMF1의 최적화된 발현 구조체들을 보여주는 일련의 도식이다. ITR: 역전된 말단 반복부; pTBG: 갑상샘 호르몬-결합 글로불린 프로모터; hTTR: 인간 트랜스레틴 프로모터; CRM: 시스-작용 조절 모듈; MVM 인트론: 마우스 인트론의 극미한 바이러스; WPRE: Woodchuck 간염 바이러스 (HWP) 전사-후 조절 요소; BGH pA: 소의 성장 호르몬 종료자 + polyA; COOLopt: COOL에 의해 코돈-최적화됨 (Codon Optimization Online) 플랫폼; AUSopt: 내부 코돈 사용 빈도 테이블에 의해 최적화된 코돈.
도 3은 확인된 rAAV 벡터들을 주사한-후, 0일차, 2일차, 7일차, 21일차, 8주차 및 12주차 시점에서 마우스 혈청에서 총 I2S 농도를 보여주는 그래프다. 상기 hI2S 농도는 ELISA에 의해 측정되었다.
도 4A는 확인된 rAAV 벡터들을 주사한-후, 0일차, 2일차, 7일차, 21일차, 8주차 및 12주차 시점에서 마우스 혈청에서 I2S 활성을 보여주는 그래프다. 도 4B는 마우스 조직에서 I2S 농도를 보여주는 그래프다. 도 4C는 마우스 조직에서 I2S 활성을 보여주는 그래프다. 도 4D는 야생형과 비교하여, hIDS 발현시키는 벡터가 투여된 동물에서 상대적인 I2S 활성을 보여주는 그래프다.
도 5A는 마우스 뇌에서 GAG 수준을 보여주는 그래프다. 도 5B는 마우스 간에서 GAG 수준을 보여주는 그래프다. 도 5C는 확인된 rAAV 벡터들을 주사한 후 12주차 시점에서 마우스 신장에서 GAG 수준을 보여주는 그래프다.
도 6A는 확인된 rAAV 벡터들을 주사한 후 12주차 시점에서 마우스의 간 및 신장 등에서 헤파린 설페이트 (HS) 및 데르마탄 설페이트 (DS) GAG 수준을 보여주는 그래프다. 일-원 ANOVA는 Dunnett 방법을 사용하여 다중 비교를 통해 처리되지 않은 녹-아웃(knockout) 동물에 대해 수행되었다. **P<0.01, ***P<0.001.
도 6B는 확인된 rAAV 벡터들을 주사한 후 12주차에서 대조군 동물과 비교하여, 간 및 신장 등에서 헤파린 설페이트 (HS) 및 데르마탄 설페이트 (DS) 수준의 감소 퍼센트를 보여주는 그래프다.
도 7A는 감소된 리소좀 저장 구획의 검출용 바이오마커 역할을 하는 LAMP1 면역조직화학 착색에 의해 결정된 간에서 LAMP1 수준을 보여주는 그래프다. 일-원 ANOVA는 Dunnett 방법을 사용하여 다중 비교를 통해 처리되지 않은 녹-아웃 동물에 대해 수행되었다. ***는 P<0.001을 나타낸다. 도 7B는 감소된 리소좀 저장 구획의 검출용 바이오마커 역할을 하는 LAMP1 면역조직화학 착색에 의해 결정된 뇌에서 LAMP1 수준을 보여주는 그래프다. 일-원 ANOVA는 Dunnett 방법을 사용하여 다중 비교를 통해 처리되지 않은 녹-아웃(knockout) 동물에 대해 수행되었다. *P<0.05, **P<0.01, ***P<0.001.
도 8은 hI2S 및 SUMF1을 발현시키는 벡터들을 주사한-후, 2일차, 7일차, 및 21일차 시점에서 마우스 혈청에서 총 hI2S 농도를 보여주는 그래프다
도 9는 확인된 rAAV 벡터들을 주사한-후, 0일차, 2일차, 7일차, 및 21일차 시점에서 마우스 혈청에서 hI2S 활성을 보여주는 그래프다.
도 10은 주사-후 최대 364일까지 I2S 농도를 보여주는 그래프다. 도 11은 주사-후 최대 364일까지 I2S 농도를 보여주는 그래프다.
도 12A는 hI2S를 투여한 마우스에서 혈청 및 조직에서 12 개월에 걸쳐 ELISA에 의해 측정하였을 때, I2S 농도를 보여주는 그래프다. 도 12B는 마우스 혈청 및 조직에서 I2S 활성을 보여주는 그래프다. 도 12C는 마우스 조직에서 GAG 수준을 보여주는 그래프다. 도 12D는 마우스 조직에서 GAG 수준의 감소 퍼센트를 보여주는 그래프다. 도 12E은 리소좀 저장 구획의 바이오마커인, LAMP1 착색 그래프다. 통계는 Dunnett 방법을 사용하여 다중 비교를 통해, 처리되지 않은 녹-아웃(knockout) 동물에 대해 일-원 ANOVA을 이용하여 수행되었다. *P<0.05, **P<0.01, ***P<0.001, ns=유의미적이지 않음.
도 13A는 대조군 동물에 비해 I2S가 투여된 마우스에서 마이크로CT에 의해 측정된 바와 같이, 완골의 골 부피 그래프를 나타내고, 도 13B는 관골궁(zygomatic arch)의 골 부피 그래프를 나타낸다.
도 14A는 낮은 투여분량의 hI2S를 투여한 마우스에서 혈청에서 90일에 걸쳐 ELISA에 의해 측정하였을 때, I2S 농도를 보여주는 그래프다. 도 14B는 혈청에서 I2S 활성 그래프다. 도 14C는 마우스 조직에서 I2S 농도 그래프다. 도 14D는 마우스 조직에서 I2S 활성 그래프다. 도 14E는 야생형 동물과 비교하여, 낮은 투여분량의 hI2S가 투여된 동물에서 상대적 I2S 활성 그래프다.
도 14F는 hI2S를 투여한 마우스의 간, 비장, 심장 및 신장을 비롯한, 체세포 조직에서 LAMP1 착색 수준을 보여주는 그래프다. 도 14G는 뇌에서 LAMP1 착색 수준을 보여주는 그래프다.
도 15A는 낮은 투여분량의 I2S를 제공받은 인간이 아닌 영장류에서 I2S 혈청 농도를 나타내는 그래프다. 도 15B는 낮은 투여분량의 I2S를 제공받은 인간이 아닌 영장류에서 I2S 혈청 활성을 나타내는 그래프다.
도 15C는 높은 투여분량의 I2S를 제공받은 인간이 아닌 영장류에서 I2S 혈청 농도를 나타내는 그래프다. 도 15D는 높은 투여분량의 I2S를 제공받은 인간이 아닌 영장류에서 I2S 혈청 활성을 나타내는 그래프다.
도 16은 인간이 아닌 영장류 개체에서 I2S 농도 및 효소 활성 프로파일, 그리고 동일한 동물에서및 항-I2S ADA 활성 프로파일을 나타낸다.
도 17A는 낮은 투여분량의 hI2S를 투여받은 인간이 아닌 영장류 개체의 간에서 hI2S 농도를 나타낸다. 도 17B는 높은은 투여분량의 hI2S를 투여받은 인간이 아닌 영장류 개체의 간에서 hI2S 농도를 나타낸다.
도 18A는 높은 투여분량 및 낮은 투여분량의 I2S를 투여받은 인간이 아닌 영장류의 신장에서 hI2S 농도를 나타낸다. 도 18B는 높은 투여분량 및 낮은 투여분량의 I2S를 투여받은 인간이 아닌 영장류의 비장에서 hI2S 농도를 나타낸다. 도 18C는 높은 투여분량 및 낮은 투여분량의 I2S를 투여받은 인간이 아닌 영장류의 폐에서 hI2S 농도를 나타낸다. 도 18D는 높은 투여분량 및 낮은 투여분량의 I2S를 투여받은 인간이 아닌 영장류의 심장에서 hI2S 농도를 나타낸다. 도 18E는 높은 투여분량 및 낮은 투여분량의 I2S를 투여받은 인간이 아닌 영장류의 골수에서 hI2S 농도를 나타낸다.
도 1A는 hIDS 발현시키는 벡터를 위한 발현 구조체를 나타내는 도식이다. 도 1B는 hIDS-WPRE의 최적화된 발현 구조체들을 보여주는 일련의 도식이다. ITR: 역전된 말단 반복부; pTBG: 갑상샘 호르몬-결합 글로불린 프로모터; hTTR: 인간 트랜스레틴 프로모터; CRM: 시스-작용 조절 모듈; MVM 인트론: 마우스 인트론의 극미한 바이러스; WPRE: Woodchuck 간염 바이러스 (WHV) 전사-후 조절 요소; BGH pA: 소의 성장 호르몬 종료자 + polyA; COOLopt: COOL에 의해 코돈-최적화됨 (Codon Optimization Online) 플랫폼; AUSopt: 내부 코돈 사용 빈도 테이블에 의해 최적화된 코돈.
도 2는 hIDS-IRES-SUMF1의 최적화된 발현 구조체들을 보여주는 일련의 도식이다. ITR: 역전된 말단 반복부; pTBG: 갑상샘 호르몬-결합 글로불린 프로모터; hTTR: 인간 트랜스레틴 프로모터; CRM: 시스-작용 조절 모듈; MVM 인트론: 마우스 인트론의 극미한 바이러스; WPRE: Woodchuck 간염 바이러스 (HWP) 전사-후 조절 요소; BGH pA: 소의 성장 호르몬 종료자 + polyA; COOLopt: COOL에 의해 코돈-최적화됨 (Codon Optimization Online) 플랫폼; AUSopt: 내부 코돈 사용 빈도 테이블에 의해 최적화된 코돈.
도 3은 확인된 rAAV 벡터들을 주사한-후, 0일차, 2일차, 7일차, 21일차, 8주차 및 12주차 시점에서 마우스 혈청에서 총 I2S 농도를 보여주는 그래프다. 상기 hI2S 농도는 ELISA에 의해 측정되었다.
도 4A는 확인된 rAAV 벡터들을 주사한-후, 0일차, 2일차, 7일차, 21일차, 8주차 및 12주차 시점에서 마우스 혈청에서 I2S 활성을 보여주는 그래프다. 도 4B는 마우스 조직에서 I2S 농도를 보여주는 그래프다. 도 4C는 마우스 조직에서 I2S 활성을 보여주는 그래프다. 도 4D는 야생형과 비교하여, hIDS 발현시키는 벡터가 투여된 동물에서 상대적인 I2S 활성을 보여주는 그래프다.
도 5A는 마우스 뇌에서 GAG 수준을 보여주는 그래프다. 도 5B는 마우스 간에서 GAG 수준을 보여주는 그래프다. 도 5C는 확인된 rAAV 벡터들을 주사한 후 12주차 시점에서 마우스 신장에서 GAG 수준을 보여주는 그래프다.
도 6A는 확인된 rAAV 벡터들을 주사한 후 12주차 시점에서 마우스의 간 및 신장 등에서 헤파린 설페이트 (HS) 및 데르마탄 설페이트 (DS) GAG 수준을 보여주는 그래프다. 일-원 ANOVA는 Dunnett 방법을 사용하여 다중 비교를 통해 처리되지 않은 녹-아웃(knockout) 동물에 대해 수행되었다. **P<0.01, ***P<0.001.
도 6B는 확인된 rAAV 벡터들을 주사한 후 12주차에서 대조군 동물과 비교하여, 간 및 신장 등에서 헤파린 설페이트 (HS) 및 데르마탄 설페이트 (DS) 수준의 감소 퍼센트를 보여주는 그래프다.
도 7A는 감소된 리소좀 저장 구획의 검출용 바이오마커 역할을 하는 LAMP1 면역조직화학 착색에 의해 결정된 간에서 LAMP1 수준을 보여주는 그래프다. 일-원 ANOVA는 Dunnett 방법을 사용하여 다중 비교를 통해 처리되지 않은 녹-아웃 동물에 대해 수행되었다. ***는 P<0.001을 나타낸다. 도 7B는 감소된 리소좀 저장 구획의 검출용 바이오마커 역할을 하는 LAMP1 면역조직화학 착색에 의해 결정된 뇌에서 LAMP1 수준을 보여주는 그래프다. 일-원 ANOVA는 Dunnett 방법을 사용하여 다중 비교를 통해 처리되지 않은 녹-아웃(knockout) 동물에 대해 수행되었다. *P<0.05, **P<0.01, ***P<0.001.
도 8은 hI2S 및 SUMF1을 발현시키는 벡터들을 주사한-후, 2일차, 7일차, 및 21일차 시점에서 마우스 혈청에서 총 hI2S 농도를 보여주는 그래프다
도 9는 확인된 rAAV 벡터들을 주사한-후, 0일차, 2일차, 7일차, 및 21일차 시점에서 마우스 혈청에서 hI2S 활성을 보여주는 그래프다.
도 10은 주사-후 최대 364일까지 I2S 농도를 보여주는 그래프다. 도 11은 주사-후 최대 364일까지 I2S 농도를 보여주는 그래프다.
도 12A는 hI2S를 투여한 마우스에서 혈청 및 조직에서 12 개월에 걸쳐 ELISA에 의해 측정하였을 때, I2S 농도를 보여주는 그래프다. 도 12B는 마우스 혈청 및 조직에서 I2S 활성을 보여주는 그래프다. 도 12C는 마우스 조직에서 GAG 수준을 보여주는 그래프다. 도 12D는 마우스 조직에서 GAG 수준의 감소 퍼센트를 보여주는 그래프다. 도 12E은 리소좀 저장 구획의 바이오마커인, LAMP1 착색 그래프다. 통계는 Dunnett 방법을 사용하여 다중 비교를 통해, 처리되지 않은 녹-아웃(knockout) 동물에 대해 일-원 ANOVA을 이용하여 수행되었다. *P<0.05, **P<0.01, ***P<0.001, ns=유의미적이지 않음.
도 13A는 대조군 동물에 비해 I2S가 투여된 마우스에서 마이크로CT에 의해 측정된 바와 같이, 완골의 골 부피 그래프를 나타내고, 도 13B는 관골궁(zygomatic arch)의 골 부피 그래프를 나타낸다.
도 14A는 낮은 투여분량의 hI2S를 투여한 마우스에서 혈청에서 90일에 걸쳐 ELISA에 의해 측정하였을 때, I2S 농도를 보여주는 그래프다. 도 14B는 혈청에서 I2S 활성 그래프다. 도 14C는 마우스 조직에서 I2S 농도 그래프다. 도 14D는 마우스 조직에서 I2S 활성 그래프다. 도 14E는 야생형 동물과 비교하여, 낮은 투여분량의 hI2S가 투여된 동물에서 상대적 I2S 활성 그래프다.
도 14F는 hI2S를 투여한 마우스의 간, 비장, 심장 및 신장을 비롯한, 체세포 조직에서 LAMP1 착색 수준을 보여주는 그래프다. 도 14G는 뇌에서 LAMP1 착색 수준을 보여주는 그래프다.
도 15A는 낮은 투여분량의 I2S를 제공받은 인간이 아닌 영장류에서 I2S 혈청 농도를 나타내는 그래프다. 도 15B는 낮은 투여분량의 I2S를 제공받은 인간이 아닌 영장류에서 I2S 혈청 활성을 나타내는 그래프다.
도 15C는 높은 투여분량의 I2S를 제공받은 인간이 아닌 영장류에서 I2S 혈청 농도를 나타내는 그래프다. 도 15D는 높은 투여분량의 I2S를 제공받은 인간이 아닌 영장류에서 I2S 혈청 활성을 나타내는 그래프다.
도 16은 인간이 아닌 영장류 개체에서 I2S 농도 및 효소 활성 프로파일, 그리고 동일한 동물에서및 항-I2S ADA 활성 프로파일을 나타낸다.
도 17A는 낮은 투여분량의 hI2S를 투여받은 인간이 아닌 영장류 개체의 간에서 hI2S 농도를 나타낸다. 도 17B는 높은은 투여분량의 hI2S를 투여받은 인간이 아닌 영장류 개체의 간에서 hI2S 농도를 나타낸다.
도 18A는 높은 투여분량 및 낮은 투여분량의 I2S를 투여받은 인간이 아닌 영장류의 신장에서 hI2S 농도를 나타낸다. 도 18B는 높은 투여분량 및 낮은 투여분량의 I2S를 투여받은 인간이 아닌 영장류의 비장에서 hI2S 농도를 나타낸다. 도 18C는 높은 투여분량 및 낮은 투여분량의 I2S를 투여받은 인간이 아닌 영장류의 폐에서 hI2S 농도를 나타낸다. 도 18D는 높은 투여분량 및 낮은 투여분량의 I2S를 투여받은 인간이 아닌 영장류의 심장에서 hI2S 농도를 나타낸다. 도 18E는 높은 투여분량 및 낮은 투여분량의 I2S를 투여받은 인간이 아닌 영장류의 골수에서 hI2S 농도를 나타낸다.
정의
아데노-연합된 바이러스 (AAV): 본원에서 사용된 바와 같이, 용어 "아데노-연합된 바이러스" 또는 "AAV" 또는 재조합 AAV ("rAAV")에는 AAV 유형 1, AAV 유형 2, AAV 유형 3 (유형 3A 및 3B을 비롯한), AAV 유형 4, AAV 유형 5, AAV 유형 6, AAV 유형 7, AAV 유형 8, AAV 유형 9, AAV 유형 10, AAV 유형 11, 조류 AAV, 소 AAV, 갯과 AAV, 말의 AAV, 및 양의 AAV (예를 들자면, Fields et al., Virology, volume 2, chapter 69 (4th ed., Lippincott-Raven Publishers); Gao et al., J. Virology 78:6381-6388 (2004); Mori et al., Virology 330:375-383 (2004) 참고)이 내포되나, 그러나 이에 국한되지 않는다. 일반적으로, AAV는 분열 세포와 비-분열 세포를 모두 감염시킬 수 있으며, 숙주 세포의 게놈에 통합되지 않고 염색체외 상태로 존재할 수 있다. AAV 벡터들이 흔히 유전자 요법에 이용된다.
투여: 본원에서 사용된 바와 같이, 용어 "투여하는", 또는 "도입하는"이란 rAAV 벡터의 효과적으로 전달하게 되는 방법 또는 경로를 통하여, I2S를 인코딩하는 rAAV 벡터들을 대상체로 전달하는 내용에서 호환사용된다. 예를 들면, 정맥내, 피하로 또는 경피를 비롯한, rAAV 벡터를 투여하기 위한 다양한 방법이 당업계에 공지되어 있다. rAAV 벡터의 경피 투여는 "유전자 총" 또는 생물학적 입자 전달 시스템을 사용하여 수행될 수 있다. 일부 구체예들에서, 상기 rAAV 벡터들 및/또는 이식유전자 발현 카세트 및/또는 최적화된 IDS 이식유전자 서열들 및/또는 상기 유전자 발현 카세트의 임의의 조성물은 비-바이러스성 화학 입자들, 이를 테면, 지질 나노입자, 비-바이러스성 생물학적 분자들, 이를 테면, 엑소좀 및/또는 세포외 소포체를 통하여 투여된다.
동물: 본원에서 사용된 바와 같이, "동물"이라는 용어는 동물 왕국의 모든 구성원을 지칭한다. 일부 구체예들에서, "동물"은 임의의 발생 단계에 있는 인간을 지칭한다. 일부 구체예들에서, "동물"은 임의의 발생 단계에 있는 인간이 아닌 동물을 지칭한다. 특정 구체예들에서, 상기 인간이 아닌 동물은 포유류 (예를 들자면, 설치류, 마우스, 렛(rat), 토끼, 원숭이, 개, 고양이, 양, 소, 영장류 및/또는 돼지)다. 일부 구체예들에서, 동물에는 포유동물, 새, 파충류, 양서류, 어류, 곤충 및/또는 벌레가 내포되지만, 이에 국한되지는 않는다. 일부 구체예들에서, 동물은 유전자삽입된(transgenic) 동물, 유전적으로-조작된 동물 및/또는 클론일 수 있다.
인지된 면역글로불린 폴리펩티드에는 카파 및 람다 경쇄, 그리고 알파, 감마 (IgG1, IgG2, IgG3, IgG4), 델타, 입실론 및 뮤 중쇄 또는 다른 종에서의 등가물이 내포된다. 전장의 면역글로불린 "경쇄" (약 25 kDa 또는 약 214 아미노산)는 NH2-말단의 약 110개 아미노산의 가변 영역과 COOH-말단에 있는 카파 또는 람다 불변 영역을 포함한다. 전장의 면역글로불린 "중쇄" (약 50 kDa 또는 약 446개 아미노산)는 유사하게, 가변 영역 (약 116개 아미노산) 및 전술한 중쇄 불변 영역중 하나, 예를 들자면, 감마 (약 330개 아미노산)를 포함한다.
대략적으로 또는 약(about): 본원에서 사용된 바와 같이, 하나 이상의 관심 값에 적용되는 용어 "대략적으로" 또는 "약(about)"이란 명시된 기준 값과 유사한 값을 나타낸다. 특정 구체예에서, 특정 구체예들에서, 용어 "대략적으로" 또는 "약"이란 달리 언급되지 않거나 또는 문맥상 명백하지 않은 한, 언급된 기준 값의 25%, 20%, 19%, 18%, 17%, 16%, 15%, 14%, 13%, 12%, 11%, 10%, 9%, 8%, 7%, 6%, 5%, 4%, 3%, 2%, 1%, 또는 미만의 상위 또는 하위 값 (더 크거나 또는 더 작은) (그러한 숫자가 가능한 값의 100%를 초과하는 경우를 제외하고) 범위 안에 속하는 값의 범위를 지칭한다.
생물학적 활성: 본원에서 사용된 바와 같이, "생물학적 활성"이라는 구절은 생물학적 시스템, 특히 유기체에서 활성을 갖는 임의의 제제의 특성을 지칭한다. 예를 들어, 유기체에 투여될 때, 그 유기체에 생물학적 영향을 미치는 제제는 생물학적 활성으로 간주된다. 특정 구체예들에서, 펩티드가 생물학적으로 활성인 경우, 펩티드의 적어도 하나의 생물학적 활성을 공유하는 해당 펩티드의 부분은 일반적으로 "생물학적 활성" 부분으로 지칭된다.
기능적 등가물 또는 유도체: 본원에서 사용된 바와 같이, "기능적 등가물" 또는 "기능적 유도체"라는 용어는 아미노산 서열의 기능적 유도체와 관련하여, 원래 서열의 활성과 실질적으로 유사한 생물학적 활성(기능 또는 구조적)을 유지하는 분자를 의미한다. 기능적 유도체 또는 등가물은 천연 유도체일 수 있거나, 또는 합성으로 만들어질 수 있다. 예시적인 기능적 유도체에는 단서조건으로 단백질의 생물학적 활성이 보존된다면, 하나 또는 그 이상의 아미노산의 치환, 결실 또는 부가를 갖는 아미노산 서열이 내포된다. 치환 아미노산은 바람직하게는 치환 아미노산과 유사한 화학적-물리적 속성을 갖는다. 바람직한 유사한 화학적-물리적 속성에는 전하의 유사성, 부피, 소수성, 친수성 및 이와 유사한 것들이 내포된다.
시험관내: 본원에 사용된 바와 같이, 용어 "시험관내"란 다-세포 유기체 안이 아닌 인위적 환경, 예를 들어, 테스트 튜브 또는 반응 용기, 세포 배양 등에서 일어나는 사건을 지칭한다.
생체내: 본원에 사용된 바와 같이, 용어 "생체내"란 다중-세포 유기체, 이를 테면, 인간과 비-인간 동물 안에서 일어나는 사건을 지칭한다. 세포-기반 시스템의 맥락에서, 상기 용어는 살아있는 세포 내(예를 들어, 시험관내 시스템과 반대되는) 에서 발생하는 사건을 지칭하는 데 사용될 수 있다.
IRES: 본원에서 사용된 바와 같이, 용어 "IRES"는 임의의 적합한 내부 리보솜 진입 부위 서열을 지칭한다.
단리된: 본원에 사용된 바와 같이, 용어 "단리된"이란 (1) 최초로 만들어질 때(자연적이건 및/또는 실험 설정에서이건), 이것과 연합된 성분들중 적어도 일부와 분리된, 및/또는 (2) 사람의 손으로 생산, 준비 및/또는 제작된 물질 및/또는 엔터티를 지칭한다. 단리된 물질 및/또는 엔터티는 이것이 최초로 연합된 다른 성분들로부터 약 10%, 약 20%, 약 30%, 약 40%, 약 50%, 약 60%, 약 70%, 약 80%, 약 90%, 약 95%, 약 98%, 약 99%, 실질적으로 100%, 또는 100% 분리될 수 있다. 일부 구체예들에서, 단리된 제제는 약 80%, 약 85%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98%, 약 99% 이상으로 순수하거나, 또는 실질적으로 100%, 또는 100% 순수하다. 본원에 사용된 바와 같이, 물질에서 다른 성분이 실질적으로 없는 경우, 해당 물질은 "순수"하다. 본원에서 사용된 바와 같이, 용어 "단리된 세포"는 다중-중심 유기체에 함유안된 세포를 지칭한다.
폴리펩티드: 본원에서 사용된 바와 같이, 용어 "폴리펩티드"란 펩티드 결합에 의해 서로 연계된 아미노산의 순차적인 쇄를 지칭한다. 이 용어는 임의의 길이의 아미노산 쇄를 나타내기 위해 사용되지만, 당업자는 이 용어가 긴 쇄에 국한되지 않고, 펩티드를 통해 함께 연계된 2개의 아미노산을 포함하는 최소 쇄를 나타낼 수 있음을 이해할 것이다. 당업자에게 공지된 바와 같이, 폴리펩티드는 가공 및/또는 변형될 수 있다.
단백질: 본원에서 사용된 바와 같이, 용어 "단백질"은 별개의 단위로 기능하는 하나 또는 그 이상 폴리펩티드를 지칭한다. 단일 폴리펩티드가 별개의 기능 단위이고, 별개의 기능 단위를 형성하기 위해 다른 폴리펩티드와 영구적 또는 일시적인 물리적 결합을 필요로 하지 않는 경우, 용어 "폴리펩티드" 및 "단백질"은 호환적으로 사용될 수 있다. 별개 기능 단위가 서로 물리적으로 연합하는 하나 이상의 폴리펩티드로 구성된 경우, 용어 "단백질"은 물리적으로 커플링되고, 별개의 단위로서 함께 기능하는 다중 폴리펩티드를 지칭한다.
조절 요소: 본원에서 사용된 바와 같이, 용어 "조절 요소"란 유전자의 전사를 조절 및/또는 제어할 수 있는 전사 조절 요소, 특히 넌-코딩 시스-작용 전사 조절 요소를 지칭한다. 조절 요소들은 적어도 하나의 전사 인자 결합 부위, 예를 들면, 조직 특이적 전사 인자를 위한 적어도 한 개의 결합 부위를 포함한다. 본원에 기술된 구체예들에서, 조절 요소들은 간-특이적 전사 인자를 위한 적어도 한 개의 결합 부위를 갖는다. 전형적으로, 조절 요소들은 조절 요소들 없이, 프로모터 단독으로부터 유전자의 전사와 비교하였을 때, 프로모터-구동된 유전자 발현을 증가 또는 강화시킨다. 따라서, 조절 요소들은 특히 인핸서 서열들을 포함하는데, 전사를 향상시키는 조절 요소들은 전형적으로 멀리 있는 상류 인핸서 서열에 국한되지 않고, 이들이 조절하는 유전자로부터 임의의 거리에 발생할 수 있음을 이해해야 한다. 당업계에서 이해되는 바와 같이, 전사 조절 서열들은 생체내에서 조절되는 유전자의 상류 (예를 들자면, 프로모터 영역에) 또는 하류 (예를 들자면, 3'UTR에)에 위치할 수 있고, 해당 유전자의 바로 근처에 위치하거나 또는 훨씬 더 멀리 위치할 수 있다. 조절 요소들은 자연 발생적 서열, 이러한 조절 요소들(이의 일부분)의 조합, 또는 조절 요소의 몇 개 복사본, 예를 들자면, 비-자연 발생적 서열들을 포함할 수 있다. 따라서, 조절 요소들에는 원하는 발현 수준을 얻기 위해 자연발생적이고, 최적화된 조절 요소, 또는 공작된 조절 요소들이 내포된다.
대상체: 본원에서 사용된 바와 같이, 용어 "대상체"는 인간 또는 임의의 인간이 아닌 동물 (예를 들자면, 마우스, 렛(rat), 토끼, 개, 고양이, 소, 돼지, 양, 말 또는 영장류)을 지칭한다. 인간은 출생-전 형태와 출생-후 형태가 내포된다. 많은 구체예들에서, 대상체는 인간이다. 대상체는 환자일 수 있고, 이때 환자란 질환의 진단 또는 치료를 위해 의료 제공자에게 보여주는 인간을 말한다. 용어 "대상체"는 "개체" 또는 "환자"와 본원에서 호환사용된다. 대상체는 질환 또는 장애에 걸리거나, 또는 이에 취약할 수 있지만, 그러나 해당 질환 또는 장애의 증상을 나타내거나 또는 나타내지 않을 수 있다.
실질적으로: 본원에서 사용된 바와 같이, "실질적으로(substantially)"라는 용어는 관심대상의 특성 또는 속성의 전체 또는 거의-전체 범위 또는 정도를 나타내는 질적 조건을 나타낸다. 생물학 분야의 통상의 기술자는 생물학적 및 화학적 현상이 거의 완료되지 않거나 또는 완전하게 진행되거나 완전한 결과를 달성하거나 회피하는 경우가 거의 없다는 것을 이해할 것이다. 따라서, 용어 "실질적으로"는 많은 생물학적 및 화학적 현상에 고유한 완전성의 잠재적인 결여를 포착하기 위해 본원에서 사용된다.
실질적 상동성: 구절 "실질적 상동성"은 본원에서 아미노산 또는 핵산 서열들 간의 비교를 지칭한다. 당업자에 의해 이해되는 바와 같이, 두 개의 서열에서 상응하는 위치에 상동성 잔기를 함유하는 경우, 이들은 일반적으로 "실질적으로 상동"인 것으로 간주된다. 상동 잔기는 동일한 잔기일 수 있다. 대안적으로, 상동 잔기는 동일하지 않은 잔기일 수 있으며, 적절하게 유사한 구조 및/또는 기능적 특성을 가질 것이다. 예를 들어, 당업자에게 잘 알려진 바와 같이, 특정 아미노산은 전형적으로 "소수성" 또는 "친수성" 아미노산으로 분류되고, 및/또는 "극성" 또는 "비-극성" 측쇄를 갖는 것으로 분류된다. 동일한 유형의 또다른 아미노산을 하나의 아미노산으로의 치환은 종종 "상동성" 치환으로 간주될 수 있다.
당분야에서 잘 알려진 바와 같이, 아미노산 또는 핵산 서열들은 다양한 알고리즘 중 임의의 것, 예를 들면, 뉴클레오티드 서열의 경우 BLASTN, 아미노산 서열의 경우 BLASTP, gapped BLAST 및 PSI-BLAST을 비롯한 이용가능한 상용 컴퓨터 프로그램을 사용하여 비교할 수 있다. 이러한 프로그램의 예시들이 다음에 설명되어 있다: Altschul, et al., basic local alignment search tool, J. Mol. Biol., 215(3): 403-410, 1990; Altschul, et al., Methods in Enzymology; Altschul, et al., "Gapped BLAST and PSI-BLAST: a new generation of protein database search programs", Nucleic Acids Res. 25:3389-3402, 1997; Baxevanis, et al., Bioinformatics : A Practical Guide to the Analysis of Genes and Proteins, Wiley, 1998; 그리고 Misener, et al., (eds.), Bioinformatics Methods and Protocols (Methods in Molecular Biology, Vol. 132), Humana Press, 1999. 상동 서열을 확인하는 것 외에도, 위에서 언급한 프로그램은 일반적으로 상동성 정도의 표시를 제공한다. 일부 구체예들에서, 두 서열이 만약 상응하는 잔기들의 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상이 잔기의 관련 구간(stretch)에 걸쳐 상동성이라면, 이들 두 서열은 실질적으로 상동성인 것으로 간주된다. 일부 구체예들에서, 상기 관련 구간은 온전한 서열이다. 일부 구체예들에서, 상기 관련 구간은 적어도 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125, 150, 175, 200, 225, 250, 275, 300, 325, 350, 375, 400, 425, 450, 475, 500개 또는 그 이상 잔기들이다.
실질적 동일성: 구절 "실질적 동일성"은 본원에서 아미노산 또는 핵산 서열들 간의 비교를 지칭한다. 당업자에 의해 이해되는 바와 같이, 두 개의 서열에서 상응하는 위치에 동일 잔기를 함유하는 경우, 이들은 일반적으로 "실질적으로 동일"인 것으로 간주된다. 당분야에서 잘 알려진 바와 같이, 아미노산 또는 핵산 서열들은 다양한 알고리즘 중 임의의 것, 예를 들면, 뉴클레오티드 서열의 경우 BLASTN, 아미노산 서열의 경우 BLASTP, gapped BLAST 및 PSI-BLAST을 비롯한 이용가능한 상용 컴퓨터 프로그램을 사용하여 비교할 수 있다. 이러한 프로그램의 예시들이 다음에 설명되어 있다: Altschul, et al., Basic local alignment search tool, J. Mol. Biol., 215(3): 403-410, 1990; Altschul, et al., Methods in Enzymology; Altschul et al., Nucleic Acids Res. 25:3389-3402, 1997; Baxevanis et al., Bioinformatics : A Practical Guide to the Analysis of Genes and Proteins, Wiley, 1998; 그리고 Misener, et al., (eds.), Bioinformatics Methods and Protocols (Methods in Molecular Biology, Vol. 132), Humana Press, 1999. 동일 서열을 확인하는 것 외에도, 위에서 언급한 프로그램은 일반적으로 동일성 정도의 표시를 제공한다. 일부 구체예들에서, 두 서열이 만약 상응하는 잔기들의 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상이 잔기의 관련 구간(stretch)에 걸쳐 동일하다면, 이들 두 서열은 실질적으로 동일성인 것으로 간주된다. 일부 구체예들에서, 상기 관련 구간은 온전한 서열이다. 일부 구체예들에서, 상기 관련 구간은 적어도 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125, 150, 175, 200, 225, 250, 275, 300, 325, 350, 375, 400, 425, 450, 475, 500개 또는 그 이상 잔기들이다.
~를 앓고 있는: 질환, 장애 및/또는 병태를 "앓고"있는 개체는 해당 질환, 장애 및/또는 병태의 하나 또는 그 이상의 증상으로 진단받았거나 또는 이를 나타낸다.
치료요법적으로 효과량: 본원에서 사용된 바와 같이, 치료요법제의 "치료요법적으로 효과량"이라는 용어는 질환, 장애 및/또는 병태를 앓고 있거나, 이에 민감한 대상체에게 투여될 때, 해당 질환, 장애 및/또는 병태의 증상(들)의 치료하고, 진단하고, 예방하고 및/또는 발병을 지연시키기에 충분한 양을 의미한다. 치료요법적으로 효과량은 적어도 하나의 단위 투여분량을 포함하는 투여 요법을 통해 전형적으로 투여된다는 것이 당업자에 의해 이해될 것이다.
치료하는: 본원에서 사용된 바와 같이, 용어 "치료하다", "치료", 또는 "치료하는"이란 특정 질환, 장애, 및/또는 병태의 하나 또는 그 이상의 증상 또는 특징을 부분적으로 또는 완전하게 완화시키고, 개선시키고, 경감시키고, 억제시키고, 예방하고, 발병을 지연시키고, 중증도 감소시키고 및/또는 발병률을 감소시키는데 사용되는 임의의 방법을 지칭한다. 해당 질환과 연합된 병리 발생 위험을 감소시킬 목적으로, 해당 질환의 징후를 나타내지 않는 대상체 및/또는 해당 질환의 초기 징후만을 나타내는 대상체에게 치료제가 투여될 수 있다.
본 명세서에서 종점에 의한 수치 범위의 언급은 그 범위 내에 포함된 모든 숫자 및 분수가 내포된다 (예를 들어, 1 ~ 5에는 1, 1.5, 2, 2.75, 3, 3.9, 4 및 5가 내포된다). 모든 숫자 및 이의 분획은 "약(about)"이라는 용어에 의해 수정된 것으로 추정된다는 것이 또한 이해되어야 한다.
본 발명의 각종 측면들을 다음의 단락들에서 상세하게 설명한다. 섹션의 사용으로 본 발명을 제한하려는 것이 아니다. 각 섹션은 본 발명의 모든 측면에 적용될 수 있다. 본 출원에서, "또는"이란 명시적으로 다른 언급이 없는 한, "및/또는"을 말한다. 본원에서 사용된 바와 같이, 단수("a", "an" 및 "the")형은 다른 명시적인 언급이 없는 한, 단수 개념 및 복수 개념 모두가 내포된다.
본 발명의 각종 측면들을 다음의 단락들에서 상세하게 설명한다. 섹션의 사용으로 본 발명을 제한하려는 것이 아니다. 각 섹션은 본 발명의 모든 측면에 적용될 수 있다. 본 출원에서, "또는"이란 명시적으로 다른 언급이 없는 한, "및/또는"을 말한다.
상세한 설명
본 명세서는 I2S 결핍과 연합된 질환, 이를 테면, Hunter 증후군 치료를 위해 I2S의 생체내 생성용으로 효과적이고, 강력한 재조합 아데노-연합된 바이러스 (rAAV) 벡터들을 기술한다.
뮤코다당증 유형 II (MPS II, Hunter 증후군)는 효소 이두로네이트-2-설파타제 (I2S)의 결핍으로 인해 발생되는 X-염색체-연계된 열성 리소좀 축적 장애다. I2S는 글리코사미노글리칸(GAG) 데르마탄 설페이트 및 헤파란 설페이트에서 말단 2-O-설페이트 모이어티를 절단시킨다. Hunter 증후군 환자들에서 I2S 효소가 없거나 또는 이 효소의 결함이 있기 때문에, GAG는 다양한 세포 유형의 리소좀에 점진적으로 축적되고, 이로 인하여 세포 울혈(engorgement), 기관 비대, 조직 파괴 및 기관 시스템 기능 장애로 이어진다.
일반적으로, Hunter 증후군 집단의 신체적 현시에는 신체 증상과 신경 증상이 모두 내포된다. 예를 들면, Hunter 증후군의 경우, 중추 신경계(CNS) 관련이 발달 지연과 신경계 문제로 이어진다. 예를 들면, 신경변성, 정신지체 등의 증상은 소아기에 나타나며, 신경영향으로 고통받는 Hunter 증후군 환자들은 뇌의 장기 손상으로 조기 사망하는 경우가 흔히 있다. 유사하게, GAG의 축적은 신체의 기관 시스템에 악영향을 미칠 수 있다. 처음에는 심장, 폐, 기도의 벽이 두꺼워지고, 그리고 간, 비장, 신장이 비정상적으로 비대해지는 것으로 나타나며, 이러한 심각한 변화는 궁극적으로 광범위한 장기 부전으로 이어질 수 있다. 결과적으로, 헌터 증후군은 항상 심각하고, 진행성이 있으며, 시한부 삶이 된다.
효소 대체 요법(ERT)은 Hunter 증후군(MPS II) 치료용으로 승인된 치료법으로, Hunter 증후군 환자에게 외생성 대체 I2S 효소를 투여하는 것과 관련된다. 그러나, ERT에는 다양한 결점이 연루되어 있는데, 그 중에서도, 예를 들면, 다양한 표적 기관으로 I2S의 분포가 한정적이라는 것이다.
본원에 기술된 벡터는 예를 들어, 간, 신장, 비장, 심장, 폐 및 중추신경계를 비롯한 다양한 기관에서 I2S의 강력한 발현을 제공한다. 따라서, 일부 구체예들에서, 본원에 기술된 벡터로 인하여 간에서 I2S가 발현된다. 따라서, 일부 구체예들에서, 본원에 기술된 벡터로 인하여 신장에서 I2S가 발현된다. 따라서, 일부 구체예들에서, 본원에 기술된 벡터로 인하여 비장에서 I2S가 발현된다. 따라서, 일부 구체예들에서, 본원에 기술된 벡터로 인하여 심장에서 I2S가 발현된다. 따라서, 일부 구체예들에서, 본원에 기술된 벡터로 인하여 폐에서 I2S가 발현된다. 따라서, 일부 구체예들에서, 본원에 기술된 벡터로 인하여 중추신경계에서 I2S가 발현된다. 따라서, 일부 구체예들에서, 본원에 기술된 벡터로 인하여 혈장에서 I2S가 발현된다.
rAAV I2S 벡터 디자인
일부 측면들에 있어서, 이두로네이트-2-설파타제 (I2S) 단백질을 인코딩하는 재조합 아데노-연합된 바이러스 (rAAV) 벡터가 본원에서 제공된다. 본 명세서의 예시적인 rAAV 벡터를 예시하는 개략도가 도 1B에 예시되어 있다. 도 1B에 나타낸 것과 같이, 일부 구체예들에서, 본 명세서의 rAAV 벡터는 간 특이적 프로모터, 5' 및 3' 역전된 말단 반복부 (ITR), 시스-작용 조절 모듈 (CRM), 인트론, 및 WPRE 서열을 포함한다.
일부 구체예들에서, 상기 벡터에는 또한 설파타제 변형 인자 1 (SUMF) 유전자가 내포된다. 일부 구체예들에서, 상기 벡터는 내부 리보솜 진입 부위 (IRES)를 포함한다.
상기 벡터의 이두로네이트-2-술파타제 (I2S)는 야생형 또는 코돈-최적화된 변이체일 수 있다. 따라서, 일부 구체예들에서, 상기 rAAV 벡터는 야생형 I2S 뉴클레오티드 서열을 포함한다. 일부 구체예들에서, 코돈-최적화된 I2S 서열을 포함한다.
본 발명을 위해 적합한 I2S는 자연-발생적 이두로네이트-2-설파타제 (I2S) 단백질의 적어도 부분적 활성을 대체하고, 또는 I2S-결핍과 연합된 하나 또는 그 이상의 표현형 또는 증상을 구조하는 임의의 단백질 또는 단백질의 일부분이다. 본원에서 사용된 바와 같이, 용어 "I2S 효소" 및 "I2S 단백질" 그리고 문법적으로 이의 등가체는 호환-사용된다.
전형적으로, 상기 인간 I2S 단백질은 전구체 형태로 만들어진다. 인간 I2S의 전구체 형태는 신호 펩티드 (상기 전장의 전구체의 아미노산 잔기 1-25), 프로-펩티드 (상기 전장의 전구체의 아미노산 잔기 26-33), 그리고 42 kDa 쇄(상기 전장의 전구체의 잔기 34-455)와 14 kDa 쇄(전장의 전구체의 잔기 446-550)로 추가 프로세싱될 수 있는 쇄를 함유한다. 전형적으로, 상기 전구체 형태를 전장의 전구체 또는 전장의 I2S 단백질로 또한 지칭할 수 있는데, 이것은 550개 아미노산을 함유한다. 상기 신호 펩티드는 제거되고, 전형적인 야생형 또는 자연-발생적 인간 I2S 단백질의 전장의 전구체 (서열 식별 번호:2)를 갖는 완전 발달된 형태의 아미노산 서열 (서열 식별 번호: 1)이 표 1에 제시된다. 상기 신호 펩티드는 밑줄로 표시된다.
표 1. 인간 이두로네이트-2-설파타제
다양한 종류의 프로모터가 본원에 기재된 rAAV 벡터에서 사용될 수 있다. 여기에는 예를 들면, 산재된, 조직-특이적, 및 조절가능한 (가령, 유도가능한, 또는 억제가능한) 프로모터가 내포된다. 일부 구체예들에서, 상기 프로모터는 간-특이적 프로모터다. 당분야에는 간-특이적 프로모터들이 공지되어 있고, 예를 들면, 인간 트란스티레틴 프로모터 (TTR), α-항-트립신 프로모터, 인간 인자 IX 프로/간 전사 인자-응답 올리고머, LSP, 및 기본 알부민 프로모터가 내포된다. 간 특이적 프로모터들은 예를 들면, Zhijian Wu et al., Molecular Therapy vol 16, no 2, February 2008에서 기술되며, 그 내용은 그 전문이 본원의 참고자료에 편입된다.
일부 구체예들에서, 상기 프로모터는 산재된 프로모터다. 일부 구체예들에서, 상기 프로모터는 닭 베타 액틴 프로모터다.
일부 구체예들에서, 상기 rAAV 벡터는 mRNA의 전사 및/또는 해독을 촉진시키기 위한 추가적인 인핸서 또는 조절 요소들 (예를 들자면, 인핸서 서열들, Kozak 서열들, 폴리아데닐화 서열들, 전사 종료 서열들, IRES 및 이와 유사한 것들)을 함유한다. 일부 구체예들에서, 상기 벡터는 5' 및 3' 역전된 말단 반복부 (ITR)를 포함한다. 일부 구체예들에서, 상기 벡터는 하나 또는 그 이상의 인핸서 요소들을 포함한다. 일부 구체예들에서, 상기 벡터는 poly(A) 꼬리를 포함한다.
일부 구체예들에서, 상기 rAAV 벡터는 하나 또는 그 이상의 작은 요소들, 이를 테면, 인트론을 포함한다. 다양한 인트론들이 당분야에 공지되어 있다. 본원에 기술된 rAAV 벡터용으로 적합한 인트론에는 예를 들면, MVM 인트론, 절두된 F.IX 인트론, 키메라 β 글로빈 SD/면역글로불린 중쇄 SA 인트론, SV40 및/또는 알파 글로빈 첫번째 인트론이 내포된다. 일부 구체예들에서, 상기 rAAV 벡터는 MVM 인트론을 포함한다. 일부 구체예들에서, 상기 rAAV 벡터는 SV40 인트론을 포함한다.
일부 구체예들에서, 상기 rAAV 벡터는 woodchuck 간염 바이러스 전사-후 제어 요소 (WPRE)를 포함한다. WPRE의 다양한 최적화된 또는 변이체 형태들이 당분야에 공지되어 있고, 그 중에는 WPRE3, WPREmut6delATG이 내포된다. 기타 변이체 WPRE 형태에는 예를 들면, WPRE2, WPRE_wt (GenBank 수탁 번호. J04514); WPRE_wt (GenBank 수탁 번호. J02442) 및 WPREmut6이 내포된다.
일부 구체예들에서, 상기 rAAV 벡터는 시스-액틴 조절 모듈 (CRM)을 포함한다. 본원에 기술된 벡터에서 사용에 적합한 다양한 종류의 CRM이 있으며, 예를 들면, 간-특이적 CRM, 신경-특이적 CRM이 내포된다. 일부 구체예들에서, 본원에 기술된 벡터에는 간세포-특이적 CRM, 예를 들면, CRM8이 내포된다. 일부 구체예들에서, 상기 벡터에는 하나 이상의 CRM이 내포된다. 예를 들면, 일부 구체예들에서, 상기 벡터는 두 개, 세 개, 네 개, 다섯 개 또는 여섯 개의 CRM을 포함한다. 일부 구체예들에서, 상기 벡터는 세 개의 CRM, 예를 들면, 세 개의 CRM8을 포함한다.
일부 구체예들에서, 상기 rAAV 벡터는 더욱 효과적인 해독을 위해 전사체 안정성을 증가시키고, 면역원성은 감소되도록 최적화된 서열이다. 일부 구체예들에서, I2S는 서열 최적화된다.
일부 구체예들에서, 상기 rAAV 벡터는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, 또는 AAV11 벡터이다. 일부 구체예들에서, 상기 rAAV 벡터는 AAV 1이다. 일부 구체예들에서, 상기 rAAV 벡터는 AAV 2이다. 일부 구체예들에서, 상기 rAAV 벡터는 AAV 3이다. 일부 구체예들에서, 상기 rAAV 벡터는 AAV 4이다. 일부 구체예들에서, 상기 rAAV 벡터는 AAV 5이다. 일부 구체예들에서, 상기 rAAV 벡터는 AAV 6이다. 일부 구체예들에서, 상기 rAAV 벡터는 AAV 7이다. 일부 구체예들에서, 상기 rAAV 벡터는 AAV 8이다. 일부 구체예들에서, 상기 rAAV 벡터는 AAV 9이다. 일부 구체예들에서, 상기 rAAV 벡터는 AAV 10이다. 일부 구체예들에서, 상기 rAAV 벡터는 AAV 11이다.
예시적인 요소 서열들은 하기 표 2에 나타낸다. 일부 구체예들에서, 상기 rAAV 벡터는 표 2에 나타낸 벡터 요소 서열과 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 동일성을 갖는 뉴클레오티드 서열을 포함하는 rAAV 벡터 요소를 포함한다. 일부 구체예들에서, 상기 rAAV 벡터는 표 2에 나타낸 벡터 요소의 뉴클레오티드 서열과 동일한 벡터 요소 뉴클레오티드 서열을 포함한다. 이 표에서, Xn (60-100)는 60-100개 뉴클레오티드를 포함하는 DNA 역가 테그를 의미한다.
표 2. 예시적인 I2S rAAV 요소 서열들
일부 구체예들에서, 상기 rAAV I2S 벡터는 하기 표 3에 나타낸 뉴클레오티드 서열에 대해 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 동일성을 갖는 뉴클레오티드 서열을 포함한다. 일부 구체예에서, 상기 rAAV I2S 벡터는 하기 표 3에 나타낸 뉴클레오티드 서열과 동일한 서열을 포함한다.
표 3: 예시적인 rAAV I2S 벡터 뉴클레오티드 서열들
질환 치료를 위한 I2S를 인코드하는 rAAV 벡터들의 용도
I2S 효소 결핍과 연합된 질환을 치료하는 방법들이 본원에서 기술된다. 따라서, 일부 구체예들에서, 본원에 기술된 rAAV 벡터들은 I2S 결핍, 이를 테면, Hunter 증후군 (MPSII)이 있는 대상체 치료에 적합하다. 치료 방법에는 본원에 기술된 재조합 아데노-연합된 바이러스 (rAAV) 벡터를 이를 필요로 하는 대상체에게 투여하는 것이 내포된다.
본원에 기술된 rAAV 벡터를 이용하여 I2S 결핍 또는 장애와 연합된 임의의 질환을 치료할 수 있다.
일부 구체예들에서, 상기 rAAV 벡터는 이를 필요로 하는 대상체에게 투여 후, 에피좀으로 유지된다. 일부 구체예들에서, 상기 rAAV 벡터는 이를 필요로 하는 대상체에게 투여 후, 에피좀에 남아있지 않는다. 예를 들면, 일부 구체예들에서, 상기 rAAV 벡터는 해당 대상체의 게놈으로 통합된다. 이러한 통합은 예를 들면, 다양한 유전자-편집 기술, 이를 테면, 아연 핑거 뉴클레아제 (ZFNs), 전사 활성자-유사 작동체 뉴클레아제 (TALENS), ARCUS 게놈 편집, 및/또는 CRISPR-Cas 시스템을 이용하여 이루어질 수 있다.
일부 구체예들에서, 본원에 기술된 rAAV 벡터를 포함하는 약제학적 조성물을 이용하여 이를 필요로 하는 대상체를 치료할 수 있다. 본 발명의 rAAV 벡터 또는 입자를 함유하는 상기 약제학적 조성물은 약제학적으로 수용가능한 부형제, 희석제 또는 담체를 함유한다. 적합한 약제학적 담체의 예는 당업계에 잘 알려져 있으며, 인산염 완충 식염수 용액, 물, 에멀젼, 예를 들어 오일/물 에멀젼, 다양한 유형의 습윤제, 멸균 용액 및 이와 유사한 것들이 내포된다. 이러한 담체는 통상적인 방법에 의해 제형화될 수 있고, 치료요법적으로 유효량으로 대상체에게 투여된다.
상기 rAAV 벡터는 이를 필요로 하는 대상체에게 적합한 경로를 통하여 투여된다. 구체예들에서, 상기 rAAV 벡터는 정맥내, 복강내, 피하, 또는 내피 경로에 의해 투여된다. 구체예들에서, 상기 rAAV 벡터는 정맥내로 투여된다. 구체예들에서, 상기 내피 투여는 "유전자 총" 또는 생물학적 입자 전달 시스템을 사용하는 투여를 포함한다. 일부 구체예들에서, 상기 rAAV 벡터는 비-바이러스성 지질 나노입자를 통하여 투여된다. 예를 들면, 상기 rAAV 벡터를 포함하는 조성물은 하나 또는 그 이상의 희석제, 완충제, 리포솜, 지질, 지질 복합체를 포함할 수 있다. 일부 구체예들에서, 상기 rAAV 벡터는 미소구 또는 나노입자, 이를 테면, 지질 나노입자 내에 포함된다. 일부 구체예들에서, 상기 rAAV 벡터들 및/또는 이식유전자 발현 카세트 및/또는 최적화된 IDS 이식유전자 서열들 및/또는 상기 유전자 발현 카세트의 임의의 조성물은 비-바이러스성 화학 입자들, 이를 테면, 지질 나노입자, 비-바이러스성 생물학적 분자들, 이를 테면, 엑소좀 및/또는 세포외 소포체를 통하여 투여된다.
일부 구체예들에서, 기능을 하는 I2S는 상기 rAAV 벡터의 투여-후 약 2 ~ 6 주 시점에서 해당 대상체의 혈장 또는 혈청에서 검출가능하다. 일부 구체예들에서, 기능을 하는 I2S는 약 2 주 시점에서 해당 대상체의 혈장 또는 혈청에서 검출가능하다. 일부 구체예들에서, 기능을 하는 I2S는 약 3 주 시점에서 해당 대상체의 혈장 또는 혈청에서 검출가능하다. 일부 구체예들에서, 기능을 하는 I2S는 약 4 주 시점에서 해당 대상체의 혈장 또는 혈청에서 검출가능하다. 일부 구체예들에서, 기능을 하는 I2S는 약 5 주 시점에서 해당 대상체의 혈장 또는 혈청에서 검출가능하다. 일부 구체예들에서, 기능을 하는 I2S는 약 6 주 시점에서 해당 대상체의 혈장 또는 혈청에서 검출가능하다. 일부 구체예들에서, 기능을 하는 I2S는 상기 rAAV 벡터의 투여-후 약 2 ~ 6 주 시점에서 해당 대상체의 간 세포에서 검출가능하다.
일부 구체예들에서, 기능을 하는 I2S는 상기 rAAV 벡터의 투여-후 적어도 3 개월, 6 개월, 12 개월, 2 년, 3 년, 4 년, 5 년, 6 년, 7 년, 8 년, 9 년, 또는 10 년 시점에서 해당 대상체의 혈장에서 검출가능하다. 따라서, 일부 구체예들에서, 기능을 하는 I2S는 상기 rAAV 벡터의 투여-후 적어도 3 개월 시점에서 해당 대상체의 혈장 또는 혈청에서 검출가능하다. 일부 구체예들에서, 기능을 하는 I2S는 상기 rAAV 벡터의 투여-후 적어도 6 개월 시점에서 해당 대상체의 혈장 또는 혈청에서 검출가능하다. 일부 구체예들에서, 기능을 하는 I2S는 상기 rAAV 벡터의 투여-후 적어도 12 개월 시점에서 해당 대상체의 혈장 또는 혈청에서 검출가능하다. 일부 구체예들에서, 기능을 하는 I2S는 상기 rAAV 벡터의 투여-후 적어도 2 년 시점에서 해당 대상체의 혈장 또는 혈청에서 검출가능하다. 일부 구체예들에서, 기능을 하는 I2S는 상기 rAAV 벡터의 투여-후 적어도 3 년 시점에서 해당 대상체의 혈장 또는 혈청에서 검출가능하다. 일부 구체예들에서, 기능을 하는 I2S는 상기 rAAV 벡터의 투여-후 적어도 4 년 시점에서 해당 대상체의 혈장 또는 혈청에서 검출가능하다. 일부 구체예들에서, 기능을 하는 I2S는 상기 rAAV 벡터의 투여-후 적어도 5 년 시점에서 해당 대상체의 혈장 또는 혈청에서 검출가능하다. 일부 구체예들에서, 기능을 하는 I2S는 상기 rAAV 벡터의 투여-후 적어도 6 년 시점에서 해당 대상체의 혈장 또는 혈청에서 검출가능하다. 일부 구체예들에서, 기능을 하는 I2S는 상기 rAAV 벡터의 투여-후 적어도 7 년 시점에서 해당 대상체의 혈장 또는 혈청에서 검출가능하다. 일부 구체예들에서, 기능을 하는 I2S는 상기 rAAV 벡터의 투여-후 적어도 8 년 시점에서 해당 대상체의 혈장 또는 혈청에서 검출가능하다. 일부 구체예들에서, 기능을 하는 I2S는 상기 rAAV 벡터의 투여-후 적어도 9 년 시점에서 해당 대상체의 혈장 또는 혈청에서 검출가능하다. 일부 구체예들에서, 기능을 하는 I2S는 상기 rAAV 벡터의 투여-후 적어도 10 년 시점에서 해당 대상체의 혈장 또는 혈청에서 검출가능하다. 일부 구체예들에서, 기능을 하는 I2S는 상기 rAAV 벡터의 투여-후, 해당 대상체의 남은 여생 동안 해당 대상체의 혈장 또는 혈청에서 검출가능하다.
일부 구체예들에서, I2S를 포함하는 rAAV를 투여하면, 정맥내로 전달된 정제된 I2S 단백질의 투여-후 발견되는 것과 동일한 정도로 활성 I2S가 생성된다. 일부 구체예들에서, I2S를 포함하는 rAAV를 투여하면, 정맥내로 전달된 정제된 I2S 단백질 투여와 비교하였을 때, 더 많은 양의 활성 I2S가 생성된다.
일부 구체예들에서, I2S를 포함하는 rAAV를 투여하면, 해당 대상체에서 글리코사미노글리칸 (GAG)의 감소를 초래한다. 일부 구체예들에서, I2S를 포함하는 rAAV를 투여하면, I2S를 포함하는 상기 rAAV 투여 전 해당 대상체의 기준 GAG 수준과 비교하였을 때, 해당 대상체에서 GAG가 약 95%, 90%, 85%, 80%, 75%, 70%, 65%, 60%, 55%, 50%, 45%, 40%, 35%, 30%, 25%, 20%, 15%, 또는 약 10% 감소된다. 따라서, 일부 구체예들에서, I2S를 포함하는 rAAV를 투여하면, 해당 대상체에서 GAG가 약 95% 감소된다. 일부 구체예들에서, I2S를 포함하는 rAAV를 투여하면, 해당 대상체에서 GAG가 약 90% 감소된다. 일부 구체예들에서, I2S를 포함하는 rAAV를 투여하면, 해당 대상체에서 GAG가 약 85% 감소된다. 일부 구체예들에서, I2S를 포함하는 rAAV를 투여하면, 해당 대상체에서 GAG가 약 80% 감소된다. 일부 구체예들에서, I2S를 포함하는 rAAV를 투여하면, 해당 대상체에서 GAG가 약 75% 감소된다. 일부 구체예들에서, I2S를 포함하는 rAAV를 투여하면, 해당 대상체에서 GAG가 약 70% 감소된다. 일부 구체예들에서, I2S를 포함하는 rAAV를 투여하면, 해당 대상체에서 GAG가 약 65% 감소된다. 일부 구체예들에서, I2S를 포함하는 rAAV를 투여하면, 해당 대상체에서 GAG가 약 60% 감소된다. 일부 구체예들에서, I2S를 포함하는 rAAV를 투여하면, 해당 대상체에서 GAG가 약 55% 감소된다. 일부 구체예들에서, I2S를 포함하는 rAAV를 투여하면, 해당 대상체에서 GAG가 약 50% 감소된다. 일부 구체예들에서, I2S를 포함하는 rAAV를 투여하면, 해당 대상체에서 GAG가 약 45% 감소된다. 일부 구체예들에서, I2S를 포함하는 rAAV를 투여하면, 해당 대상체에서 GAG가 약 40% 감소된다. 일부 구체예들에서, I2S를 포함하는 rAAV를 투여하면, 해당 대상체에서 GAG가 약 35% 감소된다. 일부 구체예들에서, I2S를 포함하는 rAAV를 투여하면, 해당 대상체에서 GAG가 약 30% 감소된다. 일부 구체예들에서, I2S를 포함하는 rAAV를 투여하면, 해당 대상체에서 GAG가 약 25% 감소된다. 일부 구체예들에서, I2S를 포함하는 rAAV를 투여하면, 해당 대상체에서 GAG가 약 20% 감소된다. 일부 구체예들에서, I2S를 포함하는 rAAV를 투여하면, 해당 대상체에서 GAG가 약 15% 감소된다. 일부 구체예들에서, I2S를 포함하는 rAAV를 투여하면, 해당 대상체에서 GAG가 약 10% 감소된다.
일부 구체예들에서, I2S를 포함하는 rAAV를 투여하면, 적어도 약 2 주, 1 개월, 2 개월, 3 개월, 4 개월, 5 개월, 6 개월, 12 개월, 1 년, 2 년, 3 년, 4 년, 5 년, 또는 5년 이상 동안 해당 대상체에서 GAG가 감소된다.
일부 구체예들에서, 대상체에게 AAV 벡터를 투여한 후, 순환계에서 검출가능한 기능을 하는 I2S의 수준은 I2S를 포함하는 rAAV의 투여-전 해당 대상체에서 검출가능한 기능을 하는 I2S의 양보다 약 2배 ~ 10배 더 많다.
일부 구체예들에서, 해당 대상체에게 AAV 벡터를 투여한 후, 검출가능한 활성 I2S의 수준은 인간의 치료요법적 수준을 충족하거나 또는 이를 초과한다. 일부 구체예들에서, 상기 rAAV 벡터를 투여한 후 활성 I2S의 수준은 상기 인간 치료요법적 수준의 약 2 ~ 35배이다. 일부 구체예들에서, 상기 투여-후 활성 I2S의 수준은 상기 인간 치료요법적 수준의 약 2배이다. 일부 구체예들에서, 상기 투여-후 활성 I2S의 수준은 상기 인간 치료요법적 수준의 약 3배이다. 일부 구체예들에서, 상기 투여-후 활성 I2S의 수준은 상기 인간 치료요법적 수준의 약 4배이다. 일부 구체예들에서, 상기 투여-후 활성 I2S의 수준은 상기 인간 치료요법적 수준의 약 5배이다. 일부 구체예들에서, 상기 투여-후 활성 I2S의 수준은 상기 인간 치료요법적 수준의 약 6배이다. 일부 구체예들에서, 상기 투여-후 활성 I2S의 수준은 상기 인간 치료요법적 수준의 약 6배이다. 일부 구체예들에서, 상기 투여-후 활성 I2S의 수준은 상기 인간 치료요법적 수준의 약 7배이다. 일부 구체예들에서, 상기 투여-후 활성 I2S의 수준은 상기 인간 치료요법적 수준의 약 8배이다. 일부 구체예들에서, 상기 투여-후 활성 I2S의 수준은 상기 인간 치료요법적 수준의 약 9배이다. 일부 구체예들에서, 상기 투여-후 활성 I2S의 수준은 상기 인간 치료요법적 수준의 약 10배이다. 일부 구체예들에서, 상기 투여-후 활성 I2S의 수준은 상기 인간 치료요법적 수준의 약 15배이다. 일부 구체예들에서, 상기 투여-후 활성 I2S의 수준은 상기 인간 치료요법적 수준의 약 20배이다. 일부 구체예들에서, 상기 투여-후 활성 I2S의 수준은 상기 인간 치료요법적 수준의 약 25배이다. 일부 구체예들에서, 상기 투여-후 활성 I2S의 수준은 상기 인간 치료요법적 수준의 약 30배이다. 일부 구체예들에서, 상기 투여-후 활성 I2S의 수준은 상기 인간 치료요법적 수준의 약 35배이다.
따라서, I2S를 포함하는 rAAV 벡터의 투여는 정제된 I2S를 이를 필요로 하는 대상체에게 단일 투여한 것과 비교하여 지속적인 강력한 발현을 초래한다.
일부 구체예들에서, 상기 rAAV I2S 벡터는 각 대상체에게 단일 투여분량으로 전달된다. 일부 구체예들에서, 해당 대상체에게 최소 효과 투여분량 (MED)으로 전달된다. 본원에서 사용된 바와 같이, MED는 해당 대상체에서 GAG 수준 감소를 초래하는 I2S 활성을 얻는데 요구되는 rAAV I2S 벡터 투여분량을 나타낸다.
벡터 역가는 벡터 조제물의 DNA 함량을 기준으로 결정된다. 일부 구체예들에서, 정량적 PCR 또는 최적화된 정량적 PCR을 사용하여 rAAV I2S 벡터 조제물의 DNA 함량을 결정한다. 한 구체예에서, 상기 용량은 약 1 x 1011 벡터 게놈 (vg)/체중 (kg) ~ 약 1 x 1013 vg/kg(양 끝점 포함)이다.
한 구체예에서, 상기 용량은 1 x 109 vg/kg ~ 3 x 1015 vg/kg(예를 들면, 1 x 109 vg/kg, 3 x 109 vg/kg, 1 x 1010 vg/kg, 3 x 1010 vg/kg, 1 x 1011 vg/kg, 3 x 1011 vg/kg, 1 x 1012 vg/kg, 3 x 1012 vg/kg, 1 x 1013 vg/kg, 3 x 1013 vg/kg, 1 x 1014 vg/kg, 3 x 1014 vg/kg, 1 x 1015 vg/kg, 3 x 1015 vg/kg) 범위에서 선택된다. 일부 구체예들에서, 상기 용량은 5 x 1013 vg/kg이다. 또다른 구체예에서, 상기 용량은 5 x l012 vg/kg이다. 특이적 구체예에서, 대상체에게 투여되는 rAAV 투여분량은 적어도 5 x 1011 vg/kg, 1 x 1012 vg/kg, 1.5 x 1012 vg/kg, 2.0 x 1012 vg/kg, 2.5 x 1012 vg/kg, 3.0 x 1012 vg/kg, 3.5 x 1012 vg/kg, 4.0 x 1012 vg/kg, 4.5 x 1012 vg/kg, 5.0 x 1012 vg/kg, 5.5 x 1012 vg/kg, 6.0 x 1012 vg/kg, 6.5 x 1012 vg/kg, 7.0 x 1012 vg/kg, 또는 7.5 x 1012 vg/kg이다.
일부 구체예들에서, 상기 rAAV I2S 벡터 조성물은 약 1.0 x 109 vg ~ 약 1.0 x 1015 vg 범위인 복제-결함 바이러스의 양을 함유하도록 용량 단위로 제형화될 수 있다. 본원에서 사용된 바와 같이, 용어 "용량(dosage)"은 치료 과정에서 해당 대상체에게 전달되는 총 용량, 또는 단일(다회) 투여로 전달되는 양을 나타낼 수 있다.
일부 구체예들에서, 상기 용량은 해당 환자의 혈장 GAG 수준을 25% 또는 그 이상 감소시키기에 충분하다. 일부 구체예들에서, rAAV I2S는 Hunter 증후군 치료를 위한 하나 또는 그 이상의 요법과 함께 투여된다.
rAAV 바이러스 벡터들의 생산
대상체에게 전달하기에 적합한 AAV 바이러스 벡터를 만들고, 단리하는 방법은 당업계에 공지되어 있다. 예를 들자면, US 특허 7790449; US 특허 7282199; WO 2003/042397; WO 2005/033321, WO 2006/1 10689; 그리고 US 7588772 B2 참고. 한 시스템에서, 생산자 세포주에 ITRs이 측면에 있는 이식유전자를 인코딩하는 구조체와 rep 및 cap을 인코딩하는 구조체로 일시적으로 형질감염시킨다. 두 번째 시스템에서, rep 및 cap을 안정적으로 공급하는 패키징 세포주에 ITRs이 측면에 있는 이식유전자를 인코딩하는 구조체로 일시적으로 형질감염시킨다. 이들 각각의 시스템에서, AAV 비리온은 헬퍼 아데노바이러스 또는 헤르페스바이러스 감염에 대한 반응으로 생성되며, 오염 바이러스로부터 rAAV를 분리해야 한다. 보다 최근에는, AAV를 복구하기 위해 헬퍼 바이러스(예: 아데노바이러스 E1, E2a, VA 및 E4 또는 헤르페스바이러스 UL5, UL8, UL52 및 UL29) 감염을 필요로 하지 않는 시스템이 개발되었고, 헤르페스바이러스 중합효소 또한 이 시스템에 의해 트랜스로 공급된다. 이러한 새로운 시스템에서, 헬퍼 기능은 요구되는 헬퍼 기능을 인코딩하는 구조체로 세포를 일시적인 형질감염을 통해 공급될 수 있거나, 또는 세포는 헬퍼 기능을 인코드하는 유전자를 안정적으로 함유하도록 조작될 수 있으며, 그 유전자의 발현은 전사 또는 전사 후 수준에서 제어될 수 있다.
일부 구체예들에서, ITRs 및 rep/cap 유전자 측면 발현 카세트는 배큘로바이러스-기반 벡터를 이용한 감염에 의해 원하는 세포 또는 세포주로 도입된다.
일부 구체예들에서, ITRs 및 rep/cap 유전자 측면 발현 카세트는 배큘로바이러스-기반 벡터를 이용한 감염에 의해 곤충 세포로 도입된다. 이들 생산 시스템에 대한 검토를 위해, 일반적으로, 예를 들자면, Zhang et al, 2009, "Adenovirus-adeno-associated virus hybrid for large-scale recombinant adeno-associated virus production," Human Gene Therapy 20:922-929를 참고하며, 이의 내용은 이의 전문이 본원에 참고자료에 편입된다. 이들 및 기타 AAV 생산 시스템을 만들고, 사용하는 방법들은 다음의 미국 특허들에도 설명되어 있으며, 그 각각의 내용은 전체가 본원의 참조에 편입된다: 5, 139,941 ; 5,741,683; 6,057, 152; 6,204,059; 6,268,213; 6,491,907; 6,660,514; 6,951,753; 7,094,604; 7, 172,893; 7,201,898; 7,229,823; 그리고 7,439,065. 전반적으로, 예를 들자면, Grieger & Samulski, 2005, "Adeno-associated virus as a gene therapy vector: Vector development, production and clinical applications," Adv. Biochem. Engin/Biotechnol. 99: 119-145; Buning et al, 2008, "Recent developments in adeno-associated virus vector technology," J. Gene Med 10:717-733; 그리고 하기 언급된 참조자료 참고, 이들 각각은 전체가 본원의 참조에 편입된다.
본 발명의 임의의 구체예들을 구축하기 위해 사용된 방법들은 핵산 조작의 숙련가에게 공지되어 있고, 유전 공학, 재조합 공학 및 합성 기술들이 내포된다. 예를 들자면, Green and Sambrook et al, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Press, Cold Spring Harbor, NY (2012) 참고. 유사하게, rAAV 비리온을 생성하는 방법들이 잘 알려져 있고, 적합한 방법의 선택이 본 발명을 국한시키는 것은 아니다. 예를 들자면, K. Fisher et al, (1993) J. Virol, 70:520-532 및 US 특허 번호 5,478,745 참고.
본 발명에 따라 사용될 수 있는 많은 플라스미드 및 기타 클로닝 및 발현 벡터는 잘 알려져 있고, 당업자에게 용이하게 이용가능하다. 더욱이, 당업자는 본 발명에 사용하기에 적합한 임의의 수의 다른 플라스미드를 쉽게 구축할 수 있다. 본 발명에서 이러한 플라스미드, 뿐만 아니라 다른 벡터의 속성, 구축 및 용도는 본 개시내용으로부터 당업자에게 용이하게 명백할 것이다.
한 구체예에서, 상기 생산 플라스미드는 본원에 기술된 것, 또는 WO2012/158757에 기술된 바와 같으며, 이는 본원의 참고자료에 편입된다. 다양한 플라스미드가 rAAV 벡터들 생성에 사용하기 위해 당업계에 공지되어 있고, 본 발명에서 유용하다. 상기 생산 플라스미드는 AAV cap 및/또는 rep 단백질들을 발현시키는 숙주 세포에서 배양된다. 상기 숙주 세포에서, 각각의 rAAV 게놈은 구조되고, 캡시드 단백질 또는 외피 단백질로 패키징되어, 감염성 바이러스 입자들이 형성된다.
특정 구체예들에서, 상기 rAAV 발현 카세트, 상기 벡터 (이를 테면, rAAV 벡터), 상기 바이러스 (이를 테면, rAAV), 상기 생산 플라스미드는 AAV 역전된 말단 반복부 서열들, IDS 및/또는 SUMF-1을 인코드하는 코돈 최적화된 핵산 서열 그리고 숙주 세포에서 상기 인코드된 단백질의 발현을 지시하는 발현 제어 서열들을 포함한다. 다른 구체예들에서, 상기 rAAV 발현 카세트, 상기 바이러스, 상기 벡터 (이를 테면, rAAV 벡터), 상기 생산 플라스미드는 인트론, Kozak 서열, polyA, 전사-후 조절 요소들과 기타 다른 것들중 하나 또는 그 이상을 더 포함한다. 한 구체예에서, 상기 전사-후 조절 요소는 Woodchuck 간염 바이러스 (WHP) 전사-후 조절 요소 (WPRE)이다.
AAV 벡터의 생산 및 정제와 관련된 다양한 방법이 당업계에 공지되어 있다. 예를 들자면, Mizukami, Hiroaki, et al. A Protocol for AAV vector production and purification; U.S. 특허 공개 번호 US20070015238 및 US20120322861 참고. 예를 들면, 관심대상 유전자를 포함하는 플라스미드는 하나 또는 그 이상의 헬퍼 플라스미드, 예를 들자면, rep 유전자 (예를 들자면, Rep78, Rep68, Rep52 및 Rep40을 인코딩하는) 및 cap 유전자 (본원에서 기술된 바와 같은 변형된 VP2 영역을 비롯하여, VP1, VP2, 및 VP3을 인코딩하는)를 함유하는 플라스미드와 복합될 수 있고, 재조합 세포로 형질감염되어, 상기 rAAV는 패키지되고, 후속적으로 정제될 수 있다.
일부 구체예들에서, 상기 패키징은 포유동물 세포 또는 곤충 세포와 같은 헬퍼 세포 또는 생산자 세포에서 수행된다. 예시적인 포유류 세포에는 HEK293 세포, COS 세포, HeLa 세포, BHK 세포, 또는 CHO 세포 (예를 들자면, ATCC® CRL-1573™, ATCC® CRL-1651™, ATCC® CRL-1650™, ATCC® CCL-2, ATCC® CCL-10™, 또는 ATCC® CCL-61™)이 내포되나, 이에 국한되지 않는다. 예시적인 곤충 세포에는 Sf9 세포 (예를 들자면, ATCC® CRL-1711™ 참고)가 내포되나, 이에 국한되지 않는다. 헬퍼 세포는 본 명세서에 기재된 방법에 사용하기 위한 Rep 단백질 및/또는 Cap 단백질을 인코딩하는 rep 및/또는 cap 유전자를 포함할 수 있다. 일부 구체예들에서, 상기 패키징은 시험관내에서 실행된다.
일부 구체예들에서, 관심대상 유전자를 포함하는 플라스미드는 하나 또는 그 이상의 헬퍼 플라스미드, 예를 들자면, 제 1 혈청형의 rep 유전자 및 동일한 혈청형 또는 상이한 혈청형의 cap 유전자를 함유하는 플라스미드와 복합될 수 있고, 재조합 세포로 형질감염되어, 상기 rAAV는 패키징된다.
일부 구체예들에서, 상기 하나 또는 그 이상의 헬퍼 플라스미드에는 rep 유전자 및 cap 유전자를 포함하는제 1 헬퍼 플라스미드, 그리고 다음의 헬퍼 유전자중 하나 또는 그 이상을 포함하는 제 2의 헬퍼 플라스미드가 내포된다: Ela 유전자, Elb 유전자, E4 유전자, E2a 유전자, 및 VA 유전자. 명확성을 위해, 헬퍼 유전자는 헬퍼 단백질 Ela, Elb, E4, E2a 및 VA를 인코딩하는 유전자다. 일부 구체예들에서, 상기 cap 유전자는 단백질 VP1, VP2 및 VP3 중 하나 또는 그 이상이 발현되지 않도록 변형된다. 일부 구체예들에서, 상기 cap 유전자는 VP2가 발현되지 않도록 변형된다. 이러한 변형을 만드는 방법은 당업계에 알려져 있다 (Lux et al. (2005), J Virology, 79: 11776-87).
헬퍼 플라스미드, 및 이러한 플라스미드를 만드는 방법은 당분야에 공지되어 있고, 일반적으로 상업적으로 이용가능하다 (예를 들자면, pDF6, pRep, pDM, pDG, pDPlrs, pDP2rs, pDP3rs, pDP4rs, pDP5rs, pDP6rs, pDG(R484E/R585E), 및 pDP8.ape 플라스미드(PlasmidFactory, Bielefeld, Germany 참고); 기타 생산품 및 서비스는 Vector Biolabs, Philadelphia, PA; Cellbiolabs, San Diego, CA; Agilent Technologies, Santa Clara, Ca; and Addgene, Cambridge, MA에서 이용가능하다; pxx6; Grimm et al. (1998), Novel Tools for Production and Purification of Recombinant Adeno associated Virus Vectors, Human Gene Therapy, Vol. 9, 2745-2760; Kem, A. et al. (2003), Identification of a Heparin-Binding Motif on Adeno- Associated Virus Type 2 Capsids, Journal of Virology, Vol. 77, 11072-11081.; Grimm et al. (2003), Helper Virus-Free, Optically Controllable, and Two-Plasmid-Based Production of Adeno-associated Virus Vectors of Serotypes 1 to 6, Molecular Therapy, Vol. 7, 839-850; Kronenberg et al. (2005).
실시예들
본 발명의 다른 속성들, 목적 및 이점은 다음의 실시예들로부터 자명하다. 그러나, 본 발명의 구체예들을 나타내는 실시예들은 단지 예시로서 제공된다는 것을 이해해야 하며, 이에 국한시킨다는 의도가 아니다. 본 발명의 범위 안에 있는 다양한 변화 및 변형들은 실시예로부터 당업자에게 자명하기 때문에, 오로지 설명을 위하여 제공되는 것으로 이해되어야 한다.
실시예 1. 벡터 디자인
인간 이두로네이트 2-설파타제 (IDS 또는 I2S)의 코딩 서열 및 이의 변이를 포함하는 rAAV 발현 구조체(rAAV 벡터)을 생성하는 예시적인 방법 및 디자인이 본 실시예에서 제공된다. 본 연구에서, 재조합 AAV 벡터 (rAAV8)가 이용되었다. rAAV 벡터의 기본 디자인은 역전된 말단 반복부(ITRs): 5'-ITR 및 3'-ITR 측면에 있는 발현 카세트를 포함한다. 이러한 ITRs는 벡터 생산자 세포에서 AAV 복제 단백질 Rep 및 관련 인자들에 의한 벡터 게놈의 복제 및 패키징을 매개한다. 전형적으로, 발현 카세트는 도 1A에 도시된 바와 같이 프로모터, 코딩 서열, polyA 꼬리 및/또는 태그를 함유한다. 인간 IDS(hIDS)를 인코딩하는 발현 구조체는 표준 분자 생물학 기술을 사용하여 설계 및 준비되었다. hIDS에 대한 코딩 서열은 프로모터, hTTR (인간 트랜스티레틴 프로모터)의 하류에 삽입되었다. 추가적으로, 간-특이적 시스-작용 조절 모듈 (CRM)은 상기 프로모터의 상류에 삽입되었고, 마우스의 극미한 바이러스 (MVM) 인트론 서열은 상기 프로모터의 하류에 삽입되었다. 이 조절 및 프로모터 조합은 다음 예에서 볼 수 있듯이 높은 형질도입 수준에 대해 테스트되었다. 또한, WPRE 서열은 코딩 영역의 하류에 삽입되었다. 이론에 얽매이지 않고, 이 요소는 mRNA 안정성을 증가시키는 3차 구조를 창출한다. 예를 들어, 전사 종결 개선 및 mRNA 핵 방출 촉진을 포함하여 WPRE에 대한 다른 기능 메커니즘이 기술되었다. 도 1B는 위에서 설명한 발현 구조체의 개략도를 보여준다. 그런 다음, 상기 발현 구조체를 AAV 플라스미드 백본으로 클로닝하고, 시퀀싱으로 확인했다. 벡터를 바이러스 입자에 패키징하고, 보관하였다.
위 구성에서 다수의 변형을 수행할 수 있다. 도 2와 같이, WPRE 서열을 내부 리보솜 진입 부위(IRES)가 앞에 오는 SUMF1(설파타제 수정 인자 1) 코딩 서열로 교체하여, 대체 구조체를 얻을 수 있다. 공개된 데이터(Fraldi A et al. 2007. Biochem J. 403:305-312)에 기초하여, 시험관내 세포 기반 분석에서 테스트될 때 SUMF1이 존재하면 I2S 활성이 증가된다. 동일한 연구에서 발표된 추가 생체 내 데이터는 SUMF1이 있을 때 설파미다제 (SGSH) 활성이 더 크게 개선되었음을 보여주었다. 단서조건으로, SUMF1은 소포체에서 IDS를 비롯한, 기질의 포르밀 글리신 촉매 잔기 활성화에 필요하다면, 동일한 벡터로부터의 IDS 및 SUMF1의 공동-발현은 세포 수준에서 IDS 양 증가를 위해 증가된 양의 SUMF1이 있음을 보장할 수 있고, 따라서, 활성화된 IDS가 리소좀으로 트래피킹되기 전에 처리되거나, 또는 업데이트를 위해 다른 세포로 이동하기 위해 세포를 벗어나갈 확률이 증가한다.
코돈 최적화.
또한, IDS 또는 SUMF1에 대한 코딩 서열은 코돈 채택 지수(CAI), CpG 부위 계수, GC 함량 및 반복성 염기 서열과 같은 여러 매개변수를 기반으로 코돈- 최적화되었다. 더 자주 사용되는 코돈을 활용하고, 잠재적으로 이 벡터로부터의 이식유전자 산물 발현 수준을 증가시키기 위해 높은 CAI는 선호되었다. 면역 반응을 유발할 수 있는 CpG 부위들은 감소했다. 반복성 염기들도 제거되었다. 이를 위해 COOL(Codon Optimization Online)이라는 합성 유전자 설계용 웹-기반 다중-목표 최적화 플랫폼과 내부 코돈 사용 빈도 테이블이 사용되었다. 추가적으로, 잠재적인 스플라이싱(splicing) 부위를 수작업으로 제거했다. 최적화된 hIDS 및 SUMF1 코딩 서열들의 특징들은 표 4에 요약하였고, hIDS-WPRE 및 hIDS-IRES-SUMF1의 대표적인 구조체에 대한 개략도는 각각 도 1B 및 도 2에서 제공된다. 위 구성에서 다수의 변형을 수행할 수 있다. 예를 들면, 하나 이상의 프로모터가 사용될 수 있고, 및/또는 IRES 서열이 코딩 영역의 상류에 도입될 수 있다. 추가적으로, 조절 영역, 프로모터 및 인트론의 다양한 조합이 고려될 수 있다.
표 4: 최적화된 hIDS 및 SUMF1 코딩 서열들의 예시적인 특징들
실시예 2. 생체내에서 rAAV-구동된 hIDS-WPRE 발현의 발현
본 실시예는 생체내에서 rAAV-구동된 IDS 발현에 최적화된 구조체의 효능을 설명한다. 마우스에게 대조군 벡터 (rAAV-XL032) (그룹 A); 또는 테스트 샘플 rAAV-XL024 (hIDS wt-WPRE) 구조체 (그룹 B) 또는 rAAV-XL026 (hIDS-AUSopt-WPRE) 구조체 (그룹 C) (도 1A 및 도 1B에 도시됨)을 주사하였다. 6주령의 마우스들은 꼬리 정맥을 통하여 200μl 용적으로 5x 109 vg의 벡터들을 제공받았고, 혈청 샘플을 주사-후 2 일차, 7 일차, 21 일차, 8 주차, 및 12 주차 시점에 수거하였다. 마우스를 12 주차에 희생시키고, 조직 샘플을 수거하였다. 연령-일치되는 야생형 마우스 그룹과 연령-일치되는 처리되지 않은 IDS-KO 마우스 그룹을 각각 양성 및 음성 대조군으로 사용했다. 실험 기획안은 하기 표 5에서 요약된다.
표 5. hIDS를 인코드하는 rAAV 벡터들을 이용한 예시적인 생체내 연구
벡터-매개된 발현량은 B85 항체를 사용하는 ELISA에 의해 결정되었다. 도 3에 결과를 도시한다. 최적화된 구조체의 rAAV 벡터, rAAV-XL024 (그룹 B) 및 rAAV-XL026 (그룹 C)를 주사한 마우스들은 대조군 벡터인 rAAV-XL032 (그룹 A)[CpG 부위를 감소시키지 않는 상이한 알고리즘에 의해 코돈-최적화된 hIDS 그리고 더 짧은 형태의 야생형 WPRE 서열을 인코드하는 벡터]와 비교하였을 때, 혈청에 hIDS 농도가 더 높았다. 벡터들 (그룹 A-C)을 주사한 모든 그룹의 경우, 단일 주사 후, hIDS 농도는 21일차 시점까지 증가되었고, hIDS 수준은 최대 12 주 (84 일)까지 유지되었다. 모든 WT 및 IDS-KO 그룹은 인간 IDS를 발현시키지 않으므로, hIDS는 검출되지 않았다.
도 4A에 나타낸 것과 같이, hIDS 활성 수준을 테스트하였을 때, 유사한 결과를 얻었다. 벡터들 (그룹 A-C)을 주사한 모든 그룹의 경우, 상기 활성 수준은 21일차 까지 증가한다. 발현 결과와 유사하게, 최적화된 구조체의 rAAV 벡터들을 주사한 마우스 그룹 (그룹 B 및 그룹 C)에서 hIDS 활성은 대조군 벡터 rAAV-XL032 (그룹 A)를 주사맞은 마우스 그룹보다 더 높았다. WT 마우스 그룹의 hIDS 활성 수준은 연구 기간을 통하여 상대적으로 안정적이었다. 본 실시예에서 이용된 rAAV 벡터는 rAAV8이었다.
조직에서, hI2S는 ELISA를 이용하여 측정되었다(도 4B에 나타냄). rAAV-XL024 (그룹 B)의 경우, 간 및 신장에서 hI2S가 검출가능하였지만, 뇌에서는 아니다. 이 그룹의 경우, 심장 및 비장은 분석하지 않았다. rAAV-XL026 (그룹 C)의 경우, 간, 신장, 심장, 비장, 및 뇌에서 hI2S가 검출가능하였다. rAAV-XL032 (그룹 A)의 경우, 간, 신장, 및 뇌에서 hI2S가 검출가능하였다. 이 그룹의 경우, 심장 및 비장은 분석하지 않았다.
조직에서, hI2S는 활성을 이용하여 측정되었다(도 4C에 나타냄). rAAV-XL024 (그룹 B)의 경우, 간, 신장, 및 뇌에서 hI2S가 검출가능하였다. 이 그룹의 경우, 심장 및 비장은 분석하지 않았다. rAAV-XL026 (그룹 C)의 경우, 간, 신장, 심장, 비장, 및 뇌에서 hI2S가 검출가능하였다. rAAV-XL032 (그룹 A)의 경우, 간, 신장, 및 뇌에서 hI2S가 검출가능하였다. 이 그룹의 경우, 심장 및 비장은 분석하지 않았다. 효소 활성 수준은 WT 그룹과 비교하였다(도 4D에 나타냄). 혈청 및 체세포 조직에서, 모든 벡터 투여 그룹은 WT보다 큰 활성 수준을 함유하였다. 뇌에서, rAAV-XL026 및 rAAV-XL032 수준은 WT보다 더 작았다.
실시예 3. hIDS-WPRE 구조체를 이용한 유전자 요법에 의한 GAG 제거
효소 이두로네이트-2-설파타제 (IDS)는 글리코사미노글리칸 (GAGs), 데르마탄 및 헤파린 설페이트로부터 설페이트 그룹을 제거하고, 이것이 없는 경우, 또는 비활성인 경우 뮤코다당증 유형 II (MPSII), 또는 Hunter 증후군, 리소좀 축적 장애가 발생된다. 따라서, 최적화된 rAAV 구조체에 의해 발현되는 hIDS의 효능을 평가하기 위해, GAG 제거를 측정했다. 표 5에 나타낸 마우스 그룹으로부터 12주차 시점에서 뇌, 간, 및 신장 조직을 추출하였고, 각 조직에서 GAG 수준이 측정되었다.
도 5A에 나타낸 것과 같이, 처리안된 IDS-KO 마우스와 비교하였을 때, rAAV-XL026 (그룹 C) 및 rAAV-XL032 (그룹 A)의 경우 뇌에서 GAG 수준이 약간 더 감소했다. 도 5B 및 도 5C에 나타낸 것과 같이, 마우스에게 hIDS를 인코딩하는 rAAV 벡터를 주사하였을 때, 간 및 신장에서 GAG 수준이 상당히 감소하였다. GAG 수준은 처리안된 WT 마우스에서 발견된 GAG 수준과 유사하였다.
실시예 4. hIDS-WPRE 구조체를 이용한 유전자 요법에 의해 헤파린 설페이트(HS)와 데르마탄 설페이트(DS)의 감소
본 실시예는 마우스에서 hIDS 발현에 의해 헤파린 설페이트 및 데르마탄 설페이트 수준의 감소를 설명한다. 효소 이두로네이트-2-설파타제 (IDS)는 글리코사미노글리칸 (GAGs), 데르마탄 및 헤파린 설페이트로부터 설페이트 그룹을 제거하고, 이것이 없는 경우, 또는 비활성인 경우 GAGs가 축적되어 뮤코다당증 유형 II (MPSII), 또는 Hunter 증후군, 리소좀 축적 장애가 발생된다.
최적화된 rAAV 구조체에 의해 발현되는 hI2S의 효능을 평가하기 위해, GAG 제거를 측정하였다.
표 5에 나타낸 마우스 그룹으로부터 12주차 시점에서 추출된 간, 신장, 심장, 비장, 및 뇌 조직에서 헤파린 설페이트 (HS) 및 데르마탄 설페이트 (DS)를 검출할 수 있는 액체 크로마토그래피 - 질량분광분석 (LC/MS) 검정을 이용하여 글리코사미노글리칸 (GAGs)을 측정하였다. 결과는 도 6A-B에 나타낸다.
rAAV-XL024 (그룹 B)의 경우, 처리안된 KO (그룹 E)와 비교하여, 간 및 신장에서 HS 및 DS GAGs는 감소되었고, 뇌에서는 더 적은 수준으로 감소되었다. 이 그룹의 경우, 심장 및 비장은 분석하지 않았다. rAAV-XL026 (그룹 C)의 경우, 처리안된 KO (그룹 E)와 비교하여, 간, 신장, 심장, 비장에서 HS 및 DS GAGs는 감소되었고, 뇌에서는 더 적은 수준으로 감소되었다. rAAV-XL032 (그룹 A)의 경우, 처리안된 KO (그룹 E)와 비교하여, 간 및 신장에서 HS 및 DS GAGs는 감소되었고, 뇌에서는 더 적은 수준으로 감소되었다.
HS 및 DS GAG 수준은 도 6B와 같이, 처리되지 않은 IKO = 0% 감소 및 WT = 100% 감소로 정규화되었다.
전반적으로, 모든 벡터 투여 그룹은 체세포에서 HS 및 DS GAGs의 감소%, 그리고 뇌 HS 및 DS GAGs의 GAG 감소%를 보여주었다. 결과는 I2S의 발현이 마우스 조직에서 GAG 수준 감소를 초래한다는 것을 보여주었다.
실시예 5. 마우스에서 hIDS-WPRE 구조체를 이용한 유전자 요법에서 리소좀 축적 격실의 감소
본 실시예는 마우스에서 hIDS-WPRE 구조체를 이용한 효소 대체 요법, 예를 들면, 뮤코다당증(MPSII)의 치료시 LAMP1 착색에 의해 검출하였을 때, 리소좀 축적 격실에서 감소를 설명한다.
간단히 말해서, LAMP1 착색을 사용하여 마우스의 리소좀 축적 구획을 측정했다. 간 및 뇌 해마, 시상, 뇌량, 피질, 소뇌 및 지층과 같은 다양한 조직을 착색하였다. 본 실시예에서, 대조군 마우스 그룹에게 실험 기간 동안 0일차, 7일차, 14일차, 21일차 및 28일차 (표 5에서 그룹 F)에 5차례 척추강내(IT)로 I2S 효소를 투여하였다. 감소된 LAMP1 착색은 기질 감소, 즉 KO 마우스의 병리학의 개선을 나타낸다.
도 7A 및 도 7B에 결과를 나타낸다. LAMP1의 상당한 감소는 도 7A에서 볼 수 있는 바와 같이, 벡터가 주사된 마우스의 간 조직에서 관찰되었다. 간에서의 효과는 WT 마우스 및 ERT로 처리된 마우스 그룹과 필적했다.
도 7B에는 뇌를 나타낸다. 처리안된 KO (그룹 E)과 비교하였을 때, LAMP1 착색의 양성적 감소는 rAAV-XL026의 경우 해마에서, rAAV-XL024 및 rAAV-XL026의 경우 뇌량에서, 그리고 rAAV-XL024 및 rAAV-XL026의 경우 시상에서 통계학적으로 유의성에 도달하였다.
전체적으로, 결과에서 마우스 간 및 뇌 조직에서, IDS를 투여하면, LAMP1 착색에 의해 측정하였을 때, 리소좀 축적 격실이 감소되었다.
실시예 6. 생체내에서 rAAV-구동된 hIDS-IRES-SUMF1 발현의 발현
본 실시예는 마우스에서 hIDS-WPRE 벡터와 비교하여, hIDS-IRES-SUMF1 벡터 투여에서 hIDS의 생체내 발현 및 활성을 비교한다.
SUMF1은 IDS의 FGly 촉매 잔기를 활성화하는 데 필요하므로, hIDS-WPRE를 발현시키는 벡터에 대비하여, hIDS 및 SUMF1을 발현하는 벡터를 사용하여 비교했다.
마우스에게 hIDS AUSopt-WPRE 구조체 (rAAV-XL026; 그룹 C), hIDS-IRES-SUMF1 구조체 (rAAV-XL027; 그룹 G, 및 XL029; 그룹 H)를 발현시키는 rAAV 벡터를 주사하고, 또는 음성 대조군으로 SUMF1 구조체 (rAAV-XL030; 그룹 I)를 발현시키는 벡터를 주사하였다. 이들 구조체의 개략도는 도 1B 및 도 2에서 도시된다.
6주령의 마우스들은 꼬리 정맥을 통하여 200μl 용적으로 5x 109 vg의 벡터들을 제공받았고, 혈청 샘플을 주사-후 2 일, 7 일 및 21 일차 시점에 수거하였다. 연령-일치되는 야생형 마우스 그룹을 각각 양성 및 음성 대조군으로 사용했다. 예시적인 생체내 연구는 표 6에서 요약된다.
표 6. hIDS 및 WPRE와 비교하여, hIDS 및 SUMF1을 인코드하는 rAAV 벡터들을 이용한 예시적인 생체내 연구
혈청내 IDS 발현 수준은 ELISA에 의해 정량화되었다. 도 8에 그 결과를 도시한다. 예상외로, hIDS 및 SUMF1 둘 모두를 발현시키는 rAAV-XL027 및 rAAV-XL029를 주사한 마우스는 오로지 hIDS만 발현시키는 rAAV-XL026 벡터(그룹 C)가 주사된 마우스와 비교하여, 21일차 시점에 혈청내 hI2S 농도가 더 낮은 것으로 나타났다.
도 9에 나타낸 것과 같이, hI2S 활성 수준을 테스트하였을 때, 유사한 결과를 얻었다. hIDS와 SUMF1을 모두 발현시키는 벡터를 주사한 모든 그룹(그룹 G-H)에서, 상기 활성 수준은 hIDS-WPRE를 발현하는 벡터를 주사한 그룹(그룹 C)보다 더 낮았다. 특정 이론에 얽매이지 않고, rAAV-XL026 벡터의 WPRE 요소는 mRNA 안정성을 증가시키고, 후속적으로 단백질 발현을 더 많이 하고, 따라서 활성이 증가되도록 하는 3차 구조를 창출하는 것으로 여겨진다. 예를 들어, 전사 종결 개선 및 mRNA 핵 방출 촉진을 포함하여 WPRE에 대한 다른 기능 메커니즘이 기술되었다. 반면에, SUMF1은 보다 활성이 큰 형태의 hIDS를 생성하지만, WPRE 요소에 의해 발현되는 hIDS의 양은 훨씬 더 많다. 본 실시예에서 사용된 rAAV 벡터는 rAAV8이다.
결과에서 hIDS-IRES-SUMF1 벡터에 비해, hIDS-WPRE 벡터의 발현 시, IDS 효소 수준 및 활성이 더 높음을 보여주었다.
실시예 7. 마우스의 생체 내 혈청 및 조직에서 rAAV 구동된 hIDS-WPRE의 장기적-발현
본 실시예는 hIDS-WPRE의 3가지 투여분량 중 하나가 투여된 마우스에서 hIDS의 생체내 발현 및 활성을 비교한다. 발현 수준 및 활성은 혈청 및 조직에서 약 12-13개월에 걸쳐 평가되었다.
마우스에게 hIDS AUSopt-WPRE 구조체 (rAAV-XL026)를 발현시키는 rAAV 벡터를 5x 109 vg (그룹 D), 2.5x 1010 vg (그룹 E), 1.25x 1011 vg (그룹 F)의 투여분량으로 주사하였고, 그리고 음성 대조군으로 무효(null) 벡터 구조체 rAAV-MY011를 1.25x 1011 vg (그룹 G)의 투여분량으로 마우스에게 주사하였다. 이들 구조체의 개략도는 도 1B 및 도 2에서 도시된다.
5~7-주령의 마우스에게 꼬리 정맥을 통하여 200μl의 용적으로 벡터를 제공하였고, 주사-후 혈청 샘플은 7일, 14일, 28일, 56일, 84일, 112일, 140일, 168일, 196일, 224일, 252일, 280일, 308일, 336일, 및 364일차 시점에 수거하였다. 연령-일치되는 야생형 마우스 그룹과 연령-일치되는 처리되지 않은 IDS-KO 마우스 그룹을 각각 양성 및 음성 대조군으로 사용했다. 예시적인 생체내 연구는 표 7에서 요약된다.
표 7. rAAV 벡터들을 이용하고, 12개월에 걸쳐 모니터링된 예시적인 생체내 연구
혈청 hI2S 수준 및 활성: 혈청 hI2S의 발현 수준은 ELISA에 의해 측정되었다. 도 10에 그 결과를 도시한다. hI2S의 농도는 rAAV-XL026 벡터(그룹 D, E, F)의 투여분량이 증가함에 따라 증가했으며, hI2S는 주사-후 364일차의 최종 시점까지 검출 가능한 상태로 유지되었다. 본 실시예에서 사용된 rAAV 벡터는 rAAV8이다.
도 11에 나타낸 것과 같이, hI2S 활성 수준을 테스트하였을 때, 유사한 결과를 얻었다. hI2S의 활성 농도는 rAAV-XL026 벡터(그룹 D, E, F)의 투여분량이 증가함에 따라 증가했으며, hI2S 활성은 주사-후 364일차의 최종 시점까지 검출 가능한 상태로 유지되었다.
조직 hI2S 수준 및 활성: 조직에서, hI2S는 ELISA를 이용하여 측정되었다(도 12A에 나타냄). rAAV-XL026 (그룹 D, E, F)의 경우, 간, 비장, 신장, 심장, 비장, 및 뇌에서 hI2S가 검출가능하였고, 그리고 투여분량 증가에 따라 증가되었다.
조직에서, hI2S 활성은 도 12B에서 나타낸 바와 같이 측정되었다. rAAV-XL026 (그룹 D, E, F)의 경우, 간, 비장, 신장, 심장, 비장, 및 뇌에서 hI2S 활성이 검출가능하였고, 그리고 투여분량 증가에 따라 증가되었다.
표 7에 나타낸 마우스 그룹으로부터 364일차 시점에서 추출된 간, 신장, 심장, 비장, 폐 및 뇌 조직에서 헤파린 설페이트 (HS) 및 데르마탄 설페이트 (DS)를 검출할 수 있는 액체 크로마토그래피 - 질량분광분석 (LC/MS) 검정을 이용하여 글리코사미노글리칸 (GAGs)을 측정하였다. 결과는 도 12C에 나타낸다.
체세포 조직에서, 모든 투여분량(그룹 D, E, F)에서 rAAV-XL026은 HS 및 DS GAG 수준을 크게 감소시켰다. HS 및 DS GAG 수준은 도 12D와 같이, 처리되지 않은 IKO = 0% 감소 및 WT = 100% 감소로 정규화되었다. 3가지 투여 분량 모두에서, rAAV-XL026(그룹 D, E, F)은 모두 체세포 조직에서 HS 및 DS GAG의 100% 감소를 보여주었다. 뇌 HS에서, GAG는 rAAV-XL026 그룹 D의 경우 17% 감소되었고, rAAV-XL026 그룹 E의 경우 38% 감소되었고, 그리고, rAAV-XL026 그룹 F의 경우 50% 감소되었다.
다양한 조직, 이를 테면, 간 및 뇌 해마, 시상, 백질, 피질, 소뇌 및 선조체를 LAMP1에 대해 착색시켰다. 도 12E에서 뇌를 나타낸다. 처리안된 KO (그룹 H)와 비교하였을 때, LAMP1 양성 착색의 감소에 있어서, 해마의 경우 rAAV-XL026 그룹 D, 그룹 E, 및 그룹 F에서, 선조체의 경우 rAAV-XL026 그룹 E 및 그룹 F에서, 백질의 경우 rAAV-XL026 그룹 E 및 그룹 F에서, 시상의 경우 rAAV-XL026 그룹 E 및 그룹 F에서, 피질의 경우 rAAV-XL026 그룹 E 및 그룹 F에서, 그리고 소뇌의 경우 rAAV-XL026 그룹 E 및 그룹 F에서 통계적으로 유의미하였다.
골 용적: 마이크로-컴퓨터 단층 촬영(마이크로-CT)을 사용하여 신체 구조를 조사했다. 도 13A 및 도 13B에 나타낸 바와 같이, 마이크로-CT를 사용하여 마우스의 7-월령, 9-월령, 11-월령 및 13월령에서 시간 경과에 따른 골 용적을 측정하였다.
도 13A 및 도 13B에서, 라인 A는 rAAV-XL026 그룹 D에 해당되며, 라인 B는 rAAV-XL026 그룹 E에 해당되며, 라인 C는 rAAV-XL026 그룹 F에 해당되며, 라인 D는 rAAV-MY011 그룹 G-음성 대조군-에 해당되며, 라인 E는 처리안된 IDS-KO 그룹 H-음성 대조군-에 해당되며, 그리고 라인 F는 처리안된 야생형 그룹 I-양성 대조군에 해당된다.
상완골(도 13A)에서, 양성 대조군 야생형 그룹 I에 대해 rAAV-XL026 그룹 D, 그룹 E 및 그룹 F의 골 용적을 겹쳐 놓았고, 그리고 이들 군의 골 용적은 음성 대조군 rAAV-MY011 그룹 G 및 처리되지 않은 IDS-KO 그룹 H보다 더 낮다.
13개월 시점에서 두개골의 관골궁 에서(도 13B), 양성 대조군 야생형 그룹 I에 대해 rAAV-XL026 그룹 D, 그룹 E 및 그룹 F의 골 용적을 겹쳐 놓았고, 그리고 이들 군의 골 용적은 음성 대조군 rAAV-MY011 그룹 G 및 처리되지 않은 IDS-KO 그룹 H보다 더 낮다.
이러한 결과는 I2S 발현 시 상완골과 관골궁 에서 골 용적이 더 낮았는데, 이것은 13개월 동안 유지되었다.
전반적으로, 이 결과에서 골 용적에 대한 혈청 및 조직 I2S 발현 및 활성 수준의 영향은 약 12-13개월 동안 유지되었음을 보여주었다.
실시예 8. 마우스에서 낮은 투여분량 투여-후, 3개월 동안 생체내에서 rAAV-구동된 hIDS-WPRE 발현 모니터링
본 실시예는 5 x 106 - 5 x 109 vg의 투여분량으로 3개월에 걸쳐 hI2S를 투여한 마우스에서 hI2S의 생체내 발현 및 활성을 설명한다.
마우스에게 hIDS AUSopt-WPRE 구조체 (rAAV-XL026)를 발현시키는 rAAV 벡터를 5x 106 vg (그룹 C), 5x 107 vg (그룹 D), 5x 108 vg (그룹 E), 5x 109 vg (그룹 F)의 투여분량으로 주사하였고, 그리고 음성 대조군으로 무효 벡터 구조체 rAAV-MY011를 5x 109 vg (그룹 B)의 투여분량으로 마우스에게 주사하였다.
5~7-주령의 마우스에게 꼬리 정맥을 통하여 200μl의 벡터를 제공하였고, 주사-후 혈청 샘플은 14일, 28일, 56일, 및 84일차 시점에 수거하였다. 연령-일치되는 야생형 마우스 그룹과 연령-일치되는 처리되지 않은 IDS-KO 마우스 그룹을 각각 양성 및 음성 대조군으로 사용했다. 예시적인 생체내 연구는 표 8에서 요약된다.
표 8. rAAV 벡터들을 이용하고, 3개월에 걸쳐 모니터링된 예시적인 생체내 연구
혈청 IDS 수준 및 활성: 낮은-투여분량의 hIDS-WPRE 벡터가 투여된 마우스의 혈청에서 hIDS의 발현 수준을 ELISA에 의해 결정하였고, 도 14A에 나타내었다. hI2S의 농도는 그룹 D, 그룹 E, 그룹 F의 경우, rAAV-XL026 벡터의 투여분량 감소에 따라 감소했으며, hI2S는 그룹 C에 대해 검출할 수 없었다. 본 실시예에서 사용된 rAAV 벡터는 rAAV8이다.
혈청 I2S 활성 수준은 도 14B에서와 같이 측정되었다. hI2S의 농도는 그룹 D, 그룹 E, 그룹 F의 경우, rAAV-XL026 벡터의 투여분량 감소에 따라 감소했으며, hI2S는 그룹 C에 대해 검출할 수 없었다.
전반적으로, 5 x 108 vg 및 5 x 109 vg의 투여분량이 투여된 그룹 D 및 그룹 E는 처리안된 마우스와 비교하여I2S 발현 및 활성이 증가되었고, I2S 수준 및 활성은 84 일 또는 3 개월에 걸쳐 유지되었다.
조직 I2S 수준 및 활성: ELISA로 측정하였을 때, 간, 비장, 신장, 심장, 폐, 골수, 대퇴사두근 및 뇌에서, 처리안된 KO (그룹 A) 및 처리안된 WT (그룹 J) 및 음성 대조군 rAAV-MY011(그룹 B) 그룹은 검출 가능한 인간 I2S (hI2S) 단백질을 함유하지 않았다 (도 14C). 5x 107 vg ~ 5x 109vg에서, 상기 rAAV-XL026 그룹 D, 그룹 E, 및 그룹 F는 투여분량의 증가에 따라 조직에서 증가된 hI2S 농도를 함유하였다.
I2S 활성은 도 14D에서 나타낸 바와 같이 간, 비장, 신장, 심장, 폐, 골수, 사두근, 및 뇌에서 측정되었다. 상기 rAAV-MY011 (그룹 B)은 모든 조직에서, 처리안된 KO (그룹 A)와 유사한 I2S 활성을 함유하였다. 5x 107 vg ~ 5x109에서, 상기 rAAV-XL026 그룹 D, 그룹 E, 및 그룹 F는 투여분량의 증가에 따라 조직에서 증가된 I2S 활성 농도를 함유하였다. 투여된 KO 마우스의 각 조직에서 I2S 활성 수준은 도 14E에 나타낸 바와 같이, 처리되지 않은 WT 수준과 비교될 수 있다.
조직 I2S수준 및 활성은 hI2S-WPRE를 포함하는 rAAV 벡터의 낮은-투여분량이 투여된 마우스에서 투여분량-의존적 방식으로 증가되었다.
조직 GAG 수준: 표 8에 나타낸 마우스 그룹으로부터 84일차 시점에서 추출된 간, 비장, 신장, 심장, 폐, 골수, 사두근, 피부, 및 뇌 조직에서 헤파린 설페이트 (HS) 및 데르마탄 설페이트 (DS)를 검출할 수 있는 액체 크로마토그래피 - 질량분광분석 (LC/MS) 검정을 이용하여 글리코사미노글리칸 (GAGs)을 측정하였다. HS 및 DS GAG 수준은 표 9 및 표 10과 같이, 처리되지 않은 IKO = 0% 감소 및 WT = 100% 감소로 정규화되었다.
5x 108 vg의 rAAV-XL026의 그룹 E에서 측정된 모든 체세포 조직에서 HS 및 GAG 수준은 >90%까지 감소되었다. 뇌에서, 5x 108 vg의 rAAV-XL026 그룹 E에서 뇌의 HS 및 GAG 수준은 차례로 8.8% 및 41%까지 감소되었다. 5x 109 vg의 rAAV-XL026의 그룹 F에서 측정된 모든 체세포 조직에서 HS 및 GAG 수준은 >95%까지 감소되었다. 뇌에서, 5x 109 vg의 rAAV-XL026 그룹 F에서 뇌의 HS 및 GAG 수준은 차례로 39% 및 78%까지 감소되었다.
HS 및 GAG 수준은 IDS-WPRE를 함유하는 5 x 107, 5 x 108 또는 5 x 109 vg의 rAAV 투여 시, 체세포 조직 및 뇌에서 감소했다.
표 9. 정규화된 HS GAG 감소
표 10. 정규화된 DS GAG 감소
리소좀 축적: 다양한 조직, 이를 테면, 간, 비장, 신장, 심장 및 뇌 해마, 시상, 백질, 피질, 소뇌 및 선조체를 LAMP1에 대해 착색시켰다. 체세포 조직은 도 14F에 나타낸다. 간, 비장 및 심장을 비롯한 체세포 조직에서, LAMP1 IHC 양성 착색은 rAAV-XL026 5x107 vg 용량 그룹 D, 5x108 vg 용량 그룹 E 및 5x109 vg 용량 그룹 F에 대한 나이브() KO 대조군과 비교하여 유의미하게 감소했다. 신장에서, LAMP1 양성 착색은 rAAV-XL026 5x108 vg 용량 그룹 E 및 5x109 vg 용량 그룹 F에 대한 나이브 KO 대조군과 비교하여 유의미하게 감소했다.
뇌 영역에서의 LAMP1 IHC 착색은 도 14G에 나타나있다. 뇌에서, LAMP1 양성 착색은 해마, 선조체, 시상, 백질, 피질 및 소뇌에서 측정되었다. 이들 모든 영역에서, rAAV-XL026 투여분량 그룹 C, 그룹 D, 그룹 E 및 그룹 F에 대한 LAMP1 양성 착색은 처리안된 KO 대조군 A와 유의미적으로 상이하지 않았다.
이들 결과에서 IDS-WPRE 낮은-투여분량 투여 시, 체세포 조직에서 리소좀 축적이 감소했지만, 뇌에서는 유의미적으로 감소하지 않았음을 보여주었다.
전반적으로, 상기 결과에서는 마우스에서 hIDS-WPRE를 포함하는 낮은-투여분량의 rAAV 투여 시, 혈청 및 조직 I2S 발현 및 활성이 약 3개월에 걸쳐 유지되었고, 그리고 LAMP에 의해 결정된 바와 같이, 체세포 조직에서 리소좀 축적이 감소되었음을 보여주었다.
실시예 9. 인간이 아닌 영장류 (NHPs)에서 hI2S 이식유전자 산물의 혈청 발현 수준
본 실시예는 hI2S 이식유전자 산물이 투여된 인간이 아닌 영장류에서 예시적인 PK/분포 연구를 설명한다.
약 1.8세~ 2세의 인간이 아닌 수컷 영장류의 정맥내 주입을 통해 hI2S 산물을 투여했다. 낮은-투여분량 코호트 동물은 1.25 x 1012 vg/kg(n=3)의 낮은-투여분량 hI2S를 제공받았고, 높은-투여분량 코호트 동물은 6.25 x 1012 vg/kg(n=6)의 높은-투여분량 hI2S를 제공받았다. 대조군 동물은 오로지 제형 완충액만을 제공받았다.
혈청 샘플은 hI2S 이식유전자를 투여하기-전, 사전-투여분량부터 시작하여, 최대 240일차까지 매 20일마다 다양한 시점에서 샘플링으로 수집되었다. 낮은-투여분량 코호트 및 높은-투여분량 코호트로부터 각각 3마리의 동물을 3개월 시점에 희생시켰다.
도 15A는 NHP 혈청 투여-후 1일~3개월 부검에서 낮은-투여분량 코호트로부터의 hI2S 이식유전자 산물 혈청 농도를 도시한다. hI2S 이식유전자 산물의 지속적인 농도는 1.25 x 12 vg/kg(낮은-투여분량)에서 관찰되었다.
상응하게, 도 15B에서, 혈청 내 hI2S 이식유전자 산물 효소 활성은 최대 3개월까지 지속된 수준을 나타내었다. 3개월에서, 오로지 제형 완충액만을 받은 대조군 동물에서 측정된 NHP 내생성 I2S 활성 수준에 비해, 약 5-배 더 높은 수준의 I2S 효소 활성이 관찰되었다.
도 15C는 3개의 NHP 투여-후 1일 ~ 약 90일차 또는 3개월 부검에서, 높은-투여분량 코호트로부터의 hI2S 이식유전자 산물의 혈청 농도를 나타내는데, 투여-후 1일차~ 약 240일차 또는 8개월까지 3가지 높은-투여분량 동물에서 유지된다.
개별 동물들은 hI2S 이식유전자 산물의 가변적인 프로파일을 보여주었으며, 달성된 초기 최대 혈청 농도 수준에서 가변성이 관찰되었다. hI2S 이식유전자 산물 혈청 농도의 급격한 감소가 동물에서 관찰되었고, 이는 3-개월 부검까지 추적관찰되었다. 혈청에서 상응하는 hI2S 효소 활성은 증가를 나타내었다가, 그 다음 21일차 이후 약 5200-7500 nmol/hr/mL의 안정기 수준으로 감소하였고 (도 15D), I2S 이식유전자 산물 농도가 3개월차 시점에 종료된 3마리의 동물에서 감소되었음에도 불구하고, 혈청에서 지속적인 hI2S 효소 활성을 입증했다.
혈청 hI2S 이식유전자 산물 농도 및 혈청 I2S 활성을 ~ 약 240 일 (8 개월)까지 추적한 동물들은 이들의 hI2S 이식유전자 산물 농도 프로파일에서 가변성을 보였다. 2마리의 동물에서 약 8개월까지 I2S 이식유전자 산물 농도가 약 100ng/mL 이하로 감소하는 것으로 나타났다. 이것은 hI2S 효소 활성이 약 8개월까지 내생성 수준(제제 완충액)까지 관찰된 감소와 또한 관련있었다. 이 연구에서 동물 중 한 마리 동물은 약 8개월까지 지속적인 hI2S 이식유전자 산물 농도와 효소 활성을 보여주었다.
전반적으로, 이들 데이터에서 면역억제제가 없는 경우에도, hI2S 이식유전자 산물의 지속적인 발현이 인간이 아닌 영장류에서 달성되었음을 입증되었다.
실시예 10. 항-이식유전자 산물 항체 (a.k.a. 항-hI2S ADA (항-약물 항체)) 및 항-AAV8 ADA 적덩에 대해 낮은-투여분량 및 높은-투여분량의 인간이 아닌 영장류에서 hI2S 이식유전자 산물의 혈청 농도 및 I2S 효소 활성 비교
본 실시예는 hI2S 이식유전자 생성물 농도 및 효소 활성으로 플롯팅된 개별 인간이 아닌 영장류로부터의 항-hI2S ADA와 항-AAV8 ADA 데이터 간의 비교를 설명한다.
개별 동물로부터의 항-hI2S ADA 및 항-AAV8 ADA 데이터를 hI2S 이식유전자 산물 농도 및 효소 활성에 대해 플롯팅하였다 (도 16). 이 그래프에는 최대 3개월의 ADA 데이터만 표시되었다. hI2S 수준의 초기 감소는 일부 동물(2001, 3002, 4003, 4001 및 4002)에서 항-hI2S ADA가 없는 상태에서, 첫 달 이내에 관찰되었다. hI2S 수준의 감소는 투여분량-의존적이지 않았다. NHP 혈청에서 hI2S 이식유전자 산물 농도의 초기 감소(첫 달 이내)는 동물마다 다양했다(10% - 80%).
평형 상태 후, 혈청에서 hI2S 이식유전자 산물의 감소는 높은-투여분량의 hI2S를 제공받았던 코호트에서 항-hI2S ADA의 존재와 상관관계가 있었다. "평형 상태" 또는 "재-확립된 상태"란 I2S 효소 또는 I2S 효소 활성의 "항정 상태(steady state)" 또는 정점(plateau) 수준을 지칭한다. 일부 동물 (3002 및 4001)에서 항-AAV8 ADA의 존재는 재-투여를 막을 수 있다. 낮은-투여분량 코호트의 동물 중 어느 동물의 혈청에서도 항-hI2S ADA가 존재하지 않았다.
이들 결과는 혈청 I2S 수준의 감소가 hIDS-WPRE를 포함하는 높은-투여분량의 rAAV-XL026을 제공받았던 인간이 아닌 영장류에서 항-hI2S ADA의 존재와 상관관계가 있음을 보여주었다.
실시예 11. 개별 인간이 아닌 영장류의 간 hI2S 이식유전자 산물 농도 프로파일
본 실시예는 인간이 아닌 영장류의 간에서 hI2S 이식유전자 산물 농도 프로파일을 도시한다.
1개월 및 2개월 시점에 낮은-투여분량 (도 17A) 및 높은-투여분량 (도 17B) 동물 모두에서 간 생검을 수행하였고, 3개월차 시점에서 최종 간 샘플을 수집하였다. 12개월차 부검이 계획된 높은-투여분량 코호트로부터 3마리 동물은 3개월 및 6개월차에 생검을 받았다.
각 생검은 좌측 엽과 우측 엽에서 수행되었다. 낮은-투여분량 코호트의 간에서 좌엽과 우엽 사이의 평균 hI2S 이식유전자 산물 농도는 1개월~3개월 사이에 평균 38.2ng/mL~42.5ng/mL 범위였다.
높은-투여분량 코호트의 간에서 hI2S 이식유전자 산물 농도는 1개월 시점에서 175.1ng/mL~367.6ng/mL 범위였다. 동물 중 한 마리 동물(동물 3001)은 좌엽(101.8ng/mL)과 우엽(528.3ng/mL) 간에 큰 차이를 보였다.
2개월 시점에서, 두 동물(동물 3001 및 동물 3002)들이 1개월에서 2개월까지 간 hI2S 이식유전자 산물 농도의 급격한 감소를 나타냈다. 동물 3003을 비롯한, 다른 동물들도 2개월에서 6개월까지 감소했지만, 그 정도는 적었다.
전반적으로, 이러한 결과들은 rAAV-XL026의 투여-후, 1 개월 내지 3개월 시점의 인간이 아닌 영장류 조직에서 I2S 이식유전자 산물의 개별 농도 프로파일을 보여주었다.
실시예 12. 인간이 아닌 영장류 조직에서 hI2S 이식유전자 산물의 농도 비교 프로파일
본 실시예는 인간이 아닌 영장류 조직에서 hI2S 이식유전자 산물의 농도 비교 프로파일을 설명한다.
3개월차 시점에 낮은-투여분량 코호트의 동물과 높은-투여분량 코호트로부터 3마리 동물에 대해 조직 부검을 수행했다.
hI2S 이식유전자 산물 농도는 신장, 비장, 폐, 심장 및 골수를 비롯한, 다양한 기관의 조직 균질액에서 ELISA에 의해 측정되었다. 3개월차 시점에서, 높은-투여분량 코호트의 혈청 내 hI2S 이식유전자 산물 농도는 낮은-투여분량 코호트(>640ng/mL)와 비교할 때, 항-hI2S ADA의 존재 하에 유의하게 더 낮은 수준(<250ng/mL)을 나타내었지만, 신장(도 18A) 및 비장(도 18B)에서 평균 hI2S 농도는 더 낮은-투여분량 코호트보다 높은-투여분량 코호트에서 더 높은 수준을 나타냈다.
항-hI2S ADA 존재 하에서, 높은-투여분량 코호트의 3마리 동물은 폐(도 18C) 및 심장(도 18D)에서 더 낮은 hI2S 이식유전자 생성물 농도를 나타내었고, 한편으로, 골수에서(도 18E), 높은-투여분량 코호트와 낮은-투여분량 코호트의 동물간에 hI2S 조직 농도는 필적하였다. 상기 조직들이 건강한 NHP에서 유래했기 때문에, 내생성 I2S는 예를 들어, 폐의 제형 완충액 그룹에서 검출된다.
이들 결과는 rAAV-XL026로 처리-후, 인간이 아닌 영장류의 상이한 조직들에서 I2S의 농도 비교 프로파일을 보여주었다.
실시예 13. IDS 녹아웃 마우스와 비교하여, 인간이 아닌 영장류에서 hI2S 조직 노출 비교
본 실시예는 인간이 아닌 영장류와 IDS KO 마우스들간의 다양한 표적 조직에서 I2S 농도 및 효소 활성을 비교-설명한다.
IDS KO 마우스에서 2.5x1011 vg/kg 및 2.5x1010 vg/kg에서 hI2S 조직 효소 활성 및 상응하는 HS GAG 감소 백분율을 표 11에 나타낸다.
마우스에서, 약 91%의 감소가 관찰된 신장을 제외하고, 대부분의 조직들의 경우, 약 2.5x1010 vg/kg의 투여분량에서 95% 이상의 HS GAG 감소가 관찰되었다. 심장 및 골수에서, 인간이 아닌 영장류의 낮은-투여분량 코호트 데이터는 2.5x1010 vg/kg에서 IDS KO 마우스보다 더 높은 hI2S 조직 농도와 효소 활성을 보여주었다.
IDS KO 마우스의 폐 조직에서, WT I2S 효소 활성은 겨우 30%이었지만, 여전히 이 수준은 97%의 HS GAG 감소를 보여주었다. 인간이 아닌 영장류에서, 낮은 투여분량의 hI2S가 투여될 때, 폐에서 효소 활성은 40%를 나타내고, 이것은 WT hI2S 효소 활성보다 더 큰 %이었다. 1.25 x 1012vg/kg로 IV 주입을 통하여 NHP에게 rAAV-XL026을 투여함으로써, 폐에 hI2S 이식유전자 산물을 충분히 노출시키면, 이 질환 모델에서 HS GAG를 ≥95%로 감소시킬 수 있다.
표 11. 녹아웃 마우스와 인간이 아닌 영장류에서 hI2S 농도와 효소 활성 및 GAG 감소의 비교.
균등물 및 범위
당업자는 일상적인 실험을 사용하여 본 명세서에 기재된 본 발명의 특정 구체예에 대한 많은 등가물을 인식하거나 또는 확인할 수 있을 것이다. 본 발명의 범위는 상기 설명에 제한되지 않으며, 그보다는 첨부한 청구범위에 제시된 바와 같다:
SEQUENCE LISTING
<110> TAKEDA PHARMACEUTICAL COMPANY LIMITED
<120> Adeno Associated Virus Vectors for the Treatment of Hunter
Disease
<130> 3817.147PC01
<140> PCT/US20/63887
<141> 2020-12-09
<150> 62/945,920
<151> 2019-12-10
<160> 24
<170> PatentIn version 3.5
<210> 1
<211> 525
<212> PRT
<213> Homo sapiens
<400> 1
Ser Glu Thr Gln Ala Asn Ser Thr Thr Asp Ala Leu Asn Val Leu Leu
1 5 10 15
Ile Ile Val Asp Asp Leu Arg Pro Ser Leu Gly Cys Tyr Gly Asp Lys
20 25 30
Leu Val Arg Ser Pro Asn Ile Asp Gln Leu Ala Ser His Ser Leu Leu
35 40 45
Phe Gln Asn Ala Phe Ala Gln Gln Ala Val Cys Ala Pro Ser Arg Val
50 55 60
Ser Phe Leu Thr Gly Arg Arg Pro Asp Thr Thr Arg Leu Tyr Asp Phe
65 70 75 80
Asn Ser Tyr Trp Arg Val His Ala Gly Asn Phe Ser Thr Ile Pro Gln
85 90 95
Tyr Phe Lys Glu Asn Gly Tyr Val Thr Met Ser Val Gly Lys Val Phe
100 105 110
His Pro Gly Ile Ser Ser Asn His Thr Asp Asp Ser Pro Tyr Ser Trp
115 120 125
Ser Phe Pro Pro Tyr His Pro Ser Ser Glu Lys Tyr Glu Asn Thr Lys
130 135 140
Thr Cys Arg Gly Pro Asp Gly Glu Leu His Ala Asn Leu Leu Cys Pro
145 150 155 160
Val Asp Val Leu Asp Val Pro Glu Gly Thr Leu Pro Asp Lys Gln Ser
165 170 175
Thr Glu Gln Ala Ile Gln Leu Leu Glu Lys Met Lys Thr Ser Ala Ser
180 185 190
Pro Phe Phe Leu Ala Val Gly Tyr His Lys Pro His Ile Pro Phe Arg
195 200 205
Tyr Pro Lys Glu Phe Gln Lys Leu Tyr Pro Leu Glu Asn Ile Thr Leu
210 215 220
Ala Pro Asp Pro Glu Val Pro Asp Gly Leu Pro Pro Val Ala Tyr Asn
225 230 235 240
Pro Trp Met Asp Ile Arg Gln Arg Glu Asp Val Gln Ala Leu Asn Ile
245 250 255
Ser Val Pro Tyr Gly Pro Ile Pro Val Asp Phe Gln Arg Lys Ile Arg
260 265 270
Gln Ser Tyr Phe Ala Ser Val Ser Tyr Leu Asp Thr Gln Val Gly Arg
275 280 285
Leu Leu Ser Ala Leu Asp Asp Leu Gln Leu Ala Asn Ser Thr Ile Ile
290 295 300
Ala Phe Thr Ser Asp His Gly Trp Ala Leu Gly Glu His Gly Glu Trp
305 310 315 320
Ala Lys Tyr Ser Asn Phe Asp Val Ala Thr His Val Pro Leu Ile Phe
325 330 335
Tyr Val Pro Gly Arg Thr Ala Ser Leu Pro Glu Ala Gly Glu Lys Leu
340 345 350
Phe Pro Tyr Leu Asp Pro Phe Asp Ser Ala Ser Gln Leu Met Glu Pro
355 360 365
Gly Arg Gln Ser Met Asp Leu Val Glu Leu Val Ser Leu Phe Pro Thr
370 375 380
Leu Ala Gly Leu Ala Gly Leu Gln Val Pro Pro Arg Cys Pro Val Pro
385 390 395 400
Ser Phe His Val Glu Leu Cys Arg Glu Gly Lys Asn Leu Leu Lys His
405 410 415
Phe Arg Phe Arg Asp Leu Glu Glu Asp Pro Tyr Leu Pro Gly Asn Pro
420 425 430
Arg Glu Leu Ile Ala Tyr Ser Gln Tyr Pro Arg Pro Ser Asp Ile Pro
435 440 445
Gln Trp Asn Ser Asp Lys Pro Ser Leu Lys Asp Ile Lys Ile Met Gly
450 455 460
Tyr Ser Ile Arg Thr Ile Asp Tyr Arg Tyr Thr Val Trp Val Gly Phe
465 470 475 480
Asn Pro Asp Glu Phe Leu Ala Asn Phe Ser Asp Ile His Ala Gly Glu
485 490 495
Leu Tyr Phe Val Asp Ser Asp Pro Leu Gln Asp His Asn Met Tyr Asn
500 505 510
Asp Ser Gln Gly Gly Asp Leu Phe Gln Leu Leu Met Pro
515 520 525
<210> 2
<211> 550
<212> PRT
<213> Homo sapiens
<400> 2
Met Pro Pro Pro Arg Thr Gly Arg Gly Leu Leu Trp Leu Gly Leu Val
1 5 10 15
Leu Ser Ser Val Cys Val Ala Leu Gly Ser Glu Thr Gln Ala Asn Ser
20 25 30
Thr Thr Asp Ala Leu Asn Val Leu Leu Ile Ile Val Asp Asp Leu Arg
35 40 45
Pro Ser Leu Gly Cys Tyr Gly Asp Lys Leu Val Arg Ser Pro Asn Ile
50 55 60
Asp Gln Leu Ala Ser His Ser Leu Leu Phe Gln Asn Ala Phe Ala Gln
65 70 75 80
Gln Ala Val Cys Ala Pro Ser Arg Val Ser Phe Leu Thr Gly Arg Arg
85 90 95
Pro Asp Thr Thr Arg Leu Tyr Asp Phe Asn Ser Tyr Trp Arg Val His
100 105 110
Ala Gly Asn Phe Ser Thr Ile Pro Gln Tyr Phe Lys Glu Asn Gly Tyr
115 120 125
Val Thr Met Ser Val Gly Lys Val Phe His Pro Gly Ile Ser Ser Asn
130 135 140
His Thr Asp Asp Ser Pro Tyr Ser Trp Ser Phe Pro Pro Tyr His Pro
145 150 155 160
Ser Ser Glu Lys Tyr Glu Asn Thr Lys Thr Cys Arg Gly Pro Asp Gly
165 170 175
Glu Leu His Ala Asn Leu Leu Cys Pro Val Asp Val Leu Asp Val Pro
180 185 190
Glu Gly Thr Leu Pro Asp Lys Gln Ser Thr Glu Gln Ala Ile Gln Leu
195 200 205
Leu Glu Lys Met Lys Thr Ser Ala Ser Pro Phe Phe Leu Ala Val Gly
210 215 220
Tyr His Lys Pro His Ile Pro Phe Arg Tyr Pro Lys Glu Phe Gln Lys
225 230 235 240
Leu Tyr Pro Leu Glu Asn Ile Thr Leu Ala Pro Asp Pro Glu Val Pro
245 250 255
Asp Gly Leu Pro Pro Val Ala Tyr Asn Pro Trp Met Asp Ile Arg Gln
260 265 270
Arg Glu Asp Val Gln Ala Leu Asn Ile Ser Val Pro Tyr Gly Pro Ile
275 280 285
Pro Val Asp Phe Gln Arg Lys Ile Arg Gln Ser Tyr Phe Ala Ser Val
290 295 300
Ser Tyr Leu Asp Thr Gln Val Gly Arg Leu Leu Ser Ala Leu Asp Asp
305 310 315 320
Leu Gln Leu Ala Asn Ser Thr Ile Ile Ala Phe Thr Ser Asp His Gly
325 330 335
Trp Ala Leu Gly Glu His Gly Glu Trp Ala Lys Tyr Ser Asn Phe Asp
340 345 350
Val Ala Thr His Val Pro Leu Ile Phe Tyr Val Pro Gly Arg Thr Ala
355 360 365
Ser Leu Pro Glu Ala Gly Glu Lys Leu Phe Pro Tyr Leu Asp Pro Phe
370 375 380
Asp Ser Ala Ser Gln Leu Met Glu Pro Gly Arg Gln Ser Met Asp Leu
385 390 395 400
Val Glu Leu Val Ser Leu Phe Pro Thr Leu Ala Gly Leu Ala Gly Leu
405 410 415
Gln Val Pro Pro Arg Cys Pro Val Pro Ser Phe His Val Glu Leu Cys
420 425 430
Arg Glu Gly Lys Asn Leu Leu Lys His Phe Arg Phe Arg Asp Leu Glu
435 440 445
Glu Asp Pro Tyr Leu Pro Gly Asn Pro Arg Glu Leu Ile Ala Tyr Ser
450 455 460
Gln Tyr Pro Arg Pro Ser Asp Ile Pro Gln Trp Asn Ser Asp Lys Pro
465 470 475 480
Ser Leu Lys Asp Ile Lys Ile Met Gly Tyr Ser Ile Arg Thr Ile Asp
485 490 495
Tyr Arg Tyr Thr Val Trp Val Gly Phe Asn Pro Asp Glu Phe Leu Ala
500 505 510
Asn Phe Ser Asp Ile His Ala Gly Glu Leu Tyr Phe Val Asp Ser Asp
515 520 525
Pro Leu Gln Asp His Asn Met Tyr Asn Asp Ser Gln Gly Gly Asp Leu
530 535 540
Phe Gln Leu Leu Met Pro
545 550
<210> 3
<211> 218
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 3
gggggaggct gctggtgaat attaaccaag gtcaccccag ttatcggagg agcaaacagg 60
ggctaagtcc accgggggag gctgctggtg aatattaacc aaggtcaccc cagttatcgg 120
aggagcaaac aggggctaag tccaccgggg gaggctgctg gtgaatatta accaaggtca 180
ccccagttat cggaggagca aacaggggct aagtccac 218
<210> 4
<211> 233
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 4
aaatgaccta ttaagaatat ttcatagaac gaatgttccg atgctctaat ctctctagac 60
aaggttcata tttgtatggg ttacttattc tctctttgtt gactaagtca ataatcagaa 120
tcagcaggtt tgcagtcaga ttggcaggga taagcagcct agctcaggag aagtgagtat 180
aaaagcccca ggctgggagc agccatcaca gaagtccact cattcttggc agg 233
<210> 5
<211> 77
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 5
ctaaggtaag ttggcgccgt ttaagggatg gttggttggt ggggtattaa tgtttaatta 60
ccttttttac aggcctg 77
<210> 6
<211> 1653
<212> DNA
<213> Homo sapiens
<400> 6
atgccgccac cccggaccgg ccgaggcctt ctctggctgg gtctggttct gagctccgtc 60
tgcgtcgccc tcggatccga aacgcaggcc aactcgacca cagatgctct gaacgttctt 120
ctcatcatcg tggatgacct gcgcccctcc ctgggctgtt atggggataa gctggtgagg 180
tccccaaata ttgaccaact ggcatcccac agcctcctct tccagaatgc ctttgcgcag 240
caagcagtgt gcgccccgag ccgcgtttct ttcctcactg gcaggagacc tgacaccacc 300
cgcctgtacg acttcaactc ctactggagg gtgcacgctg gaaacttctc caccatcccc 360
cagtacttca aggagaatgg ctatgtgacc atgtcggtgg gaaaagtctt tcaccctggg 420
atatcttcta accataccga tgattctccg tatagctggt cttttccacc ttatcatcct 480
tcctctgaga agtatgaaaa cactaagaca tgtcgagggc cagatggaga actccatgcc 540
aacctgcttt gccctgtgga tgtgctggat gttcccgagg gcaccttgcc tgacaaacag 600
agcactgagc aagccataca gttgttggaa aagatgaaaa cgtcagccag tcctttcttc 660
ctggccgttg ggtatcataa gccacacatc cccttcagat accccaagga atttcagaag 720
ttgtatccct tggagaacat caccctggcc cccgatcccg aggtccctga tggcctaccc 780
cctgtggcct acaacccctg gatggacatc aggcaacggg aagacgtcca agccttaaac 840
atcagtgtgc cgtatggtcc aattcctgtg gactttcagc ggaaaatccg ccagagctac 900
tttgcctctg tgtcatattt ggatacacag gtcggccgcc tcttgagtgc tttggacgat 960
cttcagctgg ccaacagcac catcattgca tttacctcgg atcatgggtg ggctctaggt 1020
gaacatggag aatgggccaa atacagcaat tttgatgttg ctacccatgt tcccctgata 1080
ttctatgttc ctggaaggac ggcttcactt ccggaggcag gcgagaagct tttcccttac 1140
ctcgaccctt ttgattccgc ctcacagttg atggagccag gcaggcaatc catggacctt 1200
gtggaacttg tgtctctttt tcccacgctg gctggacttg caggactgca ggttccacct 1260
cgctgccccg ttccttcatt tcacgttgag ctgtgcagag aaggcaagaa ccttctgaag 1320
cattttcgat tccgtgactt ggaagaggat ccgtacctcc ctggtaatcc ccgtgaactg 1380
attgcctata gccagtatcc ccggccttca gacatccctc agtggaattc tgacaagccg 1440
agtttaaaag atataaagat catgggctat tccatacgca ccatagacta taggtatact 1500
gtgtgggttg gcttcaatcc tgatgaattt ctagctaact tttctgacat ccatgcaggg 1560
gaactgtatt ttgtggattc tgacccattg caggatcaca atatgtataa tgattcccaa 1620
ggtggagatc ttttccagtt gttgatgcct tga 1653
<210> 7
<211> 592
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 7
aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctttgttgct 60
ccttttacgc tttgtggata cgctgcttta ttgcctttgt atcttgctat tgcttcccgt 120
ttggctttca ttttctcctc cttgtataaa tcctggttgc tgtctctttt tgaggagttg 180
tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240
ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300
attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360
ttgggcactg acaattccgt ggtgttgtcg gggaaatcat cgtcctttcc ttggctgctc 420
gcctgtgttg ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480
aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540
cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgca tc 592
<210> 8
<211> 234
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 8
cctagagctc gctgatcagc ctcgactgtg ccttctagtt gccagccatc tgttgtttgc 60
ccctcccccg tgccttcctt gaccctggaa ggtgccactc ccactgtcct ttcctaataa 120
aatgaggaaa ttgcatcgca ttgtctgagt aggtgtcatt ctattctggg gggtggggtg 180
gggcaggaca gcaaggggga ggattgggaa gacaatagca ggcatgctgg ggaa 234
<210> 9
<211> 133
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 9
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120
gagcgcgcag aga 133
<210> 10
<211> 130
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 10
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct 130
<210> 11
<211> 1653
<212> DNA
<213> Artificial Sequence
<220>
<223> Synethetic Polynucleotide
<400> 11
atgccaccac ctaggacagg caggggcctg ctttggcttg gactggtgct gagctctgtc 60
tgtgttgccc tgggctccga gacccaagcc aactctacaa ccgatgctct caatgttctg 120
ctcatcatag tggatgacct gcggccctct ctaggctgct atggagacaa gttggtgcgg 180
agccccaaca tagaccagct agcctctcac tccctgctgt tccagaatgc cttcgcccag 240
caagctgtgt gcgccccctc tagagtgtct ttcctgaccg ggagaaggcc tgatacaaca 300
aggctgtatg actttaacag ctactggagg gtgcacgcag gcaacttctc cactatcccc 360
caatacttca aggagaatgg ctatgtgacc atgagcgtgg gcaaggtctt ccaccctgga 420
atctcctcca accacactga tgatagtccc tactcttggt cttttcctcc ctatcaccct 480
agcagtgaga agtatgagaa caccaaaacc tgcagaggcc ctgatgggga gctgcatgct 540
aacctcctgt gtcctgtaga tgtgctggac gtcccagagg gcaccttgcc agataagcag 600
tctactgagc aggctatcca gctgcttgag aaaatgaaga cttctgcatc tcccttcttt 660
ctggctgttg gctaccacaa gcctcacatc cccttcaggt accctaagga gttccaaaag 720
ctctatcctc tggaaaacat cacacttgcc cccgatcctg aggtccctga cggcctccca 780
ccagtagcct acaatccttg gatggacatt aggcagagag aggatgtcca ggctctgaat 840
atttctgtgc cctatgggcc catcccggtg gacttccagc gcaaaatcag acagtcctac 900
tttgcctctg tgagctatct ggacacccag gttgggaggc tcctctccgc ccttgacgac 960
ctccagttgg ccaacagcac cattatagcc ttcacctctg accacggctg ggcactgggg 1020
gaacacgggg agtgggctaa gtactctaac tttgatgtgg ccacccacgt gcccctcatc 1080
ttttatgtgc ctggcaggac tgccagcctg cccgaagctg gggaaaaact gtttccatac 1140
ctggaccctt ttgacagtgc ttctcagctc atggaacctg gccgtcagag catggatctg 1200
gtggagctag tgtccctctt cccaaccttg gctggccttg ctggtctcca ggtgcctcct 1260
agatgcccag tcccctcctt ccatgttgaa ctctgccgtg aggggaagaa tctgctgaag 1320
cacttcagat tcagagactt ggaggaggac ccctaccttc ctgggaaccc cagggagttg 1380
attgcatact cccagtatcc caggccaagt gacattcccc agtggaactc cgacaaacca 1440
agtctgaagg acatcaagat catggggtac agcatcagga ccattgacta cagatacaca 1500
gtgtgggttg gatttaaccc agatgagttc ttggcaaact tttctgacat ccatgcaagt 1560
cagttgtatt ttgtggacag cgaccctctg caggatcaca acatgtacaa tgacagccag 1620
ggtggggacc tctttcaact cctcatgcca tag 1653
<210> 12
<211> 1653
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 12
atgccacccc cccggaccgg gagaggcctc ttgtggttgg gcctggtgct gagcagcgtg 60
tgcgtggccc tgggcagtga gacccaggct aactctacaa cagatgcctt gaatgtgctg 120
ctgatcattg tggatgacct gaggccaagt ctgggctgct atggggacaa attggtgagg 180
tcccccaaca tcgaccagtt ggcctcccac tctctcctat tccaaaatgc tttcgcccag 240
caggcagttt gtgccccctc tagggtgagc ttcctcactg gcaggcgccc tgacaccact 300
agactgtatg actttaacag ctattggagg gtgcacgcag gaaacttctc cacaatccct 360
caatacttca aggagaatgg ttatgtgaca atgtctgtgg gcaaggtgtt ccaccctggc 420
atcagcagca accacaccga tgactcaccc tatagttggt cttttccccc ctaccatcct 480
tcatctgaga aatatgaaaa cacaaaaacc tgccgaggcc cagacgggga actgcatgcc 540
aacctactct gtcctgttga tgtactggac gtgcccgagg gcaccctccc tgataagcag 600
tccacagaac aggccattca gctgcttgaa aagatgaaga cctccgcatc ccccttcttc 660
ttggctgtcg gctaccacaa gccccatatc ccctttagat accccaagga attccagaaa 720
ctgtacccac tggagaacat cacacttgct cctgaccctg aagtgcctga cggactgcct 780
ccagtggcct ataacccttg gatggacatc cggcagcgcg aggatgtgca ggctctgaac 840
attagtgtgc cttatgggcc catccctgtg gactttcaga ggaagattcg ccagtcctac 900
tttgcctctg tatcctacct ggacacacag gtgggacgcc tgctgtctgc ccttgatgat 960
ctgcaactgg ccaacagcac cattatagct ttcacatcag accatgggtg ggctcttggg 1020
gagcatggtg aatgggctaa gtactccaac ttcgatgtgg caacccatgt ccctctgatc 1080
ttctatgtgc caggaaggac cgcctctctg ccagaggcag gtgagaagct gttcccctat 1140
ctggaccctt ttgactccgc cagccagctg atggagcctg gccgacagtc tatggacctg 1200
gttgagctgg tcagcctgtt tcccacactc gctggactgg ctggcctgca agtaccccca 1260
cgctgcccag tgccctcctt ccatgtggag ctttgcaggg aggggaagaa cctcctcaag 1320
cacttcaggt tcagggacct agaggaggat ccttatctgc ctggaaaccc cagagagctt 1380
attgcttact cccagtatcc aaggcctagt gacattcccc aatggaactc agacaaacca 1440
agcctgaaag acatcaagat catgggatac tctatcagga ccattgacta caggtacact 1500
gtgtgggttg gcttcaaccc ggatgagttc ctggctaatt tctctgacat acatgctggc 1560
gagctgtact tcgtggacag tgaccccctg caggatcaca acatgtacaa tgattcccag 1620
gggggtgacc tcttccagct tctgatgccc taa 1653
<210> 13
<211> 575
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 13
gcccctctcc ctcccccccc cctaacgtta ctggccgaag ccgcttggaa taaggccggt 60
gtgcgtttgt ctatatgtta ttttccacca tattgccgtc ttttggcaat gtgagggccc 120
ggaaacctgg ccctgtcttc ttgacgagca ttcctagggg tctttcccct ctcgccaaag 180
gaatgcaagg tctgttgaat gtcgtgaagg aagcagttcc tctggaagct tcttgaagac 240
aaacaacgtc tgtagcgacc ctttgcaggc agcggaaccc cccacctggc gacaggtgcc 300
tctgcggcca aaagccacgt gtataagata cacctgcaaa ggcggcacaa ccccagtgcc 360
acgttgtgag ttggatagtt gtggaaagag tcaaatggct cacctcaagc gtattcaaca 420
aggggctgaa ggatgcccag aaggtacccc attgtatggg atctgatctg gggcctcggt 480
gcacatgctt tacatgtgtt tagtcgaggt taaaaaacgt ctaggccccc cgaaccacgg 540
ggacgtggtt ttcctttgaa aaacacgatg ataat 575
<210> 14
<211> 1125
<212> DNA
<213> Homo sapiens
<400> 14
atggctgcgc ccgcactagg gctggtgtgt ggacgttgcc ctgagctggg tctcgtcctc 60
ttgctgctgc tgctctcgct gctgtgtgga gcggcaggga gccaggaggc cgggaccggt 120
gcgggcgcgg ggtcccttgc gggttcttgc ggctgcggca cgccccagcg gcctggcgcc 180
catggcagtt cggcagccgc tcaccgatac tcgcgggagg ctaacgctcc gggccccgta 240
cccggagagc ggcaactcgc gcactcaaag atggtcccca tccctgctgg agtatttaca 300
atgggcacag atgatcctca gataaagcag gatggggaag cacctgcgag gagagttact 360
attgatgcct tttacatgga tgcctatgaa gtcagtaata ctgaatttga gaagtttgtg 420
aactcaactg gctatttgac agaggctgag aagtttggcg actcctttgt ctttgaaggc 480
atgttgagtg agcaagtgaa gaccaatatt caacaggcag ttgcagctgc tccctggtgg 540
ttacctgtga aaggcgctaa ctggagacac ccagaagggc ctgactctac tattctgcac 600
aggccggatc atccagttct ccatgtgtcc tggaatgatg cggttgccta ctgcacttgg 660
gcagggaagc ggctgcccac ggaagctgag tgggaataca gctgtcgagg aggcctgcat 720
aatagacttt tcccctgggg caacaaactg cagcccaaag gccagcatta tgccaacatt 780
tggcagggcg agtttccggt gaccaacact ggtgaggatg gcttccaagg aactgcgcct 840
gttgatgcct tccctcccaa tggttatggc ttatacaaca tagtggggaa cgcatgggaa 900
tggacttcag actggtggac tgttcatcat tctgttgaag aaacgcttaa cccaaaaggt 960
cccccttctg ggaaagaccg agtgaagaaa ggtggatcct acatgtgcca taggtcttat 1020
tgttacaggt atcgctgtgc tgctcggagc cagaacacac ctgatagctc tgcttcgaat 1080
ctgggattcc gctgtgcagc cgaccgcctg cccactatgg actga 1125
<210> 15
<211> 1125
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 15
atggctgctc ctgccctggg gctggtgtgt ggaagatgtc ctgaactggg cctggttctg 60
ttactgcttc tgctcagcct gctctgtggt gctgccggca gccaagaggc aggcactggc 120
gctggagctg gaagcctggc tgggtcttgt ggatgtggca caccacagag gccaggggct 180
catggctcct ctgctgcagc tcataggtac agcagagaag ccaatgctcc aggcccagtg 240
cctggagaga gacagctggc tcacagcaag atggtgccca tccctgctgg ggtgttcaca 300
atgggaacag atgatcccca gatcaagcag gatggggagg cgcctgccag gagggtgacc 360
attgatgcat tctatatgga tgcctatgag gtgagcaata cagaatttga gaagtttgtg 420
aactctactg gctacctgac tgaggctgaa aaatttggag actcttttgt gtttgaagga 480
atgcttagtg aacaggttaa gaccaacatc cagcaggctg ttgcagcagc cccctggtgg 540
ttgcctgtca agggagctaa ctggaggcac cctgagggac cagattctac aatcctgcat 600
agacctgatc atcctgttct gcatgtgtct tggaatgatg ctgtggctta ctgtacctgg 660
gcaggaaaaa ggctgccaac agaagctgag tgggaatact cttgcagagg aggcctgcac 720
aatagactgt tcccatgggg caacaagctg caacccaagg gccagcacta tgctaacatc 780
tggcagggag aattccctgt gacaaacaca ggagaggacg gcttccaggg aactgcccct 840
gtagatgctt tccctcctaa tggctatggc ctgtataaca ttgttggcaa cgcctgggag 900
tggacttctg attggtggac agtgcaccac tctgttgagg agacactgaa tcctaagggg 960
ccaccttctg gaaaggatag agtgaagaag gggggaagct acatgtgcca caggtcttat 1020
tgttacagat acaggtgcgc tgctaggtct cagaacaccc ctgatagcag tgctagcaat 1080
ctgggcttca ggtgtgccgc tgacagactg cctaccatgg attaa 1125
<210> 16
<211> 1125
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 16
atggctgccc ctgctctggg attggtttgt ggcagatgtc ctgagcttgg tctggtgctg 60
ttgctccttc tgttgtctct gctgtgtgga gcagctgggt ctcaggaagc tggcacaggc 120
gctggggctg gctctctggc cgggtcatgt ggctgtggaa ctccccagcg gcctggagcc 180
catggcagct ctgccgcagc acacaggtat tctagggaag ccaatgcccc aggccctgtg 240
cctggggaga gacagctagc tcattctaag atggtgccta tcccagccgg ggtttttaca 300
atgggcactg atgatcctca gattaagcag gatggagagg cccccgccag aagagtgacc 360
attgatgctt tctacatgga tgcatatgaa gtgtccaaca cagagtttga gaaatttgtg 420
aactctactg gatacttgac cgaggctgag aagtttggag attcctttgt ctttgaaggc 480
atgctgtctg agcaggtcaa gaccaacatt cagcaagcag tggccgctgc accttggtgg 540
cttcctgtga agggcgccaa ctggagacat ccagaggggc cagatagtac catcctccac 600
agacctgatc acccagtcct tcatgtttcc tggaatgatg cagttgctta ctgcacttgg 660
gccggcaaga ggctccctac tgaggcagag tgggaatact cctgcagagg aggcctgcac 720
aacagactgt tcccttgggg gaacaagctt cagcccaaag gccagcacta tgctaacatc 780
tggcagggtg agtttccagt caccaataca ggggaggacg gattccaggg aaccgcacca 840
gtagatgcct tccctcctaa tggctatggc ctgtataata ttgtgggcaa tgcatgggag 900
tggacctctg actggtggac tgtgcaccac tcagtggagg aaaccctgaa ccctaaggga 960
cccccttcag gcaaagatag agtcaaaaag ggagggagct atatgtgtca cagatcctat 1020
tgctacagat atagatgtgc agccaggtcc cagaacaccc ctgactcttc tgctagcaac 1080
ctgggctttc ggtgtgctgc tgatagactg cccaccatgg actaa 1125
<210> 17
<211> 9854
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 17
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct ttaattaaac gcgtggggga ggctgctggt gaatattaac caaggtcacc 180
ccagttatcg gaggagcaaa caggggctaa gtccaccggg ggaggctgct ggtgaatatt 240
aaccaaggtc accccagtta tcggaggagc aaacaggggc taagtccacc gggggaggct 300
gctggtgaat attaaccaag gtcaccccag ttatcggagg agcaaacagg ggctaagtcc 360
acactagtaa atgacctatt aagaatattt catagaacga atgttccgat gctctaatct 420
ctctagacaa ggttcatatt tgtatgggtt acttattctc tctttgttga ctaagtcaat 480
aatcagaatc agcaggtttg cagtcagatt ggcagggata agcagcctag ctcaggagaa 540
gtgagtataa aagccccagg ctgggagcag ccatcacaga agtccactca ttcttggcag 600
gccgcggcta aggtaagttg gcgccgttta agggatggtt ggttggtggg gtattaatgt 660
ttaattacct tttttacagg cctgggcgcg ccgccaccat gccgccaccc cggaccggcc 720
gaggccttct ctggctgggt ctggttctga gctccgtctg cgtcgccctc ggatccgaaa 780
cgcaggccaa ctcgaccaca gatgctctga acgttcttct catcatcgtg gatgacctgc 840
gcccctccct gggctgttat ggggataagc tggtgaggtc cccaaatatt gaccaactgg 900
catcccacag cctcctcttc cagaatgcct ttgcgcagca agcagtgtgc gccccgagcc 960
gcgtttcttt cctcactggc aggagacctg acaccacccg cctgtacgac ttcaactcct 1020
actggagggt gcacgctgga aacttctcca ccatccccca gtacttcaag gagaatggct 1080
atgtgaccat gtcggtggga aaagtctttc accctgggat atcttctaac cataccgatg 1140
attctccgta tagctggtct tttccacctt atcatccttc ctctgagaag tatgaaaaca 1200
ctaagacatg tcgagggcca gatggagaac tccatgccaa cctgctttgc cctgtggatg 1260
tgctggatgt tcccgagggc accttgcctg acaaacagag cactgagcaa gccatacagt 1320
tgttggaaaa gatgaaaacg tcagccagtc ctttcttcct ggccgttggg tatcataagc 1380
cacacatccc cttcagatac cccaaggaat ttcagaagtt gtatcccttg gagaacatca 1440
ccctggcccc cgatcccgag gtccctgatg gcctaccccc tgtggcctac aacccctgga 1500
tggacatcag gcaacgggaa gacgtccaag ccttaaacat cagtgtgccg tatggtccaa 1560
ttcctgtgga ctttcagcgg aaaatccgcc agagctactt tgcctctgtg tcatatttgg 1620
atacacaggt cggccgcctc ttgagtgctt tggacgatct tcagctggcc aacagcacca 1680
tcattgcatt tacctcggat catgggtggg ctctaggtga acatggagaa tgggccaaat 1740
acagcaattt tgatgttgct acccatgttc ccctgatatt ctatgttcct ggaaggacgg 1800
cttcacttcc ggaggcaggc gagaagcttt tcccttacct cgaccctttt gattccgcct 1860
cacagttgat ggagccaggc aggcaatcca tggaccttgt ggaacttgtg tctctttttc 1920
ccacgctggc tggacttgca ggactgcagg ttccacctcg ctgccccgtt ccttcatttc 1980
acgttgagct gtgcagagaa ggcaagaacc ttctgaagca ttttcgattc cgtgacttgg 2040
aagaggatcc gtacctccct ggtaatcccc gtgaactgat tgcctatagc cagtatcccc 2100
ggccttcaga catccctcag tggaattctg acaagccgag tttaaaagat ataaagatca 2160
tgggctattc catacgcacc atagactata ggtatactgt gtgggttggc ttcaatcctg 2220
atgaatttct agctaacttt tctgacatcc atgcagggga actgtatttt gtggattctg 2280
acccattgca ggatcacaat atgtataatg attcccaagg tggagatctt ttccagttgt 2340
tgatgccttg aggtaccaat caacctctgg attacaaaat ttgtgaaaga ttgactggta 2400
ttcttaactt tgttgctcct tttacgcttt gtggatacgc tgctttattg cctttgtatc 2460
ttgctattgc ttcccgtttg gctttcattt tctcctcctt gtataaatcc tggttgctgt 2520
ctctttttga ggagttgtgg cccgttgtca ggcaacgtgg cgtggtgtgc actgtgtttg 2580
ctgacgcaac ccccactggt tggggcattg ccaccacctg tcagctcctt tccgggactt 2640
tcgctttccc cctccctatt gccacggcgg aactcatcgc cgcctgcctt gcccgctgct 2700
ggacaggggc tcggctgttg ggcactgaca attccgtggt gttgtcgggg aaatcatcgt 2760
cctttccttg gctgctcgcc tgtgttgcca cctggattct gcgcgggacg tccttctgct 2820
acgtcccttc ggccctcaat ccagcggacc ttccttcccg cggcctgctg ccggctctgc 2880
ggcctcttcc gcgtcttcgc cttcgccctc agacgagtcg gatctccctt tgggccgcct 2940
ccccgcatcg gtaccgtcga ccctagagct cgctgatcag cctcgactgt gccttctagt 3000
tgccagccat ctgttgtttg cccctccccc gtgccttcct tgaccctgga aggtgccact 3060
cccactgtcc tttcctaata aaatgaggaa attgcatcgc attgtctgag taggtgtcat 3120
tctattctgg ggggtggggt ggggcaggac agcaaggggg aggattggga agacaatagc 3180
aggcatgctg gggaatctag agtttaaaca tttaaatagg aacccctagt gatggagttg 3240
gccactccct ctctgcgcgc tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga 3300
cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag cgcgcagaga gtatacatcg 3360
atgtgagttc gcgggtggct ggggggccct gggctgcgac cgcccccgaa ccgcgtctac 3420
gagccttgcg ggctccgggt ctttgcagtc gtatgggggc agggtagctg ttccccgcaa 3480
ggagagctca aggtcagcgc tcggacctgg cggagccccg cacccaggct gtggcgccct 3540
gtgcagctcc gcccttgcgg cgccatctgc ccggagcctc cttcccctag tccccagaaa 3600
caggaggtcc ctactcccgc ccgagatccc gacccggacc cctaggtggg ggacgctttc 3660
tttcctttcg cgctctgcgg ggtcacgtgt cgcagaggag cccctccccc acggcctccg 3720
gcaccgcagg ccccgggatg ctagtgcgca gcgggtgcat ccctgtccgg atgctgcgcc 3780
tgcggtagag cggccgccat gttgcaaccg ggaaggaaat gaatgggcag ccgttaggaa 3840
agcctgccgg tgactaaccc tgcgctcctg cctcgatggg tggagtcgcg tgtggcgggg 3900
aagtcaggtg gagcgaggct agctggcccg atttctcctc cgggtgatgc ttttcctaga 3960
ttattctctg gtaaatcaaa gaagtgggtt tatggaggtc ctcttgtgtc ccctccccgc 4020
agaggtgtgg tggctgtggc atggtgccaa gccgggagaa gctgagtcat gggtagttgg 4080
aaaaggacat ttccaccgca aaatggcccc tctggtggtg gccccttcct gcagcgccgg 4140
ctcacctcac ggccccgccc ttcccctgcc agcctagcgt tgacccgacc ccaaaggcca 4200
ggctgtaaat gtcaccggga ggattgggtg tctgggcgcc tcggggaacc tgcccttctc 4260
cccattccgt cttccggaaa ccagatctcc caccgcaccc tggtctgagg ttaaatatag 4320
ctgctgacct ttctgtagct gggggcctgg gctggggctc tctcccatcc cttctcccca 4380
cacacatgca cttacctgtg ctcccactcc tgatttctgg aaaagagcta ggaaggacag 4440
gcaacttggc aaatcaaagc cctgggacta gggggttaaa atacagcttc ccctcttccc 4500
acccgcccca gtctctgtcc cttttgtagg agggacttag agaaggggtg ggcttgccct 4560
gtccagttaa tttctgacct ttactcctgc cctttgagtt tgatgatgct gagtgtacaa 4620
gcgttttctc cctaaagggt gcagctgagc taggcagcag caagcattcc tggggtggca 4680
tagtggggtg gtgaatacca tgtacaaagc ttgtgcccag actgtgggtg gcagtgcccc 4740
acatggccgc ttctcctgga agggcttcgt atgactgggg gtgttgggca gccctggagc 4800
cttcagttgc agccatgcct taagccaggc cagcctggca gggaagctca agggagataa 4860
aattcaacct cttgggccct cctgggggta aggagatgct gcattcgccc tcttaatggg 4920
gaggtggcct agggctgctc acatattctg gaggagcctc ccctcctcat gccttcttgc 4980
ctcttgtctc ttaggcatgc aaaagagtcg aataagggcg acacaaaatt tattctaaat 5040
gcataataaa tactgataac atcttatagt ttgtattata ttttgtatta tcgttgacat 5100
gtataatttt gatatcaaaa actgattttc cctttattat tttcgagatt tattttctta 5160
attctcttta acaaactaga aatattgtat atacaaaaaa tcataaataa tagatgaata 5220
gtttaattat aggtgttcat caatcgaaaa agcaacgtat cttatttaaa gtgcgttgct 5280
tttttctcat ttataaggtt aaataattct catatatcaa gcaaagtgac aggcgccctt 5340
aaatattctg acaaatgctc tttccctaaa ctccccccat aaaaaaaccc gccgaagcgg 5400
gtttttacgt tatttgcgga ttaacgatta ctcgttatca gaaccgccca gggggcccga 5460
gcttaagact ggccgtcgtt ttacaacaca gaaagagttt gtagaaacgc aaaaaggcca 5520
tccgtcaggg gccttctgct tagtttgatg cctggcagtt ccctactctc gccttccgct 5580
tcctcgctca ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac 5640
tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga 5700
gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat 5760
aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac 5820
ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct 5880
gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg 5940
ctttctcata gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg 6000
ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt 6060
cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg 6120
attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg ggctaactac 6180
ggctacacta gaagaacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga 6240
aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt 6300
gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt 6360
tctacggggt ctgacgctca gtggaacgac gcgcgcgtaa ctcacgttaa gggattttgg 6420
tcatgagctt gcgccgtccc gtcaagtcag cgtaatgctc tgcttaggtg gcggtacttg 6480
ggtcgatatc aaagtgcatc acttcttccc gtatgcccaa ctttgtatag agagccactg 6540
cgggatcgtc accgtaatct gcttgcacgt agatcacata agcaccaagc gcgttggcct 6600
catgcttgag gagattgatg agcgcggtgg caatgccctg cctccggtgc tcgccggaga 6660
ctgcgagatc atagatatag atctcactac gcggctgctc aaacttgggc agaacgtaag 6720
ccgcgagagc gccaacaacc gcttcttggt cgaaggcagc aagcgcgatg aatgtcttac 6780
tacggagcaa gttcccgagg taatcggagt ccggctgatg ttgggagtag gtggctacgt 6840
caccgaactc acgaccgaaa agatcaagag cagcccgcat ggatttgact tggtcagggc 6900
cgagcctaca tgtgcgaatg atgcccatac ttgagccacc taactttgtt ttagggcgac 6960
tgccctgctg cgtaacatcg ttgctgctcc ataacatcaa acatcgaccc acggcgtaac 7020
gcgcttgctg cttggatgcc cgaggcatag actgtacaaa aaaacagtca taacaagcca 7080
tgaaaaccgc cactgcgccg ttaccaccgc tgcgttcggt caaggttctg gaccagttgc 7140
gtgagcgcat ttttttttcc tcctcggcgt ttacgccccg ccctgccact catcgcagta 7200
ctgttgtaat tcattaagca ttctgccgac atggaagcca tcacagacgg catgatgaac 7260
ctgaatcgcc agcggcatca gcaccttgtc gccttgcgta taatatttgc ccatagtgaa 7320
aacgggggcg aagaagttgt ccatattggc cacgtttaaa tcaaaactgg tgaaactcac 7380
ccagggattg gcgctgacga aaaacatatt ctcaataaac cctttaggga aataggccag 7440
gttttcaccg taacacgcca catcttgcga atatatgtgt agaaactgcc ggaaatcgtc 7500
gtgtgcactc atggaaaacg gtgtaacaag ggtgaacact atcccatatc accagctcac 7560
cgtctttcat tgccatacgg aactccggat gagcattcat caggcgggca agaatgtgaa 7620
taaaggccgg ataaaacttg tgcttatttt tctttacggt ctttaaaaag gccgtaatat 7680
ccagctgaac ggtctggtta taggtacatt gagcaactga ctgaaatgcc tcaaaatgtt 7740
ctttacgatg ccattgggat atatcaacgg tggtatatcc agtgattttt ttctccattt 7800
ttttttcctc ctttagaaaa actcatcgag catcaaatga aactgcaatt tattcatatc 7860
aggattatca ataccatatt tttgaaaaag ccgtttctgt aatgaaggag aaaactcacc 7920
gaggcagttc cataggatgg caagatcctg gtatcggtct gcgattccga ctcgtccaac 7980
atcaatacaa cctattaatt tcccctcgtc aaaaataagg ttatcaagtg agaaatcacc 8040
atgagtgacg actgaatccg gtgagaatgg caaaagttta tgcatttctt tccagacttg 8100
ttcaacaggc cagccattac gctcgtcatc aaaatcactc gcatcaacca aaccgttatt 8160
cattcgtgat tgcgcctgag cgaggcgaaa tacgcgatcg ctgttaaaag gacaattaca 8220
aacaggaatc gagtgcaacc ggcgcaggaa cactgccagc gcatcaacaa tattttcacc 8280
tgaatcagga tattcttcta atacctggaa cgctgttttt ccggggatcg cagtggtgag 8340
taaccatgca tcatcaggag tacggataaa atgcttgatg gtcggaagtg gcataaattc 8400
cgtcagccag tttagtctga ccatctcatc tgtaacatca ttggcaacgc tacctttgcc 8460
atgtttcaga aacaactctg gcgcatcggg cttcccatac aagcgataga ttgtcgcacc 8520
tgattgcccg acattatcgc gagcccattt atacccatat aaatcagcat ccatgttgga 8580
atttaatcgc ggcctcgacg tttcccgttg aatatggctc attttttttt cctcctttac 8640
caatgcttaa tcagtgaggc acctatctca gcgatctgtc tatttcgttc atccatagtt 8700
gcctgactcc ccgtcgtgta gataactacg atacgggagg gcttaccatc tggccccagc 8760
gctgcgatga taccgcgaga accacgctca ccggctccgg atttatcagc aataaaccag 8820
ccagccggaa gggccgagcg cagaagtggt cctgcaactt tatccgcctc catccagtct 8880
attaattgtt gccgggaagc tagagtaagt agttcgccag ttaatagttt gcgcaacgtt 8940
gttgccatcg ctacaggcat cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc 9000
tccggttccc aacgatcaag gcgagttaca tgatccccca tgttgtgcac gttgtcagaa 9060
gtaagttggc cgcagtgtta tcactcatgg ttatggcagc actgcataat tctcttactg 9120
tcatgccatc cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag tcattctgag 9180
aatagtgtat gcggcgaccg agttgctctt gcccggcgtc aatacgggat aataccgcgc 9240
cacatagcag aactttaaaa gtgctcatca ttggaaaacg ttcttcgggg cgaaaactct 9300
caaggatctt accgctgttg agatccagtt cgatgtaacc cactcgtgca cccaactgat 9360
cttcagcatc ttttactttc accagcgttt ctgggtgagc aaaaacagga aggcaaaatg 9420
ccgcaaaaaa gggaataagg gcgacacgga aatgttgaat actcatattc ttcctttttc 9480
aatattattg aagcatttat cagggttatt gtctcatgag cggatacata tttgaatgta 9540
tttagaaaaa taaacaaata ggggtcagtg ttacaaccaa ttaaccaatt ctgaacatta 9600
tcgcgagccc atttatacct gaatatggct cataacaccc cttgtttgcc tggcggcagt 9660
agcgcggtgg tcccacctga ccccatgccg aactcagaag tgaaacgccg tagcgccgat 9720
ggtagtgtgg ggactcccca tgcgagagta gggaactgcc aggcatcaaa taaaacgaaa 9780
ggctcagtcg aaagactggg cctttcgccc gggctaattg aggggtgtcg cccttattcg 9840
actcggggct cgag 9854
<210> 18
<211> 9854
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 18
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct ttaattaaac gcgtggggga ggctgctggt gaatattaac caaggtcacc 180
ccagttatcg gaggagcaaa caggggctaa gtccaccggg ggaggctgct ggtgaatatt 240
aaccaaggtc accccagtta tcggaggagc aaacaggggc taagtccacc gggggaggct 300
gctggtgaat attaaccaag gtcaccccag ttatcggagg agcaaacagg ggctaagtcc 360
acactagtaa atgacctatt aagaatattt catagaacga atgttccgat gctctaatct 420
ctctagacaa ggttcatatt tgtatgggtt acttattctc tctttgttga ctaagtcaat 480
aatcagaatc agcaggtttg cagtcagatt ggcagggata agcagcctag ctcaggagaa 540
gtgagtataa aagccccagg ctgggagcag ccatcacaga agtccactca ttcttggcag 600
gccgcggcta aggtaagttg gcgccgttta agggatggtt ggttggtggg gtattaatgt 660
ttaattacct tttttacagg cctgggcgcg ccgccaccat gccacccccc cggaccggga 720
gaggcctctt gtggttgggc ctggtgctga gcagcgtgtg cgtggccctg ggcagtgaga 780
cccaggctaa ctctacaaca gatgccttga atgtgctgct gatcattgtg gatgacctga 840
ggccaagtct gggctgctat ggggacaaat tggtgaggtc ccccaacatc gaccagttgg 900
cctcccactc tctcctattc caaaatgctt tcgcccagca ggcagtttgt gccccctcta 960
gggtgagctt cctcactggc aggcgccctg acaccactag actgtatgac tttaacagct 1020
attggagggt gcacgcagga aacttctcca caatccctca atacttcaag gagaatggtt 1080
atgtgacaat gtctgtgggc aaggtgttcc accctggcat cagcagcaac cacaccgatg 1140
actcacccta tagttggtct tttcccccct accatccttc atctgagaaa tatgaaaaca 1200
caaaaacctg ccgaggccca gacggggaac tgcatgccaa cctactctgt cctgttgatg 1260
tactggacgt gcccgagggc accctccctg ataagcagtc cacagaacag gccattcagc 1320
tgcttgaaaa gatgaagacc tccgcatccc ccttcttctt ggctgtcggc taccacaagc 1380
cccatatccc ctttagatac cccaaggaat tccagaaact gtacccactg gagaacatca 1440
cacttgctcc tgaccctgaa gtgcctgacg gactgcctcc agtggcctat aacccttgga 1500
tggacatccg gcagcgcgag gatgtgcagg ctctgaacat tagtgtgcct tatgggccca 1560
tccctgtgga ctttcagagg aagattcgcc agtcctactt tgcctctgta tcctacctgg 1620
acacacaggt gggacgcctg ctgtctgccc ttgatgatct gcaactggcc aacagcacca 1680
ttatagcttt cacatcagac catgggtggg ctcttgggga gcatggtgaa tgggctaagt 1740
actccaactt cgatgtggca acccatgtcc ctctgatctt ctatgtgcca ggaaggaccg 1800
cctctctgcc agaggcaggt gagaagctgt tcccctatct ggaccctttt gactccgcca 1860
gccagctgat ggagcctggc cgacagtcta tggacctggt tgagctggtc agcctgtttc 1920
ccacactcgc tggactggct ggcctgcaag tacccccacg ctgcccagtg ccctccttcc 1980
atgtggagct ttgcagggag gggaagaacc tcctcaagca cttcaggttc agggacctag 2040
aggaggatcc ttatctgcct ggaaacccca gagagcttat tgcttactcc cagtatccaa 2100
ggcctagtga cattccccaa tggaactcag acaaaccaag cctgaaagac atcaagatca 2160
tgggatactc tatcaggacc attgactaca ggtacactgt gtgggttggc ttcaacccgg 2220
atgagttcct ggctaatttc tctgacatac atgctggcga gctgtacttc gtggacagtg 2280
accccctgca ggatcacaac atgtacaatg attcccaggg gggtgacctc ttccagcttc 2340
tgatgcccta aggtaccaat caacctctgg attacaaaat ttgtgaaaga ttgactggta 2400
ttcttaactt tgttgctcct tttacgcttt gtggatacgc tgctttattg cctttgtatc 2460
ttgctattgc ttcccgtttg gctttcattt tctcctcctt gtataaatcc tggttgctgt 2520
ctctttttga ggagttgtgg cccgttgtca ggcaacgtgg cgtggtgtgc actgtgtttg 2580
ctgacgcaac ccccactggt tggggcattg ccaccacctg tcagctcctt tccgggactt 2640
tcgctttccc cctccctatt gccacggcgg aactcatcgc cgcctgcctt gcccgctgct 2700
ggacaggggc tcggctgttg ggcactgaca attccgtggt gttgtcgggg aaatcatcgt 2760
cctttccttg gctgctcgcc tgtgttgcca cctggattct gcgcgggacg tccttctgct 2820
acgtcccttc ggccctcaat ccagcggacc ttccttcccg cggcctgctg ccggctctgc 2880
ggcctcttcc gcgtcttcgc cttcgccctc agacgagtcg gatctccctt tgggccgcct 2940
ccccgcatcg gtaccgtcga ccctagagct cgctgatcag cctcgactgt gccttctagt 3000
tgccagccat ctgttgtttg cccctccccc gtgccttcct tgaccctgga aggtgccact 3060
cccactgtcc tttcctaata aaatgaggaa attgcatcgc attgtctgag taggtgtcat 3120
tctattctgg ggggtggggt ggggcaggac agcaaggggg aggattggga agacaatagc 3180
aggcatgctg gggaatctag agtttaaaca tttaaatagg aacccctagt gatggagttg 3240
gccactccct ctctgcgcgc tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga 3300
cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag cgcgcagaga gtatacatcg 3360
atgtgagttc gcgggtggct ggggggccct gggctgcgac cgcccccgaa ccgcgtctac 3420
gagccttgcg ggctccgggt ctttgcagtc gtatgggggc agggtagctg ttccccgcaa 3480
ggagagctca aggtcagcgc tcggacctgg cggagccccg cacccaggct gtggcgccct 3540
gtgcagctcc gcccttgcgg cgccatctgc ccggagcctc cttcccctag tccccagaaa 3600
caggaggtcc ctactcccgc ccgagatccc gacccggacc cctaggtggg ggacgctttc 3660
tttcctttcg cgctctgcgg ggtcacgtgt cgcagaggag cccctccccc acggcctccg 3720
gcaccgcagg ccccgggatg ctagtgcgca gcgggtgcat ccctgtccgg atgctgcgcc 3780
tgcggtagag cggccgccat gttgcaaccg ggaaggaaat gaatgggcag ccgttaggaa 3840
agcctgccgg tgactaaccc tgcgctcctg cctcgatggg tggagtcgcg tgtggcgggg 3900
aagtcaggtg gagcgaggct agctggcccg atttctcctc cgggtgatgc ttttcctaga 3960
ttattctctg gtaaatcaaa gaagtgggtt tatggaggtc ctcttgtgtc ccctccccgc 4020
agaggtgtgg tggctgtggc atggtgccaa gccgggagaa gctgagtcat gggtagttgg 4080
aaaaggacat ttccaccgca aaatggcccc tctggtggtg gccccttcct gcagcgccgg 4140
ctcacctcac ggccccgccc ttcccctgcc agcctagcgt tgacccgacc ccaaaggcca 4200
ggctgtaaat gtcaccggga ggattgggtg tctgggcgcc tcggggaacc tgcccttctc 4260
cccattccgt cttccggaaa ccagatctcc caccgcaccc tggtctgagg ttaaatatag 4320
ctgctgacct ttctgtagct gggggcctgg gctggggctc tctcccatcc cttctcccca 4380
cacacatgca cttacctgtg ctcccactcc tgatttctgg aaaagagcta ggaaggacag 4440
gcaacttggc aaatcaaagc cctgggacta gggggttaaa atacagcttc ccctcttccc 4500
acccgcccca gtctctgtcc cttttgtagg agggacttag agaaggggtg ggcttgccct 4560
gtccagttaa tttctgacct ttactcctgc cctttgagtt tgatgatgct gagtgtacaa 4620
gcgttttctc cctaaagggt gcagctgagc taggcagcag caagcattcc tggggtggca 4680
tagtggggtg gtgaatacca tgtacaaagc ttgtgcccag actgtgggtg gcagtgcccc 4740
acatggccgc ttctcctgga agggcttcgt atgactgggg gtgttgggca gccctggagc 4800
cttcagttgc agccatgcct taagccaggc cagcctggca gggaagctca agggagataa 4860
aattcaacct cttgggccct cctgggggta aggagatgct gcattcgccc tcttaatggg 4920
gaggtggcct agggctgctc acatattctg gaggagcctc ccctcctcat gccttcttgc 4980
ctcttgtctc ttaggcatgc aaaagagtcg aataagggcg acacaaaatt tattctaaat 5040
gcataataaa tactgataac atcttatagt ttgtattata ttttgtatta tcgttgacat 5100
gtataatttt gatatcaaaa actgattttc cctttattat tttcgagatt tattttctta 5160
attctcttta acaaactaga aatattgtat atacaaaaaa tcataaataa tagatgaata 5220
gtttaattat aggtgttcat caatcgaaaa agcaacgtat cttatttaaa gtgcgttgct 5280
tttttctcat ttataaggtt aaataattct catatatcaa gcaaagtgac aggcgccctt 5340
aaatattctg acaaatgctc tttccctaaa ctccccccat aaaaaaaccc gccgaagcgg 5400
gtttttacgt tatttgcgga ttaacgatta ctcgttatca gaaccgccca gggggcccga 5460
gcttaagact ggccgtcgtt ttacaacaca gaaagagttt gtagaaacgc aaaaaggcca 5520
tccgtcaggg gccttctgct tagtttgatg cctggcagtt ccctactctc gccttccgct 5580
tcctcgctca ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac 5640
tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga 5700
gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat 5760
aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac 5820
ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct 5880
gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg 5940
ctttctcata gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg 6000
ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt 6060
cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg 6120
attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg ggctaactac 6180
ggctacacta gaagaacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga 6240
aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt 6300
gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt 6360
tctacggggt ctgacgctca gtggaacgac gcgcgcgtaa ctcacgttaa gggattttgg 6420
tcatgagctt gcgccgtccc gtcaagtcag cgtaatgctc tgcttaggtg gcggtacttg 6480
ggtcgatatc aaagtgcatc acttcttccc gtatgcccaa ctttgtatag agagccactg 6540
cgggatcgtc accgtaatct gcttgcacgt agatcacata agcaccaagc gcgttggcct 6600
catgcttgag gagattgatg agcgcggtgg caatgccctg cctccggtgc tcgccggaga 6660
ctgcgagatc atagatatag atctcactac gcggctgctc aaacttgggc agaacgtaag 6720
ccgcgagagc gccaacaacc gcttcttggt cgaaggcagc aagcgcgatg aatgtcttac 6780
tacggagcaa gttcccgagg taatcggagt ccggctgatg ttgggagtag gtggctacgt 6840
caccgaactc acgaccgaaa agatcaagag cagcccgcat ggatttgact tggtcagggc 6900
cgagcctaca tgtgcgaatg atgcccatac ttgagccacc taactttgtt ttagggcgac 6960
tgccctgctg cgtaacatcg ttgctgctcc ataacatcaa acatcgaccc acggcgtaac 7020
gcgcttgctg cttggatgcc cgaggcatag actgtacaaa aaaacagtca taacaagcca 7080
tgaaaaccgc cactgcgccg ttaccaccgc tgcgttcggt caaggttctg gaccagttgc 7140
gtgagcgcat ttttttttcc tcctcggcgt ttacgccccg ccctgccact catcgcagta 7200
ctgttgtaat tcattaagca ttctgccgac atggaagcca tcacagacgg catgatgaac 7260
ctgaatcgcc agcggcatca gcaccttgtc gccttgcgta taatatttgc ccatagtgaa 7320
aacgggggcg aagaagttgt ccatattggc cacgtttaaa tcaaaactgg tgaaactcac 7380
ccagggattg gcgctgacga aaaacatatt ctcaataaac cctttaggga aataggccag 7440
gttttcaccg taacacgcca catcttgcga atatatgtgt agaaactgcc ggaaatcgtc 7500
gtgtgcactc atggaaaacg gtgtaacaag ggtgaacact atcccatatc accagctcac 7560
cgtctttcat tgccatacgg aactccggat gagcattcat caggcgggca agaatgtgaa 7620
taaaggccgg ataaaacttg tgcttatttt tctttacggt ctttaaaaag gccgtaatat 7680
ccagctgaac ggtctggtta taggtacatt gagcaactga ctgaaatgcc tcaaaatgtt 7740
ctttacgatg ccattgggat atatcaacgg tggtatatcc agtgattttt ttctccattt 7800
ttttttcctc ctttagaaaa actcatcgag catcaaatga aactgcaatt tattcatatc 7860
aggattatca ataccatatt tttgaaaaag ccgtttctgt aatgaaggag aaaactcacc 7920
gaggcagttc cataggatgg caagatcctg gtatcggtct gcgattccga ctcgtccaac 7980
atcaatacaa cctattaatt tcccctcgtc aaaaataagg ttatcaagtg agaaatcacc 8040
atgagtgacg actgaatccg gtgagaatgg caaaagttta tgcatttctt tccagacttg 8100
ttcaacaggc cagccattac gctcgtcatc aaaatcactc gcatcaacca aaccgttatt 8160
cattcgtgat tgcgcctgag cgaggcgaaa tacgcgatcg ctgttaaaag gacaattaca 8220
aacaggaatc gagtgcaacc ggcgcaggaa cactgccagc gcatcaacaa tattttcacc 8280
tgaatcagga tattcttcta atacctggaa cgctgttttt ccggggatcg cagtggtgag 8340
taaccatgca tcatcaggag tacggataaa atgcttgatg gtcggaagtg gcataaattc 8400
cgtcagccag tttagtctga ccatctcatc tgtaacatca ttggcaacgc tacctttgcc 8460
atgtttcaga aacaactctg gcgcatcggg cttcccatac aagcgataga ttgtcgcacc 8520
tgattgcccg acattatcgc gagcccattt atacccatat aaatcagcat ccatgttgga 8580
atttaatcgc ggcctcgacg tttcccgttg aatatggctc attttttttt cctcctttac 8640
caatgcttaa tcagtgaggc acctatctca gcgatctgtc tatttcgttc atccatagtt 8700
gcctgactcc ccgtcgtgta gataactacg atacgggagg gcttaccatc tggccccagc 8760
gctgcgatga taccgcgaga accacgctca ccggctccgg atttatcagc aataaaccag 8820
ccagccggaa gggccgagcg cagaagtggt cctgcaactt tatccgcctc catccagtct 8880
attaattgtt gccgggaagc tagagtaagt agttcgccag ttaatagttt gcgcaacgtt 8940
gttgccatcg ctacaggcat cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc 9000
tccggttccc aacgatcaag gcgagttaca tgatccccca tgttgtgcac gttgtcagaa 9060
gtaagttggc cgcagtgtta tcactcatgg ttatggcagc actgcataat tctcttactg 9120
tcatgccatc cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag tcattctgag 9180
aatagtgtat gcggcgaccg agttgctctt gcccggcgtc aatacgggat aataccgcgc 9240
cacatagcag aactttaaaa gtgctcatca ttggaaaacg ttcttcgggg cgaaaactct 9300
caaggatctt accgctgttg agatccagtt cgatgtaacc cactcgtgca cccaactgat 9360
cttcagcatc ttttactttc accagcgttt ctgggtgagc aaaaacagga aggcaaaatg 9420
ccgcaaaaaa gggaataagg gcgacacgga aatgttgaat actcatattc ttcctttttc 9480
aatattattg aagcatttat cagggttatt gtctcatgag cggatacata tttgaatgta 9540
tttagaaaaa taaacaaata ggggtcagtg ttacaaccaa ttaaccaatt ctgaacatta 9600
tcgcgagccc atttatacct gaatatggct cataacaccc cttgtttgcc tggcggcagt 9660
agcgcggtgg tcccacctga ccccatgccg aactcagaag tgaaacgccg tagcgccgat 9720
ggtagtgtgg ggactcccca tgcgagagta gggaactgcc aggcatcaaa taaaacgaaa 9780
ggctcagtcg aaagactggg cctttcgccc gggctaattg aggggtgtcg cccttattcg 9840
actcggggct cgag 9854
<210> 19
<211> 10968
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 19
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct ttaattaaac gcgtggggga ggctgctggt gaatattaac caaggtcacc 180
ccagttatcg gaggagcaaa caggggctaa gtccaccggg ggaggctgct ggtgaatatt 240
aaccaaggtc accccagtta tcggaggagc aaacaggggc taagtccacc gggggaggct 300
gctggtgaat attaaccaag gtcaccccag ttatcggagg agcaaacagg ggctaagtcc 360
acactagtaa atgacctatt aagaatattt catagaacga atgttccgat gctctaatct 420
ctctagacaa ggttcatatt tgtatgggtt acttattctc tctttgttga ctaagtcaat 480
aatcagaatc agcaggtttg cagtcagatt ggcagggata agcagcctag ctcaggagaa 540
gtgagtataa aagccccagg ctgggagcag ccatcacaga agtccactca ttcttggcag 600
gccgcggcta aggtaagttg gcgccgttta agggatggtt ggttggtggg gtattaatgt 660
ttaattacct tttttacagg cctgggcgcg ccgccaccat gccgccaccc cggaccggcc 720
gaggccttct ctggctgggt ctggttctga gctccgtctg cgtcgccctc ggatccgaaa 780
cgcaggccaa ctcgaccaca gatgctctga acgttcttct catcatcgtg gatgacctgc 840
gcccctccct gggctgttat ggggataagc tggtgaggtc cccaaatatt gaccaactgg 900
catcccacag cctcctcttc cagaatgcct ttgcgcagca agcagtgtgc gccccgagcc 960
gcgtttcttt cctcactggc aggagacctg acaccacccg cctgtacgac ttcaactcct 1020
actggagggt gcacgctgga aacttctcca ccatccccca gtacttcaag gagaatggct 1080
atgtgaccat gtcggtggga aaagtctttc accctgggat atcttctaac cataccgatg 1140
attctccgta tagctggtct tttccacctt atcatccttc ctctgagaag tatgaaaaca 1200
ctaagacatg tcgagggcca gatggagaac tccatgccaa cctgctttgc cctgtggatg 1260
tgctggatgt tcccgagggc accttgcctg acaaacagag cactgagcaa gccatacagt 1320
tgttggaaaa gatgaaaacg tcagccagtc ctttcttcct ggccgttggg tatcataagc 1380
cacacatccc cttcagatac cccaaggaat ttcagaagtt gtatcccttg gagaacatca 1440
ccctggcccc cgatcccgag gtccctgatg gcctaccccc tgtggcctac aacccctgga 1500
tggacatcag gcaacgggaa gacgtccaag ccttaaacat cagtgtgccg tatggtccaa 1560
ttcctgtgga ctttcagcgg aaaatccgcc agagctactt tgcctctgtg tcatatttgg 1620
atacacaggt cggccgcctc ttgagtgctt tggacgatct tcagctggcc aacagcacca 1680
tcattgcatt tacctcggat catgggtggg ctctaggtga acatggagaa tgggccaaat 1740
acagcaattt tgatgttgct acccatgttc ccctgatatt ctatgttcct ggaaggacgg 1800
cttcacttcc ggaggcaggc gagaagcttt tcccttacct cgaccctttt gattccgcct 1860
cacagttgat ggagccaggc aggcaatcca tggaccttgt ggaacttgtg tctctttttc 1920
ccacgctggc tggacttgca ggactgcagg ttccacctcg ctgccccgtt ccttcatttc 1980
acgttgagct gtgcagagaa ggcaagaacc ttctgaagca ttttcgattc cgtgacttgg 2040
aagaggatcc gtacctccct ggtaatcccc gtgaactgat tgcctatagc cagtatcccc 2100
ggccttcaga catccctcag tggaattctg acaagccgag tttaaaagat ataaagatca 2160
tgggctattc catacgcacc atagactata ggtatactgt gtgggttggc ttcaatcctg 2220
atgaatttct agctaacttt tctgacatcc atgcagggga actgtatttt gtggattctg 2280
acccattgca ggatcacaat atgtataatg attcccaagg tggagatctt ttccagttgt 2340
tgatgccttg acaattggcc cctctccctc ccccccccct aacgttactg gccgaagccg 2400
cttggaataa ggccggtgtg cgtttgtcta tatgttattt tccaccatat tgccgtcttt 2460
tggcaatgtg agggcccgga aacctggccc tgtcttcttg acgagcattc ctaggggtct 2520
ttcccctctc gccaaaggaa tgcaaggtct gttgaatgtc gtgaaggaag cagttcctct 2580
ggaagcttct tgaagacaaa caacgtctgt agcgaccctt tgcaggcagc ggaacccccc 2640
acctggcgac aggtgcctct gcggccaaaa gccacgtgta taagatacac ctgcaaaggc 2700
ggcacaaccc cagtgccacg ttgtgagttg gatagttgtg gaaagagtca aatggctcac 2760
ctcaagcgta ttcaacaagg ggctgaagga tgcccagaag gtaccccatt gtatgggatc 2820
tgatctgggg cctcggtgca catgctttac atgtgtttag tcgaggttaa aaaacgtcta 2880
ggccccccga accacgggga cgtggttttc ctttgaaaaa cacgatgata atcatatggc 2940
caccatggct gcgcccgcac tagggctggt gtgtggacgt tgccctgagc tgggtctcgt 3000
cctcttgctg ctgctgctct cgctgctgtg tggagcggca gggagccagg aggccgggac 3060
cggtgcgggc gcggggtccc ttgcgggttc ttgcggctgc ggcacgcccc agcggcctgg 3120
cgcccatggc agttcggcag ccgctcaccg atactcgcgg gaggctaacg ctccgggccc 3180
cgtacccgga gagcggcaac tcgcgcactc aaagatggtc cccatccctg ctggagtatt 3240
tacaatgggc acagatgatc ctcagataaa gcaggatggg gaagcacctg cgaggagagt 3300
tactattgat gccttttaca tggatgccta tgaagtcagt aatactgaat ttgagaagtt 3360
tgtgaactca actggctatt tgacagaggc tgagaagttt ggcgactcct ttgtctttga 3420
aggcatgttg agtgagcaag tgaagaccaa tattcaacag gcagttgcag ctgctccctg 3480
gtggttacct gtgaaaggcg ctaactggag acacccagaa gggcctgact ctactattct 3540
gcacaggccg gatcatccag ttctccatgt gtcctggaat gatgcggttg cctactgcac 3600
ttgggcaggg aagcggctgc ccacggaagc tgagtgggaa tacagctgtc gaggaggcct 3660
gcataataga cttttcccct ggggcaacaa actgcagccc aaaggccagc attatgccaa 3720
catttggcag ggcgagtttc cggtgaccaa cactggtgag gatggcttcc aaggaactgc 3780
gcctgttgat gccttccctc ccaatggtta tggcttatac aacatagtgg ggaacgcatg 3840
ggaatggact tcagactggt ggactgttca tcattctgtt gaagaaacgc ttaacccaaa 3900
aggtccccct tctgggaaag accgagtgaa gaaaggtgga tcctacatgt gccataggtc 3960
ttattgttac aggtatcgct gtgctgctcg gagccagaac acacctgata gctctgcttc 4020
gaatctggga ttccgctgtg cagccgaccg cctgcccact atggactgag tcgaccctag 4080
agctcgctga tcagcctcga ctgtgccttc tagttgccag ccatctgttg tttgcccctc 4140
ccccgtgcct tccttgaccc tggaaggtgc cactcccact gtcctttcct aataaaatga 4200
ggaaattgca tcgcattgtc tgagtaggtg tcattctatt ctggggggtg gggtggggca 4260
ggacagcaag ggggaggatt gggaagacaa tagcaggcat gctggggaat ctagagttta 4320
aacatttaaa taggaacccc tagtgatgga gttggccact ccctctctgc gcgctcgctc 4380
gctcactgag gccgggcgac caaaggtcgc ccgacgcccg ggctttgccc gggcggcctc 4440
agtgagcgag cgagcgcgca gagagtatac atcgatgtga gttcgcgggt ggctgggggg 4500
ccctgggctg cgaccgcccc cgaaccgcgt ctacgagcct tgcgggctcc gggtctttgc 4560
agtcgtatgg gggcagggta gctgttcccc gcaaggagag ctcaaggtca gcgctcggac 4620
ctggcggagc cccgcaccca ggctgtggcg ccctgtgcag ctccgccctt gcggcgccat 4680
ctgcccggag cctccttccc ctagtcccca gaaacaggag gtccctactc ccgcccgaga 4740
tcccgacccg gacccctagg tgggggacgc tttctttcct ttcgcgctct gcggggtcac 4800
gtgtcgcaga ggagcccctc ccccacggcc tccggcaccg caggccccgg gatgctagtg 4860
cgcagcgggt gcatccctgt ccggatgctg cgcctgcggt agagcggccg ccatgttgca 4920
accgggaagg aaatgaatgg gcagccgtta ggaaagcctg ccggtgacta accctgcgct 4980
cctgcctcga tgggtggagt cgcgtgtggc ggggaagtca ggtggagcga ggctagctgg 5040
cccgatttct cctccgggtg atgcttttcc tagattattc tctggtaaat caaagaagtg 5100
ggtttatgga ggtcctcttg tgtcccctcc ccgcagaggt gtggtggctg tggcatggtg 5160
ccaagccggg agaagctgag tcatgggtag ttggaaaagg acatttccac cgcaaaatgg 5220
cccctctggt ggtggcccct tcctgcagcg ccggctcacc tcacggcccc gcccttcccc 5280
tgccagccta gcgttgaccc gaccccaaag gccaggctgt aaatgtcacc gggaggattg 5340
ggtgtctggg cgcctcgggg aacctgccct tctccccatt ccgtcttccg gaaaccagat 5400
ctcccaccgc accctggtct gaggttaaat atagctgctg acctttctgt agctgggggc 5460
ctgggctggg gctctctccc atcccttctc cccacacaca tgcacttacc tgtgctccca 5520
ctcctgattt ctggaaaaga gctaggaagg acaggcaact tggcaaatca aagccctggg 5580
actagggggt taaaatacag cttcccctct tcccacccgc cccagtctct gtcccttttg 5640
taggagggac ttagagaagg ggtgggcttg ccctgtccag ttaatttctg acctttactc 5700
ctgccctttg agtttgatga tgctgagtgt acaagcgttt tctccctaaa gggtgcagct 5760
gagctaggca gcagcaagca ttcctggggt ggcatagtgg ggtggtgaat accatgtaca 5820
aagcttgtgc ccagactgtg ggtggcagtg ccccacatgg ccgcttctcc tggaagggct 5880
tcgtatgact gggggtgttg ggcagccctg gagccttcag ttgcagccat gccttaagcc 5940
aggccagcct ggcagggaag ctcaagggag ataaaattca acctcttggg ccctcctggg 6000
ggtaaggaga tgctgcattc gccctcttaa tggggaggtg gcctagggct gctcacatat 6060
tctggaggag cctcccctcc tcatgccttc ttgcctcttg tctcttaggc atgcaaaaga 6120
gtcgaataag ggcgacacaa aatttattct aaatgcataa taaatactga taacatctta 6180
tagtttgtat tatattttgt attatcgttg acatgtataa ttttgatatc aaaaactgat 6240
tttcccttta ttattttcga gatttatttt cttaattctc tttaacaaac tagaaatatt 6300
gtatatacaa aaaatcataa ataatagatg aatagtttaa ttataggtgt tcatcaatcg 6360
aaaaagcaac gtatcttatt taaagtgcgt tgcttttttc tcatttataa ggttaaataa 6420
ttctcatata tcaagcaaag tgacaggcgc ccttaaatat tctgacaaat gctctttccc 6480
taaactcccc ccataaaaaa acccgccgaa gcgggttttt acgttatttg cggattaacg 6540
attactcgtt atcagaaccg cccagggggc ccgagcttaa gactggccgt cgttttacaa 6600
cacagaaaga gtttgtagaa acgcaaaaag gccatccgtc aggggccttc tgcttagttt 6660
gatgcctggc agttccctac tctcgccttc cgcttcctcg ctcactgact cgctgcgctc 6720
ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac 6780
agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa 6840
ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg acgagcatca 6900
caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc 6960
gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata 7020
cctgtccgcc tttctccctt cgggaagcgt ggcgctttct catagctcac gctgtaggta 7080
tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca 7140
gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga 7200
cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg 7260
tgctacagag ttcttgaagt ggtgggctaa ctacggctac actagaagaa cagtatttgg 7320
tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg 7380
caaacaaacc accgctggta gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag 7440
aaaaaaagga tctcaagaag atcctttgat cttttctacg gggtctgacg ctcagtggaa 7500
cgacgcgcgc gtaactcacg ttaagggatt ttggtcatga gcttgcgccg tcccgtcaag 7560
tcagcgtaat gctctgctta ggtggcggta cttgggtcga tatcaaagtg catcacttct 7620
tcccgtatgc ccaactttgt atagagagcc actgcgggat cgtcaccgta atctgcttgc 7680
acgtagatca cataagcacc aagcgcgttg gcctcatgct tgaggagatt gatgagcgcg 7740
gtggcaatgc cctgcctccg gtgctcgccg gagactgcga gatcatagat atagatctca 7800
ctacgcggct gctcaaactt gggcagaacg taagccgcga gagcgccaac aaccgcttct 7860
tggtcgaagg cagcaagcgc gatgaatgtc ttactacgga gcaagttccc gaggtaatcg 7920
gagtccggct gatgttggga gtaggtggct acgtcaccga actcacgacc gaaaagatca 7980
agagcagccc gcatggattt gacttggtca gggccgagcc tacatgtgcg aatgatgccc 8040
atacttgagc cacctaactt tgttttaggg cgactgccct gctgcgtaac atcgttgctg 8100
ctccataaca tcaaacatcg acccacggcg taacgcgctt gctgcttgga tgcccgaggc 8160
atagactgta caaaaaaaca gtcataacaa gccatgaaaa ccgccactgc gccgttacca 8220
ccgctgcgtt cggtcaaggt tctggaccag ttgcgtgagc gcattttttt ttcctcctcg 8280
gcgtttacgc cccgccctgc cactcatcgc agtactgttg taattcatta agcattctgc 8340
cgacatggaa gccatcacag acggcatgat gaacctgaat cgccagcggc atcagcacct 8400
tgtcgccttg cgtataatat ttgcccatag tgaaaacggg ggcgaagaag ttgtccatat 8460
tggccacgtt taaatcaaaa ctggtgaaac tcacccaggg attggcgctg acgaaaaaca 8520
tattctcaat aaacccttta gggaaatagg ccaggttttc accgtaacac gccacatctt 8580
gcgaatatat gtgtagaaac tgccggaaat cgtcgtgtgc actcatggaa aacggtgtaa 8640
caagggtgaa cactatccca tatcaccagc tcaccgtctt tcattgccat acggaactcc 8700
ggatgagcat tcatcaggcg ggcaagaatg tgaataaagg ccggataaaa cttgtgctta 8760
tttttcttta cggtctttaa aaaggccgta atatccagct gaacggtctg gttataggta 8820
cattgagcaa ctgactgaaa tgcctcaaaa tgttctttac gatgccattg ggatatatca 8880
acggtggtat atccagtgat ttttttctcc attttttttt cctcctttag aaaaactcat 8940
cgagcatcaa atgaaactgc aatttattca tatcaggatt atcaatacca tatttttgaa 9000
aaagccgttt ctgtaatgaa ggagaaaact caccgaggca gttccatagg atggcaagat 9060
cctggtatcg gtctgcgatt ccgactcgtc caacatcaat acaacctatt aatttcccct 9120
cgtcaaaaat aaggttatca agtgagaaat caccatgagt gacgactgaa tccggtgaga 9180
atggcaaaag tttatgcatt tctttccaga cttgttcaac aggccagcca ttacgctcgt 9240
catcaaaatc actcgcatca accaaaccgt tattcattcg tgattgcgcc tgagcgaggc 9300
gaaatacgcg atcgctgtta aaaggacaat tacaaacagg aatcgagtgc aaccggcgca 9360
ggaacactgc cagcgcatca acaatatttt cacctgaatc aggatattct tctaatacct 9420
ggaacgctgt ttttccgggg atcgcagtgg tgagtaacca tgcatcatca ggagtacgga 9480
taaaatgctt gatggtcgga agtggcataa attccgtcag ccagtttagt ctgaccatct 9540
catctgtaac atcattggca acgctacctt tgccatgttt cagaaacaac tctggcgcat 9600
cgggcttccc atacaagcga tagattgtcg cacctgattg cccgacatta tcgcgagccc 9660
atttataccc atataaatca gcatccatgt tggaatttaa tcgcggcctc gacgtttccc 9720
gttgaatatg gctcattttt ttttcctcct ttaccaatgc ttaatcagtg aggcacctat 9780
ctcagcgatc tgtctatttc gttcatccat agttgcctga ctccccgtcg tgtagataac 9840
tacgatacgg gagggcttac catctggccc cagcgctgcg atgataccgc gagaaccacg 9900
ctcaccggct ccggatttat cagcaataaa ccagccagcc ggaagggccg agcgcagaag 9960
tggtcctgca actttatccg cctccatcca gtctattaat tgttgccggg aagctagagt 10020
aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc atcgctacag gcatcgtggt 10080
gtcacgctcg tcgtttggta tggcttcatt cagctccggt tcccaacgat caaggcgagt 10140
tacatgatcc cccatgttgt gcacgttgtc agaagtaagt tggccgcagt gttatcactc 10200
atggttatgg cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct 10260
gtgactggtg agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc 10320
tcttgcccgg cgtcaatacg ggataatacc gcgccacata gcagaacttt aaaagtgctc 10380
atcattggaa aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc 10440
agttcgatgt aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc 10500
gtttctgggt gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca 10560
cggaaatgtt gaatactcat attcttcctt tttcaatatt attgaagcat ttatcagggt 10620
tattgtctca tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtc 10680
agtgttacaa ccaattaacc aattctgaac attatcgcga gcccatttat acctgaatat 10740
ggctcataac accccttgtt tgcctggcgg cagtagcgcg gtggtcccac ctgaccccat 10800
gccgaactca gaagtgaaac gccgtagcgc cgatggtagt gtggggactc cccatgcgag 10860
agtagggaac tgccaggcat caaataaaac gaaaggctca gtcgaaagac tgggcctttc 10920
gcccgggcta attgaggggt gtcgccctta ttcgactcgg ggctcgag 10968
<210> 20
<211> 10968
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 20
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct ttaattaaac gcgtggggga ggctgctggt gaatattaac caaggtcacc 180
ccagttatcg gaggagcaaa caggggctaa gtccaccggg ggaggctgct ggtgaatatt 240
aaccaaggtc accccagtta tcggaggagc aaacaggggc taagtccacc gggggaggct 300
gctggtgaat attaaccaag gtcaccccag ttatcggagg agcaaacagg ggctaagtcc 360
acactagtaa atgacctatt aagaatattt catagaacga atgttccgat gctctaatct 420
ctctagacaa ggttcatatt tgtatgggtt acttattctc tctttgttga ctaagtcaat 480
aatcagaatc agcaggtttg cagtcagatt ggcagggata agcagcctag ctcaggagaa 540
gtgagtataa aagccccagg ctgggagcag ccatcacaga agtccactca ttcttggcag 600
gccgcggcta aggtaagttg gcgccgttta agggatggtt ggttggtggg gtattaatgt 660
ttaattacct tttttacagg cctgggcgcg ccgccaccat gccaccacct aggacaggca 720
ggggcctgct ttggcttgga ctggtgctga gctctgtctg tgttgccctg ggctccgaga 780
cccaagccaa ctctacaacc gatgctctca atgttctgct catcatagtg gatgacctgc 840
ggccctctct aggctgctat ggagacaagt tggtgcggag ccccaacata gaccagctag 900
cctctcactc cctgctgttc cagaatgcct tcgcccagca agctgtgtgc gccccctcta 960
gagtgtcttt cctgaccggg agaaggcctg atacaacaag gctgtatgac tttaacagct 1020
actggagggt gcacgcaggc aacttctcca ctatccccca atacttcaag gagaatggct 1080
atgtgaccat gagcgtgggc aaggtcttcc accctggaat ctcctccaac cacactgatg 1140
atagtcccta ctcttggtct tttcctccct atcaccctag cagtgagaag tatgagaaca 1200
ccaaaacctg cagaggccct gatggggagc tgcatgctaa cctcctgtgt cctgtagatg 1260
tgctggacgt cccagagggc accttgccag ataagcagtc tactgagcag gctatccagc 1320
tgcttgagaa aatgaagact tctgcatctc ccttctttct ggctgttggc taccacaagc 1380
ctcacatccc cttcaggtac cctaaggagt tccaaaagct ctatcctctg gaaaacatca 1440
cacttgcccc cgatcctgag gtccctgacg gcctcccacc agtagcctac aatccttgga 1500
tggacattag gcagagagag gatgtccagg ctctgaatat ttctgtgccc tatgggccca 1560
tcccggtgga cttccagcgc aaaatcagac agtcctactt tgcctctgtg agctatctgg 1620
acacccaggt tgggaggctc ctctccgccc ttgacgacct ccagttggcc aacagcacca 1680
ttatagcctt cacctctgac cacggctggg cactggggga acacggggag tgggctaagt 1740
actctaactt tgatgtggcc acccacgtgc ccctcatctt ttatgtgcct ggcaggactg 1800
ccagcctgcc cgaagctggg gaaaaactgt ttccatacct ggaccctttt gacagtgctt 1860
ctcagctcat ggaacctggc cgtcagagca tggatctggt ggagctagtg tccctcttcc 1920
caaccttggc tggccttgct ggtctccagg tgcctcctag atgcccagtc ccctccttcc 1980
atgttgaact ctgccgtgag gggaagaatc tgctgaagca cttcagattc agagacttgg 2040
aggaggaccc ctaccttcct gggaacccca gggagttgat tgcatactcc cagtatccca 2100
ggccaagtga cattccccag tggaactccg acaaaccaag tctgaaggac atcaagatca 2160
tggggtacag catcaggacc attgactaca gatacacagt gtgggttgga tttaacccag 2220
atgagttctt ggcaaacttt tctgacatcc atgcaagtca gttgtatttt gtggacagcg 2280
accctctgca ggatcacaac atgtacaatg acagccaggg tggggacctc tttcaactcc 2340
tcatgccata gcaattggcc cctctccctc ccccccccct aacgttactg gccgaagccg 2400
cttggaataa ggccggtgtg cgtttgtcta tatgttattt tccaccatat tgccgtcttt 2460
tggcaatgtg agggcccgga aacctggccc tgtcttcttg acgagcattc ctaggggtct 2520
ttcccctctc gccaaaggaa tgcaaggtct gttgaatgtc gtgaaggaag cagttcctct 2580
ggaagcttct tgaagacaaa caacgtctgt agcgaccctt tgcaggcagc ggaacccccc 2640
acctggcgac aggtgcctct gcggccaaaa gccacgtgta taagatacac ctgcaaaggc 2700
ggcacaaccc cagtgccacg ttgtgagttg gatagttgtg gaaagagtca aatggctcac 2760
ctcaagcgta ttcaacaagg ggctgaagga tgcccagaag gtaccccatt gtatgggatc 2820
tgatctgggg cctcggtgca catgctttac atgtgtttag tcgaggttaa aaaacgtcta 2880
ggccccccga accacgggga cgtggttttc ctttgaaaaa cacgatgata atcatatggc 2940
caccatggct gctcctgccc tggggctggt gtgtggaaga tgtcctgaac tgggcctggt 3000
tctgttactg cttctgctca gcctgctctg tggtgctgcc ggcagccaag aggcaggcac 3060
tggcgctgga gctggaagcc tggctgggtc ttgtggatgt ggcacaccac agaggccagg 3120
ggctcatggc tcctctgctg cagctcatag gtacagcaga gaagccaatg ctccaggccc 3180
agtgcctgga gagagacagc tggctcacag caagatggtg cccatccctg ctggggtgtt 3240
cacaatggga acagatgatc cccagatcaa gcaggatggg gaggcgcctg ccaggagggt 3300
gaccattgat gcattctata tggatgccta tgaggtgagc aatacagaat ttgagaagtt 3360
tgtgaactct actggctacc tgactgaggc tgaaaaattt ggagactctt ttgtgtttga 3420
aggaatgctt agtgaacagg ttaagaccaa catccagcag gctgttgcag cagccccctg 3480
gtggttgcct gtcaagggag ctaactggag gcaccctgag ggaccagatt ctacaatcct 3540
gcatagacct gatcatcctg ttctgcatgt gtcttggaat gatgctgtgg cttactgtac 3600
ctgggcagga aaaaggctgc caacagaagc tgagtgggaa tactcttgca gaggaggcct 3660
gcacaataga ctgttcccat ggggcaacaa gctgcaaccc aagggccagc actatgctaa 3720
catctggcag ggagaattcc ctgtgacaaa cacaggagag gacggcttcc agggaactgc 3780
ccctgtagat gctttccctc ctaatggcta tggcctgtat aacattgttg gcaacgcctg 3840
ggagtggact tctgattggt ggacagtgca ccactctgtt gaggagacac tgaatcctaa 3900
ggggccacct tctggaaagg atagagtgaa gaagggggga agctacatgt gccacaggtc 3960
ttattgttac agatacaggt gcgctgctag gtctcagaac acccctgata gcagtgctag 4020
caatctgggc ttcaggtgtg ccgctgacag actgcctacc atggattaag tcgaccctag 4080
agctcgctga tcagcctcga ctgtgccttc tagttgccag ccatctgttg tttgcccctc 4140
ccccgtgcct tccttgaccc tggaaggtgc cactcccact gtcctttcct aataaaatga 4200
ggaaattgca tcgcattgtc tgagtaggtg tcattctatt ctggggggtg gggtggggca 4260
ggacagcaag ggggaggatt gggaagacaa tagcaggcat gctggggaat ctagagttta 4320
aacatttaaa taggaacccc tagtgatgga gttggccact ccctctctgc gcgctcgctc 4380
gctcactgag gccgggcgac caaaggtcgc ccgacgcccg ggctttgccc gggcggcctc 4440
agtgagcgag cgagcgcgca gagagtatac atcgatgtga gttcgcgggt ggctgggggg 4500
ccctgggctg cgaccgcccc cgaaccgcgt ctacgagcct tgcgggctcc gggtctttgc 4560
agtcgtatgg gggcagggta gctgttcccc gcaaggagag ctcaaggtca gcgctcggac 4620
ctggcggagc cccgcaccca ggctgtggcg ccctgtgcag ctccgccctt gcggcgccat 4680
ctgcccggag cctccttccc ctagtcccca gaaacaggag gtccctactc ccgcccgaga 4740
tcccgacccg gacccctagg tgggggacgc tttctttcct ttcgcgctct gcggggtcac 4800
gtgtcgcaga ggagcccctc ccccacggcc tccggcaccg caggccccgg gatgctagtg 4860
cgcagcgggt gcatccctgt ccggatgctg cgcctgcggt agagcggccg ccatgttgca 4920
accgggaagg aaatgaatgg gcagccgtta ggaaagcctg ccggtgacta accctgcgct 4980
cctgcctcga tgggtggagt cgcgtgtggc ggggaagtca ggtggagcga ggctagctgg 5040
cccgatttct cctccgggtg atgcttttcc tagattattc tctggtaaat caaagaagtg 5100
ggtttatgga ggtcctcttg tgtcccctcc ccgcagaggt gtggtggctg tggcatggtg 5160
ccaagccggg agaagctgag tcatgggtag ttggaaaagg acatttccac cgcaaaatgg 5220
cccctctggt ggtggcccct tcctgcagcg ccggctcacc tcacggcccc gcccttcccc 5280
tgccagccta gcgttgaccc gaccccaaag gccaggctgt aaatgtcacc gggaggattg 5340
ggtgtctggg cgcctcgggg aacctgccct tctccccatt ccgtcttccg gaaaccagat 5400
ctcccaccgc accctggtct gaggttaaat atagctgctg acctttctgt agctgggggc 5460
ctgggctggg gctctctccc atcccttctc cccacacaca tgcacttacc tgtgctccca 5520
ctcctgattt ctggaaaaga gctaggaagg acaggcaact tggcaaatca aagccctggg 5580
actagggggt taaaatacag cttcccctct tcccacccgc cccagtctct gtcccttttg 5640
taggagggac ttagagaagg ggtgggcttg ccctgtccag ttaatttctg acctttactc 5700
ctgccctttg agtttgatga tgctgagtgt acaagcgttt tctccctaaa gggtgcagct 5760
gagctaggca gcagcaagca ttcctggggt ggcatagtgg ggtggtgaat accatgtaca 5820
aagcttgtgc ccagactgtg ggtggcagtg ccccacatgg ccgcttctcc tggaagggct 5880
tcgtatgact gggggtgttg ggcagccctg gagccttcag ttgcagccat gccttaagcc 5940
aggccagcct ggcagggaag ctcaagggag ataaaattca acctcttggg ccctcctggg 6000
ggtaaggaga tgctgcattc gccctcttaa tggggaggtg gcctagggct gctcacatat 6060
tctggaggag cctcccctcc tcatgccttc ttgcctcttg tctcttaggc atgcaaaaga 6120
gtcgaataag ggcgacacaa aatttattct aaatgcataa taaatactga taacatctta 6180
tagtttgtat tatattttgt attatcgttg acatgtataa ttttgatatc aaaaactgat 6240
tttcccttta ttattttcga gatttatttt cttaattctc tttaacaaac tagaaatatt 6300
gtatatacaa aaaatcataa ataatagatg aatagtttaa ttataggtgt tcatcaatcg 6360
aaaaagcaac gtatcttatt taaagtgcgt tgcttttttc tcatttataa ggttaaataa 6420
ttctcatata tcaagcaaag tgacaggcgc ccttaaatat tctgacaaat gctctttccc 6480
taaactcccc ccataaaaaa acccgccgaa gcgggttttt acgttatttg cggattaacg 6540
attactcgtt atcagaaccg cccagggggc ccgagcttaa gactggccgt cgttttacaa 6600
cacagaaaga gtttgtagaa acgcaaaaag gccatccgtc aggggccttc tgcttagttt 6660
gatgcctggc agttccctac tctcgccttc cgcttcctcg ctcactgact cgctgcgctc 6720
ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac 6780
agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa 6840
ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg acgagcatca 6900
caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc 6960
gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata 7020
cctgtccgcc tttctccctt cgggaagcgt ggcgctttct catagctcac gctgtaggta 7080
tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca 7140
gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga 7200
cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg 7260
tgctacagag ttcttgaagt ggtgggctaa ctacggctac actagaagaa cagtatttgg 7320
tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg 7380
caaacaaacc accgctggta gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag 7440
aaaaaaagga tctcaagaag atcctttgat cttttctacg gggtctgacg ctcagtggaa 7500
cgacgcgcgc gtaactcacg ttaagggatt ttggtcatga gcttgcgccg tcccgtcaag 7560
tcagcgtaat gctctgctta ggtggcggta cttgggtcga tatcaaagtg catcacttct 7620
tcccgtatgc ccaactttgt atagagagcc actgcgggat cgtcaccgta atctgcttgc 7680
acgtagatca cataagcacc aagcgcgttg gcctcatgct tgaggagatt gatgagcgcg 7740
gtggcaatgc cctgcctccg gtgctcgccg gagactgcga gatcatagat atagatctca 7800
ctacgcggct gctcaaactt gggcagaacg taagccgcga gagcgccaac aaccgcttct 7860
tggtcgaagg cagcaagcgc gatgaatgtc ttactacgga gcaagttccc gaggtaatcg 7920
gagtccggct gatgttggga gtaggtggct acgtcaccga actcacgacc gaaaagatca 7980
agagcagccc gcatggattt gacttggtca gggccgagcc tacatgtgcg aatgatgccc 8040
atacttgagc cacctaactt tgttttaggg cgactgccct gctgcgtaac atcgttgctg 8100
ctccataaca tcaaacatcg acccacggcg taacgcgctt gctgcttgga tgcccgaggc 8160
atagactgta caaaaaaaca gtcataacaa gccatgaaaa ccgccactgc gccgttacca 8220
ccgctgcgtt cggtcaaggt tctggaccag ttgcgtgagc gcattttttt ttcctcctcg 8280
gcgtttacgc cccgccctgc cactcatcgc agtactgttg taattcatta agcattctgc 8340
cgacatggaa gccatcacag acggcatgat gaacctgaat cgccagcggc atcagcacct 8400
tgtcgccttg cgtataatat ttgcccatag tgaaaacggg ggcgaagaag ttgtccatat 8460
tggccacgtt taaatcaaaa ctggtgaaac tcacccaggg attggcgctg acgaaaaaca 8520
tattctcaat aaacccttta gggaaatagg ccaggttttc accgtaacac gccacatctt 8580
gcgaatatat gtgtagaaac tgccggaaat cgtcgtgtgc actcatggaa aacggtgtaa 8640
caagggtgaa cactatccca tatcaccagc tcaccgtctt tcattgccat acggaactcc 8700
ggatgagcat tcatcaggcg ggcaagaatg tgaataaagg ccggataaaa cttgtgctta 8760
tttttcttta cggtctttaa aaaggccgta atatccagct gaacggtctg gttataggta 8820
cattgagcaa ctgactgaaa tgcctcaaaa tgttctttac gatgccattg ggatatatca 8880
acggtggtat atccagtgat ttttttctcc attttttttt cctcctttag aaaaactcat 8940
cgagcatcaa atgaaactgc aatttattca tatcaggatt atcaatacca tatttttgaa 9000
aaagccgttt ctgtaatgaa ggagaaaact caccgaggca gttccatagg atggcaagat 9060
cctggtatcg gtctgcgatt ccgactcgtc caacatcaat acaacctatt aatttcccct 9120
cgtcaaaaat aaggttatca agtgagaaat caccatgagt gacgactgaa tccggtgaga 9180
atggcaaaag tttatgcatt tctttccaga cttgttcaac aggccagcca ttacgctcgt 9240
catcaaaatc actcgcatca accaaaccgt tattcattcg tgattgcgcc tgagcgaggc 9300
gaaatacgcg atcgctgtta aaaggacaat tacaaacagg aatcgagtgc aaccggcgca 9360
ggaacactgc cagcgcatca acaatatttt cacctgaatc aggatattct tctaatacct 9420
ggaacgctgt ttttccgggg atcgcagtgg tgagtaacca tgcatcatca ggagtacgga 9480
taaaatgctt gatggtcgga agtggcataa attccgtcag ccagtttagt ctgaccatct 9540
catctgtaac atcattggca acgctacctt tgccatgttt cagaaacaac tctggcgcat 9600
cgggcttccc atacaagcga tagattgtcg cacctgattg cccgacatta tcgcgagccc 9660
atttataccc atataaatca gcatccatgt tggaatttaa tcgcggcctc gacgtttccc 9720
gttgaatatg gctcattttt ttttcctcct ttaccaatgc ttaatcagtg aggcacctat 9780
ctcagcgatc tgtctatttc gttcatccat agttgcctga ctccccgtcg tgtagataac 9840
tacgatacgg gagggcttac catctggccc cagcgctgcg atgataccgc gagaaccacg 9900
ctcaccggct ccggatttat cagcaataaa ccagccagcc ggaagggccg agcgcagaag 9960
tggtcctgca actttatccg cctccatcca gtctattaat tgttgccggg aagctagagt 10020
aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc atcgctacag gcatcgtggt 10080
gtcacgctcg tcgtttggta tggcttcatt cagctccggt tcccaacgat caaggcgagt 10140
tacatgatcc cccatgttgt gcacgttgtc agaagtaagt tggccgcagt gttatcactc 10200
atggttatgg cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct 10260
gtgactggtg agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc 10320
tcttgcccgg cgtcaatacg ggataatacc gcgccacata gcagaacttt aaaagtgctc 10380
atcattggaa aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc 10440
agttcgatgt aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc 10500
gtttctgggt gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca 10560
cggaaatgtt gaatactcat attcttcctt tttcaatatt attgaagcat ttatcagggt 10620
tattgtctca tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtc 10680
agtgttacaa ccaattaacc aattctgaac attatcgcga gcccatttat acctgaatat 10740
ggctcataac accccttgtt tgcctggcgg cagtagcgcg gtggtcccac ctgaccccat 10800
gccgaactca gaagtgaaac gccgtagcgc cgatggtagt gtggggactc cccatgcgag 10860
agtagggaac tgccaggcat caaataaaac gaaaggctca gtcgaaagac tgggcctttc 10920
gcccgggcta attgaggggt gtcgccctta ttcgactcgg ggctcgag 10968
<210> 21
<211> 10968
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 21
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct ttaattaaac gcgtggggga ggctgctggt gaatattaac caaggtcacc 180
ccagttatcg gaggagcaaa caggggctaa gtccaccggg ggaggctgct ggtgaatatt 240
aaccaaggtc accccagtta tcggaggagc aaacaggggc taagtccacc gggggaggct 300
gctggtgaat attaaccaag gtcaccccag ttatcggagg agcaaacagg ggctaagtcc 360
acactagtaa atgacctatt aagaatattt catagaacga atgttccgat gctctaatct 420
ctctagacaa ggttcatatt tgtatgggtt acttattctc tctttgttga ctaagtcaat 480
aatcagaatc agcaggtttg cagtcagatt ggcagggata agcagcctag ctcaggagaa 540
gtgagtataa aagccccagg ctgggagcag ccatcacaga agtccactca ttcttggcag 600
gccgcggcta aggtaagttg gcgccgttta agggatggtt ggttggtggg gtattaatgt 660
ttaattacct tttttacagg cctgggcgcg ccgccaccat gccacccccc cggaccggga 720
gaggcctctt gtggttgggc ctggtgctga gcagcgtgtg cgtggccctg ggcagtgaga 780
cccaggctaa ctctacaaca gatgccttga atgtgctgct gatcattgtg gatgacctga 840
ggccaagtct gggctgctat ggggacaaat tggtgaggtc ccccaacatc gaccagttgg 900
cctcccactc tctcctattc caaaatgctt tcgcccagca ggcagtttgt gccccctcta 960
gggtgagctt cctcactggc aggcgccctg acaccactag actgtatgac tttaacagct 1020
attggagggt gcacgcagga aacttctcca caatccctca atacttcaag gagaatggtt 1080
atgtgacaat gtctgtgggc aaggtgttcc accctggcat cagcagcaac cacaccgatg 1140
actcacccta tagttggtct tttcccccct accatccttc atctgagaaa tatgaaaaca 1200
caaaaacctg ccgaggccca gacggggaac tgcatgccaa cctactctgt cctgttgatg 1260
tactggacgt gcccgagggc accctccctg ataagcagtc cacagaacag gccattcagc 1320
tgcttgaaaa gatgaagacc tccgcatccc ccttcttctt ggctgtcggc taccacaagc 1380
cccatatccc ctttagatac cccaaggaat tccagaaact gtacccactg gagaacatca 1440
cacttgctcc tgaccctgaa gtgcctgacg gactgcctcc agtggcctat aacccttgga 1500
tggacatccg gcagcgcgag gatgtgcagg ctctgaacat tagtgtgcct tatgggccca 1560
tccctgtgga ctttcagagg aagattcgcc agtcctactt tgcctctgta tcctacctgg 1620
acacacaggt gggacgcctg ctgtctgccc ttgatgatct gcaactggcc aacagcacca 1680
ttatagcttt cacatcagac catgggtggg ctcttgggga gcatggtgaa tgggctaagt 1740
actccaactt cgatgtggca acccatgtcc ctctgatctt ctatgtgcca ggaaggaccg 1800
cctctctgcc agaggcaggt gagaagctgt tcccctatct ggaccctttt gactccgcca 1860
gccagctgat ggagcctggc cgacagtcta tggacctggt tgagctggtc agcctgtttc 1920
ccacactcgc tggactggct ggcctgcaag tacccccacg ctgcccagtg ccctccttcc 1980
atgtggagct ttgcagggag gggaagaacc tcctcaagca cttcaggttc agggacctag 2040
aggaggatcc ttatctgcct ggaaacccca gagagcttat tgcttactcc cagtatccaa 2100
ggcctagtga cattccccaa tggaactcag acaaaccaag cctgaaagac atcaagatca 2160
tgggatactc tatcaggacc attgactaca ggtacactgt gtgggttggc ttcaacccgg 2220
atgagttcct ggctaatttc tctgacatac atgctggcga gctgtacttc gtggacagtg 2280
accccctgca ggatcacaac atgtacaatg attcccaggg gggtgacctc ttccagcttc 2340
tgatgcccta acaattggcc cctctccctc ccccccccct aacgttactg gccgaagccg 2400
cttggaataa ggccggtgtg cgtttgtcta tatgttattt tccaccatat tgccgtcttt 2460
tggcaatgtg agggcccgga aacctggccc tgtcttcttg acgagcattc ctaggggtct 2520
ttcccctctc gccaaaggaa tgcaaggtct gttgaatgtc gtgaaggaag cagttcctct 2580
ggaagcttct tgaagacaaa caacgtctgt agcgaccctt tgcaggcagc ggaacccccc 2640
acctggcgac aggtgcctct gcggccaaaa gccacgtgta taagatacac ctgcaaaggc 2700
ggcacaaccc cagtgccacg ttgtgagttg gatagttgtg gaaagagtca aatggctcac 2760
ctcaagcgta ttcaacaagg ggctgaagga tgcccagaag gtaccccatt gtatgggatc 2820
tgatctgggg cctcggtgca catgctttac atgtgtttag tcgaggttaa aaaacgtcta 2880
ggccccccga accacgggga cgtggttttc ctttgaaaaa cacgatgata ataccggtgc 2940
caccatggct gcccctgctc tgggattggt ttgtggcaga tgtcctgagc ttggtctggt 3000
gctgttgctc cttctgttgt ctctgctgtg tggagcagct gggtctcagg aagctggcac 3060
aggcgctggg gctggctctc tggccgggtc atgtggctgt ggaactcccc agcggcctgg 3120
agcccatggc agctctgccg cagcacacag gtattctagg gaagccaatg ccccaggccc 3180
tgtgcctggg gagagacagc tagctcattc taagatggtg cctatcccag ccggggtttt 3240
tacaatgggc actgatgatc ctcagattaa gcaggatgga gaggcccccg ccagaagagt 3300
gaccattgat gctttctaca tggatgcata tgaagtgtcc aacacagagt ttgagaaatt 3360
tgtgaactct actggatact tgaccgaggc tgagaagttt ggagattcct ttgtctttga 3420
aggcatgctg tctgagcagg tcaagaccaa cattcagcaa gcagtggccg ctgcaccttg 3480
gtggcttcct gtgaagggcg ccaactggag acatccagag gggccagata gtaccatcct 3540
ccacagacct gatcacccag tccttcatgt ttcctggaat gatgcagttg cttactgcac 3600
ttgggccggc aagaggctcc ctactgaggc agagtgggaa tactcctgca gaggaggcct 3660
gcacaacaga ctgttccctt gggggaacaa gcttcagccc aaaggccagc actatgctaa 3720
catctggcag ggtgagtttc cagtcaccaa tacaggggag gacggattcc agggaaccgc 3780
accagtagat gccttccctc ctaatggcta tggcctgtat aatattgtgg gcaatgcatg 3840
ggagtggacc tctgactggt ggactgtgca ccactcagtg gaggaaaccc tgaaccctaa 3900
gggaccccct tcaggcaaag atagagtcaa aaagggaggg agctatatgt gtcacagatc 3960
ctattgctac agatatagat gtgcagccag gtcccagaac acccctgact cttctgctag 4020
caacctgggc tttcggtgtg ctgctgatag actgcccacc atggactaag tcgaccctag 4080
agctcgctga tcagcctcga ctgtgccttc tagttgccag ccatctgttg tttgcccctc 4140
ccccgtgcct tccttgaccc tggaaggtgc cactcccact gtcctttcct aataaaatga 4200
ggaaattgca tcgcattgtc tgagtaggtg tcattctatt ctggggggtg gggtggggca 4260
ggacagcaag ggggaggatt gggaagacaa tagcaggcat gctggggaat ctagagttta 4320
aacatttaaa taggaacccc tagtgatgga gttggccact ccctctctgc gcgctcgctc 4380
gctcactgag gccgggcgac caaaggtcgc ccgacgcccg ggctttgccc gggcggcctc 4440
agtgagcgag cgagcgcgca gagagtatac atcgatgtga gttcgcgggt ggctgggggg 4500
ccctgggctg cgaccgcccc cgaaccgcgt ctacgagcct tgcgggctcc gggtctttgc 4560
agtcgtatgg gggcagggta gctgttcccc gcaaggagag ctcaaggtca gcgctcggac 4620
ctggcggagc cccgcaccca ggctgtggcg ccctgtgcag ctccgccctt gcggcgccat 4680
ctgcccggag cctccttccc ctagtcccca gaaacaggag gtccctactc ccgcccgaga 4740
tcccgacccg gacccctagg tgggggacgc tttctttcct ttcgcgctct gcggggtcac 4800
gtgtcgcaga ggagcccctc ccccacggcc tccggcaccg caggccccgg gatgctagtg 4860
cgcagcgggt gcatccctgt ccggatgctg cgcctgcggt agagcggccg ccatgttgca 4920
accgggaagg aaatgaatgg gcagccgtta ggaaagcctg ccggtgacta accctgcgct 4980
cctgcctcga tgggtggagt cgcgtgtggc ggggaagtca ggtggagcga ggctagctgg 5040
cccgatttct cctccgggtg atgcttttcc tagattattc tctggtaaat caaagaagtg 5100
ggtttatgga ggtcctcttg tgtcccctcc ccgcagaggt gtggtggctg tggcatggtg 5160
ccaagccggg agaagctgag tcatgggtag ttggaaaagg acatttccac cgcaaaatgg 5220
cccctctggt ggtggcccct tcctgcagcg ccggctcacc tcacggcccc gcccttcccc 5280
tgccagccta gcgttgaccc gaccccaaag gccaggctgt aaatgtcacc gggaggattg 5340
ggtgtctggg cgcctcgggg aacctgccct tctccccatt ccgtcttccg gaaaccagat 5400
ctcccaccgc accctggtct gaggttaaat atagctgctg acctttctgt agctgggggc 5460
ctgggctggg gctctctccc atcccttctc cccacacaca tgcacttacc tgtgctccca 5520
ctcctgattt ctggaaaaga gctaggaagg acaggcaact tggcaaatca aagccctggg 5580
actagggggt taaaatacag cttcccctct tcccacccgc cccagtctct gtcccttttg 5640
taggagggac ttagagaagg ggtgggcttg ccctgtccag ttaatttctg acctttactc 5700
ctgccctttg agtttgatga tgctgagtgt acaagcgttt tctccctaaa gggtgcagct 5760
gagctaggca gcagcaagca ttcctggggt ggcatagtgg ggtggtgaat accatgtaca 5820
aagcttgtgc ccagactgtg ggtggcagtg ccccacatgg ccgcttctcc tggaagggct 5880
tcgtatgact gggggtgttg ggcagccctg gagccttcag ttgcagccat gccttaagcc 5940
aggccagcct ggcagggaag ctcaagggag ataaaattca acctcttggg ccctcctggg 6000
ggtaaggaga tgctgcattc gccctcttaa tggggaggtg gcctagggct gctcacatat 6060
tctggaggag cctcccctcc tcatgccttc ttgcctcttg tctcttaggc atgcaaaaga 6120
gtcgaataag ggcgacacaa aatttattct aaatgcataa taaatactga taacatctta 6180
tagtttgtat tatattttgt attatcgttg acatgtataa ttttgatatc aaaaactgat 6240
tttcccttta ttattttcga gatttatttt cttaattctc tttaacaaac tagaaatatt 6300
gtatatacaa aaaatcataa ataatagatg aatagtttaa ttataggtgt tcatcaatcg 6360
aaaaagcaac gtatcttatt taaagtgcgt tgcttttttc tcatttataa ggttaaataa 6420
ttctcatata tcaagcaaag tgacaggcgc ccttaaatat tctgacaaat gctctttccc 6480
taaactcccc ccataaaaaa acccgccgaa gcgggttttt acgttatttg cggattaacg 6540
attactcgtt atcagaaccg cccagggggc ccgagcttaa gactggccgt cgttttacaa 6600
cacagaaaga gtttgtagaa acgcaaaaag gccatccgtc aggggccttc tgcttagttt 6660
gatgcctggc agttccctac tctcgccttc cgcttcctcg ctcactgact cgctgcgctc 6720
ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac 6780
agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa 6840
ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg acgagcatca 6900
caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc 6960
gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata 7020
cctgtccgcc tttctccctt cgggaagcgt ggcgctttct catagctcac gctgtaggta 7080
tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca 7140
gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga 7200
cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg 7260
tgctacagag ttcttgaagt ggtgggctaa ctacggctac actagaagaa cagtatttgg 7320
tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg 7380
caaacaaacc accgctggta gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag 7440
aaaaaaagga tctcaagaag atcctttgat cttttctacg gggtctgacg ctcagtggaa 7500
cgacgcgcgc gtaactcacg ttaagggatt ttggtcatga gcttgcgccg tcccgtcaag 7560
tcagcgtaat gctctgctta ggtggcggta cttgggtcga tatcaaagtg catcacttct 7620
tcccgtatgc ccaactttgt atagagagcc actgcgggat cgtcaccgta atctgcttgc 7680
acgtagatca cataagcacc aagcgcgttg gcctcatgct tgaggagatt gatgagcgcg 7740
gtggcaatgc cctgcctccg gtgctcgccg gagactgcga gatcatagat atagatctca 7800
ctacgcggct gctcaaactt gggcagaacg taagccgcga gagcgccaac aaccgcttct 7860
tggtcgaagg cagcaagcgc gatgaatgtc ttactacgga gcaagttccc gaggtaatcg 7920
gagtccggct gatgttggga gtaggtggct acgtcaccga actcacgacc gaaaagatca 7980
agagcagccc gcatggattt gacttggtca gggccgagcc tacatgtgcg aatgatgccc 8040
atacttgagc cacctaactt tgttttaggg cgactgccct gctgcgtaac atcgttgctg 8100
ctccataaca tcaaacatcg acccacggcg taacgcgctt gctgcttgga tgcccgaggc 8160
atagactgta caaaaaaaca gtcataacaa gccatgaaaa ccgccactgc gccgttacca 8220
ccgctgcgtt cggtcaaggt tctggaccag ttgcgtgagc gcattttttt ttcctcctcg 8280
gcgtttacgc cccgccctgc cactcatcgc agtactgttg taattcatta agcattctgc 8340
cgacatggaa gccatcacag acggcatgat gaacctgaat cgccagcggc atcagcacct 8400
tgtcgccttg cgtataatat ttgcccatag tgaaaacggg ggcgaagaag ttgtccatat 8460
tggccacgtt taaatcaaaa ctggtgaaac tcacccaggg attggcgctg acgaaaaaca 8520
tattctcaat aaacccttta gggaaatagg ccaggttttc accgtaacac gccacatctt 8580
gcgaatatat gtgtagaaac tgccggaaat cgtcgtgtgc actcatggaa aacggtgtaa 8640
caagggtgaa cactatccca tatcaccagc tcaccgtctt tcattgccat acggaactcc 8700
ggatgagcat tcatcaggcg ggcaagaatg tgaataaagg ccggataaaa cttgtgctta 8760
tttttcttta cggtctttaa aaaggccgta atatccagct gaacggtctg gttataggta 8820
cattgagcaa ctgactgaaa tgcctcaaaa tgttctttac gatgccattg ggatatatca 8880
acggtggtat atccagtgat ttttttctcc attttttttt cctcctttag aaaaactcat 8940
cgagcatcaa atgaaactgc aatttattca tatcaggatt atcaatacca tatttttgaa 9000
aaagccgttt ctgtaatgaa ggagaaaact caccgaggca gttccatagg atggcaagat 9060
cctggtatcg gtctgcgatt ccgactcgtc caacatcaat acaacctatt aatttcccct 9120
cgtcaaaaat aaggttatca agtgagaaat caccatgagt gacgactgaa tccggtgaga 9180
atggcaaaag tttatgcatt tctttccaga cttgttcaac aggccagcca ttacgctcgt 9240
catcaaaatc actcgcatca accaaaccgt tattcattcg tgattgcgcc tgagcgaggc 9300
gaaatacgcg atcgctgtta aaaggacaat tacaaacagg aatcgagtgc aaccggcgca 9360
ggaacactgc cagcgcatca acaatatttt cacctgaatc aggatattct tctaatacct 9420
ggaacgctgt ttttccgggg atcgcagtgg tgagtaacca tgcatcatca ggagtacgga 9480
taaaatgctt gatggtcgga agtggcataa attccgtcag ccagtttagt ctgaccatct 9540
catctgtaac atcattggca acgctacctt tgccatgttt cagaaacaac tctggcgcat 9600
cgggcttccc atacaagcga tagattgtcg cacctgattg cccgacatta tcgcgagccc 9660
atttataccc atataaatca gcatccatgt tggaatttaa tcgcggcctc gacgtttccc 9720
gttgaatatg gctcattttt ttttcctcct ttaccaatgc ttaatcagtg aggcacctat 9780
ctcagcgatc tgtctatttc gttcatccat agttgcctga ctccccgtcg tgtagataac 9840
tacgatacgg gagggcttac catctggccc cagcgctgcg atgataccgc gagaaccacg 9900
ctcaccggct ccggatttat cagcaataaa ccagccagcc ggaagggccg agcgcagaag 9960
tggtcctgca actttatccg cctccatcca gtctattaat tgttgccggg aagctagagt 10020
aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc atcgctacag gcatcgtggt 10080
gtcacgctcg tcgtttggta tggcttcatt cagctccggt tcccaacgat caaggcgagt 10140
tacatgatcc cccatgttgt gcacgttgtc agaagtaagt tggccgcagt gttatcactc 10200
atggttatgg cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct 10260
gtgactggtg agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc 10320
tcttgcccgg cgtcaatacg ggataatacc gcgccacata gcagaacttt aaaagtgctc 10380
atcattggaa aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc 10440
agttcgatgt aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc 10500
gtttctgggt gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca 10560
cggaaatgtt gaatactcat attcttcctt tttcaatatt attgaagcat ttatcagggt 10620
tattgtctca tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtc 10680
agtgttacaa ccaattaacc aattctgaac attatcgcga gcccatttat acctgaatat 10740
ggctcataac accccttgtt tgcctggcgg cagtagcgcg gtggtcccac ctgaccccat 10800
gccgaactca gaagtgaaac gccgtagcgc cgatggtagt gtggggactc cccatgcgag 10860
agtagggaac tgccaggcat caaataaaac gaaaggctca gtcgaaagac tgggcctttc 10920
gcccgggcta attgaggggt gtcgccctta ttcgactcgg ggctcgag 10968
<210> 22
<211> 8722
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 22
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct ttaattaaac gcgtggggga ggctgctggt gaatattaac caaggtcacc 180
ccagttatcg gaggagcaaa caggggctaa gtccaccggg ggaggctgct ggtgaatatt 240
aaccaaggtc accccagtta tcggaggagc aaacaggggc taagtccacc gggggaggct 300
gctggtgaat attaaccaag gtcaccccag ttatcggagg agcaaacagg ggctaagtcc 360
acactagtaa atgacctatt aagaatattt catagaacga atgttccgat gctctaatct 420
ctctagacaa ggttcatatt tgtatgggtt acttattctc tctttgttga ctaagtcaat 480
aatcagaatc agcaggtttg cagtcagatt ggcagggata agcagcctag ctcaggagaa 540
gtgagtataa aagccccagg ctgggagcag ccatcacaga agtccactca ttcttggcag 600
gccgcggcta aggtaagttg gcgccgttta agggatggtt ggttggtggg gtattaatgt 660
ttaattacct tttttacagg cctgggcgcg ccgccaccat ggctgcgccc gcactagggc 720
tggtgtgtgg acgttgccct gagctgggtc tcgtcctctt gctgctgctg ctctcgctgc 780
tgtgtggagc ggcagggagc caggaggccg ggaccggtgc gggcgcgggg tcccttgcgg 840
gttcttgcgg ctgcggcacg ccccagcggc ctggcgccca tggcagttcg gcagccgctc 900
accgatactc gcgggaggct aacgctccgg gccccgtacc cggagagcgg caactcgcgc 960
actcaaagat ggtccccatc cctgctggag tatttacaat gggcacagat gatcctcaga 1020
taaagcagga tggggaagca cctgcgagga gagttactat tgatgccttt tacatggatg 1080
cctatgaagt cagtaatact gaatttgaga agtttgtgaa ctcaactggc tatttgacag 1140
aggctgagaa gtttggcgac tcctttgtct ttgaaggcat gttgagtgag caagtgaaga 1200
ccaatattca acaggcagtt gcagctgctc cctggtggtt acctgtgaaa ggcgctaact 1260
ggagacaccc agaagggcct gactctacta ttctgcacag gccggatcat ccagttctcc 1320
atgtgtcctg gaatgatgcg gttgcctact gcacttgggc agggaagcgg ctgcccacgg 1380
aagctgagtg ggaatacagc tgtcgaggag gcctgcataa tagacttttc ccctggggca 1440
acaaactgca gcccaaaggc cagcattatg ccaacatttg gcagggcgag tttccggtga 1500
ccaacactgg tgaggatggc ttccaaggaa ctgcgcctgt tgatgccttc cctcccaatg 1560
gttatggctt atacaacata gtggggaacg catgggaatg gacttcagac tggtggactg 1620
ttcatcattc tgttgaagaa acgcttaacc caaaaggtcc cccttctggg aaagaccgag 1680
tgaagaaagg tggatcctac atgtgccata ggtcttattg ttacaggtat cgctgtgctg 1740
ctcggagcca gaacacacct gatagctctg cttcgaatct gggattccgc tgtgcagccg 1800
accgcctgcc cactatggac tgagtcgacc ctagagctcg ctgatcagcc tcgactgtgc 1860
cttctagttg ccagccatct gttgtttgcc cctcccccgt gccttccttg accctggaag 1920
gtgccactcc cactgtcctt tcctaataaa atgaggaaat tgcatcgcat tgtctgagta 1980
ggtgtcattc tattctgggg ggtggggtgg ggcaggacag caagggggag gattgggaag 2040
acaatagcag gcatgctggg gaatctagag tttaaacatt taaataggaa cccctagtga 2100
tggagttggc cactccctct ctgcgcgctc gctcgctcac tgaggccggg cgaccaaagg 2160
tcgcccgacg cccgggcttt gcccgggcgg cctcagtgag cgagcgagcg cgcagagagt 2220
atacatcgat gtgagttcgc gggtggctgg ggggccctgg gctgcgaccg cccccgaacc 2280
gcgtctacga gccttgcggg ctccgggtct ttgcagtcgt atgggggcag ggtagctgtt 2340
ccccgcaagg agagctcaag gtcagcgctc ggacctggcg gagccccgca cccaggctgt 2400
ggcgccctgt gcagctccgc ccttgcggcg ccatctgccc ggagcctcct tcccctagtc 2460
cccagaaaca ggaggtccct actcccgccc gagatcccga cccggacccc taggtggggg 2520
acgctttctt tcctttcgcg ctctgcgggg tcacgtgtcg cagaggagcc cctcccccac 2580
ggcctccggc accgcaggcc ccgggatgct agtgcgcagc gggtgcatcc ctgtccggat 2640
gctgcgcctg cggtagagcg gccgccatgt tgcaaccggg aaggaaatga atgggcagcc 2700
gttaggaaag cctgccggtg actaaccctg cgctcctgcc tcgatgggtg gagtcgcgtg 2760
tggcggggaa gtcaggtgga gcgaggctag ctggcccgat ttctcctccg ggtgatgctt 2820
ttcctagatt attctctggt aaatcaaaga agtgggttta tggaggtcct cttgtgtccc 2880
ctccccgcag aggtgtggtg gctgtggcat ggtgccaagc cgggagaagc tgagtcatgg 2940
gtagttggaa aaggacattt ccaccgcaaa atggcccctc tggtggtggc cccttcctgc 3000
agcgccggct cacctcacgg ccccgccctt cccctgccag cctagcgttg acccgacccc 3060
aaaggccagg ctgtaaatgt caccgggagg attgggtgtc tgggcgcctc ggggaacctg 3120
cccttctccc cattccgtct tccggaaacc agatctccca ccgcaccctg gtctgaggtt 3180
aaatatagct gctgaccttt ctgtagctgg gggcctgggc tggggctctc tcccatccct 3240
tctccccaca cacatgcact tacctgtgct cccactcctg atttctggaa aagagctagg 3300
aaggacaggc aacttggcaa atcaaagccc tgggactagg gggttaaaat acagcttccc 3360
ctcttcccac ccgccccagt ctctgtccct tttgtaggag ggacttagag aaggggtggg 3420
cttgccctgt ccagttaatt tctgaccttt actcctgccc tttgagtttg atgatgctga 3480
gtgtacaagc gttttctccc taaagggtgc agctgagcta ggcagcagca agcattcctg 3540
gggtggcata gtggggtggt gaataccatg tacaaagctt gtgcccagac tgtgggtggc 3600
agtgccccac atggccgctt ctcctggaag ggcttcgtat gactgggggt gttgggcagc 3660
cctggagcct tcagttgcag ccatgcctta agccaggcca gcctggcagg gaagctcaag 3720
ggagataaaa ttcaacctct tgggccctcc tgggggtaag gagatgctgc attcgccctc 3780
ttaatgggga ggtggcctag ggctgctcac atattctgga ggagcctccc ctcctcatgc 3840
cttcttgcct cttgtctctt aggcatgcaa aagagtcgaa taagggcgac acaaaattta 3900
ttctaaatgc ataataaata ctgataacat cttatagttt gtattatatt ttgtattatc 3960
gttgacatgt ataattttga tatcaaaaac tgattttccc tttattattt tcgagattta 4020
ttttcttaat tctctttaac aaactagaaa tattgtatat acaaaaaatc ataaataata 4080
gatgaatagt ttaattatag gtgttcatca atcgaaaaag caacgtatct tatttaaagt 4140
gcgttgcttt tttctcattt ataaggttaa ataattctca tatatcaagc aaagtgacag 4200
gcgcccttaa atattctgac aaatgctctt tccctaaact ccccccataa aaaaacccgc 4260
cgaagcgggt ttttacgtta tttgcggatt aacgattact cgttatcaga accgcccagg 4320
gggcccgagc ttaagactgg ccgtcgtttt acaacacaga aagagtttgt agaaacgcaa 4380
aaaggccatc cgtcaggggc cttctgctta gtttgatgcc tggcagttcc ctactctcgc 4440
cttccgcttc ctcgctcact gactcgctgc gctcggtcgt tcggctgcgg cgagcggtat 4500
cagctcactc aaaggcggta atacggttat ccacagaatc aggggataac gcaggaaaga 4560
acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt 4620
ttttccatag gctccgcccc cctgacgagc atcacaaaaa tcgacgctca agtcagaggt 4680
ggcgaaaccc gacaggacta taaagatacc aggcgtttcc ccctggaagc tccctcgtgc 4740
gctctcctgt tccgaccctg ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa 4800
gcgtggcgct ttctcatagc tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct 4860
ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc ttatccggta 4920
actatcgtct tgagtccaac ccggtaagac acgacttatc gccactggca gcagccactg 4980
gtaacaggat tagcagagcg aggtatgtag gcggtgctac agagttcttg aagtggtggg 5040
ctaactacgg ctacactaga agaacagtat ttggtatctg cgctctgctg aagccagtta 5100
ccttcggaaa aagagttggt agctcttgat ccggcaaaca aaccaccgct ggtagcggtg 5160
gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa gaagatcctt 5220
tgatcttttc tacggggtct gacgctcagt ggaacgacgc gcgcgtaact cacgttaagg 5280
gattttggtc atgagcttgc gccgtcccgt caagtcagcg taatgctctg cttaggtggc 5340
ggtacttggg tcgatatcaa agtgcatcac ttcttcccgt atgcccaact ttgtatagag 5400
agccactgcg ggatcgtcac cgtaatctgc ttgcacgtag atcacataag caccaagcgc 5460
gttggcctca tgcttgagga gattgatgag cgcggtggca atgccctgcc tccggtgctc 5520
gccggagact gcgagatcat agatatagat ctcactacgc ggctgctcaa acttgggcag 5580
aacgtaagcc gcgagagcgc caacaaccgc ttcttggtcg aaggcagcaa gcgcgatgaa 5640
tgtcttacta cggagcaagt tcccgaggta atcggagtcc ggctgatgtt gggagtaggt 5700
ggctacgtca ccgaactcac gaccgaaaag atcaagagca gcccgcatgg atttgacttg 5760
gtcagggccg agcctacatg tgcgaatgat gcccatactt gagccaccta actttgtttt 5820
agggcgactg ccctgctgcg taacatcgtt gctgctccat aacatcaaac atcgacccac 5880
ggcgtaacgc gcttgctgct tggatgcccg aggcatagac tgtacaaaaa aacagtcata 5940
acaagccatg aaaaccgcca ctgcgccgtt accaccgctg cgttcggtca aggttctgga 6000
ccagttgcgt gagcgcattt ttttttcctc ctcggcgttt acgccccgcc ctgccactca 6060
tcgcagtact gttgtaattc attaagcatt ctgccgacat ggaagccatc acagacggca 6120
tgatgaacct gaatcgccag cggcatcagc accttgtcgc cttgcgtata atatttgccc 6180
atagtgaaaa cgggggcgaa gaagttgtcc atattggcca cgtttaaatc aaaactggtg 6240
aaactcaccc agggattggc gctgacgaaa aacatattct caataaaccc tttagggaaa 6300
taggccaggt tttcaccgta acacgccaca tcttgcgaat atatgtgtag aaactgccgg 6360
aaatcgtcgt gtgcactcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac 6420
cagctcaccg tctttcattg ccatacggaa ctccggatga gcattcatca ggcgggcaag 6480
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc 6540
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc 6600
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt 6660
ctccattttt ttttcctcct ttagaaaaac tcatcgagca tcaaatgaaa ctgcaattta 6720
ttcatatcag gattatcaat accatatttt tgaaaaagcc gtttctgtaa tgaaggagaa 6780
aactcaccga ggcagttcca taggatggca agatcctggt atcggtctgc gattccgact 6840
cgtccaacat caatacaacc tattaatttc ccctcgtcaa aaataaggtt atcaagtgag 6900
aaatcaccat gagtgacgac tgaatccggt gagaatggca aaagtttatg catttctttc 6960
cagacttgtt caacaggcca gccattacgc tcgtcatcaa aatcactcgc atcaaccaaa 7020
ccgttattca ttcgtgattg cgcctgagcg aggcgaaata cgcgatcgct gttaaaagga 7080
caattacaaa caggaatcga gtgcaaccgg cgcaggaaca ctgccagcgc atcaacaata 7140
ttttcacctg aatcaggata ttcttctaat acctggaacg ctgtttttcc ggggatcgca 7200
gtggtgagta accatgcatc atcaggagta cggataaaat gcttgatggt cggaagtggc 7260
ataaattccg tcagccagtt tagtctgacc atctcatctg taacatcatt ggcaacgcta 7320
cctttgccat gtttcagaaa caactctggc gcatcgggct tcccatacaa gcgatagatt 7380
gtcgcacctg attgcccgac attatcgcga gcccatttat acccatataa atcagcatcc 7440
atgttggaat ttaatcgcgg cctcgacgtt tcccgttgaa tatggctcat ttttttttcc 7500
tcctttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta tttcgttcat 7560
ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc ttaccatctg 7620
gccccagcgc tgcgatgata ccgcgagaac cacgctcacc ggctccggat ttatcagcaa 7680
taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta tccgcctcca 7740
tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt aatagtttgc 7800
gcaacgttgt tgccatcgct acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt 7860
cattcagctc cggttcccaa cgatcaaggc gagttacatg atcccccatg ttgtgcacgt 7920
tgtcagaagt aagttggccg cagtgttatc actcatggtt atggcagcac tgcataattc 7980
tcttactgtc atgccatccg taagatgctt ttctgtgact ggtgagtact caaccaagtc 8040
attctgagaa tagtgtatgc ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa 8100
taccgcgcca catagcagaa ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg 8160
aaaactctca aggatcttac cgctgttgag atccagttcg atgtaaccca ctcgtgcacc 8220
caactgatct tcagcatctt ttactttcac cagcgtttct gggtgagcaa aaacaggaag 8280
gcaaaatgcc gcaaaaaagg gaataagggc gacacggaaa tgttgaatac tcatattctt 8340
cctttttcaa tattattgaa gcatttatca gggttattgt ctcatgagcg gatacatatt 8400
tgaatgtatt tagaaaaata aacaaatagg ggtcagtgtt acaaccaatt aaccaattct 8460
gaacattatc gcgagcccat ttatacctga atatggctca taacacccct tgtttgcctg 8520
gcggcagtag cgcggtggtc ccacctgacc ccatgccgaa ctcagaagtg aaacgccgta 8580
gcgccgatgg tagtgtgggg actccccatg cgagagtagg gaactgccag gcatcaaata 8640
aaacgaaagg ctcagtcgaa agactgggcc tttcgcccgg gctaattgag gggtgtcgcc 8700
cttattcgac tcggggctcg ag 8722
<210> 23
<211> 10269
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 23
cgcgttgtag ttaatgatta acccgccatg ctacttatct acgtagccat gctctaggaa 60
gatcggaatt cgcccttaag ctagcaggtt aatttttaaa aagcagtcaa aagtccaagt 120
ggcccttggc agcatttact ctctctgttt gctctggtta ataatctcag gagcacaaac 180
attccagatc caggttaatt tttaaaaagc agtcaaaagt ccaagtggcc cttggcagca 240
tttactctct ctgtttgctc tggttaataa tctcaggagc acaaacattc cagatccggc 300
gcgccagggc tggaagctac ctttgacatc atttcctctg cgaatgcatg tataatttct 360
acagaaccta ttagaaagga tcacccagcc tctgcttttg tacaactttc ccttaaaaaa 420
ctgccaattc cactgctgtt tggcccaata gtgagaactt tttcctgctg cctcttggtg 480
cttttgccta tggcccctat tctgcctgct gaagacactc ttgccagcat ggacttaaac 540
ccctccagct ctgacaatcc tctttctctt ttgttttaca tgaagggtct ggcagccaaa 600
gcaatcactc aaagttcaaa ccttatcatt ttttgctttg ttcctcttgg ccttggtttt 660
gtacatcagc tttgaaaata ccatcccagg gttaatgctg gggttaattt ataactaaga 720
gtgctctagt tttgcaatac aggacatgct ataaaaatgg aaagatgttg ctttctgaga 780
gactgcagaa gttggtcgtg aggcactggg caggtaagta tcaaggttac aagacaggtt 840
taaggagacc aatagaaact gggcttgtcg agacagagaa gactcttgcg tttctgatag 900
gcacctattg gtcttactga catccacttt gcctttctct ccacaggtgt ccaggcggcc 960
gcatgccccc gccccgcacc ggccgcggcc tgctgtggct gggcctggtg ctgagcagcg 1020
tgtgcgtggc cctgggcagc gagacccagg ccaacagcac caccgacgcc ctgaacgtgc 1080
tgctgatcat cgtggacgac ctgcgcccca gcctgggctg ctacggcgac aagctggtgc 1140
gcagccccaa catcgaccag ctggccagcc acagcctgct gttccagaac gccttcgccc 1200
agcaggccgt gtgcgccccc agccgcgtga gcttcctgac cggccgccgc cccgacacca 1260
cccgcctgta cgacttcaac agctactggc gcgtgcacgc cggcaacttc agcaccatcc 1320
cccagtactt caaggagaac ggctacgtga ccatgagcgt gggcaaggtg ttccaccccg 1380
gcatcagcag caaccacacc gacgacagcc cctacagctg gagcttcccc ccctaccacc 1440
ccagcagcga gaagtacgag aacaccaaga cctgccgcgg ccccgacggc gagctgcacg 1500
ccaacctgct gtgccccgtg gacgtgctgg acgtgcccga gggcaccctg cccgacaagc 1560
agagcaccga gcaggccatc cagctgctgg agaagatgaa gaccagcgcc agccccttct 1620
tcctggccgt gggctaccac aagccccaca tccccttccg ctaccccaag gagttccaga 1680
agctgtaccc cctggagaac atcaccctgg cccccgaccc cgaggtgccc gacggcctgc 1740
cccccgtggc ctacaacccc tggatggaca tccgccagcg cgaggacgtg caggccctga 1800
acatcagcgt gccctacggc cccatccccg tggacttcca gcgcaagatc cgccagagct 1860
acttcgccag cgtgagctac ctggacaccc aggtgggccg cctgctgagc gccctggacg 1920
acctgcagct ggccaacagc accatcatcg ccttcaccag cgaccacggc tgggccctgg 1980
gcgagcacgg cgagtgggcc aagtacagca acttcgacgt ggccacccac gtgcccctga 2040
tcttctacgt gcccggccgc accgccagcc tgcccgaggc cggcgagaag ctgttcccct 2100
acctggaccc cttcgacagc gccagccagc tgatggagcc cggccgccag agcatggacc 2160
tggtggagct ggtgagcctg ttccccaccc tggccggcct ggccggcctg caggtgcccc 2220
cccgctgccc cgtgcccagc ttccacgtgg agctgtgccg cgagggcaag aacctgctga 2280
agcacttccg cttccgcgac ctggaggagg acccctacct gcccggcaac ccccgcgagc 2340
tgatcgccta cagccagtac ccccgcccca gcgacatccc ccagtggaac agcgacaagc 2400
ccagcctgaa ggacatcaag atcatgggct acagcatccg caccatcgac taccgctaca 2460
ccgtgtgggt gggcttcaac cccgacgagt tcctggccaa cttcagcgac atccacgccg 2520
gcgagctgta cttcgtggac agcgaccccc tgcaggacca caacatgtac aacgacagcc 2580
agggcggcga cctgttccag ctgctgatgc cctagaagcc tggatccaat caacctctgg 2640
attacaaaat ttgtgaaaga ttgactggta ttcttaacta tgttgctcct tttacgctat 2700
gtggatacgc tgctttaatg cctttgtatc atgctattgc ttcccgtatg gctttcattt 2760
tctcctcctt gtataaatcc tggttgctgt ctctttatga ggagttgtgg cccgttgtca 2820
ggcaacgtgg cgtggtgtgc actgtgtttg ctgacgcaac ccccactggt tggggcattg 2880
ccaccacctg tcagctcctt tccgggactt tcgctttccc cctccctatt gccacggcgg 2940
aactcatcgc cgcctgcctt gcccgctgct ggacaggggc tcggctgttg ggcactgaca 3000
attccgtggt gttgtcgggg aagctgacgt cctttccatg gctgctcgcc tgtgttgcca 3060
cctggattct gcgcgggacg tccttctgct acgtcccttc ggccctcaat ccagcggacc 3120
ttccttcccg cggcctgctg ccggctctgc ggcctcttcc gcgtcttcga gatctgcctc 3180
gactgtgcct tctagttgcc agccatctgt tgtttgcccc tcccccgtgc cttccttgac 3240
cctggaaggt gccactccca ctgtcctttc ctaataaaat gaggaaattg catcgcattg 3300
tctgagtagg tgtcattcta ttctgggggg tggggtgggg caggacagca agggggagga 3360
ttgggaagac aatagcaggc atgctgggga ctcgagttaa gggcgaattc ccgattagga 3420
tcttcctaga gcatggctac gtagataagt agcatggcgg gttaatcatt aactacagtt 3480
taaacattta aataggaacc cctagtgatg gagttggcca ctccctctct gcgcgctcgc 3540
tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggctttgc ccgggcggcc 3600
tcagtgagcg agcgagcgcg cagagagtat acatcgatgt gagttcgcgg gtggctgggg 3660
ggccctgggc tgcgaccgcc cccgaaccgc gtctacgagc cttgcgggct ccgggtcttt 3720
gcagtcgtat gggggcaggg tagctgttcc ccgcaaggag agctcaaggt cagcgctcgg 3780
acctggcgga gccccgcacc caggctgtgg cgccctgtgc agctccgccc ttgcggcgcc 3840
atctgcccgg agcctccttc ccctagtccc cagaaacagg aggtccctac tcccgcccga 3900
gatcccgacc cggaccccta ggtgggggac gctttctttc ctttcgcgct ctgcggggtc 3960
acgtgtcgca gaggagcccc tcccccacgg cctccggcac cgcaggcccc gggatgctag 4020
tgcgcagcgg gtgcatccct gtccggatgc tgcgcctgcg gtagagcggc cgccatgttg 4080
caaccgggaa ggaaatgaat gggcagccgt taggaaagcc tgccggtgac taaccctgcg 4140
ctcctgcctc gatgggtgga gtcgcgtgtg gcggggaagt caggtggagc gaggctagct 4200
ggcccgattt ctcctccggg tgatgctttt cctagattat tctctggtaa atcaaagaag 4260
tgggtttatg gaggtcctct tgtgtcccct ccccgcagag gtgtggtggc tgtggcatgg 4320
tgccaagccg ggagaagctg agtcatgggt agttggaaaa ggacatttcc accgcaaaat 4380
ggcccctctg gtggtggccc cttcctgcag cgccggctca cctcacggcc ccgcccttcc 4440
cctgccagcc tagcgttgac ccgaccccaa aggccaggct gtaaatgtca ccgggaggat 4500
tgggtgtctg ggcgcctcgg ggaacctgcc cttctcccca ttccgtcttc cggaaaccag 4560
atctcccacc gcaccctggt ctgaggttaa atatagctgc tgacctttct gtagctgggg 4620
gcctgggctg gggctctctc ccatcccttc tccccacaca catgcactta cctgtgctcc 4680
cactcctgat ttctggaaaa gagctaggaa ggacaggcaa cttggcaaat caaagccctg 4740
ggactagggg gttaaaatac agcttcccct cttcccaccc gccccagtct ctgtcccttt 4800
tgtaggaggg acttagagaa ggggtgggct tgccctgtcc agttaatttc tgacctttac 4860
tcctgccctt tgagtttgat gatgctgagt gtacaagcgt tttctcccta aagggtgcag 4920
ctgagctagg cagcagcaag cattcctggg gtggcatagt ggggtggtga ataccatgta 4980
caaagcttgt gcccagactg tgggtggcag tgccccacat ggccgcttct cctggaaggg 5040
cttcgtatga ctgggggtgt tgggcagccc tggagccttc agttgcagcc atgccttaag 5100
ccaggccagc ctggcaggga agctcaaggg agataaaatt caacctcttg ggccctcctg 5160
ggggtaagga gatgctgcat tcgccctctt aatggggagg tggcctaggg ctgctcacat 5220
attctggagg agcctcccct cctcatgcct tcttgcctct tgtctcttag gcatgcaaaa 5280
gagtcgaata agggcgacac aaaatttatt ctaaatgcat aataaatact gataacatct 5340
tatagtttgt attatatttt gtattatcgt tgacatgtat aattttgata tcaaaaactg 5400
attttccctt tattattttc gagatttatt ttcttaattc tctttaacaa actagaaata 5460
ttgtatatac aaaaaatcat aaataataga tgaatagttt aattataggt gttcatcaat 5520
cgaaaaagca acgtatctta tttaaagtgc gttgcttttt tctcatttat aaggttaaat 5580
aattctcata tatcaagcaa agtgacaggc gcccttaaat attctgacaa atgctctttc 5640
cctaaactcc ccccataaaa aaacccgccg aagcgggttt ttacgttatt tgcggattaa 5700
cgattactcg ttatcagaac cgcccagggg gcccgagctt aagactggcc gtcgttttac 5760
aacacagaaa gagtttgtag aaacgcaaaa aggccatccg tcaggggcct tctgcttagt 5820
ttgatgcctg gcagttccct actctcgcct tccgcttcct cgctcactga ctcgctgcgc 5880
tcggtcgttc ggctgcggcg agcggtatca gctcactcaa aggcggtaat acggttatcc 5940
acagaatcag gggataacgc aggaaagaac atgtgagcaa aaggccagca aaaggccagg 6000
aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat 6060
cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag 6120
gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga 6180
tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg 6240
tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt 6300
cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac 6360
gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc 6420
ggtgctacag agttcttgaa gtggtgggct aactacggct acactagaag aacagtattt 6480
ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc 6540
ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc 6600
agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg 6660
aacgacgcgc gcgtaactca cgttaaggga ttttggtcat gagcttgcgc cgtcccgtca 6720
agtcagcgta atgctctgct taggtggcgg tacttgggtc gatatcaaag tgcatcactt 6780
cttcccgtat gcccaacttt gtatagagag ccactgcggg atcgtcaccg taatctgctt 6840
gcacgtagat cacataagca ccaagcgcgt tggcctcatg cttgaggaga ttgatgagcg 6900
cggtggcaat gccctgcctc cggtgctcgc cggagactgc gagatcatag atatagatct 6960
cactacgcgg ctgctcaaac ttgggcagaa cgtaagccgc gagagcgcca acaaccgctt 7020
cttggtcgaa ggcagcaagc gcgatgaatg tcttactacg gagcaagttc ccgaggtaat 7080
cggagtccgg ctgatgttgg gagtaggtgg ctacgtcacc gaactcacga ccgaaaagat 7140
caagagcagc ccgcatggat ttgacttggt cagggccgag cctacatgtg cgaatgatgc 7200
ccatacttga gccacctaac tttgttttag ggcgactgcc ctgctgcgta acatcgttgc 7260
tgctccataa catcaaacat cgacccacgg cgtaacgcgc ttgctgcttg gatgcccgag 7320
gcatagactg tacaaaaaaa cagtcataac aagccatgaa aaccgccact gcgccgttac 7380
caccgctgcg ttcggtcaag gttctggacc agttgcgtga gcgcattttt ttttcctcct 7440
cggcgtttac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct 7500
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac 7560
cttgtcgcct tgcgtataat atttgcccat agtgaaaacg ggggcgaaga agttgtccat 7620
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggcgc tgacgaaaaa 7680
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc 7740
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgt gcactcatgg aaaacggtgt 7800
aacaagggtg aacactatcc catatcacca gctcaccgtc tttcattgcc atacggaact 7860
ccggatgagc attcatcagg cgggcaagaa tgtgaataaa ggccggataa aacttgtgct 7920
tatttttctt tacggtcttt aaaaaggccg taatatccag ctgaacggtc tggttatagg 7980
tacattgagc aactgactga aatgcctcaa aatgttcttt acgatgccat tgggatatat 8040
caacggtggt atatccagtg atttttttct ccattttttt ttcctccttt agaaaaactc 8100
atcgagcatc aaatgaaact gcaatttatt catatcagga ttatcaatac catatttttg 8160
aaaaagccgt ttctgtaatg aaggagaaaa ctcaccgagg cagttccata ggatggcaag 8220
atcctggtat cggtctgcga ttccgactcg tccaacatca atacaaccta ttaatttccc 8280
ctcgtcaaaa ataaggttat caagtgagaa atcaccatga gtgacgactg aatccggtga 8340
gaatggcaaa agtttatgca tttctttcca gacttgttca acaggccagc cattacgctc 8400
gtcatcaaaa tcactcgcat caaccaaacc gttattcatt cgtgattgcg cctgagcgag 8460
gcgaaatacg cgatcgctgt taaaaggaca attacaaaca ggaatcgagt gcaaccggcg 8520
caggaacact gccagcgcat caacaatatt ttcacctgaa tcaggatatt cttctaatac 8580
ctggaacgct gtttttccgg ggatcgcagt ggtgagtaac catgcatcat caggagtacg 8640
gataaaatgc ttgatggtcg gaagtggcat aaattccgtc agccagttta gtctgaccat 8700
ctcatctgta acatcattgg caacgctacc tttgccatgt ttcagaaaca actctggcgc 8760
atcgggcttc ccatacaagc gatagattgt cgcacctgat tgcccgacat tatcgcgagc 8820
ccatttatac ccatataaat cagcatccat gttggaattt aatcgcggcc tcgacgtttc 8880
ccgttgaata tggctcattt ttttttcctc ctttaccaat gcttaatcag tgaggcacct 8940
atctcagcga tctgtctatt tcgttcatcc atagttgcct gactccccgt cgtgtagata 9000
actacgatac gggagggctt accatctggc cccagcgctg cgatgatacc gcgagaacca 9060
cgctcaccgg ctccggattt atcagcaata aaccagccag ccggaagggc cgagcgcaga 9120
agtggtcctg caactttatc cgcctccatc cagtctatta attgttgccg ggaagctaga 9180
gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg ccatcgctac aggcatcgtg 9240
gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg gttcccaacg atcaaggcga 9300
gttacatgat cccccatgtt gtgcacgttg tcagaagtaa gttggccgca gtgttatcac 9360
tcatggttat ggcagcactg cataattctc ttactgtcat gccatccgta agatgctttt 9420
ctgtgactgg tgagtactca accaagtcat tctgagaata gtgtatgcgg cgaccgagtt 9480
gctcttgccc ggcgtcaata cgggataata ccgcgccaca tagcagaact ttaaaagtgc 9540
tcatcattgg aaaacgttct tcggggcgaa aactctcaag gatcttaccg ctgttgagat 9600
ccagttcgat gtaacccact cgtgcaccca actgatcttc agcatctttt actttcacca 9660
gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga 9720
cacggaaatg ttgaatactc atattcttcc tttttcaata ttattgaagc atttatcagg 9780
gttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg 9840
tcagtgttac aaccaattaa ccaattctga acattatcgc gagcccattt atacctgaat 9900
atggctcata acaccccttg tttgcctggc ggcagtagcg cggtggtccc acctgacccc 9960
atgccgaact cagaagtgaa acgccgtagc gccgatggta gtgtggggac tccccatgcg 10020
agagtaggga actgccaggc atcaaataaa acgaaaggct cagtcgaaag actgggcctt 10080
tcgcccgggc taattgaggg gtgtcgccct tattcgactc ggggctcgag ctgcgcgctc 10140
gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt ggtcgcccgg 10200
cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact aggggttcct 10260
ttaattaaa 10269
<210> 24
<211> 9854
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 24
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct ttaattaaac gcgtggggga ggctgctggt gaatattaac caaggtcacc 180
ccagttatcg gaggagcaaa caggggctaa gtccaccggg ggaggctgct ggtgaatatt 240
aaccaaggtc accccagtta tcggaggagc aaacaggggc taagtccacc gggggaggct 300
gctggtgaat attaaccaag gtcaccccag ttatcggagg agcaaacagg ggctaagtcc 360
acactagtaa atgacctatt aagaatattt catagaacga atgttccgat gctctaatct 420
ctctagacaa ggttcatatt tgtatgggtt acttattctc tctttgttga ctaagtcaat 480
aatcagaatc agcaggtttg cagtcagatt ggcagggata agcagcctag ctcaggagaa 540
gtgagtataa aagccccagg ctgggagcag ccatcacaga agtccactca ttcttggcag 600
gccgcggcta aggtaagttg gcgccgttta agggatggtt ggttggtggg gtattaatgt 660
ttaattacct tttttacagg cctgggcgcg ccgccaccat gccaccacct aggacaggca 720
ggggcctgct ttggcttgga ctggtgctga gctctgtctg tgttgccctg ggctccgaga 780
cccaagccaa ctctacaacc gatgctctca atgttctgct catcatagtg gatgacctgc 840
ggccctctct aggctgctat ggagacaagt tggtgcggag ccccaacata gaccagctag 900
cctctcactc cctgctgttc cagaatgcct tcgcccagca agctgtgtgc gccccctcta 960
gagtgtcttt cctgaccggg agaaggcctg atacaacaag gctgtatgac tttaacagct 1020
actggagggt gcacgcaggc aacttctcca ctatccccca atacttcaag gagaatggct 1080
atgtgaccat gagcgtgggc aaggtcttcc accctggaat ctcctccaac cacactgatg 1140
atagtcccta ctcttggtct tttcctccct atcaccctag cagtgagaag tatgagaaca 1200
ccaaaacctg cagaggccct gatggggagc tgcatgctaa cctcctgtgt cctgtagatg 1260
tgctggacgt cccagagggc accttgccag ataagcagtc tactgagcag gctatccagc 1320
tgcttgagaa aatgaagact tctgcatctc ccttctttct ggctgttggc taccacaagc 1380
ctcacatccc cttcaggtac cctaaggagt tccaaaagct ctatcctctg gaaaacatca 1440
cacttgcccc cgatcctgag gtccctgacg gcctcccacc agtagcctac aatccttgga 1500
tggacattag gcagagagag gatgtccagg ctctgaatat ttctgtgccc tatgggccca 1560
tcccggtgga cttccagcgc aaaatcagac agtcctactt tgcctctgtg agctatctgg 1620
acacccaggt tgggaggctc ctctccgccc ttgacgacct ccagttggcc aacagcacca 1680
ttatagcctt cacctctgac cacggctggg cactggggga acacggggag tgggctaagt 1740
actctaactt tgatgtggcc acccacgtgc ccctcatctt ttatgtgcct ggcaggactg 1800
ccagcctgcc cgaagctggg gaaaaactgt ttccatacct ggaccctttt gacagtgctt 1860
ctcagctcat ggaacctggc cgtcagagca tggatctggt ggagctagtg tccctcttcc 1920
caaccttggc tggccttgct ggtctccagg tgcctcctag atgcccagtc ccctccttcc 1980
atgttgaact ctgccgtgag gggaagaatc tgctgaagca cttcagattc agagacttgg 2040
aggaggaccc ctaccttcct gggaacccca gggagttgat tgcatactcc cagtatccca 2100
ggccaagtga cattccccag tggaactccg acaaaccaag tctgaaggac atcaagatca 2160
tggggtacag catcaggacc attgactaca gatacacagt gtgggttgga tttaacccag 2220
atgagttctt ggcaaacttt tctgacatcc atgcaagtca gttgtatttt gtggacagcg 2280
accctctgca ggatcacaac atgtacaatg acagccaggg tggggacctc tttcaactcc 2340
tcatgccata gcaattgaat caacctctgg attacaaaat ttgtgaaaga ttgactggta 2400
ttcttaactt tgttgctcct tttacgcttt gtggatacgc tgctttattg cctttgtatc 2460
ttgctattgc ttcccgtttg gctttcattt tctcctcctt gtataaatcc tggttgctgt 2520
ctctttttga ggagttgtgg cccgttgtca ggcaacgtgg cgtggtgtgc actgtgtttg 2580
ctgacgcaac ccccactggt tggggcattg ccaccacctg tcagctcctt tccgggactt 2640
tcgctttccc cctccctatt gccacggcgg aactcatcgc cgcctgcctt gcccgctgct 2700
ggacaggggc tcggctgttg ggcactgaca attccgtggt gttgtcgggg aaatcatcgt 2760
cctttccttg gctgctcgcc tgtgttgcca cctggattct gcgcgggacg tccttctgct 2820
acgtcccttc ggccctcaat ccagcggacc ttccttcccg cggcctgctg ccggctctgc 2880
ggcctcttcc gcgtcttcgc cttcgccctc agacgagtcg gatctccctt tgggccgcct 2940
ccccgcatcc aattggtcga ccctagagct cgctgatcag cctcgactgt gccttctagt 3000
tgccagccat ctgttgtttg cccctccccc gtgccttcct tgaccctgga aggtgccact 3060
cccactgtcc tttcctaata aaatgaggaa attgcatcgc attgtctgag taggtgtcat 3120
tctattctgg ggggtggggt ggggcaggac agcaaggggg aggattggga agacaatagc 3180
aggcatgctg gggaatctag agtttaaaca tttaaatagg aacccctagt gatggagttg 3240
gccactccct ctctgcgcgc tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga 3300
cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag cgcgcagaga gtatacatcg 3360
atgtgagttc gcgggtggct ggggggccct gggctgcgac cgcccccgaa ccgcgtctac 3420
gagccttgcg ggctccgggt ctttgcagtc gtatgggggc agggtagctg ttccccgcaa 3480
ggagagctca aggtcagcgc tcggacctgg cggagccccg cacccaggct gtggcgccct 3540
gtgcagctcc gcccttgcgg cgccatctgc ccggagcctc cttcccctag tccccagaaa 3600
caggaggtcc ctactcccgc ccgagatccc gacccggacc cctaggtggg ggacgctttc 3660
tttcctttcg cgctctgcgg ggtcacgtgt cgcagaggag cccctccccc acggcctccg 3720
gcaccgcagg ccccgggatg ctagtgcgca gcgggtgcat ccctgtccgg atgctgcgcc 3780
tgcggtagag cggccgccat gttgcaaccg ggaaggaaat gaatgggcag ccgttaggaa 3840
agcctgccgg tgactaaccc tgcgctcctg cctcgatggg tggagtcgcg tgtggcgggg 3900
aagtcaggtg gagcgaggct agctggcccg atttctcctc cgggtgatgc ttttcctaga 3960
ttattctctg gtaaatcaaa gaagtgggtt tatggaggtc ctcttgtgtc ccctccccgc 4020
agaggtgtgg tggctgtggc atggtgccaa gccgggagaa gctgagtcat gggtagttgg 4080
aaaaggacat ttccaccgca aaatggcccc tctggtggtg gccccttcct gcagcgccgg 4140
ctcacctcac ggccccgccc ttcccctgcc agcctagcgt tgacccgacc ccaaaggcca 4200
ggctgtaaat gtcaccggga ggattgggtg tctgggcgcc tcggggaacc tgcccttctc 4260
cccattccgt cttccggaaa ccagatctcc caccgcaccc tggtctgagg ttaaatatag 4320
ctgctgacct ttctgtagct gggggcctgg gctggggctc tctcccatcc cttctcccca 4380
cacacatgca cttacctgtg ctcccactcc tgatttctgg aaaagagcta ggaaggacag 4440
gcaacttggc aaatcaaagc cctgggacta gggggttaaa atacagcttc ccctcttccc 4500
acccgcccca gtctctgtcc cttttgtagg agggacttag agaaggggtg ggcttgccct 4560
gtccagttaa tttctgacct ttactcctgc cctttgagtt tgatgatgct gagtgtacaa 4620
gcgttttctc cctaaagggt gcagctgagc taggcagcag caagcattcc tggggtggca 4680
tagtggggtg gtgaatacca tgtacaaagc ttgtgcccag actgtgggtg gcagtgcccc 4740
acatggccgc ttctcctgga agggcttcgt atgactgggg gtgttgggca gccctggagc 4800
cttcagttgc agccatgcct taagccaggc cagcctggca gggaagctca agggagataa 4860
aattcaacct cttgggccct cctgggggta aggagatgct gcattcgccc tcttaatggg 4920
gaggtggcct agggctgctc acatattctg gaggagcctc ccctcctcat gccttcttgc 4980
ctcttgtctc ttaggcatgc aaaagagtcg aataagggcg acacaaaatt tattctaaat 5040
gcataataaa tactgataac atcttatagt ttgtattata ttttgtatta tcgttgacat 5100
gtataatttt gatatcaaaa actgattttc cctttattat tttcgagatt tattttctta 5160
attctcttta acaaactaga aatattgtat atacaaaaaa tcataaataa tagatgaata 5220
gtttaattat aggtgttcat caatcgaaaa agcaacgtat cttatttaaa gtgcgttgct 5280
tttttctcat ttataaggtt aaataattct catatatcaa gcaaagtgac aggcgccctt 5340
aaatattctg acaaatgctc tttccctaaa ctccccccat aaaaaaaccc gccgaagcgg 5400
gtttttacgt tatttgcgga ttaacgatta ctcgttatca gaaccgccca gggggcccga 5460
gcttaagact ggccgtcgtt ttacaacaca gaaagagttt gtagaaacgc aaaaaggcca 5520
tccgtcaggg gccttctgct tagtttgatg cctggcagtt ccctactctc gccttccgct 5580
tcctcgctca ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac 5640
tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga 5700
gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat 5760
aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac 5820
ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct 5880
gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg 5940
ctttctcata gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg 6000
ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt 6060
cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg 6120
attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg ggctaactac 6180
ggctacacta gaagaacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga 6240
aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt 6300
gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt 6360
tctacggggt ctgacgctca gtggaacgac gcgcgcgtaa ctcacgttaa gggattttgg 6420
tcatgagctt gcgccgtccc gtcaagtcag cgtaatgctc tgcttaggtg gcggtacttg 6480
ggtcgatatc aaagtgcatc acttcttccc gtatgcccaa ctttgtatag agagccactg 6540
cgggatcgtc accgtaatct gcttgcacgt agatcacata agcaccaagc gcgttggcct 6600
catgcttgag gagattgatg agcgcggtgg caatgccctg cctccggtgc tcgccggaga 6660
ctgcgagatc atagatatag atctcactac gcggctgctc aaacttgggc agaacgtaag 6720
ccgcgagagc gccaacaacc gcttcttggt cgaaggcagc aagcgcgatg aatgtcttac 6780
tacggagcaa gttcccgagg taatcggagt ccggctgatg ttgggagtag gtggctacgt 6840
caccgaactc acgaccgaaa agatcaagag cagcccgcat ggatttgact tggtcagggc 6900
cgagcctaca tgtgcgaatg atgcccatac ttgagccacc taactttgtt ttagggcgac 6960
tgccctgctg cgtaacatcg ttgctgctcc ataacatcaa acatcgaccc acggcgtaac 7020
gcgcttgctg cttggatgcc cgaggcatag actgtacaaa aaaacagtca taacaagcca 7080
tgaaaaccgc cactgcgccg ttaccaccgc tgcgttcggt caaggttctg gaccagttgc 7140
gtgagcgcat ttttttttcc tcctcggcgt ttacgccccg ccctgccact catcgcagta 7200
ctgttgtaat tcattaagca ttctgccgac atggaagcca tcacagacgg catgatgaac 7260
ctgaatcgcc agcggcatca gcaccttgtc gccttgcgta taatatttgc ccatagtgaa 7320
aacgggggcg aagaagttgt ccatattggc cacgtttaaa tcaaaactgg tgaaactcac 7380
ccagggattg gcgctgacga aaaacatatt ctcaataaac cctttaggga aataggccag 7440
gttttcaccg taacacgcca catcttgcga atatatgtgt agaaactgcc ggaaatcgtc 7500
gtgtgcactc atggaaaacg gtgtaacaag ggtgaacact atcccatatc accagctcac 7560
cgtctttcat tgccatacgg aactccggat gagcattcat caggcgggca agaatgtgaa 7620
taaaggccgg ataaaacttg tgcttatttt tctttacggt ctttaaaaag gccgtaatat 7680
ccagctgaac ggtctggtta taggtacatt gagcaactga ctgaaatgcc tcaaaatgtt 7740
ctttacgatg ccattgggat atatcaacgg tggtatatcc agtgattttt ttctccattt 7800
ttttttcctc ctttagaaaa actcatcgag catcaaatga aactgcaatt tattcatatc 7860
aggattatca ataccatatt tttgaaaaag ccgtttctgt aatgaaggag aaaactcacc 7920
gaggcagttc cataggatgg caagatcctg gtatcggtct gcgattccga ctcgtccaac 7980
atcaatacaa cctattaatt tcccctcgtc aaaaataagg ttatcaagtg agaaatcacc 8040
atgagtgacg actgaatccg gtgagaatgg caaaagttta tgcatttctt tccagacttg 8100
ttcaacaggc cagccattac gctcgtcatc aaaatcactc gcatcaacca aaccgttatt 8160
cattcgtgat tgcgcctgag cgaggcgaaa tacgcgatcg ctgttaaaag gacaattaca 8220
aacaggaatc gagtgcaacc ggcgcaggaa cactgccagc gcatcaacaa tattttcacc 8280
tgaatcagga tattcttcta atacctggaa cgctgttttt ccggggatcg cagtggtgag 8340
taaccatgca tcatcaggag tacggataaa atgcttgatg gtcggaagtg gcataaattc 8400
cgtcagccag tttagtctga ccatctcatc tgtaacatca ttggcaacgc tacctttgcc 8460
atgtttcaga aacaactctg gcgcatcggg cttcccatac aagcgataga ttgtcgcacc 8520
tgattgcccg acattatcgc gagcccattt atacccatat aaatcagcat ccatgttgga 8580
atttaatcgc ggcctcgacg tttcccgttg aatatggctc attttttttt cctcctttac 8640
caatgcttaa tcagtgaggc acctatctca gcgatctgtc tatttcgttc atccatagtt 8700
gcctgactcc ccgtcgtgta gataactacg atacgggagg gcttaccatc tggccccagc 8760
gctgcgatga taccgcgaga accacgctca ccggctccgg atttatcagc aataaaccag 8820
ccagccggaa gggccgagcg cagaagtggt cctgcaactt tatccgcctc catccagtct 8880
attaattgtt gccgggaagc tagagtaagt agttcgccag ttaatagttt gcgcaacgtt 8940
gttgccatcg ctacaggcat cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc 9000
tccggttccc aacgatcaag gcgagttaca tgatccccca tgttgtgcac gttgtcagaa 9060
gtaagttggc cgcagtgtta tcactcatgg ttatggcagc actgcataat tctcttactg 9120
tcatgccatc cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag tcattctgag 9180
aatagtgtat gcggcgaccg agttgctctt gcccggcgtc aatacgggat aataccgcgc 9240
cacatagcag aactttaaaa gtgctcatca ttggaaaacg ttcttcgggg cgaaaactct 9300
caaggatctt accgctgttg agatccagtt cgatgtaacc cactcgtgca cccaactgat 9360
cttcagcatc ttttactttc accagcgttt ctgggtgagc aaaaacagga aggcaaaatg 9420
ccgcaaaaaa gggaataagg gcgacacgga aatgttgaat actcatattc ttcctttttc 9480
aatattattg aagcatttat cagggttatt gtctcatgag cggatacata tttgaatgta 9540
tttagaaaaa taaacaaata ggggtcagtg ttacaaccaa ttaaccaatt ctgaacatta 9600
tcgcgagccc atttatacct gaatatggct cataacaccc cttgtttgcc tggcggcagt 9660
agcgcggtgg tcccacctga ccccatgccg aactcagaag tgaaacgccg tagcgccgat 9720
ggtagtgtgg ggactcccca tgcgagagta gggaactgcc aggcatcaaa taaaacgaaa 9780
ggctcagtcg aaagactggg cctttcgccc gggctaattg aggggtgtcg cccttattcg 9840
actcggggct cgag 9854
Claims (48)
- AAV8 캡시드 및 코돈-최적화된 인간 이두로네이트-2-설파타제 (I2S) 효소를 인코딩하는 서열을 포함하는 재조합 아데노-연합된 바이러스 (rAAV) 벡터.
- AAV9 캡시드 및 코돈-최적화된 인간 이두로네이트-2 설파타제 (I2S) 효소를 인코딩하는 서열을 포함하는 재조합 아데노-연합된 바이러스 (rAAV) 벡터.
- 청구항 1 또는 2에 있어서, 이때 인간 I2S 효소를 인코딩하는 상기 코돈-최적화된 서열은 서열 식별 번호: 6에 대해 적어도 약 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 동일성을 갖는 서열을 포함하는, 재조합 아데노-연합된 바이러스 (rAAV) 벡터.
- 청구항 3에 있어서, 이때 인간 I2S 효소를 인코딩하는 상기 코돈-최적화된 서열은 서열 식별 번호: 11 또는 12에 대해 동일한 서열을 포함하는, rAAV 벡터.
- 청구항 1에 있어서, 이때 상기 벡터는 간-특이적 프로모터를 더 포함하는, rAAV 벡터.
- 청구항 5에 있어서, 이때 상기 간-특이적 프로모터는 트랜스레틴 프로모터 (TTR)인, rAAV 벡터.
- 청구항 5 또는 6에 있어서, 이때 상기 벡터는 5' 및 3' 역전된 말단 반복부 (ITR), I2S 서열의 상류 인트론, 및 시스-작용 조절 모듈 (CRM)을 더 포함하는, rAAV 벡터.
- 청구항 2에 있어서, 이때 상기 벡터는 산재된 프로모터를 더 포함하는, rAAV 벡터.
- 청구항 8에 있어서, 이때 상기 벡터는 5' 및 3' 역전된 말단 반복부, I2S 서열의 상류 인트론, 및 시스-작용 조절 모듈 (CRM)을 더 포함하는, rAAV 벡터.
- 선술한 청구항들중 임의의 한 항에 있어서, 이때 상기 rAAV 벡터는 설파타제 변형 인자 1 (SUMF1)을 포함하는, rAAV 벡터.
- 청구항 10에 있어서, 이때 상기 SUMF1의 앞에 내부 리보솜 진입 부위 (IRES)가 있는, rAAV 벡터.
- 선술한 청구항들중 임의의 한 항에 있어서, 이때 상기 벡터는 WPRE 서열을 더 포함하는, rAAV 벡터.
- 청구항 7 또는 9에 있어서, 이때 상기 인트론은 마우스의 극미한 바이러스 (MVM) 또는 SV40 인트론인, rAAV 벡터.
- 청구항 7 또는 9에 있어서, 이때 상기 CRM은 간-특이적 CRM인, rAAV 벡터.
- 청구항 7 또는 9에 있어서, 이때 상기 CRM은 신경-특이적 CRM인, rAAV 벡터.
- 청구항 7 또는 9에 있어서, 이때 상기 CRM은 CRM8인, rAAV 벡터.
- 청구항 7 또는 9에 있어서, 이때 상기 벡터는 적어도 세 개의 CRMs를 포함하는, rAAV 벡터.
- AAV8 캡시드를 포함하는 재조합 아데노-연합된 바이러스 (rAAV) 및 다음을 포함하는 rAAV 벡터:
a. 5' 역전된 말단 반복부 (ITR);
b. 시스-작용 조절 모듈 (CRM);
c. 간 특이적 프로모터;
d. 마우스의 극미한 바이러스 (MVM);
e. 인간 이두로네이트-2-설파타제 (I2S) 효소를 인코딩하는 서열;
f. woodchuck 간염 바이러스 전사-후 조절 요소 (WPRE); 그리고
g. 3' ITR. - 청구항 18에 있어서, 이때 인간 I2S 효소를 인코딩하는 서열은 야생형 서열 또는 코돈-최적화된 서열인, rAAV.
- 청구항 19에 있어서, 이때 인간 I2S 효소를 인코딩하는 서열은 서열 식별 번호: 6과 적어도 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% 동일성을 갖는 코돈-최적화된 서열인, rAAV.
- 청구항 18에 있어서, 설파타제 변형 인자 1 (SUMF1) 및 내부 리보솜 진입 부위 (IRES)를 인코딩하는 서열을 더 포함하는 rAAV.
- AAV9 캡시드를 포함하는 재조합 아데노-연합된 바이러스 (rAAV) 및 다음을 포함하는 rAAV 벡터:
a. 5' 역전된 말단 반복부 (ITR);
b. 시스-작용 조절 모듈 (CRM);
c. 산재된 프로모터;
d. 마우스의 극미한 바이러스 (MVM);
e. 인간 이두로네이트-2-설파타제 (I2S) 효소를 인코딩하는 서열;
f. woodchuck 간염 바이러스 전사-후 조절 요소(WPRE); 그리고
g. 3' ITR. - 청구항 22에 있어서, 이때 인간 I2S 효소를 인코딩하는 서열은 야생형 서열 또는 코돈-최적화된 서열인, rAAV.
- 청구항 23에 있어서, 이때 인간 I2S 효소를 인코딩하는 서열은 서열 식별 번호: 6과 적어도 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% 동일성을 갖는 코돈-최적화된 서열인, rAAV.
- 청구항 22에 있어서, 설파타제 변형 인자 1 (SUMF1) 및 내부 리보솜 진입 부위 (IRES)를 인코딩하는 서열을 더 포함하는 rAAV.
- 전술한 청구항들중 임의의 한 항에 있어서, 이때 상기 rAAV 벡터는 ApoB를 포함하지 않는, rAAV.
- Hunter 증후군 (MPS II)을 갖는 대상체를 치료하는 방법에 있어서, 이 방법은 전술한 청구항들중 임의의 한 항의 rAAV를 이를 필요로 하는 대상체에게 투여하는 것을 포함하는, 방법.
- Hunter 증후군 (MPS II)을 갖는 대상체를 치료하는 방법에 있어서, 이 방법은 AAV8 또는 AAV9 캡시드, 및 이두로네이트-2-설파타제 (I2S)를 인코드하는 핵산 서열에 작동가능하도록 연계된 프로모터를 포함하는 재조합 아데노-연합된 바이러스 (rAAV) 벡터를 이를 필요로 하는 대상체에게 투여하는 것을 포함하고, 이때 투여로 해당 대상체에서 I2S 효소적 활성이 증가된, 방법.
- 청구항 28에 있어서, 이때 I2S 활성의 증가는 해당 대상체의 혈청에서 검출되는, 방법.
- 청구항 28-29중 임의의 한 항에 있어서, 이때 I2S 활성의 증가는 해당 대상체의 간에서 검출되는, 방법.
- 청구항 28-30중 임의의 한 항에 있어서, 이때 상기 I2S 활성은 중추 신경계 (CNS)에서 검출되는, 방법.
- 청구항 28-31중 임의의 한 항에 있어서, 이때 I2S 활성의 증가는 해당 대상체의 뇌에서 검출되는, 방법.
- 청구항 28-32중 임의의 한 항에 있어서, 이때 I2S 활성의 증가는 해마, 시상, 뇌량, 피질, 소뇌, 또는 뇌의 선조체에서 검출되는, 방법.
- 청구항 28-33중 임의의 한 항에 있어서, 이때 I2S 활성의 증가는 해당 대상체의 신장에서 검출되는, 방법.
- 청구항 28-34중 임의의 한 항에 있어서, 이때 I2S 활성의 증가는 단일 투여 후, 적어도 30일, 60일, 90일, 120일, 150일, 180일 또는 그 이상 동안 유지되는, 방법.
- 청구항 28-35중 임의의 한 항에 있어서, 이때 I2S 활성 수준은 헤파린 설페이트 분석에 의해 측정되는, 방법.
- 청구항 28-35중 임의의 한 항에 있어서, 이때 I2S 활성 수준은 데르마탄 설페이트 분석에 의해 측정되는, 방법.
- 청구항 28-37중 임의의 한 항에 있어서, 이때 상기 AAV의 투여로 해당 대상체에서 글리코사미노글리칸 (GAG)의 수준이 감소되는, 방법.
- 청구항 38에 있어서, 이때 상기 AAV의 투여로 해당 대상체의 혈청에서 GAG 수준이 감소되는, 방법.
- 청구항 38-39중 임의의 한 항에 있어서, 이때 상기 AAV의 투여로 해당 대상체의 간에서 GAG 수준이 감소되는, 방법.
- 청구항 38-40중 임의의 한 항에 있어서, 이때 상기 AAV의 투여로 해당 대상체의 신장에서 GAG 수준이 감소되는, 방법.
- 청구항 38-41중 임의의 한 항에 있어서, 이때 상기 AAV의 투여로 해당 대상체의 CNS에서 GAG 수준이 감소되는, 방법.
- 청구항 38-41중 임의의 한 항에 있어서, 이때 상기 AAV의 투여로 해당 대상체의 뇌에서 GAG 수준이 감소되는, 방법.
- 청구항 43에 있어서, 이때 상기 AAV의 투여로 해마, 시상, 뇌량, 피질, 소뇌, 또는 뇌의 선조체에서 GAG 수준이 감소되는, 방법.
- 청구항 28-44중 임의의 한 항에 있어서, 이때 상기 AAV는 정맥내로 투여되는, 방법.
- 청구항 30-44중 임의의 한 항에 있어서, 이때 상기 AAV는 경막 내로 투여되는, 방법.
- 청구항 45 또는 46에 있어서, 이때 상기 AAV는 약 5 x 109 vg의 투여분량으로 투여되는, 방법.
- 청구항 30-47중 임의의 한 항에 있어서, 이때 상기 AAV 투여로 면역 반응이 야기되지 않는, 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962945920P | 2019-12-10 | 2019-12-10 | |
US62/945,920 | 2019-12-10 | ||
PCT/US2020/063887 WO2021119053A1 (en) | 2019-12-10 | 2020-12-09 | Adeno associated virus vectors for the treatment of hunter disease |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20220112283A true KR20220112283A (ko) | 2022-08-10 |
Family
ID=73856378
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227022896A KR20220112283A (ko) | 2019-12-10 | 2020-12-09 | Hunter 질환 치료용 아데노-연합된 바이러스 벡터 |
Country Status (13)
Country | Link |
---|---|
US (1) | US11981912B2 (ko) |
EP (1) | EP4072595A1 (ko) |
JP (1) | JP2023505851A (ko) |
KR (1) | KR20220112283A (ko) |
AR (1) | AR120709A1 (ko) |
AU (1) | AU2020401116A1 (ko) |
BR (1) | BR112022011332A2 (ko) |
CA (1) | CA3164189A1 (ko) |
CO (1) | CO2022009604A2 (ko) |
IL (1) | IL293684A (ko) |
MX (1) | MX2022007135A (ko) |
TW (1) | TW202136515A (ko) |
WO (1) | WO2021119053A1 (ko) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2021252515A1 (en) * | 2020-04-06 | 2022-10-27 | Homology Medicines, Inc. | Adeno-associated virus compositions for IDS gene transfer and methods of use thereof |
WO2023187728A1 (en) * | 2022-04-01 | 2023-10-05 | Takeda Pharmaceutical Company Limited | Gene therapy for diseases with cns manifestations |
Family Cites Families (35)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5139941A (en) | 1985-10-31 | 1992-08-18 | University Of Florida Research Foundation, Inc. | AAV transduction vectors |
US5436146A (en) | 1989-09-07 | 1995-07-25 | The Trustees Of Princeton University | Helper-free stocks of recombinant adeno-associated virus vectors |
US6268213B1 (en) | 1992-06-03 | 2001-07-31 | Richard Jude Samulski | Adeno-associated virus vector and cis-acting regulatory and promoter elements capable of expressing at least one gene and method of using same for gene therapy |
US5869305A (en) | 1992-12-04 | 1999-02-09 | The University Of Pittsburgh | Recombinant viral vector system |
US5478745A (en) | 1992-12-04 | 1995-12-26 | University Of Pittsburgh | Recombinant viral vector system |
US6204059B1 (en) | 1994-06-30 | 2001-03-20 | University Of Pittsburgh | AAV capsid vehicles for molecular transfer |
US5741683A (en) | 1995-06-07 | 1998-04-21 | The Research Foundation Of State University Of New York | In vitro packaging of adeno-associated virus DNA |
US6093570A (en) | 1995-06-07 | 2000-07-25 | The University Of North Carolina At Chapel Hill | Helper virus-free AAV production |
ES2224375T3 (es) | 1997-04-14 | 2005-03-01 | Cell Genesys, Inc. | Metodos para aumentar la eficacia del producto de aav recombinante. |
EP1080218A1 (en) | 1998-05-27 | 2001-03-07 | University of Florida | Method of preparing recombinant adeno-associated virus compositions by using an iodixanol gradient |
JP2002538770A (ja) | 1998-11-10 | 2002-11-19 | ユニバーシティ オブ ノース カロライナ アット チャペル ヒル | ウイルスベクターとその製造及び投与の方法 |
AU6814901A (en) | 2000-06-01 | 2001-12-11 | Univ North Carolina | Methods and compounds for controlled release of recombinant parvovirus vectors |
AU2002350039A1 (en) * | 2001-10-29 | 2003-05-12 | Renovis, Inc. | Method for isolating cell-type specific mrnas |
DK1310571T3 (da) | 2001-11-13 | 2006-06-19 | Univ Pennsylvania | Fremgangsmåde til identifikation af ukendte adeno-associerede virussekvenser (AAV-sekvenser) og et kit til fremgangsmåden |
EP1453547B1 (en) | 2001-12-17 | 2016-09-21 | The Trustees Of The University Of Pennsylvania | Adeno-associated virus (aav) serotype 8 sequences, vectors containing same, and uses therefor |
WO2003104413A2 (en) | 2002-06-05 | 2003-12-18 | University Of Florida | Production of pseudotyped recombinant aav virions |
ES2411479T3 (es) | 2003-09-30 | 2013-07-05 | The Trustees Of The University Of Pennsylvania | Clados de virus adeno-asociados (AAV), secuencias, vectores que los contienen, y usos de los mismos |
EP3085389A1 (en) | 2005-04-07 | 2016-10-26 | The Trustees Of The University Of Pennsylvania | Method of increasing the function of an aav vector |
EP2007795B1 (en) | 2006-03-30 | 2016-11-16 | The Board Of Trustees Of The Leland Stanford Junior University | Aav capsid proteins |
US20120322861A1 (en) | 2007-02-23 | 2012-12-20 | Barry John Byrne | Compositions and Methods for Treating Diseases |
ES2635726T3 (es) | 2007-06-06 | 2017-10-04 | Genzyme Corporation | Terapia génica para enfermedades de almacenamiento lisosómico |
AU2010366066B2 (en) | 2010-12-22 | 2016-01-14 | Fondazione Telethon | Therapeutic strategies to treat CNS pathology in mucopolysaccharidoses |
BR112013022697A2 (pt) | 2011-03-07 | 2019-09-24 | Fond Telethon | inibidores de fosforilação de tfeb e usos dos mesmos |
US8609088B2 (en) | 2011-05-10 | 2013-12-17 | Regents Of The University Of Minnesota | Intranasal delivery of therapeutic enzymes to the central nervous system for the treatment of lysosomal storage diseases |
US9249425B2 (en) | 2011-05-16 | 2016-02-02 | The Trustees Of The University Of Pennslyvania | Proviral plasmids and production of recombinant adeno-associated virus |
US20150079051A1 (en) | 2012-04-19 | 2015-03-19 | Fondazione Telethon | Tfeb gene therapy of alpha-1-antitrypsin deficiency |
AU2013332061A1 (en) | 2012-10-17 | 2015-05-07 | Fondazione Telethon | Gene therapy for glycogen storage diseases |
KR20160010526A (ko) | 2013-05-15 | 2016-01-27 | 리젠츠 오브 더 유니버시티 오브 미네소타 | 중추 신경계로의 아데노-연관 바이러스 매개 유전자 전달 |
GB201308917D0 (en) | 2013-05-17 | 2013-07-03 | Renishaw Plc | Delivery |
US20160243260A1 (en) | 2013-10-24 | 2016-08-25 | Uniqure Ip B.V. | Treatment of neurological diseases using adeno-associated virus (AAV) comprising AAV-5 capsid proteins |
WO2016187017A1 (en) | 2015-05-15 | 2016-11-24 | Mcivor R Scott | Adeno-associated for therapeutic delivery to central nervous system |
EP3101125A1 (en) * | 2015-06-05 | 2016-12-07 | Laboratorios Del Dr. Esteve, S.A. | Adenoassociated virus vectors for the treatment of mucopolysaccharidoses |
KR20190008237A (ko) | 2016-04-15 | 2019-01-23 | 더 트러스티스 오브 더 유니버시티 오브 펜실바니아 | Ii형 점액다당류증의 치료를 위한 유전자 요법 |
IL266639B1 (en) * | 2016-11-15 | 2024-02-01 | Univ Minnesota | A method to improve neurological function in MPSI and MPSII and other neurological disorders |
JP7449223B2 (ja) | 2017-09-22 | 2024-03-13 | ザ・トラステイーズ・オブ・ザ・ユニバーシテイ・オブ・ペンシルベニア | ムコ多糖症ii型を治療するための遺伝子療法 |
-
2020
- 2020-12-09 MX MX2022007135A patent/MX2022007135A/es unknown
- 2020-12-09 BR BR112022011332A patent/BR112022011332A2/pt unknown
- 2020-12-09 AU AU2020401116A patent/AU2020401116A1/en active Pending
- 2020-12-09 US US17/116,098 patent/US11981912B2/en active Active
- 2020-12-09 KR KR1020227022896A patent/KR20220112283A/ko active Search and Examination
- 2020-12-09 EP EP20828494.3A patent/EP4072595A1/en active Pending
- 2020-12-09 WO PCT/US2020/063887 patent/WO2021119053A1/en active Application Filing
- 2020-12-09 IL IL293684A patent/IL293684A/en unknown
- 2020-12-09 JP JP2022535258A patent/JP2023505851A/ja active Pending
- 2020-12-09 CA CA3164189A patent/CA3164189A1/en active Pending
- 2020-12-10 AR ARP200103430A patent/AR120709A1/es unknown
- 2020-12-10 TW TW109143730A patent/TW202136515A/zh unknown
-
2022
- 2022-07-08 CO CONC2022/0009604A patent/CO2022009604A2/es unknown
Also Published As
Publication number | Publication date |
---|---|
JP2023505851A (ja) | 2023-02-13 |
TW202136515A (zh) | 2021-10-01 |
AU2020401116A1 (en) | 2022-07-21 |
BR112022011332A2 (pt) | 2022-08-23 |
US11981912B2 (en) | 2024-05-14 |
MX2022007135A (es) | 2022-09-19 |
CO2022009604A2 (es) | 2022-07-19 |
CA3164189A1 (en) | 2021-06-17 |
WO2021119053A1 (en) | 2021-06-17 |
IL293684A (en) | 2022-08-01 |
US20210332383A1 (en) | 2021-10-28 |
EP4072595A1 (en) | 2022-10-19 |
AR120709A1 (es) | 2022-03-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2020260491B2 (en) | Gene therapies for lysosomal disorders | |
AU2020205228B2 (en) | Gene therapies for lysosomal disorders | |
KR102609858B1 (ko) | 점액다당류증의 치료를 위한 아데노-관련 바이러스 벡터 | |
AU2018229561B2 (en) | Recombinant adenoviruses and use thereof | |
US6329508B1 (en) | Transferrin receptor reactive chimeric antibodies | |
KR102446169B1 (ko) | 리소좀 저장 장애의 치료를 위한 아데노연관 바이러스 벡터 | |
US7527966B2 (en) | Gene regulation in transgenic animals using a transposon-based vector | |
CN108495685B (zh) | 针对艰难梭菌感染的基于酵母的免疫疗法 | |
KR20200074988A (ko) | 아데노바이러스 벡터 및 이의 용도 | |
KR20190025910A (ko) | 조류 숙주 세포에 대한 crispr-cas 시스템 | |
CN114026115A (zh) | 用于溶酶体病症的基因疗法 | |
KR20210086645A (ko) | Aav 삼중-플라스미드 시스템 | |
KR20210080375A (ko) | 암 면역요법을 위한 재조합 폭스바이러스 | |
KR20210105382A (ko) | 단백질을 코딩하는 rna | |
KR20160016856A (ko) | 말라리아 백신 | |
KR20220012327A (ko) | 피토칸나비노이드 및 피토칸나비노이드 전구체의 생산을 위한 방법 및 세포 | |
KR20220121844A (ko) | 유전자의 발현을 동시에 조절하기 위한 조성물 및 방법 | |
KR20220112283A (ko) | Hunter 질환 치료용 아데노-연합된 바이러스 벡터 | |
CN115927299A (zh) | 增加双链rna产生的方法和组合物 | |
KR20230066360A (ko) | 신경퇴행성 장애를 위한 유전자 요법 | |
KR20220161297A (ko) | 신규 세포주 | |
KR20210150486A (ko) | 리소좀 장애에 대한 유전자 요법 | |
KR20240021906A (ko) | 발현 벡터, 박테리아 서열-무함유 벡터, 및 이를 제조하고 사용하는 방법 | |
KR20230051529A (ko) | 리소좀 장애에 대한 유전자 요법 | |
KR20230117327A (ko) | 가용성 알칼리성 포스파타제 작제물 및 가용성 알칼리성 포스파타제 작제물을 인코딩하는 폴리뉴클레오티드를 포함하는 발현 벡터 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination |