KR20220164743A - Ids 유전자 전달을 위한 아데노-연관 바이러스 조성물 및 이의 사용 방법 - Google Patents
Ids 유전자 전달을 위한 아데노-연관 바이러스 조성물 및 이의 사용 방법 Download PDFInfo
- Publication number
- KR20220164743A KR20220164743A KR1020227037747A KR20227037747A KR20220164743A KR 20220164743 A KR20220164743 A KR 20220164743A KR 1020227037747 A KR1020227037747 A KR 1020227037747A KR 20227037747 A KR20227037747 A KR 20227037747A KR 20220164743 A KR20220164743 A KR 20220164743A
- Authority
- KR
- South Korea
- Prior art keywords
- amino acid
- seq
- capsid protein
- protein corresponding
- sequence
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 85
- 241000702421 Dependoparvovirus Species 0.000 title claims abstract description 19
- 101150110586 IDS gene Proteins 0.000 title abstract description 34
- 239000000203 mixture Substances 0.000 title abstract description 23
- 238000001476 gene delivery Methods 0.000 title description 5
- 208000022018 mucopolysaccharidosis type 2 Diseases 0.000 claims abstract description 202
- 201000002273 mucopolysaccharidosis II Diseases 0.000 claims abstract description 42
- 150000001413 amino acids Chemical class 0.000 claims description 859
- 108090000565 Capsid Proteins Proteins 0.000 claims description 446
- 102100023321 Ceruloplasmin Human genes 0.000 claims description 446
- 239000002773 nucleotide Substances 0.000 claims description 246
- 125000003729 nucleotide group Chemical group 0.000 claims description 246
- 108091026890 Coding region Proteins 0.000 claims description 195
- 101710096421 Iduronate 2-sulfatase Proteins 0.000 claims description 191
- 102100029199 Iduronate 2-sulfatase Human genes 0.000 claims description 189
- 230000008488 polyadenylation Effects 0.000 claims description 162
- 108700029229 Transcriptional Regulatory Elements Proteins 0.000 claims description 161
- 210000000234 capsid Anatomy 0.000 claims description 151
- 239000013598 vector Substances 0.000 claims description 147
- 101000840540 Homo sapiens Iduronate 2-sulfatase Proteins 0.000 claims description 139
- 210000004027 cell Anatomy 0.000 claims description 136
- 102000057422 human IDS Human genes 0.000 claims description 132
- 241000282414 Homo sapiens Species 0.000 claims description 85
- 210000004185 liver Anatomy 0.000 claims description 67
- 108090000623 proteins and genes Proteins 0.000 claims description 60
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 53
- 238000004806 packaging method and process Methods 0.000 claims description 37
- 108091033319 polynucleotide Proteins 0.000 claims description 34
- 102000040430 polynucleotide Human genes 0.000 claims description 34
- 239000002157 polynucleotide Substances 0.000 claims description 34
- 241000701022 Cytomegalovirus Species 0.000 claims description 30
- 102000004169 proteins and genes Human genes 0.000 claims description 27
- 150000007523 nucleic acids Chemical group 0.000 claims description 25
- 210000003169 central nervous system Anatomy 0.000 claims description 23
- 241000700605 Viruses Species 0.000 claims description 22
- 210000002216 heart Anatomy 0.000 claims description 19
- 210000000952 spleen Anatomy 0.000 claims description 19
- 210000003734 kidney Anatomy 0.000 claims description 15
- 210000004072 lung Anatomy 0.000 claims description 15
- 239000008194 pharmaceutical composition Substances 0.000 claims description 15
- 108700028146 Genetic Enhancer Elements Proteins 0.000 claims description 14
- 210000001428 peripheral nervous system Anatomy 0.000 claims description 14
- 229920001184 polypeptide Polymers 0.000 claims description 14
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 14
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 14
- 210000000278 spinal cord Anatomy 0.000 claims description 11
- 238000003780 insertion Methods 0.000 claims description 10
- 210000001320 hippocampus Anatomy 0.000 claims description 9
- 239000013612 plasmid Substances 0.000 claims description 9
- 210000001638 cerebellum Anatomy 0.000 claims description 8
- 238000004519 manufacturing process Methods 0.000 claims description 8
- 210000004498 neuroglial cell Anatomy 0.000 claims description 8
- 210000002569 neuron Anatomy 0.000 claims description 8
- 210000004248 oligodendroglia Anatomy 0.000 claims description 7
- 206010064571 Gene mutation Diseases 0.000 claims description 6
- 210000001130 astrocyte Anatomy 0.000 claims description 6
- 238000011282 treatment Methods 0.000 claims description 6
- 241000701161 unidentified adenovirus Species 0.000 claims description 6
- 102100026031 Beta-glucuronidase Human genes 0.000 claims description 5
- 101000834253 Gallus gallus Actin, cytoplasmic 1 Proteins 0.000 claims description 4
- 101000933465 Homo sapiens Beta-glucuronidase Proteins 0.000 claims description 4
- 241000700618 Vaccinia virus Species 0.000 claims description 4
- 210000003591 cerebellar nuclei Anatomy 0.000 claims description 4
- 210000000337 motor cortex Anatomy 0.000 claims description 4
- 210000002161 motor neuron Anatomy 0.000 claims description 4
- 210000004116 schwann cell Anatomy 0.000 claims description 4
- 230000001953 sensory effect Effects 0.000 claims description 4
- 210000001044 sensory neuron Anatomy 0.000 claims description 4
- 230000002463 transducing effect Effects 0.000 claims description 4
- 241001529453 unidentified herpesvirus Species 0.000 claims description 4
- 102100025580 Calmodulin-1 Human genes 0.000 claims description 3
- 239000003814 drug Substances 0.000 claims description 3
- 230000037431 insertion Effects 0.000 claims description 3
- 239000013603 viral vector Substances 0.000 claims description 3
- 108010060309 Glucuronidase Proteins 0.000 claims description 2
- 101000984164 Homo sapiens Calmodulin-1 Proteins 0.000 claims description 2
- 210000003710 cerebral cortex Anatomy 0.000 claims description 2
- 239000013600 plasmid vector Substances 0.000 claims description 2
- 125000003275 alpha amino acid group Chemical group 0.000 claims 10
- 102000006602 glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 claims 2
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 claims 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 abstract description 20
- 208000035475 disorder Diseases 0.000 abstract description 10
- 241000699670 Mus sp. Species 0.000 description 386
- 102100021244 Integral membrane protein GPR180 Human genes 0.000 description 356
- 230000000694 effects Effects 0.000 description 107
- 210000004556 brain Anatomy 0.000 description 73
- 230000002068 genetic effect Effects 0.000 description 64
- 239000003981 vehicle Substances 0.000 description 55
- 238000012546 transfer Methods 0.000 description 50
- 229920002683 Glycosaminoglycan Polymers 0.000 description 49
- 230000014509 gene expression Effects 0.000 description 45
- 210000002966 serum Anatomy 0.000 description 35
- 241000699666 Mus <mouse, genus> Species 0.000 description 28
- 108010079364 N-glycylalanine Proteins 0.000 description 23
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 23
- 210000005013 brain tissue Anatomy 0.000 description 21
- 108091092195 Intron Proteins 0.000 description 20
- 210000002700 urine Anatomy 0.000 description 20
- 241000702423 Adeno-associated virus - 2 Species 0.000 description 17
- NMCBVGFGWSIGSB-NUTKFTJISA-N Trp-Ala-Leu Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N NMCBVGFGWSIGSB-NUTKFTJISA-N 0.000 description 17
- 210000005260 human cell Anatomy 0.000 description 17
- 210000001519 tissue Anatomy 0.000 description 17
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 16
- 229920002971 Heparan sulfate Polymers 0.000 description 15
- 208000002678 Mucopolysaccharidoses Diseases 0.000 description 14
- 206010028093 mucopolysaccharidosis Diseases 0.000 description 14
- 231100000673 dose–response relationship Toxicity 0.000 description 13
- 238000013518 transcription Methods 0.000 description 13
- 230000035897 transcription Effects 0.000 description 13
- VCSABYLVNWQYQE-SRVKXCTJSA-N Ala-Lys-Lys Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O VCSABYLVNWQYQE-SRVKXCTJSA-N 0.000 description 12
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 12
- 108010009254 Lysosomal-Associated Membrane Protein 1 Proteins 0.000 description 12
- 102100035133 Lysosome-associated membrane glycoprotein 1 Human genes 0.000 description 12
- 108020004414 DNA Proteins 0.000 description 11
- 108010092854 aspartyllysine Proteins 0.000 description 11
- 108010016686 methionyl-alanyl-serine Proteins 0.000 description 11
- NBSCHQHZLSJFNQ-QTVWNMPRSA-N D-Mannose-6-phosphate Chemical compound OC1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H](O)[C@@H]1O NBSCHQHZLSJFNQ-QTVWNMPRSA-N 0.000 description 10
- 201000010099 disease Diseases 0.000 description 10
- 108010051242 phenylalanylserine Proteins 0.000 description 10
- 108010015796 prolylisoleucine Proteins 0.000 description 10
- 238000003364 immunohistochemistry Methods 0.000 description 9
- 210000005228 liver tissue Anatomy 0.000 description 9
- 238000010172 mouse model Methods 0.000 description 9
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 8
- 229920000045 Dermatan sulfate Polymers 0.000 description 8
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 8
- 230000007423 decrease Effects 0.000 description 8
- AVJBPWGFOQAPRH-FWMKGIEWSA-L dermatan sulfate Chemical compound CC(=O)N[C@H]1[C@H](O)O[C@H](CO)[C@H](OS([O-])(=O)=O)[C@@H]1O[C@H]1[C@H](O)[C@@H](O)[C@H](O)[C@H](C([O-])=O)O1 AVJBPWGFOQAPRH-FWMKGIEWSA-L 0.000 description 8
- 229940051593 dermatan sulfate Drugs 0.000 description 8
- 241000894007 species Species 0.000 description 8
- 241001465754 Metazoa Species 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 210000000056 organ Anatomy 0.000 description 7
- 210000000449 purkinje cell Anatomy 0.000 description 7
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 6
- JBGSZRYCXBPWGX-BQBZGAKWSA-N Ala-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N JBGSZRYCXBPWGX-BQBZGAKWSA-N 0.000 description 6
- NHCPCLJZRSIDHS-ZLUOBGJFSA-N Ala-Asp-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O NHCPCLJZRSIDHS-ZLUOBGJFSA-N 0.000 description 6
- GSCLWXDNIMNIJE-ZLUOBGJFSA-N Ala-Asp-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O GSCLWXDNIMNIJE-ZLUOBGJFSA-N 0.000 description 6
- KIUYPHAMDKDICO-WHFBIAKZSA-N Ala-Asp-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KIUYPHAMDKDICO-WHFBIAKZSA-N 0.000 description 6
- IKKVASZHTMKJIR-ZKWXMUAHSA-N Ala-Asp-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IKKVASZHTMKJIR-ZKWXMUAHSA-N 0.000 description 6
- CZPAHAKGPDUIPJ-CIUDSAMLSA-N Ala-Gln-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O CZPAHAKGPDUIPJ-CIUDSAMLSA-N 0.000 description 6
- LMFXXZPPZDCPTA-ZKWXMUAHSA-N Ala-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N LMFXXZPPZDCPTA-ZKWXMUAHSA-N 0.000 description 6
- GRPHQEMIFDPKOE-HGNGGELXSA-N Ala-His-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O GRPHQEMIFDPKOE-HGNGGELXSA-N 0.000 description 6
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 6
- OINVDEKBKBCPLX-JXUBOQSCSA-N Ala-Lys-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OINVDEKBKBCPLX-JXUBOQSCSA-N 0.000 description 6
- FEGOCLZUJUFCHP-CIUDSAMLSA-N Ala-Pro-Gln Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O FEGOCLZUJUFCHP-CIUDSAMLSA-N 0.000 description 6
- YHBDGLZYNIARKJ-GUBZILKMSA-N Ala-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N YHBDGLZYNIARKJ-GUBZILKMSA-N 0.000 description 6
- YCTIYBUTCKNOTI-UWJYBYFXSA-N Ala-Tyr-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCTIYBUTCKNOTI-UWJYBYFXSA-N 0.000 description 6
- JNJHNBXBGNJESC-KKXDTOCCSA-N Ala-Tyr-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JNJHNBXBGNJESC-KKXDTOCCSA-N 0.000 description 6
- JQFJNGVSGOUQDH-XIRDDKMYSA-N Arg-Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCCN=C(N)N)N)C(O)=O)=CNC2=C1 JQFJNGVSGOUQDH-XIRDDKMYSA-N 0.000 description 6
- UHFUZWSZQKMDSX-DCAQKATOSA-N Arg-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UHFUZWSZQKMDSX-DCAQKATOSA-N 0.000 description 6
- UZGFHWIJWPUPOH-IHRRRGAJSA-N Arg-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UZGFHWIJWPUPOH-IHRRRGAJSA-N 0.000 description 6
- AYZAWXAPBAYCHO-CIUDSAMLSA-N Asn-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N AYZAWXAPBAYCHO-CIUDSAMLSA-N 0.000 description 6
- GNKVBRYFXYWXAB-WDSKDSINSA-N Asn-Glu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O GNKVBRYFXYWXAB-WDSKDSINSA-N 0.000 description 6
- WIDVAWAQBRAKTI-YUMQZZPRSA-N Asn-Leu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O WIDVAWAQBRAKTI-YUMQZZPRSA-N 0.000 description 6
- FHETWELNCBMRMG-HJGDQZAQSA-N Asn-Leu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FHETWELNCBMRMG-HJGDQZAQSA-N 0.000 description 6
- RVHGJNGNKGDCPX-KKUMJFAQSA-N Asn-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N RVHGJNGNKGDCPX-KKUMJFAQSA-N 0.000 description 6
- DAYDURRBMDCCFL-AAEUAGOBSA-N Asn-Trp-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N DAYDURRBMDCCFL-AAEUAGOBSA-N 0.000 description 6
- XEDQMTWEYFBOIK-ACZMJKKPSA-N Asp-Ala-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XEDQMTWEYFBOIK-ACZMJKKPSA-N 0.000 description 6
- XYBJLTKSGFBLCS-QXEWZRGKSA-N Asp-Arg-Val Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CC(O)=O XYBJLTKSGFBLCS-QXEWZRGKSA-N 0.000 description 6
- UQBGYPFHWFZMCD-ZLUOBGJFSA-N Asp-Asn-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O UQBGYPFHWFZMCD-ZLUOBGJFSA-N 0.000 description 6
- UGKZHCBLMLSANF-CIUDSAMLSA-N Asp-Asn-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UGKZHCBLMLSANF-CIUDSAMLSA-N 0.000 description 6
- UGIBTKGQVWFTGX-BIIVOSGPSA-N Asp-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)C(=O)O UGIBTKGQVWFTGX-BIIVOSGPSA-N 0.000 description 6
- PGUYEUCYVNZGGV-QWRGUYRKSA-N Asp-Gly-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PGUYEUCYVNZGGV-QWRGUYRKSA-N 0.000 description 6
- IDDMGSKZQDEDGA-SRVKXCTJSA-N Asp-Phe-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 IDDMGSKZQDEDGA-SRVKXCTJSA-N 0.000 description 6
- ZVGRHIRJLWBWGJ-ACZMJKKPSA-N Asp-Ser-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZVGRHIRJLWBWGJ-ACZMJKKPSA-N 0.000 description 6
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 6
- OYSYWMMZGJSQRB-AVGNSLFASA-N Asp-Tyr-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O OYSYWMMZGJSQRB-AVGNSLFASA-N 0.000 description 6
- QYTKAVBFRUGYAU-ACZMJKKPSA-N Gln-Asp-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QYTKAVBFRUGYAU-ACZMJKKPSA-N 0.000 description 6
- GPISLLFQNHELLK-DCAQKATOSA-N Gln-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N GPISLLFQNHELLK-DCAQKATOSA-N 0.000 description 6
- KVXVVDFOZNYYKZ-DCAQKATOSA-N Gln-Gln-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KVXVVDFOZNYYKZ-DCAQKATOSA-N 0.000 description 6
- VOLVNCMGXWDDQY-LPEHRKFASA-N Gln-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N)C(=O)O VOLVNCMGXWDDQY-LPEHRKFASA-N 0.000 description 6
- OREPWMPAUWIIAM-ZPFDUUQYSA-N Gln-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N OREPWMPAUWIIAM-ZPFDUUQYSA-N 0.000 description 6
- SYZZMPFLOLSMHL-XHNCKOQMSA-N Gln-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N)C(=O)O SYZZMPFLOLSMHL-XHNCKOQMSA-N 0.000 description 6
- MKRDNSWGJWTBKZ-GVXVVHGQSA-N Gln-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MKRDNSWGJWTBKZ-GVXVVHGQSA-N 0.000 description 6
- ZMXZGYLINVNTKH-DZKIICNBSA-N Gln-Val-Phe Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZMXZGYLINVNTKH-DZKIICNBSA-N 0.000 description 6
- SBCYJMOOHUDWDA-NUMRIWBASA-N Glu-Asp-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SBCYJMOOHUDWDA-NUMRIWBASA-N 0.000 description 6
- CUXJIASLBRJOFV-LAEOZQHASA-N Glu-Gly-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CUXJIASLBRJOFV-LAEOZQHASA-N 0.000 description 6
- DMYACXMQUABZIQ-NRPADANISA-N Glu-Ser-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O DMYACXMQUABZIQ-NRPADANISA-N 0.000 description 6
- WGYHAAXZWPEBDQ-IFFSRLJSSA-N Glu-Val-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGYHAAXZWPEBDQ-IFFSRLJSSA-N 0.000 description 6
- PMNHJLASAAWELO-FOHZUACHSA-N Gly-Asp-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PMNHJLASAAWELO-FOHZUACHSA-N 0.000 description 6
- IXKRSKPKSLXIHN-YUMQZZPRSA-N Gly-Cys-Leu Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O IXKRSKPKSLXIHN-YUMQZZPRSA-N 0.000 description 6
- BEQGFMIBZFNROK-JGVFFNPUSA-N Gly-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)CN)C(=O)O BEQGFMIBZFNROK-JGVFFNPUSA-N 0.000 description 6
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 6
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 6
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 6
- RIYIFUFFFBIOEU-KBPBESRZSA-N Gly-Tyr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 RIYIFUFFFBIOEU-KBPBESRZSA-N 0.000 description 6
- PNUFMLXHOLFRLD-KBPBESRZSA-N Gly-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 PNUFMLXHOLFRLD-KBPBESRZSA-N 0.000 description 6
- OCRQUYDOYKCOQG-IRXDYDNUSA-N Gly-Tyr-Phe Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 OCRQUYDOYKCOQG-IRXDYDNUSA-N 0.000 description 6
- DNAZKGFYFRGZIH-QWRGUYRKSA-N Gly-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 DNAZKGFYFRGZIH-QWRGUYRKSA-N 0.000 description 6
- FNXSYBOHALPRHV-ONGXEEELSA-N Gly-Val-Lys Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN FNXSYBOHALPRHV-ONGXEEELSA-N 0.000 description 6
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 6
- BDHUXUFYNUOUIT-SRVKXCTJSA-N His-Asp-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BDHUXUFYNUOUIT-SRVKXCTJSA-N 0.000 description 6
- HYWZHNUGAYVEEW-KKUMJFAQSA-N His-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N HYWZHNUGAYVEEW-KKUMJFAQSA-N 0.000 description 6
- JODPUDMBQBIWCK-GHCJXIJMSA-N Ile-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O JODPUDMBQBIWCK-GHCJXIJMSA-N 0.000 description 6
- PWWVAXIEGOYWEE-UHFFFAOYSA-N Isophenergan Chemical compound C1=CC=C2N(CC(C)N(C)C)C3=CC=CC=C3SC2=C1 PWWVAXIEGOYWEE-UHFFFAOYSA-N 0.000 description 6
- UGTHTQWIQKEDEH-BQBZGAKWSA-N L-alanyl-L-prolylglycine zwitterion Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UGTHTQWIQKEDEH-BQBZGAKWSA-N 0.000 description 6
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 6
- VGPCJSXPPOQPBK-YUMQZZPRSA-N Leu-Gly-Ser Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O VGPCJSXPPOQPBK-YUMQZZPRSA-N 0.000 description 6
- USLNHQZCDQJBOV-ZPFDUUQYSA-N Leu-Ile-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O USLNHQZCDQJBOV-ZPFDUUQYSA-N 0.000 description 6
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 6
- BIZNDKMFQHDOIE-KKUMJFAQSA-N Leu-Phe-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 BIZNDKMFQHDOIE-KKUMJFAQSA-N 0.000 description 6
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 6
- MPOHDJKRBLVGCT-CIUDSAMLSA-N Lys-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N MPOHDJKRBLVGCT-CIUDSAMLSA-N 0.000 description 6
- XFIHDSBIPWEYJJ-YUMQZZPRSA-N Lys-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN XFIHDSBIPWEYJJ-YUMQZZPRSA-N 0.000 description 6
- LCMWVZLBCUVDAZ-IUCAKERBSA-N Lys-Gly-Glu Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CCC([O-])=O LCMWVZLBCUVDAZ-IUCAKERBSA-N 0.000 description 6
- ZJWIXBZTAAJERF-IHRRRGAJSA-N Lys-Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZJWIXBZTAAJERF-IHRRRGAJSA-N 0.000 description 6
- PDIDTSZKKFEDMB-UWVGGRQHSA-N Lys-Pro-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O PDIDTSZKKFEDMB-UWVGGRQHSA-N 0.000 description 6
- SBQDRNOLGSYHQA-YUMQZZPRSA-N Lys-Ser-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SBQDRNOLGSYHQA-YUMQZZPRSA-N 0.000 description 6
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 6
- BRDYYVQTEJVRQT-HRCADAONSA-N Phe-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O BRDYYVQTEJVRQT-HRCADAONSA-N 0.000 description 6
- UNLYPPYNDXHGDG-IHRRRGAJSA-N Phe-Gln-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 UNLYPPYNDXHGDG-IHRRRGAJSA-N 0.000 description 6
- YYKZDTVQHTUKDW-RYUDHWBXSA-N Phe-Gly-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N YYKZDTVQHTUKDW-RYUDHWBXSA-N 0.000 description 6
- HQCSLJFGZYOXHW-KKUMJFAQSA-N Phe-His-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CS)C(=O)O)N HQCSLJFGZYOXHW-KKUMJFAQSA-N 0.000 description 6
- QRUOLOPKCOEZKU-HJWJTTGWSA-N Phe-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC1=CC=CC=C1)N QRUOLOPKCOEZKU-HJWJTTGWSA-N 0.000 description 6
- SSSFPISOZOLQNP-GUBZILKMSA-N Pro-Arg-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SSSFPISOZOLQNP-GUBZILKMSA-N 0.000 description 6
- YFNOUBWUIIJQHF-LPEHRKFASA-N Pro-Asp-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)O)C(=O)N2CCC[C@@H]2C(=O)O YFNOUBWUIIJQHF-LPEHRKFASA-N 0.000 description 6
- KTFZQPLSPLWLKN-KKUMJFAQSA-N Pro-Gln-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KTFZQPLSPLWLKN-KKUMJFAQSA-N 0.000 description 6
- UUHXBJHVTVGSKM-BQBZGAKWSA-N Pro-Gly-Asn Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O UUHXBJHVTVGSKM-BQBZGAKWSA-N 0.000 description 6
- NAIPAPCKKRCMBL-JYJNAYRXSA-N Pro-Pro-Phe Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H]1NCCC1)C1=CC=CC=C1 NAIPAPCKKRCMBL-JYJNAYRXSA-N 0.000 description 6
- VVAWNPIOYXAMAL-KJEVXHAQSA-N Pro-Thr-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VVAWNPIOYXAMAL-KJEVXHAQSA-N 0.000 description 6
- FIDNSJUXESUDOV-JYJNAYRXSA-N Pro-Tyr-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O FIDNSJUXESUDOV-JYJNAYRXSA-N 0.000 description 6
- IMNVAOPEMFDAQD-NHCYSSNCSA-N Pro-Val-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IMNVAOPEMFDAQD-NHCYSSNCSA-N 0.000 description 6
- UBRXAVQWXOWRSJ-ZLUOBGJFSA-N Ser-Asn-Asp Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CO)N)C(=O)N UBRXAVQWXOWRSJ-ZLUOBGJFSA-N 0.000 description 6
- BPMRXBZYPGYPJN-WHFBIAKZSA-N Ser-Gly-Asn Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O BPMRXBZYPGYPJN-WHFBIAKZSA-N 0.000 description 6
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 6
- XXXAXOWMBOKTRN-XPUUQOCRSA-N Ser-Gly-Val Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXXAXOWMBOKTRN-XPUUQOCRSA-N 0.000 description 6
- XKFJENWJGHMDLI-QWRGUYRKSA-N Ser-Phe-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O XKFJENWJGHMDLI-QWRGUYRKSA-N 0.000 description 6
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 6
- BDMWLJLPPUCLNV-XGEHTFHBSA-N Ser-Thr-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BDMWLJLPPUCLNV-XGEHTFHBSA-N 0.000 description 6
- 241000700584 Simplexvirus Species 0.000 description 6
- 108091081024 Start codon Proteins 0.000 description 6
- WFUAUEQXPVNAEF-ZJDVBMNYSA-N Thr-Arg-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CCCN=C(N)N WFUAUEQXPVNAEF-ZJDVBMNYSA-N 0.000 description 6
- OHAJHDJOCKKJLV-LKXGYXEUSA-N Thr-Asp-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O OHAJHDJOCKKJLV-LKXGYXEUSA-N 0.000 description 6
- XOWKUMFHEZLKLT-CIQUZCHMSA-N Thr-Ile-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O XOWKUMFHEZLKLT-CIQUZCHMSA-N 0.000 description 6
- IMDMLDSVUSMAEJ-HJGDQZAQSA-N Thr-Leu-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IMDMLDSVUSMAEJ-HJGDQZAQSA-N 0.000 description 6
- UJQVSMNQMQHVRY-KZVJFYERSA-N Thr-Met-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O UJQVSMNQMQHVRY-KZVJFYERSA-N 0.000 description 6
- IWAVRIPRTCJAQO-HSHDSVGOSA-N Thr-Pro-Trp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O IWAVRIPRTCJAQO-HSHDSVGOSA-N 0.000 description 6
- ZMYCLHFLHRVOEA-HEIBUPTGSA-N Thr-Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ZMYCLHFLHRVOEA-HEIBUPTGSA-N 0.000 description 6
- XZLHHHYSWIYXHD-XIRDDKMYSA-N Trp-Gln-Arg Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O XZLHHHYSWIYXHD-XIRDDKMYSA-N 0.000 description 6
- YRSOERSDNRSCBC-XIRDDKMYSA-N Trp-His-Cys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CN=CN3)C(=O)N[C@@H](CS)C(=O)O)N YRSOERSDNRSCBC-XIRDDKMYSA-N 0.000 description 6
- VPRHDRKAPYZMHL-SZMVWBNQSA-N Trp-Leu-Glu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 VPRHDRKAPYZMHL-SZMVWBNQSA-N 0.000 description 6
- UJRIVCPPPMYCNA-HOCLYGCPSA-N Trp-Leu-Gly Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N UJRIVCPPPMYCNA-HOCLYGCPSA-N 0.000 description 6
- CYDVHRFXDMDMGX-KKUMJFAQSA-N Tyr-Asn-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O CYDVHRFXDMDMGX-KKUMJFAQSA-N 0.000 description 6
- DWAMXBFJNZIHMC-KBPBESRZSA-N Tyr-Leu-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O DWAMXBFJNZIHMC-KBPBESRZSA-N 0.000 description 6
- PRONOHBTMLNXCZ-BZSNNMDCSA-N Tyr-Leu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PRONOHBTMLNXCZ-BZSNNMDCSA-N 0.000 description 6
- BYAKMYBZADCNMN-JYJNAYRXSA-N Tyr-Lys-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O BYAKMYBZADCNMN-JYJNAYRXSA-N 0.000 description 6
- XGJLNBNZNMVJRS-NRPADANISA-N Val-Glu-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O XGJLNBNZNMVJRS-NRPADANISA-N 0.000 description 6
- LAYSXAOGWHKNED-XPUUQOCRSA-N Val-Gly-Ser Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LAYSXAOGWHKNED-XPUUQOCRSA-N 0.000 description 6
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 6
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 6
- 108010044940 alanylglutamine Proteins 0.000 description 6
- 238000013103 analytical ultracentrifugation Methods 0.000 description 6
- 210000003423 ankle Anatomy 0.000 description 6
- DDRJAANPRJIHGJ-UHFFFAOYSA-N creatinine Chemical compound CN1CC(=O)NC1=N DDRJAANPRJIHGJ-UHFFFAOYSA-N 0.000 description 6
- 210000002683 foot Anatomy 0.000 description 6
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 6
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 6
- 108010059898 glycyl-tyrosyl-lysine Proteins 0.000 description 6
- 108010050848 glycylleucine Proteins 0.000 description 6
- 108010040030 histidinoalanine Proteins 0.000 description 6
- 108010025306 histidylleucine Proteins 0.000 description 6
- 108010034529 leucyl-lysine Proteins 0.000 description 6
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 6
- 108010047926 leucyl-lysyl-tyrosine Proteins 0.000 description 6
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 6
- 108010057821 leucylproline Proteins 0.000 description 6
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 6
- 108010077112 prolyl-proline Proteins 0.000 description 6
- 108010026333 seryl-proline Proteins 0.000 description 6
- 238000010361 transduction Methods 0.000 description 6
- 230000026683 transduction Effects 0.000 description 6
- 108010015666 tryptophyl-leucyl-glutamic acid Proteins 0.000 description 6
- 108010038745 tryptophylglycine Proteins 0.000 description 6
- 108010045269 tryptophyltryptophan Proteins 0.000 description 6
- NHWYNIZWLJYZAG-XVYDVKMFSA-N Ala-Ser-His Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N NHWYNIZWLJYZAG-XVYDVKMFSA-N 0.000 description 5
- NCQMBSJGJMYKCK-ZLUOBGJFSA-N Ala-Ser-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O NCQMBSJGJMYKCK-ZLUOBGJFSA-N 0.000 description 5
- LSMDIAAALJJLRO-XQXXSGGOSA-N Ala-Thr-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O LSMDIAAALJJLRO-XQXXSGGOSA-N 0.000 description 5
- XSLGWYYNOSUMRM-ZKWXMUAHSA-N Ala-Val-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XSLGWYYNOSUMRM-ZKWXMUAHSA-N 0.000 description 5
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 5
- FRBAHXABMQXSJQ-FXQIFTODSA-N Arg-Ser-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FRBAHXABMQXSJQ-FXQIFTODSA-N 0.000 description 5
- CGWVCWFQGXOUSJ-ULQDDVLXSA-N Arg-Tyr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O CGWVCWFQGXOUSJ-ULQDDVLXSA-N 0.000 description 5
- KXFCBAHYSLJCCY-ZLUOBGJFSA-N Asn-Asn-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O KXFCBAHYSLJCCY-ZLUOBGJFSA-N 0.000 description 5
- FTCGGKNCJZOPNB-WHFBIAKZSA-N Asn-Gly-Ser Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FTCGGKNCJZOPNB-WHFBIAKZSA-N 0.000 description 5
- FTSAJSADJCMDHH-CIUDSAMLSA-N Asn-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N FTSAJSADJCMDHH-CIUDSAMLSA-N 0.000 description 5
- BKZFBJYIVSBXCO-KKUMJFAQSA-N Asn-Phe-His Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC=N1)C(O)=O BKZFBJYIVSBXCO-KKUMJFAQSA-N 0.000 description 5
- GKKUBLFXKRDMFC-BQBZGAKWSA-N Asn-Pro-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O GKKUBLFXKRDMFC-BQBZGAKWSA-N 0.000 description 5
- VHQSGALUSWIYOD-QXEWZRGKSA-N Asn-Pro-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O VHQSGALUSWIYOD-QXEWZRGKSA-N 0.000 description 5
- BEHQTVDBCLSCBY-CFMVVWHZSA-N Asn-Tyr-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BEHQTVDBCLSCBY-CFMVVWHZSA-N 0.000 description 5
- WSWYMRLTJVKRCE-ZLUOBGJFSA-N Asp-Ala-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O WSWYMRLTJVKRCE-ZLUOBGJFSA-N 0.000 description 5
- ZLGKHJHFYSRUBH-FXQIFTODSA-N Asp-Arg-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLGKHJHFYSRUBH-FXQIFTODSA-N 0.000 description 5
- IXIWEFWRKIUMQX-DCAQKATOSA-N Asp-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(O)=O IXIWEFWRKIUMQX-DCAQKATOSA-N 0.000 description 5
- MRQQMVZUHXUPEV-IHRRRGAJSA-N Asp-Arg-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MRQQMVZUHXUPEV-IHRRRGAJSA-N 0.000 description 5
- RDRMWJBLOSRRAW-BYULHYEWSA-N Asp-Asn-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O RDRMWJBLOSRRAW-BYULHYEWSA-N 0.000 description 5
- BKOIIURTQAJHAT-GUBZILKMSA-N Asp-Pro-Pro Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 BKOIIURTQAJHAT-GUBZILKMSA-N 0.000 description 5
- 102000004190 Enzymes Human genes 0.000 description 5
- 108090000790 Enzymes Proteins 0.000 description 5
- 101100269075 Gallus gallus ACTB gene Proteins 0.000 description 5
- NPTGGVQJYRSMCM-GLLZPBPUSA-N Gln-Gln-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NPTGGVQJYRSMCM-GLLZPBPUSA-N 0.000 description 5
- IKFZXRLDMYWNBU-YUMQZZPRSA-N Gln-Gly-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N IKFZXRLDMYWNBU-YUMQZZPRSA-N 0.000 description 5
- GNMQDOGFWYWPNM-LAEOZQHASA-N Gln-Gly-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)CNC(=O)[C@@H](N)CCC(N)=O)C(O)=O GNMQDOGFWYWPNM-LAEOZQHASA-N 0.000 description 5
- NSORZJXKUQFEKL-JGVFFNPUSA-N Gln-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCC(=O)N)N)C(=O)O NSORZJXKUQFEKL-JGVFFNPUSA-N 0.000 description 5
- JKDBRTNMYXYLHO-JYJNAYRXSA-N Gln-Tyr-Leu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 JKDBRTNMYXYLHO-JYJNAYRXSA-N 0.000 description 5
- UBRQJXFDVZNYJP-AVGNSLFASA-N Gln-Tyr-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O UBRQJXFDVZNYJP-AVGNSLFASA-N 0.000 description 5
- AUTNXSQEVVHSJK-YVNDNENWSA-N Glu-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O AUTNXSQEVVHSJK-YVNDNENWSA-N 0.000 description 5
- OGNJZUXUTPQVBR-BQBZGAKWSA-N Glu-Gly-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OGNJZUXUTPQVBR-BQBZGAKWSA-N 0.000 description 5
- WVYJNPCWJYBHJG-YVNDNENWSA-N Glu-Ile-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O WVYJNPCWJYBHJG-YVNDNENWSA-N 0.000 description 5
- VGUYMZGLJUJRBV-YVNDNENWSA-N Glu-Ile-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O VGUYMZGLJUJRBV-YVNDNENWSA-N 0.000 description 5
- PMSMKNYRZCKVMC-DRZSPHRISA-N Glu-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCC(=O)O)N PMSMKNYRZCKVMC-DRZSPHRISA-N 0.000 description 5
- XUDLUKYPXQDCRX-BQBZGAKWSA-N Gly-Arg-Asn Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O XUDLUKYPXQDCRX-BQBZGAKWSA-N 0.000 description 5
- CIMULJZTTOBOPN-WHFBIAKZSA-N Gly-Asn-Asn Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CIMULJZTTOBOPN-WHFBIAKZSA-N 0.000 description 5
- BULIVUZUDBHKKZ-WDSKDSINSA-N Gly-Gln-Asn Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O BULIVUZUDBHKKZ-WDSKDSINSA-N 0.000 description 5
- HAOUOFNNJJLVNS-BQBZGAKWSA-N Gly-Pro-Ser Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O HAOUOFNNJJLVNS-BQBZGAKWSA-N 0.000 description 5
- CSMYMGFCEJWALV-WDSKDSINSA-N Gly-Ser-Gln Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O CSMYMGFCEJWALV-WDSKDSINSA-N 0.000 description 5
- VIJMRAIWYWRXSR-CIUDSAMLSA-N His-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 VIJMRAIWYWRXSR-CIUDSAMLSA-N 0.000 description 5
- DFFTXLCCDFYRKD-MBLNEYKQSA-N Ile-Gly-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N DFFTXLCCDFYRKD-MBLNEYKQSA-N 0.000 description 5
- GAZGFPOZOLEYAJ-YTFOTSKYSA-N Ile-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N GAZGFPOZOLEYAJ-YTFOTSKYSA-N 0.000 description 5
- JTBFQNHKNRZJDS-SYWGBEHUSA-N Ile-Trp-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](C)C(=O)O)N JTBFQNHKNRZJDS-SYWGBEHUSA-N 0.000 description 5
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 5
- STAVRDQLZOTNKJ-RHYQMDGZSA-N Leu-Arg-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STAVRDQLZOTNKJ-RHYQMDGZSA-N 0.000 description 5
- LLBQJYDYOLIQAI-JYJNAYRXSA-N Leu-Glu-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LLBQJYDYOLIQAI-JYJNAYRXSA-N 0.000 description 5
- KOSWSHVQIVTVQF-ZPFDUUQYSA-N Leu-Ile-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KOSWSHVQIVTVQF-ZPFDUUQYSA-N 0.000 description 5
- QLDHBYRUNQZIJQ-DKIMLUQUSA-N Leu-Ile-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QLDHBYRUNQZIJQ-DKIMLUQUSA-N 0.000 description 5
- QNTJIDXQHWUBKC-BZSNNMDCSA-N Leu-Lys-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QNTJIDXQHWUBKC-BZSNNMDCSA-N 0.000 description 5
- FLNPJLDPGMLWAU-UWVGGRQHSA-N Leu-Met-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CC(C)C FLNPJLDPGMLWAU-UWVGGRQHSA-N 0.000 description 5
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 5
- YNNPKXBBRZVIRX-IHRRRGAJSA-N Lys-Arg-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O YNNPKXBBRZVIRX-IHRRRGAJSA-N 0.000 description 5
- QUCDKEKDPYISNX-HJGDQZAQSA-N Lys-Asn-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QUCDKEKDPYISNX-HJGDQZAQSA-N 0.000 description 5
- VSRXPEHZMHSFKU-IUCAKERBSA-N Lys-Gln-Gly Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VSRXPEHZMHSFKU-IUCAKERBSA-N 0.000 description 5
- ZXEUFAVXODIPHC-GUBZILKMSA-N Lys-Glu-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZXEUFAVXODIPHC-GUBZILKMSA-N 0.000 description 5
- GNLJXWBNLAIPEP-MELADBBJSA-N Lys-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCCCN)N)C(=O)O GNLJXWBNLAIPEP-MELADBBJSA-N 0.000 description 5
- IZJGPPIGYTVXLB-FQUUOJAGSA-N Lys-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IZJGPPIGYTVXLB-FQUUOJAGSA-N 0.000 description 5
- NJNRBRKHOWSGMN-SRVKXCTJSA-N Lys-Leu-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O NJNRBRKHOWSGMN-SRVKXCTJSA-N 0.000 description 5
- DLCAXBGXGOVUCD-PPCPHDFISA-N Lys-Thr-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DLCAXBGXGOVUCD-PPCPHDFISA-N 0.000 description 5
- CAVRAQIDHUPECU-UVOCVTCTSA-N Lys-Thr-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAVRAQIDHUPECU-UVOCVTCTSA-N 0.000 description 5
- VWJFOUBDZIUXGA-AVGNSLFASA-N Lys-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCCCN)N VWJFOUBDZIUXGA-AVGNSLFASA-N 0.000 description 5
- YRAWWKUTNBILNT-FXQIFTODSA-N Met-Ala-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YRAWWKUTNBILNT-FXQIFTODSA-N 0.000 description 5
- DTICLBJHRYSJLH-GUBZILKMSA-N Met-Ala-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O DTICLBJHRYSJLH-GUBZILKMSA-N 0.000 description 5
- IHITVQKJXQQGLJ-LPEHRKFASA-N Met-Asn-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N IHITVQKJXQQGLJ-LPEHRKFASA-N 0.000 description 5
- OTKQHDPECKUDSB-SZMVWBNQSA-N Met-Val-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCSC)C(O)=O)=CNC2=C1 OTKQHDPECKUDSB-SZMVWBNQSA-N 0.000 description 5
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 5
- 241000283973 Oryctolagus cuniculus Species 0.000 description 5
- GDBOREPXIRKSEQ-FHWLQOOXSA-N Phe-Gln-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GDBOREPXIRKSEQ-FHWLQOOXSA-N 0.000 description 5
- FMMIYCMOVGXZIP-AVGNSLFASA-N Phe-Glu-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O FMMIYCMOVGXZIP-AVGNSLFASA-N 0.000 description 5
- VJLLEKDQJSMHRU-STQMWFEESA-N Phe-Gly-Met Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O VJLLEKDQJSMHRU-STQMWFEESA-N 0.000 description 5
- WWPAHTZOWURIMR-ULQDDVLXSA-N Phe-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 WWPAHTZOWURIMR-ULQDDVLXSA-N 0.000 description 5
- CVAUVSOFHJKCHN-BZSNNMDCSA-N Phe-Tyr-Cys Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CS)C(O)=O)C1=CC=CC=C1 CVAUVSOFHJKCHN-BZSNNMDCSA-N 0.000 description 5
- DRVIASBABBMZTF-GUBZILKMSA-N Pro-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@@H]1CCCN1 DRVIASBABBMZTF-GUBZILKMSA-N 0.000 description 5
- ICTZKEXYDDZZFP-SRVKXCTJSA-N Pro-Arg-Pro Chemical compound N([C@@H](CCCN=C(N)N)C(=O)N1[C@@H](CCC1)C(O)=O)C(=O)[C@@H]1CCCN1 ICTZKEXYDDZZFP-SRVKXCTJSA-N 0.000 description 5
- FYKUEXMZYFIZKA-DCAQKATOSA-N Pro-Pro-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O FYKUEXMZYFIZKA-DCAQKATOSA-N 0.000 description 5
- OWQXAJQZLWHPBH-FXQIFTODSA-N Pro-Ser-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O OWQXAJQZLWHPBH-FXQIFTODSA-N 0.000 description 5
- SEZGGSHLMROBFX-CIUDSAMLSA-N Pro-Ser-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O SEZGGSHLMROBFX-CIUDSAMLSA-N 0.000 description 5
- SNGZLPOXVRTNMB-LPEHRKFASA-N Pro-Ser-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N2CCC[C@@H]2C(=O)O SNGZLPOXVRTNMB-LPEHRKFASA-N 0.000 description 5
- ZMLRZBWCXPQADC-TUAOUCFPSA-N Pro-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 ZMLRZBWCXPQADC-TUAOUCFPSA-N 0.000 description 5
- 108010079005 RDV peptide Proteins 0.000 description 5
- OOKCGAYXSNJBGQ-ZLUOBGJFSA-N Ser-Asn-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OOKCGAYXSNJBGQ-ZLUOBGJFSA-N 0.000 description 5
- FMDHKPRACUXATF-ACZMJKKPSA-N Ser-Gln-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O FMDHKPRACUXATF-ACZMJKKPSA-N 0.000 description 5
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 5
- XXNYYSXNXCJYKX-DCAQKATOSA-N Ser-Leu-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O XXNYYSXNXCJYKX-DCAQKATOSA-N 0.000 description 5
- NNFMANHDYSVNIO-DCAQKATOSA-N Ser-Lys-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NNFMANHDYSVNIO-DCAQKATOSA-N 0.000 description 5
- KZPRPBLHYMZIMH-MXAVVETBSA-N Ser-Phe-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KZPRPBLHYMZIMH-MXAVVETBSA-N 0.000 description 5
- QYBRQMLZDDJBSW-AVGNSLFASA-N Ser-Tyr-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O QYBRQMLZDDJBSW-AVGNSLFASA-N 0.000 description 5
- KEGBFULVYKYJRD-LFSVMHDDSA-N Thr-Ala-Phe Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KEGBFULVYKYJRD-LFSVMHDDSA-N 0.000 description 5
- JMZKMSTYXHFYAK-VEVYYDQMSA-N Thr-Arg-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O JMZKMSTYXHFYAK-VEVYYDQMSA-N 0.000 description 5
- QGXCWPNQVCYJEL-NUMRIWBASA-N Thr-Asn-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QGXCWPNQVCYJEL-NUMRIWBASA-N 0.000 description 5
- KCRQEJSKXAIULJ-FJXKBIBVSA-N Thr-Gly-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O KCRQEJSKXAIULJ-FJXKBIBVSA-N 0.000 description 5
- VYEHBMMAJFVTOI-JHEQGTHGSA-N Thr-Gly-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O VYEHBMMAJFVTOI-JHEQGTHGSA-N 0.000 description 5
- YSXYEJWDHBCTDJ-DVJZZOLTSA-N Thr-Gly-Trp Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O YSXYEJWDHBCTDJ-DVJZZOLTSA-N 0.000 description 5
- QNTBGBCOEYNAPV-CWRNSKLLSA-N Trp-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)O QNTBGBCOEYNAPV-CWRNSKLLSA-N 0.000 description 5
- YXONONCLMLHWJX-SZMVWBNQSA-N Trp-Glu-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O)=CNC2=C1 YXONONCLMLHWJX-SZMVWBNQSA-N 0.000 description 5
- WMIUTJPFHMMUGY-ZFWWWQNUSA-N Trp-Pro-Gly Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)NCC(=O)O WMIUTJPFHMMUGY-ZFWWWQNUSA-N 0.000 description 5
- SDNVRAKIJVKAGS-LKTVYLICSA-N Tyr-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N SDNVRAKIJVKAGS-LKTVYLICSA-N 0.000 description 5
- HKIUVWMZYFBIHG-KKUMJFAQSA-N Tyr-Arg-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O HKIUVWMZYFBIHG-KKUMJFAQSA-N 0.000 description 5
- JWGXUKHIKXZWNG-RYUDHWBXSA-N Tyr-Gly-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O JWGXUKHIKXZWNG-RYUDHWBXSA-N 0.000 description 5
- QFXVAFIHVWXXBJ-AVGNSLFASA-N Tyr-Ser-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O QFXVAFIHVWXXBJ-AVGNSLFASA-N 0.000 description 5
- WQOHKVRQDLNDIL-YJRXYDGGSA-N Tyr-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O WQOHKVRQDLNDIL-YJRXYDGGSA-N 0.000 description 5
- HZDQUVQEVVYDDA-ACRUOGEOSA-N Tyr-Tyr-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HZDQUVQEVVYDDA-ACRUOGEOSA-N 0.000 description 5
- QVYFTFIBKCDHIE-ACRUOGEOSA-N Tyr-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O QVYFTFIBKCDHIE-ACRUOGEOSA-N 0.000 description 5
- ASQFIHTXXMFENG-XPUUQOCRSA-N Val-Ala-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O ASQFIHTXXMFENG-XPUUQOCRSA-N 0.000 description 5
- SLLKXDSRVAOREO-KZVJFYERSA-N Val-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N)O SLLKXDSRVAOREO-KZVJFYERSA-N 0.000 description 5
- QPZMOUMNTGTEFR-ZKWXMUAHSA-N Val-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N QPZMOUMNTGTEFR-ZKWXMUAHSA-N 0.000 description 5
- OUUBKKIJQIAPRI-LAEOZQHASA-N Val-Gln-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OUUBKKIJQIAPRI-LAEOZQHASA-N 0.000 description 5
- FOADDSDHGRFUOC-DZKIICNBSA-N Val-Glu-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N FOADDSDHGRFUOC-DZKIICNBSA-N 0.000 description 5
- UZFNHAXYMICTBU-DZKIICNBSA-N Val-Phe-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N UZFNHAXYMICTBU-DZKIICNBSA-N 0.000 description 5
- QIVPZSWBBHRNBA-JYJNAYRXSA-N Val-Pro-Phe Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O QIVPZSWBBHRNBA-JYJNAYRXSA-N 0.000 description 5
- NZYNRRGJJVSSTJ-GUBZILKMSA-N Val-Ser-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NZYNRRGJJVSSTJ-GUBZILKMSA-N 0.000 description 5
- JXWGBRRVTRAZQA-ULQDDVLXSA-N Val-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N JXWGBRRVTRAZQA-ULQDDVLXSA-N 0.000 description 5
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 5
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 5
- 238000000540 analysis of variance Methods 0.000 description 5
- 230000000295 complement effect Effects 0.000 description 5
- 229940088598 enzyme Drugs 0.000 description 5
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 5
- 108010077435 glycyl-phenylalanyl-glycine Proteins 0.000 description 5
- 108010077515 glycylproline Proteins 0.000 description 5
- 108010037850 glycylvaline Proteins 0.000 description 5
- 108010092114 histidylphenylalanine Proteins 0.000 description 5
- 238000001727 in vivo Methods 0.000 description 5
- 230000001965 increasing effect Effects 0.000 description 5
- 238000001990 intravenous administration Methods 0.000 description 5
- 238000002955 isolation Methods 0.000 description 5
- 108010012058 leucyltyrosine Proteins 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 108010024607 phenylalanylalanine Proteins 0.000 description 5
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 5
- 108010090894 prolylleucine Proteins 0.000 description 5
- 108010061238 threonyl-glycine Proteins 0.000 description 5
- LGFCAXJBAZESCF-ACZMJKKPSA-N Ala-Gln-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O LGFCAXJBAZESCF-ACZMJKKPSA-N 0.000 description 4
- MOHUTCNYQLMARY-GUBZILKMSA-N Asn-His-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N MOHUTCNYQLMARY-GUBZILKMSA-N 0.000 description 4
- 108700024394 Exon Proteins 0.000 description 4
- LJEPDHWNQXPXMM-NHCYSSNCSA-N Gln-Arg-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O LJEPDHWNQXPXMM-NHCYSSNCSA-N 0.000 description 4
- 241001529936 Murinae Species 0.000 description 4
- MMGJPDWSIOAGTH-ACZMJKKPSA-N Ser-Ala-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MMGJPDWSIOAGTH-ACZMJKKPSA-N 0.000 description 4
- VLMIUSLQONKLDV-HEIBUPTGSA-N Ser-Thr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VLMIUSLQONKLDV-HEIBUPTGSA-N 0.000 description 4
- SHOMROOOQBDGRL-JHEQGTHGSA-N Thr-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SHOMROOOQBDGRL-JHEQGTHGSA-N 0.000 description 4
- UQMPYVLTQCGRSK-IFFSRLJSSA-N Val-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N)O UQMPYVLTQCGRSK-IFFSRLJSSA-N 0.000 description 4
- 230000008499 blood brain barrier function Effects 0.000 description 4
- 210000001218 blood-brain barrier Anatomy 0.000 description 4
- 239000003623 enhancer Substances 0.000 description 4
- 238000002641 enzyme replacement therapy Methods 0.000 description 4
- 238000001415 gene therapy Methods 0.000 description 4
- 238000000338 in vitro Methods 0.000 description 4
- 239000000543 intermediate Substances 0.000 description 4
- 230000035772 mutation Effects 0.000 description 4
- 102000039446 nucleic acids Human genes 0.000 description 4
- 108020004707 nucleic acids Proteins 0.000 description 4
- 238000001543 one-way ANOVA Methods 0.000 description 4
- 238000007619 statistical method Methods 0.000 description 4
- 230000003612 virological effect Effects 0.000 description 4
- 241001634120 Adeno-associated virus - 5 Species 0.000 description 3
- 208000002267 Anti-neutrophil cytoplasmic antibody-associated vasculitis Diseases 0.000 description 3
- 102000005643 COP9 Signalosome Complex Human genes 0.000 description 3
- 108010070033 COP9 Signalosome Complex Proteins 0.000 description 3
- JEDIEMIJYSRUBB-FOHZUACHSA-N Thr-Asp-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O JEDIEMIJYSRUBB-FOHZUACHSA-N 0.000 description 3
- 108700019146 Transgenes Proteins 0.000 description 3
- 210000001759 blood-nerve barrier Anatomy 0.000 description 3
- 230000037396 body weight Effects 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 3
- 229940109239 creatinine Drugs 0.000 description 3
- 230000002950 deficient Effects 0.000 description 3
- 208000015181 infectious disease Diseases 0.000 description 3
- 210000005229 liver cell Anatomy 0.000 description 3
- 230000002132 lysosomal effect Effects 0.000 description 3
- 238000004949 mass spectrometry Methods 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 230000037361 pathway Effects 0.000 description 3
- 239000002243 precursor Substances 0.000 description 3
- 210000004129 prosencephalon Anatomy 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 231100001055 skeletal defect Toxicity 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000004580 weight loss Effects 0.000 description 3
- 239000013607 AAV vector Substances 0.000 description 2
- 101710164735 Calmodulin-1 Proteins 0.000 description 2
- 108020004635 Complementary DNA Proteins 0.000 description 2
- 102000053602 DNA Human genes 0.000 description 2
- WZUVPPKBWHMQCE-UHFFFAOYSA-N Haematoxylin Chemical compound C12=CC(O)=C(O)C=C2CC2(O)C1C1=CC=C(O)C(O)=C1OC2 WZUVPPKBWHMQCE-UHFFFAOYSA-N 0.000 description 2
- 108091005904 Hemoglobin subunit beta Proteins 0.000 description 2
- 241000282412 Homo Species 0.000 description 2
- 101000982010 Homo sapiens Myelin proteolipid protein Proteins 0.000 description 2
- 208000026350 Inborn Genetic disease Diseases 0.000 description 2
- 101710116782 Lysosome-associated membrane glycoprotein 1 Proteins 0.000 description 2
- 108010072388 Methyl-CpG-Binding Protein 2 Proteins 0.000 description 2
- 102100039124 Methyl-CpG-binding protein 2 Human genes 0.000 description 2
- 101000819572 Mus musculus Glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 2
- 102000010292 Peptide Elongation Factor 1 Human genes 0.000 description 2
- 108010077524 Peptide Elongation Factor 1 Proteins 0.000 description 2
- 102000011755 Phosphoglycerate Kinase Human genes 0.000 description 2
- 101001099217 Thermotoga maritima (strain ATCC 43589 / DSM 3109 / JCM 10099 / NBRC 100826 / MSB8) Triosephosphate isomerase Proteins 0.000 description 2
- XPNSAQMEAVSQRD-FBCQKBJTSA-N Thr-Gly-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)NCC(O)=O XPNSAQMEAVSQRD-FBCQKBJTSA-N 0.000 description 2
- 108091023040 Transcription factor Proteins 0.000 description 2
- 102000040945 Transcription factor Human genes 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000001174 ascending effect Effects 0.000 description 2
- 238000010804 cDNA synthesis Methods 0.000 description 2
- 208000010877 cognitive disease Diseases 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 230000001054 cortical effect Effects 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000007850 degeneration Effects 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 239000003937 drug carrier Substances 0.000 description 2
- 239000000839 emulsion Substances 0.000 description 2
- 230000001815 facial effect Effects 0.000 description 2
- 210000003195 fascia Anatomy 0.000 description 2
- 230000009395 genetic defect Effects 0.000 description 2
- 208000016361 genetic disease Diseases 0.000 description 2
- 230000002518 glial effect Effects 0.000 description 2
- 210000002064 heart cell Anatomy 0.000 description 2
- 238000000589 high-performance liquid chromatography-mass spectrometry Methods 0.000 description 2
- 210000004124 hock Anatomy 0.000 description 2
- 210000005265 lung cell Anatomy 0.000 description 2
- 239000006166 lysate Substances 0.000 description 2
- 210000003712 lysosome Anatomy 0.000 description 2
- 230000001868 lysosomic effect Effects 0.000 description 2
- 210000004962 mammalian cell Anatomy 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- 210000001259 mesencephalon Anatomy 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 239000000546 pharmaceutical excipient Substances 0.000 description 2
- 230000000750 progressive effect Effects 0.000 description 2
- 230000006337 proteolytic cleavage Effects 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 108020003175 receptors Proteins 0.000 description 2
- 102000005962 receptors Human genes 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 230000001177 retroviral effect Effects 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 210000001202 rhombencephalon Anatomy 0.000 description 2
- 238000004062 sedimentation Methods 0.000 description 2
- 210000004989 spleen cell Anatomy 0.000 description 2
- 238000010186 staining Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 208000024891 symptom Diseases 0.000 description 2
- 210000001103 thalamus Anatomy 0.000 description 2
- 230000001225 therapeutic effect Effects 0.000 description 2
- 238000002560 therapeutic procedure Methods 0.000 description 2
- 230000002103 transcriptional effect Effects 0.000 description 2
- 238000001890 transfection Methods 0.000 description 2
- 210000000427 trigeminal ganglion Anatomy 0.000 description 2
- 241000701447 unidentified baculovirus Species 0.000 description 2
- 230000002485 urinary effect Effects 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 238000001262 western blot Methods 0.000 description 2
- YNVAHBUBGBLIEY-WGDLNXRISA-N (1e,4e)-1,5-bis(2-hydroxyphenyl)penta-1,4-dien-3-one Chemical compound OC1=CC=CC=C1\C=C\C(=O)\C=C\C1=CC=CC=C1O YNVAHBUBGBLIEY-WGDLNXRISA-N 0.000 description 1
- 241001655883 Adeno-associated virus - 1 Species 0.000 description 1
- 241000202702 Adeno-associated virus - 3 Species 0.000 description 1
- 241000580270 Adeno-associated virus - 4 Species 0.000 description 1
- 241000972680 Adeno-associated virus - 6 Species 0.000 description 1
- 241001164823 Adeno-associated virus - 7 Species 0.000 description 1
- 241001164825 Adeno-associated virus - 8 Species 0.000 description 1
- 241000649044 Adeno-associated virus 9 Species 0.000 description 1
- CPTXATAOUQJQRO-GUBZILKMSA-N Arg-Val-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O CPTXATAOUQJQRO-GUBZILKMSA-N 0.000 description 1
- 101001057129 Bacillus cereus Enterotoxin Proteins 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 108091062157 Cis-regulatory element Proteins 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 208000028698 Cognitive impairment Diseases 0.000 description 1
- MNQZXJOMYWMBOU-VKHMYHEASA-N D-glyceraldehyde Chemical compound OC[C@@H](O)C=O MNQZXJOMYWMBOU-VKHMYHEASA-N 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 206010011878 Deafness Diseases 0.000 description 1
- 101710088194 Dehydrogenase Proteins 0.000 description 1
- 238000002965 ELISA Methods 0.000 description 1
- 241000283074 Equus asinus Species 0.000 description 1
- 102000009123 Fibrin Human genes 0.000 description 1
- 108010073385 Fibrin Proteins 0.000 description 1
- BWGVNKXGVNDBDI-UHFFFAOYSA-N Fibrin monomer Chemical compound CNC(=O)CNC(=O)CN BWGVNKXGVNDBDI-UHFFFAOYSA-N 0.000 description 1
- 108091006027 G proteins Proteins 0.000 description 1
- 102000030782 GTP binding Human genes 0.000 description 1
- 108091000058 GTP-Binding Proteins 0.000 description 1
- 241000287828 Gallus gallus Species 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- NNQHEEQNPQYPGL-FXQIFTODSA-N Gln-Ala-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O NNQHEEQNPQYPGL-FXQIFTODSA-N 0.000 description 1
- KUBFPYIMAGXGBT-ACZMJKKPSA-N Gln-Ser-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KUBFPYIMAGXGBT-ACZMJKKPSA-N 0.000 description 1
- 102100031573 Hematopoietic progenitor cell antigen CD34 Human genes 0.000 description 1
- 102100021519 Hemoglobin subunit beta Human genes 0.000 description 1
- 102100024025 Heparanase Human genes 0.000 description 1
- HTTJABKRGRZYRN-UHFFFAOYSA-N Heparin Chemical compound OC1C(NC(=O)C)C(O)OC(COS(O)(=O)=O)C1OC1C(OS(O)(=O)=O)C(O)C(OC2C(C(OS(O)(=O)=O)C(OC3C(C(O)C(O)C(O3)C(O)=O)OS(O)(=O)=O)C(CO)O2)NS(O)(=O)=O)C(C(O)=O)O1 HTTJABKRGRZYRN-UHFFFAOYSA-N 0.000 description 1
- 206010019842 Hepatomegaly Diseases 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 101000756632 Homo sapiens Actin, cytoplasmic 1 Proteins 0.000 description 1
- 101000777663 Homo sapiens Hematopoietic progenitor cell antigen CD34 Proteins 0.000 description 1
- 101000985642 Homo sapiens Metallothionein-3 Proteins 0.000 description 1
- 101000821100 Homo sapiens Synapsin-1 Proteins 0.000 description 1
- 101000821096 Homo sapiens Synapsin-2 Proteins 0.000 description 1
- 101001042049 Human herpesvirus 1 (strain 17) Transcriptional regulator ICP22 Proteins 0.000 description 1
- 101000999690 Human herpesvirus 2 (strain HG52) E3 ubiquitin ligase ICP22 Proteins 0.000 description 1
- 206010020880 Hypertrophy Diseases 0.000 description 1
- 101150027427 ICP4 gene Proteins 0.000 description 1
- QADCTXFNLZBZAB-GHCJXIJMSA-N Ile-Asn-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C)C(=O)O)N QADCTXFNLZBZAB-GHCJXIJMSA-N 0.000 description 1
- RZHLIPMZXOEJTL-AVGNSLFASA-N Lys-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N RZHLIPMZXOEJTL-AVGNSLFASA-N 0.000 description 1
- 208000015439 Lysosomal storage disease Diseases 0.000 description 1
- 108010052285 Membrane Proteins Proteins 0.000 description 1
- 102000018697 Membrane Proteins Human genes 0.000 description 1
- GMMLGMFBYCFCCX-KZVJFYERSA-N Met-Thr-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O GMMLGMFBYCFCCX-KZVJFYERSA-N 0.000 description 1
- 108700021154 Metallothionein 3 Proteins 0.000 description 1
- 102100028708 Metallothionein-3 Human genes 0.000 description 1
- 101000700655 Mycobacterium leprae (strain TN) Serine-rich antigen Proteins 0.000 description 1
- 102100026784 Myelin proteolipid protein Human genes 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 102000043276 Oncogene Human genes 0.000 description 1
- 108700020796 Oncogene Proteins 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 241001510071 Pyrrhocoridae Species 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- 206010041660 Splenomegaly Diseases 0.000 description 1
- 102000017299 Synapsin-1 Human genes 0.000 description 1
- 108050005241 Synapsin-1 Proteins 0.000 description 1
- 101710197509 Synapsin-2 Proteins 0.000 description 1
- 102100021994 Synapsin-2 Human genes 0.000 description 1
- 208000012827 T-B+ severe combined immunodeficiency due to gamma chain deficiency Diseases 0.000 description 1
- 101710097834 Thiol protease Proteins 0.000 description 1
- GCXFWAZRHBRYEM-NUMRIWBASA-N Thr-Gln-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O GCXFWAZRHBRYEM-NUMRIWBASA-N 0.000 description 1
- LECUEEHKUFYOOV-ZJDVBMNYSA-N Thr-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](N)[C@@H](C)O LECUEEHKUFYOOV-ZJDVBMNYSA-N 0.000 description 1
- PELIQFPESHBTMA-WLTAIBSBSA-N Thr-Tyr-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 PELIQFPESHBTMA-WLTAIBSBSA-N 0.000 description 1
- 102000044209 Tumor Suppressor Genes Human genes 0.000 description 1
- 108700025716 Tumor Suppressor Genes Proteins 0.000 description 1
- 101150068034 UL30 gene Proteins 0.000 description 1
- 101150099321 UL42 gene Proteins 0.000 description 1
- 108090000848 Ubiquitin Proteins 0.000 description 1
- 102000044159 Ubiquitin Human genes 0.000 description 1
- HGJRMXOWUWVUOA-GVXVVHGQSA-N Val-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N HGJRMXOWUWVUOA-GVXVVHGQSA-N 0.000 description 1
- 208000036142 Viral infection Diseases 0.000 description 1
- 208000023940 X-Linked Combined Immunodeficiency disease Diseases 0.000 description 1
- 201000007146 X-linked severe combined immunodeficiency Diseases 0.000 description 1
- 210000001015 abdomen Anatomy 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 239000004480 active ingredient Substances 0.000 description 1
- 239000002671 adjuvant Substances 0.000 description 1
- 210000001552 airway epithelial cell Anatomy 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000010322 bone marrow transplantation Methods 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 210000004413 cardiac myocyte Anatomy 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 239000011248 coating agent Substances 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000001066 destructive effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 239000003085 diluting agent Substances 0.000 description 1
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 1
- 150000002016 disaccharides Chemical class 0.000 description 1
- 239000002552 dosage form Substances 0.000 description 1
- 238000012377 drug delivery Methods 0.000 description 1
- 230000002526 effect on cardiovascular system Effects 0.000 description 1
- 229940012882 elaprase Drugs 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000001952 enzyme assay Methods 0.000 description 1
- YQGOJNYOYNNSMM-UHFFFAOYSA-N eosin Chemical compound [Na+].OC(=O)C1=CC=CC=C1C1=C2C=C(Br)C(=O)C(Br)=C2OC2=C(Br)C(O)=C(Br)C=C21 YQGOJNYOYNNSMM-UHFFFAOYSA-N 0.000 description 1
- 210000002919 epithelial cell Anatomy 0.000 description 1
- 230000029142 excretion Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 229950003499 fibrin Drugs 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 230000030279 gene silencing Effects 0.000 description 1
- 150000004676 glycans Chemical class 0.000 description 1
- 101150024875 hbb2 gene Proteins 0.000 description 1
- 230000010370 hearing loss Effects 0.000 description 1
- 231100000888 hearing loss Toxicity 0.000 description 1
- 208000016354 hearing loss disease Diseases 0.000 description 1
- 230000004217 heart function Effects 0.000 description 1
- 210000003709 heart valve Anatomy 0.000 description 1
- 108010037536 heparanase Proteins 0.000 description 1
- 210000003494 hepatocyte Anatomy 0.000 description 1
- 210000000548 hind-foot Anatomy 0.000 description 1
- 102000049157 human CALM1 Human genes 0.000 description 1
- 102000056508 human PLP1 Human genes 0.000 description 1
- 108010072166 idursulfase Proteins 0.000 description 1
- 230000028993 immune response Effects 0.000 description 1
- 238000012744 immunostaining Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 238000001802 infusion Methods 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000007918 intramuscular administration Methods 0.000 description 1
- 238000007912 intraperitoneal administration Methods 0.000 description 1
- 238000007913 intrathecal administration Methods 0.000 description 1
- 238000010253 intravenous injection Methods 0.000 description 1
- 230000002045 lasting effect Effects 0.000 description 1
- 208000032839 leukemia Diseases 0.000 description 1
- 210000003141 lower extremity Anatomy 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 230000036210 malignancy Effects 0.000 description 1
- 210000000274 microglia Anatomy 0.000 description 1
- 238000009126 molecular therapy Methods 0.000 description 1
- 230000003562 morphometric effect Effects 0.000 description 1
- 238000013425 morphometry Methods 0.000 description 1
- 230000004770 neurodegeneration Effects 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 230000000414 obstructive effect Effects 0.000 description 1
- 150000002482 oligosaccharides Polymers 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 210000005105 peripheral blood lymphocyte Anatomy 0.000 description 1
- 230000002688 persistence Effects 0.000 description 1
- 230000003094 perturbing effect Effects 0.000 description 1
- 229940124531 pharmaceutical excipient Drugs 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 239000002953 phosphate buffered saline Substances 0.000 description 1
- 230000006461 physiological response Effects 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 230000000069 prophylactic effect Effects 0.000 description 1
- 230000017854 proteolysis Effects 0.000 description 1
- 238000004451 qualitative analysis Methods 0.000 description 1
- 239000013608 rAAV vector Substances 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 208000023504 respiratory system disease Diseases 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 208000002491 severe combined immunodeficiency Diseases 0.000 description 1
- 210000003625 skull Anatomy 0.000 description 1
- 201000002859 sleep apnea Diseases 0.000 description 1
- 210000004988 splenocyte Anatomy 0.000 description 1
- 238000007920 subcutaneous administration Methods 0.000 description 1
- 238000010254 subcutaneous injection Methods 0.000 description 1
- 239000007929 subcutaneous injection Substances 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 230000008961 swelling Effects 0.000 description 1
- 230000008719 thickening Effects 0.000 description 1
- 230000000699 topical effect Effects 0.000 description 1
- 238000003146 transient transfection Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- 238000007492 two-way ANOVA Methods 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 230000009385 viral infection Effects 0.000 description 1
- 230000003442 weekly effect Effects 0.000 description 1
- 239000000080 wetting agent Substances 0.000 description 1
- 210000000216 zygoma Anatomy 0.000 description 1
Images
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/005—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
- A61K38/16—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- A61K38/43—Enzymes; Proenzymes; Derivatives thereof
- A61K38/46—Hydrolases (3)
- A61K38/465—Hydrolases (3) acting on ester bonds (3.1), e.g. lipases, ribonucleases
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P43/00—Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y301/00—Hydrolases acting on ester bonds (3.1)
- C12Y301/06—Sulfuric ester hydrolases (3.1.6)
- C12Y301/06013—Iduronate-2-sulfatase (3.1.6.13)
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2217/00—Genetically modified animals
- A01K2217/07—Animals genetically altered by homologous recombination
- A01K2217/075—Animals genetically altered by homologous recombination inducing loss of function, i.e. knock out
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2217/00—Genetically modified animals
- A01K2217/07—Animals genetically altered by homologous recombination
- A01K2217/075—Animals genetically altered by homologous recombination inducing loss of function, i.e. knock out
- A01K2217/077—Animals genetically altered by homologous recombination inducing loss of function, i.e. knock out heterozygous knock out animals displaying phenotype
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2227/00—Animals characterised by species
- A01K2227/10—Mammal
- A01K2227/105—Murine
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2267/00—Animals characterised by purpose
- A01K2267/03—Animal model, e.g. for test or diseases
- A01K2267/0306—Animal model for genetic diseases
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
- C12N2750/14143—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14151—Methods of production or purification of viral material
- C12N2750/14152—Methods of production or purification of viral material relating to complementing cells and packaging systems for producing virus or viral particles
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/008—Vector systems having a special element relevant for transcription cell type or tissue specific enhancer/promoter combination
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/50—Vector systems having a special element relevant for transcription regulating RNA stability, not being an intron, e.g. poly A signal
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Medicinal Chemistry (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Biochemistry (AREA)
- Veterinary Medicine (AREA)
- Public Health (AREA)
- Animal Behavior & Ethology (AREA)
- Pharmacology & Pharmacy (AREA)
- Microbiology (AREA)
- Epidemiology (AREA)
- Physics & Mathematics (AREA)
- Virology (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Immunology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Gastroenterology & Hepatology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
- Enzymes And Modification Thereof (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
Abstract
세포에서 IDS 유전자 기능을 복원할 수 있는 아데노-연관 바이러스(AAV) 조성물, 및 IDS 유전자 기능의 감소와 연관된 장애(예를 들어, 헌터 증후군)를 치료하기 위해 이러한 AAV 조성물을 사용하는 방법이 제공된다. 또한, AAV 조성물을 제조하기 위한 조성물, 시스템 및 방법이 제공된다.
Description
관련 출원
본 출원은 2020년 4월 6일에 출원된 미국 특허 가출원 제63/005,833호, 2020년 10월 21일에 출원된 제63/094,800호, 및 2021년 2월 3일에 출원된 제63/145,258호에 대한 우선권을 주장하며, 이의 전체 개시 내용은 본원에 참조로서 통합된다.
서열 목록
본 출원은 ASCII 포맷으로 전자 제출된 서열 목록을 포함하며, 그 전체가 본원에 참조로서 통합된다(전술한 ASCII 사본은 2021년 3월 30일에 생성되었고, "404217-HMW-037WO(182710)SL.txt"로 명명되며, 크기는 217,283바이트임).
헌터 증후군, 또는 뮤코다당류증 II(mcocopolysaccharidosis II, MPS II)는 치명적인 리소좀 축적 장애로서, 기대 수명을 10 내지 20년 심각하게 감소시키며 충족되지 않은 의학적 요구가 높다. 이 질환은 주로 남성에게 영향을 미치고, 글리코사미노글리칸(GAG)으로도 알려진 특정 뮤코다당류를 분해하고 재활용하는 신체의 능력을 방해하는 희귀한 X-연관 유전 장애이다. 헌터 증후군은 GAG, 헤파란 설페이트및 더마탄 설페이트의 단계적 분해에 필수적인 리소좀 효소인 이두로네이트-2-설파타제(IDS)의 유전자 결함에 의해 야기된다. IDS 결함은 신체 전반에 걸쳐 GAG를 세포 내에 축적시켜 특정 세포 및 기관의 적절한 기능을 방해한다. GAG의 축적이 계속됨에 따라, 헌터 증후군의 징후 및 증상이 더 잘 보이게 된다. 여기에는 뚜렷한 안면 특징, 큰 머리, 복부 비대, 난청, 심장 기능 저하를 야기하는 심장 판막의 비후화, 폐쇄성 기도 질환, 수면 무호흡증, 운동 범위 및 이동성 감소, 간 및 비장 비대를 포함할 수 있다. 헌터 증후군 환자의 2/3는 중추 신경계(CNS) 질환이 발생하여 신경인지 및 행동의 이상을 초래한다. 2 내지 4세 정도의 아동은 거친 안면 특징, 골격 이상, 장기 비대(특히, 간) 및 인지 장애를 동반한 심혈관 합병증과 같은 증상을 나타낼 수 있다. 미국에서 헌터 증후군의 질병 발생률은 1:130,000이다.
현재, 헌터 증후군은 몇 가지 다른 치료로 관리할 수 있다. 치료는 골수 이식 및 효소 대체 요법(ERT)을 포함한다. ERT는 엘라프라제(Elaprase)와 같은 정기적인 투여를 필요로 하는데, 엘라프라제는 1~8시간 동안 지속되는 주입으로 매주 투여되야 한다. 승인된 ERT 치료는 헌터 환자의 2/3와 관련된 신경퇴행을 치료하기에는 불충분하다. 혈액 뇌 장벽을 통과하도록 조작된 항체와 IDS의 융합 단백질인 SHP631과 같은 다른 ERT 치료는 여전히 임상 시험 단계에 있다. 다른 치료는, IDS 유전자와 함께 형질도입된 말초 혈액 림프구의 확장을 포함하는 생체 외 유전자 요법을 포함하며, 이는 인지 질환 환자에게 권장되지 않는 접근법이다. 몇 가지 다른 치료 옵션이 있음에도 불구하고, 헌터 증후군에 대한 치유법은 없다.
유전자 요법은 헌터 증후군을 치유할 기회를 제공한다. 렌티바이러스 벡터를 포함하는 레트로바이러스 벡터는 핵산을 숙주 세포 게놈 내로 통합시킬 수 있어, 게놈 내로의 비표적화된 삽입으로 인한 안전성 우려를 제기할 수 있다. 예를 들어, 벡터는 종양 억제 유전자를 교란시키거나 종양 유전자를 활성화시켜 악성 종양을 유발할 위험이 있다. 실제로, CD34+ 골수 전구체를 감마레트로바이러스 벡터로 형질도입함으로써 X-연관 중증 복합 면역결핍(SCID)을 치료하기 위한 임상시험에서, 10명의 환자 중 4명에서 백혈병이 발생했다(Hacein-Bey-Abina 등의 문헌[J Clin Invest. (2008) 118(9):3132-42], 그 전체가 참조로서 본원에 포함됨). 반면, 비통합 벡터는 종종 생체 내 불충분한 발현 수준 또는 부적절한 발현 지속시간을 경험한다.
따라서, 헌터 증후군 환자에서 IDS 유전자 기능을 효율적이고 안전하게 복원할 수 있는 개선된 유전자 요법 조성물 및 방법이 당업계에 필요하다.
본원에서는, 세포에서 IDS 유전자 기능을 복원할 수 있는 아데노-연관 바이러스(AAV) 조성물, 및 IDS 유전자 기능의 감소와 연관된 장애(예를 들어, 헌터 증후군)를 치료하기 위해 이를 사용하는 방법이 제공된다. 또한, AAV 조성물을 제조하기 위한 조성물, 시스템 및 방법이 제공된다.
따라서, 일 양태에서, 본 개시는 (a) AAV 캡시드 단백질을 포함하는 AAV 캡시드; 및 (b) 인트론을 포함하는 이두로네이트-2-설파타제(IDS) 인트론 삽입 암호화 서열에 작동가능하게 연결된 전사 조절 요소를 포함하는 rAAV 게놈을 포함하는, 재조합 아데노-연관 바이러스(rAAV)를 제공한다.
특정 구현예에서, IDS 인트론-삽입 암호화 서열은 인간 IDS 단백질을 암호화한다. 특정 구현예에서, IDS 인트론-삽입 암호화 서열은 서열번호 23에 제시된 아미노산 서열을 암호화한다.
특정 구현예에서, 인트론은 이종 인트론이다. 특정 구현예에서, 인트론은 서열번호 33에 제시된 뉴클레오티드 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 서열 동일성을 갖는다.
특정 구현예에서, 인트론은 서열번호 24에 제시된 IDS 암호화 서열의 708 및 709 위치에 상응하는 IDS 인트론-삽입 암호화 서열 내 뉴클레오티드 사이에 위치한다. 특정 구현예에서, IDS 인트론-삽입 암호화 서열은 서열번호 25, 59 또는 60에 제시된 뉴클레오티드 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 서열 동일성을 갖는 뉴클레오티드 서열을 포함한다.
특정 구현예에서, 인트론은 서열번호 26에 제시된 IDS 암호화 서열의 580 및 581 위치에 상응하는 IDS 인트론-삽입 암호화 서열 내 뉴클레오티드 사이에 위치한다. 특정 구현예에서, IDS 인트론-삽입 암호화 서열은 서열번호 27에 제시된 뉴클레오티드 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 서열 동일성을 갖는 뉴클레오티드 서열을 포함한다.
특정 구현예에서, IDS 인트론-삽입 암호화 서열은 서열번호 25, 27, 59, 또는 60에 제시된 뉴클레오티드 서열을 포함한다.
특정 구현예에서, 전사 조절 요소는 거대세포바이러스(CMV) 인핸서 요소, 거대세포바이러스(CMV) 프로모터, 닭-β-액틴(CBA) 프로모터, 작은 닭-β-액틴(SmCBA) 프로모터, 글리세르알데히드 3-포스페이트 탈수소효소(GAPDH) 프로모터, 베타-글루쿠로니다아제(GUSB) 프로모터, 변형 인간 EF-1 프로모터, CALM1 프로모터, 합성 프로모터 및 이들의 임의의 조합으로 이루어진 군으로부터 선택된 하나 이상의 요소를 포함한다.
특정 구현예에서, 전사 조절 요소는 서열번호 29, 30, 36, 39, 40, 41, 42, 44, 46, 47, 48, 또는 55에 제시된 뉴클레오티드 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 서열 동일성을 갖는 뉴클레오티드 서열을 포함한다. 특정 구현예에서, 전사 조절 요소는 서열번호 29에 제시된 뉴클레오티드 서열을 포함한다.
특정 구현예에서, rAAV 게놈은 IDS 인트론-삽입 암호화 서열 3'에 폴리아데닐화 서열을 추가로 포함한다. 특정 구현예에서, 폴리아데닐화 서열은 외인성 폴리아데닐화 서열이다. 특정 구현예에서, 외인성 폴리아데닐화 서열은 SV40 폴리아데닐화 서열이다. 특정 구현예에서, SV40 폴리아데닐화 서열은 서열번호 45에 제시된 뉴클레오티드 서열을 포함한다.
특정 구현예에서, rAAV 게놈은 서열번호 37, 43, 52, 54, 61, 63, 65, 69, 75, 또는 77에 제시된 뉴클레오티드 서열을 포함한다.
특정 구현예에서, rAAV 게놈은 5' 역위 말단 반복(5' ITR) 뉴클레오티드 및 3' 역위 말단 반복(3' ITR) 뉴클레오티드 서열을 추가로 포함한다. 특정 구현예에서, 5' ITR 뉴클레오티드 서열은 서열번호 18, 20 또는 49와 적어도 95%의 서열 동일성을 갖고, 3' ITR 뉴클레오티드 서열은 서열번호 14, 19, 21, 또는 51과 적어도 95%의 서열 동일성을 갖는다.
특정 구현예에서, 5' ITR 뉴클레오티드 서열은 서열번호 18과 적어도 80%의 서열 동일성을 갖고, 3' ITR 뉴클레오티드 서열은 서열번호 14와 적어도 80%의 서열 동일성을 갖는다. 특정 구현예에서, 5' ITR 뉴클레오티드 서열은 서열번호 18에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 가지며, 3' ITR 뉴클레오티드 서열은 서열번호 19에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는다. 특정 구현예에서, 5' ITR 뉴클레오티드 서열은 서열번호 18과 적어도 80%의 서열 동일성을 갖고, 3' ITR 뉴클레오티드 서열은 서열번호 51과 적어도 80%의 서열 동일성을 갖는다. 특정 구현예에서, 5' ITR 뉴클레오티드 서열은 서열번호 49에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 가지며, 3' ITR 뉴클레오티드 서열은 서열번호 14에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는다. 특정 구현예에서, 5' ITR 뉴클레오티드 서열은 서열번호 49에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 가지며, 3' ITR 뉴클레오티드 서열은 서열번호 19에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는다. 특정 구현예에서, 5' ITR 뉴클레오티드 서열은 서열번호 49에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 가지며, 3' ITR 뉴클레오티드 서열은 서열번호 51에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는다. 특정 구현예에서, 5' ITR 뉴클레오티드 서열은 서열번호 20에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 가지며, 3' ITR 뉴클레오티드 서열은 서열번호 21에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는다. 특정 구현예에서, 5' ITR 뉴클레오티드 서열 및 3' ITR 뉴클레오티드는 각각 서열번호 18 및 14; 18 및 19; 18 및 51; 49 및 14; 49 및 19; 40 및 51; 또는 20 및 21의 서열을 포함한다.
특정 구현예에서, rAAV 게놈은 서열번호 28, 38, 50, 53, 56, 57, 58, 62, 64, 66, 70, 71, 72, 73, 또는 74에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, rAAV 게놈은 서열번호 72 및 74; 72 및 28; 73 및 74; 또는 73 및 28에 제시된 뉴클레오티드 서열을 포함한다.
특정 구현예에서, rAAV 게놈은 서열번호 38, 50, 62, 64, 66, 70, 76, 또는 78에 제시된 뉴클레오티드 서열을 포함한다.
특정 구현예에서, AAV 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 203 내지 736의 아미노산 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함한다. 특정 구현예에서, 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질 내의 아미노산이 C이거나; 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 내의 아미노산이 H이거나; 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질 내의 아미노산이 Q이거나; 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 내의 아미노산이 A이거나; 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 내의 아미노산이 N이거나; 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질 내의 아미노산이 S이거나; 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 내의 아미노산이 I이거나; 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 내의 아미노산이 G 또는 Y이거나; 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 내의 아미노산이 M이거나; 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질 내의 아미노산이 K이거나; 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 내의 아미노산이 C이거나; 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 내의 아미노산이 G이다.
특정 구현예에서, (a) 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 내의 아미노산이 G이고, 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 내의 아미노산이 G이거나; (b) 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 내의 아미노산이 H이고, 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 내의 아미노산이 N이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산이 R이고, 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 내의 아미노산이 M이거나; (c) 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산이 R이고, 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; (d) 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 내의 아미노산은이 A이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; (e) 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 내의 아미노산이 I이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산은 R이고, 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 내의 아미노산이 C이다.
특정 구현예에서, 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 203 내지 736의 아미노산 서열을 포함한다.
특정 구현예에서, AAV 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 138 내지 736의 아미노산 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함한다. 특정 구현예에서, 서열번호 16의 아미노산 151에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 서열번호 16의 아미노산 160에 상응하는 캡시드 단백질 내의 아미노산이 D이거나; 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질 내의 아미노산이 C이거나; 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 내의 아미노산이 H이거나; 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질 내의 아미노산이 Q이거나; 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 내의 아미노산이 A이거나; 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 내의 아미노산이 N이거나; 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질 내의 아미노산이 S이거나; 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 내의 아미노산이 I이거나; 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 내의 아미노산이 G 또는 Y이거나; 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 내의 아미노산이 M이거나; 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질 내의 아미노산이 K이거나; 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 내의 아미노산이 C이거나; 또는 상기 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 내의 아미노산은 G이다.
특정 구현예에서, (a) 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 내의 아미노산이 G이고, 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 내의 아미노산이 G이거나; (b) 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 내의 아미노산이 H이고, 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 내의 아미노산이 N이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산이 R이고, 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 내의 아미노산이 M이거나; (c) 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산이 R이고, 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; (d) 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 내의 아미노산은이 A이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; (e) 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 내의 아미노산이 I이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산은 R이고, 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 내의 아미노산이 C이다.
특정 구현예에서, 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 138 내지 736의 아미노산 서열을 포함한다.
특정 구현예에서, AAV 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 1 내지 736의 아미노산 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함한다. 특정 구현예에서, 서열번호 16의 아미노산 2에 상응하는 캡시드 단백질 내의 아미노산이 T이거나; 서열번호 16의 아미노산 65에 상응하는 캡시드 단백질 내의 아미노산이 I이거나; 서열번호 16의 아미노산 68에 상응하는 캡시드 단백질 내의 아미노산이 V이거나; 서열번호 16의 아미노산 77에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 서열번호 16의 아미노산 119에 상응하는 캡시드 단백질 내의 아미노산이 L이거나; 서열번호 16의 아미노산 151에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 서열번호 16의 아미노산 160에 상응하는 캡시드 단백질 내의 아미노산이 D이거나; 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질 내의 아미노산이 C이거나; 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 내의 아미노산이 H이거나; 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질 내의 아미노산이 Q이거나; 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 내의 아미노산이 A이거나; 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 내의 아미노산이 N이거나; 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질 내의 아미노산이 S이거나; 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 내의 아미노산이 I이거나; 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 내의 아미노산이 G 또는 Y이거나; 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 내의 아미노산이 M이거나; 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질 내의 아미노산이 K이거나; 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 내의 아미노산이 C이거나; 또는 상기 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 내의 아미노산은 G이다.
특정 구현예에서, (a) 서열번호 16의 아미노산 2에 상응하는 캡시드 단백질 내의 아미노산이 T이고, 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질 내의 아미노산이 Q이거나; (b) 서열번호 16의 아미노산 65에 상응하는 캡시드 단백질 내의 아미노산이 I이고, 상기 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 내의 아미노산이 Y이거나; (c) 서열번호 16의 아미노산 77에 상응하는 캡시드 단백질 내의 아미노산이 R이고, 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질 내의 아미노산이 K이거나; (d) 서열번호 16의 아미노산 119에 상응하는 캡시드 단백질 내의 아미노산이 L이고, 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질 내의 아미노산이 S이거나; (e) 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 내의 아미노산이 G이고, 상기 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 내의 아미노산이 G이거나; (f) 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 내의 아미노산이 H이고, 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 내의 아미노산이 N이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산이 R이고, 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 내의 아미노산이 M이거나; (g) 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산이 R이고, 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; (h) 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 내의 아미노산이 A이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; (i) 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 내의 아미노산이 I이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산은 R이고, 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 내의 아미노산은 C이다.
특정 구현예에서, 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 1 내지 736의 아미노산 서열을 포함한다.
또 다른 양태에서, 본 개시는 세포에서 이두로네이트-2-설파타제(IDS) 폴리펩티드를 발현하기 위한 방법을 제공하며, 이러한 방법은 세포를 본원에 기술된 바와 같은 재조합 아데노-연관 바이러스(rAAV)로 형질도입하는 단계를 포함한다.
특정 구현예에서, 세포는 중추 신경계의 세포이다. 특정 구현예에서, 세포는 척수, 운동 피질, 감각 피질, 해마, 피각, 소뇌, 선택적으로 소뇌 핵, 및 임의의 이의 조합으로 이루어진 군으로부터 선택된 중추 신경계 영역의 세포이다. 특정 구현예에서, 세포는 뉴런 및/또는 신경교세포이되, 선택적으로 이러한 세포는 중추 신경계 및/또는 말초 신경계의 뉴런 및/또는 신경교세포이다. 특정 구현예에서, 세포는 운동 뉴런, 성상교세포, 희소돌기교세포, 중추 신경계의 대뇌 피질의 세포, 말초 신경계의 감각 뉴런, 슈반(Schwann) 세포, 및 이들의 임의의 조합으로 이루어진 군으로부터 선택된 세포이다.
특정 구현예에서, 세포는 간의 세포이다. 특정 구현예에서, 세포는 심장의 세포이다. 특정 구현예에서, 세포는 폐의 세포이다. 특정 구현예에서, 세포는 신장의 세포이다. 특정 구현예에서, 세포는 비장의 세포이다.
특정 구현예에서, 세포는 포유류 대상체에 존재하고, rAAV는 대상체에서 세포를 형질도입하기에는데데 효과적인 양으로 대상체에게 투여된다.
또 다른 양태에서, 본 개시는 본원에 기술된 rAAV를 포함하는 약학적 조성물을 제공한다.
또 다른 양태에서, 본 개시는 헌터 증후군(HS)을 가진 대상체를 치료하기 위한 방법을 제공하며, 이러한 방법은 유효량의 본원에 기술된 rAAV, 또는 본원에 기술된 약학적 조성물을 대상체에게 투여하는 단계를 포함한다.
특정 구현예에서, rAAV 또는 약학적 조성물은 정맥내 투여된다.
특정 구현예에서, 헌터 증후군(HS)은 이두로네이트-2-설파타제(IDS) 유전자 돌연변이와 연관된다.
특정 구현예에서, 대상체는 인간 대상체이다.
또 다른 양태에서, 본 개시는 rAAV의 제조를 위한 패키징 시스템을 제공하며, 여기서 패키징 시스템은 (a) 하나 이상의 AAV Rep 단백질을 암호화하는 제1 뉴클레오티드 서열; (b) 본원에 기술된 바와 같은 rAAV의 캡시드 단백질을 암호화하는 제2 뉴클레오티드 서열; 및 (c) 본원에 기술된 바와 같은 rAAV의 rAAV 게놈 서열을 포함하는 제3 뉴클레오티드 서열을포함한다.
특정 구현예에서, 패키징 시스템은 제1 뉴클레오티드 서열 및 제2 뉴클레오티드 서열을 포함하는 제1 벡터, 및 제3 뉴클레오티드 서열을 포함하는 제2 벡터를 포함한다.
특정 구현예에서, 패키징 시스템은 하나 이상의 헬퍼 바이러스 유전자를 포함하는 제4 뉴클레오티드 서열을 추가로 포함한다. 특정 구현예에서, 제4 뉴클레오티드 서열은 제3 벡터 내에 포함된다. 특정 구현예에서, 제4 뉴클레오티드 서열은 아데노바이러스, 포진 바이러스, 우두 바이러스, 및 거대세포 바이러스(CMV)로 이루어진 군으로부터 선택된 바이러스로부터 유래한 하나 이상의 유전자를 포함한다.
특정 구현예에서, 제1 벡터, 제2 벡터, 및/또는 제3 벡터는 플라스미드이다.
또 다른 양태에서, 본 개시는 rAAV의 재조합 제조 방법을 제공하며, 이러한 방법은 rAAV가 생산되는 조건 하에서 본원에 기술된 패키징 시스템을 세포에 도입하는 단계를 포함한다.
또 다른 양태에서, 본 개시는 서열번호 25, 26, 27, 37, 38, 43, 50, 52, 53, 54, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 75, 76, 77, 또는 78에 제시된 뉴클레오티드 서열과 적어도 80%, 81%, 82%, 83%, 84%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함하는 폴리뉴클레오티드를 제공한다. 특정 구현예에서, 폴리뉴클레오티드는 서열번호 25, 26, 27, 37, 38, 43, 50, 52, 53, 54, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 75, 76, 77, 또는 78에 제시된 핵산 서열을 포함한다. 특정 구현예에서, 폴리뉴클레오티드는 벡터, 선택적으로는 바이러스 벡터(예를 들어, AAV 벡터, 레트로바이러스 벡터, 또는 아데노바이러스 벡터) 또는 플라스미드 벡터 내에 포함된다. 또 다른 양태에서, 본 개시는 전술한 폴리뉴클레오티드를 포함하는 재조합 세포를 제공한다.
또 다른 양태에서, 본 개시는 의약으로서 사용하기 위한, 본원에 기술된 바와 같은 rAAV, 본원에 기술된 바와 같은 약학적 조성물, 본원에 기술된 바와 같은 폴리뉴클레오티드, 또는 본원에 기술된 바와 같은 재조합 세포를 제공한다.
또 다른 양태에서, 본 개시는 헌터 증후군(HS)의 치료에 사용하기 위한, 본원에 기술된 바와 같은 rAAV, 본원에 기술된 바와 같은 약학적 조성물, 본원에 기술된 바와 같은 폴리뉴클레오티드, 또는 본원에 기술된 바와 같은 재조합 세포를 제공한다.
또 다른 양태에서, 본 개시는 헌터 증후군(HS)을 가진 대상체를 치료하는 방법에 사용하기 위한, 본원에 기술된 바와 같은 rAAV, 본원에 기술된 바와 같은 약학적 조성물, 본원에 기술된 바와 같은 폴리뉴클레오티드, 또는 본원에 기술된 바와 같은 재조합 세포를 제공하며, 이러한 방법은 유효량의 rAAV, 약학적 조성물, 폴리뉴클레오티드, 또는 세포를 대상체에게 투여하는 단계를 포함한다.
도 1a, 1b, 1c, 1d, 및 1e는 각각 pHM-05205, pHM-05213, pHM-05214, pHM-05216, 및 pHM-05217 벡터의 벡터 맵이다.
도 2a 및 2b. 도 2a는 투여 후 4주차에 야생형 및 Ids KO 반접합체 마우스의 간에서 형질도입된 세포의 DNA의 ng당 벡터 게놈의 수를 보여주는 그래프이다. 도 2b는 투여 후 4주차에 야생형 및 Ids KO 반접합체 마우스의 간에서 nmol/hr/mg의 단백질로 표현된 I2S 활성을 나타내는 그래프이다. 도 2a 및 2b에서, WT는 미치료 야생형 마우스를 지칭하며; MPS II는 미치료 Ids KO 반접합체 마우스를 지칭하고; AAV9-hIDS는 AAV9 캡시드에 2e13 vg/kg의 투여량으로 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스를 지칭하며; HSC15-hIDS는 AAVHSC15 캡시드에 2e13 vg/kg의 투여량으로 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스를 지칭한다. 도 2b에서, 인간 간은 정상 인간 간에서 대표적인 I2S 활성 수준을 지칭한다. *는 p<0.05의 통계적 유의성을 나타낸다; WT와 비교해 ***는 p<0.001의 통계적 유의성을 나타내고, ****는 p<0.0001의 통계적 유의성을 나타낸다. 미치료 마우스는 비히클이 투여된 마우스를 지칭한다.
도 3a 및 3b. 도 3a는 투여 후 4주차에 야생형 및 Ids KO 반접합체 마우스의 뇌(전뇌, 중뇌 및 후뇌)에서 형질도입된 세포의 DNA의 ng당 벡터 게놈의 수를 보여주는 그래프이다. 도 3b는 투여 후 4주차에 야생형 및 Ids KO 반접합체 마우스의 전뇌에서, nmol/hr/mg의 단백질로 표현된 I2S 활성을 보여주는 그래프이다. 도 3a 및 3b에서, WT는 미치료 야생형 마우스를 지칭하며; MPS II는 미치료 Ids KO 반접합체 마우스를 지칭하고; AAV9-hIDS는 AAV9 캡시드에 2e13 vg/kg의 투여량으로 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스를 지칭하며; HSC15-hIDS는 AAVHSC15 캡시드에 2e13 vg/kg의 투여량으로 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스를 지칭한다. 도 3b에서, 인간 뇌는 정상 성인 인간 뇌에서 대표적인 I2S 활성 수준을 지칭한다. n.s는 유의하지 않음을 나타낸다. 미치료 마우스는 비히클이 투여된 마우스를 지칭한다.
도 4a 및 4b. 도 4a는, 투여 후 4주차에, 마우스 간 내 대표적인 야생형 I2S 활성 수준의 백분율로 표현된, 2e13 vg/kg의 투여량으로 AAV9 캡시드(AAV9-hIDS)에 패키징된 pHM-05205 또는 2e13 vg/kg의 투여량으로 AAVHSC15 캡시드(HSC15-hIDS)에 패키징된 pHM-05205를 투여한 Ids KO KO 반접합체 마우스의 간에서 검출된 I2S 활성 수준을 보여주는 그래프이다. FIG. 4b는, 투여 후 4주차에, 간 내 대표적인 정상 인간 I2S 활성 수준의 백분율로 표현된, 2e13 vg/kg의 투여량으로 AAV9 캡시드(AAV9-hIDS)에 패키징된 pHM-05205 또는 2e13 vg/kg의 투여량으로 AAVHSC15 캡시드(HSC15-hIDS)에 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스의 간에서 검출된 I2S 활성 수준을 보여주는 그래프이다. 도 4a 및 4b에서, *는 p<0.05의 통계적 유의성을 나타낸다.
도 5a 및 5b. 도 5a는, 마우스 뇌 내 대표적인 야생형 I2S활성 수준의 백분율로 표현된, 투여 후 4주차에 2e13 vg/kg의 투여량으로 AAV9 캡시드(AAV9-hIDS)에 패키징된 pHM-05205 또는 2e13 vg/kg의 투여량으로 AAVHSC15 캡시드(HSC15-I2S)에 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스의 뇌에서 검출된 I2S 활성 수준을 보여주는 그래프이다. FIG. 5b는, 뇌 내 대표적인 정상 인간 I2S 활성 수준의 백분율로 표현된, 투여 후 4주차에, 2e13 vg/kg의 투여량으로 AAV9 캡시드(AAV9-hIDS)에 패키징된 pHM-05205 또는 2e13 vg/kg의 투여량으로 AAVHSC15 캡시드(HSC15-hIDS)에 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스의 뇌에서 검출된 I2S 활성 수준을 보여주는 그래프이다.
도 6a, 6b, 및 6c. 도 6a는 투여 후 4주차에 야생형 및 Ids KO 반접합체 마우스의 간에서 검출된 GAG 수준을 보여주는 그래프이다. 도 6b는 투여 후 4주차에 야생형 및 Ids KO 반접합체 마우스의 뇌에서 검출된 GAG 수준을 보여주는 그래프이다. 도 6c는 투여 후 4주차에 야생형 및 Ids KO 반접합체 마우스의 소변에서 검출된 GAG 수준을 보여주는 그래프이다. 도 6a, 6b, 및 6c에서, WT는 미치료 야생형 마우스를 지칭하며; MPS II는 미치료 Ids KO 반접합체 마우스를 지칭하고; AAV9-hIDS는 AAV9 캡시드에 2e13 vg/kg의 투여량으로 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스를 지칭하며; HSC15-hIDS는 AAVHSC15 캡시드에 2e13 vg/kg의 투여량으로 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스를 지칭한다. 도 6a에서, 인간 간은 인간 간에서 대표적인 GAG 수준을 지칭한다. 도 6b에서, 인간 뇌는 인간 뇌에서 대표적인 GAG 수준을 지칭한다. 도 6a~6c에서, *는 p<0.05의 통계적 유의성을 나타내고, **는 p<0.01의 통계적 유의성을 나타낸다. 미치료 마우스는 비히클이 투여된 마우스를 지칭한다.
도 7a 및 7b. 도 7a는 투여 후 4주차에, 마우스 GAPDH의 발현 수준에 대해 정규화된, 야생형 및 Ids KO 반접합체 마우스의 간에서 hIDS의 발현을 보여주는 그래프이다. 도 7b는 투여 후 4주차에, 마우스 GAPDH의 발현 수준에 대해 정규화된, 야생형 및 Ids KO 반접합체 마우스의 뇌에서 hIDS의 발현을 보여주는 그래프이다. 도 7a 및 7b에서, WT는 미치료 야생형 마우스를 지칭하며; MPS II는 미치료 Ids KO 반접합체 마우스를 지칭하고; AAV9-hIDS는 AAV9 캡시드에 2e13 vg/kg의 투여량으로 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스를 지칭하며; HSC15-hIDS는 AAVHSC15 캡시드에 2e13 vg/kg의 투여량으로 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스를 지칭한다. 도 7b에서, 인간 뇌는 성인 정상 인간 뇌에서의 대표적인 IDS 발현 수준을 지칭한다. 미치료 마우스는 비히클이 투여된 마우스를 지칭한다.
도 8a, 8b, 및 8c. 도 8a는 시간에 따라, 야생형 및 Ids KO 반접합체 마우스의 소변에서 검출된 총 GAG 수준을 보여주는 그래프이다. 도 8b는 투여 후 12주차에 야생형 및 Ids KO 반접합체 마우스의 간에서 검출된 GAG 수준을 보여주는 그래프이다. 도 8c는 투여 후 12주차에 야생형 및 Ids KO 반접합체 마우스의 간에서 nmol/hr/mg의 단백질로 표현된 I2S 활성을 나타내는 그래프이다. 도 8a, 8b, 및 8c에서, WT는 미치료 야생형 마우스를 지칭하며; MPS II는 미치료 Ids KO 반접합체 마우스를 지칭하고; HSC15-hIDS는 AAVHSC15 캡시드에 2e13 vg/kg의 투여량으로 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스를 지칭한다. 도 8a~8c에서, ***는 p<0.001의 통계적 유의성을 나타내고, ****는 p<0.0001의 통계적 유의성을 나타낸다. 미치료 마우스는 비히클이 투여된 마우스를 지칭한다.
도 9a, 9b, 및 9c. 도 9a는 투여 후 12주차에 야생형 및 Ids KO 반접합체 마우스의 뇌에서 검출된 GAG 수준을 보여주는 그래프이다. 도 9b는 투여 후 12주차에 야생형 및 Ids KO 반접합체 마우스의 뇌에서 nmol/hr/mg의 단백질로서 표현된 I2S 활성을 나타내는 그래프이다. 도 9a 및 9b에서, *는 p<0.05의 통계적 유의성을 나타내고, **는 p<0.01의 통계적 유의성을 나타낸다. 도 9c는, 대표적인 야생형 마우스 I2S 활성의 백분율로서 표현된, 투여 후 12주차에 야생형 및 Ids KO 반접합체 마우스의 뇌에서의 I2S 활성을 나타내는 그래프이다. 도 9a, 9b, 및 9c에서, WT는 미치료 야생형 마우스를 지칭하며; MPS II는 미치료 Ids KO 반접합체 마우스를 지칭하고; HSC15-hIDS는 AAVHSC15 캡시드에 2e13 vg/kg의 투여량으로 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스를 지칭한다. 미치료 마우스는 비히클이 투여된 마우스를 지칭한다.
도 10a, 10b, 10c, 및 10d는 각각 T-004, T-005, 및 T-006 벡터의 벡터 맵이다.
도 11a 및 11b. 도 11a는 투여 후 4주차에 야생형 및 Ids KO 반접합체 마우스의 소변에서 검출된 총 GAG 수준을 보여주는 그래프이다. 도 11b는 투여 후 4주차에 야생형 및 Ids KO 반접합체 마우스에서 검출된 nmol/hr/ml로 표현된 혈청 I2S 활성을 보여주는 그래프이다. 도 11a 및 11b에서, WT는 미치료 야생형 마우스를 지칭하며; MPS II는 미치료 Ids KO 반접합체 마우스를 지칭하고; AAV9-hIDS는 AAV9 캡시드에 2e13 vg/kg의 투여량으로 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스를 지칭하며; HSC15-hIDS는 AAVHSC15 캡시드에 2e13 vg/kg의 투여량으로 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스를 지칭하며; HSC15-T-004는 AAVHSC15 캡시드에 2e13 vg/kg의 투여량으로 패키징된 T-004를 투여한 Ids KO 반접합체 마우스를 지칭하고; HSC15-T-005는 AAVHSC15 캡시드에 2e13 vg/kg의 투여량으로 패키징된 T-005를 투여한 Ids KO 반접합체 마우스를 지칭하며; HSC15-T-006은 AAVHSC15 캡시드에 2e13 vg/kg의 투여량으로 패키징된 T-006을 투여한 Ids KO 반접합체 마우스를 지칭한다. 도 11a 및 11b에서, *는 p<0.05의 통계적 유의성을 나타내고, **는 p<0.01의 통계적 유의성을 나타내며, ***는 p<0.001의 통계적 유의성을 나타내고, ****는 p<0.0001의 통계적 유의성을 나타낸다. 미치료 마우스는 비히클이 투여된 마우스를 지칭한다.
도 12a, 12b, 12c, 및 12d. 도 12a는 투여 후 4주차에 야생형 및 Ids KO 반접합체 마우스의 뇌에서 검출된 GAG 수준을 보여주는 그래프이다. 도 12b는 투여 후 4주차에 야생형 및 Ids KO 반접합체 마우스의 간에서 검출된 GAG 수준을 보여주는 그래프이다. 도 12c는 투여 후 4주차에 야생형 및 Ids KO 반접합체 마우스의 뇌에서 검출된 I2S 활성을 보여주는 그래프이다. 도 12d는 투여 후 4주차에 야생형 및 Ids KO 반접합체 마우스의 간에서 검출된 I2S 활성을 보여주는 그래프이다. 도 12a, 12b, 12c, 및 12d에서, WT는 미치료 야생형 마우스를 지칭하며; MPS II는 미치료 Ids KO 반접합체 마우스를 지칭하고; AAV9-hIDS는 AAV9 캡시드에 2e13 vg/kg의 투여량으로 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스를 지칭하며; HSC15-hIDS는 AAVHSC15 캡시드에 2e13 vg/kg의 투여량으로 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스를 지칭하며; HSC15-T-004는 AAVHSC15 캡시드에 2e13 vg/kg의 투여량으로 패키징된 T-004를 투여한 Ids KO 반접합체 마우스를 지칭하고; HSC15-T-005는 AAVHSC15 캡시드에 2e13 vg/kg의 투여량으로 패키징된 T-005를 투여한 Ids KO 반접합체 마우스를 지칭하며; HSC15-T-006은 AAVHSC15 캡시드에 2e13 vg/kg의 투여량으로 패키징된 T-006을 투여한 Ids KO 반접합체 마우스를 지칭한다. 도 12a, 12b, 및 12d에서, *는 p<0.05의 통계적 유의성을 나타내고, **는 p<0.01의 통계적 유의성을 나타내고, ***는 p<0.001의 통계적 유의성을 나타내고, ****는 p<0.0001의 통계적 유의성을 나타낸다. 미치료 마우스는 비히클이 투여된 마우스를 지칭한다.
도 13a 및 13b는 투여 후 4주까지 야생형 및 Ids KO 반접합체 마우스의 체중을 보여주는 그래프이다. 도 13a 및 13b에서, 그룹 1: 미치료 Ids KO 반접합체 대조군; 그룹 2: AAVHSC15 캡시드에 2.2e13 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스; 그룹 3: AAVHSC15 캡시드에 6.5e13 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스; 그룹 4: AAVHSC15 캡시드에 1.1e14 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스; 그룹 5: 야생형 마우스 대조군; 그룹 6: AAVHSC15 캡시드에 2.2e13 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 야생형 마우스; 및 그룹 7: AAVHSC15 캡시드에 1.1e14 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 야생형 마우스. 미치료 마우스는 비히클이 투여된 마우스를 지칭한다.
도 14a, 14b, 및 14c는 AAVHSC15에 패키징된 pHM-05217을 투여한 야생형 마우스에서 투여량 의존적인 I2S 활성을 보여주는 그래프이다. 도 14a는 투여 후 2주차에 야생형 및 Ids KO 반접합체 마우스에서 검출된 nmol/hr/ml 단위의 혈청 I2S 활성을 보여주는 그래프이다. 도 14b는 투여 후 4주차에 야생형 및 Ids KO 반접합체 마우스에서 검출된 nmol/hr/ml 단위의 혈청 I2S 활성을 보여주는 그래프이다. 도 14c는 투여 후 4주차에 야생형 및 Ids KO 반접합체 마우스의 간에서 nmol/hr/mg 단위의 I2S 활성을 보여주는 그래프이다. 도 14a, 14b, 및 14c에서, WT는 미치료 야생형 마우스를 지칭하며; MPS II는 미치료 Ids KO 반접합체 마우스를 지칭하고; WT - 2.2E+13은 AAVHSC15에 2.2e13 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 야생형 마우스를 지칭한며; WT - 1.1E+14는 AAVHSC15에 1.1e14 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 야생형 마우스를 지칭한다. 미치료 마우스는 비히클이 투여된 마우스를 지칭한다.
도 15a 및 15b. 도 15a는 투여 후 4주차에 야생형 및 반접합체 마우스의 뇌에서 총 GAG 수준을 보여주는 그래프이다. 도 15b는 투여 후 4주차에 야생형 및 반접합체 마우스의 간에서 총 GAG 수준을 보여주는 그래프이다. 도 15a 및 15b에서, WT는 미치료 야생형 마우스를 지칭하며; MPS II는 미치료 Ids KO 반접합체 마우스를 지칭하고; WT - 2.2E+13은 AAVHSC15에 2.2e13 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 야생형 마우스를 지칭한며; WT - 1.1E+14는 AAVHSC15에 1.1e14 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 야생형 마우스를 지칭한다. 도 15a 및 15b에서, ***는 p<0.001의 통계적 유의성을 나타내고, ****는 p<0.0001의 통계적 유의성을 나타낸다. 미치료 마우스는 비히클이 투여된 마우스를 지칭한다.
도 16a 및 16b. 도 16a는 투여 후 4주차에 야생형 및 Ids KO 반접합체 마우스의 뇌에서 IDS의 발현 수준을 보여주는 그래프이다. 도 16b는 투여 후 4주차에 야생형 및 Ids KO 반접합체 마우스의 간에서 IDS의 발현 수준을 보여주는 그래프이다. 도 16a 및 16b에서, WT는 미치료 야생형 마우스를 지칭하며; MPS II는 미치료 Ids KO 반접합체 마우스를 지칭하고; MPS II - 2.2E+13은 AAVHSC15에 2.2e13 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스를 지칭하며; MPS II - 6.5E+13은 AAVHSC15에 6.5e13 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스를 지칭하고; MPS II - 1.1E+14는 AAVHSC15에 1.1e14 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스를 지칭한다. 도 16a 및 16b에서, *는 p<0.05의 통계적 유의성을 나타내고, ***는 p<0.001의 통계적 유의성을 나타낸다. 미치료 마우스는 비히클이 투여된 마우스를 지칭한다.
도 17a 및 17b. 도 17a는 투여 후 2주차에 야생형 및 Ids KO 반접합체 마우스에서 검출된 혈청 I2S 활성을 보여주는 그래프이다. 도 17b는 투여 후 4주차에 야생형 Ids IDS KO 반접합체 마우스에서 검출된 혈청 I2S 활성을 보여주는 그래프이다. 도 17a 및 17b에서, WT는 미치료 야생형 마우스를 지칭하며; MPS II는 미치료 Ids KO 반접합체 마우스를 지칭하고; MPS II - 2.2E+13은 AAVHSC15에 2.2e13 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스를 지칭하며; MPS II - 6.5E+13은 AAVHSC15에 6.5e13 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스를 지칭하고; MPS II - 1.1E+14는 AAVHSC15에 1.1e14 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스를 지칭한다. 도 17a 및 17b에서, **는 p<0.01의 통계적 유의성을 나타내고, ****는 p<0.0001의 통계적 유의성을 나타내고, ns는 유의하지 않음을 나타낸다. 미치료 마우스는 비히클이 투여된 마우스를 지칭한다.
도 18은 투여 후 4주차에 야생형 및 Ids KO 반접합체 마우스의 간에서 검출된 I2S 활성을 보여주는 그래프이다. WT는 미치료 야생형 마우스를 지칭하며; MPS II는 미치료 Ids KO 반접합체 마우스를 지칭하고; MPS II - 2.2E+13은 AAVHSC15에 2.2e13 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스를 지칭하며; MPS II - 6.5E+13은 AAVHSC15에 6.5e13 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스를 지칭하고; MPS II - 1.1E+14는 AAVHSC15에 1.1e14 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스를 지칭한다. 도 18에서, **는 p<0.01의 통계적 유의성을 나타내고, ****는 p<0.0001의 통계적 유의성을 나타낸다. 미치료 마우스는 비히클이 투여된 마우스를 지칭한다.
도 19a 및 19b는, 소변 내 크레아티닌 수준으로 정규화된, 투여 후 2주(도 19a) 및 4주(도 19b)차에 야생형 및 Ids KO 반접합체 마우스의 소변에서 검출된 총 GAG 수준을 보여주는 그래프이다. 도 19c 및 도 19d는 투여 후 4주차에 야생형 마우스 및 Ids KO 반접합체 마우스에서 GAG 헤파란 설페이트(GAG-HS; "HS")(도 19c) 및 GAG 더마탄 설페이트(GAG-DS; "DS")(도 19d)의 수준을 보여주는 그래프이다. WT는 미치료 야생형 마우스를 지칭하며; MPS II는 미치료 Ids KO 반접합체 마우스를 지칭하고; MPS II - 2.2E+13은 AAVHSC15에 2.2e13 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스를 지칭하며; MPS II - 6.5E+13은 AAVHSC15에 6.5e13 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스를 지칭하고; MPS II - 1.1E+14는 AAVHSC15에 1.1e14 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스를 지칭한다. 도 19a~19d에서, ns는 통계적 유의성이 없음을 나타내고, **는 p<0.01의 통계적 유의성을 나타내고, ***는 p<0.001의 통계적 유의성을 나타내고, ****는 p<0.0001의 통계적 유의성을 나타낸다. 미치료 마우스는 비히클이 투여된 마우스를 지칭한다.
도 20a, 20b, 20c, 20d, 20e, 및 20f는 투여 후 4주차에 야생형 및 Ids KO 반접합체 마우스의 간(도 20a), 심장(도 20b), 폐(도 20c), 뇌(도 20d), 신장(도 20e), 및 비장(도 20f)에서 검출된 총 GAG 수준을 보여주는 그래프이다. 도 20a 20b, 20c, 20d, 20e, 및 20f에서, WT는 미치료 야생형 마우스를 지칭하며; MPS II는 미치료 Ids KO 반접합체 마우스를 지칭하고; MPS II - 2.2E+13은 AAVHSC15에 2.2e13 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스를 지칭하며; MPS II - 6.5E+13은 AAVHSC15에 6.5e13 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스를 지칭하고; MPS II - 1.1E+14는 AAVHSC15에 1.1e14 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스를 지칭한다. 도 20a~20f에서, *는 p<0.05의 통계적 유의성을 나타내고, **는 p<0.01의 통계적 유의성을 나타내며, ***는 p<0.001의 통계적 유의성을 나타내고, ****는 p<0.0001의 통계적 유의성을 나타낸다. 미치료 마우스는 비히클이 투여된 마우스를 지칭한다.
도 21a, 21b, 21c, 및 21d. 도 21a는 투여 후 4주차에 표시된 바와 같은 다양한 투여량으로 AAVHSC15에 패키징된 pHM-05217을 투여한 MPS II 마우스의 뇌, 심장, 신장, 간, 폐, 및 비장 조직에서 형질도입된 세포의 DNA ?g당 벡터 게놈의 수를 보여주는 그래프이다. 도 21b는 투여 후 4주차에 다양한 표시된 투여량으로 AAVHSC15에 패키징된 pHM-05217을 투여한 MPS II 마우스의 뇌, 심장, 신장, 간, 폐, 및 비장 조직에서 검출된 정규화된 침묵 변형 hIDS 전사체를 보여주는 그래프이다. 도 21c는 투여 후 4주차에 다양한 표시된 투여량으로 AAVHSC15에 패키징된 pHM-05217을 투여한 MPS II 마우스의 뇌, 신장, 심장, 간, 폐, 및 비장 조직에서 검출된 헤파란 설페이트를 보여주는 그래프이다. 도 21d는 투여 후 4주차에 다양한 표시된 투여량으로 AAVHSC15에 패키징된 pHM-05217을 투여한 MPS II 마우스의 신장, 심장, 간, 및 폐 조직에서 검출된 더마탄 설페이트를 보여주는 그래프이다. 도 21c 및 21d에서, 비히클이 투여된 야생형 마우스 및 MPS II 마우스를 대조군으로서 사용하였다. 도 21c 및 21d에서, *는 p<0.05의 통계적 유의성을 나타내고, **는 p<0.01의 통계적 유의성을 나타내고, ****는 p<0.000의 통계적 유의성을 나타내고, ns는 유의하지 않음을 나타낸다.
도 22a, 22b, 22c, 및 22d는 투여 후 4주차에 다양한 표시된 투여량으로 AAVHSC15에 패키징된 pHM-05217을 투여한 MPS II 마우스의 뇌 조직-특이적 벡터 게놈 수준(도 22a), 뇌 조직에서 정규화된 침묵 변형 hIDS 전사체(도 22b), 뇌 조직 hI2S 활성(도 22c) 및 뇌 조직-특이적 헤파란 설페이트 수준(도 22d)을 보여주는 그래프이다. 비히클이 투여된 야생형 마우스 및 MPS II 마우스를 대조군으로서 사용하였다. 도 22c 및 22d에서, *는 p<0.05의 통계적 유의성을 나타내고, **는 p<0.01의 통계적 유의성을 나타내며, ***는 p<0.001의 통계적 유의성을 나타내고, ns는 유의하지 않음을 나타낸다.
도 23a, 23b, 및 23c는 투여 후 4주차에 다양한 표시된 투여량으로 AAVHSC15에 패키징된 pHM-05217을 투여한 MPS II 마우스의 소뇌(도 23a), 척수(도 23b) 및 해마(도 23c)에서 IHC에 의해 검출된 LAMP1 단백질의 픽셀 강도를 보여주는 그래프이다. 비히클이 투여된 야생형 마우스 및 MPS II 마우스를 대조군으로서 사용하였다. 도 23a~23c에서, *는 p<0.05의 통계적 유의성을 나타내고, **는 p<0.01의 통계적 유의성을 나타내며, ***는 p<0.001의 통계적 유의성을 나타내고, ****는 p<0.0001의 통계적 유의성을 나타내며, ns는 유의하지 않음을 나타낸다.
도 24는 투여 후 4주차에 다양한 표시된 투여량으로 AAVHSC15에 패키징된 pHM-05217을 투여한 MPS II 마우스에서 측정된 혈청 I2S 활성을 보여주는 그래프이다. 비히클이 투여된 야생형 마우스 및 MPS II 마우스를 대조군으로서 사용하였다. 도 24에서, **는 p<0.01의 통계적 유의성을 나타내고, ****는 p<0.0001의 통계적 유의성을 나타내며, ns는 유의하지 않음을 나타낸다.
도 25는 투여 후 4주차에 다양항 표시된 투여량으로 AAVHSC15에 패키징된 pHM-05217을 투여한 MPS II 마우스에서 측정된 간 조직 I2S 활성을 보여주는 그래프이다. 비히클이 투여된 야생형 마우스 및 MPS II 마우스를 대조군으로서 사용하였다. 도 25에서, **는 p<0.01의 통계적 유의성을 나타내고, ****는 p<0.0001의 통계적 유의성을 나타낸다.
도 26a는pHM-05205 벡터의 벡터맵이다. 도 26b, 26c 및 26d는 투여 후 4주차에 6e13 vg/kg의 투여량으로 AAVHSC15에 패키징된 pHM-05205(야생형 hIDS 암호화 서열을 포함함) 또는 pHM-05208(침묵 변형 hIDS 암호화 서열을 포함함) 중 하나를 투여한 MPS II 마우스의 뇌에서 혈청 I2S 활성(도 26b), 간 조직 I2S 활성(도 26c), 및 정규화된 hIDS 전사체(도 26d)를 보여주는 그래프이다. 비히클이 투여된 야생형 마우스 및 MPS II 마우스(또한 "Hemi"로도 지칭함)를 대조군으로서 사용하였다. 도 26b~26d에서, ****는 p<0.0001의 통계적 유의성을 나타내고, ns는 유의하지 않음을 나타낸다.
도 27a는pHM-05211 벡터의 벡터맵이다. 도 27b 및 27c. 도 27b는 AAVHSC15 캡시드에 각각 2e13 vg/kg의 투여량으로 패키징된 pHM-05205 또는 pHM-05211을 투여한 MPS II 마우스에서 검출된 혈청 I2S 활성의 수준을 보여주는 그래프이다. 혈청 I2S 활성은 표시된 바와 같이, 투여 후 6 또는 8주차에 측정하였다. 비히클이 투여된 MPS II 마우스를 대조군으로서 사용하였다. 도 27c는 각각 AAVHSC15 캡시드에 2e13 vg/kg의 투여량으로 패키징된 pHM-05205 또는 pHM-05211을 투여한 MPS II 마우스의 뇌에서 정규화된 hIDS 전사체의 수준을 보여주는 그래프이다. 지시된 바와 같이, 투여 후 2 또는 8주차에 마우스를 희생시키고, 뇌 hIDS 전사체를 측정하였다. 도 27b 및 27c에서, ns는 유의하지 않음을 나타낸다.
도 28a~28o는 AAVHSC15에 1.8e14 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 MPS II 마우스와 관련된 다양한 데이터를 보여주는 그래프이다. 도 28a는 투여 후 52주까지 치료된 MPS II 마우스에서 형광 효소 검정을 사용하여 검출된 혈청 I2S 활성의 수준을 보여주는 그래프이다. 개별 마우스(그룹당 n=3~5마리 마우스) 중의 최소, 최대 및 중앙값은 표준 편차를 나타내는 오차 막대와 함께 상자에 표시된다. 도 28b는 투여 후 12, 24, 39, 및 52주차에 치료된 MPS II 마우스의 뇌, 심장, 간, 비장, 신장 및 폐 조직에서 형질도입된 세포의 DNA의 ?g당 벡터 게놈의 수를 보여주는 그래프이다. 도 28c는 투여 후 12, 24, 39, 및 52주차에 치료된 MPS II 마우스의 뇌, 심장, 간, 비장, 신장 및 폐 조직에서 검출된 hIDS 전사체의 수를 보여주는 그래프이다. 도 28d는 투여 후 52주차에 치료된 MPS II 마우스의 뇌, 심장, 간, 비장, 신장 및 폐 조직에서 검출된 헤파란 설페이트의 수준을 보여주는 그래프이다. 도 28e 및 도 28f는 투여 후 52주차에 치료된 MPS II 마우스의 척수(도 28e) 및 해마(도 28f)에서 IHC에 의해 검출된 LAMP1 단백질의 픽셀 강도를 보여주는 그래프이다. 도 28g는 투여 후 39주차에 치료된 MPS II의 삼차 신경절에서 형질도입된 세포의 DNA μg당 벡터 게놈의 수를 보여주는 그래프이다. 도 28h는 투여 후 12, 24, 39, 및 52주차에 치료한 MPS II 마우스의 간 조직에서 검출된 I2S 활성의 수준을 보여주는 그래프이다. 도 28i~28l은 투여 후 12(도 28i), 24(도 28j), 39(도 28k), 및 52(도 28l)주차에 치료된 MPS II 마우스의 뇌 조직에서 검출된 I2S 활성의 수준을 보여주는 그래프이다. 도 28m은 투여 후 52주차에 1.8e14 vg/kg으로 AAVHSC15에 패키징된 pHM-05217을 투여한 MPS II 마우스의 소변에서 검출된 GAG-HS의 수준을 보여주는 그래프이다. 도 28n은 투여 후 52주차에 1.8e14 vg/kg으로 AAVHSC15에 패키징된 pHM-05217을 투여한 MPS II 마우스에서 퍼킨지 세포층 세포 밀도의 정량화를 보여주는 그래프이다. 도 28o는 투여 후 52주차에 치료된 MPS II 마우스의 관골궁 두께를 보여주는 그래프이다. 도 28b~28d 및 28e~28m의 각각에서, 미치료 MPS II 및 야생형 마우스를 대조군으로서 사용하였다. 도 28j~28l에서, 정상 성인 인간 뇌 조직을 추가 대조군으로서 사용하였다. 각각의 경우에, *는 p<0.05의 통계적 유의성을 나타내고, **는 p <0.01의 통계적 유의성을 나타내며, ***는 p<0.001의 통계적 유의성을 나타내고, ns는 유의하지 않음을 나타낸다. 미치료 마우스는 비히클이 투여된 마우스를 지칭한다.
도 29a~29e. 도 29a는 발목 및 발의 깊이와 폭 측정치의 위치를 보여주는 개략도이다. 도 29b~29e는 AAVHSC15에 1.8e14 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 MPS II 마우스에서 투여 후 14, 20, 28, 34, 37, 40, 46, 및 52주차에서의 발의 폭(도 29b), 발 깊이(도 29c), 발목 폭(도 29d) 및 발목 깊이(도 29e) 측정치를 보여주는 그래프이다. 각각의 경우에, 비히클을 투여한 야생형 마우스 및 MPS II 마우스를 대조군으로서 사용하였다.
도 30a~30e. 도 30a, 30d, 및 30e는 AAVHSC15에 패키징된 1.8e14 vg/kg의 pHM-05217을 투여한 MPS II 마우스에서 투여 후 8주까지 혈청(도 30a), 간 조직(도 30d) 및 뇌 조직(도 30f)에서 검출된 I2S 활성의 수준을 보여주는 그래프이다 . 비히클이 투여된 MPS II 마우스를 대조군으로서 사용하였다. 도 30a에서, *는 p<0.05의 통계적 유의성을 나타내고, **는 p<0.01의 통계적 유의성을 나타내며, ***는 p<0.001의 통계적 유의성을 나타내고, ns는 유의하지 않음을 나타낸다. 도 30b 및 30c는, 표시된 바와 같이, 투여 후 8일, 2주 및 8주에 AAVHSC15에 패키징된 1.8e14 vg/kg의 pHM-05217이 투여된 MPS II 마우스의 뇌, 심장, 간, 및 비장 조직에서 검출된 벡터 게놈(도 30b) 및 침묵 변형된 hIDS 전사체(도 30C)의 수준을 보여주는 그래프이다.
도 31a, 31b, 및 31c는, 표시된 바와 같이, 투여 후 8일(도 31a), 2주(도 31b), 및 8주(도 31c)에 AAVHSC15에 패키징된 1.8e14 vg/kg의 pHM-05217을 투여한 MPS II 마우스의 뇌, 심장, 간 및 비장 조직에서 검출된 GAG-HS의 수준을 보여주는 그래프이다. 도 31d는 AAVHSC15에 패키징된 1.8e14 vg/kg의 pHM-05217을 투여한 MPS II 마우스의 소변에서 검출된 GAG-HS의 수준을 표시된 다양한 시점에서 보여주는 그래프이다. 각각의 경우에, 비히클을 투여한 야생형 및 MPS II 마우스를 대조군으로서 사용하였다.
도 32a 및 32b는, 표시된 바와 같이, 비히클로 처리한 야생형(WT) 마우스, 비히클로 처리한 MPS II 마우스 및 6e13 vg/kg(MPS II 6E+13), 1e14 vg/kg(MPS II 1E+14), 또는 2e14 vg/kg(MPS II 2E+14)의 투여량으로 정맥 내 투여된 AAVHSC15 캡시드에 패키징된 pHM-05217을 처리한 MPS II 마우스의 뇌척수액(CSF)(도 32a) 또는 뇌 조직(도 32b)에서 HPLC-MS/MS에 의해 검출된 GAG-HS 수준을 보여주는 그래프이다. 도 32c는, 표시된 바와 같이, 비히클 처리한 야생형(WT) 마우스, 비히클 처리한 MPS II 마우스, 및 6e13 vg/kg(MPS II 6E+13), 1e14 vg/kg(MPS II 1E/14), 또는 2e14 (MPS II 1+2E/14)의 투여량으로 정맥 내 투여한 AAVHSC15 캡시드에 패키징된 pHM-05217을 처리한 MPS II 마우스의 뇌 조직에서 검출된 I2S 활성 수준을 보여주는 그래프이다. 정상 성인 인간 뇌 조직을 추가 대조군("인간 WT")으로서 사용하였다. 도 32a~32c에서, *는 p<0.05의 통계적 유의성을 나타내고, **는 p<0.01의 통계적 유의성을 나타내고, ***는 p<0.001의 통계적 유의성을 나타내고, ****는 p<0.0001의 통계적 유의성을 나타낸다.
도 33은 만노스 6-포스페이트(M6P)의 존재 또는 부재 하에 AAVHSC15에 패키징된 1.8e14 vg/kg의 pHM-05217의 투여 8일 후 MPS II 마우스로부터 수득한 혈청으로 인큐베이션한 IDS KO HeLa 세포의 세포 용해물에서 검출된 I2S 활성 수준을 보여주는 그래프이다. 도 33에서, *는 p<0.05의 통계적 유의성을 나타내고, ***는 p<0.001의 통계적 유의성을 나타낸다.
도 2a 및 2b. 도 2a는 투여 후 4주차에 야생형 및 Ids KO 반접합체 마우스의 간에서 형질도입된 세포의 DNA의 ng당 벡터 게놈의 수를 보여주는 그래프이다. 도 2b는 투여 후 4주차에 야생형 및 Ids KO 반접합체 마우스의 간에서 nmol/hr/mg의 단백질로 표현된 I2S 활성을 나타내는 그래프이다. 도 2a 및 2b에서, WT는 미치료 야생형 마우스를 지칭하며; MPS II는 미치료 Ids KO 반접합체 마우스를 지칭하고; AAV9-hIDS는 AAV9 캡시드에 2e13 vg/kg의 투여량으로 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스를 지칭하며; HSC15-hIDS는 AAVHSC15 캡시드에 2e13 vg/kg의 투여량으로 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스를 지칭한다. 도 2b에서, 인간 간은 정상 인간 간에서 대표적인 I2S 활성 수준을 지칭한다. *는 p<0.05의 통계적 유의성을 나타낸다; WT와 비교해 ***는 p<0.001의 통계적 유의성을 나타내고, ****는 p<0.0001의 통계적 유의성을 나타낸다. 미치료 마우스는 비히클이 투여된 마우스를 지칭한다.
도 3a 및 3b. 도 3a는 투여 후 4주차에 야생형 및 Ids KO 반접합체 마우스의 뇌(전뇌, 중뇌 및 후뇌)에서 형질도입된 세포의 DNA의 ng당 벡터 게놈의 수를 보여주는 그래프이다. 도 3b는 투여 후 4주차에 야생형 및 Ids KO 반접합체 마우스의 전뇌에서, nmol/hr/mg의 단백질로 표현된 I2S 활성을 보여주는 그래프이다. 도 3a 및 3b에서, WT는 미치료 야생형 마우스를 지칭하며; MPS II는 미치료 Ids KO 반접합체 마우스를 지칭하고; AAV9-hIDS는 AAV9 캡시드에 2e13 vg/kg의 투여량으로 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스를 지칭하며; HSC15-hIDS는 AAVHSC15 캡시드에 2e13 vg/kg의 투여량으로 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스를 지칭한다. 도 3b에서, 인간 뇌는 정상 성인 인간 뇌에서 대표적인 I2S 활성 수준을 지칭한다. n.s는 유의하지 않음을 나타낸다. 미치료 마우스는 비히클이 투여된 마우스를 지칭한다.
도 4a 및 4b. 도 4a는, 투여 후 4주차에, 마우스 간 내 대표적인 야생형 I2S 활성 수준의 백분율로 표현된, 2e13 vg/kg의 투여량으로 AAV9 캡시드(AAV9-hIDS)에 패키징된 pHM-05205 또는 2e13 vg/kg의 투여량으로 AAVHSC15 캡시드(HSC15-hIDS)에 패키징된 pHM-05205를 투여한 Ids KO KO 반접합체 마우스의 간에서 검출된 I2S 활성 수준을 보여주는 그래프이다. FIG. 4b는, 투여 후 4주차에, 간 내 대표적인 정상 인간 I2S 활성 수준의 백분율로 표현된, 2e13 vg/kg의 투여량으로 AAV9 캡시드(AAV9-hIDS)에 패키징된 pHM-05205 또는 2e13 vg/kg의 투여량으로 AAVHSC15 캡시드(HSC15-hIDS)에 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스의 간에서 검출된 I2S 활성 수준을 보여주는 그래프이다. 도 4a 및 4b에서, *는 p<0.05의 통계적 유의성을 나타낸다.
도 5a 및 5b. 도 5a는, 마우스 뇌 내 대표적인 야생형 I2S활성 수준의 백분율로 표현된, 투여 후 4주차에 2e13 vg/kg의 투여량으로 AAV9 캡시드(AAV9-hIDS)에 패키징된 pHM-05205 또는 2e13 vg/kg의 투여량으로 AAVHSC15 캡시드(HSC15-I2S)에 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스의 뇌에서 검출된 I2S 활성 수준을 보여주는 그래프이다. FIG. 5b는, 뇌 내 대표적인 정상 인간 I2S 활성 수준의 백분율로 표현된, 투여 후 4주차에, 2e13 vg/kg의 투여량으로 AAV9 캡시드(AAV9-hIDS)에 패키징된 pHM-05205 또는 2e13 vg/kg의 투여량으로 AAVHSC15 캡시드(HSC15-hIDS)에 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스의 뇌에서 검출된 I2S 활성 수준을 보여주는 그래프이다.
도 6a, 6b, 및 6c. 도 6a는 투여 후 4주차에 야생형 및 Ids KO 반접합체 마우스의 간에서 검출된 GAG 수준을 보여주는 그래프이다. 도 6b는 투여 후 4주차에 야생형 및 Ids KO 반접합체 마우스의 뇌에서 검출된 GAG 수준을 보여주는 그래프이다. 도 6c는 투여 후 4주차에 야생형 및 Ids KO 반접합체 마우스의 소변에서 검출된 GAG 수준을 보여주는 그래프이다. 도 6a, 6b, 및 6c에서, WT는 미치료 야생형 마우스를 지칭하며; MPS II는 미치료 Ids KO 반접합체 마우스를 지칭하고; AAV9-hIDS는 AAV9 캡시드에 2e13 vg/kg의 투여량으로 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스를 지칭하며; HSC15-hIDS는 AAVHSC15 캡시드에 2e13 vg/kg의 투여량으로 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스를 지칭한다. 도 6a에서, 인간 간은 인간 간에서 대표적인 GAG 수준을 지칭한다. 도 6b에서, 인간 뇌는 인간 뇌에서 대표적인 GAG 수준을 지칭한다. 도 6a~6c에서, *는 p<0.05의 통계적 유의성을 나타내고, **는 p<0.01의 통계적 유의성을 나타낸다. 미치료 마우스는 비히클이 투여된 마우스를 지칭한다.
도 7a 및 7b. 도 7a는 투여 후 4주차에, 마우스 GAPDH의 발현 수준에 대해 정규화된, 야생형 및 Ids KO 반접합체 마우스의 간에서 hIDS의 발현을 보여주는 그래프이다. 도 7b는 투여 후 4주차에, 마우스 GAPDH의 발현 수준에 대해 정규화된, 야생형 및 Ids KO 반접합체 마우스의 뇌에서 hIDS의 발현을 보여주는 그래프이다. 도 7a 및 7b에서, WT는 미치료 야생형 마우스를 지칭하며; MPS II는 미치료 Ids KO 반접합체 마우스를 지칭하고; AAV9-hIDS는 AAV9 캡시드에 2e13 vg/kg의 투여량으로 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스를 지칭하며; HSC15-hIDS는 AAVHSC15 캡시드에 2e13 vg/kg의 투여량으로 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스를 지칭한다. 도 7b에서, 인간 뇌는 성인 정상 인간 뇌에서의 대표적인 IDS 발현 수준을 지칭한다. 미치료 마우스는 비히클이 투여된 마우스를 지칭한다.
도 8a, 8b, 및 8c. 도 8a는 시간에 따라, 야생형 및 Ids KO 반접합체 마우스의 소변에서 검출된 총 GAG 수준을 보여주는 그래프이다. 도 8b는 투여 후 12주차에 야생형 및 Ids KO 반접합체 마우스의 간에서 검출된 GAG 수준을 보여주는 그래프이다. 도 8c는 투여 후 12주차에 야생형 및 Ids KO 반접합체 마우스의 간에서 nmol/hr/mg의 단백질로 표현된 I2S 활성을 나타내는 그래프이다. 도 8a, 8b, 및 8c에서, WT는 미치료 야생형 마우스를 지칭하며; MPS II는 미치료 Ids KO 반접합체 마우스를 지칭하고; HSC15-hIDS는 AAVHSC15 캡시드에 2e13 vg/kg의 투여량으로 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스를 지칭한다. 도 8a~8c에서, ***는 p<0.001의 통계적 유의성을 나타내고, ****는 p<0.0001의 통계적 유의성을 나타낸다. 미치료 마우스는 비히클이 투여된 마우스를 지칭한다.
도 9a, 9b, 및 9c. 도 9a는 투여 후 12주차에 야생형 및 Ids KO 반접합체 마우스의 뇌에서 검출된 GAG 수준을 보여주는 그래프이다. 도 9b는 투여 후 12주차에 야생형 및 Ids KO 반접합체 마우스의 뇌에서 nmol/hr/mg의 단백질로서 표현된 I2S 활성을 나타내는 그래프이다. 도 9a 및 9b에서, *는 p<0.05의 통계적 유의성을 나타내고, **는 p<0.01의 통계적 유의성을 나타낸다. 도 9c는, 대표적인 야생형 마우스 I2S 활성의 백분율로서 표현된, 투여 후 12주차에 야생형 및 Ids KO 반접합체 마우스의 뇌에서의 I2S 활성을 나타내는 그래프이다. 도 9a, 9b, 및 9c에서, WT는 미치료 야생형 마우스를 지칭하며; MPS II는 미치료 Ids KO 반접합체 마우스를 지칭하고; HSC15-hIDS는 AAVHSC15 캡시드에 2e13 vg/kg의 투여량으로 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스를 지칭한다. 미치료 마우스는 비히클이 투여된 마우스를 지칭한다.
도 10a, 10b, 10c, 및 10d는 각각 T-004, T-005, 및 T-006 벡터의 벡터 맵이다.
도 11a 및 11b. 도 11a는 투여 후 4주차에 야생형 및 Ids KO 반접합체 마우스의 소변에서 검출된 총 GAG 수준을 보여주는 그래프이다. 도 11b는 투여 후 4주차에 야생형 및 Ids KO 반접합체 마우스에서 검출된 nmol/hr/ml로 표현된 혈청 I2S 활성을 보여주는 그래프이다. 도 11a 및 11b에서, WT는 미치료 야생형 마우스를 지칭하며; MPS II는 미치료 Ids KO 반접합체 마우스를 지칭하고; AAV9-hIDS는 AAV9 캡시드에 2e13 vg/kg의 투여량으로 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스를 지칭하며; HSC15-hIDS는 AAVHSC15 캡시드에 2e13 vg/kg의 투여량으로 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스를 지칭하며; HSC15-T-004는 AAVHSC15 캡시드에 2e13 vg/kg의 투여량으로 패키징된 T-004를 투여한 Ids KO 반접합체 마우스를 지칭하고; HSC15-T-005는 AAVHSC15 캡시드에 2e13 vg/kg의 투여량으로 패키징된 T-005를 투여한 Ids KO 반접합체 마우스를 지칭하며; HSC15-T-006은 AAVHSC15 캡시드에 2e13 vg/kg의 투여량으로 패키징된 T-006을 투여한 Ids KO 반접합체 마우스를 지칭한다. 도 11a 및 11b에서, *는 p<0.05의 통계적 유의성을 나타내고, **는 p<0.01의 통계적 유의성을 나타내며, ***는 p<0.001의 통계적 유의성을 나타내고, ****는 p<0.0001의 통계적 유의성을 나타낸다. 미치료 마우스는 비히클이 투여된 마우스를 지칭한다.
도 12a, 12b, 12c, 및 12d. 도 12a는 투여 후 4주차에 야생형 및 Ids KO 반접합체 마우스의 뇌에서 검출된 GAG 수준을 보여주는 그래프이다. 도 12b는 투여 후 4주차에 야생형 및 Ids KO 반접합체 마우스의 간에서 검출된 GAG 수준을 보여주는 그래프이다. 도 12c는 투여 후 4주차에 야생형 및 Ids KO 반접합체 마우스의 뇌에서 검출된 I2S 활성을 보여주는 그래프이다. 도 12d는 투여 후 4주차에 야생형 및 Ids KO 반접합체 마우스의 간에서 검출된 I2S 활성을 보여주는 그래프이다. 도 12a, 12b, 12c, 및 12d에서, WT는 미치료 야생형 마우스를 지칭하며; MPS II는 미치료 Ids KO 반접합체 마우스를 지칭하고; AAV9-hIDS는 AAV9 캡시드에 2e13 vg/kg의 투여량으로 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스를 지칭하며; HSC15-hIDS는 AAVHSC15 캡시드에 2e13 vg/kg의 투여량으로 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스를 지칭하며; HSC15-T-004는 AAVHSC15 캡시드에 2e13 vg/kg의 투여량으로 패키징된 T-004를 투여한 Ids KO 반접합체 마우스를 지칭하고; HSC15-T-005는 AAVHSC15 캡시드에 2e13 vg/kg의 투여량으로 패키징된 T-005를 투여한 Ids KO 반접합체 마우스를 지칭하며; HSC15-T-006은 AAVHSC15 캡시드에 2e13 vg/kg의 투여량으로 패키징된 T-006을 투여한 Ids KO 반접합체 마우스를 지칭한다. 도 12a, 12b, 및 12d에서, *는 p<0.05의 통계적 유의성을 나타내고, **는 p<0.01의 통계적 유의성을 나타내고, ***는 p<0.001의 통계적 유의성을 나타내고, ****는 p<0.0001의 통계적 유의성을 나타낸다. 미치료 마우스는 비히클이 투여된 마우스를 지칭한다.
도 13a 및 13b는 투여 후 4주까지 야생형 및 Ids KO 반접합체 마우스의 체중을 보여주는 그래프이다. 도 13a 및 13b에서, 그룹 1: 미치료 Ids KO 반접합체 대조군; 그룹 2: AAVHSC15 캡시드에 2.2e13 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스; 그룹 3: AAVHSC15 캡시드에 6.5e13 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스; 그룹 4: AAVHSC15 캡시드에 1.1e14 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스; 그룹 5: 야생형 마우스 대조군; 그룹 6: AAVHSC15 캡시드에 2.2e13 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 야생형 마우스; 및 그룹 7: AAVHSC15 캡시드에 1.1e14 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 야생형 마우스. 미치료 마우스는 비히클이 투여된 마우스를 지칭한다.
도 14a, 14b, 및 14c는 AAVHSC15에 패키징된 pHM-05217을 투여한 야생형 마우스에서 투여량 의존적인 I2S 활성을 보여주는 그래프이다. 도 14a는 투여 후 2주차에 야생형 및 Ids KO 반접합체 마우스에서 검출된 nmol/hr/ml 단위의 혈청 I2S 활성을 보여주는 그래프이다. 도 14b는 투여 후 4주차에 야생형 및 Ids KO 반접합체 마우스에서 검출된 nmol/hr/ml 단위의 혈청 I2S 활성을 보여주는 그래프이다. 도 14c는 투여 후 4주차에 야생형 및 Ids KO 반접합체 마우스의 간에서 nmol/hr/mg 단위의 I2S 활성을 보여주는 그래프이다. 도 14a, 14b, 및 14c에서, WT는 미치료 야생형 마우스를 지칭하며; MPS II는 미치료 Ids KO 반접합체 마우스를 지칭하고; WT - 2.2E+13은 AAVHSC15에 2.2e13 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 야생형 마우스를 지칭한며; WT - 1.1E+14는 AAVHSC15에 1.1e14 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 야생형 마우스를 지칭한다. 미치료 마우스는 비히클이 투여된 마우스를 지칭한다.
도 15a 및 15b. 도 15a는 투여 후 4주차에 야생형 및 반접합체 마우스의 뇌에서 총 GAG 수준을 보여주는 그래프이다. 도 15b는 투여 후 4주차에 야생형 및 반접합체 마우스의 간에서 총 GAG 수준을 보여주는 그래프이다. 도 15a 및 15b에서, WT는 미치료 야생형 마우스를 지칭하며; MPS II는 미치료 Ids KO 반접합체 마우스를 지칭하고; WT - 2.2E+13은 AAVHSC15에 2.2e13 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 야생형 마우스를 지칭한며; WT - 1.1E+14는 AAVHSC15에 1.1e14 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 야생형 마우스를 지칭한다. 도 15a 및 15b에서, ***는 p<0.001의 통계적 유의성을 나타내고, ****는 p<0.0001의 통계적 유의성을 나타낸다. 미치료 마우스는 비히클이 투여된 마우스를 지칭한다.
도 16a 및 16b. 도 16a는 투여 후 4주차에 야생형 및 Ids KO 반접합체 마우스의 뇌에서 IDS의 발현 수준을 보여주는 그래프이다. 도 16b는 투여 후 4주차에 야생형 및 Ids KO 반접합체 마우스의 간에서 IDS의 발현 수준을 보여주는 그래프이다. 도 16a 및 16b에서, WT는 미치료 야생형 마우스를 지칭하며; MPS II는 미치료 Ids KO 반접합체 마우스를 지칭하고; MPS II - 2.2E+13은 AAVHSC15에 2.2e13 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스를 지칭하며; MPS II - 6.5E+13은 AAVHSC15에 6.5e13 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스를 지칭하고; MPS II - 1.1E+14는 AAVHSC15에 1.1e14 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스를 지칭한다. 도 16a 및 16b에서, *는 p<0.05의 통계적 유의성을 나타내고, ***는 p<0.001의 통계적 유의성을 나타낸다. 미치료 마우스는 비히클이 투여된 마우스를 지칭한다.
도 17a 및 17b. 도 17a는 투여 후 2주차에 야생형 및 Ids KO 반접합체 마우스에서 검출된 혈청 I2S 활성을 보여주는 그래프이다. 도 17b는 투여 후 4주차에 야생형 Ids IDS KO 반접합체 마우스에서 검출된 혈청 I2S 활성을 보여주는 그래프이다. 도 17a 및 17b에서, WT는 미치료 야생형 마우스를 지칭하며; MPS II는 미치료 Ids KO 반접합체 마우스를 지칭하고; MPS II - 2.2E+13은 AAVHSC15에 2.2e13 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스를 지칭하며; MPS II - 6.5E+13은 AAVHSC15에 6.5e13 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스를 지칭하고; MPS II - 1.1E+14는 AAVHSC15에 1.1e14 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스를 지칭한다. 도 17a 및 17b에서, **는 p<0.01의 통계적 유의성을 나타내고, ****는 p<0.0001의 통계적 유의성을 나타내고, ns는 유의하지 않음을 나타낸다. 미치료 마우스는 비히클이 투여된 마우스를 지칭한다.
도 18은 투여 후 4주차에 야생형 및 Ids KO 반접합체 마우스의 간에서 검출된 I2S 활성을 보여주는 그래프이다. WT는 미치료 야생형 마우스를 지칭하며; MPS II는 미치료 Ids KO 반접합체 마우스를 지칭하고; MPS II - 2.2E+13은 AAVHSC15에 2.2e13 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스를 지칭하며; MPS II - 6.5E+13은 AAVHSC15에 6.5e13 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스를 지칭하고; MPS II - 1.1E+14는 AAVHSC15에 1.1e14 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스를 지칭한다. 도 18에서, **는 p<0.01의 통계적 유의성을 나타내고, ****는 p<0.0001의 통계적 유의성을 나타낸다. 미치료 마우스는 비히클이 투여된 마우스를 지칭한다.
도 19a 및 19b는, 소변 내 크레아티닌 수준으로 정규화된, 투여 후 2주(도 19a) 및 4주(도 19b)차에 야생형 및 Ids KO 반접합체 마우스의 소변에서 검출된 총 GAG 수준을 보여주는 그래프이다. 도 19c 및 도 19d는 투여 후 4주차에 야생형 마우스 및 Ids KO 반접합체 마우스에서 GAG 헤파란 설페이트(GAG-HS; "HS")(도 19c) 및 GAG 더마탄 설페이트(GAG-DS; "DS")(도 19d)의 수준을 보여주는 그래프이다. WT는 미치료 야생형 마우스를 지칭하며; MPS II는 미치료 Ids KO 반접합체 마우스를 지칭하고; MPS II - 2.2E+13은 AAVHSC15에 2.2e13 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스를 지칭하며; MPS II - 6.5E+13은 AAVHSC15에 6.5e13 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스를 지칭하고; MPS II - 1.1E+14는 AAVHSC15에 1.1e14 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스를 지칭한다. 도 19a~19d에서, ns는 통계적 유의성이 없음을 나타내고, **는 p<0.01의 통계적 유의성을 나타내고, ***는 p<0.001의 통계적 유의성을 나타내고, ****는 p<0.0001의 통계적 유의성을 나타낸다. 미치료 마우스는 비히클이 투여된 마우스를 지칭한다.
도 20a, 20b, 20c, 20d, 20e, 및 20f는 투여 후 4주차에 야생형 및 Ids KO 반접합체 마우스의 간(도 20a), 심장(도 20b), 폐(도 20c), 뇌(도 20d), 신장(도 20e), 및 비장(도 20f)에서 검출된 총 GAG 수준을 보여주는 그래프이다. 도 20a 20b, 20c, 20d, 20e, 및 20f에서, WT는 미치료 야생형 마우스를 지칭하며; MPS II는 미치료 Ids KO 반접합체 마우스를 지칭하고; MPS II - 2.2E+13은 AAVHSC15에 2.2e13 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스를 지칭하며; MPS II - 6.5E+13은 AAVHSC15에 6.5e13 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스를 지칭하고; MPS II - 1.1E+14는 AAVHSC15에 1.1e14 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스를 지칭한다. 도 20a~20f에서, *는 p<0.05의 통계적 유의성을 나타내고, **는 p<0.01의 통계적 유의성을 나타내며, ***는 p<0.001의 통계적 유의성을 나타내고, ****는 p<0.0001의 통계적 유의성을 나타낸다. 미치료 마우스는 비히클이 투여된 마우스를 지칭한다.
도 21a, 21b, 21c, 및 21d. 도 21a는 투여 후 4주차에 표시된 바와 같은 다양한 투여량으로 AAVHSC15에 패키징된 pHM-05217을 투여한 MPS II 마우스의 뇌, 심장, 신장, 간, 폐, 및 비장 조직에서 형질도입된 세포의 DNA ?g당 벡터 게놈의 수를 보여주는 그래프이다. 도 21b는 투여 후 4주차에 다양한 표시된 투여량으로 AAVHSC15에 패키징된 pHM-05217을 투여한 MPS II 마우스의 뇌, 심장, 신장, 간, 폐, 및 비장 조직에서 검출된 정규화된 침묵 변형 hIDS 전사체를 보여주는 그래프이다. 도 21c는 투여 후 4주차에 다양한 표시된 투여량으로 AAVHSC15에 패키징된 pHM-05217을 투여한 MPS II 마우스의 뇌, 신장, 심장, 간, 폐, 및 비장 조직에서 검출된 헤파란 설페이트를 보여주는 그래프이다. 도 21d는 투여 후 4주차에 다양한 표시된 투여량으로 AAVHSC15에 패키징된 pHM-05217을 투여한 MPS II 마우스의 신장, 심장, 간, 및 폐 조직에서 검출된 더마탄 설페이트를 보여주는 그래프이다. 도 21c 및 21d에서, 비히클이 투여된 야생형 마우스 및 MPS II 마우스를 대조군으로서 사용하였다. 도 21c 및 21d에서, *는 p<0.05의 통계적 유의성을 나타내고, **는 p<0.01의 통계적 유의성을 나타내고, ****는 p<0.000의 통계적 유의성을 나타내고, ns는 유의하지 않음을 나타낸다.
도 22a, 22b, 22c, 및 22d는 투여 후 4주차에 다양한 표시된 투여량으로 AAVHSC15에 패키징된 pHM-05217을 투여한 MPS II 마우스의 뇌 조직-특이적 벡터 게놈 수준(도 22a), 뇌 조직에서 정규화된 침묵 변형 hIDS 전사체(도 22b), 뇌 조직 hI2S 활성(도 22c) 및 뇌 조직-특이적 헤파란 설페이트 수준(도 22d)을 보여주는 그래프이다. 비히클이 투여된 야생형 마우스 및 MPS II 마우스를 대조군으로서 사용하였다. 도 22c 및 22d에서, *는 p<0.05의 통계적 유의성을 나타내고, **는 p<0.01의 통계적 유의성을 나타내며, ***는 p<0.001의 통계적 유의성을 나타내고, ns는 유의하지 않음을 나타낸다.
도 23a, 23b, 및 23c는 투여 후 4주차에 다양한 표시된 투여량으로 AAVHSC15에 패키징된 pHM-05217을 투여한 MPS II 마우스의 소뇌(도 23a), 척수(도 23b) 및 해마(도 23c)에서 IHC에 의해 검출된 LAMP1 단백질의 픽셀 강도를 보여주는 그래프이다. 비히클이 투여된 야생형 마우스 및 MPS II 마우스를 대조군으로서 사용하였다. 도 23a~23c에서, *는 p<0.05의 통계적 유의성을 나타내고, **는 p<0.01의 통계적 유의성을 나타내며, ***는 p<0.001의 통계적 유의성을 나타내고, ****는 p<0.0001의 통계적 유의성을 나타내며, ns는 유의하지 않음을 나타낸다.
도 24는 투여 후 4주차에 다양한 표시된 투여량으로 AAVHSC15에 패키징된 pHM-05217을 투여한 MPS II 마우스에서 측정된 혈청 I2S 활성을 보여주는 그래프이다. 비히클이 투여된 야생형 마우스 및 MPS II 마우스를 대조군으로서 사용하였다. 도 24에서, **는 p<0.01의 통계적 유의성을 나타내고, ****는 p<0.0001의 통계적 유의성을 나타내며, ns는 유의하지 않음을 나타낸다.
도 25는 투여 후 4주차에 다양항 표시된 투여량으로 AAVHSC15에 패키징된 pHM-05217을 투여한 MPS II 마우스에서 측정된 간 조직 I2S 활성을 보여주는 그래프이다. 비히클이 투여된 야생형 마우스 및 MPS II 마우스를 대조군으로서 사용하였다. 도 25에서, **는 p<0.01의 통계적 유의성을 나타내고, ****는 p<0.0001의 통계적 유의성을 나타낸다.
도 26a는pHM-05205 벡터의 벡터맵이다. 도 26b, 26c 및 26d는 투여 후 4주차에 6e13 vg/kg의 투여량으로 AAVHSC15에 패키징된 pHM-05205(야생형 hIDS 암호화 서열을 포함함) 또는 pHM-05208(침묵 변형 hIDS 암호화 서열을 포함함) 중 하나를 투여한 MPS II 마우스의 뇌에서 혈청 I2S 활성(도 26b), 간 조직 I2S 활성(도 26c), 및 정규화된 hIDS 전사체(도 26d)를 보여주는 그래프이다. 비히클이 투여된 야생형 마우스 및 MPS II 마우스(또한 "Hemi"로도 지칭함)를 대조군으로서 사용하였다. 도 26b~26d에서, ****는 p<0.0001의 통계적 유의성을 나타내고, ns는 유의하지 않음을 나타낸다.
도 27a는pHM-05211 벡터의 벡터맵이다. 도 27b 및 27c. 도 27b는 AAVHSC15 캡시드에 각각 2e13 vg/kg의 투여량으로 패키징된 pHM-05205 또는 pHM-05211을 투여한 MPS II 마우스에서 검출된 혈청 I2S 활성의 수준을 보여주는 그래프이다. 혈청 I2S 활성은 표시된 바와 같이, 투여 후 6 또는 8주차에 측정하였다. 비히클이 투여된 MPS II 마우스를 대조군으로서 사용하였다. 도 27c는 각각 AAVHSC15 캡시드에 2e13 vg/kg의 투여량으로 패키징된 pHM-05205 또는 pHM-05211을 투여한 MPS II 마우스의 뇌에서 정규화된 hIDS 전사체의 수준을 보여주는 그래프이다. 지시된 바와 같이, 투여 후 2 또는 8주차에 마우스를 희생시키고, 뇌 hIDS 전사체를 측정하였다. 도 27b 및 27c에서, ns는 유의하지 않음을 나타낸다.
도 28a~28o는 AAVHSC15에 1.8e14 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 MPS II 마우스와 관련된 다양한 데이터를 보여주는 그래프이다. 도 28a는 투여 후 52주까지 치료된 MPS II 마우스에서 형광 효소 검정을 사용하여 검출된 혈청 I2S 활성의 수준을 보여주는 그래프이다. 개별 마우스(그룹당 n=3~5마리 마우스) 중의 최소, 최대 및 중앙값은 표준 편차를 나타내는 오차 막대와 함께 상자에 표시된다. 도 28b는 투여 후 12, 24, 39, 및 52주차에 치료된 MPS II 마우스의 뇌, 심장, 간, 비장, 신장 및 폐 조직에서 형질도입된 세포의 DNA의 ?g당 벡터 게놈의 수를 보여주는 그래프이다. 도 28c는 투여 후 12, 24, 39, 및 52주차에 치료된 MPS II 마우스의 뇌, 심장, 간, 비장, 신장 및 폐 조직에서 검출된 hIDS 전사체의 수를 보여주는 그래프이다. 도 28d는 투여 후 52주차에 치료된 MPS II 마우스의 뇌, 심장, 간, 비장, 신장 및 폐 조직에서 검출된 헤파란 설페이트의 수준을 보여주는 그래프이다. 도 28e 및 도 28f는 투여 후 52주차에 치료된 MPS II 마우스의 척수(도 28e) 및 해마(도 28f)에서 IHC에 의해 검출된 LAMP1 단백질의 픽셀 강도를 보여주는 그래프이다. 도 28g는 투여 후 39주차에 치료된 MPS II의 삼차 신경절에서 형질도입된 세포의 DNA μg당 벡터 게놈의 수를 보여주는 그래프이다. 도 28h는 투여 후 12, 24, 39, 및 52주차에 치료한 MPS II 마우스의 간 조직에서 검출된 I2S 활성의 수준을 보여주는 그래프이다. 도 28i~28l은 투여 후 12(도 28i), 24(도 28j), 39(도 28k), 및 52(도 28l)주차에 치료된 MPS II 마우스의 뇌 조직에서 검출된 I2S 활성의 수준을 보여주는 그래프이다. 도 28m은 투여 후 52주차에 1.8e14 vg/kg으로 AAVHSC15에 패키징된 pHM-05217을 투여한 MPS II 마우스의 소변에서 검출된 GAG-HS의 수준을 보여주는 그래프이다. 도 28n은 투여 후 52주차에 1.8e14 vg/kg으로 AAVHSC15에 패키징된 pHM-05217을 투여한 MPS II 마우스에서 퍼킨지 세포층 세포 밀도의 정량화를 보여주는 그래프이다. 도 28o는 투여 후 52주차에 치료된 MPS II 마우스의 관골궁 두께를 보여주는 그래프이다. 도 28b~28d 및 28e~28m의 각각에서, 미치료 MPS II 및 야생형 마우스를 대조군으로서 사용하였다. 도 28j~28l에서, 정상 성인 인간 뇌 조직을 추가 대조군으로서 사용하였다. 각각의 경우에, *는 p<0.05의 통계적 유의성을 나타내고, **는 p <0.01의 통계적 유의성을 나타내며, ***는 p<0.001의 통계적 유의성을 나타내고, ns는 유의하지 않음을 나타낸다. 미치료 마우스는 비히클이 투여된 마우스를 지칭한다.
도 29a~29e. 도 29a는 발목 및 발의 깊이와 폭 측정치의 위치를 보여주는 개략도이다. 도 29b~29e는 AAVHSC15에 1.8e14 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 MPS II 마우스에서 투여 후 14, 20, 28, 34, 37, 40, 46, 및 52주차에서의 발의 폭(도 29b), 발 깊이(도 29c), 발목 폭(도 29d) 및 발목 깊이(도 29e) 측정치를 보여주는 그래프이다. 각각의 경우에, 비히클을 투여한 야생형 마우스 및 MPS II 마우스를 대조군으로서 사용하였다.
도 30a~30e. 도 30a, 30d, 및 30e는 AAVHSC15에 패키징된 1.8e14 vg/kg의 pHM-05217을 투여한 MPS II 마우스에서 투여 후 8주까지 혈청(도 30a), 간 조직(도 30d) 및 뇌 조직(도 30f)에서 검출된 I2S 활성의 수준을 보여주는 그래프이다 . 비히클이 투여된 MPS II 마우스를 대조군으로서 사용하였다. 도 30a에서, *는 p<0.05의 통계적 유의성을 나타내고, **는 p<0.01의 통계적 유의성을 나타내며, ***는 p<0.001의 통계적 유의성을 나타내고, ns는 유의하지 않음을 나타낸다. 도 30b 및 30c는, 표시된 바와 같이, 투여 후 8일, 2주 및 8주에 AAVHSC15에 패키징된 1.8e14 vg/kg의 pHM-05217이 투여된 MPS II 마우스의 뇌, 심장, 간, 및 비장 조직에서 검출된 벡터 게놈(도 30b) 및 침묵 변형된 hIDS 전사체(도 30C)의 수준을 보여주는 그래프이다.
도 31a, 31b, 및 31c는, 표시된 바와 같이, 투여 후 8일(도 31a), 2주(도 31b), 및 8주(도 31c)에 AAVHSC15에 패키징된 1.8e14 vg/kg의 pHM-05217을 투여한 MPS II 마우스의 뇌, 심장, 간 및 비장 조직에서 검출된 GAG-HS의 수준을 보여주는 그래프이다. 도 31d는 AAVHSC15에 패키징된 1.8e14 vg/kg의 pHM-05217을 투여한 MPS II 마우스의 소변에서 검출된 GAG-HS의 수준을 표시된 다양한 시점에서 보여주는 그래프이다. 각각의 경우에, 비히클을 투여한 야생형 및 MPS II 마우스를 대조군으로서 사용하였다.
도 32a 및 32b는, 표시된 바와 같이, 비히클로 처리한 야생형(WT) 마우스, 비히클로 처리한 MPS II 마우스 및 6e13 vg/kg(MPS II 6E+13), 1e14 vg/kg(MPS II 1E+14), 또는 2e14 vg/kg(MPS II 2E+14)의 투여량으로 정맥 내 투여된 AAVHSC15 캡시드에 패키징된 pHM-05217을 처리한 MPS II 마우스의 뇌척수액(CSF)(도 32a) 또는 뇌 조직(도 32b)에서 HPLC-MS/MS에 의해 검출된 GAG-HS 수준을 보여주는 그래프이다. 도 32c는, 표시된 바와 같이, 비히클 처리한 야생형(WT) 마우스, 비히클 처리한 MPS II 마우스, 및 6e13 vg/kg(MPS II 6E+13), 1e14 vg/kg(MPS II 1E/14), 또는 2e14 (MPS II 1+2E/14)의 투여량으로 정맥 내 투여한 AAVHSC15 캡시드에 패키징된 pHM-05217을 처리한 MPS II 마우스의 뇌 조직에서 검출된 I2S 활성 수준을 보여주는 그래프이다. 정상 성인 인간 뇌 조직을 추가 대조군("인간 WT")으로서 사용하였다. 도 32a~32c에서, *는 p<0.05의 통계적 유의성을 나타내고, **는 p<0.01의 통계적 유의성을 나타내고, ***는 p<0.001의 통계적 유의성을 나타내고, ****는 p<0.0001의 통계적 유의성을 나타낸다.
도 33은 만노스 6-포스페이트(M6P)의 존재 또는 부재 하에 AAVHSC15에 패키징된 1.8e14 vg/kg의 pHM-05217의 투여 8일 후 MPS II 마우스로부터 수득한 혈청으로 인큐베이션한 IDS KO HeLa 세포의 세포 용해물에서 검출된 I2S 활성 수준을 보여주는 그래프이다. 도 33에서, *는 p<0.05의 통계적 유의성을 나타내고, ***는 p<0.001의 통계적 유의성을 나타낸다.
본 개시는 세포에서 IDS 유전자 기능을 복원할 수 있는 AAV 조성물, 및 IDS 유전자 기능의 감소와 관련된 장애(예컨대, 헌터 증후군)를 치료하기 위해 이를 사용하는 방법을 제공한다. 또한, AAV 조성물을 제조하기 위한 조성물, 시스템 및 방법이 제공된다.
I.
정의
본원에서 사용되는 용어 "재조합 아데노-연관 바이러스"는 또는 "rAAV"는 기능적 rep 및 cap 유전자가 결여된 게놈을 포함하는 AAV를 지칭한다.
본원에서 사용되는 용어 "IDS 유전자"는 이두로네이트-2-설파타제 유전자를 지칭한다. 인간 IDS 유전자는 국립생물공학정보센터(National Center for Biotechnology Information, NCBI) 유전자 ID 3423에 의해 식별된다. IDS 유전자의 상보적 암호화 서열의 예시적인 뉴클레오티드 서열은 서열번호 24에 제공된다. IDS 폴리펩티드의 예시적인 아미노산 서열은 서열번호 23으로 제공된다.
본원에서 사용되는 용어 "rAAV 게놈"은 rAAV의 게놈 서열을 포함하는 핵산 분자(예를 들어, DNA 및/또는 RNA)를 지칭한다. 당업자는 rAAV 게놈이 이식유전자(예를 들어, 전사 조절 요소에 작동 가능하게 연결된 IDS 코팅 서열)를 포함하는 경우, rAAV 게놈이 이식유전자의 전사 방향에 대해 센스 또는 안티센스 배향에 있을 수 있음을 이해할 것이다.
본원에서 사용되는 용어 "AAV 캡시드 단백질"은 AAV VP1, VP2, 또는 VP3 캡시드 단백질을 지칭한다. 용어 "클레이드(Clade) F 캡시드 단백질"은 본원에서 각각 서열번호 1~736, 138~736, 및 203~736의 아미노산에 제시된 VP1, VP2 또는 VP3 아미노산 서열과 적어도 90%의 동일성을 갖는 AAV VP1, VP2 또는 VP3 캡시드 단백질을 지칭한다.
본원에서 사용되는 바와 같이, 2개의 뉴클레오티드 서열 사이 또는 2개의 아미노산 서열 사이의 "백분율 동일성"은 정렬된 서열 쌍 사이의 일치되는 수에 100을 곱하고, 내부 갭을 포함하는 정렬된 영역의 길이를 나눔으로써 계산된다. 동일성 채점은 완벽한 일치만을 계산하며, 아미노산의 서로 유사한 정도는 고려하지 않는다. 내부 갭만이 길이에 포함되고, 서열 말단에서의 갭은 포함되지 않는다.
본원에서 사용되는 "IDS 유전자 돌연변이와 연관된 질환 또는 장애"라는 용어는 IDS 유전자의 돌연변이에 의해 야기되거나, 이에 의해 악화되거나, 또는 이와 유전적으로 연결된 임의의 질환 또는 장애를 지칭한다. 특정 구현예에서, IDS 유전자 돌연변이와 연관된 질환 또는 장애는 헌터 증후군 또는 뮤코다당류증 II(MPS II)이다.
본원에서 사용되는 용어 "암호화 서열"은, 시작 코돈에서 시작하여 정지 코돈에서 끝나는, 폴리펩티드를 암호화하는 상보적 DNA(cDNA)의 부분을 지칭한다. 유전자는 대안적 스플라이싱, 대안적 번역 개시, 및 모집단 내 변이로 인해 하나 이상의 암호화 서열을 가질 수 있다. 암호화 서열은 야생형이거나 침묵 변형되거나 인트론-삽입될 수 있다. 예시적인 야생형 IDS 암호화 서열은 서열번호 24에 제시되어 있다.
본원에서 사용되는 용어 "침묵 변형된"은 암호화 서열 또는 스터퍼-삽입 암호화 서열에 의해 암호화된 폴리펩티드의 아미노산 서열을 변화시키지 않는 (예를 들어, 뉴클레오티드 치환에 의한) 유전자의 암호화 서열 또는 인트론-삽입 암호화 서열의 변형을 지칭한다. 이러한 침묵 변형은 암호화 서열이 세포 내로 형질도입될 때 암호화 서열의 번역 효율을 증가시킬 수 있고/있거나 내인성 유전자의 상응하는 서열과의 재조합을 방지할 수 있다는 점에서 유리하다. 본원에 기술된 바와 같은 예시적인 침묵 변형된 IDS 암호화 서열은 서열번호 26, 67, 또는 68에 제시되어 있다.
본원에서 사용되는 용어 유전자의 "인트론-삽입 암호화 서열"은 유전자의 암호화 서열에 삽입된 하나 이상의 인트론을 포함하는 뉴클레오티드 서열을 지칭한다. 유전자의 인트론-삽입 암호화 서열은 인트론을 포함하는 인트론-삽입 암호화 서열로도 지칭된다. 특정 구현예에서, 인트론 중 적어도 하나는 비천연 또는 이종 인트론, 즉, 유전자의 천연 인트론과 상이한 서열을 갖는 인트론이다. 특정 구현예에서, 인트론-삽입 암호화 서열의 모든 인트론은 비천연 인트론이다. 비천연 인트론은 상이한 종으로부터의 인트론의 서열 또는 동일한 종으로부터의 또는 상이한 종으로부터의 상이한 유전자에서의 인트론의 서열을 가질 수 있다. 대안적으로 또는 추가적으로, 비천연 인트론 서열의 적어도 일부는 합성일 수 있다. 당업자는 비천연 인트론 서열이 당업계에 공지된 임의의 공동(consensus) 스플라이싱 모티프를 도입함으로써 RNA 스플라이싱을 매개하도록 설계될 수 있음을 이해할 것이다. 예시적인 공동 스플라이싱 모티프는 Sibley 등의 문헌[(2016) Nature Reviews Genetics, 17, 407-21]에 제공되며, 그 전문은 본원에 참조로서 통합된다. 비천연 인트론의 삽입은 벡터 패키징의 효율 및 견고성을 증진할 수 있는데, 이는 이러한 서열이 벡터가 최적의 크기(예를 들어, 4.5~4.8 kb)에 도달할 수 있도록 조정을 가능하게 하기 때문이다. 특정 구현예에서, 인트론 중 적어도 하나는 유전자의 천연 인트론이다. 특정 구현예에서, 인트론-삽입 암호화 서열의 모든 인트론은 유전자의 천연 인트론이다. 비천연 또는 천연 인트론은 암호화 서열 내 임의의 뉴클레오티드간 결합에 삽입될 수 있다. 특정 구현예에서, 하나 이상의 비천연 또는 천연 인트론은 효율적인 스플라이싱을 촉진하기 위해 예측된 뉴클레오티드간 결합에 삽입된다(예를 들어, Zhang (1998) Human Molecular Genetics, 7(5):919-32참조, 그 개시 내용은 그 전체가 참조로서 본원에 통합됨). 특정 구현예에서, 하나 이상의 비천연 또는 천연 인트론은 2개의 내인성 엑손을 연결하는 뉴클레오티드간 결합에 삽입된다. 따라서, 특정 구현예에서, 유전자의 인트론-삽입 암호화 서열은 효율적인 스플라이싱을 위해 설계된 하나 이상의 인트론을 포함한다. 특정 구현예에서, 하나 이상의 인트론은 (예를 들어, 인트론 매개 강화(IME)를 통해) 유전자의 발현을 향상시키기 위해 유전자의 암호화 서열 내에 삽입될 수 있다.
본원에서 사용되는 용어 "이종 인트론" 및 "비천연 인트론"은 주어진 유전자에 대해 천연이 아닌 인트론을 지칭한다.
본 개시에서, IDS 유전자에서의 뉴클레오티드 위치는 시작 코돈의 제1 뉴클레오티드와 관련하여 명시된다. 시작 코돈의 제1 뉴클레오티드는 위치 1이고; 시작 코돈의 제1 뉴클레오티드에 대한 5' 뉴클레오티드는 음의 수를 가지고; 시작 코돈의 제1 뉴클레오티드에 대한 3' 뉴클레오티드는 양의 수를 가진다. 인간 IDS 유전자의 예시적인 뉴클레오티드 1은 NCBI 참조 서열 NG_011900.3(등록 영역 NG_011900, 영역 5029..33347, 분류군 9606, 염색체 X, 맵 Xq28)의 뉴클레오티드 170이고, 인간 IDS 유전자의 예시적인 뉴클레오티드 3은 NCBI 참조 서열 NG_011900.3의 뉴클레오티드 172이다. 시작 코돈에 인접한 5' 뉴클레오티드는 뉴클레오티드 -1이다.
본원에서 사용되는 용어 "전사 조절 요소" 또는 "TRE"는 RNA 중합효소에 의해 작동 가능하게 연결된 뉴클레오티드 서열의 전사를 조절(예를 들어, 제어, 증가, 또는 감소)하여 RNA 분자를 형성하는 시스-작용 뉴클레오티드 서열, 예를 들어, DNA 서열을 지칭한다. TRE는 전사 인자와 같은 하나 이상의 트랜스-작용 분자에 의존하여 전사를 조절한다. 따라서, 하나의 TRE는, 예를 들어, 상이한 유형의 세포에 존재할 때, 상이한 트랜스-작용 분자와 접촉할 경우 상이한 방식으로 전사를 조절할 수 있다. TRE는 하나 이상의 프로모터 요소 및/또는 인핸서 요소를 포함할 수 있다. 당업자는, 유전자 내의 프로모터 및 인핸서 요소가 위치상 근접할 수 있고, 용어 "프로모터"는 프로모터 요소 및 인핸서 요소를 포함하는 서열을 지칭할 수 있음을 이해할 것이다. 따라서, 용어 "프로모터"는 서열에서의 인핸서 요소를 배제하지 않는다. 프로모터 및 인핸서 요소는 동일한 유전자 또는 종으로부터 유래될 필요가 없으며, 각각의 프로모터 또는 인핸서 요소의 서열은 게놈 내의 상응하는 내인성 서열과 동일하거나 실질적으로 동일할 수 있다.
본원에서 사용되는 용어 "작동 가능하게 연결된"은 TRE와 전사될 암호화 서열 사이의 연결을 설명하는 데 사용된다. 일반적으로, 유전자 발현은 하나 이상의 프로모터 및/또는 인핸서 요소를 포함하는 TRE의 조절 하에 배치된다. 암호화 서열의 전사가 TRE에 의해 제어되거나 영향을 받는 경우, 암호화 서열은 TRE에 "작동 가능하게 연결"된다. TRE의 프로모터 및 인핸서 요소는 원하는 전사 활성이 수득되는 한, 암호화 서열로부터 임의의 배향 및/또는 거리에 있을 수 있다. 특정 구현예에서, TRE는 암호화 서열로부터 상류에 있다.
본원에서 사용되는 용어 "폴리아데닐화 서열"은 RNA로 전사될 때 폴리아데닐화 신호 서열을 구성하는 DNA 서열을 지칭한다. 폴리아데닐화 서열은 (예를 들어, IDS 유전자로부터 유래된) 천연이거나 외인성일 수 있다. 외인성 폴리아데닐화 서열은 포유류 또는 바이러스 폴리아데닐화 서열(예를 들어, SV40 폴리아데닐화 서열)일 수 있다.
본원에서 사용되는 "외인성 폴리아데닐화 서열"은 IDS 유전자(예를 들어, 인간 IDS 유전자)의 내인성 폴리아데닐화 서열과 동일하지 않거나 실질적으로 동일하지 않은 폴리아데닐화 서열을 지칭한다. 특정 구현예에서, 외인성 폴리아데닐화 서열은 동일한 종(예를 들어, 인간)에서의 비-IDS 유전자의 폴리아데닐화 서열이다. 특정 구현예에서, 외인성 폴리아데닐화 서열은 상이한 종(예를 들어, 바이러스)의 폴리아데닐화 서열이다.
본원에서 사용되는, 대상체에게 AAV를 투여하는 맥락에서의 용어 "유효량"은 원하는 예방 효과 또는 치료 효과를 달성하는 AAV의 양을 지칭한다.
본원에서 사용되는 바와 같이, IDS 단백질의 발현 수준과 같은 측정 가능한 값을 지칭할 때, 용어 "약" 또는 "대략"은, 주어진 값 또는 범위의 ±20% 또는 ±10%, ±5%, ±1%, 또는 ±0.1%의 변이를 포함하고, 본원에 개시된 방법을 수행하기에 적절하다.
II.
아데노-연관 바이러스 조성물
일 양태에서, IDS 유전자 기능이 감소되거나 결함이 있는 세포에서 IDS 폴리펩티드를 발현시키는데 유용한 신규 rAAV 조성물이 본원에 제공된다. 특정 구현예에서, 본원에 개시된 AAV는 캡시드 단백질(예를 들어, AAV 클레이드 F 캡시드 단백질)을 포함하는 AAV 캡시드; 및 AAV가 형질도입된 세포에서 IDS의 염색체 외 발현을 가능하게 하는 인트론-삽입 IDS 암호화 서열(예를 들어, 침묵 변형된 인트론-삽입 IDS 암호화 서열)에 작동가능하게 연결된 전사 조절 요소를 포함하는 rAAV 게놈을 포함한다.
AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, 또는 AAV9 혈청형으로부터의 캡시드 단백질을 포함하되 이로 제한되지 않는, 당업계에 공지된 임의의 캡시드로부터의 캡시드 단백질이 본원에 개시된 rAAV 조성물에 사용될 수 있다. 예를 들어, 특정 구현예에서, 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 203 내지 736의 아미노산 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함한다. 특정 구현예에서, 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 203 내지 736의 아미노산 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하며, 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질 내 아미노산은 C이거나 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 내의 아미노산이 H이거나; 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질 내의 아미노산이 Q이거나; 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 내의 아미노산이 A이거나; 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 내의 아미노산이 N이거나; 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질 내의 아미노산이 S이거나; 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 내의 아미노산이 I이거나; 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 내의 아미노산이 G 또는 Y이거나; 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 내의 아미노산이 M이거나; 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질 내의 아미노산이 K이거나; 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 내의 아미노산이 C이거나; 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 내 아미노산은 G이다. 특정 구현예에서, 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 내 아미노산은 G이고; 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 내 아미노산은 G이다. 특정 구현예에서, 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 내 아미노산은 H이고; 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 내 아미노산은 N이고; 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내 아미노산은 R이고, 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 내 아미노산은 M이다. 특정 구현예에서, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내 아미노산은 R이고, 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 내 아미노산은 R이다. 특정 구현예에서, 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 내 아미노산은 A이고, 서열번번호 16의 아미노산 505에 상응하는 캡시드 단백질 내 아미노산은 R이다. 특정 구현예에서, 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 내 아미노산은 I이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내 아미노산은 R이고, 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 내 아미노산은 C이다. 특정 구현예에서, 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 203 내지 736의 아미노산 서열을 포함한다.
예를 들어, 특정 구현예에서, 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 138 내지 736의 아미노산 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함한다. 특정 구현예에서, 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 138 내지 736의 아미노산 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하며, 여기에서 서열번호 16의 아미노산 151에 상응하는 캡시드 단백질 내 아미노산은 R이거나; 서열번호 16의 아미노산 160에 상응하는 캡시드 단백질 내의 아미노산이 D이거나; 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질 내의 아미노산이 C이거나; 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 내의 아미노산이 H이거나; 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질 내의 아미노산이 Q이거나; 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 내의 아미노산이 A이거나; 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 내의 아미노산이 N이거나; 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질 내의 아미노산이 S이거나; 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 내의 아미노산이 I이거나; 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 내의 아미노산이 G 또는 Y이거나; 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 내의 아미노산이 M이거나; 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질 내의 아미노산이 K이거나; 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 내의 아미노산이 C이거나; 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 내의 아미노산은 G이다. 특정 구현예에서, 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 내의 아미노산은 G이고, 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 내의 아미노산은 G이다. 특정 구현예에서, 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 내의 아미노산은 H이고, 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 내의 아미노산은 N이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산은 R이고, 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 내의 아미노산은 M이다. 특정 구현예에서, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산은 R이고, 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 내의 아미노산은 R이다. 특정 구현예에서, 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 내의 아미노산은 A이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산은 R이다. 특정 구현예에서, 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 내의 아미노산은 I이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산은 R이고, 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 내 아미노산은 C이다. 특정 구현예에서, 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 138 내지 736의 아미노산 서열을 포함한다.
예를 들어, 특정 구현예에서, 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 1 내지 736의 아미노산 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함한다. 특정 구현예에서, 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 1 내지 736의 아미노산 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하며, 여기에서 서열번호 16의 아미노산 2에 상응하는 캡시드 단백질 내의 아미노산은 T이거나; 서열번호 16의 아미노산 65에 상응하는 캡시드 단백질 내의 아미노산이 I이거나; 서열번호 16의 아미노산 68에 상응하는 캡시드 단백질 내의 아미노산이 V이거나; 서열번호 16의 아미노산 77에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 서열번호 16의 아미노산 119에 상응하는 캡시드 단백질 내의 아미노산이 L이거나; 서열번호 16의 아미노산 151에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 서열번호 16의 아미노산 160에 상응하는 캡시드 단백질 내의 아미노산이 D이거나; 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질 내의 아미노산이 C이거나; 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 내의 아미노산이 H이거나; 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질 내의 아미노산이 Q이거나; 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 내의 아미노산이 A이거나; 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 내의 아미노산이 N이거나; 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질 내의 아미노산이 S이거나; 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 내의 아미노산이 I이거나; 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 내의 아미노산이 G 또는 Y이거나; 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 내의 아미노산이 M이거나; 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질 내의 아미노산이 K이거나; 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 내의 아미노산이 C이거나; 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 내의 아미노산은 G이다. 특정 구현예에서, 서열번호 16의 아미노산 2에 상응하는 캡시드 단백질 내의 아미노산은 T이고, 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질 내의 아미노산은 Q이다. 특정 구현예에서, 서열번호 16의 아미노산 65에 상응하는 캡시드 단백질 내의 아미노산은 I이고, 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 내의 아미노산은 Y이다. 특정 구현예에서, 서열번호 16의 아미노산 77에 상응하는 캡시드 단백질 내의 아미노산은 R이고, 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질 내의 아미노산은 K이다. 특정 구현예에서, 서열번호 16의 아미노산 119에 상응하는 캡시드 단백질 내의 아미노산은 L이고, 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질 내의 아미노산은 S이다. 특정 구현예에서, 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 내의 아미노산은 G이고, 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 내의 아미노산은 G이다. 특정 구현예에서, 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 내의 아미노산은 H이고, 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 내의 아미노산은 N이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산은 R이고, 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 내의 아미노산은 M이다. 특정 구현예에서, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산은 R이고, 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 내의 아미노산은 R이다. 특정 구현예에서, 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 내의 아미노산은 A이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산은 R이다. 특정 구현예에서, 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 내의 아미노산은 I이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산은 R이고, 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 내의 아미노산은 C이다. 특정 구현예에서 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 1 내지 736의 아미노산 서열을 포함한다.
특정 구현예에서, AAV 캡시드 단백질은 다음 중 둘 이상을 포함한다: (a) 서열번호 1, 2, 3, 4, 6, 7, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 203 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 1, 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 138 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 1 내지 736의 아미노산 서열을 포함하는 캡시드 단백질. 특정 구현예에서, AAV 캡시드 단백질은 다음을 포함한다: (a) 서열번호 1, 2, 3, 4, 6, 7, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 203 내지 736으로 이루어진 아미노산 서열을 갖는 캡시드 단백질; (b) 서열번호 1, 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 138 내지 736으로 이루어진 아미노산 서열을 갖는 캡시드 단백질; 및 (c) 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 1 내지 736으로 이루어진 아미노산 서열을 갖는 캡시드 단백질.
특정 구현예에서, AAV 캡시드 단백질은 다음 중 하나 이상을 포함한다: (a)서열번호 8의 아미노산 203 내지 736의 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 8의 아미노산 138 내지 736의 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 8의 아미노산 1 내지 736의 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질. 특정 구현예에서, AAV 캡시드는 다음 중 하나 이상을 포함한다: (a) 서열번호 8의 아미노산 203 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 8의 아미노산 138 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 8의 아미노산 1 내지 736의 아미노산 서열을 포함하는 캡시드 단백질. 특정 구현예에서, AAV 캡시드는 다음 중 둘 이상을 포함한다: (a) 서열번호 8의 아미노산 203 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 8의 아미노산 138 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 8의 아미노산 1 내지 736의 아미노산 서열을 포함하는 캡시드 단백질. 특정 구현예에서, AAV 캡시드는 다음을 포함한다: (a) 서열번호 8의 아미노산 203 내지 736으로 이루어진 아미노산 서열을 갖는 캡시드 단백질; (b) 서열번호 8의 아미노산 138 내지 736으로 이루어진 아미노산 서열을 갖는 캡시드 단백질; 및 (c) 서열번호 8의 아미노산 1 내지 736으로 이루어진 아미노산 서열을 갖는 캡시드 단백질.
특정 구현예에서, AAV 캡시드 단백질은 다음 중 하나 이상을 포함한다: (a) 서열번호 11의 아미노산 203 내지 736의 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 11의 아미노산 138 내지 736의 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 11의 아미노산 1 내지 736의 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질. 특정 구현예에서, AAV 캡시드는 다음 중 하나 이상을 포함한다: (a) 서열번호 11의 아미노산 203 내지 736의 아미노산 서열을 포함하는 캡시드 단백질;. (b) 서열번호 11의 아미노산 138 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 11의 아미노산 1 내지 736의 아미노산 서열을 포함하는 캡시드 단백질. 특정 구현예에서, AAV 캡시드는 다음 중 둘 이상을 포함한다: (a) 서열번호 11의 아미노산 203 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 11의 아미노산 138 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 11의 아미노산 1 내지 736의 아미노산 서열을 포함하는 캡시드 단백질. 특정 구현예에서, AAV 캡시드는 다음을 포함한다: (a) 서열번호 11의 아미노산 203 내지 736으로 이루어진 아미노산 서열을 갖는 캡시드 단백질; (b) 서열번호 11의 아미노산 138 내지 736으로 이루어진 아미노산 서열을 갖는 캡시드 단백질; 및 (c) 서열번호 11의 아미노산 1 내지 736으로 이루어진 아미노산 서열을 갖는 캡시드 단백질.
특정 구현예에서, AAV 캡시드 단백질은 다음 중 하나 이상을 포함한다: (a) 서열번호 13의 아미노산 203 내지 736의 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 13의 아미노산 138 내지 736의 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 13의 아미노산 1 내지 736의 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질. 특정 구현예에서, AAV 캡시드는 다음 중 하나 이상을 포함한다: (a) 서열번호 13의 아미노산 203 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 13의 아미노산 138 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 13의 아미노산 1 내지 736의 아미노산 서열을 포함하는 캡시드 단백질. 특정 구현예에서, AAV 캡시드는 다음 중 둘 이상을 포함한다: (a) 서열번호 13의 아미노산 203 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 13의 아미노산 138 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 13의 아미노산 1 내지 736의 아미노산 서열을 포함하는 캡시드 단백질. 특정 구현예에서, AAV 캡시드는 다음을 포함한다: (a) 서열번호 13의 아미노산 203 내지 736으로 이루어진 아미노산 서열을 갖는 캡시드 단백질; (b) 서열번호 13의 아미노산 138 내지 736으로 이루어진 아미노산 서열을 갖는 캡시드 단백질; 및 (c) 서열번호 13의 아미노산 1 내지 736으로 이루어진 아미노산 서열을 갖는 캡시드 단백질.
특정 구현예에서, AAV 캡시드 단백질은 다음 중 하나 이상을 포함한다: (a) 서열번호 16의 아미노산 203 내지 736의 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 16의 아미노산 138 내지 736의 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 16의 아미노산 1 내지 736의 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질. 특정 구현예에서, AAV 캡시드는 다음 중 하나 이상을 포함한다: (a) 서열번호 16의 아미노산 203 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 16의 아미노산 138 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 16의 아미노산 1 내지 736의 아미노산 서열을 포함하는 캡시드 단백질. 특정 구현예에서, AAV 캡시드는 다음 중 둘 이상을 포함한다: (a) 서열번호 16의 아미노산 203 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 16의 아미노산 138 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 16의 아미노산 1 내지 736의 아미노산 서열을 포함하는 캡시드 단백질. 특정 구현예에서, AAV 캡시드는 다음을 포함한다: (a) 서열번호 16의 아미노산 203 내지 736으로 이루어진 아미노산 서열을 갖는 캡시드 단백질; (b) 서열번호 16의 아미노산 138 내지 736으로 이루어진 아미노산 서열을 갖는 캡시드 단백질; 및 (c) 서열번호 16의 아미노산 1 내지 736으로 이루어진 아미노산 서열을 갖는 캡시드 단백질.
본원에 개시된 AAV 조성물에 유용한 rAAV 게놈은 일반적으로 인트론-삽입 IDS 암호화 서열에 작동 가능하게 연결된 전사 조절 요소(TRE)를 포함한다. 특정 구현예에서, rAAV 게놈은 TRE 및 인트론-삽입 IDS 암호화 서열의 5' 역위 말단 반복(5' ITR) 뉴클레오티드 서열 5', 및 TRE 및 인트론-삽입 IDS 암호화 서열의 3' 역위 말단 반복(3' ITR) 뉴클레오티드 서열 3'을 포함한다.
특정 구현예에서, 인트론-삽입 IDS 암호화 서열은 IDS 유전자의 암호화 서열의 전부 또는 실질적으로 전부를 포함한다. 특정 구현예에서, rAAV 게놈은 서열번호 23을 암호화하는 뉴클레오티드 서열을 포함하고, 선택적으로 인트론-삽입 IDS 암호화 서열의 3'에 외인성 폴리아데닐화 서열을 추가로 포함할 수 있다. 특정 구현예에서, 서열번호 23을 암호화하는 인트론-삽입 IDS 암호화 서열의 뉴클레오티드 서열은 야생형이다(예를 들어, 서열번호 25에 제시된 서열을 가짐). 특정 구현예에서, 서열번호 23을 암호화하는 인트론-삽입 IDS 암호화 서열의 뉴클레오티드 서열은 침묵 변형된다(예를 들어, 서열번호 27, 59, 또는 60에 제시된 서열을 가짐).
특정 구현예에서, 인트론-삽입 IDS 암호화 서열은 IDS 단백질의 아미노산 서열의 전부 또는 실질적으로 전부를 포함하는 폴리펩티드를 암호화한다. 특정 구현예에서, 인트론-삽입 IDS 암호화 서열은 야생형 IDS 단백질(예를 들어, 인간 IDS 단백질)의 아미노산 서열을 암호화한다. 특정 구현예에서, 인트론-삽입 IDS 암호화 서열은 돌연변이 IDS 단백질(예를 들어, 인간 IDS 단백질)의 아미노산 서열을 암호화하며, 여기에서 돌연변이 IDS 폴리펩티드는 야생형 IDS 폴리펩티드의 기능적 균등물이다. 즉, 야생형 IDS 폴리펩티드로서 기능할 수 있다. 특정 구현예에서, 기능적으로 균등한 IDS 폴리펩티드는 야생형 IDS 폴리펩티드에서 발견되지 않는 적어도 하나의 특성, 예를 들어, 단백질 분해에 저항하는 능력을 추가로 포함한다.
특정 구현예에서, 본원에 개시된 AAV 조성물에 유용한 rAAV 게놈은 일반적으로 IDS를 암호화하는 인트론-삽입 암호화 서열에 작동 가능하게 연결된 전사 조절 요소(TRE)를 포함한다.
rAAV 게놈은 임의의 포유류 세포(예를 들어, 인간 세포)에서 IDS를 발현하는데 사용될 수 있다. 따라서, TRE는 임의의 포유류 세포(예를 들어, 인간 세포)에서 활성일 수 있다. 특정 구현예에서, TRE는 광범위한 인간 세포에서 활성이다. 이러한 TRE는 거대세포바이러스(CMV) 프로모터/인핸서(예를 들어, 서열번호 29, 40, 또는 46에 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 뉴클레오티드 서열을 포함함), SV40 프로모터, 닭 ACTB 프로모터(예를 들어, 서열번호 47에 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 뉴클레오티드 서열을 포함함), JeT 프로모터(예를 들어, 서열번호 30에 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 뉴클레오티드 서열을 포함함), smCBA 프로모터(예를 들어, 서열번호 55에 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 뉴클레오티드 서열을 포함함), 인간 신장 인자 1 알파(EF1α) 프로모터(예를 들어, 서열번호 39에 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 뉴클레오티드 서열을 포함함), 전사 인자 결합 부위를 포함하는 미세 생쥐 바이러스(MVM) 인트론(예를 들어, 서열번호 33에 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 뉴클레오티드 서열을 포함함), 인간 포스포글리세레이트 키나아제(PGK1) 프로모터, 인간 유비퀴틴 C(Ubc) 프로모터, 인간 베타 액틴 프로모터, 인간 뉴런-특이적 에놀라아제(ENO2) 프로모터, 인간 베타-글루쿠로니다아제(GUSB) 프로모터, 토끼 베타-글로빈 요소(예를 들어, 서열번호 41에 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 뉴클레오티드 서열을 포함함), 인간 칼모둘린 1(CALM1) 프로모터(예를 들어, 서열번호 44에 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 뉴클레오티드 서열을 포함함), 및/또는 인간 메틸-CpG 결합 단백질 2(MeCP2) 프로모터를 포함하는 구성 프로모터 및/또는 인핸서 요소를 포함할 수 있다. 이들 TRE 중 어느 하나는 효율적인 전사를 유도하기 위해 임의의 순서로 조합될 수 있다. 예를 들어, rAAV 게놈은 CMV 인핸서, CBA 프로모터, 및 집합적으로 CAG 프로모터로 지칭되는 토끼 베타-글로빈 유전자의 엑손 3의 스플라이싱 수용체를 포함할 수 있다(예를 들어, 서열번호 42와 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 뉴클레오티드 서열을 포함함). 예를 들어, rAAV 게놈은 집합적으로 CASI 프로모터 영역으로 지칭되는 CMV 인핸서 및 CBA 프로모터, 및 이에 이어지는 스플라이싱 공여자 및 스플라이싱 수용체를 포함할 수 있다(예를 들어, 서열번호 48과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 뉴클레오티드 서열을 포함함).
대안적으로, TRE는 조직-특이적 TRE일 수 있는데, 즉, 특정 조직(들) 및/또는 기관(들)에서 활성이다. 조직-특이적 TRE는 하나 이상의 조직-특이적 프로모터 및/또는 인핸서 요소, 및 선택적으로 하나 이상의 구성 프로모터 및/또는 인핸서 요소를 포함한다. 당업자는 조직-특이적 프로모터 및/또는 인핸서 요소가 당업계에 공지된 방법에 의해 조직에서 특이적으로 발현된 유전자로부터 단리될 수 있음을 이해할 것이다.
특정 구현예에서, TRE는 뇌-특이적(예를 들어, 뉴런-특이적, 신경교세포-특이적, 성상교세포-특이적, 희소돌기교세포-특이적, 미세교세포-특이적 및/또는 중추 신경계-특이적)이다. 예시적인 뇌-특이적 TRE는, 제한 없이, 인간 신경교 섬유소 산성 단백질(GFAP) 프로모터, 인간 시냅신 1(SYN1) 프로모터, 인간 시냅신 2(SYN2) 프로모터, 인간 메탈로티오네인 3(MT3) 프로모터, 및/또는 인간 프로테오리피드 단백질 1(PLP1) 프로모터로부터의 하나 이상의 요소를 포함할 수 있다. 더 많은 뇌-특이적 프로모터 요소가 WO2016/100575A1에 개시되어 있으며, 이는 그 전체가 참조로서 본원에 통합된다.
특정 구현예에서, rAAV 게놈은 전술한 TRE 중 적어도 하나를 선택적으로 포함하는, 2개 이상의 TRE를 포함한다. 당업자는 이들 TRE 중 임의의 것이 임의의 순서로 조합될 수 있고, 구성 TRE 및 조직-특이적 TRE의 조합이 효율적이고 조직-특이적인 전사를 유도할 수 있음을 이해할 것이다.
특정 구현예에서, rAAV 벡터는 IDS 암호화 서열의 5'에 또는 이에 삽입된 인트론을 추가로 포함한다. 이러한 인트론은, 예를 들어, 전사 침묵을 감소시키고 핵에서 세포질로 mRNA를 내보내는 것을 향상시킴으로써 이식유전자 발현을 증가시킬 수 있다. 특정 구현예에서, rAAV 게놈은 5'에서 3'으로 비암호화 엑손, 인트론, 및 IDS 암호화 서열을 포함한다. 특정 구현예에서, 인트론 서열은 IDS 암호화 서열에 삽입되되, 선택적으로, 인트론은 2개의 천연 엑손을 연결하는 뉴클레오티드 간 결합에 삽입된다. 특정 구현예에서, 인트론은 천연 엑손 1 및 엑손 2를 연결하는 뉴클레오티드간 결합에 삽입된다.
인트론은 IDS 유전자의 천연 인트론 서열, 상이한 종으로부터 또는 동일한 종으로부터의 상이한 유전자로부터의 인트론 서열(즉, 비천연 또는 이종 인트론), 및/또는 합성 인트론 서열을 포함할 수 있다. 당업자는 합성 인트론 서열이 당업계에 공지된 임의의 공통 스플라이싱 모티프를 도입함으로써 RNA 스플라이싱을 매개하도록 설계될 수 있음을 이해할 것이다(예를 들어, Sibley 등의 문헌[(2016) Nature Reviews Genetics, 17, 407-21 참조, 이는 그 전체가 본원에 참조로서 통합됨). 예시적인 인트론 서열은 Lu등의 문헌 [(2013) Molecular Therapy 21(5): 954-63], 및 Lu 등의 문헌 [(2017) Hum. Gene Ther. 28(1): 125-34]에 제공되며, 그 전체가 참조로서 본원에 통합된다. 특정 구현예에서, rAAV 게놈은 SV40 요소(예를 들어, 서열번호 31과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 뉴클레오티드 서열을 포함함) 또는 마우스의 미세 바이러스(MVM) 인트론(예를 들어, 서열번호 33과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 뉴클레오티드 서열을 포함함)을 포함한다. 특정 구현예에서, rAAV 게놈은 SV40 요소(예를 들어, 서열번호 31에 제시된 뉴클레오티드 서열을 포함함) 또는 마우스의 미세 바이러스(MVM) 인트론(예를 들어, 서열번호 33에 제시된 뉴클레오티드 서열을 포함함)을 포함한다. 특정 구현예에서, rAAV 게놈은, 부분적으로 전사되지 않은 닭 ACTB(cACTB) 프로모터, 모든 cACTB 엑손 1, 부분적으로 cACTB 인트론 1, 부분적으로 토끼 HBB2(rHBB2) 인트론 2, 및 부분적으로 rHBB2 엑손 3을 포함하는, 닭 및 토끼 서열의 조합을 포함하는 키메라 인트론 서열(예를 들어, 서열번호 32)을 포함한다. 특정 구현예에서, rAAV 게놈은 키메라 인트론 서열(예를 들어, 서열번호 32와 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 뉴클레오티드 서열을 포함함)을 포함한다. 특정 구현예에서, rAAV 게놈은 키메라 인트론 서열(예를 들어, 서열번호 32에 제시된 뉴클레오티드 서열을 포함함)을 포함한다.
특정 구현예에서, rAAV 게놈은 CMV 인핸서, CBA 프로모터, 및 키메라 인트론 서열(예를 들어, 서열번호 36과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 뉴클레오티드 서열을 포함함)을 포함하는 TRE를 포함한다. 특정 구현예에서, rAAV 게놈은 서열번호 36을 포함하는 TRE를 포함한다.
특정 구현예에서, rAAV 게놈은 서열번호 29와 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 뉴클레오티드 서열을 포함하는 TRE를 포함한다. 특정 구현예에서, rAAV 게놈은 서열번호 29를 포함하는 TRE를 포함한다.
특정 구현예에서, 본원에서 개시된 rAAV 게놈은 전사 종결자(예를 들어, 폴리아데닐화 서열)를 추가로 포함한다. 특정 구현예에서, 전사 종결자는 인트론-삽입 IDS 암호화 서열에 대해 3'이다. 전사 종결자는 전사를 효과적으로 종료하는 임의의 서열일 수 있고, 당업자는 이러한 서열이 인트론-삽입 IDS 암호화 서열의 전사가 필요한 세포에서 발현되는 임의의 유전자로부터 단리될 수 있음을 이해할 것이다. 특정 구현예에서, 전사 종결자는 폴리아데닐화 서열을 포함한다. 특정 구현예에서, 폴리아데닐화 서열은 인간 IDS 유전자의 내인성 폴리아데닐화 서열과 동일하거나 실질적으로 동일하다. 특정 구현예에서, 폴리아데닐화 서열은 외인성 폴리아데닐화 서열이다. 특정 구현예에서, 폴리아데닐화 서열은 SV40 폴리아데닐화 서열(예를 들어, 서열번호 34, 35, 또는 45에 제시된 뉴클레오티드 서열, 또는 이에 상보적인 뉴클레오티드 서열을 포함함)이다. 특정 구현예에서, 폴리아데닐화 서열은 서열번호 45에 제시된 서열을 포함한다.
특정 구현예에서, rAAV 게놈은 5'에서 3'으로 TRE, 인트론-삽입 IDS 암호화 서열, 및 폴리아데닐화 서열을 포함한다. 특정 구현예에서, TRE는 서열번호 29, 30, 31, 32, 33, 35, 36, 39, 40, 41, 42, 44, 46, 47, 48, 및/또는 55 중 어느 하나에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖고/갖거나; 인트론-삽입 IDS 암호화 서열은 서열번호 25, 27, 59 또는 60에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖고/갖거나; 폴리아데닐화 서열은 서열번호 34, 35 또는 45 중 어느 하나에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는다.
특정 구현예에서, TRE는 서열 번호 29에 제시된 뉴클레오티드 서열을 포함하고/하거나; 인트론-삽입 IDS 암호화 서열은 서열번호 25에 제시된 서열을 포함하고/하거나; 폴리아데닐화 서열은 서열번호 45에 제시된 서열을 포함한다.
특정 구현예에서, TRE는 서열 번호 29에 제시된 뉴클레오티드 서열을 포함하고/하거나; 인트론-삽입 IDS 암호화 서열은 서열번호 27에 제시된 서열을 포함하고/하거나; 폴리아데닐화 서열은 서열번호 45에 제시된 서열을 포함한다.
특정 구현예에서, TRE는 서열 번호 29에 제시된 뉴클레오티드 서열을 포함하고/하거나; 인트론-삽입 IDS 암호화 서열은 서열번호 59에 제시된 서열을 포함하고/하거나; 폴리아데닐화 서열은 서열번호 45에 제시된 서열을 포함한다.
특정 구현예에서, TRE는 서열 번호 29에 제시된 뉴클레오티드 서열을 포함하고/하거나; 인트론-삽입 IDS 암호화 서열은 서열번호 60에 제시된 서열을 포함하고/하거나; 폴리아데닐화 서열은 서열번호 45에 제시된 서열을 포함한다.
특정 구현예에서, rAAV 게놈은 서열번호 37, 43, 52, 54, 61, 63, 65, 69, 75, 또는 77과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 포함한다. 특정 구현예에서, rAAV 게놈은 서열번호 37, 43, 52, 54, 61, 63, 65, 69, 75, 또는 77에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, rAAV 게놈의 뉴클레오티드 서열은 서열번호 37, 43, 52, 54, 61, 63, 65, 69, 75, 또는 77에 제시된 뉴클레오티드 서열로 이루어진다. 특정 구현예에서, rAAV 게놈은 서열번호 37에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, rAAV 게놈의 뉴클레오티드 서열은 서열번호 37에 제시된 뉴클레오티드 서열로 이루어진다. 특정 구현예에서, rAAV 게놈은 서열번호 43에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, rAAV 게놈의 뉴클레오티드 서열은 서열번호 43에 제시된 뉴클레오티드 서열로 이루어진다. 특정 구현예에서, rAAV 게놈은 서열번호 52에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, rAAV 게놈의 뉴클레오티드 서열은 서열번호 52에 제시된 뉴클레오티드 서열로 이루어진다. 특정 구현예에서, rAAV 게놈은 서열번호 54에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, rAAV 게놈의 뉴클레오티드 서열은 서열번호 54에 제시된 뉴클레오티드 서열로 이루어진다. 특정 구현예에서, rAAV 게놈은 서열번호 61에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, rAAV 게놈의 뉴클레오티드 서열은 서열번호 61에 제시된 뉴클레오티드 서열로 이루어진다. 특정 구현예에서, rAAV 게놈은 서열번호 63에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, rAAV 게놈의 뉴클레오티드 서열은 서열번호 63에 제시된 뉴클레오티드 서열로 이루어진다. 특정 구현예에서, rAAV 게놈은 서열번호 65에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, rAAV 게놈의 뉴클레오티드 서열은 서열번호 65에 제시된 뉴클레오티드 서열로 이루어진다. 특정 구현예에서, rAAV 게놈은 서열번호 69에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, rAAV 게놈의 뉴클레오티드 서열은 서열번호 69에 제시된 뉴클레오티드 서열로 이루어진다. 특정 구현예에서, rAAV 게놈은 서열번호 75에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, rAAV 게놈의 뉴클레오티드 서열은 서열번호 75에 제시된 뉴클레오티드 서열로 이루어진다. 특정 구현예에서, rAAV 게놈은 서열번호 77에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, rAAV 게놈의 뉴클레오티드 서열은 서열번호 77에 제시된 뉴클레오티드 서열로 이루어진다.
특정 구현예에서, 본원에 개시된 rAAV 게놈은 TRE의 5'에 5' 역위 말단 반복(5' ITR) 뉴클레오티드 서열, 및 IDS 암호화 서열의 3'에 3' 역위 말단 반복(3' ITR) 뉴클레오티드 서열을 추가로 포함한다. 임의의 AAV 혈청형 또는 이의 변이체로부터의 ITR 서열은 본원에 개시된 rAAV 게놈에 사용될 수 있다. 5' 및 3' ITR은 동일한 혈청형의 AAV 또는 상이한 혈청형의 AAV로부터 유래할 수 있다. 본원에 개시된 rAAV 게놈에 사용하기 위한 예시적인 ITR은 본원에서 서열번호 14, 18~21, 28, 49, 51, 57, 및 72~74에 제시되어 있다.
특정 구현예에서, 5' ITR 또는 3' ITR은 AAV2로부터 유래한다. 특정 구현예에서, 5' ITR 및 3' ITR 둘 모두는 AAV2로부터 유래한다. 특정 구현예에서, 5' ITR 뉴클레오티드 서열은 서열번호 18에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖거나, 3' ITR 뉴클레오티드 서열은 서열번호 14에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는다. 특정 구현예에서, 5' ITR 뉴클레오티드 서열은 서열번호 18에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 가지며, 3' ITR 뉴클레오티드 서열은 서열번호 14에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는다. 특정 구현예에서, rAAV 게놈은 서열번호 37, 43, 52, 또는 54 중 어느 하나에 제시된 뉴클레오티드 서열, 서열번호 18의 서열을 갖는 5' ITR 뉴클레오티드 서열, 및 서열번호 14의 서열을 갖는 3' ITR 뉴클레오티드 서열을 포함한다.
특정 구현예에서, 5' ITR 또는 3' ITR은 AAV2로부터 유래한다. 특정 구현예에서, 5' ITR 및 3' ITR 둘 모두는 AAV2로부터 유래한다. 특정 구현예에서, 5' ITR 뉴클레오티드 서열은 서열번호 18에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖거나, 3' ITR 뉴클레오티드 서열은 서열번호 19에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는다. 특정 구현예에서, 5' ITR 뉴클레오티드 서열은 서열번호 18에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 가지며, 3' ITR 뉴클레오티드 서열은 서열번호 19에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는다. 특정 구현예에서, rAAV 게놈은 서열번호 37, 43, 52, 또는 54 중 어느 하나에 제시된 뉴클레오티드 서열, 서열번호 18의 서열을 갖는 5' ITR 뉴클레오티드 서열, 및 서열번호 19의 서열을 갖는 3' ITR 뉴클레오티드 서열을 포함한다.
특정 구현예에서, 5' ITR 또는 3' ITR은 AAV5로부터 유래한다. 특정 구현예에서, 5' ITR 및 3' ITR 둘 모두는 AAV5로부터 유래한다. 특정 구현예에서, 5' ITR 뉴클레오티드 서열이 서열번호 20에 대해 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖거나, 3' ITR 뉴클레오티드 서열이 서열번호 21에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는다. 특정 구현예에서, 5' ITR 뉴클레오티드 서열은 서열번호 20에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 가지며, 3' ITR 뉴클레오티드 서열은 서열번호 21에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는다. 특정 구현예에서, rAAV 게놈은 서열번호 37, 43, 52, 또는 54 중 어느 하나에 제시된 뉴클레오티드 서열, 서열번호 20의 서열을 갖는 5' ITR 뉴클레오티드 서열, 및 서열번호 21의 서열을 갖는 3' ITR 뉴클레오티드 서열을 포함한다.
특정 구현예에서, 5' ITR 뉴클레오티드 서열 및 3' ITR 뉴클레오티드 서열은 서로 실질적으로 상보적(예를 들어, 5' 또는 3' ITR에서 1, 2, 3, 4 또는 5개의 뉴클레오티드 위치에서의 불일치를 제외하고 서로 상보적임)이다.
특정 구현예에서, 5' ITR 또는 3' ITR은 Rep 단백질("비-분해성 ITR")에 의한 분해능을 감소시키거나 폐지하도록 변형된다. 특정 구현예에서, 비-분해성 ITR은 말단 분해 부위의 뉴클레오티드 서열에 삽입, 결실, 또는 치환을 포함한다. 이러한 변형은 rAAV 게놈이 감염된 세포에서 복제된 후 AAV의 자가-상보성, 이중-가닥 DNA 게놈의 형성을 가능하게 한다. 예시적인 비-분해성 ITR 서열은 당업계에 공지되어 있다(예를 들어, 미국 특허 제7,790,154호 및 제9,783,824호에 제공된 것들을 참조하며, 이들은 그 전체가 참조로서 본원에 통합됨). 특정 구현예에서, 5' ITR은 서열번호 49와 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 뉴클레오티드 서열을 포함한다. 특정 구현예에서, 5' ITR은 서열번호 49와 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 뉴클레오티드 서열로 이루어진다. 특정 구현예에서, 5' ITR은 서열번호 49에 제시된 뉴클레오티드 서열로 이루어진다. 특정 구현예에서, 3' ITR은 서열번호 51과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 뉴클레오티드 서열을 포함한다. 특정 구현예에서, 5' ITR은 서열번호 51과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 뉴클레오티드 서열로 이루어진다. 특정 구현예에서, 3' ITR은 서열번호 51에 제시된 뉴클레오티드 서열로 이루어진다. 특정 구현예에서, 5' ITR은 서열번호 49에 제시된 뉴클레오티드 서열로 이루어지고, 3' ITR은 서열번호 51에 제시된 뉴클레오티드 서열로 이루어진다. 특정 구현예에서, 5' ITR은 서열번호 49에 제시된 뉴클레오티드 서열로 이루어지고, 3' ITR은 서열번호 14에 제시된 뉴클레오티드 서열로 이루어진다.
특정 구현예에서, 5' ITR은 야생형 AAV2 게놈 서열로부터 유래된 추가의 뉴클레오티드 서열의 측면에 위치한다. 특정 구현예에서, 5' ITR은 야생형 AAV2 ITR에 인접한 야생형 AAV2 서열로부터 유래된 추가의 46 bp 서열의 측면에 위치한다. 특정 구현예에서, 추가의 46 bp 서열은 5' ITR의 내부에 있다. 특정 구현예에서, 46 bp 서열은 서열 번호 71에 제시된 서열로 이루어진다. 특정 구현예에서, 5' ITR은 서열번호 71과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 뉴클레오티드 서열을 포함한다. 특정 구현예에서, 5' ITR은 서열 번호 72 또는 73에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, 5' ITR의 뉴클레오티드 서열은 서열번호 72 또는 73과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 뉴클레오티드 서열로 이루어진다. 특정 구현예에서, 5' ITR의 뉴클레오티드 서열은 서열번호 72 또는 73에 제시된 뉴클레오티드 서열로 이루어진다.
특정 구현예에서, 3' ITR은 야생형 AAV2 게놈 서열로부터 유래된 추가의 뉴클레오티드 서열의 측면에 위치한다. 특정 구현예에서, 3' ITR은 야생형 AAV2 ITR에 인접한 야생형 AAV2 서열로부터 유래된 추가의 37 bp 서열의 측면에 위치한다. 예를 들어, Savy 등의 문헌[Human Gene Therapy Methods (2017) 28(5): 277-289]을 참조한다(이는 그 전체가 본원에 참조로서 통합됨). 특정 구현예에서, 추가의 37 bp 서열은 3' ITR의 내부에 있다. 특정 구현예에서, 37 bp 서열은 서열번호 56에 제시된 서열로 이루어진다. 특정 구현예에서, 3' ITR은 서열번호 28, 57 또는 74와 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 뉴클레오티드 서열을 포함한다. 특정 구현예에서, 3' ITR은 서열 번호 28, 57, 또는 74에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, 3' ITR의 뉴클레오티드 서열은 서열번호 28, 57 또는 74와 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 뉴클레오티드 서열로 이루어진다. 특정 구현예에서, 3' ITR의 뉴클레오티드 서열은 서열번호 28, 57, 또는 74에 제시된 뉴클레오티드 서열로 이루어진다.
특정 구현예에서, rAAV 게놈은 5'에서 3'으로 5' ITR; 본원에 개시된 바와 같이, 5'에서 3'으로 TRE, 선택적으로 비암호화 엑손 및 인트론, 인트론-삽입 IDS 암호화 서열, 및 폴리아데닐화 서열을 포함하는 내부 요소; 비-분해성 ITR; 내부 요소에 상보적인 뉴클레오티드 서열; 및 3' ITR을 포함한다. 이러한 rAAV 게놈은 감염 후 및 복제 전에 AAV의 자가-상보성, 이중-가닥 DNA 게놈을 형성할 수 있다.
특정 구현예에서, rAAV 게놈은 5'에서 3'으로 5' ITR, TRE, 인트론-삽입 IDS 암호화 서열, 폴리아데닐화 서열, 및 3' ITR을 포함한다. 특정 구현예에서, 5' ITR은 서열번호 18, 20, 49, 또는 73과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖고/가지거나; TRE는 서열번호 29, 30, 31, 32, 33, 35, 36, 39, 40, 41, 42, 44, 46, 47, 48, 및/또는 55 중 어느 하나에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 가지고/가지거나; 인트론-삽입 IDS 암호화 서열은 서열번호 25, 27, 59 또는 60에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%,또는 99%의 서열 동일성을 가지고/가지거나; 폴리아데닐화 서열은 서열번호 34, 35 또는 45 중 어느 하나와 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 가지고/가지거나; 3' ITR은 서열번호 14, 19, 21, 28, 51, 57, 또는 74에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는다. 특정 구현예에서, 5' ITR은 서열번호 18, 20, 49, 또는 73으로 이루어진 군으로부터 선택되는 뉴클레오티드 서열을 포함하거나 이로 이루어지고/이루어지거나; TRE는 서열번호 29, 30, 31, 32, 33, 35, 36, 39, 40, 41, 42, 44, 46, 47, 48, 및/또는 55로 이루어진 군으로부터 선택된 뉴클레오티드 서열을 포함하고/하거나; 인트론-삽입 IDS 암호화 서열은 서열번호 25, 27, 59, 또는 60에 제시된 서열을 포함하고/하거나; 폴리아데닐화 서열은 서열번호 34, 35 또는 45로 이루어진 군으로부터 선택된 뉴클레오티드 서열을 포함하고/하거나; 3' ITR은 서열번호 14, 19, 21, 28, 51, 57, 또는 74로 이루어진 군으로부터 선택된 뉴클레오티드 서열을 포함하거나 이로 이루어진다.
특정 구현예에서, 5' ITR은 서열번호 18 또는 49에 제시된 서열을 포함하거나 이로 이루어지고/이루어지거나; TRE는 서열번호 29에 제시된 서열을 포함하고/하거나; 인트론-삽입 IDS 암호화 서열은 서열번호 25, 27, 59, 또는 60에 제시된 서열을 포함하고/하거나; 폴리아데닐화 서열은 서열번호 45에 제시된 서열을 포함하고/하거나; 3' ITR은 서열번호 14 또는 51에 제시된 서열을 포함하거나 이로 이루어진다.
특정 구현예에서, 5' ITR은 서열번호 49에 제시된 서열을 포함하거나 이로 이루어지고/이루어지거나; TRE는 서열번호 29에 제시된 서열을 포함하고/하거나; 인트론-삽입 IDS 암호화 서열은 서열번호 25에 제시된 서열을 포함하고/하거나; 폴리아데닐화 서열은 서열번호 45에 제시된 서열을 포함하고/하거나; 3' ITR은 서열번호 51에 제시된 서열을 포함하거나 이로 이루어진다.
특정 구현예에서, 5' ITR은 서열번호 49에 제시된 서열을 포함하거나 이로 이루어지고/이루어지거나; TRE는 서열번호 29에 제시된 서열을 포함하고/하거나; 인트론-삽입 IDS 암호화 서열은 서열번호 25에 제시된 서열을 포함하고/하거나; 폴리아데닐화 서열은 서열번호 45에 제시된 서열을 포함하고/하거나; 3' ITR은 서열번호 14에 제시된 서열을 포함하거나 이로 이루어진다.
특정 구현예에서, 5' ITR은 서열번호 49에 제시된 서열을 포함하거나 이로 이루어지고/이루어지거나; TRE는 서열번호 29에 제시된 서열을 포함하고/하거나; 인트론-삽입 IDS 암호화 서열은 서열번호 27에 제시된 서열을 포함하고/하거나; 폴리아데닐화 서열은 서열번호 45에 제시된 서열을 포함하고/하거나; 3' ITR은 서열번호 14에 제시된 서열을 포함하거나 이로 이루어진다.
특정 구현예에서, 5' ITR은 서열번호 18에 제시된 서열을 포함하거나 이로 이루어지고/이루어지거나; TRE는 서열번호 29에 제시된 서열을 포함하고/하거나; 인트론-삽입 IDS 암호화 서열은 서열번호 25에 제시된 서열을 포함하고/하거나; 폴리아데닐화 서열은 서열번호 45에 제시된 서열을 포함하고/하거나; 3' ITR은 서열번호 14에 제시된 서열을 포함하거나 이로 이루어진다.
특정 구현예에서, 5' ITR은 서열번호 18에 제시된 서열을 포함하거나 이로 이루어지고/이루어지거나; TRE는 서열번호 29에 제시된 서열을 포함하고/하거나; 인트론-삽입 IDS 암호화 서열은 서열번호 27에 제시된 서열을 포함하고/하거나; 폴리아데닐화 서열은 서열번호 45에 제시된 서열을 포함하고/하거나; 3' ITR은 서열번호 14에 제시된 서열을 포함하거나 이로 이루어진다.
특정 구현예에서, 5' ITR은 서열번호 18에 제시된 서열을 포함하거나 이로 이루어지고/이루어지거나; TRE는 서열번호 29에 제시된 서열을 포함하고/하거나; 인트론-삽입 IDS 암호화 서열은 서열번호 27에 제시된 서열을 포함하고/하거나; 폴리아데닐화 서열은 서열번호 45에 제시된 서열을 포함하고/하거나; 3' ITR은 서열번호 19에 제시된 서열을 포함하거나 이로 이루어진다.
특정 구현예에서, 5' ITR은 서열번호 49에 제시된 서열을 포함하거나 이로 이루어지고/이루어지거나; TRE는 서열번호 29에 제시된 서열을 포함하고/하거나; 인트론-삽입 IDS 암호화 서열은 서열번호 59에 제시된 서열을 포함하고/하거나; 폴리아데닐화 서열은 서열번호 45에 제시된 서열을 포함하고/하거나; 3' ITR은 서열번호 14에 제시된 서열을 포함하거나 이로 이루어진다.
특정 구현예에서, 5' ITR은 서열번호 49에 제시된 서열을 포함하거나 이로 이루어지고/이루어지거나; TRE는 서열번호 29에 제시된 서열을 포함하고/하거나; 인트론-삽입 IDS 암호화 서열은 서열번호 60에 제시된 서열을 포함하고/하거나; 폴리아데닐화 서열은 서열번호 45에 제시된 서열을 포함하고/하거나; 3' ITR은 서열번호 14에 제시된 서열을 포함하거나 이로 이루어진다.
특정 구현예에서, rAAV 게놈은 서열번호 38, 50, 53, 58, 62, 64, 66, 70, 76, 또는 78과 적어도 90%(예를 들어, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100%) 동일한 서열을 포함한다. 특정 구현예에서, rAAV 게놈은 서열번호 38, 50, 53, 58, 62, 64, 66, 70, 76, 또는 78에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, rAAV 게놈의 뉴클레오티드 서열은 서열번호 38, 50, 53, 58, 62, 64, 66, 70, 76, 또는 78에 제시된 뉴클레오티드 서열로 이루어진다. 특정 구현예에서, rAAV 게놈은 서열번호 38에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, rAAV 게놈의 뉴클레오티드 서열은 서열번호 38에 제시된 뉴클레오티드 서열로 이루어진다. 특정 구현예에서, rAAV 게놈은 서열번호 50에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, rAAV 게놈의 뉴클레오티드 서열은 서열번호 50에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, rAAV 게놈은 서열번호 53에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, rAAV 게놈의 뉴클레오티드 서열은 서열번호 53에 제시된 뉴클레오티드 서열로 이루어진다. 특정 구현예에서, rAAV 게놈은 서열번호 58에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, rAAV 게놈의 뉴클레오티드 서열은 서열번호 58에 제시된 뉴클레오티드 서열로 이루어진다. 특정 구현예에서, rAAV 게놈은 서열번호 62에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, rAAV 게놈의 뉴클레오티드 서열은 서열번호 62에 제시된 뉴클레오티드 서열로 이루어진다. 특정 구현예에서, rAAV 게놈은 서열번호 64에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, rAAV 게놈의 뉴클레오티드 서열은 서열번호 64에 제시된 뉴클레오티드 서열로 이루어진다. 특정 구현예에서, rAAV 게놈은 서열번호 66에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, rAAV 게놈의 뉴클레오티드 서열은 서열번호 66에 제시된 뉴클레오티드 서열로 이루어진다. 특정 구현예에서, rAAV 게놈은 서열번호 70에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, rAAV 게놈의 뉴클레오티드 서열은 서열번호 70에 제시된 뉴클레오티드 서열로 이루어진다. 특정 구현예에서, rAAV 게놈은 서열번호 76에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, rAAV 게놈의 뉴클레오티드 서열은 서열번호 76에 제시된 뉴클레오티드 서열로 이루어진다. 특정 구현예에서, rAAV 게놈은 서열번호 78에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, rAAV 게놈의 뉴클레오티드 서열은 서열번호 78에 제시된 뉴클레오티드 서열로 이루어진다.
특정 구현예에서, rAAV는 다음을 포함한다: (a) 서열번호 16의 아미노산 203 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 49의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 야생형 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 25의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열 45), 및 3' ITR 요소(예를 들어, 서열번호 51의 3' ITR:); (b) 서열번호 16의 아미노산 138 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 49의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 야생형 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 25의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 51의 3' ITR); 및/또는 (c) 서열번호 16의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 49의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 야생형 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 25의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 51의 3' ITR).
특정 구현예에서, rAAV는 다음을 포함한다: (a) 서열번호 16의 아미노산 203 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 49의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 야생형 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 25의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR); (b) 서열번호 16의 아미노산 138 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 49의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 야생형 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 25의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열 45), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR); 및/또는 (c) 서열번호 16의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 49의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 야생형 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 25의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR).
특정 구현예에서, rAAV는 다음을 포함한다: (a) 서열번호 16의 아미노산 203 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 49의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 침묵 변형된 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 27의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR); (b) 서열번호 16의 아미노산 138 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 49의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 침묵 변형된 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 27의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR); 및/또는 (c) 서열번호 16의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 49의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 침묵 변형된 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 27의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR).
특정 구현예에서, rAAV는 다음을 포함한다: (a) 서열번호 16의 아미노산 203 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 18의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 야생형 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 25의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR); (b) 서열번호 16의 아미노산 138 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 18의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 야생형 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 25의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR); 및/또는 (c) 서열번호 16의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 18의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 야생형 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 25의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR).
특정 구현예에서, rAAV는 다음을 포함한다: (a) 서열번호 16의 아미노산 203 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 18의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 침묵 변형된 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 27의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR); (b) 서열번호 16의 아미노산 138 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 18의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 침묵 변형된 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 27의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR); 및/또는 (c) 서열번호 16의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 18의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 침묵 변형된 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 27의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR).
특정 구현예에서, rAAV는 다음을 포함한다: (a) 서열번호 16의 아미노산 203 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 18의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 침묵 변형된 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 27의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 19의 3' ITR); (b) 서열번호 16의 아미노산 138 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 18의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 침묵 변형된 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 27의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 19의 3' ITR); 및/또는 (c) 서열번호 16의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 18의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 침묵 변형된 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 27의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 19의 3' ITR).
특정 구현예에서, rAAV는 다음을 포함한다: (a) 서열번호 16의 아미노산 203 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 49의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 침묵 변형된 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 59의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR); (b) 서열번호 16의 아미노산 138 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 49의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 침묵 변형된 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 59의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR); 및/또는 (c) 서열번호 16의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 49의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 침묵 변형된 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 59의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR).
특정 구현예에서, rAAV는 다음을 포함한다: (a) 서열번호 16의 아미노산 203 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 49의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 침묵 변형된 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 60의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR); (b) 서열번호 16의 아미노산 138 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 49의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 침묵 변형된 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 60의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR); 및/또는 (c) 서열번호 16의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 49의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 침묵 변형된 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 60의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR).
특정 구현예에서, rAAV는 (a) 서열번호 16의 아미노산 203 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질, 및 서열번호 25, 27, 29, 37, 38, 43, 50, 52, 53, 54, 58, 60, 61, 62, 63, 64, 65, 66, 69, 70, 75, 76, 77, 또는 78 중 어느 하나에 제시된 뉴클레오티드 서열을 포함하는 rAAV 게놈; (b) 서열번호 16의 아미노산 138 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질, 및 서열번호 25, 27, 29, 37, 38, 43, 50, 52, 53, 54, 58, 60, 61, 62, 63, 64, 65, 66, 69, 70, 75, 76, 77, 또는 78 중 어느 하나에 제시된 뉴클레오티드 서열을 포함하는 rAAV 게놈; 및/또는 (c) 서열번호 16의 아미노산 서열을 포함하는 AAV 캡시드 단백질, 및 서열번호 25, 27, 29, 37, 38, 43, 50, 52, 53, 54, 58, 60, 61, 62, 63, 64, 65, 66, 69, 70, 75, 76, 77, 또는 78 중 어느 하나에 제시된 뉴클레오티드 서열을 포함하는 rAAV 게놈을 포함한다.
또 다른 양태에서, 서열번호 25, 26, 27, 37, 38, 43, 50, 52, 53, 54, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 75, 76, 77, 또는 78에 제시된 핵산 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드가 본원에 제공된다. 특정 구현예에서, 폴리뉴클레오티드는 서열번호 25, 26, 27, 37, 38, 43, 50, 52, 53, 54, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 75, 76, 77, 또는 78에 제시된 핵산 서열을 포함한다. 특정 구현예에서, 폴리뉴클레오티드의 핵산 서열은 서열번호 25, 26, 27, 37, 38, 43, 50, 52, 53, 54, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 75, 76, 77, 또는 78에 제시된 핵산 서열로 이루어진다. 특정 구현예에서, 폴리뉴클레오티드는 서열번호 25, 26, 27, 37, 38, 43, 50, 52, 53, 54, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 75, 76, 77, 또는 78에 제시된 핵산 서열을 포함한다. 특정 구현예에서, 폴리뉴클레오티드의 핵산 서열은 서열번호 25, 26, 27, 37, 38, 43, 50, 52, 53, 54, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 75, 76, 77, 또는 78에 제시된 핵산 서열로 이루어진다.
또한, 서열번호 25, 27, 59, 또는 60에 제시된 핵산 서열과 적어도 80%(예를 들어, 적어도 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%) 동일한 핵산 서열을 포함하는 폴리뉴클레오티드가 본원에 제공된다. 특정 구현예에서, 폴리뉴클레오티드는 서열번호 25, 27, 59, 또는 60에 제시된 핵산 서열을 포함한다. 특정 구현예에서, 폴리뉴클레오티드의 핵산 서열은 서열번호 25, 27, 59, 또는 60에 제시된 핵산 서열로 이루어진다. 특정 구현예에서, 폴리뉴클레오티드는 서열번호 25에 제시된 핵산 서열을 포함한다. 특정 구현예에서, 폴리뉴클레오티드의 핵산 서열은 서열번호 25에 제시된 핵산 서열로 이루어진다. 특정 구현예에서, 폴리뉴클레오티드는 서열번호 27에 제시된 핵산 서열을 포함한다. 특정 구현예에서, 폴리뉴클레오티드의 핵산 서열은 서열번호 27에 제시된 핵산 서열로 이루어진다. 특정 구현예에서, 폴리뉴클레오티드는 서열번호 59에 제시된 핵산 서열을 포함한다. 특정 구현예에서, 폴리뉴클레오티드의 핵산 서열은 서열번호 59에 제시된 핵산 서열로 이루어진다. 특정 구현예에서, 폴리뉴클레오티드는 서열번호 60에 제시된 핵산 서열을 포함한다. 특정 구현예에서, 폴리뉴클레오티드의 핵산 서열은 서열번호 60에 제시된 핵산 서열로 이루어진다.
폴리뉴클레오티드는 DNA, RNA, 변형된 DNA, 변형된 RNA, 또는 이들의 조합을 포함할 수 있다. 특정 구현예에서, 폴리뉴클레오티드는 벡터, 예를 들어, 바이러스 벡터 또는 플라스미드 내에 포함된다. 또한, 폴리뉴클레오티드 또는 벡터를 포함하는 재조합 세포가 본원에 제공된다.
또 다른 양태에서, 본 개시는 약학적으로 허용 가능한 부형제, 보조제, 희석제, 비히클 또는 담체, 또는 이들의 조합과 함께 본원에 개시된 바와 같은 AAV를 포함하는 약학적 조성물을 제공한다. "약학적으로 허용 가능한 담체"는, 조성물의 활성 성분과 조합될 때, 성분이 생물학적 활성을 유지할 수 있게 하고 의도하지 않은 면역 반응과 같은 파괴적인 생리학적 반응을 일으키지 않는 임의의 물질을 포함한다. 약학적으로 허용 가능한 담체는 물, 인산염 완충 식염수, 유화액, 예컨대 오일/물 유화액, 및 습윤제를 포함한다. 이러한 담체를 포함하는 조성물은 문헌[Remington's Pharmaceutical Sciences, current Ed., Mack Publishing Co., Easton Pa. 18042, USA; A. Gennaro (2000) "Remington: The Science and Practice of Pharmacy", 20th, Lippincott, Williams, & Wilkins; Pharmaceutical Dosage Forms and Drug Delivery Systems (1999) H. C. Ansel et al, 7th ed., Lippincott, Williams, & Wilkins; and Handbook of Pharmaceutical Excipients (2000) A. H. Kibbe et al, 3rd ed. Amer. Pharmaceutical Assoc.]에 제시된 바와 같이 잘 알려진 통상적인 방법에 의해 제형화될 수 있다.
III.
사용 방법
또 다른 양태에서, 본 개시는 세포에서 IDS 폴리펩티드를 발현시키는 방법을 제공한다. 이러한 방법은 일반적으로 본원에 개시된 바와 같은 rAAV로 세포를 형질도입하는 단계를 포함한다. 이러한 방법은 IDS 발현을 복원하는 데 매우 효율적이다. 따라서, 특정 구현예에서, 본원에 개시된 방법은 본원에 개시된 rAAV로 세포를 형질도입하는 단계를 포함한다.
본원에 개시된 방법은 IDS 유전자에서 돌연변이를 보유하는 임의의 세포에 적용될 수 있다. 당업자는 활성 내인성 IDS(예를 들어, 내인성 I2S 활성)를 필요로 하는 세포가 특히 관심 대상임을 이해할 것이다. 따라서, 특정 구현예에서, 본 방법은 내인성 I2S 활성을 상실한 임의의 세포에 적용된다.
특정 구현예에서, 본 방법은 뉴런 및/또는 신경교세포에 적용된다. 특정 구현예에서, 특정 관심 대상은 활성 내인성 IDS(예를 들어, 내인성 I2S 활성)를 필요로 하는 뉴런 및/또는 신경교세포이다. 특정 구현예에서, 본 방법은 중추 신경계(CNS)의 세포 및/또는 말초 신경계(PNS)의 세포에 적용된다. 특정 구현예에서, 특정 관심 대상은 활성 내인성 IDS(예를 들어, 내인성 I2S 활성)를 필요로 하는 중추 신경계 및/또는 말초 신경계의 세포이다. 특정 구현예에서, 특정 관심 대상은 전뇌, 중뇌, 후뇌, 척수, 및 이들의 임의의 조합의 세포이다. 특정 구현예에서, 특정 관심 대상은 척수, 운동 피질, 감각 피질, 시상, 해마, 피각, 소뇌(예를 들어, 소뇌 핵), 및 이들의 임의의 조합으로 이루어진 군으로부터 선택된 중추 신경계 영역의 세포이다. 특정 구현예에서, 특정 관심 대상은 뇌의 교뇌 및 수질, 척수의 상행근막의 세포, 및 이들의 임의의 조합이다. 특정 구현예에서, 특정 관심 대상은, 활성 내인성 IDS(예를 들어, 내인성 I2S 활성)를 필요로 하는, 척수, 운동 피질, 감각 피질, 시상, 해마, 피각, 소뇌(예를 들어, 소뇌 핵), 및 이들의 임의의 조합으로 이루어진 군으로부터 선택된 중추 신경계(CNS) 영역의 세포이다. 특정 구현예에서, 특정 관심 대상은 중추 신경계(CNS)에서의 운동 뉴런 및 성상교세포 프로파일, CNS에서의 희소돌기교세포(상행 섬유), CNS에서의 대뇌 피질의 세포 집단, 및 말초 신경계(PNS)의 감각 뉴런이다. 특정 구현예에서, 특정 관심 대상은 척수의 배측 근막 내에 있는 것과 같은 희소돌기교세포이다. 특정 구현예에서, 특정 관심 대상은, 성상교세포, 희소돌기교세포, 슈반 세포, 및 이들의 임의의 조합을 포함하지만 이에 한정되지 않는, 중추 신경계에서의 신경교 프로파일이다. 특정 구현예에서, 특정 관심 대상은 운동 뉴런, 성상교세포, 희소돌기교세포, 중추 신경계의 대뇌 피질 세포, 말초 신경계의 감각 뉴런, 말초 신경계의 신경교세포(예를 들어, 슈반 세포), 및 이들의 임의의 조합이다.
특정 구현예에서, 본 방법은 간 세포(예를 들어, 간세포)에 적용된다. 특정 구현예에서, 특정 관심 대상은 활성 내인성 IDS(예를 들어, 내인성 I2S 활성)를 필요로 하는 간 세포이다. 특정 구현예에서, 본 방법은 심장 세포(예를 들어, 심근 세포)에 적용된다. 특정 구현예에서, 특정 관심 대상은 활성 내인성 IDS(예를 들어, 내인성 I2S 활성)를 필요로 하는 심장 세포이다. 특정 구현예에서, 본 방법은 폐 세포(예를 들어, 기도 상피 세포)에 적용된다. 특정 구현예에서, 특정 관심 대상은 활성 내인성 IDS(예를 들어, 내인성 I2S 활성)를 필요로 하는 폐 세포이다. 특정 구현예에서, 본 방법은 신장 세포(예를 들어, 신장 상피 세포)에 적용된다. 특정 구현예에서, 특정 관심 대상은 활성 내인성 IDS(예를 들어, 내인성 I2S 활성)를 필요로 하는 신장 세포이다. 특정 구현예에서, 본 방법은 비장 세포(예를 들어, 비장세포)에 적용된다. 특정 구현예에서, 특정 관심 대상은 활성 내인성 IDS(예를 들어, 내인성 I2S 활성)를 필요로 하는 비장 세포이다.
본원에 개시된 방법은 연구 목적을 위해 시험관 내에서 수행될 수 있거나, 치료 목적을 위해 생체 외 또는 생체 내에서 수행될 수 있다.
특정 구현예에서, 형질도입될 세포는 포유류 대상체에 존재하고, AAV는 대상체에서 세포에 형질도입되기에 효과적인 양으로 대상체에게 투여된다. 따라서, 특정 구현예에서, 본 개시는 IDS 유전자 돌연변이와 연관된 질환 또는 장애를 갖는 대상체를 치료하기 위한 방법을 제공하며, 이러한 방법은 일반적으로 본원에 개시된 바와 같은 rAAV의 유효량을 대상체에게 투여하는 단계를 포함한다. 대상체는 IDS 돌연변이를 갖는 인간 대상체, 비인간 영장류 대상체(예를 들어, 시노몰구스(cynomolgus)) 또는 설치류 대상체(예를 들어, 마우스)일 수 있다. IDS 유전자 돌연변이와 연관된 임의의 질환 또는 장애는 본원에 개시된 방법을 사용하여 치료될 수 있다. 적절한 질환 또는 장애는, 제한 없이, 헌터 증후군을 포함한다.
특정 구현예에서, 전술한 방법은 다음을 포함하는 rAAV를 사용한다: (a) 서열번호 16의 아미노산 203 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 49의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 야생형 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 25의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 51의 3' ITR); (b) 서열번호 16의 아미노산 138 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 49의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 야생형 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 25의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 51의 3' ITR); 및/또는 (c) 서열번호 16의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 49의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 야생형 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 25의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 51의 3' ITR).
특정 구현예에서, 전술한 방법은 다음을 포함하는 rAAV를 사용한다: (a) 서열번호 16의 아미노산 203 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 49의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 야생형 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 25의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR); (b) 서열번호 16의 아미노산 138 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 49의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 야생형 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 25의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열 45), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR); 및/또는 (c) 서열번호 16의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 49의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 야생형 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 25의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR).
특정 구현예에서, 전술한 방법은 다음을 포함하는 rAAV를 사용한다: (a) 서열번호 16의 아미노산 203 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 49의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 침묵 변형된 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 27의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR); (b) 서열번호 16의 아미노산 138 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 49의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 침묵 변형된 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 27의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR); 및/또는 (c) 서열번호 16의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 49의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 침묵 변형된 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 27의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR).
특정 구현예에서, 전술한 방법은 다음을 포함하는 rAAV를 사용한다: (a) 서열번호 16의 아미노산 203 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 18의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 야생형 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 25의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR); (b) 서열번호 16의 아미노산 138 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 18의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 야생형 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 25의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR); 및/또는 (c) 서열번호 16의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 18의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 야생형 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 25의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR).
특정 구현예에서, 전술한 방법은 다음을 포함하는 rAAV를 사용한다: (a) 서열번호 16의 아미노산 203 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 18의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 침묵 변형된 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 27의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR); (b) 서열번호 16의 아미노산 138 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 18의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 침묵 변형된 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 27의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR); 및/또는 (c) 서열번호 16의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 18의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 침묵 변형된 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 27의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR).
특정 구현예에서, 전술한 방법은 다음을 포함하는 rAAV를 사용한다: (a) 서열번호 16의 아미노산 203 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 18의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 침묵 변형된 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 27의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 19의 3' ITR); (b) 서열번호 16의 아미노산 138 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 18의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 침묵 변형된 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 27의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 19의 3' ITR); 및/또는 (c) 서열번호 16의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 18의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 침묵 변형된 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 27의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 19의 3' ITR).
특정 구현예에서, 전술한 방법은 다음을 포함하는 rAAV를 사용한다: (a) 서열번호 16의 아미노산 203 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 49의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 침묵 변형된 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 59의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR); (b) 서열번호 16의 아미노산 138 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 49의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 침묵 변형된 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 59의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR); 및/또는 (c) 서열번호 16의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 49의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 침묵 변형된 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 59의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR).
특정 구현예에서, 전술한 방법은 다음을 포함하는 rAAV를 사용한다: (a) 서열번호 16의 아미노산 203 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 49의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 침묵 변형된 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 60의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR); (b) 서열번호 16의 아미노산 138 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 49의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 침묵 변형된 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 60의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR); 및/또는 (c) 서열번호 16의 아미노산 서열을 포함하는 AAV 캡시드 단백질 및 5'에서 3'으로 다음의 유전적 요소를 포함하는 rAAV 게놈: 5' ITR 요소(예를 들어, 서열번호 49의 5' ITR), 전사 조절 요소(예를 들어, 서열번호 29의 서열을 포함하는 TRE), 침묵 변형된 인간 인트론-삽입 IDS 암호화 서열(예를 들어, 서열번호 60의 인트론-삽입 hIDS 암호화 서열), SV40 폴리아데닐화 서열(예를 들어, 서열번호 45의 SV40 폴리아데닐화 서열), 및 3' ITR 요소(예를 들어, 서열번호 14의 3' ITR).
특정 구현예에서, 전술한 방법은 다음을 포함하는 rAAV를 사용한다: (a) 서열번호 16의 아미노산 203 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질, 및 서열번호 25, 27, 37, 38, 43, 50, 52, 53, 54, 58, 59, 60, 61, 62, 63, 64, 65, 66, 69, 또는 70;중 어느 하나에 제시된 뉴클레오티드 서열을 포함하는 rAAV 게놈; (b) 서열번호 16의 아미노산 138 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질, 및 서열번호 25, 27, 37, 38, 43, 50, 52, 53, 54, 58, 59, 60, 61, 62, 63, 64, 65, 66, 69, 또는 70 중 어느 하나에 제시된 뉴클레오티드 서열을 포함하는 rAAV 게놈; 및/또는 (c) 서열번호 16의 아미노산 서열을 포함하는 AAV 캡시드 단백질, 및 서열번호 25, 27, 37, 38, 43, 50, 52, 53, 54, 58, 59, 60, 61, 62, 63, 64, 65, 66, 69, 또는 70 중 어느 하나에 제시된 뉴클레오티드 서열을 포함하는 rAAV 게놈.
본원에 개시된 방법은 생체 내 및 시험관 내 모두에서 높은 효율로 세포에서 IDS 단백질을 발현할 수 있다는 점에서 특히 유리하다. 특정 구현예에서, 이러한 IDS 단백질의 발현 수준은 IDS 유전자에 돌연변이를 갖지 않는 동일한 유형의 세포의 내인성 IDS 단백질의 발현 수준의 적어도 약 0.1%, 적어도 약 0.2%, 적어도 약 0.3%, 적어도 약 0.4%, 적어도 약 0.5%, 적어도 약 0.6%, 적어도 약 0.7%, 적어도 약 0.8%, 적어도 약 0.9%, 적어도 약 1%, 적어도 약 2%, 적어도 약 3%, 적어도 약 4%, 적어도 약 5%, 적어도 약 6%, 적어도 약 7%, 적어도 약 8%, 적어도 약 9%, 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 99%, 적어도 약 100%, 또는 이들의 임의의 중간 백분율이다. 특정 구현예에서, IDS 단백질의 발현 수준은 IDS 유전자 내에 돌연변이를 갖지 않는 동일한 유형의 세포에서의 내인성 IDS 단백질의 발현 수준보다 적어도 1.1, 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10배 더 높다. ELISA, 웨스턴 블롯팅, 면역 염색, 및 질량 분광분석을 포함하되 이들로 한정되지 않는, IDS 단백질의 발현 수준을 결정하는 임의의 방법이 사용될 수 있다.
특정 구현예에서, 본원에 개시된 AAV 조성물로 세포를 형질도입하는 것은 본원에 제공된 바와 같이 또는 당업자에게 공지된 임의의 형질도입 방법에 의해 수행될 수 있다. 특정 구현예에서, 세포는 AAV와 50,000; 100,000; 150,000; 200,000; 250,000; 300,000; 350,000; 400,000; 450,000; 또는 500,000의 감염 다중도(MOI) 또는 세포에 대해 최적의 형질도입을 제공하는 임의의 MOI로 접촉할 수 있다.
본원에 개시된 AAV 조성물은 정맥내, 경막내, 복강내, 피하, 근육내, 비강내, 국소 또는 피부내 경로를 포함하되 이들로 한정되지 않는 임의의 적절한 경로에 의해 대상체에게 투여될 수 있다. 특정 구현예에서, 조성물은 정맥내 주사 또는 피하 주사를 통해 투여되도록 제형화된다.
IV.
AAV 패키징 시스템
또 다른 양태에서, 본 개시는 본원에 개시된 재조합 아데노-연관 바이러스(rAAV)의 재조합 제조를 위한 패키징 시스템을 제공한다. 이러한 패키징 시스템은 일반적으로 하나 이상의 AAV Rep 단백질을 암호화하는 제1 뉴클레오티드; 본원에 개시된 바와 같은 AAV 중 어느 하나의 캡시드 단백질을 암호화하는 제2 뉴클레오티드; 및 본원에 개시된 바와 같은 rAAV 게놈 중 어느 하나를 포함하는 제3 뉴클레오티드 서열을 포함하되, 패키징 시스템은 캡시드 내에 rAAV 게놈을 둘러싸서 AAV를 형를 형성하도록 작동된다.
특정 구현예에서, 패키징 시스템은 하나 이상의 AAV Rep 단백질을 암호화하는 제1 뉴클레오티드 서열 및 AAV 캡시드 단백질을 암호화하는 제2 뉴클레오티드 서열을 포함하는 제1 벡터 및 rAAV 게놈을 포함하는 제3 뉴클레오티드 서열을 포함하는 제2 벡터를 포함한다. 본원에 기술된 패키징 시스템의 맥락에서 사용되는 "벡터"는 핵산을 세포 내로 도입하기 위한 비히클인 핵산 분자를 지칭한다(예를 들어, 플라스미드, 바이러스, 코스미드, 인공 염색체 등).
임의의 AAV Rep 단백질은 본원에 개시된 패키징 시스템에 사용될 수 있다. 패키징 시스템의 특정 구현예에서, Rep 뉴클레오티드 서열은 AAV2 Rep 단백질을 암호화한다. 적절한 AAV2 Rep 단백질은 Rep 78/68 또는 Rep 68/52를 포함하되 이에 한정되지 않는다. 패키징 시스템의 특정 구현예에서, AAV2 Rep 단백질을 암호화하는 뉴클레오티드 서열은 서열번호 22의 AAV2 Rep 아미노산 서열과 최소 백분율 서열 동일성을 갖는 단백질을 암호화하는 뉴클레오티드 서열을 포함하되, 최소 백분율 서열 동일성은 AAV2 Rep 단백질의 아미노산 서열 길이에 걸쳐 적어도 70%(예를 들어, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99%, 또는 100%)이다. 패키징 시스템의 특정 구현예에서, AAV2 Rep 단백질은 서열번호 22에 제시된 아미노산 서열을 갖는다.
패키징 시스템의 특정 구현예에서, 패키징 시스템은 하나 이상의 헬퍼 바이러스 유전자를 포함하는 제4 뉴클레오티드 서열을 추가로 포함한다. 패키징 시스템의 특정 구현예에서, 패키징 시스템은 하나 이상의 헬퍼 바이러스 유전자를 포함하는 제4 뉴클레오티드 서열을 포함하는 제3 벡터, 예를 들어 헬퍼 바이러스 벡터를 추가로 포함한다. 제3 벡터는 독립적인 제3 벡터이거나, 제1 벡터와 일체화되거나, 제2 벡터와 일체화될 수 있다.
패키징 시스템의 특정 구현예에서, 헬퍼 바이러스는 아데노바이러스, 포진 바이러스(단순 포진 바이러스(HSV)를 포함함), 수두 바이러스(예를 들어, 우두 바이러스), 거대세포 바이러스(CMV), 및 배큘로바이러스로 이루어진 군으로부터 선택된다. 헬퍼 바이러스가 아데노바이러스인 패키징 시스템의 특정 구현예에서, 아데노바이러스 게놈은 El, E2, E4 및 VA로 이루어진 군으로부터 선택된 하나 이상의 아데노바이러스 RNA 유전자를 포함한다. 헬퍼 바이러스가 HSV인 패키징 시스템의 특정 구현예에서, HSV 게놈은 UL5/8/52, ICPO, ICP4, ICP22 및 UL30/UL42로 이루어진 군으로부터 선택된 하나 이상의 HSV 유전자를 포함한다.
패키징 시스템의 특정 구현예에서, 제1, 제2 및/또는 제3 벡터는 하나 이상의 플라스미드 내에 함유된다. 특정 구현예에서, 제1 벡터 및 제3 벡터는 제1 플라스미드 내에 함유된다. 특정 구현예에서, 제2 벡터 및 제3 벡터는 제2 플라스미드 내에 함유된다.
패키징 시스템의 특정 구현예에서, 제1, 제2 및/또는 제3 벡터는 하나 이상의 재조합 헬퍼 바이러스 내에 함유된다. 특정 구현예에서, 제1 벡터 및 제3 벡터는 재조합 헬퍼 바이러스 내에 함유된다. 특정 구현예에서, 제2 벡터 및 제3 벡터는 재조합 헬퍼 바이러스 내에 함유된다.
또 다른 양태에서, 본 개시는 본원에 기술된 바와 같은 AAV의 재조합 제조 방법을 제공하며, 이러한 방법은 본원에 기술된 바와 같은 rAAV를 형성하도록 캡시드 내에 rAAV 게놈을 둘러싸도록 작동되는 조건 하에서 본원에 기술된 바와 같은 패키징 시스템으로 세포를 형질감염시키거나 형질도입하는 단계를 포함한다. rAAV의 재조합 제조를 위한 예시적인 방법은 일시적 형질감염(예를 들어, 본원에 기재된 바와 같은 제1, 및 제2, 및 선택적으로 제3 벡터를 함유하는 하나 이상의 형질감염 플라스미드를 사용함), 바이러스 감염(예를 들어, 본원에 개시된 바와 같은 제1, 및 제2, 및 선택적으로 제3 벡터를 함유하는 하나 이상의 재조합 헬퍼 바이러스, 예컨대 아데노바이러스, 수두바이러스(예를 들어, 우두 바이러스), 포진 바이러스(HSV를 포함함) 거대세포 바이러스, 또는 바큘로바이러스를 사용함), 및 안정한 생산자 세포주 형질감염 또는 감염(예를 들어, 본원에 기재된 바와 같은 하나 이상의 AAV Rep 단백질을 암호화하는 Rep 뉴클레오티드 서열 및/또는 하나 이상의 AAV 캡시드 단백질을 암호화하는 Cap 뉴클레오티드 서열을 함유하는 포유동물 또는 곤충 세포와 같은 안정한 생산자 세포, 및 플라스미드 또는 재조합 헬퍼 바이러스의 형태로 전달되는 본원에 기술된 rAAV 게놈을 사용함)을 포함한다.
따라서, 본 개시는 재조합 AAV(rAAV)의 제조를 위한 패키징 시스템을 제공하며, 여기서 패키징 시스템은 하나 이상의 AAV Rep 단백질을 암호화하는 제1 뉴클레오티드 서열; 본원에 기술된 AAV 중 어느 하나의 캡시드 단백질을 암호화하는 제2 뉴클레오티드 서열; 및 본원에 기술된 AAV 중 어느 하나의 rAAV 게놈 서열을 포함하는 제3 뉴클레오티드 서열; 및 선택적으로 하나 이상의 헬퍼 바이러스 유전자를 포함하는 제4 뉴클레오티드 서열을 포함한다.
V.
실시예
본원에 개시된 재조합 AAV 벡터는 시험관 내 및 생체 내에서 매우 효율적인 유전자 전달을 매개한다. 다음의 실시예는 본원에 개시된 바와 같은 AAV 기반 벡터를 사용하여 (헌터 증후군과 같은 특정 인간 질환에서 돌연변이된) IDS 유전자의 발현을 효율적으로 복원하는 것을 입증한다. 이들 실시예는 예시로서 제공되며, 제한하는 것이 아니다.
아래의 실시예 5, 6 및 11에서, 벡터 게놈 내 인간 IDS 유전자에 대하여 2.2e13 vg/kg, 6.5e13 vg/kg, 및 1.1e14 vg/kg 투여량의 AAV가 정량된다. 벡터 게놈 내 SV40 polyA 서열을 사용하여 정량될 때, AAV의 등가 투여량은 2e13 vg/kg, 6e13 vg/kg, 및 1e14 vg/kg이다. 아래의 실시예 9, 10 및 12에서, 벡터 게놈 내의 인간 IDS 유전자에 대해 1.8e14 vg/kg 투여량의 AAV가 정량된다. 벡터 게놈 내 SV40 polyA 서열에 대해 정량될 때, AAV의 등가 투여량은 1e14 vg/kg이다.
실시예 1: 인간 IDS 전달 벡터
본 실시예는 벡터가 형질도입되는 세포(예를 들어, 인간 세포 또는 마우스 세포)에서 인간 IDS(hIDS)의 발현을 위한 인간 IDS 전달 벡터 pHM-05205, pHM-05213, pHM-05214, pHM-05216, 및 pHM-05217을 제공한다.
a) pHM-05205
도 1a에 도시된 바와 같이, IDS 전달 벡터 pHM-05205는 5'에서 3'으로 다음의 유전적 요소를 포함한다: 5' ITR 요소; CMV 프로모터를 포함하는 전사 조절 요소; 야생형 인간 IDS 인트론-삽입 암호화 서열; SV40 폴리아데닐화 서열; 및 3' ITR 요소. 이들 요소의 서열은 표 1에 제시되어 있다. 이 벡터는 벡터가 형질도입되는 세포(예를 들어, 인간 세포 또는 마우스 세포)에서 인간 IDS 단백질을 발현할 수 있다.
b) pHM-05213
도 1b에 도시된 바와 같이, IDS 전달 벡터 pHM-05213은, 5'에서 3'으로 다음의 유전적 요소를 포함한다: 5' ITR 요소; CMV 프로모터를 포함하는 전사 조절 요소; 야생형 인간 IDS 인트론-삽입 암호화 서열; SV40 폴리아데닐화 서열; 및 3' ITR 요소. 이들 요소의 서열은 표 1에 제시되어 있다. 이 벡터는 벡터가 형질도입되는 세포(예를 들어, 인간 세포 또는 마우스 세포)에서 인간 IDS 단백질을 발현할 수 있다.
c) pHM-05214
도 1c에 도시된 바와 같이, IDS 전달 벡터 pHM-05214는 5'에서 3'으로 다음의 유전적 요소를 포함한다: 5' ITR 요소; CMV 프로모터를 포함하는 전사 조절 요소; 침묵 변형된 인간 IDS 인트론-삽입 암호화 서열; SV40 폴리아데닐화 서열; 및 3' ITR 요소. 이들 요소의 서열은 표 1에 제시되어 있다. 이 벡터는 벡터가 형질도입되는 세포(예를 들어, 인간 세포 또는 마우스 세포)에서 인간 IDS 단백질을 발현할 수 있다.
d) pHM-05216
도 1d에 도시된 바와 같이, IDS 전달 벡터 pHM-05216은 5'에서 3'으로 다음의 유전적 요소를 포함한다: 5' ITR 요소; CMV 프로모터를 포함하는 전사 조절 요소; 야생형 인간 IDS 인트론-삽입 암호화 서열; SV40 폴리아데닐화 서열; 및 3' ITR 요소. 이들 요소의 서열은 표 1에 제시되어 있다. 이 벡터는 벡터가 형질도입되는 세포(예를 들어, 인간 세포 또는 마우스 세포)에서 인간 IDS 단백질을 발현할 수 있다.
e) pHM-05217
도 1e에 도시된 바와 같이, IDS 전달 벡터 pHM-05217은 5'에서 3'으로 다음의 유전적 요소를 포함한다: 5' ITR 요소; CMV 프로모터를 포함하는 전사 조절 요소; 침묵 변형된 인간 IDS 인트론-삽입 암호화 서열; SV40 폴리아데닐화 서열; 및 3' ITR 요소. 이들 요소의 서열은 표 1에 제시되어 있다. 이 벡터는 벡터가 형질도입되는 세포(예를 들어, 인간 세포 또는 마우스 세포)에서 인간 IDS 단백질을 발현할 수 있다.
인간 IDS 전달 벡터 pHM-05210, pHM-05213, pHM-05214, pHM-05216, 및 pHM-05217에서의 유전적 요소 | |||||
유전적 요소 | pHM-05205 | pHM-05213 | pHM-05214 | pHM-05216 | pHM-05217 |
서열번호 | |||||
5' ITR 요소 | 49 | 49 | 49 | 18 | 18 |
전사 조절 요소 | 29 | 29 | 29 | 29 | 29 |
인간 IDS 암호화 서열 | 25 | 25 | 27 | 25 | 27 |
SV40 폴리아데닐화 서열 | 45 | 45 | 45 | 45 | 45 |
3' ITR 요소 | 14 | 14 | 14 | 14 | 19 |
rAAV 게놈(프로모터에서 폴리아데닐화 서열까지) | 75 | 37 | 43 | 52 | 54 |
본원에 개시된 벡터는 AAV 캡시드, 예를 들어, 이에 제한되지는 않으나, AAVHSC5, AAVHSC7, AAVHSC15 또는 AAVHSC17 캡시드와 같은 AAV 클레이드 F 캡시드에 패키징될 수 있다. 패키징된 바이러스 입자는 야생형 동물 또는 IDS-결핍 동물에 투여될 수 있다.
실시예 2: 뮤코다당류증(MPS) II형(헌터 증후군) 마우스 모델에서의 IDS 유전자 전달
헌터 증후군은 희귀한 X-연관 유전 장애로서, 주로 남성에게 영향을 미치는 질환이다. 이 질환은 리소좀 효소 이두로네이트-2-설파타제(IDS)의 유전자 결함에 의해 야기된다. IDS는 글리코사미노글리칸(GAG), 헤파란 설페이트(HS), 및 더마탄 설페이트(DS)의 단계적 분해에 필수적이다. IDS는 주로 중추 신경계에서 발현된다.
IDS 유전자 전달의 생체 내 효과를 연구하기 위해 MPS II 마우스 모델을 사용하였다. MPS II 마우스 모델 B6J.Cg-Idstm1Muen/HMI는 쥣과 동물 Ids Ids 유전자의 엑손 4 및 엑손 5의 일부에서의 결실을 포함하여 유전자 발현이 파괴된 Ids 녹아웃(IdsKO) 마우스이다. Garcia 등의 문헌 [(2007) J. Inherit. Metab. Dis. 30(6): 924-934]을 참조한다. Ids KO 마우스는 I2S 활성이 결여되어 있고, 증가된 조직 및 기관 GAG 수준뿐만 아니라 소변 GAG 배설을 나타낸다. LAMP1 발현은 Ids KO 마우스의 조직에서 상승된다. Ids KO 마우스는 손가락이 두꺼워지고 비절이 부은 것과 같은 진행성 골격 이상을 나타낸다.
본 실시예에서는 7~9주령의 야생형 및 Ids KO 반접합체(Ids KO 반접합체) 수컷을 사용하였다. AAVHSC15 캡시드에 패키징된 pHM-05205 또는 AAV9 캡시드에 패키징된 pHM-05205를 체중 kg당 2e13 벡터 게놈(vg/kg)의 단일 투여량으로 마우스에게 정맥 내 투여하였다. 투여 후 4주차에 마우스를 희생시켰다.
벡터 게놈 및 hI2S 활성은 Ids KO 반접합체 마우스의 뇌 및 간 조직에서 검출된 것으로 밝혀졌다. 도 2는 야생형, Ids KO 반접합체 수컷, 또는 표시된 바와 같이 rAAV를 투여한 Ids KO 반접합체 수컷의 간에서 검출된 벡터 게놈(도 2a) 및 I2S 활성(도 2b)을 나타낸다 . *는 p<0.05의 통계적 유의성을 나타낸다; WT와 비교해 ***는 p<0.001의 통계적 유의성을 나타내고, ****는 p<0.0001의 통계적 유의성을 나타낸다. 도 3은 야생형, Ids KO 반접합체 수컷, 또는 표시된 바와 같이 rAAV를 투여한 Ids KO 반접합체 수컷의 뇌에서 검출된 벡터 게놈(도 3a) 및 hI2S 활성(도 3b)을 보여준다. 벡터 게놈의 양과 hI2S 활성은 뇌에 비해 간에서 더 높은 것으로 밝혀졌다. 뇌에서, 벡터 게놈 수준은 문미축에 걸쳐 유사한 것으로 밝혀졌으며, AAV9 캡시드로 패키징된 pHM-05205가 투여된 Ids KO 반접합체 마우스에 비해 AAVHSC15 캡시드로 패키징된 pHM-05205가 투여된 Ids KO 반접합체 마우스에서 더 높게 나타났다.
도 4는 AAV9 캡시드로 패키징된 pHM-05205가 투여된 Ids KO 반접합체 마우스와 비교한 AAVHSC15 캡시드로 패키징된 pHM-05205가 투여된 Ids KO 반접합체 마우스의 간 및 뇌에서 hI2S 활성을 보여준다. AAV9 캡시드로 패키징된 pHM-05205가 투여된 Ids KO 반접합체 마우스와 비교하여, AAVHSC15 캡시드로 패키징된 pHM-05205가 투여된 Ids KO 반접합체 마우스 둘 다에서 간에서 검출된 hI2S 활성 수준이 생리학적 이상인 것으로 밝혀졌다(도 4a는 간에서 야생형 I2S 활성 수준의 백분율로서 I2S 활성을 보여준다; 도 4b는 간에서 정상 인간 I2S 활성의 백분율로서 I2S 활성을 보여준다). 또한, AAVHSC15 캡시드로 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스는 AAV9 캡시드로 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스와 비교하여 상당히 더 높은 hI2S 활성을 나타내는 것으로 밝혀졌다. 뇌에서, AAVHSC15 캡시드로 패키징된 pHM-05205가 투여된 Ids KO 반접합체 마우스와 비교하여 AAV9 캡시드로 패키징된 pHM-05205가 투여된 Ids KO 반접합체 마우스의 hI2S 활성 수준은 각각 야생형 마우스의 약 40% 및 약 45%였고, 성인 인간 수준의 약 75% 및 약 82%인 것으로 밝혀졌다(도 5a는 뇌에서 마우스 I2S 활성 수준의 백분율로서 I2S 활성을 보여준다; 도 5b는 뇌에서 정상 인간 I2S 활성의 백분율로서 I2S 활성을 보여준다). *는 p<0.05의 통계적 유의성을 나타낸다.
AAVHSC15 캡시드로 패키징된 pHM-05205가 투여된 Ids KO 반접합체 마우스 및 AAV9 캡시드로 패키징된 pHM-05205 Ids KO 반접합체 마우스는 미치료 Ids KO 반접합체 마우스(비히클로 치료된 Ids KO 반접합체 마우스)에 비해 뇌, 간 및 소변에서 GAG 수준이 감소된 것으로 밝혀졌다. 도 6은 야생형(WT), Ids KO 반접합체 마우스(MPS II), AAV9 캡시드(AAV9-hIDS)로 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스, AAVHSC15 캡시드(HSC15-hIDS)로 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스, 및/또는 대표적인 인간의 간(도 6a), 뇌(도 6b) 및 소변(도 6c)에서의 GAG 수준을 보여준다. AAVHSC15 캡시드로 패키징된 pHM-05205가 투여된 Ids KO 반접합체 마우스 및 AAV9 캡시드로 패키징된 pHM-05205가 투여된 Ids KO 마우스의 간 및 뇌에서의 GAG 수준이 야생형 수준까지 감소한 것으로 밝혀졌다. 소변에서, AAVHSC15 캡시드로 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스의 GAG 수준은 야생형 마우스에서보다 유의하게 더 낮은 것으로 밝혀졌다. *는 p<0.05의 통계적 유의성을 나타내고, **는 p<0.01의 통계적 유의성을 나타낸다.
도 7은 야생형(WT), Ids KO 반접합체 마우스(MPS II), AAV9 캡시드(AAV9-hIDS)로 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스, AAVHSC15 캡시드(HSC15-hIDS)로 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스, 및/또는 대표적인 인간의 hIDS의 mRNA 발현이 간(도 7a) 및 뇌(도 7b)에서 검출되었음을 보여준다.
투여 후 12주차에 간 조직 및 소변에서, AAVHSC15 캡시드로 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스는 지속성 및 표현형 회복을 나타냈다. 도 8a는 표시된 시간에 소변 샘플 내의 GAG 수준이 야생형 수준으로 구제되었음을 보여준다: 야생형 마우스(WT), Ids KO 반접합체 마우스(MPS II), 및 AAVHSC15 캡시드(HSC15-hIDS)로 패키징된 pHM-05205가 투여된 Ids KO 반접합체 마우스. ***는 p<0.001의 통계적 유의성을 나타낸다. 도 8b는 간에서의 GAG 수준이 야생형 수준으로 구제되었음을 보여준다: 야생형 마우스(WT), Ids KO 반접합체 마우스(MPS II), 및 AAVHSC15 캡시드(HSC15-hIDS)로 패키징된 pHM-05205가 투여된 Ids KO 반접합체 마우스. ****는 p<0.0001의 통계적 유의성을 나타낸다. 도 8c는 간에서 I2S 활성이 증가하였음을 보여준다: 야생형 마우스(WT), 및 AAVHSC15 캡시드(HSC15-hIDS)에 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스. ****는 p<0.0001의 통계적 유의성을 나타낸다. 또한, 항-LAMP1을 사용한 면역 조직 화학에 의해 검출된 바와 같이, AAVHSC15에 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스는 간 조직 내 LAMP1가 감소된 것으로 밝혀졌다.
투여 후 12주차에 뇌에서, AAVHSC15 캡시드로 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스는 내구성과 표현형 회복을 나타냈다. 도 9a는, 뇌에서의 GAG 수준이 야생형 수준으로 구제되었음을 보여준다: 야생형 마우스(WT), Ids KO 반접합체 마우스(MPS II), 및 AAVHSC15 캡시드(HSC15-hIDS)에 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스. *는 p<0.05의 통계적 유의성을 나타내고, **는 p<0.01의 통계적 유의성을 나타낸다. 야생형 마우스(WT) 및 AAVHSC15 캡시드에 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스의 뇌에서 hI2S 활성을 검출하였다(도 9b 및 도 9c). *는 p<0.05의 통계적 유의성을 나타낸다.
실시예 3: 인간 IDS 전달 벡터
본 실시예는 벡터가 형질도입되는 세포(예를 들어, 인간 세포 또는 마우스 세포)에서 인간 IDS(hIDS)의 발현을 위한 인간 IDS 전달 벡터 T-004, T-005, 및 T-006을 제공한다.
a) T-004
도 10a에 도시된 바와 같이, IDS 전달 벡터 T-004는 5'에서 3'으로 다음의 유전적 요소를 포함한다: 5' ITR 요소; CMV 프로모터를 포함하는 전사 조절 요소; 침묵 변형된 인간 IDS 인트론-삽입 암호화 서열; SV40 폴리아데닐화 서열; 및 3' ITR 요소. 이들 요소의 서열은 표 2에 제시되어 있다. 이 벡터는 벡터가 형질도입되는 세포(예를 들어, 인간 세포 또는 마우스 세포)에서 인간 IDS 단백질을 발현할 수 있다.
b) T-005
도 10b에 도시된 바와 같이, IDS 전달 벡터 T-005는 5'에서 3'으로 다음의 유전적 요소를 포함한다: 5' ITR 요소; CMV 프로모터를 포함하는 전사 조절 요소; 침묵 변형된 인간 IDS 인트론-삽입 암호화 서열; SV40 폴리아데닐화 서열; 및 3' ITR 요소. 이들 요소의 서열은 표 2에 제시되어 있다. 이 벡터는 벡터가 형질도입되는 세포(예를 들어, 인간 세포 또는 마우스 세포)에서 인간 IDS 단백질을 발현할 수 있다.
c) T-006
도 10c에 도시된 바와 같이, IDS 전달 벡터 T-006은 5'에서 3'으로 다음의 유전적 요소를 포함한다: 5' ITR 요소; CMV 프로모터를 포함하는 전사 조절 요소; 침묵 변형된 인간 IDS 인트론-삽입 암호화 서열; SV40 폴리아데닐화 서열; 및 3' ITR 요소. 이들 요소의 서열은 표 2에 제시되어 있다. 이 벡터는 벡터가 형질도입되는 세포(예를 들어, 인간 세포 또는 마우스 세포)에서 인간 IDS 단백질을 발현할 수 있다.
인간 IDS 전달 벡터 T-004, T-005, 및 T-006에서의 유전적 요소 | |||
유전적 요소 | T-004 | T-005 | T-006 |
서열번호 | |||
5' ITR 요소 | 49 | 49 | 49 |
전사 조절 요소 | 29 | 29 | 29 |
인간 IDS 암호화 서열 | 59 | 60 | 27 |
SV40 폴리아데닐화 서열 | 45 | 45 | 45 |
3' ITR 요소 | 14 | 14 | 14 |
rAAV 게놈(프로모터에서 폴리아데닐화 서열까지) | 61 | 63 | 65 |
rAAV 게놈(5' ITR에서 3' ITR까지) | 62 | 64 | 66 |
본원에 개시된 벡터는 AAV 캡시드, 예를 들어, 이에 제한되지는 않으나, AAVHSC5, AAVHSC7, AAVHSC15 또는 AAVHSC17 캡시드와 같은 AAV 클레이드 F 캡시드에 패키징될 수 있다. 패키징된 바이러스 입자는 야생형 동물 또는 IDS-결핍 동물에 투여될 수 있다.
실시예 4: 뮤코다당류증(MPS) II(헌터 증후군) 마우스 모델에서의 IDS 유전자 전달
본 실시예에서는 6~9주령의 야생형 및 Ids KO 반접합체(Ids KO 반접합체, 또한 MPS II로도 지칭됨) 수컷을 사용하였다. AAVHSC15 캡시드 또는 AAV9 캡시드 중 하나에 패키징된 pHM-05205, T-004, T-005, 또는 T-006 2e13 vg/kg의 단일 투여량을 마우스에게 정맥 내 투여하였다. 투여 후 4주차에 마우스를 희생시켰다.
도 11은 4마리의 야생형 마우스(WT); 4마리의 Ids KO 반접합체 마우스(MPS II); AAV9 캡시드(AAV9-hIDS)에 패키징된 pHM-05205를 투여한 4마리의 Ids KO 반접합체 마우스; AAVHSC15 캡시드(HSC15-hIDS)에 패키징된 pHM-05205를 투여한 4마리의 Ids KO 반접합체 마우스; AAVHSC15 캡시드(HSC15-T-004)에 패키징된 T-004를 투여한 8마리의 Ids KO 반접합체 마우스; AAVHSC15 캡시드(HSC15-T-005)에 패키징된 T-005를 투여한 4마리의 IDS KO 반접합체 마우스; 및 AAVHSC15 캡시드(hIDS-T-006)로 패키징된 T-006을 투여한 4마리의 IDS KO 반접합체 마우스의 소변에서 검출된 GAG 수준(도 11a) 및 혈청 I2S 활성(도 11b)을 보여준다. 도 11a에 도시된 바와 같이, 치료된 Ids KO 반접합체 마우스의 소변 중 GAG 수준은 미치료 Ids KO 반접합체 마우스(비히클로 치료된Ids KO 반접합체 마우스)와 비교하여 감소되었다. 도 11b에 도시된 바와 같이, AAVHSC15 캡시드에 패키징된 T-004, T-005, 또는 T-006을 투여한 Ids KO 반접합체 마우스에게서 혈청 I2S 활성을 검출하였다. *는 p<0.05의 통계적 유의성을 나타내고, **는 p<0.01의 통계적 유의성을 나타내며, ***는 p<0.001의 통계적 유의성을 나타내고, ****는 p<0.0001의 통계적 유의성을 나타낸다.
도 12는 야생형 마우스(WT); Ids KO 반접합체 마우스(MPS II); AAV9 캡시드(AAV9-hIDS)에 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스; AAVHSC15 캡시드(HSC15-hIDS)에 패키징된 pHM-05205를 투여한 Ids KO 반접합체 마우스; AAVHSC15 캡시드(HSC15-T-004)에 패키징된 T-004를 투여한 Ids KO 반접합체 마우스; AAVHSC15 캡시드(HSC15-T-005)에 패키징된 T-005를 투여한 Ids KO 반접합체 마우스; 및/또는 AAVHSC15 캡시드(hIDS-T-006)에 패키징된 T-006을 투여한 Ids KO 반접합체 마우스의 뇌 및 간에서 검출된 GAG 수준(도 12a 및 12b) 및 뇌 및 간에서의 I2S 활성(도 12c 및 12d)을 보여준다. 도시된 바와 같이, 치료된 Ids KO 반접합체 마우스의 뇌(도 12a) 및 간(도 12ㅠ) 내 GAG 수준은 미치료된 Ids KO 반접합체 마우스(비히클로 치료된Ids KO 반접합체 마우스)와 비교하여 감소되었다. 도시된 바와 같이, AAVHSC15 캡시드에 패키징된 T-004, T-005, 또는 T-006을 투여한 Ids KO 반접합체 마우스에서 뇌(도 12c) 및 간(도 12d)에서의 I2S 활성을 검출하였다. *는 p<0.05의 통계적 유의성을 나타내고, **는 p<0.01의 통계적 유의성을 나타내며, ***는 p<0.001의 통계적 유의성을 나타내고, ****는 p<0.0001의 통계적 유의성을 나타낸다.
실시예 5: 뮤코다당류증(MPS) II(헌터 증후군) 마우스 모델에서의 IDS 유전자 전달
본 실시예에서는 7~10주령의 야생형 및 Ids KO 반접합체(Ids KO 반접합체, 또한 MPS II로도 지칭됨) 수컷을 사용하였다. AAVHSC15 캡시드에 패키징된 2.2e13 vg/kg, 6.5e13 vg/kg, 및 1.1e14 vg/kg의 pHM-05217을 포함하는 투여량 범위를 그룹 당 5마리의 마우스에게 정맥 내 투여하였다. 투여 후 4주차에 마우스를 희생시켰다. 본 실시예에서, 미치료 마우스는 비히클이 투여된 마우스를 지칭한다.
AAVHSC15 캡시드에 패키징된 pHM-05217의 안전성을 조사하기 위해, 야생형 마우스에 대한 바이러스 투여의 효과를 연구하였다. AAVHSC15 캡시드에 패키징된 pHM-05217의 내약성은 투여 용량에 걸쳐 그리고 시간에 따라 체중 감소의 증거가 관찰되지 않았을 때 입증되었다(도 13a 및 도 13b). 도 13a 및 도 13b에 도시된 바와 같이, AAVHSC15에 패키징된 pHM-05217로 치료한 야생형 및 Ids KO 반접합체 마우스 둘 다는 시간 경과에 따른 체중 감소의 증거를 나타내지 않았다. 도 13에서, 그룹 1: Ids KO 반접합체 마우스 대조군; 그룹 2: AAVHSC15 캡시드에 2.2e13 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스; 그룹 3: 6.5e13 vg/kg의 투여량으로 AAVHSC15 캡시드에 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스; 그룹 4: AAVHSC15 캡시드에 1.1e14 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스; 및 그룹 5: 야생형 마우스. 도 13b에서, 그룹 5: 야생형 마우스; 그룹 6: AAVHSC15 캡시드에 2.2e13 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 야생형 마우스; 및 그룹 7: AAVHSC15 캡시드에 1.1e14 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 야생형 마우스.
야생형 마우스에서의 I2S 활성은 AAVHSC15 캡시드에 패키징된 pHM-05217의 투여 시 투여량 의존적인 것으로 밝혀졌다. 혈청에서, 투여 후 2주(도 14a) 및 4주(도 14b)차에, 표시된 바와 같은 투여량으로 AAVHSC15 캡시드에 패키징된 pHM-05217을 투여한 야생형 마우스는 I2S 활성의 투여량 의존적 증가를 나타냈다. 미치료 야생형(WT) 마우스 및 Ids KO 반접합체(MPS II) 마우스를 대조군으로서 사용하였다. 간에서, 투여 후 4주차(도 14c)에, 표시된 바와 같은 투여량으로 AAVHSC15 캡시드에 패키징된 pHM-05217을 투여한 야생형 마우스는 I2S 활성의 투여량 의존적 증가를 나타냈다. 이는 인간 I2S 활성이 야생형 마우스에서 검출 가능하며, 야생형 마우스에서 정상 수준보다 I2S 활성을 증가시키는 것이 체중에 영향을 미치지 않음을 입증하였다.
AAVHSC15 캡시드로 패키징된 pHM-05217을 투여한 야생형 마우스에서의 GAG 수준은 야생형 미치료 마우스의 GAG 수준과 유사하며, 야생형 수준 미만으로 더 감소되지 않는 것으로 밝혀졌다. 뇌(도 15a) 및 간(도 15b)에서, 치료된 Ids KO 반접합체 마우스의 GAG 수준은 야생형 미치료 마우스(대조군)와 유사한 것으로 밝혀졌다. ***는 p<0.001의 통계적 유의성을 나타내고, ****는 p<0.0001의 통계적 유의성을 나타낸다.
뇌 및 간에서의 발현은 AAVHSC15에 패키징된 pHM-05217의 투여 시 용량 의존적인 것으로 밝혀졌다. 도 16a는 표시된 투여량으로 AAVHSC15에 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스의 뇌 발현을 보여주는데, 이는 투여량이 증가함에 따라 발현이 증가하는 것을 보여준다. 도 16b는 표시된 투여량으로 AAVHSC15에 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스의 간 발현을 보여주는데, 이는 투여량이 증가함에 따라 발현이 증가하는 것을 보여준다. 일반적으로, 간은 뇌보다 더 많은 양의 침묵 변형된 IDS 발현을 갖는 것으로 밝혀졌다. *는 p<0.05의 통계적 유의성을 나타내고, ***는 p<0.001의 통계적 유의성을 나타낸다.
AAVHSC15 캡시드에 패키징된 pHM-05217의 효능을 조사하기 위해, Ids KO 반접합체 마우스에 대한 바이러스 투여의 효과를 연구하였다. AAVHSC15 캡시드로 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스의 혈청 I2S 활성은 투여 후 2주차(도 17a)에 검출되었고, 4주차(도 17b)에 일관되게 유지되었다. 4주차에, 혈청 I2S 활성은 6.5e13 vg/kg의 투여량까지 투여량 의존적인 것으로 밝혀졌다. **는 p<0.01의 통계적 유의성을 나타내고, ****는 p<0.0001의 통계적 유의성을 나타낸다.
AAVHSC15 캡시드에 패키징된 pHM-05217은 또한 간에서 투여량 의존적인 I2S 활성을 나타냈다. 도 18은 AAVHSC15 캡시드에 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스의 간 I2S 활성을 보여준다. **는 p<0.01의 통계적 유의성을 나타내고, ****는 p<0.0001의 통계적 유의성을 나타낸다.
AAVHSC15에 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스의 소변 내 GAG 수준은 투여 후 2주차(도 19a) 및 4 주차(도 19b)에 모든 투여량에서 야생형 수준으로 감소되는 것으로 밝혀졌다. AAVHSC15에 패키징된 pHM-05217를 투여한 Ids KO 반접합체 마우스의 소변 내 GAG 헤파린 설페이트(GAG-HS)(도 19c) 및 GAG 더마탄 설페이트(GAG-DS)(도 19d) 수준은 투여 후 4주차에 야생형 수준까지 감소된 것으로 밝혀졌다. GAG 수준을 질량 분광분석에 의해 결정하고, 각 소변 샘플에서 크레아티닌 수준으로 정규화하였다. 이원분산분석(ANOVA)을 사용하여 통계적 분석을 수행하였다: ns는 통계적 유의성이 없음을 나타내고, **는 p<0.01의 통계적 유의성을 나타내고, ***는 p<0.001의 통계적 유의성을 나타내고, ****는 p<0.0001의 통계적 유의성을 나타낸다.
AAVHSC15에 패키징된 pHM-05217을 투여한 Ids KO 반접합체 마우스의 간(도 20a), 심장(도 20b), 폐(도 20c), 뇌(도 20d), 신장(도 20e) 및 비장(도 20f)의 GAG 수준은 투여 후 4주차에 모든 투여량에서 야생형 수준으로 감소되는 것으로 밝혀졌다. *는 p<0.05의 통계적 유의성을 나타내고, **는 p<0.01의 통계적 유의성을 나타내며, ***는 p<0.001의 통계적 유의성을 나타내고, ****는 p<0.0001의 통계적 유의성을 나타낸다.
실시예 6: 뮤코다당류증(MPS) II(헌터 증후군) 마우스 모델에서의 IDS 유전자 전달
또 다른 실시예에서, 성인 야생형 및 Ids KO 반접합체 마우스(Ids KO 반접합체; MPS II로도 지칭됨)에서 4주 정맥 내 단일 투여량 범위 확인 연구를 수행하였다. 2.2e13 vg/kg, 6.5e13 vg/kg, 및 1.1e14 vg/kg의 AAVHSC15 캡시드에 패키징된 pHM-05217을 그룹 당 4~5마리의 마우스의 정맥 내에 투여하였다. 투여 후 4주차에 마우스를 희생시켰다. 이들 실험에서, AAVHSC15에 패키징된 pHM-05217은 뇌의 혈액-뇌 장벽을 통과하고 세포에 형질도입되어, 뇌에서 I2S의 발현 및 유의한 헤파란 설페이트 감소 및 용량 의존적 LAMP1 감소를 유도하는 것으로 밝혀졌다. 혈청 및 간 I2S 활성은 또한 투여량 의존적인 것으로 밝혀졌다. 모든 투여량에서, 헤파란 설페이트 수준은 시험한 모든 말초 조직에서 감소하는 것으로 밝혀졌다. MPS II 또는 WT 치료 동물의 체중 감소 결여에 기반하여, AAVHSC15에 패키징된 최대 1.1e14 vg/kg의 pHM-05217의 투여량은 관용성이 있는 것으로 밝혀졌다.
AAVHSC15 캡시드에 패키징된 pHM-05217의 단일 정맥 내 투여는 벡터 게놈의 수준(도 21a) 및 주요 쥣과 동물 말초 및 중앙 장기에서 hIDS 전사체(도 21b)의 투여량 의존적 증가를 초래하는 것으로 밝혀졌다. 도 21b는 야생형 hIDS 전사체에 대해 정규화된 침묵 변형된 hIDS 전사체의 백분율을 보여준다. 헤파란 설페이트(도 21c), 더마탄 설페이트(도 21d) 및/또는 총 GAG 수준은 모든 투여량에서 모든 기관에서 감소되는 것으로 밝혀졌다. 도 21c 및 21d에서, *는 p<0.05의 통계적 유의성을 나타내고, **는 p<0.01의 통계적 유의성을 나타내며, ****는 p<0.0001의 통계적 유의성을 나타내고, ns는 유의하지 않음을 나타낸다.
투여 후 4주차에, AAVHSC15 캡시드에 패키징된 pHM-05217을 투여한 MPS II 마우스는 뇌에서 벡터 게놈 수준(도 22a), 인간 야생형 hIDS 전사체에 대해 정규화된 침묵 변형된 hIDS 전사체의 백분율(도 22b) 및 I2S 활성(도 22c)의 투여량 의존적 증가를 나타냈다. AAVHSC15에 패키징된 pHM-05217을 투여한 MPS II 마우스의 뇌에서의 헤파란 설페이트 수준은 투여 후 4주차에 모든 투여량에서 감소되는 것으로 밝혀졌다(도 22d). 도 22a~22d에 나타낸 바와 같이, AAVHSC15 캡시드에 패키징된 pHM-05217은 혈액-뇌 장벽을 통과하고, 뇌 조직에 형질도입되어, 침묵 변형된 hIDS를 발현하였고, 뇌에서 검출 가능한 I2S 활성을 초래하고, 뇌 조직 특이적 GAG를 감소시켰다. 도 22a~22d에서, *는 p<0.05의 통계적 유의성을 나타내고, **는 p<0.01의 통계적 유의성을 나타내며, ***는 p<0.001의 통계적 유의성을 나타내고, ns는 유의하지 않음을 나타낸다.
AAVHSC15 캡시드에 패키징된 pHM-05217의 투여가 뇌 병리에 미치는 효과를 추가로 평가하기 위해, 소뇌(도 23a), 척수(도 23b) 및 해마(도 23c)를 면역조직화학(IHC)에 의해 리소좀-연관 막 단백질 1(LAMP1)에 대해 분석하였다. LAMP1의 존재는 리소좀 부담의 증거이다. 면역조직화학(IHC)에 의한 LAMP1의검출은 토끼 다클론 항-LAMP1 항체(Abcam, ab24170)를 사용하여 수행하였다. 간략하게, 포르말린 고정 파라핀 포매(FFPE) 샘플을 4 μm 또는 6 μm로 절단하고 하전된 슬라이드에 장착하였다. 슬라이드는 자동 염색기를 사용하여 처리되고 가공되었고, 항-LAMP1 일차 항체로 30분 동안 염색되었고(0.25 μg/ml), 항-토끼 표지된 중합체-HRP로 30분 동안 염색되었다. 염색된 절편의 이미지를 촬영하고 픽셀 평균 회색 값을 분석하여, 각 절편에서 LAMP1의 발현에 대한 반정량적 보고를 허용하였다. 도 23a~23c에서, AAVHSC15에 패키징된 pHM-05217은 혈액-뇌 장벽을 통과하였고, 치료한 MPS II 마우스의 CNS에서 LAMP1 감소의 투여량 의존적 추세를 초래하였다. 도 23a~23c에서, *는 p<0.05의 통계적 유의성을 나타내고, **는p<0.01의 통계적 유의성을 나타내며, ***는 p<0.001의 통계적 유의성을 나타내고, ****는 p<0.0001의 통계적 유의성을 나타내며, ns는 유의하지 않음을 나타낸다.
LAMP1 발현은 또한 간, 비장, 심장, 신장 및 폐를 포함하는 주요 기관에서 IHC에 의해 분석되었다. AAVHSC15 캡시드에 1.1e14 vg/kg의 투여량으로 패키징된 pHM-05217을 투여한 MPS II 마우스의 정성적 분석은 미치료 MPS II 마우스(비히클을 투여한 MPS II 마우스)와 비교하여, 치료한 MPS II 마우스의 간, 비장, 심장, 신장 및 폐에서 LAMP1의 발현이 감소하였음을 입증하였다.
투여 후 4주차에, AAVHSC15 캡시드에 패키징된 pHM-05217을 투여한 MPS II 마우스는 혈청(도 24) 및 간(도 25)에서 I2S 활성의 용량 의존적 증가를 보여주었다. 도 24 및 25에서, **는 p<0.01의 통계적 유의성을 나타내고, ****는 p<0.0001의 통계적 유의성을 나타내며, ns는 유의하지 않음을 나타낸다.
실시예 7: 야생형 및 침묵 변형된 hIDS 전달 벡터 간의 비교
본 실시예는 벡터가 형질도입되는 세포(예를 들어, 인간 세포 또는 마우스 세포)에서 인간 IDS(hIDS)의 발현을 위한 인간 IDS 전달 벡터 pHM-05205를 제공한다. 본 실시예는 hIDS 전달 벡터 T-006과 pHM-05205의 효능 간의 비교를 제공한다. T-006은 실시예 3에 기술되어 있고, pHM-05205는 아래에 기술되어 있다.
pHM-05205
도 26a에 도시된 바와 같이, IDS 전달 벡터 pHM-05205는 5'에서 3'으로 다음의 유전적 요소를 포함한다: 5' ITR 요소; CMV 프로모터를 포함하는 전사 조절 요소; 야생형 인간 IDS 인트론-삽입 암호화 서열; SV40 폴리아데닐화 서열; 및 3' ITR 요소. 이들 요소의 서열은 표 3에 제시되어 있다. 이 벡터는 벡터가 형질도입되는 세포(예를 들어, 인간 세포 또는 마우스 세포)에서 인간 IDS 단백질을 발현할 수 있다.
인간 IDS 전달 벡터 pHM-05205에서의 유전적 요소 | |
유전적 요소 | pHM-05205 |
서열번호 | |
5' ITR 요소 | 49 |
전사 조절 요소 | 29 |
인간 IDS 암호화 서열 | 25 |
SV40 폴리아데닐화 서열 | 45 |
3' ITR 요소 | 14 |
rAAV 게놈(프로모터에서 폴리아데닐화 서열까지) | 75 |
rAAV 게놈(5' ITR에서 3' ITR까지) | 76 |
야생형 hIDS 암호화 서열을 포함하는 hIDS 전달 벡터(pHM-05205) 및 침묵 변형된 hIDS 암호화 서열을 포함하는 hIDS 전달 벡터(T-006)의 효능을 시험하기 위해, T-006 및 pHM-05205를 AAVHSC15에 각각 포장하여 6e13 vg/kg의 투여량으로 MPS II 마우스에 투여하였다. 투여 후 4주차에 마우스를 희생시키고 혈청(도 26b) 및 간(도 26c) 내 I2S 활성뿐 아니라 쥣과 G 단백질 경로 억제자 1(GPS1)의 발현에 대해 정규화된 hIDS 전사체의 상대적 발현을 측정하였다(도 26d). 도 26b 및 26c에 나타낸 바와 같이, 야생형 hIDS 전달 벡터(pHM-05205; "SC WT")의 투여에 비해, 침묵 변형된 hIDS 전달 벡터(T-006; "SC SA")의 투여는 치료된 MPS II 마우스 내 혈청 및 간에서 각각 유의하게 더 높은 I2S 활성을 초래하였다. 도 26d는 야생형 hIDS 전달 벡터의 투여와 비교하여 치료된 MPS II 마우스에서 침묵 변형된 hIDS 전달 벡터의 투여는 뇌 조직에서 hIDS 전사체의 유의하게 더 높은 상대적 발현을 초래함을 보여준다. 비히클로 치료한 MPS II 마우스를 대조군으로서 사용하였다. 도 26b~26d에서, ****는 p<0.0001의 통계적 유의성을 나타내고, ns는 유의하지 않음을 나타낸다.
실시예 8: 단일-가닥 및 자가 상보성 hIDS 전달 벡터 간의 비교
본 실시예는 벡터가 형질도입되는 세포(예를 들어, 인간 세포 또는 마우스 세포)에서 인간 IDS(hIDS)의 발현을 위한 인간 IDS 전달 벡터 pHM-05211을 제공한다. 본 실시예는 hIDS 전달 벡터 pHM-05205와 pHM-05211 간의 비교를 제공한다. pHM-05205는 실시예 7에 기술되어 있고, pHM-05211은 아래에 기술되어 있다.
pHM-05211
도 27a에 나타낸 바와 같이, IDS 전달 벡터 pHM-05211은 5'에서 3'로 다음의 유전적 요소를 포함한다: 5' ITR 요소; CMV 프로모터를 포함하는 전사 조절 요소; 야생형 인간 IDS 인트론-삽입 암호화 서열; SV40 폴리아데닐화 서열; 및 3' ITR 요소. 이들 요소의 서열은 표 4에 제시되어 있다. 이 벡터는 벡터가 형질도입되는 세포(예를 들어, 인간 세포 또는 마우스 세포)에서 인간 IDS 단백질을 발현할 수 있다.
표 4:
[0001]
단일-가닥 hIDS 전달 벡터(pHM-05211; "SS WT")와 자가-상보성 hIDS 전달 벡터(pHM-05205; "SC WT") 간의 비교를 수행하였다. 도 27b는 각각 AAVHSC15 캡시드에 2e13 vg/kg의 용량으로 패키징된 pHM-05211 또는 pHM-05205를 투여한 MPS II 마우스에서 검출된 혈청 hI2S 활성의 수준을 보여준다. 혈청 hI2S 활성은 표시된 바와 같이, 투여 후 6 또는 8주차에 측정하였다. 단일-가닥 및 자가-상보성 hIDS 전달 벡터의 혈청 hI2S 활성을 유도하는 능력 사이에 유의한 차이는 발견되지 않았다. 도 27c는 단일-가닥 또는 자가-상보성 전달 벡터로 치료한 MPS II 마우스에서 쥣과 G 단백질 경로 억제자 1(GPS1)의 발현에 대해 정규화된 hIDS 전사체의 상대적 발현을 보여준다. 표시된 바와 같이, 투여 후 2 또는 8주차에 마우스를 희생시켰고, 각 코호트에서 단일-가닥 또는 자가-상보성 전달 벡터로 치료한 마우스 사이에서 hIDS 전사체의 상대적 발현에서 차이가 검출되지 않았다. ns는 유의하지 않음을 나타낸다.
[0002]
분석적 초원심분리 침강 속도(AUC)는 침강 계수에 기초하여 거대분자를 정량화하는 데 사용되는 분석 방법이다. rAAV 샘플의 분석을 위해, AUC를 사용해 DNA-함유(완전한 캡시드 및 부분적으로 완전한 캡시드) 및 빈 캡시드의 상대 백분율을 결정할 수 있다. 단일-가닥 및 자가-상보성 전달 벡터에 대한 AUC 프로파일을 결정하였다. 단일-가닥 전달 벡터의 AUC 프로파일은 자가-상보성 전달 벡터의 AUC 프로파일과 비교하여 완전한 캡시드의 백분율이 더 높은 프로파일을 나타냈다. 자가-상보성 전달 벡터(pHM-05205)는 31.7%의 완전히 패키징된 캡시드를 초래하였고, 단일-가닥 전달 벡터(pHM-05211)는 85.0%의 완전히 패키징된 캡시드를 초래하였다.
실시예 9: 뮤코다당류증(MPS) II(헌터 증후군) 마우스 모델에서의 hIDS 유전자 전달
본 실시예는 성인 야생형 및 Ids KO 반접합체 마우스(Ids KO 반접합체; MPS II 마우스로도 지칭됨)에서 52주 단일 정맥 내 투여 시간 경과, 내구성 및 효능 연구를 기술한다. AAVHSC15 캡시드에 패키징된 1.8e14 vg/kg 용량의 pHM-05217을 그룹 당 3~5마리의 마우스에게 정맥 내 투여하였다.
MPS II 마우스에게 정맥내로 투여되는 AAVHSC15 캡시드에 패키징된 pHM-05217의 단일 1.8e14 vg/kg 투여량은 대조군 비히클-치료 MPS II 마우스와 비교하여 유의한 혈청 I2S 활성을 유발하는 것으로 밝혀졌다(도 28a). 혈청 I2S 활성은 투여 후 52주까지 검출 가능하였다.
투여 후 52주차에, 벡터 게놈 및 발현을 유지하였다. 전달 벡터로 치료한 MPS II 마우스의 뇌, 심장, 간, 비장, 신장 및 폐 조직에서 투여 후 52주까지 벡터 게놈(도 28b) 및 hIDS 전사체(도 28c)의 수준을 검출하였다. AAVHSC15에 패키징된 1.8e14 vg/kg의 pHM-05217을 투여한 후 52주차에, 뇌, 심장, 간, 비장, 신장 및 폐 조직에서의 글리코사미노글리칸 헤파란 설페이트(GAG-HS) 수준은 비히클로 치료한 MPS II 마우스와 비교하여 감소한 것으로 밝혀졌다(도 28d).
뇌에서, IHC에 의해 분석된 바와 같이, 투여 후 52주차에 척수(도 28e) 및 해마(도 28f)에서 LAMP-1 염색의 감소가 관찰되었다. 해마에서, LAMP-1 염색은 전달 벡터로 치료한 MPS II 마우스에서 비히클로 치료한 MPS II 마우스와 비교하여 유의하게 감소하였다. 도 28e 및 28f에서, *는 p<0.05의 통계적 유의성을 나타내고, ns는 유의하지 않음을 나타낸다.
혈액-신경 장벽(BNB)의 통과 및 말초 신경계(PNS)의 형질도입을 평가하기 위해, 동물로부터 삼차 신경절을 채취하였다. 비히클로 치료한 MPS II 마우스 및 야생형 마우스와 비교하여, AAVHSC15 캡시드에 패키징된 1.8e14 vg/kg의 투여량의 pHM-05217을 투여한 MPS II 마우스에서는 투여 후 39주차에 벡터 게놈이 검출되었다(도 28g). 도 28g에 나타낸 바와 같이, AAVHSC15에 패키징된 pHM-05217은 BNB를 통과하여 PNS의 세포에 형질도입되는 것으로 밝혀졌다.
AAVHSC15 캡시드에 패키징된 1.8e14 vg/kg의 투여량의 pHM-05217을 투여한 MPS II 마우스에서 간 및 뇌 조직 특이적 I2S 효소 활성을 검출하였다. 간 특이적 I2S 효소 활성은 투여 후 12, 24, 39, 및 52주차에 검출되었고(도 28h), 뇌 특이적 I2S 효소 활성은 투여 후 12주(도 28i), 24주(도 28j), 39주(도 28k), 및 52주(도 28l)차에 검출되었다. 도 28j~28l에서, 정상 성인 인간 뇌 조직을 추가 대조군으로서 사용하였다.
AAVHSC15에 패키징된 1.8e14 vg/kg의 pHM-05217을 투여한 MPS II 마우스의 소변에서 검출된 GAG-HS의 수준은, 비히클로 치료한 MPS II 마우스와 비교하여, 투여 후 적어도 52주까지 감소하는 것으로 밝혀졌다(도 28m). 소변 GAG-HS 수준을 질량 분광분석에 의해 결정하고 각 소변 샘플에서 크레아티닌 수준으로 정규화하였다. 도 28m에서, 데이터는 각 투여량 코호트에 대한 평균 수준으로서 제시된다(n=3~5마리 마우스/그룹).
MPS II 마우스는 소뇌에서 퍼킨지 세포 뉴런의 진행성 변성을 특징으로 한다. AAVHSC15에 패키징된 1.8e14 vg/kg의 pHM-05217을 투여한 MPS II 마우스의 투여 후 52주차에 퍼킨지 세포층(PCL) 세포 선형 밀도를 정량화하였다. 헤마톡실린 및 에오신(H&E)으로 공동 염색된 시상 뇌 절편에 대해 퍼킨지 세포 선형 밀도의 정량화를 수행하였다. 소뇌의 이미지를 수집하고, 400 μm 길이의 퍼킨지 세포층(PCL) 영역을 따라 총 퍼킨지 세포체 수를 수동으로 계수하였다. 절편 당 3개의 PCL 영역을 무작위로 샘플링하였다(n = 동물 당 1개의 섹션). AAVHSC15에 패키징된 1.8e14 vg/kg의 pHM-05217을 투여한 MPS II 마우스는, 비히클로 치료한 MPS II 마우스와 비교하여, 퍼킨지 세포 변성을 완화시킨 것으로 밝혀졌다(도 28n). 도 28n에서, **은 일원 분산 분석(ANOVA) 검정에 의해 계산했을 때, p<0.01의 통계적 유의성을 나타낸다.
MPS II 마우스는 야생형 동물과 비교하여, 비후해진 관공굴, 비후한 손가략, 및 뒷발 비대를 포함하는 골격 이상을 특징으로 한다. 껍질을 제거한 동물의 두개골에서 캘리퍼를 사용하여 관공굴 기저부 형태 측정 값을 평가하였다. AAVHSC15 캡시드에 패키징된 1.8e14 vg/kg 투여량의 pHM-05217을 투여한 MPS II 마우스는 비히클로 치료한 MPS II 마우스와 비교하여 관골궁 두께가 감소된 것으로 밝혀졌다(도 28o). 도 28o에서, ***는 p<0.01의 통계적 유의성을 나타내고, ns는 유의하지 않음을 나타낸다.
투여 후 52주차에, AAVHSC15에 패키징된 1.8e14 vg/kg의 pHM-05217로 치료한 MPS II 마우스는 미치료 MPS II 마우스(비히클을 투여한 MPS II 마우스)에 비해 감소된 발과 발목 비대를 나타냈다. 마취된 마우스에 대해 디지털 캘리버를 사용하여 도 29a에 제공된 바와 같은 도식을 따라 발목 및 발 측정을 수행하였다. 도 29b 및 29c에 나타낸 바와 같이, 전달 벡터로 치료한 MPS II 마우스는 비히클-치료 MPS II 대조군 마우스와 비교하여 발 폭(도 29b) 및 깊이(도 29c) 모두에서 측정된 바와 같이 시간에 따른 뒷발의 비후화의 완화를 보여주었다 도 29d 및 29e에 나타낸 바와 같이, 전달 벡터로 치료한 MPS II 마우스는 비히클로 치료한 MPS II 대조군 마우스와 비교하여 발목 폭(도 29d) 및 깊이(도 29e) 둘 다에서 측정된 바와 같이 시간에 따른 비절의 팽창의 완화를 보여주었다
실시예 10: 뮤코다당류증(MPS) II(헌터 증후군) 마우스 모델에서의 IDS 유전자 전달
본 실시예는 성인 야생형 및 Ids KO 반접합체 마우스(Ids KO 반접합체; 또한 MPS II 마우스로도 지칭됨)에서 8주 단일 정맥 내 투여 생물학적 동역학 연구를 기술한다. AAVHSC15 캡시드에 패키징된 1.8e14 vg/kg 투여량의 pHM-05217을 그룹 당 4~5마리의 마우스에게 정맥 내 투여하였다.
MPS II 마우스에게 정맥내로 투여되는 AAVHSC15 캡시드에 패키징된 1.8e14 vg/kg의 단일 투여량의 pHM-05217은, 대조군 비히클 치료된 MPS II 마우스와 비교하여 투여 후 이르게는 1일차에 측정 가능한 유의한 혈청 I2SS 활성을 유발하는 것으로 밝혀졌다(도 30a). AAVHSC15 캡시드에 패키징된 1.8e14 vg/kg의 단일 투여량의 pHM-05217을 정맥 내 투여한 MPS II 마우스에서 벡터 게놈(도 30b) 및 발현(도 30c) 수준을 시험한 모든 시점에, 뇌, 심장, 간 및 비장 조직에서 검출하였다. 투여 후 8주차에, AAVHSC15 캡시드에 패키징된 1.8e14 vg/kg의 단일 투여량의 pHM-05217을 정맥 내 투여한 MPS II 마우스에서 간 조직(도 30d) 및 뇌 조직(도 30e) 특이적 I2S 활성을 검출하였다. AAVHSC15에 패키징된 1.8e14 vg/kg의 pHM-05217의 투여 후 8일(도 31a), 2주(도 31b), 및 8주(도 31c)차의 시점에 시점에, 뇌, 심장, 간 및 비장 조직에서의 글리코사미노글리칸 헤파란 설페이트(GAG-HS) 수준은 비히클로 치료한 MPS II 마우스와 비교하여 감소한 것으로 밝혀졌다. AAVHSC15에 패키징된 1.8e14 vg/kg의 pHM-05217을 투여한 MPS II 마우스의 소변에서 검출된 GAG-HS의 수준은, 비히클로 치료한 MPS II 마우스와 비교하여, 투여 후 3일 및 적어도 8주까지 베이스라인 수준 대비 감소하는 것으로 밝혀졌다(도 31d). 도 30a~31d에서, *는 p<0.05의 통계적 유의성을 나타내고,, **는 p<0.01의 통계적 유의성을 나타내며, ***는 p<0.001의 통계적 유의성을 나타내고, ns는 유의하지 않음을 나타낸다.
실시예 11: 뮤코다당류증(MPS) II(헌터 증후군) 마우스 모델에서의 IDS 유전자 전달
고성능 액체 크로마토그래피 질량 분광분석을 사용하여, 헤파란란분해효소 분해 후 CSF 샘플에서 헤파란 설페이트 특이적 이당류를 측정함으로써 마우스의 뇌척수액(CSF)에서 글리코사미노글리칸 헤파란 설페이트(GAG-HS) 수준을 결정하였다. 도 32a에 표시된 바와 같이, 투여 후 12주차에 GAG-HS 수준을 야생형(WT) 마우스, 비히클로 치료한 MPS II 마우스, 및 6e13 vg/kg(MPS II 6E+13), 1e14 vg/kg(MPS II 1E+14), 또는 2e14 vg/kg (MPS II 2E+14)의 투여량으로 정맥 내 투여한 AAVHSC15 캡시드로 패키징된 pHM-05217로 치료한 MPS II 마우스의 CSF에서 측정하였다. 비히클로 치료한 MPS II 마우스와 비교했을 때, 시험한 모든 투여량에서 CSF GAG-HS 수준의 감소가 관찰되었다. 도 32a에서, 각 군은 총 5마리의 마우스로부터 모인 3개의 CSF 샘플을 갖는다. 통계적 분석은 일방향 분산 분석(ANOVA)을 사용하여 수행하였다. *는 p<0.05의 통계적 유의성을 나타내고, **는 p<0.01의 통계적 유의성을 나타낸다. 도 32b에 표시된 바와 같이, 투여 후 12주차에, 야생형(WT) 마우스, 비히클로 치료한 MPS II 마우스, 및 6e13 vg/kg(MPS II 6E+13), 1e14 vg/kg(MPS II 1E+14), 또는 2e14 vg/kg(MPS II 2E+14)의 투여량으로 정맥 내 투여한 AAVHSC15 캡시드로 패키징된 pHM-05217로 치료된 MPS II 마우스의 뇌 조직 내 GAG-HS 수준. 도 32b에 도시된 바와 같이, 비히클로 치료한 미치료 MPS II 마우스와 비교했을 때, 시험한 모든 투여량에서 뇌 GAG-HS 수준의 감소가 관찰되었다. 통계적 분석은 일방향 분산 분석(ANOVA)을 사용하여 수행하였다. ****는 p<0.0001의 통계적 유의성을 나타낸다.
도 32c에 표시된 바와 같이, 투여 후 12주차에 야생형(WT) 마우스, MPS II 마우스, 6e13 vg/kg(MPS II 6E+13), 1e14 vg/kg(MPS II 1E+14), 또는 2e14 vg/kg(MPS II 2E+14)의 투여량으로 정맥 내 투여한 AAVHSC15 캡시드로 패키징된 pHM-05217로 치료한 MPS II 마우스의 뇌 조직에서 I2S 활성을 검출하였다. 정상 성인 인간 뇌 조직을 추가 대조군으로서 사용하였다. 통계적 분석은 일방향 분산 분석(ANOVA) 검정을 사용하여 수행하였다. *는 p<0.05의 통계적 유의성을 나타내고, ***는 p<0.001의 통계적 유의성을 나타낸다.
실시예 12: IDS 유전자 전달 교차 보정
AAV 유전자 전달 벡터로부터 발현된 I2S의 교차-보정 능력을 조사하기 위해, AAVHSC15에 패키징된 1.8e14 vg/kg의 pHM-05217을 MPS II 마우스에 정맥 내 투여하고 혈청을 분석하였다.
이두로네이트-2-설파타제는 번역 후 변형된다. 초기 73~78 kDa IDS 단백질은 만노오스 6-포스페이트(M6P) 모이어티의 첨가를 통해 90 kDa 인산화 전구체로 전환된다. 그런 다음, 90 kDa 전구체를 다양한 중간체를 통한 단백질 분해 절단을 통해 주요 55 kDa 중간체로 가공하고, 18 kDa 폴리펩티드를 방출한다. 티올 프로테아제에 의한 추가 단백질 분해 절단은 혼성 및 복합형 올리고당 사슬을 함유하는 45 kDa 성숙 형태를 초래한다.
요약하자면, IDS KO HeLa 세포를 배양하고, 투여 후 8일차에 AAVHSC15에 패키징된 1.8e14 vg/kg의 pHM-05217로 치료한 MPS II 마우스로부터 수득한 마우스 혈청과 함께 배양하였다. 세포를 48시간 동안 M6P의 존재 또는 부재 하에 처리된 마우스 혈청과 함께 인큐베이션하였다. 염소 항-hIDS 1차 항체로 탐침하고 당나귀 항-염소 2차 항체를 사용하여 검출한 웨스턴 블롯은 다음을 확인하였다: (1) AAVHSC15에 패키징된 pHM-05217에 의해 만들어진 hIDS 단백질은 90 kDa 전구체 형태로 치료한 MPS II 마우스의 혈청에서 순환하고; (2) 90 kDa 형태는 촉매 활성이고; (3) IDS KO HeLa 세포에서 M6P-의존성 경로를 통해 90 kDa 형태를 취하고, IDS KO HeLa 세포의 리소좀에서 중간체 55 kDa 및 성숙한 45 kDa 단백질로 가공한다.
처리된 MPS II 마우스로부터 수득한 마우스 혈청과 함께 IDS KO HeLa 세포를 인큐베이션한 후, 세포를 원심분리하고 상청액을 제거하였다. 그런 다음, 펠릿화된 세포를 용해시키고 hI2S 활성에 대해 분석하였다. 도 33은 IDS KO 세포(대조군), M6P 없이 처리된 MPS II 마우스 혈청으로 인큐베이션한 IDS KO 세포, 및 M6P와 함께 처리된 MPS II 마우스 혈청으로 인큐베이션한 IDS KO 세포에서 검출된 I2SS 활성의 수준을 보여준다. 도 33에 도시된 바와 같이, AAVHSC15에 패키징된 1.8e14 vg/kg의 pHM-05217을 투여한 후 8일차에 MPS II 마우스로부터 수득된 혈청으로 처리된 IDS KO HeLa 세포의 용해물에서 I2S 활성을 검출하였다. I2S 활성은 M6P가 존재할 때 더 낮은 것으로 밝혀졌으며, 임의의 이론에 구속되지 않고, M6P가 M6P 수용체에 대해 경쟁하고, 따라서 hI2S 흡수가 시험관 내에서 M6P 수용체 경로에 의해 매개된다는 것을 시사한다. *는 p<0.05의 통계적 유의성을 나타내고, ***는 p<0.001의 통계적 유의성을 나타낸다.
*
*
*
본 발명은 본원에 기술된 특정 구현예에 의해 그 범위가 제한되지 않는다. 실제로, 기술된 것들에 더하여, 본 발명의 다양한 변형은 전술한 설명 및 첨부 도면으로부터 당업자에게 명백해질 것이다. 이러한 변형은 첨부된 청구범위의 범주 내에 속하는 것으로 의도된다.
본원에 인용된 모든 참조(예를 들어, 간행물 또는 특허 또는 특허 출원)는 각각의 개별 참조(예를 들어, 간행물 또는 특허 또는 특허 출원)가 모든 목적을 위해 그 전체가 참조로서 포함되는 것으로 구체적 및 개별적으로 표시된 것과 동일한 정도로 그 전체가 모든 목적을 위해 본원에 참조로서 포함된다. 다른 구현예는 다음의 청구범위 내에 있다.
<110> HOMOLOGY MEDICINES, INC.
<120> ADENO-ASSOCIATED VIRUS COMPOSITIONS FOR IDS GENE TRANSFER AND
METHODS OF USE THEREOF
<130> HMW-037WO (182710)
<150> US 63/005,833
<151> 2020-04-06
<150> US 63/094,800
<151> 2020-10-21
<150> US 63/145,258
<151> 2021-02-03
<160> 78
<170> PatentIn version 3.5
<210> 1
<211> 736
<212> PRT
<213> Artificial Sequence
<220>
<223> adeno-associated virus 9
<400> 1
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 2
<211> 736
<212> PRT
<213> Artificial Sequence
<220>
<223> AAV isolate
<400> 2
Met Thr Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Gln Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 3
<211> 736
<212> PRT
<213> Artificial Sequence
<220>
<223> AAV isolate
<400> 3
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Gly Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Gly Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 4
<211> 736
<212> PRT
<213> Artificial Sequence
<220>
<223> AAV isolate
<400> 4
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Ile Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Tyr Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 5
<211> 736
<212> PRT
<213> Artificial Sequence
<220>
<223> AAV isolate
<400> 5
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Asp
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 6
<211> 736
<212> PRT
<213> Artificial Sequence
<220>
<223> AAV isolate
<400> 6
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Leu Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Ser Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 7
<211> 736
<212> PRT
<213> Artificial Sequence
<220>
<223> AAV isolate
<400> 7
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Arg Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 8
<211> 736
<212> PRT
<213> Artificial Sequence
<220>
<223> AAV isolate
<400> 8
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Val Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 9
<211> 736
<212> PRT
<213> Artificial Sequence
<220>
<223> AAV isolate
<400> 9
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Arg Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 10
<211> 736
<212> PRT
<213> Artificial Sequence
<220>
<223> AAV isolate
<400> 10
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Cys Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 11
<211> 736
<212> PRT
<213> Artificial Sequence
<220>
<223> AAV isolate
<400> 11
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Arg Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Lys Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 12
<211> 736
<212> PRT
<213> Artificial Sequence
<220>
<223> AAV isolate
<400> 12
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro His Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Asn
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Arg Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Met Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 13
<211> 736
<212> PRT
<213> Artificial Sequence
<220>
<223> AAV isolate
<400> 13
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Arg Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 14
<211> 145
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 14
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120
gagcgcgcag agagggagtg gccaa 145
<210> 15
<211> 736
<212> PRT
<213> Artificial Sequence
<220>
<223> AAV isolate
<400> 15
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Arg Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Arg Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 16
<211> 736
<212> PRT
<213> Artificial Sequence
<220>
<223> AAV isolate
<400> 16
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Ala Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Arg Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 17
<211> 736
<212> PRT
<213> Artificial Sequence
<220>
<223> AAV isolate
<400> 17
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Ile Ala Trp Pro Arg Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Cys Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 18
<211> 145
<212> DNA
<213> Artificial Sequence
<220>
<223> AAV2 5' ITR
<400> 18
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcct 145
<210> 19
<211> 145
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 19
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgcccgggc aaagcccggg cgtcgggcga cctttggtcg cccggcctca gtgagcgagc 120
gagcgcgcag agagggagtg gccaa 145
<210> 20
<211> 167
<212> DNA
<213> Artificial Sequence
<220>
<223> AAV5 5' ITR
<400> 20
ctctcccccc tgtcgcgttc gctcgctcgc tggctcgttt gggggggtgg cagctcaaag 60
agctgccaga cgacggccct ctggccgtcg cccccccaaa cgagccagcg agcgagcgaa 120
cgcgacaggg gggagagtgc cacactctca agcaaggggg ttttgta 167
<210> 21
<211> 167
<212> DNA
<213> Artificial Sequence
<220>
<223> AAV5 3' ITR
<400> 21
tacaaaacct ccttgcttga gagtgtggca ctctcccccc tgtcgcgttc gctcgctcgc 60
tggctcgttt gggggggtgg cagctcaaag agctgccaga cgacggccct ctggccgtcg 120
cccccccaaa cgagccagcg agcgagcgaa cgcgacaggg gggagag 167
<210> 22
<211> 621
<212> PRT
<213> Artificial Sequence
<220>
<223> AAV2 Rep
<400> 22
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
1 5 10 15
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu
20 25 30
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile
35 40 45
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu
50 55 60
Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
65 70 75 80
Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu
85 90 95
Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile
100 105 110
Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu
115 120 125
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
130 135 140
Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
145 150 155 160
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu
165 170 175
Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His
180 185 190
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn
195 200 205
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
210 215 220
Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys
225 230 235 240
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
245 250 255
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
260 265 270
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln
275 280 285
Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu
290 295 300
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
305 310 315 320
Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
325 330 335
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro
340 345 350
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
355 360 365
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
370 375 380
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
385 390 395 400
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
405 410 415
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
420 425 430
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
435 440 445
Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln
450 455 460
Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val
465 470 475 480
Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala
485 490 495
Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val
500 505 510
Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp
515 520 525
Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu
530 535 540
Phe Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys
545 550 555 560
Phe Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu
565 570 575
Ser Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr
580 585 590
Ile His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp
595 600 605
Leu Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln
610 615 620
<210> 23
<211> 550
<212> PRT
<213> Homo sapiens
<400> 23
Met Pro Pro Pro Arg Thr Gly Arg Gly Leu Leu Trp Leu Gly Leu Val
1 5 10 15
Leu Ser Ser Val Cys Val Ala Leu Gly Ser Glu Thr Gln Ala Asn Ser
20 25 30
Thr Thr Asp Ala Leu Asn Val Leu Leu Ile Ile Val Asp Asp Leu Arg
35 40 45
Pro Ser Leu Gly Cys Tyr Gly Asp Lys Leu Val Arg Ser Pro Asn Ile
50 55 60
Asp Gln Leu Ala Ser His Ser Leu Leu Phe Gln Asn Ala Phe Ala Gln
65 70 75 80
Gln Ala Val Cys Ala Pro Ser Arg Val Ser Phe Leu Thr Gly Arg Arg
85 90 95
Pro Asp Thr Thr Arg Leu Tyr Asp Phe Asn Ser Tyr Trp Arg Val His
100 105 110
Ala Gly Asn Phe Ser Thr Ile Pro Gln Tyr Phe Lys Glu Asn Gly Tyr
115 120 125
Val Thr Met Ser Val Gly Lys Val Phe His Pro Gly Ile Ser Ser Asn
130 135 140
His Thr Asp Asp Ser Pro Tyr Ser Trp Ser Phe Pro Pro Tyr His Pro
145 150 155 160
Ser Ser Glu Lys Tyr Glu Asn Thr Lys Thr Cys Arg Gly Pro Asp Gly
165 170 175
Glu Leu His Ala Asn Leu Leu Cys Pro Val Asp Val Leu Asp Val Pro
180 185 190
Glu Gly Thr Leu Pro Asp Lys Gln Ser Thr Glu Gln Ala Ile Gln Leu
195 200 205
Leu Glu Lys Met Lys Thr Ser Ala Ser Pro Phe Phe Leu Ala Val Gly
210 215 220
Tyr His Lys Pro His Ile Pro Phe Arg Tyr Pro Lys Glu Phe Gln Lys
225 230 235 240
Leu Tyr Pro Leu Glu Asn Ile Thr Leu Ala Pro Asp Pro Glu Val Pro
245 250 255
Asp Gly Leu Pro Pro Val Ala Tyr Asn Pro Trp Met Asp Ile Arg Gln
260 265 270
Arg Glu Asp Val Gln Ala Leu Asn Ile Ser Val Pro Tyr Gly Pro Ile
275 280 285
Pro Val Asp Phe Gln Arg Lys Ile Arg Gln Ser Tyr Phe Ala Ser Val
290 295 300
Ser Tyr Leu Asp Thr Gln Val Gly Arg Leu Leu Ser Ala Leu Asp Asp
305 310 315 320
Leu Gln Leu Ala Asn Ser Thr Ile Ile Ala Phe Thr Ser Asp His Gly
325 330 335
Trp Ala Leu Gly Glu His Gly Glu Trp Ala Lys Tyr Ser Asn Phe Asp
340 345 350
Val Ala Thr His Val Pro Leu Ile Phe Tyr Val Pro Gly Arg Thr Ala
355 360 365
Ser Leu Pro Glu Ala Gly Glu Lys Leu Phe Pro Tyr Leu Asp Pro Phe
370 375 380
Asp Ser Ala Ser Gln Leu Met Glu Pro Gly Arg Gln Ser Met Asp Leu
385 390 395 400
Val Glu Leu Val Ser Leu Phe Pro Thr Leu Ala Gly Leu Ala Gly Leu
405 410 415
Gln Val Pro Pro Arg Cys Pro Val Pro Ser Phe His Val Glu Leu Cys
420 425 430
Arg Glu Gly Lys Asn Leu Leu Lys His Phe Arg Phe Arg Asp Leu Glu
435 440 445
Glu Asp Pro Tyr Leu Pro Gly Asn Pro Arg Glu Leu Ile Ala Tyr Ser
450 455 460
Gln Tyr Pro Arg Pro Ser Asp Ile Pro Gln Trp Asn Ser Asp Lys Pro
465 470 475 480
Ser Leu Lys Asp Ile Lys Ile Met Gly Tyr Ser Ile Arg Thr Ile Asp
485 490 495
Tyr Arg Tyr Thr Val Trp Val Gly Phe Asn Pro Asp Glu Phe Leu Ala
500 505 510
Asn Phe Ser Asp Ile His Ala Gly Glu Leu Tyr Phe Val Asp Ser Asp
515 520 525
Pro Leu Gln Asp His Asn Met Tyr Asn Asp Ser Gln Gly Gly Asp Leu
530 535 540
Phe Gln Leu Leu Met Pro
545 550
<210> 24
<211> 1653
<212> DNA
<213> Homo sapiens
<400> 24
atgccgccac cccggaccgg ccgaggcctt ctctggctgg gtctggttct gagctccgtc 60
tgcgtcgccc tcggatccga aacgcaggcc aactcgacca cagatgctct gaacgttctt 120
ctcatcatcg tggatgacct gcgcccctcc ctgggctgtt atggggataa gctggtgagg 180
tccccaaata ttgaccaact ggcatcccac agcctcctct tccagaatgc ctttgcgcag 240
caagcagtgt gcgccccgag ccgcgtttct ttcctcactg gcaggagacc tgacaccacc 300
cgcctgtacg acttcaactc ctactggagg gtgcacgctg gaaacttctc caccatcccc 360
cagtacttca aggagaatgg ctatgtgacc atgtcggtgg gaaaagtctt tcaccctggg 420
atatcttcta accataccga tgattctccg tatagctggt cttttccacc ttatcatcct 480
tcctctgaga agtatgaaaa cactaagaca tgtcgagggc cagatggaga actccatgcc 540
aacctgcttt gccctgtgga tgtgctggat gttcccgagg gcaccttgcc tgacaaacag 600
agcactgagc aagccataca gttgttggaa aagatgaaaa cgtcagccag tcctttcttc 660
ctggccgttg ggtatcataa gccacacatc cccttcagat accccaagga atttcagaag 720
ttgtatccct tggagaacat caccctggcc cccgatcccg aggtccctga tggcctaccc 780
cctgtggcct acaacccctg gatggacatc aggcaacggg aagacgtcca agccttaaac 840
atcagtgtgc cgtatggtcc aattcctgtg gactttcagc ggaaaatccg ccagagctac 900
tttgcctctg tgtcatattt ggatacacag gtcggccgcc tcttgagtgc tttggacgat 960
cttcagctgg ccaacagcac catcattgca tttacctcgg atcatgggtg ggctctaggt 1020
gaacatggag aatgggccaa atacagcaat tttgatgttg ctacccatgt tcccctgata 1080
ttctatgttc ctggaaggac ggcttcactt ccggaggcag gcgagaagct tttcccttac 1140
ctcgaccctt ttgattccgc ctcacagttg atggagccag gcaggcaatc catggacctt 1200
gtggaacttg tgtctctttt tcccacgctg gctggacttg caggactgca ggttccacct 1260
cgctgccccg ttccttcatt tcacgttgag ctgtgcagag aaggcaagaa ccttctgaag 1320
cattttcgat tccgtgactt ggaagaggat ccgtacctcc ctggtaatcc ccgtgaactg 1380
attgcctata gccagtatcc ccggccttca gacatccctc agtggaattc tgacaagccg 1440
agtttaaaag atataaagat catgggctat tccatacgca ccatagacta taggtatact 1500
gtgtgggttg gcttcaatcc tgatgaattt ctagctaact tttctgacat ccatgcaggg 1560
gaactgtatt ttgtggattc tgacccattg caggatcaca atatgtataa tgattcccaa 1620
ggtggagatc ttttccagtt gttgatgcct tga 1653
<210> 25
<211> 1735
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 25
atgccgccac cccggaccgg ccgaggcctt ctctggctgg gtctggttct gagctccgtc 60
tgcgtcgccc tcggatccga aacgcaggcc aactcgacca cagatgctct gaacgttctt 120
ctcatcatcg tggatgacct gcgcccctcc ctgggctgtt atggggataa gctggtgagg 180
tccccaaata ttgaccaact ggcatcccac agcctcctct tccagaatgc ctttgcgcag 240
caagcagtgt gcgccccgag ccgcgtttct ttcctcactg gcaggagacc tgacaccacc 300
cgcctgtacg acttcaactc ctactggagg gtgcacgctg gaaacttctc caccatcccc 360
cagtacttca aggagaatgg ctatgtgacc atgtcggtgg gaaaagtctt tcaccctggg 420
atatcttcta accataccga tgattctccg tatagctggt cttttccacc ttatcatcct 480
tcctctgaga agtatgaaaa cactaagaca tgtcgagggc cagatggaga actccatgcc 540
aacctgcttt gccctgtgga tgtgctggat gttcccgagg gcaccttgcc tgacaaacag 600
agcactgagc aagccataca gttgttggaa aagatgaaaa cgtcagccag tcctttcttc 660
ctggccgttg ggtatcataa gccacacatc cccttcagat accccaaggt aagggtttaa 720
gggatggttg gttggtgggg tattaatgtt taattacctg gagcacctgc ctgaaatcac 780
tttttttcag gaatttcaga agttgtatcc cttggagaac atcaccctgg cccccgatcc 840
cgaggtccct gatggcctac cccctgtggc ctacaacccc tggatggaca tcaggcaacg 900
ggaagacgtc caagccttaa acatcagtgt gccgtatggt ccaattcctg tggactttca 960
gcggaaaatc cgccagagct actttgcctc tgtgtcatat ttggatacac aggtcggccg 1020
cctcttgagt gctttggacg atcttcagct ggccaacagc accatcattg catttacctc 1080
ggatcatggg tgggctctag gtgaacatgg agaatgggcc aaatacagca attttgatgt 1140
tgctacccat gttcccctga tattctatgt tcctggaagg acggcttcac ttccggaggc 1200
aggcgagaag cttttccctt acctcgaccc ttttgattcc gcctcacagt tgatggagcc 1260
aggcaggcaa tccatggacc ttgtggaact tgtgtctctt tttcccacgc tggctggact 1320
tgcaggactg caggttccac ctcgctgccc cgttccttca tttcacgttg agctgtgcag 1380
agaaggcaag aaccttctga agcattttcg attccgtgac ttggaagagg atccgtacct 1440
ccctggtaat ccccgtgaac tgattgccta tagccagtat ccccggcctt cagacatccc 1500
tcagtggaat tctgacaagc cgagtttaaa agatataaag atcatgggct attccatacg 1560
caccatagac tataggtata ctgtgtgggt tggcttcaat cctgatgaat ttctagctaa 1620
cttttctgac atccatgcag gggaactgta ttttgtggat tctgacccat tgcaggatca 1680
caatatgtat aatgattccc aaggtggaga tcttttccag ttgttgatgc cttga 1735
<210> 26
<211> 1653
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 26
atgcccccac ccaggaccgg aagaggcctg ctgtggctgg gcctggtgct ctcttccgtg 60
tgcgtggccc tgggaagcga aacccaggcc aacagcacaa ccgacgccct gaatgtgctg 120
ctgatcattg tggacgatct gagaccctcc ctgggctgtt acggcgacaa actggtgcgg 180
tccccaaaca tcgaccagct ggcctcccac tccctgctgt tccagaacgc cttcgcccag 240
caggccgtgt gtgcccccag cagggtgagc ttcctgaccg gcagaagacc tgacaccacc 300
aggctgtacg actttaacag ctactggcgg gtgcacgccg gcaatttcag caccattcct 360
cagtacttca aggagaatgg ctacgtgaca atgtccgtgg gcaaggtgtt tcatcccggc 420
attagctcca accacaccga cgatagccca tactcctggt ccttcccccc ctaccatccc 480
tccagcgaga agtacgagaa caccaaaacc tgcagaggcc ctgacggaga gctgcacgcc 540
aacctgctgt gccctgtgga tgtcctggat gtgcccgaag gcaccctgcc agacaagcag 600
tccacagagc aggccatcca gctgctggag aagatgaaga caagcgccag ccccttcttt 660
ctggccgtgg gataccacaa gcctcacatt ccattccggt acccaaaaga gttccagaag 720
ctgtaccctc tggaaaacat caccctggcc cctgaccccg aggtgccaga cgggctgcct 780
cctgtggcct acaatccctg gatggacatc agacagcggg aggatgtgca ggccctgaat 840
atttccgtgc cctatgggcc catccctgtg gactttcagc ggaaaatcag acagtcttac 900
tttgccagcg tgtcctacct ggacacccag gtgggccgcc tgctctcagc cctggacgac 960
ctgcagctgg ccaattccac catcatcgcc ttcaccagcg atcacggctg ggccctgggc 1020
gagcacgggg agtgggccaa atacagcaac ttcgatgtgg ccacccacgt gcctctgatt 1080
ttttatgtgc ccggccggac agccagcctg cccgaggccg gggagaagct ctttccttac 1140
ctggaccctt tcgactctgc cagccagctg atggaacctg gcagacagag catggacctg 1200
gtggagctgg tgagcctctt ccccactctg gccggcctgg ctggcctgca ggtgccacca 1260
agatgcccag tgccttcttt ccacgtggag ctgtgtagag agggaaagaa cctgctgaag 1320
cacttcagat ttagagatct ggaggaggat ccctacctgc caggcaaccc aagggagctg 1380
atcgcctaca gccagtatcc cagaccctct gatatccccc agtggaacag cgataagccc 1440
tccctgaaag acatcaagat tatgggctac tccatcagga ccattgacta ccggtacaca 1500
gtgtgggtgg gcttcaaccc cgatgagttt ctggccaact tcagcgacat ccacgccggc 1560
gagctgtatt ttgtggactc cgaccccctg caggaccaca acatgtacaa cgactcccag 1620
ggcggcgacc tgttccagct gctgatgccc tga 1653
<210> 27
<211> 1735
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 27
atgcccccac ccaggaccgg aagaggcctg ctgtggctgg gcctggtgct ctcttccgtg 60
tgcgtggccc tgggaagcga aacccaggcc aacagcacaa ccgacgccct gaatgtgctg 120
ctgatcattg tggacgatct gagaccctcc ctgggctgtt acggcgacaa actggtgcgg 180
tccccaaaca tcgaccagct ggcctcccac tccctgctgt tccagaacgc cttcgcccag 240
caggccgtgt gtgcccccag cagggtgagc ttcctgaccg gcagaagacc tgacaccacc 300
aggctgtacg actttaacag ctactggcgg gtgcacgccg gcaatttcag caccattcct 360
cagtacttca aggagaatgg ctacgtgaca atgtccgtgg gcaaggtgtt tcatcccggc 420
attagctcca accacaccga cgatagccca tactcctggt ccttcccccc ctaccatccc 480
tccagcgaga agtacgagaa caccaaaacc tgcagaggcc ctgacggaga gctgcacgcc 540
aacctgctgt gccctgtgga tgtcctggat gtgcccgaag gtaagggttt aagggatggt 600
tggttggtgg ggtattaatg tttaattacc tggagcacct gcctgaaatc actttttttc 660
aggcaccctg ccagacaagc agtccacaga gcaggccatc cagctgctgg agaagatgaa 720
gacaagcgcc agccccttct ttctggccgt gggataccac aagcctcaca ttccattccg 780
gtacccaaaa gagttccaga agctgtaccc tctggaaaac atcaccctgg cccctgaccc 840
cgaggtgcca gacgggctgc ctcctgtggc ctacaatccc tggatggaca tcagacagcg 900
ggaggatgtg caggccctga atatttccgt gccctatggg cccatccctg tggactttca 960
gcggaaaatc agacagtctt actttgccag cgtgtcctac ctggacaccc aggtgggccg 1020
cctgctctca gccctggacg acctgcagct ggccaattcc accatcatcg ccttcaccag 1080
cgatcacggc tgggccctgg gcgagcacgg ggagtgggcc aaatacagca acttcgatgt 1140
ggccacccac gtgcctctga ttttttatgt gcccggccgg acagccagcc tgcccgaggc 1200
cggggagaag ctctttcctt acctggaccc tttcgactct gccagccagc tgatggaacc 1260
tggcagacag agcatggacc tggtggagct ggtgagcctc ttccccactc tggccggcct 1320
ggctggcctg caggtgccac caagatgccc agtgccttct ttccacgtgg agctgtgtag 1380
agagggaaag aacctgctga agcacttcag atttagagat ctggaggagg atccctacct 1440
gccaggcaac ccaagggagc tgatcgccta cagccagtat cccagaccct ctgatatccc 1500
ccagtggaac agcgataagc cctccctgaa agacatcaag attatgggct actccatcag 1560
gaccattgac taccggtaca cagtgtgggt gggcttcaac cccgatgagt ttctggccaa 1620
cttcagcgac atccacgccg gcgagctgta ttttgtggac tccgaccccc tgcaggacca 1680
caacatgtac aacgactccc agggcggcga cctgttccag ctgctgatgc cctga 1735
<210> 28
<211> 182
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 28
gtagataagt agcatggcgg gttaatcatt aactacaagg aacccctagt gatggagttg 60
gccactccct ctctgcgcgc tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga 120
cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc 180
aa 182
<210> 29
<211> 173
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 29
actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 60
aaaatcaacg ggactttcca aaatgtcgta ataaccccgc cccgttgacg caaatgggcg 120
gtaggcgtgt acggtgggag gtctatataa gcagagctcg tttagtgaac cgt 173
<210> 30
<211> 201
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 30
gaattcgggc ggagttaggg cggagccaat cagcgtgcgc cgttccgaaa gttgcctttt 60
atggctgggc ggagaatggg cggtgaacgc cgatgattat ataaggacgc gccgggtgtg 120
gcacagctag ttccgtcgca gccgggattt gggtcgcggt tcttgtttgt ggatccctgt 180
gatcgtgatc atcacttgtg a 201
<210> 31
<211> 93
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 31
ctctaaggta aatataaaat ttttaagtgt ataatgtgtt aaactactga ttctaattgt 60
ttctctcttt tagattccaa cctttggaac tga 93
<210> 32
<211> 924
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 32
gtgagcgggc gggacggccc ttctcctccg ggctgtaatt agcgcttggt ttaatgacgg 60
cttgtttctt ttctgtggct gcgtgaaagc cttgaggggc tccgggaggg ccctttgtgc 120
ggggggagcg gctcgggggg tgcgtgcgtg tgtgtgtgcg tggggagcgc cgcgtgcggc 180
tccgcgctgc ccggcggctg tgagcgctgc gggcgcggcg cggggctttg tgcgctccgc 240
agtgtgcgcg aggggagcgc ggccgggggc ggtgccccgc ggtgcggggg gggctgcgag 300
gggaacaaag gctgcgtgcg gggtgtgtgc gtgggggggt gagcaggggg tgtgggcgcg 360
tcggtcgggc tgcaaccccc cctgcacccc cctccccgag ttgctgagca cggcccggct 420
tcgggtgcgg ggctccgtac ggggcgtggc gcggggctcg ccgtgccggg cggggggtgg 480
cggcaggtgg gggtgccggg cggggcgggg ccgcctcggg ccggggaggg ctcgggggag 540
gggcgcggcg gcccccggag cgccggcggc tgtcgaggcg cggcgagccg cagccattgc 600
cttttatggt aatcgtgcga gagggcgcag ggacttcctt tgtcccaaat ctgtgcggag 660
ccgaaatctg ggaggcgccg ccgcaccccc tctagcgggc gcggggcgaa gcggtgcggc 720
gccggcagga aggaaatggg cggggagggc cttcgtgcgt cgccgcgccg ccgtcccctt 780
ctccctctcc agcctcgggg ctgtccgcgg ggggacggct gccttcgggg gggacggggc 840
agggcggggt tcggcttctg gcgtgtgacc ggcggctcta gagcctctgc taaccatgtt 900
catgccttct tctttttcct acag 924
<210> 33
<211> 82
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 33
gtaagggttt aagggatggt tggttggtgg ggtattaatg tttaattacc tggagcacct 60
gcctgaaatc actttttttc ag 82
<210> 34
<211> 122
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 34
aacttgttta ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca 60
aataaagcat ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct 120
ta 122
<210> 35
<211> 133
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 35
tgctttattt gtgaaatttg tgatgctatt gctttatttg taaccattat aagctgcaat 60
aaacaagtta acaacaacaa ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg 120
gaggtttttt aaa 133
<210> 36
<211> 1676
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 36
ggcattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 60
catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120
acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180
ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg gcagtacatc 240
aagtgtatca tatgccaagt ccgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300
ggcattatgc ccagtacatg accttacggg actttcctac ttggcagtac atctacgtat 360
tagtcatcgc tattaccatg gtcgaggtga gccccacgtt ctgcttcact ctccccatct 420
cccccccctc cccaccccca attttgtatt tatttatttt ttaattattt tgtgcagcga 480
tgggggcggg gggggggggg gggcgcgcgc caggcggggc ggggcggggc gaggggcggg 540
gcggggcgag gcggagaggt gcggcggcag ccaatcagag cggcgcgctc cgaaagtttc 600
cttttatggc gaggcggcgg cggcggcggc cctataaaaa gcgaagcgcg cggcgggcgg 660
gagtcgctgc gcgctgcctt cgccccgtgc cccgctccgc cgccgcctcg cgccgcccgc 720
cccggctctg actgaccgcg ttactcccac aggtgagcgg gcgggacggc ccttctcctc 780
cgggctgtaa ttagcgcttg gtttaatgac ggcttgtttc ttttctgtgg ctgcgtgaaa 840
gccttgaggg gctccgggag ggccctttgt gcggggggag cggctcgggg ggtgcgtgcg 900
tgtgtgtgtg cgtggggagc gccgcgtgcg gctccgcgct gcccggcggc tgtgagcgct 960
gcgggcgcgg cgcggggctt tgtgcgctcc gcagtgtgcg cgaggggagc gcggccgggg 1020
gcggtgcccc gcggtgcggg gggggctgcg aggggaacaa aggctgcgtg cggggtgtgt 1080
gcgtgggggg gtgagcaggg ggtgtgggcg cgtcggtcgg gctgcaaccc cccctgcacc 1140
cccctccccg agttgctgag cacggcccgg cttcgggtgc ggggctccgt acggggcgtg 1200
gcgcggggct cgccgtgccg ggcggggggt ggcggcaggt gggggtgccg ggcggggcgg 1260
ggccgcctcg ggccggggag ggctcggggg aggggcgcgg cggcccccgg agcgccggcg 1320
gctgtcgagg cgcggcgagc cgcagccatt gccttttatg gtaatcgtgc gagagggcgc 1380
agggacttcc tttgtcccaa atctgtgcgg agccgaaatc tgggaggcgc cgccgcaccc 1440
cctctagcgg gcgcggggcg aagcggtgcg gcgccggcag gaaggaaatg ggcggggagg 1500
gccttcgtgc gtcgccgcgc cgccgtcccc ttctccctct ccagcctcgg ggctgtccgc 1560
ggggggacgg ctgccttcgg gggggacggg gcagggcggg gttcggcttc tggcgtgtga 1620
ccggcggctc tagagcctct gctaaccatg ttcatgcctt cttctttttc ctacag 1676
<210> 37
<211> 2112
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 37
actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 60
aaaatcaacg ggactttcca aaatgtcgta ataaccccgc cccgttgacg caaatgggcg 120
gtaggcgtgt acggtgggag gtctatataa gcagagctcg tttagtgaac cgtgccacca 180
tgccgccacc ccggaccggc cgaggccttc tctggctggg tctggttctg agctccgtct 240
gcgtcgccct cggatccgaa acgcaggcca actcgaccac agatgctctg aacgttcttc 300
tcatcatcgt ggatgacctg cgcccctccc tgggctgtta tggggataag ctggtgaggt 360
ccccaaatat tgaccaactg gcatcccaca gcctcctctt ccagaatgcc tttgcgcagc 420
aagcagtgtg cgccccgagc cgcgtttctt tcctcactgg caggagacct gacaccaccc 480
gcctgtacga cttcaactcc tactggaggg tgcacgctgg aaacttctcc accatccccc 540
agtacttcaa ggagaatggc tatgtgacca tgtcggtggg aaaagtcttt caccctggga 600
tatcttctaa ccataccgat gattctccgt atagctggtc ttttccacct tatcatcctt 660
cctctgagaa gtatgaaaac actaagacat gtcgagggcc agatggagaa ctccatgcca 720
acctgctttg ccctgtggat gtgctggatg ttcccgaggg caccttgcct gacaaacaga 780
gcactgagca agccatacag ttgttggaaa agatgaaaac gtcagccagt cctttcttcc 840
tggccgttgg gtatcataag ccacacatcc ccttcagata ccccaaggta agggtttaag 900
ggatggttgg ttggtggggt attaatgttt aattacctgg agcacctgcc tgaaatcact 960
ttttttcagg aatttcagaa gttgtatccc ttggagaaca tcaccctggc ccccgatccc 1020
gaggtccctg atggcctacc ccctgtggcc tacaacccct ggatggacat caggcaacgg 1080
gaagacgtcc aagccttaaa catcagtgtg ccgtatggtc caattcctgt ggactttcag 1140
cggaaaatcc gccagagcta ctttgcctct gtgtcatatt tggatacaca ggtcggccgc 1200
ctcttgagtg ctttggacga tcttcagctg gccaacagca ccatcattgc atttacctcg 1260
gatcatgggt gggctctagg tgaacatgga gaatgggcca aatacagcaa ttttgatgtt 1320
gctacccatg ttcccctgat attctatgtt cctggaagga cggcttcact tccggaggca 1380
ggcgagaagc ttttccctta cctcgaccct tttgattccg cctcacagtt gatggagcca 1440
ggcaggcaat ccatggacct tgtggaactt gtgtctcttt ttcccacgct ggctggactt 1500
gcaggactgc aggttccacc tcgctgcccc gttccttcat ttcacgttga gctgtgcaga 1560
gaaggcaaga accttctgaa gcattttcga ttccgtgact tggaagagga tccgtacctc 1620
cctggtaatc cccgtgaact gattgcctat agccagtatc cccggccttc agacatccct 1680
cagtggaatt ctgacaagcc gagtttaaaa gatataaaga tcatgggcta ttccatacgc 1740
accatagact ataggtatac tgtgtgggtt ggcttcaatc ctgatgaatt tctagctaac 1800
ttttctgaca tccatgcagg ggaactgtat tttgtggatt ctgacccatt gcaggatcac 1860
aatatgtata atgattccca aggtggagat cttttccagt tgttgatgcc ttgagatcca 1920
gacatgataa gatacattga tgagtttgga caaaccacaa ctagaatgca gtgaaaaaaa 1980
tgctttattt gtgaaatttg tgatgctatt gctttatttg taaccattat aagctgcaat 2040
aaacaagtta acaacaacaa ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg 2100
gaggtttttt aa 2112
<210> 38
<211> 2482
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 38
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggggag gggtggagtc 120
gtgacgtgaa ttacgtcata gggttaggga ggtcctgcat atgcggccgc aactcacggg 180
gatttccaag tctccacccc attgacgtca atgggagttt gttttggcac caaaatcaac 240
gggactttcc aaaatgtcgt aataaccccg ccccgttgac gcaaatgggc ggtaggcgtg 300
tacggtggga ggtctatata agcagagctc gtttagtgaa ccgtgccacc atgccgccac 360
cccggaccgg ccgaggcctt ctctggctgg gtctggttct gagctccgtc tgcgtcgccc 420
tcggatccga aacgcaggcc aactcgacca cagatgctct gaacgttctt ctcatcatcg 480
tggatgacct gcgcccctcc ctgggctgtt atggggataa gctggtgagg tccccaaata 540
ttgaccaact ggcatcccac agcctcctct tccagaatgc ctttgcgcag caagcagtgt 600
gcgccccgag ccgcgtttct ttcctcactg gcaggagacc tgacaccacc cgcctgtacg 660
acttcaactc ctactggagg gtgcacgctg gaaacttctc caccatcccc cagtacttca 720
aggagaatgg ctatgtgacc atgtcggtgg gaaaagtctt tcaccctggg atatcttcta 780
accataccga tgattctccg tatagctggt cttttccacc ttatcatcct tcctctgaga 840
agtatgaaaa cactaagaca tgtcgagggc cagatggaga actccatgcc aacctgcttt 900
gccctgtgga tgtgctggat gttcccgagg gcaccttgcc tgacaaacag agcactgagc 960
aagccataca gttgttggaa aagatgaaaa cgtcagccag tcctttcttc ctggccgttg 1020
ggtatcataa gccacacatc cccttcagat accccaaggt aagggtttaa gggatggttg 1080
gttggtgggg tattaatgtt taattacctg gagcacctgc ctgaaatcac tttttttcag 1140
gaatttcaga agttgtatcc cttggagaac atcaccctgg cccccgatcc cgaggtccct 1200
gatggcctac cccctgtggc ctacaacccc tggatggaca tcaggcaacg ggaagacgtc 1260
caagccttaa acatcagtgt gccgtatggt ccaattcctg tggactttca gcggaaaatc 1320
cgccagagct actttgcctc tgtgtcatat ttggatacac aggtcggccg cctcttgagt 1380
gctttggacg atcttcagct ggccaacagc accatcattg catttacctc ggatcatggg 1440
tgggctctag gtgaacatgg agaatgggcc aaatacagca attttgatgt tgctacccat 1500
gttcccctga tattctatgt tcctggaagg acggcttcac ttccggaggc aggcgagaag 1560
cttttccctt acctcgaccc ttttgattcc gcctcacagt tgatggagcc aggcaggcaa 1620
tccatggacc ttgtggaact tgtgtctctt tttcccacgc tggctggact tgcaggactg 1680
caggttccac ctcgctgccc cgttccttca tttcacgttg agctgtgcag agaaggcaag 1740
aaccttctga agcattttcg attccgtgac ttggaagagg atccgtacct ccctggtaat 1800
ccccgtgaac tgattgccta tagccagtat ccccggcctt cagacatccc tcagtggaat 1860
tctgacaagc cgagtttaaa agatataaag atcatgggct attccatacg caccatagac 1920
tataggtata ctgtgtgggt tggcttcaat cctgatgaat ttctagctaa cttttctgac 1980
atccatgcag gggaactgta ttttgtggat tctgacccat tgcaggatca caatatgtat 2040
aatgattccc aaggtggaga tcttttccag ttgttgatgc cttgagatcc agacatgata 2100
agatacattg atgagtttgg acaaaccaca actagaatgc agtgaaaaaa atgctttatt 2160
tgtgaaattt gtgatgctat tgctttattt gtaaccatta taagctgcaa taaacaagtt 2220
aacaacaaca attgcattca ttttatgttt caggttcagg gggaggtgtg ggaggttttt 2280
taacctgcag gtctagatac gtagataagt agcatggcgg gttaatcatt aactacaagg 2340
aacccctagt gatggagttg gccactccct ctctgcgcgc tcgctcgctc actgaggccg 2400
ggcgaccaaa ggtcgcccga cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag 2460
cgcgcagaga gggagtggcc aa 2482
<210> 39
<211> 1168
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 39
cgtgaggctc cggtgcccgt cagtgggcag agcgcacatc gcccacagtc cccgagaagt 60
tggggggagg ggtcggcaat tgaaccggtg cctagagaag gtggcgcggg gtaaactggg 120
aaagtgatgt cgtgtactgg ctccgccttt ttcccgaggg tgggggagaa ccgtatataa 180
gtgcagtagt cgccgtgaac gttctttttc gcaacgggtt tgccgccaga acacaggtaa 240
gtgccgtgtg tggttcccgc gggcctggcc tctttacggg ttatggccct tgcgtgcctt 300
gaattacttc cacctggctc cagtacgtga ttcttgatcc cgagctggag ccaggggcgg 360
gccttgcgct ttaggagccc cttcgcctcg tgcttgagtt gaggcctggc ctgggcgctg 420
gggccgccgc gtgcgaatct ggtggcacct tcgcgcctgt ctcgctgctt tcgataagtc 480
tctagccatt taaaattttt gatgacctgc tgcgacgctt tttttctggc aagatagtct 540
tgtaaatgcg ggccaggatc tgcacactgg tatttcggtt tttggggccg cgggcggcga 600
cggggcccgt gcgtcccagc gcacatgttc ggcgaggcgg ggcctgcgag cgcggccacc 660
gagaatcgga cgggggtagt ctcaagctgg ccggcctgct ctggtgcctg gcctcgcgcc 720
gccgtgtatc gccccgccct gggcggcaag gctggcccgg tcggcaccag ttgcgtgagc 780
ggaaagatgg ccgcttcccg gccctgctcc agggggctca aaatggagga cgcggcgctc 840
gggagagcgg gcgggtgagt cacccacaca aaggaaaggg gcctttccgt cctcagccgt 900
cgcttcatgt gactccacgg agtaccgggc gccgtccagg cacctcgatt agttctggag 960
cttttggagt acgtcgtctt taggttgggg ggaggggttt tatgcgatgg agtttcccca 1020
cactgagtgg gtggagactg aagttaggcc agcttggcac ttgatgtaat tctccttgga 1080
atttgccctt tttgagtttg gatcttggtt cattctcaag cctcagacag tggttcaaag 1140
tttttttctt ccatttcagg tgtcgtga 1168
<210> 40
<211> 100
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 40
ccaaaatcaa cgggactttc caaaatgtcg taataacccc gccccgttga cgcaaatggg 60
cggtaggcgt gtacggtggg aggtctatat aagcagagct 100
<210> 41
<211> 95
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 41
cctctgctaa ccatgttcat gccttcttct ttttcctaca gctcctgggc aacgtgctgg 60
ttattgtgct gtctcatcat tttggcaaag aattc 95
<210> 42
<211> 1873
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 42
gatcttcaat attggccatt agccatatta ttcattggtt atatagcata aatcaatatt 60
ggctattggc cattgcatac gttgtatcta tatcataata tgtacattta tattggctca 120
tgtccaatat gaccgccatg ttggcattga ttattgacta gttattaata gtaatcaatt 180
acggggtcat tagttcatag cccatatatg gagttccgcg ttacataact tacggtaaat 240
ggcccgcctg gctgaccgcc caacgacccc cgcccattga cgtcaataat gacgtatgtt 300
cccatagtaa cgccaatagg gactttccat tgacgtcaat gggtggagta tttacggtaa 360
actgcccact tggcagtaca tcaagtgtat catatgccaa gtccgccccc tattgacgtc 420
aatgacggta aatggcccgc ctggcattat gcccagtaca tgaccttacg ggactttcct 480
acttggcagt acatctacgt attagtcatc gctattacca tggtcgaggt gagccccacg 540
ttctgcttca ctctccccat ctcccccccc tccccacccc caattttgta tttatttatt 600
ttttaattat tttgtgcagc gatgggggcg gggggggggg gggggcgcgc gccaggcggg 660
gcggggcggg gcgaggggcg gggcggggcg aggcggagag gtgcggcggc agccaatcag 720
agcggcgcgc tccgaaagtt tccttttatg gcgaggcggc ggcggcggcg gccctataaa 780
aagcgaagcg cgcggcgggc gggagtcgct gcgacgctgc cttcgccccg tgccccgctc 840
cgccgccgcc tcgcgccgcc cgccccggct ctgactgacc gcgttactcc cacaggtgag 900
cgggcgggac ggcccttctc ctccgggctg taattagcgc ttggtttaat gacggcttgt 960
ttcttttctg tggctgcgtg aaagccttga ggggctccgg gagggccctt tgtgcggggg 1020
ggagcggctc ggggggtgcg tgcgtgtgtg tgtgcgtggg gagcgccgcg tgcggcccgc 1080
gctgcccggc ggctgtgagc gctgcgggcg cggcgcgggg ctttgtgcgc tccgcagtgt 1140
gcgcgagggg agcgcggccg ggggcggtgc cccgcggtgc ggggggggct gcgaggggaa 1200
caaaggctgc gtgcggggtg tgtgcgtggg ggggtgagca gggggtgtgg gcgcggcggt 1260
cgggctgtaa cccccccctg cacccccctc cccgagttgc tgagcacggc ccggcttcgg 1320
gtgcggggct ccgtacgggg cgtggcgcgg ggctcgccgt gccgggcggg gggtggcggc 1380
aggtgggggt gccgggcggg gcggggccgc ctcgggccgg ggagggctcg ggggaggggc 1440
gcggcggccc ccggagcgcc ggcggctgtc gaggcgcggc gagccgcagc cattgccttt 1500
tatggtaatc gtgcgagagg gcgcagggac ttcctttgtc ccaaatctgt gcggagccga 1560
aatctgggag gcgccgccgc accccctcta gcgggcgcgg ggcgaagcgg tgcggcgccg 1620
gcaggaagga aatgggcggg gagggccttc gtgcgtcgcc gcgccgccgt ccccttctcc 1680
ctctccagcc tcggggctgt ccgcgggggg acggctgcct tcggggggga cggggcaggg 1740
cggggttcgg cttctggcgt gtgaccggcg gctctagagc ctctgctaac catgttcatg 1800
ccttcttctt tttcctacag ctcctgggca acgtgctggt tattgtgctg tctcatcatt 1860
ttggcaaaga att 1873
<210> 43
<211> 2113
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 43
aactcacggg gatttccaag tctccacccc attgacgtca atgggagttt gttttggcac 60
caaaatcaac gggactttcc aaaatgtcgt aataaccccg ccccgttgac gcaaatgggc 120
ggtaggcgtg tacggtggga ggtctatata agcagagctc gtttagtgaa ccgtgccacc 180
atgcccccac ccaggaccgg aagaggcctg ctgtggctgg gcctggtgct ctcttccgtg 240
tgcgtggccc tgggaagcga aacccaggcc aacagcacaa ccgacgccct gaatgtgctg 300
ctgatcattg tggacgatct gagaccctcc ctgggctgtt acggcgacaa actggtgcgg 360
tccccaaaca tcgaccagct ggcctcccac tccctgctgt tccagaacgc cttcgcccag 420
caggccgtgt gtgcccccag cagggtgagc ttcctgaccg gcagaagacc tgacaccacc 480
aggctgtacg actttaacag ctactggcgg gtgcacgccg gcaatttcag caccattcct 540
cagtacttca aggagaatgg ctacgtgaca atgtccgtgg gcaaggtgtt tcatcccggc 600
attagctcca accacaccga cgatagccca tactcctggt ccttcccccc ctaccatccc 660
tccagcgaga agtacgagaa caccaaaacc tgcagaggcc ctgacggaga gctgcacgcc 720
aacctgctgt gccctgtgga tgtcctggat gtgcccgaag gtaagggttt aagggatggt 780
tggttggtgg ggtattaatg tttaattacc tggagcacct gcctgaaatc actttttttc 840
aggcaccctg ccagacaagc agtccacaga gcaggccatc cagctgctgg agaagatgaa 900
gacaagcgcc agccccttct ttctggccgt gggataccac aagcctcaca ttccattccg 960
gtacccaaaa gagttccaga agctgtaccc tctggaaaac atcaccctgg cccctgaccc 1020
cgaggtgcca gacgggctgc ctcctgtggc ctacaatccc tggatggaca tcagacagcg 1080
ggaggatgtg caggccctga atatttccgt gccctatggg cccatccctg tggactttca 1140
gcggaaaatc agacagtctt actttgccag cgtgtcctac ctggacaccc aggtgggccg 1200
cctgctctca gccctggacg acctgcagct ggccaattcc accatcatcg ccttcaccag 1260
cgatcacggc tgggccctgg gcgagcacgg ggagtgggcc aaatacagca acttcgatgt 1320
ggccacccac gtgcctctga ttttttatgt gcccggccgg acagccagcc tgcccgaggc 1380
cggggagaag ctctttcctt acctggaccc tttcgactct gccagccagc tgatggaacc 1440
tggcagacag agcatggacc tggtggagct ggtgagcctc ttccccactc tggccggcct 1500
ggctggcctg caggtgccac caagatgccc agtgccttct ttccacgtgg agctgtgtag 1560
agagggaaag aacctgctga agcacttcag atttagagat ctggaggagg atccctacct 1620
gccaggcaac ccaagggagc tgatcgccta cagccagtat cccagaccct ctgatatccc 1680
ccagtggaac agcgataagc cctccctgaa agacatcaag attatgggct actccatcag 1740
gaccattgac taccggtaca cagtgtgggt gggcttcaac cccgatgagt ttctggccaa 1800
cttcagcgac atccacgccg gcgagctgta ttttgtggac tccgaccccc tgcaggacca 1860
caacatgtac aacgactccc agggcggcga cctgttccag ctgctgatgc cctgagatcc 1920
agacatgata agatacattg atgagtttgg acaaaccaca actagaatgc agtgaaaaaa 1980
atgctttatt tgtgaaattt gtgatgctat tgctttattt gtaaccatta taagctgcaa 2040
taaacaagtt aacaacaaca attgcattca ttttatgttt caggttcagg gggaggtgtg 2100
ggaggttttt taa 2113
<210> 44
<211> 913
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 44
ggcatcctaa aaaatattca gtggaaacgt aaaaacatta aagactgatt aaacatcgca 60
gcatgacaca gatttagcaa ctgagcataa ataatttgac tcggatactg ctccaaaatc 120
cgaagaggac caatttcttc caggaggaca actacctcgt cctctgcaga cccctctcct 180
cggcagctga aggagtgtgg ccaatctgcc tccacctccc cgcggacccc ctactctcag 240
gacctcctgc agcaccccaa actggaagtg gccgctgcag acccaaggac gaggggcacg 300
cgggagccgg cagccctagt ggagcggttg gagatgttga ggtgggaggg tcacccaggt 360
ggggtgaggc tggggtaggt agcggagtga acggcttccg aagctctggg ccgcccccag 420
gttggactaa gcaggcgctc tgtcttcgcc cccgcccagg gtgggcgtct cctgaggact 480
ccccgccaca cctgacccga gaccgcgcgc ccagcctaga acgcttcccc gacccagcgt 540
agggccgccg cgactggcgg gcgagggtcg gcgggaggcc tggcgaaccc gggggcggga 600
ccaggcgggc aaggcccggc tgccgcagcg ccgctctgcg cgaggcggct ccgccgcggc 660
ggagggatac ggcgcaccat atatatatcg cggggcgcag actcgcgctc cggcagtggt 720
gctgggagtg tcgtggacgc cgtgccgtta ctcgtagtca ggcggcggcg caggcggcgg 780
cggcggcata gcgcacagcg cgccttagca gcagcagcag cagcagcggc atcggaggta 840
cccccgccgt cgcagccccc gcgctggtgc agccaccctc gctccctctg ctcttcctcc 900
cttcgctcgc acc 913
<210> 45
<211> 198
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 45
gatccagaca tgataagata cattgatgag tttggacaaa ccacaactag aatgcagtga 60
aaaaaatgct ttatttgtga aatttgtgat gctattgctt tatttgtaac cattataagc 120
tgcaataaac aagttaacaa caacaattgc attcatttta tgtttcaggt tcagggggag 180
gtgtgggagg ttttttaa 198
<210> 46
<211> 380
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 46
ggcattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 60
catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120
acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180
ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg gcagtacatc 240
aagtgtatca tatgccaagt ccgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300
ggcattatgc ccagtacatg accttacggg actttcctac ttggcagtac atctacgtat 360
tagtcatcgc tattaccatg 380
<210> 47
<211> 1246
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 47
tcgaggtgag ccccacgttc tgcttcactc tccccatctc ccccccctcc ccacccccaa 60
ttttgtattt atttattttt taattatttt gtgcagcgat gggggcgggg gggggggggg 120
ggcgcgcgcc aggcggggcg gggcggggcg aggggcgggg cggggcgagg cggagaggtg 180
cggcggcagc caatcagagc ggcgcgctcc gaaagtttcc ttttatggcg aggcggcggc 240
ggcggcggcc ctataaaaag cgaagcgcgc ggcgggcggg agtcgctgcg cgctgccttc 300
gccccgtgcc ccgctccgcc gccgcctcgc gccgcccgcc ccggctctga ctgaccgcgt 360
tactcccaca ggtgagcggg cgggacggcc cttctcctcc gggctgtaat tagcgcttgg 420
tttaatgacg gcttgtttct tttctgtggc tgcgtgaaag ccttgagggg ctccgggagg 480
gccctttgtg cggggggagc ggctcggggg gtgcgtgcgt gtgtgtgtgc gtggggagcg 540
ccgcgtgcgg ctccgcgctg cccggcggct gtgagcgctg cgggcgcggc gcggggcttt 600
gtgcgctccg cagtgtgcgc gaggggagcg cggccggggg cggtgccccg cggtgcgggg 660
ggggctgcga ggggaacaaa ggctgcgtgc ggggtgtgtg cgtggggggg tgagcagggg 720
gtgtgggcgc gtcggtcggg ctgcaacccc ccctgcaccc ccctccccga gttgctgagc 780
acggcccggc ttcgggtgcg gggctccgta cggggcgtgg cgcggggctc gccgtgccgg 840
gcggggggtg gcggcaggtg ggggtgccgg gcggggcggg gccgcctcgg gccggggagg 900
gctcggggga ggggcgcggc ggcccccgga gcgccggcgg ctgtcgaggc gcggcgagcc 960
gcagccattg ccttttatgg taatcgtgcg agagggcgca gggacttcct ttgtcccaaa 1020
tctgtgcgga gccgaaatct gggaggcgcc gccgcacccc ctctagcggg cgcggggcga 1080
agcggtgcgg cgccggcagg aaggaaatgg gcggggaggg ccttcgtgcg tcgccgcgcc 1140
gccgtcccct tctccctctc cagcctcggg gctgtccgcg gggggacggc tgccttcggg 1200
ggggacgggg cagggcgggg ttcggcttct ggcgtgtgac cggcgg 1246
<210> 48
<211> 1061
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 48
tagggaggtc ctgcacgtta cataacttac ggtaaatggc ccgcctggct gaccgcccaa 60
cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc caatagggac 120
tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg cagtacatca 180
agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat ggcccgcctg 240
gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca tctacgtatt 300
agtcatcgct attaccatgg tcgaggtgag ccccacgttc tgcttcactc tccccatctc 360
ccccccctcc ccacccccaa ttttgtattt atttattttt taattatttt gtgcagcgat 420
gggggcgggg gggggggggg gcgcgcgcca ggcggggcgg ggcggggcga ggggcggggc 480
ggggcgaggc ggagaggtgc ggcggcagcc aatcagagcg gcgcgctccg aaagtttcct 540
tttatggcga ggcggcggcg gcggcggccc tataaaaagc gaagcgcgcg gcgggcggga 600
gtcgctgcgc gctgccttcg ccccgtgccc cgctccgccg ccgcctcgcg ccgcccgccc 660
cggctctgac tgaccgcgtt actaaaacag gtaagtccgg cctccgcgcc gggttttggc 720
gcctcccgcg ggcgcccccc tcctcacggc gagcgctgcc acgtcagacg aagggcgcag 780
cgagcgtcct gatccttccg cccggacgct caggacagcg gcccgctgct cataagactc 840
ggccttagaa ccccagtatc agcagaagga cattttagga cgggacttgg gtgactctag 900
ggcactggtt ttctttccag agagcggaac aggcgaggaa aagtagtccc ttctcggcga 960
ttctgcggag ggatctccgt ggggcggtga acgccgatga tgcctctact aaccatgttc 1020
atgttttctt tttttttcta caggtcctgg gtgacgaaca g 1061
<210> 49
<211> 106
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 49
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtgg 106
<210> 50
<211> 2482
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 50
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggggag gggtggagtc 120
gtgacgtgaa ttacgtcata gggttaggga ggtcctgcat atgcggccgc aactcacggg 180
gatttccaag tctccacccc attgacgtca atgggagttt gttttggcac caaaatcaac 240
gggactttcc aaaatgtcgt aataaccccg ccccgttgac gcaaatgggc ggtaggcgtg 300
tacggtggga ggtctatata agcagagctc gtttagtgaa ccgtgccacc atgcccccac 360
ccaggaccgg aagaggcctg ctgtggctgg gcctggtgct ctcttccgtg tgcgtggccc 420
tgggaagcga aacccaggcc aacagcacaa ccgacgccct gaatgtgctg ctgatcattg 480
tggacgatct gagaccctcc ctgggctgtt acggcgacaa actggtgcgg tccccaaaca 540
tcgaccagct ggcctcccac tccctgctgt tccagaacgc cttcgcccag caggccgtgt 600
gtgcccccag cagggtgagc ttcctgaccg gcagaagacc tgacaccacc aggctgtacg 660
actttaacag ctactggcgg gtgcacgccg gcaatttcag caccattcct cagtacttca 720
aggagaatgg ctacgtgaca atgtccgtgg gcaaggtgtt tcatcccggc attagctcca 780
accacaccga cgatagccca tactcctggt ccttcccccc ctaccatccc tccagcgaga 840
agtacgagaa caccaaaacc tgcagaggcc ctgacggaga gctgcacgcc aacctgctgt 900
gccctgtgga tgtcctggat gtgcccgaag gtaagggttt aagggatggt tggttggtgg 960
ggtattaatg tttaattacc tggagcacct gcctgaaatc actttttttc aggcaccctg 1020
ccagacaagc agtccacaga gcaggccatc cagctgctgg agaagatgaa gacaagcgcc 1080
agccccttct ttctggccgt gggataccac aagcctcaca ttccattccg gtacccaaaa 1140
gagttccaga agctgtaccc tctggaaaac atcaccctgg cccctgaccc cgaggtgcca 1200
gacgggctgc ctcctgtggc ctacaatccc tggatggaca tcagacagcg ggaggatgtg 1260
caggccctga atatttccgt gccctatggg cccatccctg tggactttca gcggaaaatc 1320
agacagtctt actttgccag cgtgtcctac ctggacaccc aggtgggccg cctgctctca 1380
gccctggacg acctgcagct ggccaattcc accatcatcg ccttcaccag cgatcacggc 1440
tgggccctgg gcgagcacgg ggagtgggcc aaatacagca acttcgatgt ggccacccac 1500
gtgcctctga ttttttatgt gcccggccgg acagccagcc tgcccgaggc cggggagaag 1560
ctctttcctt acctggaccc tttcgactct gccagccagc tgatggaacc tggcagacag 1620
agcatggacc tggtggagct ggtgagcctc ttccccactc tggccggcct ggctggcctg 1680
caggtgccac caagatgccc agtgccttct ttccacgtgg agctgtgtag agagggaaag 1740
aacctgctga agcacttcag atttagagat ctggaggagg atccctacct gccaggcaac 1800
ccaagggagc tgatcgccta cagccagtat cccagaccct ctgatatccc ccagtggaac 1860
agcgataagc cctccctgaa agacatcaag attatgggct actccatcag gaccattgac 1920
taccggtaca cagtgtgggt gggcttcaac cccgatgagt ttctggccaa cttcagcgac 1980
atccacgccg gcgagctgta ttttgtggac tccgaccccc tgcaggacca caacatgtac 2040
aacgactccc agggcggcga cctgttccag ctgctgatgc cctgagatcc agacatgata 2100
agatacattg atgagtttgg acaaaccaca actagaatgc agtgaaaaaa atgctttatt 2160
tgtgaaattt gtgatgctat tgctttattt gtaaccatta taagctgcaa taaacaagtt 2220
aacaacaaca attgcattca ttttatgttt caggttcagg gggaggtgtg ggaggttttt 2280
taacctgcag gtctagatac gtagataagt agcatggcgg gttaatcatt aactacaagg 2340
aacccctagt gatggagttg gccactccct ctctgcgcgc tcgctcgctc actgaggccg 2400
ggcgaccaaa ggtcgcccga cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag 2460
cgcgcagaga gggagtggcc aa 2482
<210> 51
<211> 143
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 51
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120
gagcgcgcag agagggagtg gcc 143
<210> 52
<211> 2112
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 52
actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 60
aaaatcaacg ggactttcca aaatgtcgta ataaccccgc cccgttgacg caaatgggcg 120
gtaggcgtgt acggtgggag gtctatataa gcagagctcg tttagtgaac cgtgccacca 180
tgccgccacc ccggaccggc cgaggccttc tctggctggg tctggttctg agctccgtct 240
gcgtcgccct cggatccgaa acgcaggcca actcgaccac agatgctctg aacgttcttc 300
tcatcatcgt ggatgacctg cgcccctccc tgggctgtta tggggataag ctggtgaggt 360
ccccaaatat tgaccaactg gcatcccaca gcctcctctt ccagaatgcc tttgcgcagc 420
aagcagtgtg cgccccgagc cgcgtttctt tcctcactgg caggagacct gacaccaccc 480
gcctgtacga cttcaactcc tactggaggg tgcacgctgg aaacttctcc accatccccc 540
agtacttcaa ggagaatggc tatgtgacca tgtcggtggg aaaagtcttt caccctggga 600
tatcttctaa ccataccgat gattctccgt atagctggtc ttttccacct tatcatcctt 660
cctctgagaa gtatgaaaac actaagacat gtcgagggcc agatggagaa ctccatgcca 720
acctgctttg ccctgtggat gtgctggatg ttcccgaggg caccttgcct gacaaacaga 780
gcactgagca agccatacag ttgttggaaa agatgaaaac gtcagccagt cctttcttcc 840
tggccgttgg gtatcataag ccacacatcc ccttcagata ccccaaggta agggtttaag 900
ggatggttgg ttggtggggt attaatgttt aattacctgg agcacctgcc tgaaatcact 960
ttttttcagg aatttcagaa gttgtatccc ttggagaaca tcaccctggc ccccgatccc 1020
gaggtccctg atggcctacc ccctgtggcc tacaacccct ggatggacat caggcaacgg 1080
gaagacgtcc aagccttaaa catcagtgtg ccgtatggtc caattcctgt ggactttcag 1140
cggaaaatcc gccagagcta ctttgcctct gtgtcatatt tggatacaca ggtcggccgc 1200
ctcttgagtg ctttggacga tcttcagctg gccaacagca ccatcattgc atttacctcg 1260
gatcatgggt gggctctagg tgaacatgga gaatgggcca aatacagcaa ttttgatgtt 1320
gctacccatg ttcccctgat attctatgtt cctggaagga cggcttcact tccggaggca 1380
ggcgagaagc ttttccctta cctcgaccct tttgattccg cctcacagtt gatggagcca 1440
ggcaggcaat ccatggacct tgtggaactt gtgtctcttt ttcccacgct ggctggactt 1500
gcaggactgc aggttccacc tcgctgcccc gttccttcat ttcacgttga gctgtgcaga 1560
gaaggcaaga accttctgaa gcattttcga ttccgtgact tggaagagga tccgtacctc 1620
cctggtaatc cccgtgaact gattgcctat agccagtatc cccggccttc agacatccct 1680
cagtggaatt ctgacaagcc gagtttaaaa gatataaaga tcatgggcta ttccatacgc 1740
accatagact ataggtatac tgtgtgggtt ggcttcaatc ctgatgaatt tctagctaac 1800
ttttctgaca tccatgcagg ggaactgtat tttgtggatt ctgacccatt gcaggatcac 1860
aatatgtata atgattccca aggtggagat cttttccagt tgttgatgcc ttgagatcca 1920
gacatgataa gatacattga tgagtttgga caaaccacaa ctagaatgca gtgaaaaaaa 1980
tgctttattt gtgaaatttg tgatgctatt gctttatttg taaccattat aagctgcaat 2040
aaacaagtta acaacaacaa ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg 2100
gaggtttttt aa 2112
<210> 53
<211> 2521
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 53
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180
ggttagggag gtcctgcata tgcggccgca actcacgggg atttccaagt ctccacccca 240
ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg ggactttcca aaatgtcgta 300
ataaccccgc cccgttgacg caaatgggcg gtaggcgtgt acggtgggag gtctatataa 360
gcagagctcg tttagtgaac cgtgccacca tgccgccacc ccggaccggc cgaggccttc 420
tctggctggg tctggttctg agctccgtct gcgtcgccct cggatccgaa acgcaggcca 480
actcgaccac agatgctctg aacgttcttc tcatcatcgt ggatgacctg cgcccctccc 540
tgggctgtta tggggataag ctggtgaggt ccccaaatat tgaccaactg gcatcccaca 600
gcctcctctt ccagaatgcc tttgcgcagc aagcagtgtg cgccccgagc cgcgtttctt 660
tcctcactgg caggagacct gacaccaccc gcctgtacga cttcaactcc tactggaggg 720
tgcacgctgg aaacttctcc accatccccc agtacttcaa ggagaatggc tatgtgacca 780
tgtcggtggg aaaagtcttt caccctggga tatcttctaa ccataccgat gattctccgt 840
atagctggtc ttttccacct tatcatcctt cctctgagaa gtatgaaaac actaagacat 900
gtcgagggcc agatggagaa ctccatgcca acctgctttg ccctgtggat gtgctggatg 960
ttcccgaggg caccttgcct gacaaacaga gcactgagca agccatacag ttgttggaaa 1020
agatgaaaac gtcagccagt cctttcttcc tggccgttgg gtatcataag ccacacatcc 1080
ccttcagata ccccaaggta agggtttaag ggatggttgg ttggtggggt attaatgttt 1140
aattacctgg agcacctgcc tgaaatcact ttttttcagg aatttcagaa gttgtatccc 1200
ttggagaaca tcaccctggc ccccgatccc gaggtccctg atggcctacc ccctgtggcc 1260
tacaacccct ggatggacat caggcaacgg gaagacgtcc aagccttaaa catcagtgtg 1320
ccgtatggtc caattcctgt ggactttcag cggaaaatcc gccagagcta ctttgcctct 1380
gtgtcatatt tggatacaca ggtcggccgc ctcttgagtg ctttggacga tcttcagctg 1440
gccaacagca ccatcattgc atttacctcg gatcatgggt gggctctagg tgaacatgga 1500
gaatgggcca aatacagcaa ttttgatgtt gctacccatg ttcccctgat attctatgtt 1560
cctggaagga cggcttcact tccggaggca ggcgagaagc ttttccctta cctcgaccct 1620
tttgattccg cctcacagtt gatggagcca ggcaggcaat ccatggacct tgtggaactt 1680
gtgtctcttt ttcccacgct ggctggactt gcaggactgc aggttccacc tcgctgcccc 1740
gttccttcat ttcacgttga gctgtgcaga gaaggcaaga accttctgaa gcattttcga 1800
ttccgtgact tggaagagga tccgtacctc cctggtaatc cccgtgaact gattgcctat 1860
agccagtatc cccggccttc agacatccct cagtggaatt ctgacaagcc gagtttaaaa 1920
gatataaaga tcatgggcta ttccatacgc accatagact ataggtatac tgtgtgggtt 1980
ggcttcaatc ctgatgaatt tctagctaac ttttctgaca tccatgcagg ggaactgtat 2040
tttgtggatt ctgacccatt gcaggatcac aatatgtata atgattccca aggtggagat 2100
cttttccagt tgttgatgcc ttgagatcca gacatgataa gatacattga tgagtttgga 2160
caaaccacaa ctagaatgca gtgaaaaaaa tgctttattt gtgaaatttg tgatgctatt 2220
gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa ttgcattcat 2280
tttatgtttc aggttcaggg ggaggtgtgg gaggtttttt aacctgcagg tctagatacg 2340
tagataagta gcatggcggg ttaatcatta actacaagga acccctagtg atggagttgg 2400
ccactccctc tctgcgcgct cgctcgctca ctgaggccgg gcgaccaaag gtcgcccgac 2460
gcccgggctt tgcccgggcg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 2520
a 2521
<210> 54
<211> 2113
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 54
aactcacggg gatttccaag tctccacccc attgacgtca atgggagttt gttttggcac 60
caaaatcaac gggactttcc aaaatgtcgt aataaccccg ccccgttgac gcaaatgggc 120
ggtaggcgtg tacggtggga ggtctatata agcagagctc gtttagtgaa ccgtgccacc 180
atgcccccac ccaggaccgg aagaggcctg ctgtggctgg gcctggtgct ctcttccgtg 240
tgcgtggccc tgggaagcga aacccaggcc aacagcacaa ccgacgccct gaatgtgctg 300
ctgatcattg tggacgatct gagaccctcc ctgggctgtt acggcgacaa actggtgcgg 360
tccccaaaca tcgaccagct ggcctcccac tccctgctgt tccagaacgc cttcgcccag 420
caggccgtgt gtgcccccag cagggtgagc ttcctgaccg gcagaagacc tgacaccacc 480
aggctgtacg actttaacag ctactggcgg gtgcacgccg gcaatttcag caccattcct 540
cagtacttca aggagaatgg ctacgtgaca atgtccgtgg gcaaggtgtt tcatcccggc 600
attagctcca accacaccga cgatagccca tactcctggt ccttcccccc ctaccatccc 660
tccagcgaga agtacgagaa caccaaaacc tgcagaggcc ctgacggaga gctgcacgcc 720
aacctgctgt gccctgtgga tgtcctggat gtgcccgaag gtaagggttt aagggatggt 780
tggttggtgg ggtattaatg tttaattacc tggagcacct gcctgaaatc actttttttc 840
aggcaccctg ccagacaagc agtccacaga gcaggccatc cagctgctgg agaagatgaa 900
gacaagcgcc agccccttct ttctggccgt gggataccac aagcctcaca ttccattccg 960
gtacccaaaa gagttccaga agctgtaccc tctggaaaac atcaccctgg cccctgaccc 1020
cgaggtgcca gacgggctgc ctcctgtggc ctacaatccc tggatggaca tcagacagcg 1080
ggaggatgtg caggccctga atatttccgt gccctatggg cccatccctg tggactttca 1140
gcggaaaatc agacagtctt actttgccag cgtgtcctac ctggacaccc aggtgggccg 1200
cctgctctca gccctggacg acctgcagct ggccaattcc accatcatcg ccttcaccag 1260
cgatcacggc tgggccctgg gcgagcacgg ggagtgggcc aaatacagca acttcgatgt 1320
ggccacccac gtgcctctga ttttttatgt gcccggccgg acagccagcc tgcccgaggc 1380
cggggagaag ctctttcctt acctggaccc tttcgactct gccagccagc tgatggaacc 1440
tggcagacag agcatggacc tggtggagct ggtgagcctc ttccccactc tggccggcct 1500
ggctggcctg caggtgccac caagatgccc agtgccttct ttccacgtgg agctgtgtag 1560
agagggaaag aacctgctga agcacttcag atttagagat ctggaggagg atccctacct 1620
gccaggcaac ccaagggagc tgatcgccta cagccagtat cccagaccct ctgatatccc 1680
ccagtggaac agcgataagc cctccctgaa agacatcaag attatgggct actccatcag 1740
gaccattgac taccggtaca cagtgtgggt gggcttcaac cccgatgagt ttctggccaa 1800
cttcagcgac atccacgccg gcgagctgta ttttgtggac tccgaccccc tgcaggacca 1860
caacatgtac aacgactccc agggcggcga cctgttccag ctgctgatgc cctgagatcc 1920
agacatgata agatacattg atgagtttgg acaaaccaca actagaatgc agtgaaaaaa 1980
atgctttatt tgtgaaattt gtgatgctat tgctttattt gtaaccatta taagctgcaa 2040
taaacaagtt aacaacaaca attgcattca ttttatgttt caggttcagg gggaggtgtg 2100
ggaggttttt taa 2113
<210> 55
<211> 953
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 55
aattcggtac cctagttatt aatagtaatc aattacgggg tcattagttc atagcccata 60
tatggagttc cgcgttacat aacttacggt aaatggcccg cctggctgac cgcccaacga 120
cccccgccca ttgacgtcaa taatgacgta tgttcccata gtaacgccaa tagggacttt 180
ccattgacgt caatgggtgg actatttacg gtaaactgcc cacttggcag tacatcaagt 240
gtatcatatg ccaagtacgc cccctattga cgtcaatgac ggtaaatggc ccgcctggca 300
ttatgcccag tacatgacct tatgggactt tcctacttgg cagtacatct acgtattagt 360
catcgctatt accatggtcg aggtgagccc cacgttctgc ttcactctcc ccatctcccc 420
cccctcccca cccccaattt tgtatttatt tattttttaa ttattttgtg cagcgatggg 480
ggcggggggg gggggggggc gcgcgccagg cggggcgggg cggggcgagg ggcggggcgg 540
ggcgaggcgg agaggtgcgg cggcagccaa tcagagcggc gcgctccgaa agtttccttt 600
tatggcgagg cggcggcggc ggcggcccta taaaaagcga agcgcgcggc gggcgggagt 660
cgctgcgacg ctgccttcgc cccgtgcccc gctccgccgc cgcctcgcgc cgcccgcccc 720
ggctctgact gaccgcgtta ctcccacagg tgagcgggcg ggacggccct tctcctccgg 780
gctgtaatta gcgcttggtt taatgacggc ttgtttcttt tctgtggctg cgtgaaagcc 840
ttgaggggct ccgggagcta gagcctctgc taaccatgtt catgccttct tctttttcct 900
acagctcctg ggcaacgtgc tggttattgt gctgtctcat cattttggca aag 953
<210> 56
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 56
gtagataagt agcatggcgg gttaatcatt aactaca 37
<210> 57
<211> 180
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 57
gtagataagt agcatggcgg gttaatcatt aactacaagg aacccctagt gatggagttg 60
gccactccct ctctgcgcgc tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga 120
cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc 180
180
<210> 58
<211> 2522
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 58
tttggccact ccctctctgc gcgctcgctc gctcactgag gccgggcgac caaaggtcgc 60
ccgacgcccg ggctttgccc gggcggcctc agtgagcgag cgagcgcgca gagagggagt 120
ggccaactcc atcactaggg gttcctggag gggtggagtc gtgacgtgaa ttacgtcata 180
gggttaggga ggtcctgcat atgcggccgc aactcacggg gatttccaag tctccacccc 240
attgacgtca atgggagttt gttttggcac caaaatcaac gggactttcc aaaatgtcgt 300
aataaccccg ccccgttgac gcaaatgggc ggtaggcgtg tacggtggga ggtctatata 360
agcagagctc gtttagtgaa ccgtgccacc atgcccccac ccaggaccgg aagaggcctg 420
ctgtggctgg gcctggtgct ctcttccgtg tgcgtggccc tgggaagcga aacccaggcc 480
aacagcacaa ccgacgccct gaatgtgctg ctgatcattg tggacgatct gagaccctcc 540
ctgggctgtt acggcgacaa actggtgcgg tccccaaaca tcgaccagct ggcctcccac 600
tccctgctgt tccagaacgc cttcgcccag caggccgtgt gtgcccccag cagggtgagc 660
ttcctgaccg gcagaagacc tgacaccacc aggctgtacg actttaacag ctactggcgg 720
gtgcacgccg gcaatttcag caccattcct cagtacttca aggagaatgg ctacgtgaca 780
atgtccgtgg gcaaggtgtt tcatcccggc attagctcca accacaccga cgatagccca 840
tactcctggt ccttcccccc ctaccatccc tccagcgaga agtacgagaa caccaaaacc 900
tgcagaggcc ctgacggaga gctgcacgcc aacctgctgt gccctgtgga tgtcctggat 960
gtgcccgaag gtaagggttt aagggatggt tggttggtgg ggtattaatg tttaattacc 1020
tggagcacct gcctgaaatc actttttttc aggcaccctg ccagacaagc agtccacaga 1080
gcaggccatc cagctgctgg agaagatgaa gacaagcgcc agccccttct ttctggccgt 1140
gggataccac aagcctcaca ttccattccg gtacccaaaa gagttccaga agctgtaccc 1200
tctggaaaac atcaccctgg cccctgaccc cgaggtgcca gacgggctgc ctcctgtggc 1260
ctacaatccc tggatggaca tcagacagcg ggaggatgtg caggccctga atatttccgt 1320
gccctatggg cccatccctg tggactttca gcggaaaatc agacagtctt actttgccag 1380
cgtgtcctac ctggacaccc aggtgggccg cctgctctca gccctggacg acctgcagct 1440
ggccaattcc accatcatcg ccttcaccag cgatcacggc tgggccctgg gcgagcacgg 1500
ggagtgggcc aaatacagca acttcgatgt ggccacccac gtgcctctga ttttttatgt 1560
gcccggccgg acagccagcc tgcccgaggc cggggagaag ctctttcctt acctggaccc 1620
tttcgactct gccagccagc tgatggaacc tggcagacag agcatggacc tggtggagct 1680
ggtgagcctc ttccccactc tggccggcct ggctggcctg caggtgccac caagatgccc 1740
agtgccttct ttccacgtgg agctgtgtag agagggaaag aacctgctga agcacttcag 1800
atttagagat ctggaggagg atccctacct gccaggcaac ccaagggagc tgatcgccta 1860
cagccagtat cccagaccct ctgatatccc ccagtggaac agcgataagc cctccctgaa 1920
agacatcaag attatgggct actccatcag gaccattgac taccggtaca cagtgtgggt 1980
gggcttcaac cccgatgagt ttctggccaa cttcagcgac atccacgccg gcgagctgta 2040
ttttgtggac tccgaccccc tgcaggacca caacatgtac aacgactccc agggcggcga 2100
cctgttccag ctgctgatgc cctgagatcc agacatgata agatacattg atgagtttgg 2160
acaaaccaca actagaatgc agtgaaaaaa atgctttatt tgtgaaattt gtgatgctat 2220
tgctttattt gtaaccatta taagctgcaa taaacaagtt aacaacaaca attgcattca 2280
ttttatgttt caggttcagg gggaggtgtg ggaggttttt taacctgcag gtctagatac 2340
gtagataagt agcatggcgg gttaatcatt aactacaagg aacccctagt gatggagttg 2400
gccactccct ctctgcgcgc tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt 2460
cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc 2520
aa 2522
<210> 59
<211> 1735
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 59
atgcccccac ctagaaccgg cagaggcctg ctgtggctgg gcctggtcct gagcagcgtt 60
tgtgtggccc tgggcagcga gacacaggcc aactccacaa cagacgccct gaacgtgctg 120
ctgatcatcg tggacgacct gagacctagc ctgggatgtt acggcgacaa gctggtgcgg 180
agccccaaca tcgaccagct ggctagccac agcctgctgt tccagaacgc ctttgcccag 240
caggctgtgt gcgccccttc tagagtgtcc tttctgaccg gcagaaggcc tgacaccaca 300
agactgtacg acttcaactc ttactggcgg gtgcacgccg gcaacttcag caccatcccc 360
cagtacttta aggagaacgg ctacgtgacc atgagcgtgg gcaaggtgtt ccatcctggc 420
atcagcagca accacaccga cgacagcccc tacagctggt ccttcccccc ctatcacccc 480
tctagcgaga agtacgagaa taccaagacc tgccggggcc ccgatggcga actgcacgcc 540
aacctgctct gccctgtgga cgtgctggat gtgcctgagg gcaccctgcc tgacaagcag 600
agcaccgagc aggccatcca gctgctcgaa aagatgaaaa catctgccag ccctttcttc 660
ctggccgtgg gctaccacaa gcctcacatc ccttttcggt accctaaggt aagggtttaa 720
gggatggttg gttggtgggg tattaatgtt taattacctg gagcacctgc ctgaaatcac 780
tttttttcag gaattccaaa aactgtaccc cctcgagaac ataacactgg ctcctgaccc 840
cgaagtgcca gacggcctcc ctccagtggc ttataacccc tggatggata tccggcagcg 900
ggaagatgtc caggccctta atatcagcgt gccatacggc cctatccctg tggacttcca 960
gagaaagatc agacagagct acttcgccag cgtctcctac ctggatacac aggtgggaag 1020
actgctgtct gccctcgatg atctgcagct ggcaaacagc acaatcatcg ccttcaccag 1080
cgaccacggc tgggctctgg gcgaacacgg cgagtgggcc aagtactcca actttgacgt 1140
ggccacccac gtgccactga tcttctacgt gcccggccgg accgcctctc tgccagaggc 1200
cggagagaaa ctgtttccat atctggaccc cttcgacagc gcctctcagc tgatggaacc 1260
tggcagacaa tctatggacc tggtggaact ggtgtccctg ttccctaccc tggccggact 1320
ggctggcctt caagtgcctc cacggtgccc cgtgccaagc ttccacgttg agctgtgcag 1380
agagggaaaa aacctgctga agcacttcag attccgggac ctggaggaag atccttacct 1440
ccctggaaat cctagagagc tgatcgccta cagccagtac cccagaccca gcgacatccc 1500
tcagtggaac agcgataagc cctccctgaa ggacattaag atcatgggat atagcatcag 1560
aaccatcgac tacagataca ccgtgtgggt cggcttcaac cccgacgagt tcctggccaa 1620
tttcagcgac atccacgccg gagaactgta cttcgtggat tctgaccctc tgcaggacca 1680
caacatgtac aacgacagcc agggcggcga tctgttccag ctgcttatgc cttga 1735
<210> 60
<211> 1735
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 60
atgccccccc ccagaaccgg gagaggcctc ctgtggctgg gcctggtgct gagctccgtg 60
tgtgtggccc tgggcagcga gacccaggcc aacagcacca cagacgccct gaatgtgctg 120
ctgatcattg tggatgacct gaggcccagc ctgggctgct acggcgacaa gctggtgcgc 180
agcccaaaca ttgaccagct ggcctcccac agcctgctgt ttcagaatgc cttcgcccag 240
caggctgtgt gtgcccccag cagagtgtcc tttctgacag gccggcggcc agataccacc 300
agactgtatg acttcaattc ctattggaga gtgcacgctg gcaacttcag caccatcccc 360
cagtatttca aagagaatgg ctacgtgacc atgtccgtgg gcaaggtgtt ccaccctggc 420
atcagcagca accacacaga cgatagcccc tatagctggt ctttcccacc ttatcatccc 480
agcagcgaga agtatgaaaa caccaagacc tgcaggggcc ccgacggaga actgcacgcc 540
aacctgctgt gccccgtgga cgtgctggac gtgcctgagg gcaccctgcc cgataagcag 600
agcactgagc aggctatcca gctgctggag aagatgaaga caagcgcctc tcctttcttc 660
ctggccgtgg gctaccataa gcctcacatc cccttcaggt accctaaggt aagggtttaa 720
gggatggttg gttggtgggg tattaatgtt taattacctg gagcacctgc ctgaaatcac 780
tttttttcag gagttccaga agctgtatcc cctggagaac atcaccctgg cccccgaccc 840
agaggtgccc gatggcctgc cccccgtggc ctacaaccca tggatggata ttcgccagag 900
ggaggatgtg caggctctga acatcagcgt gccctacggc cccatccccg tggacttcca 960
gcgcaagatc cggcagagct actttgcctc cgtgtcttac ctggatacac aggtgggcag 1020
gctgctgtcc gccctggacg atctgcagct ggccaatagc accatcatcg ccttcaccag 1080
cgaccatggc tgggccctgg gcgagcacgg agaatgggcc aagtacagca actttgacgt 1140
ggccacccac gtgccactta tcttctacgt gcccggcagg accgccagcc tgcccgaggc 1200
tggcgagaag ctgttcccct acctcgatcc ttttgattct gcctcccagc tgatggagcc 1260
cggcaggcag agcatggacc tggtggagct ggtgagcctg tttccaacac tggccgggct 1320
ggccggcctg caggtgccac ccagatgccc agtgcccagt tttcatgtgg agctgtgtag 1380
ggagggcaag aatctgctga agcacttcag attcagggat ctggaggagg acccatacct 1440
gcctggaaat cccagggagc tgatcgcata ctcccagtac cccagaccta gcgacatccc 1500
tcagtggaac tctgataagc ccagcctcaa ggacattaag attatgggct acagtatcag 1560
gaccatcgac tacagataca cagtgtgggt gggatttaac ccagacgagt tcctggccaa 1620
tttctccgac atccacgccg gcgagctgta cttcgtggac tctgaccctc tgcaggacca 1680
caacatgtac aatgacagcc agggaggaga cctgttccag ctgctgatgc cctga 1735
<210> 61
<211> 2112
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 61
actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 60
aaaatcaacg ggactttcca aaatgtcgta ataaccccgc cccgttgacg caaatgggcg 120
gtaggcgtgt acggtgggag gtctatataa gcagagctcg tttagtgaac cgtgccagga 180
tgcccccacc tagaaccggc agaggcctgc tgtggctggg cctggtcctg agcagcgttt 240
gtgtggccct gggcagcgag acacaggcca actccacaac agacgccctg aacgtgctgc 300
tgatcatcgt ggacgacctg agacctagcc tgggatgtta cggcgacaag ctggtgcgga 360
gccccaacat cgaccagctg gctagccaca gcctgctgtt ccagaacgcc tttgcccagc 420
aggctgtgtg cgccccttct agagtgtcct ttctgaccgg cagaaggcct gacaccacaa 480
gactgtacga cttcaactct tactggcggg tgcacgccgg caacttcagc accatccccc 540
agtactttaa ggagaacggc tacgtgacca tgagcgtggg caaggtgttc catcctggca 600
tcagcagcaa ccacaccgac gacagcccct acagctggtc cttccccccc tatcacccct 660
ctagcgagaa gtacgagaat accaagacct gccggggccc cgatggcgaa ctgcacgcca 720
acctgctctg ccctgtggac gtgctggatg tgcctgaggg caccctgcct gacaagcaga 780
gcaccgagca ggccatccag ctgctcgaaa agatgaaaac atctgccagc cctttcttcc 840
tggccgtggg ctaccacaag cctcacatcc cttttcggta ccctaaggta agggtttaag 900
ggatggttgg ttggtggggt attaatgttt aattacctgg agcacctgcc tgaaatcact 960
ttttttcagg aattccaaaa actgtacccc ctcgagaaca taacactggc tcctgacccc 1020
gaagtgccag acggcctccc tccagtggct tataacccct ggatggatat ccggcagcgg 1080
gaagatgtcc aggcccttaa tatcagcgtg ccatacggcc ctatccctgt ggacttccag 1140
agaaagatca gacagagcta cttcgccagc gtctcctacc tggatacaca ggtgggaaga 1200
ctgctgtctg ccctcgatga tctgcagctg gcaaacagca caatcatcgc cttcaccagc 1260
gaccacggct gggctctggg cgaacacggc gagtgggcca agtactccaa ctttgacgtg 1320
gccacccacg tgccactgat cttctacgtg cccggccgga ccgcctctct gccagaggcc 1380
ggagagaaac tgtttccata tctggacccc ttcgacagcg cctctcagct gatggaacct 1440
ggcagacaat ctatggacct ggtggaactg gtgtccctgt tccctaccct ggccggactg 1500
gctggccttc aagtgcctcc acggtgcccc gtgccaagct tccacgttga gctgtgcaga 1560
gagggaaaaa acctgctgaa gcacttcaga ttccgggacc tggaggaaga tccttacctc 1620
cctggaaatc ctagagagct gatcgcctac agccagtacc ccagacccag cgacatccct 1680
cagtggaaca gcgataagcc ctccctgaag gacattaaga tcatgggata tagcatcaga 1740
accatcgact acagatacac cgtgtgggtc ggcttcaacc ccgacgagtt cctggccaat 1800
ttcagcgaca tccacgccgg agaactgtac ttcgtggatt ctgaccctct gcaggaccac 1860
aacatgtaca acgacagcca gggcggcgat ctgttccagc tgcttatgcc ttgagatcca 1920
gacatgataa gatacattga tgagtttgga caaaccacaa ctagaatgca gtgaaaaaaa 1980
tgctttattt gtgaaatttg tgatgctatt gctttatttg taaccattat aagctgcaat 2040
aaacaagtta acaacaacaa ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg 2100
gaggtttttt aa 2112
<210> 62
<211> 2482
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 62
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggggag gggtggagtc 120
gtgacgtgaa ttacgtcata gggttaggga ggtcctgcat atgcggccgc aactcacggg 180
gatttccaag tctccacccc attgacgtca atgggagttt gttttggcac caaaatcaac 240
gggactttcc aaaatgtcgt aataaccccg ccccgttgac gcaaatgggc ggtaggcgtg 300
tacggtggga ggtctatata agcagagctc gtttagtgaa ccgtgccagg atgcccccac 360
ctagaaccgg cagaggcctg ctgtggctgg gcctggtcct gagcagcgtt tgtgtggccc 420
tgggcagcga gacacaggcc aactccacaa cagacgccct gaacgtgctg ctgatcatcg 480
tggacgacct gagacctagc ctgggatgtt acggcgacaa gctggtgcgg agccccaaca 540
tcgaccagct ggctagccac agcctgctgt tccagaacgc ctttgcccag caggctgtgt 600
gcgccccttc tagagtgtcc tttctgaccg gcagaaggcc tgacaccaca agactgtacg 660
acttcaactc ttactggcgg gtgcacgccg gcaacttcag caccatcccc cagtacttta 720
aggagaacgg ctacgtgacc atgagcgtgg gcaaggtgtt ccatcctggc atcagcagca 780
accacaccga cgacagcccc tacagctggt ccttcccccc ctatcacccc tctagcgaga 840
agtacgagaa taccaagacc tgccggggcc ccgatggcga actgcacgcc aacctgctct 900
gccctgtgga cgtgctggat gtgcctgagg gcaccctgcc tgacaagcag agcaccgagc 960
aggccatcca gctgctcgaa aagatgaaaa catctgccag ccctttcttc ctggccgtgg 1020
gctaccacaa gcctcacatc ccttttcggt accctaaggt aagggtttaa gggatggttg 1080
gttggtgggg tattaatgtt taattacctg gagcacctgc ctgaaatcac tttttttcag 1140
gaattccaaa aactgtaccc cctcgagaac ataacactgg ctcctgaccc cgaagtgcca 1200
gacggcctcc ctccagtggc ttataacccc tggatggata tccggcagcg ggaagatgtc 1260
caggccctta atatcagcgt gccatacggc cctatccctg tggacttcca gagaaagatc 1320
agacagagct acttcgccag cgtctcctac ctggatacac aggtgggaag actgctgtct 1380
gccctcgatg atctgcagct ggcaaacagc acaatcatcg ccttcaccag cgaccacggc 1440
tgggctctgg gcgaacacgg cgagtgggcc aagtactcca actttgacgt ggccacccac 1500
gtgccactga tcttctacgt gcccggccgg accgcctctc tgccagaggc cggagagaaa 1560
ctgtttccat atctggaccc cttcgacagc gcctctcagc tgatggaacc tggcagacaa 1620
tctatggacc tggtggaact ggtgtccctg ttccctaccc tggccggact ggctggcctt 1680
caagtgcctc cacggtgccc cgtgccaagc ttccacgttg agctgtgcag agagggaaaa 1740
aacctgctga agcacttcag attccgggac ctggaggaag atccttacct ccctggaaat 1800
cctagagagc tgatcgccta cagccagtac cccagaccca gcgacatccc tcagtggaac 1860
agcgataagc cctccctgaa ggacattaag atcatgggat atagcatcag aaccatcgac 1920
tacagataca ccgtgtgggt cggcttcaac cccgacgagt tcctggccaa tttcagcgac 1980
atccacgccg gagaactgta cttcgtggat tctgaccctc tgcaggacca caacatgtac 2040
aacgacagcc agggcggcga tctgttccag ctgcttatgc cttgagatcc agacatgata 2100
agatacattg atgagtttgg acaaaccaca actagaatgc agtgaaaaaa atgctttatt 2160
tgtgaaattt gtgatgctat tgctttattt gtaaccatta taagctgcaa taaacaagtt 2220
aacaacaaca attgcattca ttttatgttt caggttcagg gggaggtgtg ggaggttttt 2280
taacctgcag gtctagatac gtagataagt agcatggcgg gttaatcatt aactacaagg 2340
aacccctagt gatggagttg gccactccct ctctgcgcgc tcgctcgctc actgaggccg 2400
ggcgaccaaa ggtcgcccga cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag 2460
cgcgcagaga gggagtggcc aa 2482
<210> 63
<211> 2112
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 63
actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 60
aaaatcaacg ggactttcca aaatgtcgta ataaccccgc cccgttgacg caaatgggcg 120
gtaggcgtgt acggtgggag gtctatataa gcagagctcg tttagtgaac cgtgccagga 180
tgcccccccc cagaaccggg agaggcctcc tgtggctggg cctggtgctg agctccgtgt 240
gtgtggccct gggcagcgag acccaggcca acagcaccac agacgccctg aatgtgctgc 300
tgatcattgt ggatgacctg aggcccagcc tgggctgcta cggcgacaag ctggtgcgca 360
gcccaaacat tgaccagctg gcctcccaca gcctgctgtt tcagaatgcc ttcgcccagc 420
aggctgtgtg tgcccccagc agagtgtcct ttctgacagg ccggcggcca gataccacca 480
gactgtatga cttcaattcc tattggagag tgcacgctgg caacttcagc accatccccc 540
agtatttcaa agagaatggc tacgtgacca tgtccgtggg caaggtgttc caccctggca 600
tcagcagcaa ccacacagac gatagcccct atagctggtc tttcccacct tatcatccca 660
gcagcgagaa gtatgaaaac accaagacct gcaggggccc cgacggagaa ctgcacgcca 720
acctgctgtg ccccgtggac gtgctggacg tgcctgaggg caccctgccc gataagcaga 780
gcactgagca ggctatccag ctgctggaga agatgaagac aagcgcctct cctttcttcc 840
tggccgtggg ctaccataag cctcacatcc ccttcaggta ccctaaggta agggtttaag 900
ggatggttgg ttggtggggt attaatgttt aattacctgg agcacctgcc tgaaatcact 960
ttttttcagg agttccagaa gctgtatccc ctggagaaca tcaccctggc ccccgaccca 1020
gaggtgcccg atggcctgcc ccccgtggcc tacaacccat ggatggatat tcgccagagg 1080
gaggatgtgc aggctctgaa catcagcgtg ccctacggcc ccatccccgt ggacttccag 1140
cgcaagatcc ggcagagcta ctttgcctcc gtgtcttacc tggatacaca ggtgggcagg 1200
ctgctgtccg ccctggacga tctgcagctg gccaatagca ccatcatcgc cttcaccagc 1260
gaccatggct gggccctggg cgagcacgga gaatgggcca agtacagcaa ctttgacgtg 1320
gccacccacg tgccacttat cttctacgtg cccggcagga ccgccagcct gcccgaggct 1380
ggcgagaagc tgttccccta cctcgatcct tttgattctg cctcccagct gatggagccc 1440
ggcaggcaga gcatggacct ggtggagctg gtgagcctgt ttccaacact ggccgggctg 1500
gccggcctgc aggtgccacc cagatgccca gtgcccagtt ttcatgtgga gctgtgtagg 1560
gagggcaaga atctgctgaa gcacttcaga ttcagggatc tggaggagga cccatacctg 1620
cctggaaatc ccagggagct gatcgcatac tcccagtacc ccagacctag cgacatccct 1680
cagtggaact ctgataagcc cagcctcaag gacattaaga ttatgggcta cagtatcagg 1740
accatcgact acagatacac agtgtgggtg ggatttaacc cagacgagtt cctggccaat 1800
ttctccgaca tccacgccgg cgagctgtac ttcgtggact ctgaccctct gcaggaccac 1860
aacatgtaca atgacagcca gggaggagac ctgttccagc tgctgatgcc ctgagatcca 1920
gacatgataa gatacattga tgagtttgga caaaccacaa ctagaatgca gtgaaaaaaa 1980
tgctttattt gtgaaatttg tgatgctatt gctttatttg taaccattat aagctgcaat 2040
aaacaagtta acaacaacaa ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg 2100
gaggtttttt aa 2112
<210> 64
<211> 2482
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 64
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggggag gggtggagtc 120
gtgacgtgaa ttacgtcata gggttaggga ggtcctgcat atgcggccgc aactcacggg 180
gatttccaag tctccacccc attgacgtca atgggagttt gttttggcac caaaatcaac 240
gggactttcc aaaatgtcgt aataaccccg ccccgttgac gcaaatgggc ggtaggcgtg 300
tacggtggga ggtctatata agcagagctc gtttagtgaa ccgtgccagg atgccccccc 360
ccagaaccgg gagaggcctc ctgtggctgg gcctggtgct gagctccgtg tgtgtggccc 420
tgggcagcga gacccaggcc aacagcacca cagacgccct gaatgtgctg ctgatcattg 480
tggatgacct gaggcccagc ctgggctgct acggcgacaa gctggtgcgc agcccaaaca 540
ttgaccagct ggcctcccac agcctgctgt ttcagaatgc cttcgcccag caggctgtgt 600
gtgcccccag cagagtgtcc tttctgacag gccggcggcc agataccacc agactgtatg 660
acttcaattc ctattggaga gtgcacgctg gcaacttcag caccatcccc cagtatttca 720
aagagaatgg ctacgtgacc atgtccgtgg gcaaggtgtt ccaccctggc atcagcagca 780
accacacaga cgatagcccc tatagctggt ctttcccacc ttatcatccc agcagcgaga 840
agtatgaaaa caccaagacc tgcaggggcc ccgacggaga actgcacgcc aacctgctgt 900
gccccgtgga cgtgctggac gtgcctgagg gcaccctgcc cgataagcag agcactgagc 960
aggctatcca gctgctggag aagatgaaga caagcgcctc tcctttcttc ctggccgtgg 1020
gctaccataa gcctcacatc cccttcaggt accctaaggt aagggtttaa gggatggttg 1080
gttggtgggg tattaatgtt taattacctg gagcacctgc ctgaaatcac tttttttcag 1140
gagttccaga agctgtatcc cctggagaac atcaccctgg cccccgaccc agaggtgccc 1200
gatggcctgc cccccgtggc ctacaaccca tggatggata ttcgccagag ggaggatgtg 1260
caggctctga acatcagcgt gccctacggc cccatccccg tggacttcca gcgcaagatc 1320
cggcagagct actttgcctc cgtgtcttac ctggatacac aggtgggcag gctgctgtcc 1380
gccctggacg atctgcagct ggccaatagc accatcatcg ccttcaccag cgaccatggc 1440
tgggccctgg gcgagcacgg agaatgggcc aagtacagca actttgacgt ggccacccac 1500
gtgccactta tcttctacgt gcccggcagg accgccagcc tgcccgaggc tggcgagaag 1560
ctgttcccct acctcgatcc ttttgattct gcctcccagc tgatggagcc cggcaggcag 1620
agcatggacc tggtggagct ggtgagcctg tttccaacac tggccgggct ggccggcctg 1680
caggtgccac ccagatgccc agtgcccagt tttcatgtgg agctgtgtag ggagggcaag 1740
aatctgctga agcacttcag attcagggat ctggaggagg acccatacct gcctggaaat 1800
cccagggagc tgatcgcata ctcccagtac cccagaccta gcgacatccc tcagtggaac 1860
tctgataagc ccagcctcaa ggacattaag attatgggct acagtatcag gaccatcgac 1920
tacagataca cagtgtgggt gggatttaac ccagacgagt tcctggccaa tttctccgac 1980
atccacgccg gcgagctgta cttcgtggac tctgaccctc tgcaggacca caacatgtac 2040
aatgacagcc agggaggaga cctgttccag ctgctgatgc cctgagatcc agacatgata 2100
agatacattg atgagtttgg acaaaccaca actagaatgc agtgaaaaaa atgctttatt 2160
tgtgaaattt gtgatgctat tgctttattt gtaaccatta taagctgcaa taaacaagtt 2220
aacaacaaca attgcattca ttttatgttt caggttcagg gggaggtgtg ggaggttttt 2280
taacctgcag gtctagatac gtagataagt agcatggcgg gttaatcatt aactacaagg 2340
aacccctagt gatggagttg gccactccct ctctgcgcgc tcgctcgctc actgaggccg 2400
ggcgaccaaa ggtcgcccga cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag 2460
cgcgcagaga gggagtggcc aa 2482
<210> 65
<211> 2112
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 65
actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 60
aaaatcaacg ggactttcca aaatgtcgta ataaccccgc cccgttgacg caaatgggcg 120
gtaggcgtgt acggtgggag gtctatataa gcagagctcg tttagtgaac cgtgccagga 180
tgcccccacc caggaccgga agaggcctgc tgtggctggg cctggtgctc tcttccgtgt 240
gcgtggccct gggaagcgaa acccaggcca acagcacaac cgacgccctg aatgtgctgc 300
tgatcattgt ggacgatctg agaccctccc tgggctgtta cggcgacaaa ctggtgcggt 360
ccccaaacat cgaccagctg gcctcccact ccctgctgtt ccagaacgcc ttcgcccagc 420
aggccgtgtg tgcccccagc agggtgagct tcctgaccgg cagaagacct gacaccacca 480
ggctgtacga ctttaacagc tactggcggg tgcacgccgg caatttcagc accattcctc 540
agtacttcaa ggagaatggc tacgtgacaa tgtccgtggg caaggtgttt catcccggca 600
ttagctccaa ccacaccgac gatagcccat actcctggtc cttccccccc taccatccct 660
ccagcgagaa gtacgagaac accaaaacct gcagaggccc tgacggagag ctgcacgcca 720
acctgctgtg ccctgtggat gtcctggatg tgcccgaagg taagggttta agggatggtt 780
ggttggtggg gtattaatgt ttaattacct ggagcacctg cctgaaatca ctttttttca 840
ggcaccctgc cagacaagca gtccacagag caggccatcc agctgctgga gaagatgaag 900
acaagcgcca gccccttctt tctggccgtg ggataccaca agcctcacat tccattccgg 960
tacccaaaag agttccagaa gctgtaccct ctggaaaaca tcaccctggc ccctgacccc 1020
gaggtgccag acgggctgcc tcctgtggcc tacaatccct ggatggacat cagacagcgg 1080
gaggatgtgc aggccctgaa tatttccgtg ccctatgggc ccatccctgt ggactttcag 1140
cggaaaatca gacagtctta ctttgccagc gtgtcctacc tggacaccca ggtgggccgc 1200
ctgctctcag ccctggacga cctgcagctg gccaattcca ccatcatcgc cttcaccagc 1260
gatcacggct gggccctggg cgagcacggg gagtgggcca aatacagcaa cttcgatgtg 1320
gccacccacg tgcctctgat tttttatgtg cccggccgga cagccagcct gcccgaggcc 1380
ggggagaagc tctttcctta cctggaccct ttcgactctg ccagccagct gatggaacct 1440
ggcagacaga gcatggacct ggtggagctg gtgagcctct tccccactct ggccggcctg 1500
gctggcctgc aggtgccacc aagatgccca gtgccttctt tccacgtgga gctgtgtaga 1560
gagggaaaga acctgctgaa gcacttcaga tttagagatc tggaggagga tccctacctg 1620
ccaggcaacc caagggagct gatcgcctac agccagtatc ccagaccctc tgatatcccc 1680
cagtggaaca gcgataagcc ctccctgaaa gacatcaaga ttatgggcta ctccatcagg 1740
accattgact accggtacac agtgtgggtg ggcttcaacc ccgatgagtt tctggccaac 1800
ttcagcgaca tccacgccgg cgagctgtat tttgtggact ccgaccccct gcaggaccac 1860
aacatgtaca acgactccca gggcggcgac ctgttccagc tgctgatgcc ctgagatcca 1920
gacatgataa gatacattga tgagtttgga caaaccacaa ctagaatgca gtgaaaaaaa 1980
tgctttattt gtgaaatttg tgatgctatt gctttatttg taaccattat aagctgcaat 2040
aaacaagtta acaacaacaa ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg 2100
gaggtttttt aa 2112
<210> 66
<211> 2482
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 66
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggggag gggtggagtc 120
gtgacgtgaa ttacgtcata gggttaggga ggtcctgcat atgcggccgc aactcacggg 180
gatttccaag tctccacccc attgacgtca atgggagttt gttttggcac caaaatcaac 240
gggactttcc aaaatgtcgt aataaccccg ccccgttgac gcaaatgggc ggtaggcgtg 300
tacggtggga ggtctatata agcagagctc gtttagtgaa ccgtgccagg atgcccccac 360
ccaggaccgg aagaggcctg ctgtggctgg gcctggtgct ctcttccgtg tgcgtggccc 420
tgggaagcga aacccaggcc aacagcacaa ccgacgccct gaatgtgctg ctgatcattg 480
tggacgatct gagaccctcc ctgggctgtt acggcgacaa actggtgcgg tccccaaaca 540
tcgaccagct ggcctcccac tccctgctgt tccagaacgc cttcgcccag caggccgtgt 600
gtgcccccag cagggtgagc ttcctgaccg gcagaagacc tgacaccacc aggctgtacg 660
actttaacag ctactggcgg gtgcacgccg gcaatttcag caccattcct cagtacttca 720
aggagaatgg ctacgtgaca atgtccgtgg gcaaggtgtt tcatcccggc attagctcca 780
accacaccga cgatagccca tactcctggt ccttcccccc ctaccatccc tccagcgaga 840
agtacgagaa caccaaaacc tgcagaggcc ctgacggaga gctgcacgcc aacctgctgt 900
gccctgtgga tgtcctggat gtgcccgaag gtaagggttt aagggatggt tggttggtgg 960
ggtattaatg tttaattacc tggagcacct gcctgaaatc actttttttc aggcaccctg 1020
ccagacaagc agtccacaga gcaggccatc cagctgctgg agaagatgaa gacaagcgcc 1080
agccccttct ttctggccgt gggataccac aagcctcaca ttccattccg gtacccaaaa 1140
gagttccaga agctgtaccc tctggaaaac atcaccctgg cccctgaccc cgaggtgcca 1200
gacgggctgc ctcctgtggc ctacaatccc tggatggaca tcagacagcg ggaggatgtg 1260
caggccctga atatttccgt gccctatggg cccatccctg tggactttca gcggaaaatc 1320
agacagtctt actttgccag cgtgtcctac ctggacaccc aggtgggccg cctgctctca 1380
gccctggacg acctgcagct ggccaattcc accatcatcg ccttcaccag cgatcacggc 1440
tgggccctgg gcgagcacgg ggagtgggcc aaatacagca acttcgatgt ggccacccac 1500
gtgcctctga ttttttatgt gcccggccgg acagccagcc tgcccgaggc cggggagaag 1560
ctctttcctt acctggaccc tttcgactct gccagccagc tgatggaacc tggcagacag 1620
agcatggacc tggtggagct ggtgagcctc ttccccactc tggccggcct ggctggcctg 1680
caggtgccac caagatgccc agtgccttct ttccacgtgg agctgtgtag agagggaaag 1740
aacctgctga agcacttcag atttagagat ctggaggagg atccctacct gccaggcaac 1800
ccaagggagc tgatcgccta cagccagtat cccagaccct ctgatatccc ccagtggaac 1860
agcgataagc cctccctgaa agacatcaag attatgggct actccatcag gaccattgac 1920
taccggtaca cagtgtgggt gggcttcaac cccgatgagt ttctggccaa cttcagcgac 1980
atccacgccg gcgagctgta ttttgtggac tccgaccccc tgcaggacca caacatgtac 2040
aacgactccc agggcggcga cctgttccag ctgctgatgc cctgagatcc agacatgata 2100
agatacattg atgagtttgg acaaaccaca actagaatgc agtgaaaaaa atgctttatt 2160
tgtgaaattt gtgatgctat tgctttattt gtaaccatta taagctgcaa taaacaagtt 2220
aacaacaaca attgcattca ttttatgttt caggttcagg gggaggtgtg ggaggttttt 2280
taacctgcag gtctagatac gtagataagt agcatggcgg gttaatcatt aactacaagg 2340
aacccctagt gatggagttg gccactccct ctctgcgcgc tcgctcgctc actgaggccg 2400
ggcgaccaaa ggtcgcccga cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag 2460
cgcgcagaga gggagtggcc aa 2482
<210> 67
<211> 1653
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 67
atgcccccac ctagaaccgg cagaggcctg ctgtggctgg gcctggtcct gagcagcgtt 60
tgtgtggccc tgggcagcga gacacaggcc aactccacaa cagacgccct gaacgtgctg 120
ctgatcatcg tggacgacct gagacctagc ctgggatgtt acggcgacaa gctggtgcgg 180
agccccaaca tcgaccagct ggctagccac agcctgctgt tccagaacgc ctttgcccag 240
caggctgtgt gcgccccttc tagagtgtcc tttctgaccg gcagaaggcc tgacaccaca 300
agactgtacg acttcaactc ttactggcgg gtgcacgccg gcaacttcag caccatcccc 360
cagtacttta aggagaacgg ctacgtgacc atgagcgtgg gcaaggtgtt ccatcctggc 420
atcagcagca accacaccga cgacagcccc tacagctggt ccttcccccc ctatcacccc 480
tctagcgaga agtacgagaa taccaagacc tgccggggcc ccgatggcga actgcacgcc 540
aacctgctct gccctgtgga cgtgctggat gtgcctgagg gcaccctgcc tgacaagcag 600
agcaccgagc aggccatcca gctgctcgaa aagatgaaaa catctgccag ccctttcttc 660
ctggccgtgg gctaccacaa gcctcacatc ccttttcggt accctaagga attccaaaaa 720
ctgtaccccc tcgagaacat aacactggct cctgaccccg aagtgccaga cggcctccct 780
ccagtggctt ataacccctg gatggatatc cggcagcggg aagatgtcca ggcccttaat 840
atcagcgtgc catacggccc tatccctgtg gacttccaga gaaagatcag acagagctac 900
ttcgccagcg tctcctacct ggatacacag gtgggaagac tgctgtctgc cctcgatgat 960
ctgcagctgg caaacagcac aatcatcgcc ttcaccagcg accacggctg ggctctgggc 1020
gaacacggcg agtgggccaa gtactccaac tttgacgtgg ccacccacgt gccactgatc 1080
ttctacgtgc ccggccggac cgcctctctg ccagaggccg gagagaaact gtttccatat 1140
ctggacccct tcgacagcgc ctctcagctg atggaacctg gcagacaatc tatggacctg 1200
gtggaactgg tgtccctgtt ccctaccctg gccggactgg ctggccttca agtgcctcca 1260
cggtgccccg tgccaagctt ccacgttgag ctgtgcagag agggaaaaaa cctgctgaag 1320
cacttcagat tccgggacct ggaggaagat ccttacctcc ctggaaatcc tagagagctg 1380
atcgcctaca gccagtaccc cagacccagc gacatccctc agtggaacag cgataagccc 1440
tccctgaagg acattaagat catgggatat agcatcagaa ccatcgacta cagatacacc 1500
gtgtgggtcg gcttcaaccc cgacgagttc ctggccaatt tcagcgacat ccacgccgga 1560
gaactgtact tcgtggattc tgaccctctg caggaccaca acatgtacaa cgacagccag 1620
ggcggcgatc tgttccagct gcttatgcct tga 1653
<210> 68
<211> 1653
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 68
atgccccccc ccagaaccgg gagaggcctc ctgtggctgg gcctggtgct gagctccgtg 60
tgtgtggccc tgggcagcga gacccaggcc aacagcacca cagacgccct gaatgtgctg 120
ctgatcattg tggatgacct gaggcccagc ctgggctgct acggcgacaa gctggtgcgc 180
agcccaaaca ttgaccagct ggcctcccac agcctgctgt ttcagaatgc cttcgcccag 240
caggctgtgt gtgcccccag cagagtgtcc tttctgacag gccggcggcc agataccacc 300
agactgtatg acttcaattc ctattggaga gtgcacgctg gcaacttcag caccatcccc 360
cagtatttca aagagaatgg ctacgtgacc atgtccgtgg gcaaggtgtt ccaccctggc 420
atcagcagca accacacaga cgatagcccc tatagctggt ctttcccacc ttatcatccc 480
agcagcgaga agtatgaaaa caccaagacc tgcaggggcc ccgacggaga actgcacgcc 540
aacctgctgt gccccgtgga cgtgctggac gtgcctgagg gcaccctgcc cgataagcag 600
agcactgagc aggctatcca gctgctggag aagatgaaga caagcgcctc tcctttcttc 660
ctggccgtgg gctaccataa gcctcacatc cccttcaggt accctaagga gttccagaag 720
ctgtatcccc tggagaacat caccctggcc cccgacccag aggtgcccga tggcctgccc 780
cccgtggcct acaacccatg gatggatatt cgccagaggg aggatgtgca ggctctgaac 840
atcagcgtgc cctacggccc catccccgtg gacttccagc gcaagatccg gcagagctac 900
tttgcctccg tgtcttacct ggatacacag gtgggcaggc tgctgtccgc cctggacgat 960
ctgcagctgg ccaatagcac catcatcgcc ttcaccagcg accatggctg ggccctgggc 1020
gagcacggag aatgggccaa gtacagcaac tttgacgtgg ccacccacgt gccacttatc 1080
ttctacgtgc ccggcaggac cgccagcctg cccgaggctg gcgagaagct gttcccctac 1140
ctcgatcctt ttgattctgc ctcccagctg atggagcccg gcaggcagag catggacctg 1200
gtggagctgg tgagcctgtt tccaacactg gccgggctgg ccggcctgca ggtgccaccc 1260
agatgcccag tgcccagttt tcatgtggag ctgtgtaggg agggcaagaa tctgctgaag 1320
cacttcagat tcagggatct ggaggaggac ccatacctgc ctggaaatcc cagggagctg 1380
atcgcatact cccagtaccc cagacctagc gacatccctc agtggaactc tgataagccc 1440
agcctcaagg acattaagat tatgggctac agtatcagga ccatcgacta cagatacaca 1500
gtgtgggtgg gatttaaccc agacgagttc ctggccaatt tctccgacat ccacgccggc 1560
gagctgtact tcgtggactc tgaccctctg caggaccaca acatgtacaa tgacagccag 1620
ggaggagacc tgttccagct gctgatgccc tga 1653
<210> 69
<211> 2118
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 69
aactcacggg gatttccaag tctccacccc attgacgtca atgggagttt gttttggcac 60
caaaatcaac gggactttcc aaaatgtcgt aataaccccg ccccgttgac gcaaatgggc 120
ggtaggcgtg tacggtggga ggtctatata agcagagctc gtttagtgaa ccgtgccacc 180
atgccgccac cccggaccgg ccgaggcctt ctctggctgg gtctggttct gagctccgtc 240
tgcgtcgccc tcggatccga aacgcaggcc aactcgacca cagatgctct gaacgttctt 300
ctcatcatcg tggatgacct gcgcccctcc ctgggctgtt atggggataa gctggtgagg 360
tccccaaata ttgaccaact ggcatcccac agcctcctct tccagaatgc ctttgcgcag 420
caagcagtgt gcgccccgag ccgcgtttct ttcctcactg gcaggagacc tgacaccacc 480
cgcctgtacg acttcaactc ctactggagg gtgcacgctg gaaacttctc caccatcccc 540
cagtacttca aggagaatgg ctatgtgacc atgtcggtgg gaaaagtctt tcaccctggg 600
atatcttcta accataccga tgattctccg tatagctggt cttttccacc ttatcatcct 660
tcctctgaga agtatgaaaa cactaagaca tgtcgagggc cagatggaga actccatgcc 720
aacctgcttt gccctgtgga tgtgctggat gttcccgagg gcaccttgcc tgacaaacag 780
agcactgagc aagccataca gttgttggaa aagatgaaaa cgtcagccag tcctttcttc 840
ctggccgttg ggtatcataa gccacacatc cccttcagat accccaaggt aagggtttaa 900
gggatggttg gttggtgggg tattaatgtt taattacctg gagcacctgc ctgaaatcac 960
tttttttcag gaatttcaga agttgtatcc cttggagaac atcaccctgg cccccgatcc 1020
cgaggtccct gatggcctac cccctgtggc ctacaacccc tggatggaca tcaggcaacg 1080
ggaagacgtc caagccttaa acatcagtgt gccgtatggt ccaattcctg tggactttca 1140
gcggaaaatc cgccagagct actttgcctc tgtgtcatat ttggatacac aggtcggccg 1200
cctcttgagt gctttggacg atcttcagct ggccaacagc accatcattg catttacctc 1260
ggatcatggg tgggctctag gtgaacatgg agaatgggcc aaatacagca attttgatgt 1320
tgctacccat gttcccctga tattctatgt tcctggaagg acggcttcac ttccggaggc 1380
aggcgagaag cttttccctt acctcgaccc ttttgattcc gcctcacagt tgatggagcc 1440
aggcaggcaa tccatggacc ttgtggaact tgtgtctctt tttcccacgc tggctggact 1500
tgcaggactg caggttccac ctcgctgccc cgttccttca tttcacgttg agctgtgcag 1560
agaaggcaag aaccttctga agcattttcg attccgtgac ttggaagagg atccgtacct 1620
ccctggtaat ccccgtgaac tgattgccta tagccagtat ccccggcctt cagacatccc 1680
tcagtggaat tctgacaagc cgagtttaaa agatataaag atcatgggct attccatacg 1740
caccatagac tataggtata ctgtgtgggt tggcttcaat cctgatgaat ttctagctaa 1800
cttttctgac atccatgcag gggaactgta ttttgtggat tctgacccat tgcaggatca 1860
caatatgtat aatgattccc aaggtggaga tcttttccag ttgttgatgc cttgactcga 1920
gatccagaca tgataagata cattgatgag tttggacaaa ccacaactag aatgcagtga 1980
aaaaaatgct ttatttgtga aatttgtgat gctattgctt tatttgtaac cattataagc 2040
tgcaataaac aagttaacaa caacaattgc attcatttta tgtttcaggt tcagggggag 2100
gtgtgggagg ttttttaa 2118
<210> 70
<211> 2432
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 70
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggaatt cacgcgtgga 120
tctgaattca attcacgcgt ggtaccaact cacggggatt tccaagtctc caccccattg 180
acgtcaatgg gagtttgttt tggcaccaaa atcaacggga ctttccaaaa tgtcgtaata 240
accccgcccc gttgacgcaa atgggcggta ggcgtgtacg gtgggaggtc tatataagca 300
gagctcgttt agtgaaccgt gccaccatgc cgccaccccg gaccggccga ggccttctct 360
ggctgggtct ggttctgagc tccgtctgcg tcgccctcgg atccgaaacg caggccaact 420
cgaccacaga tgctctgaac gttcttctca tcatcgtgga tgacctgcgc ccctccctgg 480
gctgttatgg ggataagctg gtgaggtccc caaatattga ccaactggca tcccacagcc 540
tcctcttcca gaatgccttt gcgcagcaag cagtgtgcgc cccgagccgc gtttctttcc 600
tcactggcag gagacctgac accacccgcc tgtacgactt caactcctac tggagggtgc 660
acgctggaaa cttctccacc atcccccagt acttcaagga gaatggctat gtgaccatgt 720
cggtgggaaa agtctttcac cctgggatat cttctaacca taccgatgat tctccgtata 780
gctggtcttt tccaccttat catccttcct ctgagaagta tgaaaacact aagacatgtc 840
gagggccaga tggagaactc catgccaacc tgctttgccc tgtggatgtg ctggatgttc 900
ccgagggcac cttgcctgac aaacagagca ctgagcaagc catacagttg ttggaaaaga 960
tgaaaacgtc agccagtcct ttcttcctgg ccgttgggta tcataagcca cacatcccct 1020
tcagataccc caaggtaagg gtttaaggga tggttggttg gtggggtatt aatgtttaat 1080
tacctggagc acctgcctga aatcactttt tttcaggaat ttcagaagtt gtatcccttg 1140
gagaacatca ccctggcccc cgatcccgag gtccctgatg gcctaccccc tgtggcctac 1200
aacccctgga tggacatcag gcaacgggaa gacgtccaag ccttaaacat cagtgtgccg 1260
tatggtccaa ttcctgtgga ctttcagcgg aaaatccgcc agagctactt tgcctctgtg 1320
tcatatttgg atacacaggt cggccgcctc ttgagtgctt tggacgatct tcagctggcc 1380
aacagcacca tcattgcatt tacctcggat catgggtggg ctctaggtga acatggagaa 1440
tgggccaaat acagcaattt tgatgttgct acccatgttc ccctgatatt ctatgttcct 1500
ggaaggacgg cttcacttcc ggaggcaggc gagaagcttt tcccttacct cgaccctttt 1560
gattccgcct cacagttgat ggagccaggc aggcaatcca tggaccttgt ggaacttgtg 1620
tctctttttc ccacgctggc tggacttgca ggactgcagg ttccacctcg ctgccccgtt 1680
ccttcatttc acgttgagct gtgcagagaa ggcaagaacc ttctgaagca ttttcgattc 1740
cgtgacttgg aagaggatcc gtacctccct ggtaatcccc gtgaactgat tgcctatagc 1800
cagtatcccc ggccttcaga catccctcag tggaattctg acaagccgag tttaaaagat 1860
ataaagatca tgggctattc catacgcacc atagactata ggtatactgt gtgggttggc 1920
ttcaatcctg atgaatttct agctaacttt tctgacatcc atgcagggga actgtatttt 1980
gtggattctg acccattgca ggatcacaat atgtataatg attcccaagg tggagatctt 2040
ttccagttgt tgatgccttg actcgagatc cagacatgat aagatacatt gatgagtttg 2100
gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt tgtgatgcta 2160
ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac aattgcattc 2220
attttatgtt tcaggttcag ggggaggtgt gggaggtttt ttaaagcatg ctggggagag 2280
atcgatctga ggaaccccta gtgatggagt tggccactcc ctctctgcgc gctcgctcgc 2340
tcactgaggc cgggcgacca aaggtcgccc gacgcccggg ctttgcccgg gcggcctcag 2400
tgagcgagcg agcgcgcaga gagggagtgg cc 2432
<210> 71
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 71
ggaggggtgg agtcgtgacg tgaattacgt catagggtta gggagg 46
<210> 72
<211> 191
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 72
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180
ggttagggag g 191
<210> 73
<211> 152
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 73
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggggag gggtggagtc 120
gtgacgtgaa ttacgtcata gggttaggga gg 152
<210> 74
<211> 182
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 74
gtagataagt agcatggcgg gttaatcatt aactacaagg aacccctagt gatggagttg 60
gccactccct ctctgcgcgc tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt 120
cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc 180
aa 182
<210> 75
<211> 2117
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 75
actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 60
aaaatcaacg ggactttcca aaatgtcgta ataaccccgc cccgttgacg caaatgggcg 120
gtaggcgtgt acggtgggag gtctatataa gcagagctcg tttagtgaac cgtgccacca 180
tgccgccacc ccggaccggc cgaggccttc tctggctggg tctggttctg agctccgtct 240
gcgtcgccct cggatccgaa acgcaggcca actcgaccac agatgctctg aacgttcttc 300
tcatcatcgt ggatgacctg cgcccctccc tgggctgtta tggggataag ctggtgaggt 360
ccccaaatat tgaccaactg gcatcccaca gcctcctctt ccagaatgcc tttgcgcagc 420
aagcagtgtg cgccccgagc cgcgtttctt tcctcactgg caggagacct gacaccaccc 480
gcctgtacga cttcaactcc tactggaggg tgcacgctgg aaacttctcc accatccccc 540
agtacttcaa ggagaatggc tatgtgacca tgtcggtggg aaaagtcttt caccctggga 600
tatcttctaa ccataccgat gattctccgt atagctggtc ttttccacct tatcatcctt 660
cctctgagaa gtatgaaaac actaagacat gtcgagggcc agatggagaa ctccatgcca 720
acctgctttg ccctgtggat gtgctggatg ttcccgaggg caccttgcct gacaaacaga 780
gcactgagca agccatacag ttgttggaaa agatgaaaac gtcagccagt cctttcttcc 840
tggccgttgg gtatcataag ccacacatcc ccttcagata ccccaaggta agggtttaag 900
ggatggttgg ttggtggggt attaatgttt aattacctgg agcacctgcc tgaaatcact 960
ttttttcagg aatttcagaa gttgtatccc ttggagaaca tcaccctggc ccccgatccc 1020
gaggtccctg atggcctacc ccctgtggcc tacaacccct ggatggacat caggcaacgg 1080
gaagacgtcc aagccttaaa catcagtgtg ccgtatggtc caattcctgt ggactttcag 1140
cggaaaatcc gccagagcta ctttgcctct gtgtcatatt tggatacaca ggtcggccgc 1200
ctcttgagtg ctttggacga tcttcagctg gccaacagca ccatcattgc atttacctcg 1260
gatcatgggt gggctctagg tgaacatgga gaatgggcca aatacagcaa ttttgatgtt 1320
gctacccatg ttcccctgat attctatgtt cctggaagga cggcttcact tccggaggca 1380
ggcgagaagc ttttccctta cctcgaccct tttgattccg cctcacagtt gatggagcca 1440
ggcaggcaat ccatggacct tgtggaactt gtgtctcttt ttcccacgct ggctggactt 1500
gcaggactgc aggttccacc tcgctgcccc gttccttcat ttcacgttga gctgtgcaga 1560
gaaggcaaga accttctgaa gcattttcga ttccgtgact tggaagagga tccgtacctc 1620
cctggtaatc cccgtgaact gattgcctat agccagtatc cccggccttc agacatccct 1680
cagtggaatt ctgacaagcc gagtttaaaa gatataaaga tcatgggcta ttccatacgc 1740
accatagact ataggtatac tgtgtgggtt ggcttcaatc ctgatgaatt tctagctaac 1800
ttttctgaca tccatgcagg ggaactgtat tttgtggatt ctgacccatt gcaggatcac 1860
aatatgtata atgattccca aggtggagat cttttccagt tgttgatgcc ttgactcgag 1920
atccagacat gataagatac attgatgagt ttggacaaac cacaactaga atgcagtgaa 1980
aaaaatgctt tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct 2040
gcaataaaca agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg 2100
tgtgggaggt tttttaa 2117
<210> 76
<211> 2487
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 76
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggggag gggtggagtc 120
gtgacgtgaa ttacgtcata gggttaggga ggtcctgcat atgcggccgc aactcacggg 180
gatttccaag tctccacccc attgacgtca atgggagttt gttttggcac caaaatcaac 240
gggactttcc aaaatgtcgt aataaccccg ccccgttgac gcaaatgggc ggtaggcgtg 300
tacggtggga ggtctatata agcagagctc gtttagtgaa ccgtgccacc atgccgccac 360
cccggaccgg ccgaggcctt ctctggctgg gtctggttct gagctccgtc tgcgtcgccc 420
tcggatccga aacgcaggcc aactcgacca cagatgctct gaacgttctt ctcatcatcg 480
tggatgacct gcgcccctcc ctgggctgtt atggggataa gctggtgagg tccccaaata 540
ttgaccaact ggcatcccac agcctcctct tccagaatgc ctttgcgcag caagcagtgt 600
gcgccccgag ccgcgtttct ttcctcactg gcaggagacc tgacaccacc cgcctgtacg 660
acttcaactc ctactggagg gtgcacgctg gaaacttctc caccatcccc cagtacttca 720
aggagaatgg ctatgtgacc atgtcggtgg gaaaagtctt tcaccctggg atatcttcta 780
accataccga tgattctccg tatagctggt cttttccacc ttatcatcct tcctctgaga 840
agtatgaaaa cactaagaca tgtcgagggc cagatggaga actccatgcc aacctgcttt 900
gccctgtgga tgtgctggat gttcccgagg gcaccttgcc tgacaaacag agcactgagc 960
aagccataca gttgttggaa aagatgaaaa cgtcagccag tcctttcttc ctggccgttg 1020
ggtatcataa gccacacatc cccttcagat accccaaggt aagggtttaa gggatggttg 1080
gttggtgggg tattaatgtt taattacctg gagcacctgc ctgaaatcac tttttttcag 1140
gaatttcaga agttgtatcc cttggagaac atcaccctgg cccccgatcc cgaggtccct 1200
gatggcctac cccctgtggc ctacaacccc tggatggaca tcaggcaacg ggaagacgtc 1260
caagccttaa acatcagtgt gccgtatggt ccaattcctg tggactttca gcggaaaatc 1320
cgccagagct actttgcctc tgtgtcatat ttggatacac aggtcggccg cctcttgagt 1380
gctttggacg atcttcagct ggccaacagc accatcattg catttacctc ggatcatggg 1440
tgggctctag gtgaacatgg agaatgggcc aaatacagca attttgatgt tgctacccat 1500
gttcccctga tattctatgt tcctggaagg acggcttcac ttccggaggc aggcgagaag 1560
cttttccctt acctcgaccc ttttgattcc gcctcacagt tgatggagcc aggcaggcaa 1620
tccatggacc ttgtggaact tgtgtctctt tttcccacgc tggctggact tgcaggactg 1680
caggttccac ctcgctgccc cgttccttca tttcacgttg agctgtgcag agaaggcaag 1740
aaccttctga agcattttcg attccgtgac ttggaagagg atccgtacct ccctggtaat 1800
ccccgtgaac tgattgccta tagccagtat ccccggcctt cagacatccc tcagtggaat 1860
tctgacaagc cgagtttaaa agatataaag atcatgggct attccatacg caccatagac 1920
tataggtata ctgtgtgggt tggcttcaat cctgatgaat ttctagctaa cttttctgac 1980
atccatgcag gggaactgta ttttgtggat tctgacccat tgcaggatca caatatgtat 2040
aatgattccc aaggtggaga tcttttccag ttgttgatgc cttgactcga gatccagaca 2100
tgataagata cattgatgag tttggacaaa ccacaactag aatgcagtga aaaaaatgct 2160
ttatttgtga aatttgtgat gctattgctt tatttgtaac cattataagc tgcaataaac 2220
aagttaacaa caacaattgc attcatttta tgtttcaggt tcagggggag gtgtgggagg 2280
ttttttaacc tgcaggtcta gatacgtaga taagtagcat ggcgggttaa tcattaacta 2340
caaggaaccc ctagtgatgg agttggccac tccctctctg cgcgctcgct cgctcactga 2400
ggccgggcga ccaaaggtcg cccgacgccc gggctttgcc cgggcggcct cagtgagcga 2460
gcgagcgcgc agagagggag tggccaa 2487
<210> 77
<211> 2117
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 77
actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 60
aaaatcaacg ggactttcca aaatgtcgta ataaccccgc cccgttgacg caaatgggcg 120
gtaggcgtgt acggtgggag gtctatataa gcagagctcg tttagtgaac cgtgccacca 180
tgccgccacc ccggaccggc cgaggccttc tctggctggg tctggttctg agctccgtct 240
gcgtcgccct cggatccgaa acgcaggcca actcgaccac agatgctctg aacgttcttc 300
tcatcatcgt ggatgacctg cgcccctccc tgggctgtta tggggataag ctggtgaggt 360
ccccaaatat tgaccaactg gcatcccaca gcctcctctt ccagaatgcc tttgcgcagc 420
aagcagtgtg cgccccgagc cgcgtttctt tcctcactgg caggagacct gacaccaccc 480
gcctgtacga cttcaactcc tactggaggg tgcacgctgg aaacttctcc accatccccc 540
agtacttcaa ggagaatggc tatgtgacca tgtcggtggg aaaagtcttt caccctggga 600
tatcttctaa ccataccgat gattctccgt atagctggtc ttttccacct tatcatcctt 660
cctctgagaa gtatgaaaac actaagacat gtcgagggcc agatggagaa ctccatgcca 720
acctgctttg ccctgtggat gtgctggatg ttcccgaggg caccttgcct gacaaacaga 780
gcactgagca agccatacag ttgttggaaa agatgaaaac gtcagccagt cctttcttcc 840
tggccgttgg gtatcataag ccacacatcc ccttcagata ccccaaggta agggtttaag 900
ggatggttgg ttggtggggt attaatgttt aattacctgg agcacctgcc tgaaatcact 960
ttttttcagg aatttcagaa gttgtatccc ttggagaaca tcaccctggc ccccgatccc 1020
gaggtccctg atggcctacc ccctgtggcc tacaacccct ggatggacat caggcaacgg 1080
gaagacgtcc aagccttaaa catcagtgtg ccgtatggtc caattcctgt ggactttcag 1140
cggaaaatcc gccagagcta ctttgcctct gtgtcatatt tggatacaca ggtcggccgc 1200
ctcttgagtg ctttggacga tcttcagctg gccaacagca ccatcattgc atttacctcg 1260
gatcatgggt gggctctagg tgaacatgga gaatgggcca aatacagcaa ttttgatgtt 1320
gctacccatg ttcccctgat attctatgtt cctggaagga cggcttcact tccggaggca 1380
ggcgagaagc ttttccctta cctcgaccct tttgattccg cctcacagtt gatggagcca 1440
ggcaggcaat ccatggacct tgtggaactt gtgtctcttt ttcccacgct ggctggactt 1500
gcaggactgc aggttccacc tcgctgcccc gttccttcat ttcacgttga gctgtgcaga 1560
gaaggcaaga accttctgaa gcattttcga ttccgtgact tggaagagga tccgtacctc 1620
cctggtaatc cccgtgaact gattgcctat agccagtatc cccggccttc agacatccct 1680
cagtggaatt ctgacaagcc gagtttaaaa gatataaaga tcatgggcta ttccatacgc 1740
accatagact ataggtatac tgtgtgggtt ggcttcaatc ctgatgaatt tctagctaac 1800
ttttctgaca tccatgcagg ggaactgtat tttgtggatt ctgacccatt gcaggatcac 1860
aatatgtata atgattccca aggtggagat cttttccagt tgttgatgcc ttgactcgag 1920
atccagacat gataagatac attgatgagt ttggacaaac cacaactaga atgcagtgaa 1980
aaaaatgctt tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct 2040
gcaataaaca agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg 2100
tgtgggaggt tttttaa 2117
<210> 78
<211> 2526
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleic acid sequence
<400> 78
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180
ggttagggag gtcctgcata tgcggccgca actcacgggg atttccaagt ctccacccca 240
ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg ggactttcca aaatgtcgta 300
ataaccccgc cccgttgacg caaatgggcg gtaggcgtgt acggtgggag gtctatataa 360
gcagagctcg tttagtgaac cgtgccacca tgccgccacc ccggaccggc cgaggccttc 420
tctggctggg tctggttctg agctccgtct gcgtcgccct cggatccgaa acgcaggcca 480
actcgaccac agatgctctg aacgttcttc tcatcatcgt ggatgacctg cgcccctccc 540
tgggctgtta tggggataag ctggtgaggt ccccaaatat tgaccaactg gcatcccaca 600
gcctcctctt ccagaatgcc tttgcgcagc aagcagtgtg cgccccgagc cgcgtttctt 660
tcctcactgg caggagacct gacaccaccc gcctgtacga cttcaactcc tactggaggg 720
tgcacgctgg aaacttctcc accatccccc agtacttcaa ggagaatggc tatgtgacca 780
tgtcggtggg aaaagtcttt caccctggga tatcttctaa ccataccgat gattctccgt 840
atagctggtc ttttccacct tatcatcctt cctctgagaa gtatgaaaac actaagacat 900
gtcgagggcc agatggagaa ctccatgcca acctgctttg ccctgtggat gtgctggatg 960
ttcccgaggg caccttgcct gacaaacaga gcactgagca agccatacag ttgttggaaa 1020
agatgaaaac gtcagccagt cctttcttcc tggccgttgg gtatcataag ccacacatcc 1080
ccttcagata ccccaaggta agggtttaag ggatggttgg ttggtggggt attaatgttt 1140
aattacctgg agcacctgcc tgaaatcact ttttttcagg aatttcagaa gttgtatccc 1200
ttggagaaca tcaccctggc ccccgatccc gaggtccctg atggcctacc ccctgtggcc 1260
tacaacccct ggatggacat caggcaacgg gaagacgtcc aagccttaaa catcagtgtg 1320
ccgtatggtc caattcctgt ggactttcag cggaaaatcc gccagagcta ctttgcctct 1380
gtgtcatatt tggatacaca ggtcggccgc ctcttgagtg ctttggacga tcttcagctg 1440
gccaacagca ccatcattgc atttacctcg gatcatgggt gggctctagg tgaacatgga 1500
gaatgggcca aatacagcaa ttttgatgtt gctacccatg ttcccctgat attctatgtt 1560
cctggaagga cggcttcact tccggaggca ggcgagaagc ttttccctta cctcgaccct 1620
tttgattccg cctcacagtt gatggagcca ggcaggcaat ccatggacct tgtggaactt 1680
gtgtctcttt ttcccacgct ggctggactt gcaggactgc aggttccacc tcgctgcccc 1740
gttccttcat ttcacgttga gctgtgcaga gaaggcaaga accttctgaa gcattttcga 1800
ttccgtgact tggaagagga tccgtacctc cctggtaatc cccgtgaact gattgcctat 1860
agccagtatc cccggccttc agacatccct cagtggaatt ctgacaagcc gagtttaaaa 1920
gatataaaga tcatgggcta ttccatacgc accatagact ataggtatac tgtgtgggtt 1980
ggcttcaatc ctgatgaatt tctagctaac ttttctgaca tccatgcagg ggaactgtat 2040
tttgtggatt ctgacccatt gcaggatcac aatatgtata atgattccca aggtggagat 2100
cttttccagt tgttgatgcc ttgactcgag atccagacat gataagatac attgatgagt 2160
ttggacaaac cacaactaga atgcagtgaa aaaaatgctt tatttgtgaa atttgtgatg 2220
ctattgcttt atttgtaacc attataagct gcaataaaca agttaacaac aacaattgca 2280
ttcattttat gtttcaggtt cagggggagg tgtgggaggt tttttaacct gcaggtctag 2340
atacgtagat aagtagcatg gcgggttaat cattaactac aaggaacccc tagtgatgga 2400
gttggccact ccctctctgc gcgctcgctc gctcactgag gccgggcgac caaaggtcgc 2460
ccgacgcccg ggctttgccc gggcggcctc agtgagcgag cgagcgcgca gagagggagt 2520
ggccaa 2526
Claims (64)
- 재조합 아데노-연관 바이러스(rAAV)로서,
(a) AAV 캡시드 단백질을 포함하는 AAV 캡시드; 및
(b) 인트론을 포함하는 이두로네이트-2-설파타제(IDS) 인트론-삽입 암호화 서열에 작동가능하게 연결된 전사 조절 요소를 포함하는 rAAV 게놈을 포함하는, rAAV. - 1. 제1항에 있어서, 상기 IDS 인트론-삽입 암호화 서열은 인간 IDS 단백질을 암호화하는, rAAV.
- 제1항 또는 제2항에 있어서, 상기 IDS 인트론-삽입 암호화 서열은 서열번호 23에 제시된 아미노산 서열을 암호화하는, rAAV.
- 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 인트론은 이종 인트론인, rAAV.
- 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 인트론은 서열번호 33에 제시된 뉴클레오티드 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 서열 동일성을 갖는, rAAV.
- 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 인트론은 서열번호 24에 제시된 상기 IDS 암호화 서열의 708 및 709 위치에 상응하는 상기 IDS 인트론 삽입 암호화 서열의 뉴클레오티드 사이에 위치하는, rAAV.
- 제1항 내지 제6항 중 어느 한 항에 있어서, 상기 IDS 인트론-삽입 암호화 서열은 서열번호 25, 59 또는 60에 제시된 뉴클레오티드 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 서열 동일성을 갖는 뉴클레오티드 서열을 포함하는, rAAV.
- 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 인트론은 서열번호 26에 제시된 상기 IDS 암호화 서열의 580 및 581 위치에 상응하는 상기 IDS 인트론-삽입 암호화 서열의 뉴클레오티드 사이에 위치하는, rAAV.
- 제8항에 있어서, 상기 IDS 인트론-삽입 암호화 서열은 서열번호 27에 제시된 뉴클레오티드 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 서열 동일성을 갖는 뉴클레오티드 서열을 포함하는, rAAV.
- 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 IDS 인트론-삽입 암호화 서열은 서열번호 25, 27, 59 또는 60에 제시된 뉴클레오티드 서열을 포함하는, rAAV.
- 제1항 내지 제10항 중 어느 한 항에 있어서, 상기 전사 조절 요소는 거대세포바이러스(CMV) 인핸서 요소, 거대세포바이러스(CMV) 프로모터, 닭-β-액틴(CBA) 프로모터, 작은 닭-β-액틴(SmCBA) 프로모터, 글리세르알데히드 3-포스페이트 탈수소효소(GAPDH) 프로모터, 베타-글루쿠로니다아제(GUSB) 프로모터, 변형된 인간 EF-1 프로모터, CALM1 프로모터, 합성 프로모터, 및 이들의 임의의 조합으로 이루어진 군으로부터 선택된 하나 이상의 요소를 포함하는, rAAV.
- 제1항 내지 제11항 중 어느 한 항에 있어서, 상기 전사 조절 요소는 서열번호 29, 30, 36, 39, 40, 41, 42, 44, 46, 47, 48, 또는 55에 제시된 뉴클레오티드 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 서열 동일성을 갖는 뉴클레오티드 서열을 포함하는, rAAV.
- 제1항 내지 제12항 중 어느 한 항에 있어서, 상기 전사 조절 요소는 서열번호 29에 제시된 뉴클레오티드 서열을 포함하는, rAAV.
- 제1항 내지 제13항 중 어느 한 항에 있어서, 상기 rAAV 게놈은 상기 IDS 인트론-삽입 암호화 서열의 3'에 폴리아데닐화 서열을 추가로 포함하는, rAAV.
- 제14항에 있어서, 상기 폴리아데닐화 서열은 외인성 폴리아데닐화 서열인, rAAV.
- 제15항에 있어서, 상기 외인성 폴리아데닐화 서열은 SV40 폴리아데닐화 서열인, rAAV.
- 제16항에 있어서, 상기 SV40 폴리아데닐화 서열은 서열번호 34, 35, 또는 45에 제시된 뉴클레오티드 서열을 포함하는, rAAV.
- 제1항 내지 제17항 중 어느 한 항에 있어서, 상기 rAAV 게놈은 서열번호 37, 43, 52, 54, 61, 63, 65, 69, 75, 또는 77에 제시된 뉴클레오티드 서열을 포함하는, rAAV.
- 제1항 내지 제18항 중 어느 한 항에 있어서, 상기 rAAV 게놈은 5' 역위 말단 반복(5' ITR) 뉴클레오티드 서열 및 3' 역위 말단 반복(3' ITR) 뉴클레오티드 서열을 추가로 포함하는, rAAV.
- 제19항에 있어서, 상기 5' ITR 뉴클레오티드 서열은 서열번호 18, 20 또는 49에 대해 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 서열 동일성을 갖고/갖거나, 상기 3' ITR 뉴클레오티드 서열은 서열번호 14, 19, 21 또는 51에 대해 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 서열 동일성을 갖는, rAAV.
- 제19항에 있어서,
(a) 상기 5' ITR 뉴클레오티드 서열은 서열번호 18에 대해 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 서열 동일성을 가지고, 상기 3' ITR 뉴클레오티드 서열은 서열번호 14에 대해 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 서열 동일성을 가지거나;
(b) 상기 5' ITR 뉴클레오티드 서열은 서열번호 18에 대해 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 서열 동일성을 가지고, 상기 3' ITR 뉴클레오티드 서열은 서열번호 19에 대해 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 서열 동일성을 가지거나;
(c) 상기 5' ITR 뉴클레오티드 서열은 서열번호 18에 대해 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 서열 동일성을 가지고, 상기 3' ITR 뉴클레오티드 서열은 서열번호 51에 대해 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 서열 동일성을 가지거나;
(d) 상기 5' ITR 뉴클레오티드 서열은 서열번호 49에 대해 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 서열 동일성을 가지고, 상기 3' ITR 뉴클레오티드 서열은 서열번호 14에 대해 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 서열 동일성을 가지거나;
(d) 상기 5' ITR 뉴클레오티드 서열은 서열번호 49에 대해 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 서열 동일성을 가지고, 상기 3' ITR 뉴클레오티드 서열은 서열번호 19에 대해 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 서열 동일성을 가지거나;
(f) 상기 5' ITR 뉴클레오티드 서열은 서열번호 49에 대해 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 서열 동일성을 가지고, 상기 3' ITR 뉴클레오티드 서열은 서열번호 51에 대해 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 서열 동일성을 가지거나; 또는
(g) 상기 5' ITR 뉴클레오티드 서열은 서열번호 20에 대해 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 서열 동일성을 가지고, 상기 3' ITR 뉴클레오티드 서열은 서열번호 21에 대해 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 서열 동일성을 가지는, rAAV. - 제19항에 있어서, 상기 5' ITR 뉴클레오티드 서열 및 상기 3' ITR 뉴클레오티드는 각각 서열번호 18 및 14; 18 및 19; 18 및 51; 49 및 14; 49 및 19; 49 및 51; 또는 20 및 21의 서열을 포함하는. rAAV.
- 제1항 내지 제22항 중 어느 한 항에 있어서, 상기 rAAV 게놈은 서열번호 28, 38, 50, 53, 56, 57, 58, 62, 64, 66, 70, 71, 72, 73, 또는 74에 제시된 뉴클레오티드 서열을 포함하는, rAAV.
- 제23항에 있어서, 상기 rAAV 게놈은 서열번호 72 및 74; 72 및 28; 73 및 74; 또는 73 및 28에 제시된 뉴클레오티드 서열을 포함하는, rAAV.
- 제1항 내지 제18항 중 어느 한 항에 있어서, 상기 rAAV 게놈은 자가-상보성인, rAAV.
- 제25항에 있어서, 상기 rAAV 게놈은 서열번호 38, 50, 62, 64, 66, 70, 76, 또는 78에 제시된 뉴클레오티드 서열을 포함하는, rAAV.
- 제1항 내지 제18항 중 어느 한 항에 있어서, 상기 rAAV 게놈은 단일 가닥인, rAAV.
- 제27항에 있어서, 상기 rAAV 게놈은 서열번호 53, 또는 58에 제시된 뉴클레오티드 서열을 포함하는, rAAV.
- 제1항 내지 제28항 중 어느 한 항에 있어서, 상기 AAV 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 203 내지 736의 아미노산 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하는, rAAV.
- 제29항에 있어서, 상기 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질 내의 아미노산이 C이거나; 상기 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 내의 아미노산이 H이거나; 상기 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질 내의 아미노산이 Q이거나; 상기 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 내의 아미노산이 A이거나; 상기 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 내의 아미노산이 N이거나; 상기 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질 내의 아미노산이 S이거나; 상기 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 내의 아미노산이 I이거나; 상기 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 상기 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 상기 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 내의 아미노산이 G 또는 Y이거나; 상기 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 내의 아미노산이 M이거나; 상기 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 상기 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질 내의 아미노산이 K이거나; 상기 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 내의 아미노산이 C이거나; 또는 상기 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 내의 아미노산은 G인, rAAV.
- 제30항에 있어서,
(a) 상기 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 내의 아미노산은 G이고, 상기 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 내의 아미노산은 G이거나;
(b) 상기 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 내의 아미노산은 H이고, 상기 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 내의 아미노산은 N이고, 상기 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산은 R이고, 상기 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 내의 아미노산은 M이거나;
(c) 상기 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산은 R이고, 상기 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 내의 아미노산은 R이거나;
(d) 상기 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 내의 아미노산은 A이고, 상기 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산은 R이거나; 또는
(e) 상기 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 내의 아미노산은 I이고, 상기 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산은 R이고, 상기 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 내의 아미노산은 C인, rAAV. - 제29항에 있어서, 상기 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 203 내지 736의 아미노산 서열을 포함하는, rAAV.
- 제1항 내지 제32항 중 어느 한 항에 있어서, 상기 AAV 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 138 내지 736의 아미노산 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하는, rAAV.
- 제33항에 있어서, 상기 서열번호 16의 아미노산 151에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 상기 서열번호 16의 아미노산 160에 상응하는 캡시드 단백질 내의 아미노산이 D이거나; 상기 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질 내의 아미노산이 C이거나; 상기 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 내의 아미노산이 H이거나; 상기 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질 내의 아미노산이 Q이거나; 상기 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 내의 아미노산이 A이거나; 상기 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 내의 아미노산이 N이거나; 상기 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질 내의 아미노산이 S이거나; 상기 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 내의 아미노산이 I이거나; 상기 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 상기 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 상기 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 내의 아미노산이 G 또는 Y이거나; 상기 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 내의 아미노산이 M이거나; 상기 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 상기 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질 내의 아미노산이 K이거나; 상기 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 내의 아미노산이 C이거나; 상기 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 내의 아미노산이 G인, rAAV.
- 제34항에 있어서,
(a) 상기 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 내의 아미노산은 G이고, 상기 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 내의 아미노산은 G이거나;
(b) 상기 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 내의 아미노산은 H이고, 상기 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 내의 아미노산은 N이고, 상기 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산은 R이고, 상기 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 내의 아미노산은 M이거나;
(c) 상기 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산은 R이고, 상기 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 내의 아미노산은 R이거나;
(d) 상기 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 내의 아미노산은 A이고, 상기 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산은 R이거나; 또는
(e) 상기 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 내의 아미노산은 I이고, 상기 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산은 R이고, 상기 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 내의 아미노산은 C인, rAAV. - 제33항에 있어서, 상기 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 138 내지 736의 아미노산 서열을 포함하는, rAAV.
- 제1항 내지 제36항 중 어느 한 항에 있어서, 상기 AAV 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 1 내지 736의 아미노산 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하는, rAAV.
- 제37항에 있어서, 상기 서열번호 16의 아미노산 2에 상응하는 캡시드 단백질 내의 아미노산이 C이거나; 상기 서열번호 16의 아미노산 65에 상응하는 캡시드 단백질 내의 아미노산이 I이거나; 상기 서열번호 16의 아미노산 68에 상응하는 캡시드 단백질 내의 아미노산이 V이거나; 상기 서열번호 16의 아미노산 77에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 상기 서열번호 16의 아미노산 119에 상응하는 캡시드 단백질 내의 아미노산이 L이거나; 상기 서열번호 16의 아미노산 151에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 상기 서열번호 16의 아미노산 160에 상응하는 캡시드 단백질 내의 아미노산이 D이거나; 상기 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질 내의 아미노산이 C이거나; 상기 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 내의 아미노산이 H이거나; 상기 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질 내의 아미노산이 Q이거나; 상기 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 내의 아미노산이 A이거나; 상기 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 내의 아미노산이 N이거나; 상기 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질 내의 아미노산이 S이거나; 상기 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 내의 아미노산이 I이거나; 상기 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 상기 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 상기 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 내의 아미노산이 G 또는 Y이거나; 상기 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 내의 아미노산이 M이거나; 상기 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 상기 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질 내의 아미노산이 K이거나; 상기 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 내의 아미노산이 C이거나; 상기 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 내의 아미노산이 G인, rAAV.
- 제38항에 있어서,
(a) 상기 서열번호 16의 아미노산 2에 상응하는 캡시드 단백질 내의 아미노산이 T이고, 상기 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질 내의 아미노산이 Q이거나;
(b) 상기 서열번호 16의 아미노산 65에 상응하는 캡시드 단백질 내의 아미노산이 I이고, 상기 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 내의 아미노산이 Y이거나;
(c) 상기 서열번호 16의 아미노산 77에 상응하는 캡시드 단백질 내의 아미노산이 R이고, 상기 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질 내의 아미노산이 K이거나;
(d) 상기 서열번호 16의 아미노산 119에 상응하는 캡시드 단백질 내의 아미노산이 L이고, 상기 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질 내의 아미노산이 S이거나;
(e) 상기 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 내의 아미노산이 G이고, 상기 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 내의 아미노산이 G이거나;
(f) 상기 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 내의 아미노산이 H이고, 상기 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 내의 아미노산이 N이고, 상기 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산이 R이고, 상기 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 내의 아미노산이 M이거나;
(g) 상기 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산이 R이고, 상기 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 내의 아미노산이 R이거나;
(h) 상기 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 내의 아미노산이 A이고, 상기 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산이 R이거나; 또는
(i) 상기 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 내의 아미노산이 I이고, 상기 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 내의 아미노산이 R이고, 상기 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 내의 아미노산은 C인, rAAV. - 제37항에 있어서, 상기 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 1 내지 736의 아미노산 서열을 포함하는, rAAV.
- 세포를 제1항 내지 제40항 중 어느 한 항의 재조합 아데노-연관 바이러스(rAAV)로 형질도입하는 단계를 포함하는, 세포에서 이두로네이트-2-설파타제(IDS) 폴리펩티드를 발현시키는 방법.
- 제41항에 있어서, 상기 세포는 중추 신경계의 세포인, 방법.
- 제41항에 있어서, 상기 세포는 척수, 운동 피질, 감각 피질, 해마, 피각, 소뇌, 선택적으로 소뇌 핵, 및 이들의 임의의 조합으로 이루어진 군으로부터 선택된 중추 신경계 영역의 세포인, 방법.
- 제41항에 있어서, 상기 세포는 뉴런 또는 신경교세포이되, 선택적으로 상기 세포는 상기 중추 신경계 또는 상기 말초 신경계의 뉴런 또는 신경교세포인, 방법.
- 제41항에 있어서, 상기 세포는 운동 뉴런, 성상교세포, 희소돌기교세포, 중추 신경계의 대뇌 피질의 세포, 말초 신경계의 감각 뉴런, 슈반 세포, 및 이들의 임의의 조합으로 이루어진 군으로부터 선택되는, 방법.
- 제41항에 있어서, 상기 세포는 간, 심장, 폐, 신장, 또는 비장의 세포인, 방법.
- 제41항 내지 제46항 중 어느 한 항에 있어서, 상기 세포는 포유류 대상체에 존재하고, 상기 rAAV는 상기 대상체에서 상기 세포를 형질도입하기에 효과적인 양으로 상기 대상체에게 투여되는, 방법.
- 제1항 내지 제40항 중 어느 한 항의 rAAV를 포함하는 약학적 조성물.
- 제1항 내지 제40항 중 어느 한 항의 rAAV 또는 제48항의 약학적 조성물의 유효량을 대상체에게 투여하는 단계를 포함하는 헌터 증후군(HS)을 앓고 있는 대상체를 치료하는 방법.
- 제49항에 있어서, 상기 rAAV 또는 약학적 조성물은 정맥내 투여되는, 방법.
- 제49항 또는 제50항에 있어서, 헌터 증후군(HS)은 이두로네이트-2-설파타제(IDS) 유전자 돌연변이와 연관된, 방법.
- 제49항 내지 제51항 중 어느 한 항에 있어서, 상기 대상체는 인간 대상체인, 방법.
- rAAV의 제조를 위한 패키징 시스템으로서, 상기 패키징 시스템은,
(a) 하나 이상의 AAV Rep 단백질을 암호화하는 제1 뉴클레오티드 서열;
(b) 제1항 내지 제40항 중 어느 한 항의 rAAV의 캡시드 단백질을 암호화하는 제2 뉴클레오티드 서열; 및
(c) 제1항 내지 제40항 중 어느 한 항의 rAAV의 rAAV 게놈 서열을 포함하는 제3 뉴클레오티드 서열을 포함하는, 패키징 시스템. - 제53항에 있어서, 상기 패키징 시스템은 상기 제1 뉴클레오티드 서열 및 상기 제2 뉴클레오티드 서열을 포함하는 제1 벡터, 및 상기 제3 뉴클레오티드 서열을 포함하는 제2 벡터를 포함하는, 패키징 시스템.
- 제53항 또는 제54항에 있어서, 하나 이상의 헬퍼 바이러스 유전자를 포함하는 제4 뉴클레오티드 서열을 추가로 포함하는, 패키징 시스템.
- 제55항에 있어서, 상기 제4 뉴클레오티드 서열은 제3 벡터 내에 포함되는, 패키징 시스템.
- 제55항 또는 제56항에 있어서, 상기 제4 뉴클레오티드 서열은 아데노바이러스, 포진 바이러스, 우두 바이러스, 및 거대세포바이러스(CMV)로 이루어진 군으로부터 선택된 바이러스로부터의 하나 이상의 유전자를 포함하는, 패키징 시스템.
- 제53항 내지 제57항 중 어느 한 항에 있어서, 상기 제1 벡터, 제2 벡터, 및/또는 상기 제3 벡터는 플라스미드인, 패키징 시스템.
- 상기 rAAV가 생성되는 조건 하에서 제53항 내지 제58항 중 어느 한 항의 패키징 시스템을 세포 내에 도입하는 단계를 포함하는 rAAV의 재조합 제조 방법.
- 서열번호 25, 26, 27, 37, 38, 43, 50, 52, 53, 54, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 75, 76, 77, 또는 78에 제시된 뉴클레오티드 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 서열 동일성을 갖는 핵산 서열을 포함하는 폴리뉴클레오티드로서, 선택적으로 상기 폴리뉴클레오티드는 바이러스 벡터 또는 플라스미드 벡터 내에 포함되는, 폴리뉴클레오티드.
- 제60항의 폴리뉴클레오티드를 포함하는 재조합 세포.
- 제1항 내지 제40항 중 어느 한 항의 rAAV, 제48항의 약학적 조성물, 제60항의 폴리뉴클레오티드 또는 제61항의 재조합 세포의 의약으로서 용도.
- 제1항 내지 제40항 중 어느 한 항의 rAAV, 제48항의 약학적 조성물, 제60항의 폴리뉴클레오티드 또는 제61항의 재조합 세포의 헌터 증후군(HS)의 치료에서의 용도.
- 제1항 내지 제40항 중 어느 한 항의 rAAV, 제48항의 약학적 조성물, 제60항의 폴리뉴클레오티드 또는 제61항의 재조합 세포의 헌터 증후군(HS)을 갖는 대상체를 치료하는 방법에서의 용도로서, 상기 방법은 상기 rAAV, 상기 약학적 조성물, 상기 폴리뉴클레오티드, 또는 상기 세포의 유효량을 상기 대상체에게 투여하는 단계를 포함하는 것인, 용도.
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063005833P | 2020-04-06 | 2020-04-06 | |
US63/005,833 | 2020-04-06 | ||
US202063094800P | 2020-10-21 | 2020-10-21 | |
US63/094,800 | 2020-10-21 | ||
US202163145258P | 2021-02-03 | 2021-02-03 | |
US63/145,258 | 2021-02-03 | ||
PCT/US2021/025785 WO2021207077A1 (en) | 2020-04-06 | 2021-04-05 | Adeno-associated virus compositions for ids gene transfer and methods of use thereof |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20220164743A true KR20220164743A (ko) | 2022-12-13 |
Family
ID=78022877
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227037747A KR20220164743A (ko) | 2020-04-06 | 2021-04-05 | Ids 유전자 전달을 위한 아데노-연관 바이러스 조성물 및 이의 사용 방법 |
Country Status (13)
Country | Link |
---|---|
US (1) | US20210361778A1 (ko) |
EP (1) | EP4132562A4 (ko) |
JP (1) | JP2023522852A (ko) |
KR (1) | KR20220164743A (ko) |
CN (1) | CN115484975A (ko) |
AU (1) | AU2021252515A1 (ko) |
BR (1) | BR112022019182A2 (ko) |
CA (1) | CA3173207A1 (ko) |
CO (1) | CO2022013833A2 (ko) |
IL (1) | IL296986A (ko) |
MX (1) | MX2022012407A (ko) |
TW (1) | TW202204629A (ko) |
WO (1) | WO2021207077A1 (ko) |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1071806B1 (en) * | 1998-04-24 | 2004-06-16 | University of Florida | Recombinant adeno-associated viral vector encoding alpha-1-antitrypsin for gene therapy |
AU2002350039A1 (en) * | 2001-10-29 | 2003-05-12 | Renovis, Inc. | Method for isolating cell-type specific mrnas |
ES2566641T3 (es) * | 2003-02-11 | 2016-04-14 | Shire Human Genetic Therapies, Inc. | Células que co-expresan una enzima que genera a una sulfatasa y una C-formiliglicina y sus métodos y usos |
US8628966B2 (en) * | 2010-04-30 | 2014-01-14 | City Of Hope | CD34-derived recombinant adeno-associated vectors for stem cell transduction and systemic therapeutic gene transfer |
US20180127733A9 (en) * | 2010-11-12 | 2018-05-10 | Green Cross Corporation | Iduronate-2-sulfatase and use thereof |
AU2013243953A1 (en) * | 2012-04-02 | 2014-10-30 | Modernatx, Inc. | Modified polynucleotides for the production of nuclear proteins |
US11072801B2 (en) * | 2014-01-21 | 2021-07-27 | Vrije Universiteit Brussel | Muscle-specific nucleic acid regulatory elements and methods and use thereof |
EP3116533B1 (en) * | 2014-03-12 | 2020-08-12 | Precision Biosciences, Inc. | Dystrophin gene exon deletion using engineered nucleases |
EP3101125A1 (en) * | 2015-06-05 | 2016-12-07 | Laboratorios Del Dr. Esteve, S.A. | Adenoassociated virus vectors for the treatment of mucopolysaccharidoses |
KR20190008237A (ko) * | 2016-04-15 | 2019-01-23 | 더 트러스티스 오브 더 유니버시티 오브 펜실바니아 | Ii형 점액다당류증의 치료를 위한 유전자 요법 |
US11530402B2 (en) * | 2017-05-31 | 2022-12-20 | The University Of North Carolina At Chapel Hill | Optimized human clotting factor IX gene expression cassettes and their use |
KR20200095462A (ko) * | 2017-10-18 | 2020-08-10 | 시티 오브 호프 | Hbb 유전자 기능 회복을 위한 아데노-연관 바이러스 조성물 및 이의 사용 방법 |
PE20212076A1 (es) * | 2018-02-01 | 2021-10-26 | Homology Medicines Inc | Composiciones de virus adeno-asociado para restaurar la funcion del gen pah y metodos de uso de las mismas |
MX2022007135A (es) * | 2019-12-10 | 2022-09-19 | Takeda Pharmaceuticals Co | Vectores de virus adenoasociados para el tratamiento del síndrome de hunter. |
-
2021
- 2021-04-05 AU AU2021252515A patent/AU2021252515A1/en active Pending
- 2021-04-05 IL IL296986A patent/IL296986A/en unknown
- 2021-04-05 BR BR112022019182A patent/BR112022019182A2/pt not_active Application Discontinuation
- 2021-04-05 CN CN202180032848.0A patent/CN115484975A/zh active Pending
- 2021-04-05 WO PCT/US2021/025785 patent/WO2021207077A1/en unknown
- 2021-04-05 US US17/222,659 patent/US20210361778A1/en not_active Abandoned
- 2021-04-05 EP EP21783859.8A patent/EP4132562A4/en active Pending
- 2021-04-05 KR KR1020227037747A patent/KR20220164743A/ko unknown
- 2021-04-05 JP JP2022561161A patent/JP2023522852A/ja active Pending
- 2021-04-05 MX MX2022012407A patent/MX2022012407A/es unknown
- 2021-04-05 CA CA3173207A patent/CA3173207A1/en active Pending
- 2021-04-06 TW TW110112432A patent/TW202204629A/zh unknown
-
2022
- 2022-09-27 CO CONC2022/0013833A patent/CO2022013833A2/es unknown
Also Published As
Publication number | Publication date |
---|---|
AU2021252515A1 (en) | 2022-10-27 |
CN115484975A (zh) | 2022-12-16 |
CO2022013833A2 (es) | 2022-10-31 |
TW202204629A (zh) | 2022-02-01 |
IL296986A (en) | 2022-12-01 |
US20210361778A1 (en) | 2021-11-25 |
BR112022019182A2 (pt) | 2022-11-29 |
MX2022012407A (es) | 2022-10-28 |
JP2023522852A (ja) | 2023-06-01 |
EP4132562A1 (en) | 2023-02-15 |
EP4132562A4 (en) | 2024-04-17 |
CA3173207A1 (en) | 2021-10-14 |
WO2021207077A1 (en) | 2021-10-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102584873B1 (ko) | 심부 인트론 돌연변이의 유전자 편집 | |
KR102116378B1 (ko) | 척수성 근위축증을 치료하기 위한 조성물 및 방법 | |
US6193980B1 (en) | Replication defective herpes simplex virus comprising heterologous inserts | |
KR20210103469A (ko) | 재조합 바이러스 벡터 및 이를 생산하기 위한 핵산 | |
US20220056478A1 (en) | Adeno-associated virus vectors for treatment of rett syndrome | |
CN113584043B (zh) | 用于治疗视网膜疾病和癌症的转基因表达盒 | |
CN114026115A (zh) | 用于溶酶体病症的基因疗法 | |
CN113480615B (zh) | 高视网膜亲和性的新型腺相关病毒衣壳蛋白及其应用 | |
CN113563430B (zh) | 用于治疗眼部疾病的基因递送系统及其应用 | |
KR20220140537A (ko) | Cdkl5 결핍 장애를 치료하기 위한 유전자 요법 | |
KR20210144696A (ko) | 라민병증 치료용 조성물 및 치료 방법 | |
CN113564187A (zh) | 基于aav的抗血管生成基因递送系统及其用途 | |
CN117545842A (zh) | SMN1和miR-23a在治疗脊髓性肌萎缩中的协同效应 | |
KR20230044522A (ko) | 척수성 근위축을 치료하기 위한 핵산 구축물 및 이의 용도 | |
CN115803441A (zh) | 用于恢复pah基因功能的腺相关病毒组合物和其使用方法 | |
KR20220007601A (ko) | 치료제 투여를 위한 조성물 및 방법 | |
JP2022536338A (ja) | Arsa遺伝子移入のためのアデノ随伴ウイルス組成物およびその使用方法 | |
CA3136004A1 (en) | Gene therapies for lysosomal disorders | |
KR20220164743A (ko) | Ids 유전자 전달을 위한 아데노-연관 바이러스 조성물 및 이의 사용 방법 | |
CN115029360A (zh) | 用于治疗粘多糖贮积症iiia型的转基因表达盒 | |
WO2022226183A2 (en) | Optimized ap4m1 polynucleotides and expression cassettes and their use | |
KR20210130578A (ko) | 폐섬유증 치료 또는 예방을 위한 세포 치료제 조성물 | |
US20240131192A1 (en) | Gene therapy for trem2-associated diseases and disorders | |
KR20230038503A (ko) | 샤르코-마리-투스 질환의 치료에 유용한 조성물 |