KR20240025645A - 아데노-연관된 바이러스 패키징 시스템 - Google Patents
아데노-연관된 바이러스 패키징 시스템 Download PDFInfo
- Publication number
- KR20240025645A KR20240025645A KR1020247002671A KR20247002671A KR20240025645A KR 20240025645 A KR20240025645 A KR 20240025645A KR 1020247002671 A KR1020247002671 A KR 1020247002671A KR 20247002671 A KR20247002671 A KR 20247002671A KR 20240025645 A KR20240025645 A KR 20240025645A
- Authority
- KR
- South Korea
- Prior art keywords
- amino acid
- nucleic acid
- promoter
- vector
- gly
- Prior art date
Links
- 241000702421 Dependoparvovirus Species 0.000 title claims abstract description 37
- 238000004806 packaging method and process Methods 0.000 title claims description 154
- 239000013598 vector Substances 0.000 claims abstract description 608
- 108090000565 Capsid Proteins Proteins 0.000 claims abstract description 517
- 102100023321 Ceruloplasmin Human genes 0.000 claims abstract description 517
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 384
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 372
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 372
- 239000002773 nucleotide Substances 0.000 claims abstract description 286
- 125000003729 nucleotide group Chemical group 0.000 claims abstract description 286
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 221
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 107
- 108700019146 Transgenes Proteins 0.000 claims abstract description 104
- 241000700605 Viruses Species 0.000 claims abstract description 104
- 238000004519 manufacturing process Methods 0.000 claims abstract description 99
- 210000004027 cell Anatomy 0.000 claims description 281
- 238000000034 method Methods 0.000 claims description 110
- 108700029229 Transcriptional Regulatory Elements Proteins 0.000 claims description 75
- 108020004414 DNA Proteins 0.000 claims description 74
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 58
- 108091026890 Coding region Proteins 0.000 claims description 47
- 241000701161 unidentified adenovirus Species 0.000 claims description 46
- 239000013612 plasmid Substances 0.000 claims description 45
- 241000702423 Adeno-associated virus - 2 Species 0.000 claims description 40
- 210000004962 mammalian cell Anatomy 0.000 claims description 36
- 230000008488 polyadenylation Effects 0.000 claims description 36
- 238000004113 cell culture Methods 0.000 claims description 34
- 230000001965 increasing effect Effects 0.000 claims description 28
- 241000701022 Cytomegalovirus Species 0.000 claims description 20
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 18
- DIGQNXIGRZPYDK-WKSCXVIASA-N (2R)-6-amino-2-[[2-[[(2S)-2-[[2-[[(2R)-2-[[(2S)-2-[[(2R,3S)-2-[[2-[[(2S)-2-[[2-[[(2S)-2-[[(2S)-2-[[(2R)-2-[[(2S,3S)-2-[[(2R)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[2-[[(2S)-2-[[(2R)-2-[[2-[[2-[[2-[(2-amino-1-hydroxyethylidene)amino]-3-carboxy-1-hydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1,5-dihydroxy-5-iminopentylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]hexanoic acid Chemical compound C[C@@H]([C@@H](C(=N[C@@H](CS)C(=N[C@@H](C)C(=N[C@@H](CO)C(=NCC(=N[C@@H](CCC(=N)O)C(=NC(CS)C(=N[C@H]([C@H](C)O)C(=N[C@H](CS)C(=N[C@H](CO)C(=NCC(=N[C@H](CS)C(=NCC(=N[C@H](CCCCN)C(=O)O)O)O)O)O)O)O)O)O)O)O)O)O)O)N=C([C@H](CS)N=C([C@H](CO)N=C([C@H](CO)N=C([C@H](C)N=C(CN=C([C@H](CO)N=C([C@H](CS)N=C(CN=C(C(CS)N=C(C(CC(=O)O)N=C(CN)O)O)O)O)O)O)O)O)O)O)O)O DIGQNXIGRZPYDK-WKSCXVIASA-N 0.000 claims description 17
- 241000238631 Hexapoda Species 0.000 claims description 17
- 102000003792 Metallothionein Human genes 0.000 claims description 17
- 108090000157 Metallothionein Proteins 0.000 claims description 17
- 102000011755 Phosphoglycerate Kinase Human genes 0.000 claims description 16
- 101001099217 Thermotoga maritima (strain ATCC 43589 / DSM 3109 / JCM 10099 / NBRC 100826 / MSB8) Triosephosphate isomerase Proteins 0.000 claims description 16
- 230000001939 inductive effect Effects 0.000 claims description 16
- 241001529453 unidentified herpesvirus Species 0.000 claims description 14
- 241001634120 Adeno-associated virus - 5 Species 0.000 claims description 13
- UPEZCKBFRMILAV-JNEQICEOSA-N Ecdysone Natural products O=C1[C@H]2[C@@](C)([C@@H]3C([C@@]4(O)[C@@](C)([C@H]([C@H]([C@@H](O)CCC(O)(C)C)C)CC4)CC3)=C1)C[C@H](O)[C@H](O)C2 UPEZCKBFRMILAV-JNEQICEOSA-N 0.000 claims description 13
- UPEZCKBFRMILAV-UHFFFAOYSA-N alpha-Ecdysone Natural products C1C(O)C(O)CC2(C)C(CCC3(C(C(C(O)CCC(C)(C)O)C)CCC33O)C)C3=CC(=O)C21 UPEZCKBFRMILAV-UHFFFAOYSA-N 0.000 claims description 13
- UPEZCKBFRMILAV-JMZLNJERSA-N ecdysone Chemical compound C1[C@@H](O)[C@@H](O)C[C@]2(C)[C@@H](CC[C@@]3([C@@H]([C@@H]([C@H](O)CCC(C)(C)O)C)CC[C@]33O)C)C3=CC(=O)[C@@H]21 UPEZCKBFRMILAV-JMZLNJERSA-N 0.000 claims description 13
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 13
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 12
- 241001655883 Adeno-associated virus - 1 Species 0.000 claims description 11
- 241000972680 Adeno-associated virus - 6 Species 0.000 claims description 11
- 241001164825 Adeno-associated virus - 8 Species 0.000 claims description 11
- 241000713333 Mouse mammary tumor virus Species 0.000 claims description 11
- -1 antagomir Proteins 0.000 claims description 11
- 229920001184 polypeptide Polymers 0.000 claims description 11
- 108020004999 messenger RNA Proteins 0.000 claims description 10
- 102000003869 Frataxin Human genes 0.000 claims description 9
- 108090000217 Frataxin Proteins 0.000 claims description 9
- 102000003638 Glucose-6-Phosphatase Human genes 0.000 claims description 9
- 108010086800 Glucose-6-Phosphatase Proteins 0.000 claims description 9
- 108091070501 miRNA Proteins 0.000 claims description 8
- 239000002679 microRNA Substances 0.000 claims description 8
- 241000701447 unidentified baculovirus Species 0.000 claims description 8
- 101001042049 Human herpesvirus 1 (strain 17) Transcriptional regulator ICP22 Proteins 0.000 claims description 7
- 101000999690 Human herpesvirus 2 (strain HG52) E3 ubiquitin ligase ICP22 Proteins 0.000 claims description 7
- 101150027427 ICP4 gene Proteins 0.000 claims description 7
- 101150090364 ICP0 gene Proteins 0.000 claims description 6
- 108010022394 Threonine synthase Proteins 0.000 claims description 6
- 101150068034 UL30 gene Proteins 0.000 claims description 6
- 101150099321 UL42 gene Proteins 0.000 claims description 6
- 101000756604 Xenopus laevis Actin, cytoplasmic 1 Proteins 0.000 claims description 6
- 210000004978 chinese hamster ovary cell Anatomy 0.000 claims description 6
- 102000004419 dihydrofolate reductase Human genes 0.000 claims description 6
- 210000003501 vero cell Anatomy 0.000 claims description 6
- 241000202702 Adeno-associated virus - 3 Species 0.000 claims description 5
- 241000580270 Adeno-associated virus - 4 Species 0.000 claims description 5
- 241001164823 Adeno-associated virus - 7 Species 0.000 claims description 5
- 108020005544 Antisense RNA Proteins 0.000 claims description 4
- 108090000994 Catalytic RNA Proteins 0.000 claims description 4
- 102000053642 Catalytic RNA Human genes 0.000 claims description 4
- 108020005004 Guide RNA Proteins 0.000 claims description 4
- 108020005198 Long Noncoding RNA Proteins 0.000 claims description 4
- 108091008103 RNA aptamers Proteins 0.000 claims description 4
- 108091027967 Small hairpin RNA Proteins 0.000 claims description 4
- 108020004459 Small interfering RNA Proteins 0.000 claims description 4
- 239000003184 complementary RNA Substances 0.000 claims description 4
- 108091092562 ribozyme Proteins 0.000 claims description 4
- 239000002924 silencing RNA Substances 0.000 claims description 4
- 239000004055 small Interfering RNA Substances 0.000 claims description 4
- 108091027963 non-coding RNA Proteins 0.000 claims description 3
- 102000042567 non-coding RNA Human genes 0.000 claims description 3
- 206010028980 Neoplasm Diseases 0.000 claims 2
- 210000000481 breast Anatomy 0.000 claims 2
- 238000001890 transfection Methods 0.000 abstract description 193
- 230000009977 dual effect Effects 0.000 abstract description 76
- 239000003795 chemical substances by application Substances 0.000 abstract description 2
- 150000001413 amino acids Chemical class 0.000 description 916
- 210000000234 capsid Anatomy 0.000 description 95
- 102100021244 Integral membrane protein GPR180 Human genes 0.000 description 59
- 230000014509 gene expression Effects 0.000 description 36
- 101100524317 Adeno-associated virus 2 (isolate Srivastava/1982) Rep40 gene Proteins 0.000 description 22
- 101100524319 Adeno-associated virus 2 (isolate Srivastava/1982) Rep52 gene Proteins 0.000 description 22
- 101100524321 Adeno-associated virus 2 (isolate Srivastava/1982) Rep68 gene Proteins 0.000 description 22
- 101100524324 Adeno-associated virus 2 (isolate Srivastava/1982) Rep78 gene Proteins 0.000 description 22
- 102100038313 Transcription factor E2-alpha Human genes 0.000 description 21
- 108010069013 Phenylalanine Hydroxylase Proteins 0.000 description 19
- 102100038223 Phenylalanine-4-hydroxylase Human genes 0.000 description 19
- 108091034131 VA RNA Proteins 0.000 description 19
- 229920002873 Polyethylenimine Polymers 0.000 description 16
- 238000013461 design Methods 0.000 description 16
- 239000006166 lysate Substances 0.000 description 15
- 239000000203 mixture Substances 0.000 description 15
- 238000013518 transcription Methods 0.000 description 15
- 230000035897 transcription Effects 0.000 description 15
- 239000013607 AAV vector Substances 0.000 description 14
- 102100022146 Arylsulfatase A Human genes 0.000 description 14
- 108010036867 Cerebroside-Sulfatase Proteins 0.000 description 14
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 14
- 238000011304 droplet digital PCR Methods 0.000 description 14
- 102100029199 Iduronate 2-sulfatase Human genes 0.000 description 12
- 101710096421 Iduronate 2-sulfatase Proteins 0.000 description 12
- 230000001976 improved effect Effects 0.000 description 12
- 230000010076 replication Effects 0.000 description 12
- 101710163270 Nuclease Proteins 0.000 description 11
- 238000003306 harvesting Methods 0.000 description 11
- 239000013604 expression vector Substances 0.000 description 10
- 238000004458 analytical method Methods 0.000 description 9
- 108091033409 CRISPR Proteins 0.000 description 8
- 238000002965 ELISA Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 239000002609 medium Substances 0.000 description 8
- 210000001519 tissue Anatomy 0.000 description 8
- 230000003612 virological effect Effects 0.000 description 8
- 101000834253 Gallus gallus Actin, cytoplasmic 1 Proteins 0.000 description 7
- 241000700584 Simplexvirus Species 0.000 description 7
- 238000005119 centrifugation Methods 0.000 description 7
- 239000012634 fragment Substances 0.000 description 7
- 108091033319 polynucleotide Proteins 0.000 description 7
- 102000040430 polynucleotide Human genes 0.000 description 7
- 239000002157 polynucleotide Substances 0.000 description 7
- 108020004705 Codon Proteins 0.000 description 6
- 238000013103 analytical ultracentrifugation Methods 0.000 description 6
- RWSXRVCMGQZWBV-WDSKDSINSA-N glutathione Chemical compound OC(=O)[C@@H](N)CCC(=O)N[C@@H](CS)C(=O)NCC(O)=O RWSXRVCMGQZWBV-WDSKDSINSA-N 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 5
- 101000823116 Homo sapiens Alpha-1-antitrypsin Proteins 0.000 description 5
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 5
- 108010025020 Nerve Growth Factor Proteins 0.000 description 5
- 239000003623 enhancer Substances 0.000 description 5
- 108020001507 fusion proteins Proteins 0.000 description 5
- 102000037865 fusion proteins Human genes 0.000 description 5
- 102000051631 human SERPINA1 Human genes 0.000 description 5
- 210000004185 liver Anatomy 0.000 description 5
- 238000011002 quantification Methods 0.000 description 5
- 101150075174 E1B gene Proteins 0.000 description 4
- 102100021519 Hemoglobin subunit beta Human genes 0.000 description 4
- 108090001007 Interleukin-8 Proteins 0.000 description 4
- 102000004890 Interleukin-8 Human genes 0.000 description 4
- 102100033342 Lysosomal acid glucosylceramidase Human genes 0.000 description 4
- 108010079364 N-glycylalanine Proteins 0.000 description 4
- 102000015336 Nerve Growth Factor Human genes 0.000 description 4
- 230000002391 anti-complement effect Effects 0.000 description 4
- 108010008730 anticomplement Proteins 0.000 description 4
- 230000000295 complement effect Effects 0.000 description 4
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 4
- 210000005260 human cell Anatomy 0.000 description 4
- 229940053128 nerve growth factor Drugs 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 102000005962 receptors Human genes 0.000 description 4
- 108020003175 receptors Proteins 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 230000002103 transcriptional effect Effects 0.000 description 4
- 230000014616 translation Effects 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- 101150026402 DBP gene Proteins 0.000 description 3
- 102000004190 Enzymes Human genes 0.000 description 3
- 108090000790 Enzymes Proteins 0.000 description 3
- 241000588724 Escherichia coli Species 0.000 description 3
- 108010024636 Glutathione Proteins 0.000 description 3
- 108091005904 Hemoglobin subunit beta Proteins 0.000 description 3
- 241000700588 Human alphaherpesvirus 1 Species 0.000 description 3
- 241000046923 Human bocavirus Species 0.000 description 3
- 241001366106 Human bocavirus 1 Species 0.000 description 3
- 241000341655 Human papillomavirus type 16 Species 0.000 description 3
- 241000699666 Mus <mouse, genus> Species 0.000 description 3
- 241000699670 Mus sp. Species 0.000 description 3
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 3
- 241001631646 Papillomaviridae Species 0.000 description 3
- 108091081024 Start codon Proteins 0.000 description 3
- NMCBVGFGWSIGSB-NUTKFTJISA-N Trp-Ala-Leu Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N NMCBVGFGWSIGSB-NUTKFTJISA-N 0.000 description 3
- 108060008682 Tumor Necrosis Factor Proteins 0.000 description 3
- 101150011902 UL52 gene Proteins 0.000 description 3
- 108090000848 Ubiquitin Proteins 0.000 description 3
- 102000044159 Ubiquitin Human genes 0.000 description 3
- 230000000692 anti-sense effect Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 102000005936 beta-Galactosidase Human genes 0.000 description 3
- 108010005774 beta-Galactosidase Proteins 0.000 description 3
- 230000027455 binding Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 210000004556 brain Anatomy 0.000 description 3
- 238000003776 cleavage reaction Methods 0.000 description 3
- 229940088598 enzyme Drugs 0.000 description 3
- 238000010362 genome editing Methods 0.000 description 3
- 229960003180 glutathione Drugs 0.000 description 3
- 230000006801 homologous recombination Effects 0.000 description 3
- 238000002744 homologous recombination Methods 0.000 description 3
- 208000015181 infectious disease Diseases 0.000 description 3
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 238000011031 large-scale manufacturing process Methods 0.000 description 3
- VLKZOEOYAKHREP-UHFFFAOYSA-N n-Hexane Chemical compound CCCCCC VLKZOEOYAKHREP-UHFFFAOYSA-N 0.000 description 3
- 230000001105 regulatory effect Effects 0.000 description 3
- 230000007017 scission Effects 0.000 description 3
- 238000004062 sedimentation Methods 0.000 description 3
- 210000002966 serum Anatomy 0.000 description 3
- 238000010561 standard procedure Methods 0.000 description 3
- 230000008093 supporting effect Effects 0.000 description 3
- 230000002463 transducing effect Effects 0.000 description 3
- NMWKYTGJWUAZPZ-WWHBDHEGSA-N (4S)-4-[[(4R,7S,10S,16S,19S,25S,28S,31R)-31-[[(2S)-2-[[(1R,6R,9S,12S,18S,21S,24S,27S,30S,33S,36S,39S,42R,47R,53S,56S,59S,62S,65S,68S,71S,76S,79S,85S)-47-[[(2S)-2-[[(2S)-4-amino-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-amino-3-methylbutanoyl]amino]-3-methylbutanoyl]amino]-3-hydroxypropanoyl]amino]-3-(1H-imidazol-4-yl)propanoyl]amino]-3-phenylpropanoyl]amino]-4-oxobutanoyl]amino]-3-carboxypropanoyl]amino]-18-(4-aminobutyl)-27,68-bis(3-amino-3-oxopropyl)-36,71,76-tribenzyl-39-(3-carbamimidamidopropyl)-24-(2-carboxyethyl)-21,56-bis(carboxymethyl)-65,85-bis[(1R)-1-hydroxyethyl]-59-(hydroxymethyl)-62,79-bis(1H-imidazol-4-ylmethyl)-9-methyl-33-(2-methylpropyl)-8,11,17,20,23,26,29,32,35,38,41,48,54,57,60,63,66,69,72,74,77,80,83,86-tetracosaoxo-30-propan-2-yl-3,4,44,45-tetrathia-7,10,16,19,22,25,28,31,34,37,40,49,55,58,61,64,67,70,73,75,78,81,84,87-tetracosazatetracyclo[40.31.14.012,16.049,53]heptaoctacontane-6-carbonyl]amino]-3-methylbutanoyl]amino]-7-(3-carbamimidamidopropyl)-25-(hydroxymethyl)-19-[(4-hydroxyphenyl)methyl]-28-(1H-imidazol-4-ylmethyl)-10-methyl-6,9,12,15,18,21,24,27,30-nonaoxo-16-propan-2-yl-1,2-dithia-5,8,11,14,17,20,23,26,29-nonazacyclodotriacontane-4-carbonyl]amino]-5-[[(2S)-1-[[(2S)-1-[[(2S)-3-carboxy-1-[[(2S)-1-[[(2S)-1-[[(1S)-1-carboxyethyl]amino]-4-methyl-1-oxopentan-2-yl]amino]-4-methyl-1-oxopentan-2-yl]amino]-1-oxopropan-2-yl]amino]-1-oxopropan-2-yl]amino]-3-(1H-imidazol-4-yl)-1-oxopropan-2-yl]amino]-5-oxopentanoic acid Chemical compound CC(C)C[C@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](Cc1c[nH]cn1)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CSSC[C@H](NC(=O)[C@@H](NC(=O)[C@@H]2CSSC[C@@H]3NC(=O)[C@H](Cc4ccccc4)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](NC(=O)[C@H](Cc4c[nH]cn4)NC(=O)[C@H](CO)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]4CCCN4C(=O)[C@H](CSSC[C@H](NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](Cc4c[nH]cn4)NC(=O)[C@H](Cc4ccccc4)NC3=O)[C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](Cc3ccccc3)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N3CCC[C@H]3C(=O)N[C@@H](C)C(=O)N2)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](Cc2ccccc2)NC(=O)[C@H](Cc2c[nH]cn2)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)C(C)C)[C@@H](C)O)C(C)C)C(=O)N[C@@H](Cc2c[nH]cn2)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](Cc2ccc(O)cc2)C(=O)N[C@@H](C(C)C)C(=O)NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N1)C(=O)N[C@@H](C)C(O)=O NMWKYTGJWUAZPZ-WWHBDHEGSA-N 0.000 description 2
- 241000649045 Adeno-associated virus 10 Species 0.000 description 2
- 241000649046 Adeno-associated virus 11 Species 0.000 description 2
- 241000649047 Adeno-associated virus 12 Species 0.000 description 2
- VCSABYLVNWQYQE-SRVKXCTJSA-N Ala-Lys-Lys Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O VCSABYLVNWQYQE-SRVKXCTJSA-N 0.000 description 2
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 2
- 102100022987 Angiogenin Human genes 0.000 description 2
- 101710095342 Apolipoprotein B Proteins 0.000 description 2
- 102100040202 Apolipoprotein B-100 Human genes 0.000 description 2
- 208000010061 Autosomal Dominant Polycystic Kidney Diseases 0.000 description 2
- 102100026031 Beta-glucuronidase Human genes 0.000 description 2
- 102000007350 Bone Morphogenetic Proteins Human genes 0.000 description 2
- 108010007726 Bone Morphogenetic Proteins Proteins 0.000 description 2
- 102000004219 Brain-derived neurotrophic factor Human genes 0.000 description 2
- 108090000715 Brain-derived neurotrophic factor Proteins 0.000 description 2
- 101100348617 Candida albicans (strain SC5314 / ATCC MYA-2876) NIK1 gene Proteins 0.000 description 2
- 108010035563 Chloramphenicol O-acetyltransferase Proteins 0.000 description 2
- 108010005939 Ciliary Neurotrophic Factor Proteins 0.000 description 2
- 102100031614 Ciliary neurotrophic factor Human genes 0.000 description 2
- 102000007644 Colony-Stimulating Factors Human genes 0.000 description 2
- 108010071942 Colony-Stimulating Factors Proteins 0.000 description 2
- 108020004635 Complementary DNA Proteins 0.000 description 2
- 102000001039 Dystrophin Human genes 0.000 description 2
- 108010069091 Dystrophin Proteins 0.000 description 2
- 108010054218 Factor VIII Proteins 0.000 description 2
- 102000001690 Factor VIII Human genes 0.000 description 2
- 102000003972 Fibroblast growth factor 7 Human genes 0.000 description 2
- 108090000385 Fibroblast growth factor 7 Proteins 0.000 description 2
- 102000012673 Follicle Stimulating Hormone Human genes 0.000 description 2
- 108010079345 Follicle Stimulating Hormone Proteins 0.000 description 2
- 102000053171 Glial Fibrillary Acidic Human genes 0.000 description 2
- 102000034615 Glial cell line-derived neurotrophic factor Human genes 0.000 description 2
- 108091010837 Glial cell line-derived neurotrophic factor Proteins 0.000 description 2
- 101710193519 Glial fibrillary acidic protein Proteins 0.000 description 2
- 108010017544 Glucosylceramidase Proteins 0.000 description 2
- 102000007390 Glycogen Phosphorylase Human genes 0.000 description 2
- 108010046163 Glycogen Phosphorylase Proteins 0.000 description 2
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 2
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 2
- 102000004858 Growth differentiation factor-9 Human genes 0.000 description 2
- 108090001086 Growth differentiation factor-9 Proteins 0.000 description 2
- 101150064935 HELI gene Proteins 0.000 description 2
- 101710154606 Hemagglutinin Proteins 0.000 description 2
- 102000001554 Hemoglobins Human genes 0.000 description 2
- 108010054147 Hemoglobins Proteins 0.000 description 2
- 108090000100 Hepatocyte Growth Factor Proteins 0.000 description 2
- 102100021866 Hepatocyte growth factor Human genes 0.000 description 2
- 102100031000 Hepatoma-derived growth factor Human genes 0.000 description 2
- 101000933465 Homo sapiens Beta-glucuronidase Proteins 0.000 description 2
- 101000982010 Homo sapiens Myelin proteolipid protein Proteins 0.000 description 2
- 102000019223 Interleukin-1 receptor Human genes 0.000 description 2
- 108050006617 Interleukin-1 receptor Proteins 0.000 description 2
- 108010001831 LDL receptors Proteins 0.000 description 2
- 102000004058 Leukemia inhibitory factor Human genes 0.000 description 2
- 108090000581 Leukemia inhibitory factor Proteins 0.000 description 2
- 102100024640 Low-density lipoprotein receptor Human genes 0.000 description 2
- 108010072388 Methyl-CpG-Binding Protein 2 Proteins 0.000 description 2
- 102100039124 Methyl-CpG-binding protein 2 Human genes 0.000 description 2
- 241001529936 Murinae Species 0.000 description 2
- 108010052185 Myotonin-Protein Kinase Proteins 0.000 description 2
- 102100022437 Myotonin-protein kinase Human genes 0.000 description 2
- 102000007530 Neurofibromin 1 Human genes 0.000 description 2
- 108010085793 Neurofibromin 1 Proteins 0.000 description 2
- 108090000742 Neurotrophin 3 Proteins 0.000 description 2
- 102100029268 Neurotrophin-3 Human genes 0.000 description 2
- 241000283973 Oryctolagus cuniculus Species 0.000 description 2
- 101710093908 Outer capsid protein VP4 Proteins 0.000 description 2
- 101710135467 Outer capsid protein sigma-1 Proteins 0.000 description 2
- 102000010292 Peptide Elongation Factor 1 Human genes 0.000 description 2
- 108010077524 Peptide Elongation Factor 1 Proteins 0.000 description 2
- 102000012288 Phosphopyruvate Hydratase Human genes 0.000 description 2
- 108010022181 Phosphopyruvate Hydratase Proteins 0.000 description 2
- 108091000080 Phosphotransferase Proteins 0.000 description 2
- 108010038512 Platelet-Derived Growth Factor Proteins 0.000 description 2
- 102000010780 Platelet-Derived Growth Factor Human genes 0.000 description 2
- 101710182846 Polyhedrin Proteins 0.000 description 2
- 101710176177 Protein A56 Proteins 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 2
- 101100007329 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) COS1 gene Proteins 0.000 description 2
- 102000017852 Saposin Human genes 0.000 description 2
- 108050007079 Saposin Proteins 0.000 description 2
- 108010090851 Simplexvirus DNA polymerase Proteins 0.000 description 2
- 101710082933 Single-strand DNA-binding protein Proteins 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 102000036693 Thrombopoietin Human genes 0.000 description 2
- 108010041111 Thrombopoietin Proteins 0.000 description 2
- 102000006601 Thymidine Kinase Human genes 0.000 description 2
- 108020004440 Thymidine kinase Proteins 0.000 description 2
- 102000003978 Tissue Plasminogen Activator Human genes 0.000 description 2
- 108090000373 Tissue Plasminogen Activator Proteins 0.000 description 2
- 241000723873 Tobacco mosaic virus Species 0.000 description 2
- 108091023040 Transcription factor Proteins 0.000 description 2
- 102000040945 Transcription factor Human genes 0.000 description 2
- 102000004887 Transforming Growth Factor beta Human genes 0.000 description 2
- 108090001012 Transforming Growth Factor beta Proteins 0.000 description 2
- 102400001320 Transforming growth factor alpha Human genes 0.000 description 2
- 101800004564 Transforming growth factor alpha Proteins 0.000 description 2
- 239000007983 Tris buffer Substances 0.000 description 2
- 101150099617 UL5 gene Proteins 0.000 description 2
- 101150033561 UL8 gene Proteins 0.000 description 2
- 241000700618 Vaccinia virus Species 0.000 description 2
- 102000005789 Vascular Endothelial Growth Factors Human genes 0.000 description 2
- 108010019530 Vascular Endothelial Growth Factors Proteins 0.000 description 2
- 108010003205 Vasoactive Intestinal Peptide Proteins 0.000 description 2
- 102400000015 Vasoactive intestinal peptide Human genes 0.000 description 2
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 2
- ZSLZBFCDCINBPY-ZSJPKINUSA-N acetyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 ZSLZBFCDCINBPY-ZSJPKINUSA-N 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 102000016679 alpha-Glucosidases Human genes 0.000 description 2
- 108010028144 alpha-Glucosidases Proteins 0.000 description 2
- 108010072788 angiogenin Proteins 0.000 description 2
- 108010092854 aspartyllysine Proteins 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- 108010085377 beta-N-Acetylhexosaminidases Proteins 0.000 description 2
- 102000007478 beta-N-Acetylhexosaminidases Human genes 0.000 description 2
- 229940112869 bone morphogenetic protein Drugs 0.000 description 2
- 108010006025 bovine growth hormone Proteins 0.000 description 2
- 229940077737 brain-derived neurotrophic factor Drugs 0.000 description 2
- 238000010804 cDNA synthesis Methods 0.000 description 2
- 239000006143 cell culture medium Substances 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 229940028334 follicle stimulating hormone Drugs 0.000 description 2
- 238000001415 gene therapy Methods 0.000 description 2
- 230000009395 genetic defect Effects 0.000 description 2
- 210000005046 glial fibrillary acidic protein Anatomy 0.000 description 2
- 230000013595 glycosylation Effects 0.000 description 2
- 238000006206 glycosylation reaction Methods 0.000 description 2
- 239000005090 green fluorescent protein Substances 0.000 description 2
- 239000003102 growth factor Substances 0.000 description 2
- 108010052188 hepatoma-derived growth factor Proteins 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 2
- VBUWHHLIZKOSMS-RIWXPGAOSA-N invicorp Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC=1NC=NC=1)C(C)C)[C@@H](C)O)[C@@H](C)O)C(C)C)C1=CC=C(O)C=C1 VBUWHHLIZKOSMS-RIWXPGAOSA-N 0.000 description 2
- 239000012139 lysis buffer Substances 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- 108010016686 methionyl-alanyl-serine Proteins 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 210000003205 muscle Anatomy 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 2
- 108010051242 phenylalanylserine Proteins 0.000 description 2
- 102000020233 phosphotransferase Human genes 0.000 description 2
- 201000008519 polycystic kidney disease 1 Diseases 0.000 description 2
- 201000008542 polycystic kidney disease 2 Diseases 0.000 description 2
- 108700032676 polycystic kidney disease 2 Proteins 0.000 description 2
- 230000001737 promoting effect Effects 0.000 description 2
- 239000013608 rAAV vector Substances 0.000 description 2
- 238000003259 recombinant expression Methods 0.000 description 2
- 108010054624 red fluorescent protein Proteins 0.000 description 2
- 239000000523 sample Substances 0.000 description 2
- 230000001568 sexual effect Effects 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- ZRKFYGHZFMAOKI-QMGMOQQFSA-N tgfbeta Chemical compound C([C@H](NC(=O)[C@H](C(C)C)NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CC(C)C)NC(=O)CNC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCSC)C(C)C)[C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O)C1=CC=C(O)C=C1 ZRKFYGHZFMAOKI-QMGMOQQFSA-N 0.000 description 2
- 229960000187 tissue plasminogen activator Drugs 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 2
- GPRLSGONYQIRFK-MNYXATJNSA-N triton Chemical compound [3H+] GPRLSGONYQIRFK-MNYXATJNSA-N 0.000 description 2
- 102000003390 tumor necrosis factor Human genes 0.000 description 2
- WDVIDPRACNGFPP-QWRGUYRKSA-N (2s)-2-[[(2s)-6-amino-2-[[2-[(2-aminoacetyl)amino]acetyl]amino]hexanoyl]amino]-5-(diaminomethylideneamino)pentanoic acid Chemical compound NCC(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O WDVIDPRACNGFPP-QWRGUYRKSA-N 0.000 description 1
- CUKWUWBLQQDQAC-VEQWQPCFSA-N (3s)-3-amino-4-[[(2s)-1-[[(2s)-1-[[(2s)-1-[[(2s,3s)-1-[[(2s)-1-[(2s)-2-[[(1s)-1-carboxyethyl]carbamoyl]pyrrolidin-1-yl]-3-(1h-imidazol-5-yl)-1-oxopropan-2-yl]amino]-3-methyl-1-oxopentan-2-yl]amino]-3-(4-hydroxyphenyl)-1-oxopropan-2-yl]amino]-3-methyl-1-ox Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(O)=O)C(C)C)C1=CC=C(O)C=C1 CUKWUWBLQQDQAC-VEQWQPCFSA-N 0.000 description 1
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- LVRVABPNVHYXRT-BQWXUCBYSA-N 52906-92-0 Chemical compound C([C@H](N)C(=O)N[C@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O)C(C)C)C1=CC=CC=C1 LVRVABPNVHYXRT-BQWXUCBYSA-N 0.000 description 1
- MJZJYWCQPMNPRM-UHFFFAOYSA-N 6,6-dimethyl-1-[3-(2,4,5-trichlorophenoxy)propoxy]-1,6-dihydro-1,3,5-triazine-2,4-diamine Chemical compound CC1(C)N=C(N)N=C(N)N1OCCCOC1=CC(Cl)=C(Cl)C=C1Cl MJZJYWCQPMNPRM-UHFFFAOYSA-N 0.000 description 1
- 108020005296 Acid Ceramidase Proteins 0.000 description 1
- 102000006772 Acid Ceramidase Human genes 0.000 description 1
- 102100029457 Adenine phosphoribosyltransferase Human genes 0.000 description 1
- 108010024223 Adenine phosphoribosyltransferase Proteins 0.000 description 1
- 241000300529 Adeno-associated virus 13 Species 0.000 description 1
- 241000649044 Adeno-associated virus 9 Species 0.000 description 1
- 108010024878 Adenovirus E1A Proteins Proteins 0.000 description 1
- 108010087905 Adenovirus E1B Proteins Proteins 0.000 description 1
- 229920000936 Agarose Polymers 0.000 description 1
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 1
- JBGSZRYCXBPWGX-BQBZGAKWSA-N Ala-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N JBGSZRYCXBPWGX-BQBZGAKWSA-N 0.000 description 1
- NHCPCLJZRSIDHS-ZLUOBGJFSA-N Ala-Asp-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O NHCPCLJZRSIDHS-ZLUOBGJFSA-N 0.000 description 1
- GSCLWXDNIMNIJE-ZLUOBGJFSA-N Ala-Asp-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O GSCLWXDNIMNIJE-ZLUOBGJFSA-N 0.000 description 1
- KIUYPHAMDKDICO-WHFBIAKZSA-N Ala-Asp-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KIUYPHAMDKDICO-WHFBIAKZSA-N 0.000 description 1
- IKKVASZHTMKJIR-ZKWXMUAHSA-N Ala-Asp-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IKKVASZHTMKJIR-ZKWXMUAHSA-N 0.000 description 1
- LGFCAXJBAZESCF-ACZMJKKPSA-N Ala-Gln-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O LGFCAXJBAZESCF-ACZMJKKPSA-N 0.000 description 1
- CZPAHAKGPDUIPJ-CIUDSAMLSA-N Ala-Gln-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O CZPAHAKGPDUIPJ-CIUDSAMLSA-N 0.000 description 1
- LMFXXZPPZDCPTA-ZKWXMUAHSA-N Ala-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N LMFXXZPPZDCPTA-ZKWXMUAHSA-N 0.000 description 1
- GRPHQEMIFDPKOE-HGNGGELXSA-N Ala-His-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O GRPHQEMIFDPKOE-HGNGGELXSA-N 0.000 description 1
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 1
- FEGOCLZUJUFCHP-CIUDSAMLSA-N Ala-Pro-Gln Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O FEGOCLZUJUFCHP-CIUDSAMLSA-N 0.000 description 1
- YHBDGLZYNIARKJ-GUBZILKMSA-N Ala-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N YHBDGLZYNIARKJ-GUBZILKMSA-N 0.000 description 1
- NHWYNIZWLJYZAG-XVYDVKMFSA-N Ala-Ser-His Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N NHWYNIZWLJYZAG-XVYDVKMFSA-N 0.000 description 1
- NCQMBSJGJMYKCK-ZLUOBGJFSA-N Ala-Ser-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O NCQMBSJGJMYKCK-ZLUOBGJFSA-N 0.000 description 1
- LSMDIAAALJJLRO-XQXXSGGOSA-N Ala-Thr-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O LSMDIAAALJJLRO-XQXXSGGOSA-N 0.000 description 1
- YCTIYBUTCKNOTI-UWJYBYFXSA-N Ala-Tyr-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCTIYBUTCKNOTI-UWJYBYFXSA-N 0.000 description 1
- JNJHNBXBGNJESC-KKXDTOCCSA-N Ala-Tyr-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JNJHNBXBGNJESC-KKXDTOCCSA-N 0.000 description 1
- XSLGWYYNOSUMRM-ZKWXMUAHSA-N Ala-Val-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XSLGWYYNOSUMRM-ZKWXMUAHSA-N 0.000 description 1
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 1
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 1
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 1
- 102100034561 Alpha-N-acetylglucosaminidase Human genes 0.000 description 1
- 102100026277 Alpha-galactosidase A Human genes 0.000 description 1
- 101710190943 Angiogenin-2 Proteins 0.000 description 1
- 102400000345 Angiotensin-2 Human genes 0.000 description 1
- 101800000733 Angiotensin-2 Proteins 0.000 description 1
- 101001084702 Arabidopsis thaliana Histone H2B.10 Proteins 0.000 description 1
- JQFJNGVSGOUQDH-XIRDDKMYSA-N Arg-Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCCN=C(N)N)N)C(O)=O)=CNC2=C1 JQFJNGVSGOUQDH-XIRDDKMYSA-N 0.000 description 1
- UHFUZWSZQKMDSX-DCAQKATOSA-N Arg-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UHFUZWSZQKMDSX-DCAQKATOSA-N 0.000 description 1
- UZGFHWIJWPUPOH-IHRRRGAJSA-N Arg-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UZGFHWIJWPUPOH-IHRRRGAJSA-N 0.000 description 1
- FRBAHXABMQXSJQ-FXQIFTODSA-N Arg-Ser-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FRBAHXABMQXSJQ-FXQIFTODSA-N 0.000 description 1
- 102000003823 Aromatic-L-amino-acid decarboxylases Human genes 0.000 description 1
- 108090000121 Aromatic-L-amino-acid decarboxylases Proteins 0.000 description 1
- 102100031491 Arylsulfatase B Human genes 0.000 description 1
- AYZAWXAPBAYCHO-CIUDSAMLSA-N Asn-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N AYZAWXAPBAYCHO-CIUDSAMLSA-N 0.000 description 1
- KXFCBAHYSLJCCY-ZLUOBGJFSA-N Asn-Asn-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O KXFCBAHYSLJCCY-ZLUOBGJFSA-N 0.000 description 1
- GNKVBRYFXYWXAB-WDSKDSINSA-N Asn-Glu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O GNKVBRYFXYWXAB-WDSKDSINSA-N 0.000 description 1
- FTCGGKNCJZOPNB-WHFBIAKZSA-N Asn-Gly-Ser Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FTCGGKNCJZOPNB-WHFBIAKZSA-N 0.000 description 1
- MOHUTCNYQLMARY-GUBZILKMSA-N Asn-His-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N MOHUTCNYQLMARY-GUBZILKMSA-N 0.000 description 1
- WIDVAWAQBRAKTI-YUMQZZPRSA-N Asn-Leu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O WIDVAWAQBRAKTI-YUMQZZPRSA-N 0.000 description 1
- FHETWELNCBMRMG-HJGDQZAQSA-N Asn-Leu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FHETWELNCBMRMG-HJGDQZAQSA-N 0.000 description 1
- FTSAJSADJCMDHH-CIUDSAMLSA-N Asn-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N FTSAJSADJCMDHH-CIUDSAMLSA-N 0.000 description 1
- BKZFBJYIVSBXCO-KKUMJFAQSA-N Asn-Phe-His Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC=N1)C(O)=O BKZFBJYIVSBXCO-KKUMJFAQSA-N 0.000 description 1
- RVHGJNGNKGDCPX-KKUMJFAQSA-N Asn-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N RVHGJNGNKGDCPX-KKUMJFAQSA-N 0.000 description 1
- GKKUBLFXKRDMFC-BQBZGAKWSA-N Asn-Pro-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O GKKUBLFXKRDMFC-BQBZGAKWSA-N 0.000 description 1
- VHQSGALUSWIYOD-QXEWZRGKSA-N Asn-Pro-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O VHQSGALUSWIYOD-QXEWZRGKSA-N 0.000 description 1
- DAYDURRBMDCCFL-AAEUAGOBSA-N Asn-Trp-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N DAYDURRBMDCCFL-AAEUAGOBSA-N 0.000 description 1
- BEHQTVDBCLSCBY-CFMVVWHZSA-N Asn-Tyr-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BEHQTVDBCLSCBY-CFMVVWHZSA-N 0.000 description 1
- WSWYMRLTJVKRCE-ZLUOBGJFSA-N Asp-Ala-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O WSWYMRLTJVKRCE-ZLUOBGJFSA-N 0.000 description 1
- XEDQMTWEYFBOIK-ACZMJKKPSA-N Asp-Ala-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XEDQMTWEYFBOIK-ACZMJKKPSA-N 0.000 description 1
- ZLGKHJHFYSRUBH-FXQIFTODSA-N Asp-Arg-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLGKHJHFYSRUBH-FXQIFTODSA-N 0.000 description 1
- IXIWEFWRKIUMQX-DCAQKATOSA-N Asp-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(O)=O IXIWEFWRKIUMQX-DCAQKATOSA-N 0.000 description 1
- MRQQMVZUHXUPEV-IHRRRGAJSA-N Asp-Arg-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MRQQMVZUHXUPEV-IHRRRGAJSA-N 0.000 description 1
- XYBJLTKSGFBLCS-QXEWZRGKSA-N Asp-Arg-Val Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CC(O)=O XYBJLTKSGFBLCS-QXEWZRGKSA-N 0.000 description 1
- UQBGYPFHWFZMCD-ZLUOBGJFSA-N Asp-Asn-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O UQBGYPFHWFZMCD-ZLUOBGJFSA-N 0.000 description 1
- UGKZHCBLMLSANF-CIUDSAMLSA-N Asp-Asn-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UGKZHCBLMLSANF-CIUDSAMLSA-N 0.000 description 1
- UGIBTKGQVWFTGX-BIIVOSGPSA-N Asp-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)C(=O)O UGIBTKGQVWFTGX-BIIVOSGPSA-N 0.000 description 1
- RDRMWJBLOSRRAW-BYULHYEWSA-N Asp-Asn-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O RDRMWJBLOSRRAW-BYULHYEWSA-N 0.000 description 1
- PGUYEUCYVNZGGV-QWRGUYRKSA-N Asp-Gly-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PGUYEUCYVNZGGV-QWRGUYRKSA-N 0.000 description 1
- IDDMGSKZQDEDGA-SRVKXCTJSA-N Asp-Phe-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 IDDMGSKZQDEDGA-SRVKXCTJSA-N 0.000 description 1
- BKOIIURTQAJHAT-GUBZILKMSA-N Asp-Pro-Pro Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 BKOIIURTQAJHAT-GUBZILKMSA-N 0.000 description 1
- ZVGRHIRJLWBWGJ-ACZMJKKPSA-N Asp-Ser-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZVGRHIRJLWBWGJ-ACZMJKKPSA-N 0.000 description 1
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 1
- OYSYWMMZGJSQRB-AVGNSLFASA-N Asp-Tyr-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O OYSYWMMZGJSQRB-AVGNSLFASA-N 0.000 description 1
- 108010023546 Aspartylglucosylaminase Proteins 0.000 description 1
- 101800001288 Atrial natriuretic factor Proteins 0.000 description 1
- 102400001282 Atrial natriuretic peptide Human genes 0.000 description 1
- 101800001890 Atrial natriuretic peptide Proteins 0.000 description 1
- 241001203868 Autographa californica Species 0.000 description 1
- 101000692648 Avena sativa Phytochrome A type 3 Proteins 0.000 description 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 1
- 101000588395 Bacillus subtilis (strain 168) Beta-hexosaminidase Proteins 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 102100022440 Battenin Human genes 0.000 description 1
- 102400000748 Beta-endorphin Human genes 0.000 description 1
- 101800005049 Beta-endorphin Proteins 0.000 description 1
- 102100032487 Beta-mannosidase Human genes 0.000 description 1
- 102000015081 Blood Coagulation Factors Human genes 0.000 description 1
- 108010039209 Blood Coagulation Factors Proteins 0.000 description 1
- 108010051479 Bombesin Proteins 0.000 description 1
- 102000013585 Bombesin Human genes 0.000 description 1
- 102400000967 Bradykinin Human genes 0.000 description 1
- 101800004538 Bradykinin Proteins 0.000 description 1
- 102100021943 C-C motif chemokine 2 Human genes 0.000 description 1
- 101710155857 C-C motif chemokine 2 Proteins 0.000 description 1
- 102100032367 C-C motif chemokine 5 Human genes 0.000 description 1
- 102100036170 C-X-C motif chemokine 9 Human genes 0.000 description 1
- 101710085500 C-X-C motif chemokine 9 Proteins 0.000 description 1
- 101150069031 CSN2 gene Proteins 0.000 description 1
- 101710103504 CXXC-type zinc finger protein 1 Proteins 0.000 description 1
- 102100036168 CXXC-type zinc finger protein 1 Human genes 0.000 description 1
- 102400000113 Calcitonin Human genes 0.000 description 1
- 108060001064 Calcitonin Proteins 0.000 description 1
- 102100025580 Calmodulin-1 Human genes 0.000 description 1
- 101710164735 Calmodulin-1 Proteins 0.000 description 1
- 241000589875 Campylobacter jejuni Species 0.000 description 1
- 101150044789 Cap gene Proteins 0.000 description 1
- 108700004991 Cas12a Proteins 0.000 description 1
- 102000005572 Cathepsin A Human genes 0.000 description 1
- 108010059081 Cathepsin A Proteins 0.000 description 1
- 108090000625 Cathepsin K Proteins 0.000 description 1
- 102000004171 Cathepsin K Human genes 0.000 description 1
- 241000701489 Cauliflower mosaic virus Species 0.000 description 1
- 102000001326 Chemokine CCL4 Human genes 0.000 description 1
- 108010055165 Chemokine CCL4 Proteins 0.000 description 1
- 108010055166 Chemokine CCL5 Proteins 0.000 description 1
- 102000016950 Chemokine CXCL1 Human genes 0.000 description 1
- 108010014419 Chemokine CXCL1 Proteins 0.000 description 1
- 102000019034 Chemokines Human genes 0.000 description 1
- 108010012236 Chemokines Proteins 0.000 description 1
- 241000195597 Chlamydomonas reinhardtii Species 0.000 description 1
- 241000195628 Chlorophyta Species 0.000 description 1
- 102100025841 Cholecystokinin Human genes 0.000 description 1
- 101800001982 Cholecystokinin Proteins 0.000 description 1
- 108091062157 Cis-regulatory element Proteins 0.000 description 1
- 208000014249 Classic phenylketonuria Diseases 0.000 description 1
- 102100022641 Coagulation factor IX Human genes 0.000 description 1
- 208000003322 Coinfection Diseases 0.000 description 1
- 108091035707 Consensus sequence Proteins 0.000 description 1
- 101150074775 Csf1 gene Proteins 0.000 description 1
- 201000003883 Cystic fibrosis Diseases 0.000 description 1
- 101150074155 DHFR gene Proteins 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 230000004543 DNA replication Effects 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108090000204 Dipeptidase 1 Proteins 0.000 description 1
- 102000003779 Dipeptidyl-peptidases and tripeptidyl-peptidases Human genes 0.000 description 1
- 108090000194 Dipeptidyl-peptidases and tripeptidyl-peptidases Proteins 0.000 description 1
- 108010065372 Dynorphins Proteins 0.000 description 1
- 102100024108 Dystrophin Human genes 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 102100031780 Endonuclease Human genes 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- 108010059378 Endopeptidases Proteins 0.000 description 1
- 102000005593 Endopeptidases Human genes 0.000 description 1
- 108010092674 Enkephalins Proteins 0.000 description 1
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 1
- 108010076282 Factor IX Proteins 0.000 description 1
- 108010014173 Factor X Proteins 0.000 description 1
- 108010074860 Factor Xa Proteins 0.000 description 1
- 102000009123 Fibrin Human genes 0.000 description 1
- 108010073385 Fibrin Proteins 0.000 description 1
- BWGVNKXGVNDBDI-UHFFFAOYSA-N Fibrin monomer Chemical compound CNC(=O)CNC(=O)CN BWGVNKXGVNDBDI-UHFFFAOYSA-N 0.000 description 1
- 102000018233 Fibroblast Growth Factor Human genes 0.000 description 1
- 108050007372 Fibroblast Growth Factor Proteins 0.000 description 1
- 102000001390 Fructose-Bisphosphate Aldolase Human genes 0.000 description 1
- 108010068561 Fructose-Bisphosphate Aldolase Proteins 0.000 description 1
- 102400001370 Galanin Human genes 0.000 description 1
- 101800002068 Galanin Proteins 0.000 description 1
- 102100023364 Ganglioside GM2 activator Human genes 0.000 description 1
- 102400000921 Gastrin Human genes 0.000 description 1
- 108010052343 Gastrins Proteins 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- 241000626621 Geobacillus Species 0.000 description 1
- 208000032612 Glial tumor Diseases 0.000 description 1
- 206010018338 Glioma Diseases 0.000 description 1
- LJEPDHWNQXPXMM-NHCYSSNCSA-N Gln-Arg-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O LJEPDHWNQXPXMM-NHCYSSNCSA-N 0.000 description 1
- QYTKAVBFRUGYAU-ACZMJKKPSA-N Gln-Asp-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QYTKAVBFRUGYAU-ACZMJKKPSA-N 0.000 description 1
- GPISLLFQNHELLK-DCAQKATOSA-N Gln-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N GPISLLFQNHELLK-DCAQKATOSA-N 0.000 description 1
- KVXVVDFOZNYYKZ-DCAQKATOSA-N Gln-Gln-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KVXVVDFOZNYYKZ-DCAQKATOSA-N 0.000 description 1
- NPTGGVQJYRSMCM-GLLZPBPUSA-N Gln-Gln-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NPTGGVQJYRSMCM-GLLZPBPUSA-N 0.000 description 1
- VOLVNCMGXWDDQY-LPEHRKFASA-N Gln-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N)C(=O)O VOLVNCMGXWDDQY-LPEHRKFASA-N 0.000 description 1
- IKFZXRLDMYWNBU-YUMQZZPRSA-N Gln-Gly-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N IKFZXRLDMYWNBU-YUMQZZPRSA-N 0.000 description 1
- GNMQDOGFWYWPNM-LAEOZQHASA-N Gln-Gly-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)CNC(=O)[C@@H](N)CCC(N)=O)C(O)=O GNMQDOGFWYWPNM-LAEOZQHASA-N 0.000 description 1
- NSORZJXKUQFEKL-JGVFFNPUSA-N Gln-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCC(=O)N)N)C(=O)O NSORZJXKUQFEKL-JGVFFNPUSA-N 0.000 description 1
- OREPWMPAUWIIAM-ZPFDUUQYSA-N Gln-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N OREPWMPAUWIIAM-ZPFDUUQYSA-N 0.000 description 1
- SYZZMPFLOLSMHL-XHNCKOQMSA-N Gln-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N)C(=O)O SYZZMPFLOLSMHL-XHNCKOQMSA-N 0.000 description 1
- JKDBRTNMYXYLHO-JYJNAYRXSA-N Gln-Tyr-Leu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 JKDBRTNMYXYLHO-JYJNAYRXSA-N 0.000 description 1
- UBRQJXFDVZNYJP-AVGNSLFASA-N Gln-Tyr-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O UBRQJXFDVZNYJP-AVGNSLFASA-N 0.000 description 1
- MKRDNSWGJWTBKZ-GVXVVHGQSA-N Gln-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MKRDNSWGJWTBKZ-GVXVVHGQSA-N 0.000 description 1
- ZMXZGYLINVNTKH-DZKIICNBSA-N Gln-Val-Phe Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZMXZGYLINVNTKH-DZKIICNBSA-N 0.000 description 1
- SBCYJMOOHUDWDA-NUMRIWBASA-N Glu-Asp-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SBCYJMOOHUDWDA-NUMRIWBASA-N 0.000 description 1
- AUTNXSQEVVHSJK-YVNDNENWSA-N Glu-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O AUTNXSQEVVHSJK-YVNDNENWSA-N 0.000 description 1
- OGNJZUXUTPQVBR-BQBZGAKWSA-N Glu-Gly-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OGNJZUXUTPQVBR-BQBZGAKWSA-N 0.000 description 1
- CUXJIASLBRJOFV-LAEOZQHASA-N Glu-Gly-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CUXJIASLBRJOFV-LAEOZQHASA-N 0.000 description 1
- WVYJNPCWJYBHJG-YVNDNENWSA-N Glu-Ile-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O WVYJNPCWJYBHJG-YVNDNENWSA-N 0.000 description 1
- VGUYMZGLJUJRBV-YVNDNENWSA-N Glu-Ile-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O VGUYMZGLJUJRBV-YVNDNENWSA-N 0.000 description 1
- PMSMKNYRZCKVMC-DRZSPHRISA-N Glu-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCC(=O)O)N PMSMKNYRZCKVMC-DRZSPHRISA-N 0.000 description 1
- DMYACXMQUABZIQ-NRPADANISA-N Glu-Ser-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O DMYACXMQUABZIQ-NRPADANISA-N 0.000 description 1
- WGYHAAXZWPEBDQ-IFFSRLJSSA-N Glu-Val-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGYHAAXZWPEBDQ-IFFSRLJSSA-N 0.000 description 1
- 102400000321 Glucagon Human genes 0.000 description 1
- 108060003199 Glucagon Proteins 0.000 description 1
- 108091052347 Glucose transporter family Proteins 0.000 description 1
- 102000042092 Glucose transporter family Human genes 0.000 description 1
- 108010060309 Glucuronidase Proteins 0.000 description 1
- XUDLUKYPXQDCRX-BQBZGAKWSA-N Gly-Arg-Asn Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O XUDLUKYPXQDCRX-BQBZGAKWSA-N 0.000 description 1
- CIMULJZTTOBOPN-WHFBIAKZSA-N Gly-Asn-Asn Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CIMULJZTTOBOPN-WHFBIAKZSA-N 0.000 description 1
- PMNHJLASAAWELO-FOHZUACHSA-N Gly-Asp-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PMNHJLASAAWELO-FOHZUACHSA-N 0.000 description 1
- IXKRSKPKSLXIHN-YUMQZZPRSA-N Gly-Cys-Leu Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O IXKRSKPKSLXIHN-YUMQZZPRSA-N 0.000 description 1
- BULIVUZUDBHKKZ-WDSKDSINSA-N Gly-Gln-Asn Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O BULIVUZUDBHKKZ-WDSKDSINSA-N 0.000 description 1
- BEQGFMIBZFNROK-JGVFFNPUSA-N Gly-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)CN)C(=O)O BEQGFMIBZFNROK-JGVFFNPUSA-N 0.000 description 1
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 1
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 1
- VEPBEGNDJYANCF-QWRGUYRKSA-N Gly-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN VEPBEGNDJYANCF-QWRGUYRKSA-N 0.000 description 1
- HAOUOFNNJJLVNS-BQBZGAKWSA-N Gly-Pro-Ser Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O HAOUOFNNJJLVNS-BQBZGAKWSA-N 0.000 description 1
- CSMYMGFCEJWALV-WDSKDSINSA-N Gly-Ser-Gln Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O CSMYMGFCEJWALV-WDSKDSINSA-N 0.000 description 1
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 1
- RIYIFUFFFBIOEU-KBPBESRZSA-N Gly-Tyr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 RIYIFUFFFBIOEU-KBPBESRZSA-N 0.000 description 1
- PNUFMLXHOLFRLD-KBPBESRZSA-N Gly-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 PNUFMLXHOLFRLD-KBPBESRZSA-N 0.000 description 1
- OCRQUYDOYKCOQG-IRXDYDNUSA-N Gly-Tyr-Phe Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 OCRQUYDOYKCOQG-IRXDYDNUSA-N 0.000 description 1
- DNAZKGFYFRGZIH-QWRGUYRKSA-N Gly-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 DNAZKGFYFRGZIH-QWRGUYRKSA-N 0.000 description 1
- FNXSYBOHALPRHV-ONGXEEELSA-N Gly-Val-Lys Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN FNXSYBOHALPRHV-ONGXEEELSA-N 0.000 description 1
- 108010058102 Glycogen Debranching Enzyme System Proteins 0.000 description 1
- 108010001483 Glycogen Synthase Proteins 0.000 description 1
- 102000017475 Glycogen debranching enzyme Human genes 0.000 description 1
- 239000000579 Gonadotropin-Releasing Hormone Substances 0.000 description 1
- 239000000095 Growth Hormone-Releasing Hormone Substances 0.000 description 1
- 102100039939 Growth/differentiation factor 8 Human genes 0.000 description 1
- QXZGBUJJYSLZLT-UHFFFAOYSA-N H-Arg-Pro-Pro-Gly-Phe-Ser-Pro-Phe-Arg-OH Natural products NC(N)=NCCCC(N)C(=O)N1CCCC1C(=O)N1C(C(=O)NCC(=O)NC(CC=2C=CC=CC=2)C(=O)NC(CO)C(=O)N2C(CCC2)C(=O)NC(CC=2C=CC=CC=2)C(=O)NC(CCCN=C(N)N)C(O)=O)CCC1 QXZGBUJJYSLZLT-UHFFFAOYSA-N 0.000 description 1
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 1
- 108091060210 Heavy strand Proteins 0.000 description 1
- 102000007625 Hirudins Human genes 0.000 description 1
- 108010007267 Hirudins Proteins 0.000 description 1
- BDHUXUFYNUOUIT-SRVKXCTJSA-N His-Asp-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BDHUXUFYNUOUIT-SRVKXCTJSA-N 0.000 description 1
- HYWZHNUGAYVEEW-KKUMJFAQSA-N His-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N HYWZHNUGAYVEEW-KKUMJFAQSA-N 0.000 description 1
- VIJMRAIWYWRXSR-CIUDSAMLSA-N His-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 VIJMRAIWYWRXSR-CIUDSAMLSA-N 0.000 description 1
- 101000756632 Homo sapiens Actin, cytoplasmic 1 Proteins 0.000 description 1
- 101000771674 Homo sapiens Apolipoprotein E Proteins 0.000 description 1
- 101000984164 Homo sapiens Calmodulin-1 Proteins 0.000 description 1
- 101001058231 Homo sapiens Gamma-enolase Proteins 0.000 description 1
- 101000685969 Homo sapiens Ganglioside GM2 activator Proteins 0.000 description 1
- 101000888419 Homo sapiens Glial fibrillary acidic protein Proteins 0.000 description 1
- 101001018064 Homo sapiens Lysosomal-trafficking regulator Proteins 0.000 description 1
- 101000985642 Homo sapiens Metallothionein-3 Proteins 0.000 description 1
- 101000821100 Homo sapiens Synapsin-1 Proteins 0.000 description 1
- 101000821096 Homo sapiens Synapsin-2 Proteins 0.000 description 1
- 101000772194 Homo sapiens Transthyretin Proteins 0.000 description 1
- 101000808011 Homo sapiens Vascular endothelial growth factor A Proteins 0.000 description 1
- 241000701074 Human alphaherpesvirus 2 Species 0.000 description 1
- 101900239484 Human herpesvirus 1 DNA helicase/primase complex-associated protein Proteins 0.000 description 1
- 108010003272 Hyaluronate lyase Proteins 0.000 description 1
- 102000001974 Hyaluronidases Human genes 0.000 description 1
- 108010091358 Hypoxanthine Phosphoribosyltransferase Proteins 0.000 description 1
- 102100029098 Hypoxanthine-guanine phosphoribosyltransferase Human genes 0.000 description 1
- 108010053927 Iduronate Sulfatase Proteins 0.000 description 1
- GAZGFPOZOLEYAJ-YTFOTSKYSA-N Ile-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N GAZGFPOZOLEYAJ-YTFOTSKYSA-N 0.000 description 1
- JODPUDMBQBIWCK-GHCJXIJMSA-N Ile-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O JODPUDMBQBIWCK-GHCJXIJMSA-N 0.000 description 1
- JTBFQNHKNRZJDS-SYWGBEHUSA-N Ile-Trp-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](C)C(=O)O)N JTBFQNHKNRZJDS-SYWGBEHUSA-N 0.000 description 1
- 108700005091 Immunoglobulin Genes Proteins 0.000 description 1
- 102000012745 Immunoglobulin Subunits Human genes 0.000 description 1
- 108010079585 Immunoglobulin Subunits Proteins 0.000 description 1
- 108020005350 Initiator Codon Proteins 0.000 description 1
- 108090001061 Insulin Proteins 0.000 description 1
- 102100023915 Insulin Human genes 0.000 description 1
- 108090000723 Insulin-Like Growth Factor I Proteins 0.000 description 1
- 102000014429 Insulin-like growth factor Human genes 0.000 description 1
- 102000000589 Interleukin-1 Human genes 0.000 description 1
- 108010002352 Interleukin-1 Proteins 0.000 description 1
- 102100026018 Interleukin-1 receptor antagonist protein Human genes 0.000 description 1
- 101710144554 Interleukin-1 receptor antagonist protein Proteins 0.000 description 1
- 108010002350 Interleukin-2 Proteins 0.000 description 1
- 108010002386 Interleukin-3 Proteins 0.000 description 1
- 108090000978 Interleukin-4 Proteins 0.000 description 1
- 108010002616 Interleukin-5 Proteins 0.000 description 1
- 108090001005 Interleukin-6 Proteins 0.000 description 1
- 108010002586 Interleukin-7 Proteins 0.000 description 1
- 108010002335 Interleukin-9 Proteins 0.000 description 1
- 102000015696 Interleukins Human genes 0.000 description 1
- 108010063738 Interleukins Proteins 0.000 description 1
- PWWVAXIEGOYWEE-UHFFFAOYSA-N Isophenergan Chemical compound C1=CC=C2N(CC(C)N(C)C)C3=CC=CC=C3SC2=C1 PWWVAXIEGOYWEE-UHFFFAOYSA-N 0.000 description 1
- AEMOLEFTQBMNLQ-HNFCZKTMSA-N L-idopyranuronic acid Chemical compound OC1O[C@@H](C(O)=O)[C@@H](O)[C@H](O)[C@H]1O AEMOLEFTQBMNLQ-HNFCZKTMSA-N 0.000 description 1
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 1
- FBOZXECLQNJBKD-ZDUSSCGKSA-N L-methotrexate Chemical compound C=1N=C2N=C(N)N=C(N)C2=NC=1CN(C)C1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 FBOZXECLQNJBKD-ZDUSSCGKSA-N 0.000 description 1
- XNSAINXGIQZQOO-UHFFFAOYSA-N L-pyroglutamyl-L-histidyl-L-proline amide Natural products NC(=O)C1CCCN1C(=O)C(NC(=O)C1NC(=O)CC1)CC1=CN=CN1 XNSAINXGIQZQOO-UHFFFAOYSA-N 0.000 description 1
- STAVRDQLZOTNKJ-RHYQMDGZSA-N Leu-Arg-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STAVRDQLZOTNKJ-RHYQMDGZSA-N 0.000 description 1
- LLBQJYDYOLIQAI-JYJNAYRXSA-N Leu-Glu-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LLBQJYDYOLIQAI-JYJNAYRXSA-N 0.000 description 1
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 1
- VGPCJSXPPOQPBK-YUMQZZPRSA-N Leu-Gly-Ser Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O VGPCJSXPPOQPBK-YUMQZZPRSA-N 0.000 description 1
- USLNHQZCDQJBOV-ZPFDUUQYSA-N Leu-Ile-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O USLNHQZCDQJBOV-ZPFDUUQYSA-N 0.000 description 1
- KOSWSHVQIVTVQF-ZPFDUUQYSA-N Leu-Ile-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KOSWSHVQIVTVQF-ZPFDUUQYSA-N 0.000 description 1
- QLDHBYRUNQZIJQ-DKIMLUQUSA-N Leu-Ile-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QLDHBYRUNQZIJQ-DKIMLUQUSA-N 0.000 description 1
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 1
- QNTJIDXQHWUBKC-BZSNNMDCSA-N Leu-Lys-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QNTJIDXQHWUBKC-BZSNNMDCSA-N 0.000 description 1
- FLNPJLDPGMLWAU-UWVGGRQHSA-N Leu-Met-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CC(C)C FLNPJLDPGMLWAU-UWVGGRQHSA-N 0.000 description 1
- BIZNDKMFQHDOIE-KKUMJFAQSA-N Leu-Phe-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 BIZNDKMFQHDOIE-KKUMJFAQSA-N 0.000 description 1
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 1
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 1
- URLZCHNOLZSCCA-VABKMULXSA-N Leu-enkephalin Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)CNC(=O)CNC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=CC=C1 URLZCHNOLZSCCA-VABKMULXSA-N 0.000 description 1
- DUKURNFHYQXCJG-UHFFFAOYSA-N Lewis A pentasaccharide Natural products OC1C(O)C(O)C(C)OC1OC1C(OC2C(C(O)C(O)C(CO)O2)O)C(NC(C)=O)C(OC2C(C(OC3C(OC(O)C(O)C3O)CO)OC(CO)C2O)O)OC1CO DUKURNFHYQXCJG-UHFFFAOYSA-N 0.000 description 1
- 102000004882 Lipase Human genes 0.000 description 1
- 108090001060 Lipase Proteins 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- 102000009151 Luteinizing Hormone Human genes 0.000 description 1
- 108010073521 Luteinizing Hormone Proteins 0.000 description 1
- MPOHDJKRBLVGCT-CIUDSAMLSA-N Lys-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N MPOHDJKRBLVGCT-CIUDSAMLSA-N 0.000 description 1
- XFIHDSBIPWEYJJ-YUMQZZPRSA-N Lys-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN XFIHDSBIPWEYJJ-YUMQZZPRSA-N 0.000 description 1
- YNNPKXBBRZVIRX-IHRRRGAJSA-N Lys-Arg-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O YNNPKXBBRZVIRX-IHRRRGAJSA-N 0.000 description 1
- QUCDKEKDPYISNX-HJGDQZAQSA-N Lys-Asn-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QUCDKEKDPYISNX-HJGDQZAQSA-N 0.000 description 1
- VSRXPEHZMHSFKU-IUCAKERBSA-N Lys-Gln-Gly Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VSRXPEHZMHSFKU-IUCAKERBSA-N 0.000 description 1
- ZXEUFAVXODIPHC-GUBZILKMSA-N Lys-Glu-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZXEUFAVXODIPHC-GUBZILKMSA-N 0.000 description 1
- LCMWVZLBCUVDAZ-IUCAKERBSA-N Lys-Gly-Glu Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CCC([O-])=O LCMWVZLBCUVDAZ-IUCAKERBSA-N 0.000 description 1
- GNLJXWBNLAIPEP-MELADBBJSA-N Lys-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCCCN)N)C(=O)O GNLJXWBNLAIPEP-MELADBBJSA-N 0.000 description 1
- IZJGPPIGYTVXLB-FQUUOJAGSA-N Lys-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IZJGPPIGYTVXLB-FQUUOJAGSA-N 0.000 description 1
- NJNRBRKHOWSGMN-SRVKXCTJSA-N Lys-Leu-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O NJNRBRKHOWSGMN-SRVKXCTJSA-N 0.000 description 1
- PDIDTSZKKFEDMB-UWVGGRQHSA-N Lys-Pro-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O PDIDTSZKKFEDMB-UWVGGRQHSA-N 0.000 description 1
- SBQDRNOLGSYHQA-YUMQZZPRSA-N Lys-Ser-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SBQDRNOLGSYHQA-YUMQZZPRSA-N 0.000 description 1
- DLCAXBGXGOVUCD-PPCPHDFISA-N Lys-Thr-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DLCAXBGXGOVUCD-PPCPHDFISA-N 0.000 description 1
- CAVRAQIDHUPECU-UVOCVTCTSA-N Lys-Thr-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAVRAQIDHUPECU-UVOCVTCTSA-N 0.000 description 1
- VWJFOUBDZIUXGA-AVGNSLFASA-N Lys-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCCCN)N VWJFOUBDZIUXGA-AVGNSLFASA-N 0.000 description 1
- 102100026001 Lysosomal acid lipase/cholesteryl ester hydrolase Human genes 0.000 description 1
- 208000015439 Lysosomal storage disease Diseases 0.000 description 1
- 102100033472 Lysosomal-trafficking regulator Human genes 0.000 description 1
- 102100038225 Lysosome-associated membrane glycoprotein 2 Human genes 0.000 description 1
- 101710116771 Lysosome-associated membrane glycoprotein 2 Proteins 0.000 description 1
- 102100026158 Melanophilin Human genes 0.000 description 1
- 101710158003 Melanophilin Proteins 0.000 description 1
- 101710151321 Melanostatin Proteins 0.000 description 1
- YRAWWKUTNBILNT-FXQIFTODSA-N Met-Ala-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YRAWWKUTNBILNT-FXQIFTODSA-N 0.000 description 1
- DTICLBJHRYSJLH-GUBZILKMSA-N Met-Ala-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O DTICLBJHRYSJLH-GUBZILKMSA-N 0.000 description 1
- IHITVQKJXQQGLJ-LPEHRKFASA-N Met-Asn-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N IHITVQKJXQQGLJ-LPEHRKFASA-N 0.000 description 1
- OTKQHDPECKUDSB-SZMVWBNQSA-N Met-Val-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCSC)C(O)=O)=CNC2=C1 OTKQHDPECKUDSB-SZMVWBNQSA-N 0.000 description 1
- 102000005741 Metalloproteases Human genes 0.000 description 1
- 108010006035 Metalloproteases Proteins 0.000 description 1
- 108700021154 Metallothionein 3 Proteins 0.000 description 1
- 102100028708 Metallothionein-3 Human genes 0.000 description 1
- 102000006404 Mitochondrial Proteins Human genes 0.000 description 1
- 108010058682 Mitochondrial Proteins Proteins 0.000 description 1
- 102400001357 Motilin Human genes 0.000 description 1
- 101800002372 Motilin Proteins 0.000 description 1
- 102100026502 Mucolipin-1 Human genes 0.000 description 1
- 102100026784 Myelin proteolipid protein Human genes 0.000 description 1
- 108010056852 Myostatin Proteins 0.000 description 1
- 102100021003 N(4)-(beta-N-acetylglucosaminyl)-L-asparaginase Human genes 0.000 description 1
- 108010027520 N-Acetylgalactosamine-4-Sulfatase Proteins 0.000 description 1
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 1
- OVRNDRQMDRJTHS-FMDGEEDCSA-N N-acetyl-beta-D-glucosamine Chemical compound CC(=O)N[C@H]1[C@H](O)O[C@H](CO)[C@@H](O)[C@@H]1O OVRNDRQMDRJTHS-FMDGEEDCSA-N 0.000 description 1
- 102100023282 N-acetylglucosamine-6-sulfatase Human genes 0.000 description 1
- 108010023320 N-acetylglucosamine-6-sulfatase Proteins 0.000 description 1
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 1
- UGJBHEZMOKVTIM-UHFFFAOYSA-N N-formylglycine Chemical compound OC(=O)CNC=O UGJBHEZMOKVTIM-UHFFFAOYSA-N 0.000 description 1
- 102100029565 NPC intracellular cholesterol transporter 1 Human genes 0.000 description 1
- 241000588650 Neisseria meningitidis Species 0.000 description 1
- 102000007072 Nerve Growth Factors Human genes 0.000 description 1
- 102400000064 Neuropeptide Y Human genes 0.000 description 1
- 102400001103 Neurotensin Human genes 0.000 description 1
- 101800001814 Neurotensin Proteins 0.000 description 1
- 102000003683 Neurotrophin-4 Human genes 0.000 description 1
- 108090000099 Neurotrophin-4 Proteins 0.000 description 1
- 102400000050 Oxytocin Human genes 0.000 description 1
- 101800000989 Oxytocin Proteins 0.000 description 1
- XNOPRXBHLZRZKH-UHFFFAOYSA-N Oxytocin Natural products N1C(=O)C(N)CSSCC(C(=O)N2C(CCC2)C(=O)NC(CC(C)C)C(=O)NCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(CCC(N)=O)NC(=O)C(C(C)CC)NC(=O)C1CC1=CC=C(O)C=C1 XNOPRXBHLZRZKH-UHFFFAOYSA-N 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 102000005327 Palmitoyl protein thioesterase Human genes 0.000 description 1
- 108020002591 Palmitoyl protein thioesterase Proteins 0.000 description 1
- 102000035195 Peptidases Human genes 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- BRDYYVQTEJVRQT-HRCADAONSA-N Phe-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O BRDYYVQTEJVRQT-HRCADAONSA-N 0.000 description 1
- UNLYPPYNDXHGDG-IHRRRGAJSA-N Phe-Gln-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 UNLYPPYNDXHGDG-IHRRRGAJSA-N 0.000 description 1
- GDBOREPXIRKSEQ-FHWLQOOXSA-N Phe-Gln-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GDBOREPXIRKSEQ-FHWLQOOXSA-N 0.000 description 1
- FMMIYCMOVGXZIP-AVGNSLFASA-N Phe-Glu-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O FMMIYCMOVGXZIP-AVGNSLFASA-N 0.000 description 1
- YYKZDTVQHTUKDW-RYUDHWBXSA-N Phe-Gly-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N YYKZDTVQHTUKDW-RYUDHWBXSA-N 0.000 description 1
- VJLLEKDQJSMHRU-STQMWFEESA-N Phe-Gly-Met Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O VJLLEKDQJSMHRU-STQMWFEESA-N 0.000 description 1
- HQCSLJFGZYOXHW-KKUMJFAQSA-N Phe-His-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CS)C(=O)O)N HQCSLJFGZYOXHW-KKUMJFAQSA-N 0.000 description 1
- QRUOLOPKCOEZKU-HJWJTTGWSA-N Phe-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC1=CC=CC=C1)N QRUOLOPKCOEZKU-HJWJTTGWSA-N 0.000 description 1
- WWPAHTZOWURIMR-ULQDDVLXSA-N Phe-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 WWPAHTZOWURIMR-ULQDDVLXSA-N 0.000 description 1
- CVAUVSOFHJKCHN-BZSNNMDCSA-N Phe-Tyr-Cys Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CS)C(O)=O)C1=CC=CC=C1 CVAUVSOFHJKCHN-BZSNNMDCSA-N 0.000 description 1
- 102000001105 Phosphofructokinases Human genes 0.000 description 1
- 108010069341 Phosphofructokinases Proteins 0.000 description 1
- 102000014750 Phosphorylase Kinase Human genes 0.000 description 1
- 108010064071 Phosphorylase Kinase Proteins 0.000 description 1
- 241000235648 Pichia Species 0.000 description 1
- 206010035226 Plasma cell myeloma Diseases 0.000 description 1
- 102100030304 Platelet factor 4 Human genes 0.000 description 1
- 108090000778 Platelet factor 4 Proteins 0.000 description 1
- 108010071690 Prealbumin Proteins 0.000 description 1
- DRVIASBABBMZTF-GUBZILKMSA-N Pro-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@@H]1CCCN1 DRVIASBABBMZTF-GUBZILKMSA-N 0.000 description 1
- SSSFPISOZOLQNP-GUBZILKMSA-N Pro-Arg-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SSSFPISOZOLQNP-GUBZILKMSA-N 0.000 description 1
- YFNOUBWUIIJQHF-LPEHRKFASA-N Pro-Asp-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)O)C(=O)N2CCC[C@@H]2C(=O)O YFNOUBWUIIJQHF-LPEHRKFASA-N 0.000 description 1
- KTFZQPLSPLWLKN-KKUMJFAQSA-N Pro-Gln-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KTFZQPLSPLWLKN-KKUMJFAQSA-N 0.000 description 1
- UUHXBJHVTVGSKM-BQBZGAKWSA-N Pro-Gly-Asn Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O UUHXBJHVTVGSKM-BQBZGAKWSA-N 0.000 description 1
- FYKUEXMZYFIZKA-DCAQKATOSA-N Pro-Pro-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O FYKUEXMZYFIZKA-DCAQKATOSA-N 0.000 description 1
- NAIPAPCKKRCMBL-JYJNAYRXSA-N Pro-Pro-Phe Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H]1NCCC1)C1=CC=CC=C1 NAIPAPCKKRCMBL-JYJNAYRXSA-N 0.000 description 1
- OWQXAJQZLWHPBH-FXQIFTODSA-N Pro-Ser-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O OWQXAJQZLWHPBH-FXQIFTODSA-N 0.000 description 1
- SEZGGSHLMROBFX-CIUDSAMLSA-N Pro-Ser-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O SEZGGSHLMROBFX-CIUDSAMLSA-N 0.000 description 1
- SNGZLPOXVRTNMB-LPEHRKFASA-N Pro-Ser-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N2CCC[C@@H]2C(=O)O SNGZLPOXVRTNMB-LPEHRKFASA-N 0.000 description 1
- VVAWNPIOYXAMAL-KJEVXHAQSA-N Pro-Thr-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VVAWNPIOYXAMAL-KJEVXHAQSA-N 0.000 description 1
- FIDNSJUXESUDOV-JYJNAYRXSA-N Pro-Tyr-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O FIDNSJUXESUDOV-JYJNAYRXSA-N 0.000 description 1
- IMNVAOPEMFDAQD-NHCYSSNCSA-N Pro-Val-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IMNVAOPEMFDAQD-NHCYSSNCSA-N 0.000 description 1
- ZMLRZBWCXPQADC-TUAOUCFPSA-N Pro-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 ZMLRZBWCXPQADC-TUAOUCFPSA-N 0.000 description 1
- 102100024622 Proenkephalin-B Human genes 0.000 description 1
- 108010057464 Prolactin Proteins 0.000 description 1
- 102000003946 Prolactin Human genes 0.000 description 1
- 108010079005 RDV peptide Proteins 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 102000003743 Relaxin Human genes 0.000 description 1
- 108090000103 Relaxin Proteins 0.000 description 1
- 241000235070 Saccharomyces Species 0.000 description 1
- 101100269369 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) AGE1 gene Proteins 0.000 description 1
- 108010086019 Secretin Proteins 0.000 description 1
- 102100037505 Secretin Human genes 0.000 description 1
- MMGJPDWSIOAGTH-ACZMJKKPSA-N Ser-Ala-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MMGJPDWSIOAGTH-ACZMJKKPSA-N 0.000 description 1
- OOKCGAYXSNJBGQ-ZLUOBGJFSA-N Ser-Asn-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OOKCGAYXSNJBGQ-ZLUOBGJFSA-N 0.000 description 1
- UBRXAVQWXOWRSJ-ZLUOBGJFSA-N Ser-Asn-Asp Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CO)N)C(=O)N UBRXAVQWXOWRSJ-ZLUOBGJFSA-N 0.000 description 1
- FMDHKPRACUXATF-ACZMJKKPSA-N Ser-Gln-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O FMDHKPRACUXATF-ACZMJKKPSA-N 0.000 description 1
- BPMRXBZYPGYPJN-WHFBIAKZSA-N Ser-Gly-Asn Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O BPMRXBZYPGYPJN-WHFBIAKZSA-N 0.000 description 1
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 1
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 1
- XXXAXOWMBOKTRN-XPUUQOCRSA-N Ser-Gly-Val Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXXAXOWMBOKTRN-XPUUQOCRSA-N 0.000 description 1
- XXNYYSXNXCJYKX-DCAQKATOSA-N Ser-Leu-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O XXNYYSXNXCJYKX-DCAQKATOSA-N 0.000 description 1
- NNFMANHDYSVNIO-DCAQKATOSA-N Ser-Lys-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NNFMANHDYSVNIO-DCAQKATOSA-N 0.000 description 1
- XKFJENWJGHMDLI-QWRGUYRKSA-N Ser-Phe-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O XKFJENWJGHMDLI-QWRGUYRKSA-N 0.000 description 1
- KZPRPBLHYMZIMH-MXAVVETBSA-N Ser-Phe-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KZPRPBLHYMZIMH-MXAVVETBSA-N 0.000 description 1
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 1
- VLMIUSLQONKLDV-HEIBUPTGSA-N Ser-Thr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VLMIUSLQONKLDV-HEIBUPTGSA-N 0.000 description 1
- BDMWLJLPPUCLNV-XGEHTFHBSA-N Ser-Thr-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BDMWLJLPPUCLNV-XGEHTFHBSA-N 0.000 description 1
- QYBRQMLZDDJBSW-AVGNSLFASA-N Ser-Tyr-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O QYBRQMLZDDJBSW-AVGNSLFASA-N 0.000 description 1
- 102100023105 Sialin Human genes 0.000 description 1
- 101710105284 Sialin Proteins 0.000 description 1
- 102220497176 Small vasohibin-binding protein_T47D_mutation Human genes 0.000 description 1
- 101710142969 Somatoliberin Proteins 0.000 description 1
- 102100022831 Somatoliberin Human genes 0.000 description 1
- 108010056088 Somatostatin Proteins 0.000 description 1
- 102000005157 Somatostatin Human genes 0.000 description 1
- 108010061312 Sphingomyelin Phosphodiesterase Proteins 0.000 description 1
- 241000256251 Spodoptera frugiperda Species 0.000 description 1
- 101000857870 Squalus acanthias Gonadoliberin Proteins 0.000 description 1
- 108010055297 Sterol Esterase Proteins 0.000 description 1
- 241000193996 Streptococcus pyogenes Species 0.000 description 1
- 101710172711 Structural protein Proteins 0.000 description 1
- 102000005262 Sulfatase Human genes 0.000 description 1
- 102000017299 Synapsin-1 Human genes 0.000 description 1
- 108050005241 Synapsin-1 Proteins 0.000 description 1
- 101710197509 Synapsin-2 Proteins 0.000 description 1
- 102100021994 Synapsin-2 Human genes 0.000 description 1
- 108091046869 Telomeric non-coding RNA Proteins 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- KEGBFULVYKYJRD-LFSVMHDDSA-N Thr-Ala-Phe Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KEGBFULVYKYJRD-LFSVMHDDSA-N 0.000 description 1
- LVHHEVGYAZGXDE-KDXUFGMBSA-N Thr-Ala-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(=O)O)N)O LVHHEVGYAZGXDE-KDXUFGMBSA-N 0.000 description 1
- WFUAUEQXPVNAEF-ZJDVBMNYSA-N Thr-Arg-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CCCN=C(N)N WFUAUEQXPVNAEF-ZJDVBMNYSA-N 0.000 description 1
- QGXCWPNQVCYJEL-NUMRIWBASA-N Thr-Asn-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QGXCWPNQVCYJEL-NUMRIWBASA-N 0.000 description 1
- JEDIEMIJYSRUBB-FOHZUACHSA-N Thr-Asp-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O JEDIEMIJYSRUBB-FOHZUACHSA-N 0.000 description 1
- OHAJHDJOCKKJLV-LKXGYXEUSA-N Thr-Asp-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O OHAJHDJOCKKJLV-LKXGYXEUSA-N 0.000 description 1
- SHOMROOOQBDGRL-JHEQGTHGSA-N Thr-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SHOMROOOQBDGRL-JHEQGTHGSA-N 0.000 description 1
- KCRQEJSKXAIULJ-FJXKBIBVSA-N Thr-Gly-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O KCRQEJSKXAIULJ-FJXKBIBVSA-N 0.000 description 1
- VYEHBMMAJFVTOI-JHEQGTHGSA-N Thr-Gly-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O VYEHBMMAJFVTOI-JHEQGTHGSA-N 0.000 description 1
- YSXYEJWDHBCTDJ-DVJZZOLTSA-N Thr-Gly-Trp Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O YSXYEJWDHBCTDJ-DVJZZOLTSA-N 0.000 description 1
- XOWKUMFHEZLKLT-CIQUZCHMSA-N Thr-Ile-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O XOWKUMFHEZLKLT-CIQUZCHMSA-N 0.000 description 1
- IMDMLDSVUSMAEJ-HJGDQZAQSA-N Thr-Leu-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IMDMLDSVUSMAEJ-HJGDQZAQSA-N 0.000 description 1
- UJQVSMNQMQHVRY-KZVJFYERSA-N Thr-Met-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O UJQVSMNQMQHVRY-KZVJFYERSA-N 0.000 description 1
- IWAVRIPRTCJAQO-HSHDSVGOSA-N Thr-Pro-Trp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O IWAVRIPRTCJAQO-HSHDSVGOSA-N 0.000 description 1
- ZMYCLHFLHRVOEA-HEIBUPTGSA-N Thr-Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ZMYCLHFLHRVOEA-HEIBUPTGSA-N 0.000 description 1
- 108090000190 Thrombin Proteins 0.000 description 1
- 108010000499 Thromboplastin Proteins 0.000 description 1
- 102000002262 Thromboplastin Human genes 0.000 description 1
- 102000011923 Thyrotropin Human genes 0.000 description 1
- 108010061174 Thyrotropin Proteins 0.000 description 1
- 239000000627 Thyrotropin-Releasing Hormone Substances 0.000 description 1
- 102400000336 Thyrotropin-releasing hormone Human genes 0.000 description 1
- 101800004623 Thyrotropin-releasing hormone Proteins 0.000 description 1
- 102100029290 Transthyretin Human genes 0.000 description 1
- QNTBGBCOEYNAPV-CWRNSKLLSA-N Trp-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)O QNTBGBCOEYNAPV-CWRNSKLLSA-N 0.000 description 1
- XZLHHHYSWIYXHD-XIRDDKMYSA-N Trp-Gln-Arg Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O XZLHHHYSWIYXHD-XIRDDKMYSA-N 0.000 description 1
- YXONONCLMLHWJX-SZMVWBNQSA-N Trp-Glu-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O)=CNC2=C1 YXONONCLMLHWJX-SZMVWBNQSA-N 0.000 description 1
- YRSOERSDNRSCBC-XIRDDKMYSA-N Trp-His-Cys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CN=CN3)C(=O)N[C@@H](CS)C(=O)O)N YRSOERSDNRSCBC-XIRDDKMYSA-N 0.000 description 1
- VPRHDRKAPYZMHL-SZMVWBNQSA-N Trp-Leu-Glu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 VPRHDRKAPYZMHL-SZMVWBNQSA-N 0.000 description 1
- UJRIVCPPPMYCNA-HOCLYGCPSA-N Trp-Leu-Gly Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N UJRIVCPPPMYCNA-HOCLYGCPSA-N 0.000 description 1
- WMIUTJPFHMMUGY-ZFWWWQNUSA-N Trp-Pro-Gly Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)NCC(=O)O WMIUTJPFHMMUGY-ZFWWWQNUSA-N 0.000 description 1
- 102000015098 Tumor Suppressor Protein p53 Human genes 0.000 description 1
- 108010078814 Tumor Suppressor Protein p53 Proteins 0.000 description 1
- 102100040247 Tumor necrosis factor Human genes 0.000 description 1
- SDNVRAKIJVKAGS-LKTVYLICSA-N Tyr-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N SDNVRAKIJVKAGS-LKTVYLICSA-N 0.000 description 1
- HKIUVWMZYFBIHG-KKUMJFAQSA-N Tyr-Arg-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O HKIUVWMZYFBIHG-KKUMJFAQSA-N 0.000 description 1
- CYDVHRFXDMDMGX-KKUMJFAQSA-N Tyr-Asn-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O CYDVHRFXDMDMGX-KKUMJFAQSA-N 0.000 description 1
- JWGXUKHIKXZWNG-RYUDHWBXSA-N Tyr-Gly-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O JWGXUKHIKXZWNG-RYUDHWBXSA-N 0.000 description 1
- DWAMXBFJNZIHMC-KBPBESRZSA-N Tyr-Leu-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O DWAMXBFJNZIHMC-KBPBESRZSA-N 0.000 description 1
- PRONOHBTMLNXCZ-BZSNNMDCSA-N Tyr-Leu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PRONOHBTMLNXCZ-BZSNNMDCSA-N 0.000 description 1
- BYAKMYBZADCNMN-JYJNAYRXSA-N Tyr-Lys-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O BYAKMYBZADCNMN-JYJNAYRXSA-N 0.000 description 1
- QFXVAFIHVWXXBJ-AVGNSLFASA-N Tyr-Ser-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O QFXVAFIHVWXXBJ-AVGNSLFASA-N 0.000 description 1
- WQOHKVRQDLNDIL-YJRXYDGGSA-N Tyr-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O WQOHKVRQDLNDIL-YJRXYDGGSA-N 0.000 description 1
- HZDQUVQEVVYDDA-ACRUOGEOSA-N Tyr-Tyr-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HZDQUVQEVVYDDA-ACRUOGEOSA-N 0.000 description 1
- QVYFTFIBKCDHIE-ACRUOGEOSA-N Tyr-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O QVYFTFIBKCDHIE-ACRUOGEOSA-N 0.000 description 1
- ASQFIHTXXMFENG-XPUUQOCRSA-N Val-Ala-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O ASQFIHTXXMFENG-XPUUQOCRSA-N 0.000 description 1
- SLLKXDSRVAOREO-KZVJFYERSA-N Val-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N)O SLLKXDSRVAOREO-KZVJFYERSA-N 0.000 description 1
- QPZMOUMNTGTEFR-ZKWXMUAHSA-N Val-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N QPZMOUMNTGTEFR-ZKWXMUAHSA-N 0.000 description 1
- OUUBKKIJQIAPRI-LAEOZQHASA-N Val-Gln-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OUUBKKIJQIAPRI-LAEOZQHASA-N 0.000 description 1
- SZTTYWIUCGSURQ-AUTRQRHGSA-N Val-Glu-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SZTTYWIUCGSURQ-AUTRQRHGSA-N 0.000 description 1
- FOADDSDHGRFUOC-DZKIICNBSA-N Val-Glu-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N FOADDSDHGRFUOC-DZKIICNBSA-N 0.000 description 1
- LAYSXAOGWHKNED-XPUUQOCRSA-N Val-Gly-Ser Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LAYSXAOGWHKNED-XPUUQOCRSA-N 0.000 description 1
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 1
- UZFNHAXYMICTBU-DZKIICNBSA-N Val-Phe-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N UZFNHAXYMICTBU-DZKIICNBSA-N 0.000 description 1
- QIVPZSWBBHRNBA-JYJNAYRXSA-N Val-Pro-Phe Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O QIVPZSWBBHRNBA-JYJNAYRXSA-N 0.000 description 1
- NZYNRRGJJVSSTJ-GUBZILKMSA-N Val-Ser-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NZYNRRGJJVSSTJ-GUBZILKMSA-N 0.000 description 1
- UQMPYVLTQCGRSK-IFFSRLJSSA-N Val-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N)O UQMPYVLTQCGRSK-IFFSRLJSSA-N 0.000 description 1
- JXWGBRRVTRAZQA-ULQDDVLXSA-N Val-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N JXWGBRRVTRAZQA-ULQDDVLXSA-N 0.000 description 1
- 108010073929 Vascular Endothelial Growth Factor A Proteins 0.000 description 1
- 108010073923 Vascular Endothelial Growth Factor C Proteins 0.000 description 1
- 102100038232 Vascular endothelial growth factor C Human genes 0.000 description 1
- GXBMIBRIOWHPDT-UHFFFAOYSA-N Vasopressin Natural products N1C(=O)C(CC=2C=C(O)C=CC=2)NC(=O)C(N)CSSCC(C(=O)N2C(CCC2)C(=O)NC(CCCN=C(N)N)C(=O)NCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(CCC(N)=O)NC(=O)C1CC1=CC=CC=C1 GXBMIBRIOWHPDT-UHFFFAOYSA-N 0.000 description 1
- 108010004977 Vasopressins Proteins 0.000 description 1
- 102000002852 Vasopressins Human genes 0.000 description 1
- 108020005202 Viral DNA Proteins 0.000 description 1
- 108700005077 Viral Genes Proteins 0.000 description 1
- 208000036142 Viral infection Diseases 0.000 description 1
- IEDXPSOJFSVCKU-HOKPPMCLSA-N [4-[[(2S)-5-(carbamoylamino)-2-[[(2S)-2-[6-(2,5-dioxopyrrolidin-1-yl)hexanoylamino]-3-methylbutanoyl]amino]pentanoyl]amino]phenyl]methyl N-[(2S)-1-[[(2S)-1-[[(3R,4S,5S)-1-[(2S)-2-[(1R,2R)-3-[[(1S,2R)-1-hydroxy-1-phenylpropan-2-yl]amino]-1-methoxy-2-methyl-3-oxopropyl]pyrrolidin-1-yl]-3-methoxy-5-methyl-1-oxoheptan-4-yl]-methylamino]-3-methyl-1-oxobutan-2-yl]amino]-3-methyl-1-oxobutan-2-yl]-N-methylcarbamate Chemical compound CC[C@H](C)[C@@H]([C@@H](CC(=O)N1CCC[C@H]1[C@H](OC)[C@@H](C)C(=O)N[C@H](C)[C@@H](O)c1ccccc1)OC)N(C)C(=O)[C@@H](NC(=O)[C@H](C(C)C)N(C)C(=O)OCc1ccc(NC(=O)[C@H](CCCNC(N)=O)NC(=O)[C@@H](NC(=O)CCCCCN2C(=O)CCC2=O)C(C)C)cc1)C(C)C IEDXPSOJFSVCKU-HOKPPMCLSA-N 0.000 description 1
- 229960000446 abciximab Drugs 0.000 description 1
- 102000010126 acid sphingomyelin phosphodiesterase activity proteins Human genes 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 229960002964 adalimumab Drugs 0.000 description 1
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 1
- 108010044940 alanylglutamine Proteins 0.000 description 1
- 229960000548 alemtuzumab Drugs 0.000 description 1
- 108010060162 alglucerase Proteins 0.000 description 1
- 229960003122 alglucerase Drugs 0.000 description 1
- 229960004539 alirocumab Drugs 0.000 description 1
- 108010030291 alpha-Galactosidase Proteins 0.000 description 1
- 102000012086 alpha-L-Fucosidase Human genes 0.000 description 1
- 108010061314 alpha-L-Fucosidase Proteins 0.000 description 1
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 1
- 102000019199 alpha-Mannosidase Human genes 0.000 description 1
- 108010012864 alpha-Mannosidase Proteins 0.000 description 1
- 108010009380 alpha-N-acetyl-D-glucosaminidase Proteins 0.000 description 1
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 1
- 229940126575 aminoglycoside Drugs 0.000 description 1
- 239000004037 angiogenesis inhibitor Substances 0.000 description 1
- 230000002491 angiogenic effect Effects 0.000 description 1
- 229950006323 angiotensin ii Drugs 0.000 description 1
- 150000001450 anions Chemical class 0.000 description 1
- 230000000340 anti-metabolite Effects 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 229940100197 antimetabolite Drugs 0.000 description 1
- 239000002256 antimetabolite Substances 0.000 description 1
- 230000006907 apoptotic process Effects 0.000 description 1
- KBZOIRJILGZLEJ-LGYYRGKSSA-N argipressin Chemical compound C([C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CSSC[C@@H](C(N[C@@H](CC=2C=CC(O)=CC=2)C(=O)N1)=O)N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(N)=O)C1=CC=CC=C1 KBZOIRJILGZLEJ-LGYYRGKSSA-N 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 210000001130 astrocyte Anatomy 0.000 description 1
- 229960003852 atezolizumab Drugs 0.000 description 1
- 229950002916 avelumab Drugs 0.000 description 1
- 229960004669 basiliximab Drugs 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 229960003270 belimumab Drugs 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 229950000321 benralizumab Drugs 0.000 description 1
- 108010055059 beta-Mannosidase Proteins 0.000 description 1
- WOPZMFQRCBYPJU-NTXHZHDSSA-N beta-endorphin Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](NC(=O)[C@@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CCSC)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)CNC(=O)CNC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)[C@@H](C)O)[C@@H](C)O)C(C)C)[C@@H](C)O)C1=CC=CC=C1 WOPZMFQRCBYPJU-NTXHZHDSSA-N 0.000 description 1
- 102000006635 beta-lactamase Human genes 0.000 description 1
- 229960000397 bevacizumab Drugs 0.000 description 1
- 229950008086 bezlotoxumab Drugs 0.000 description 1
- 238000001815 biotherapy Methods 0.000 description 1
- 229960003008 blinatumomab Drugs 0.000 description 1
- 239000003114 blood coagulation factor Substances 0.000 description 1
- DNDCVAGJPBKION-DOPDSADYSA-N bombesin Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(N)=O)NC(=O)CNC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](CC=1NC2=CC=CC=C2C=1)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H]1NC(=O)CC1)C(C)C)C1=CN=CN1 DNDCVAGJPBKION-DOPDSADYSA-N 0.000 description 1
- QXZGBUJJYSLZLT-FDISYFBBSA-N bradykinin Chemical compound NC(=N)NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(=O)NCC(=O)N[C@@H](CC=2C=CC=CC=2)C(=O)N[C@@H](CO)C(=O)N2[C@@H](CCC2)C(=O)N[C@@H](CC=2C=CC=CC=2)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)CCC1 QXZGBUJJYSLZLT-FDISYFBBSA-N 0.000 description 1
- 229960000455 brentuximab vedotin Drugs 0.000 description 1
- 229960003735 brodalumab Drugs 0.000 description 1
- 229950000025 brolucizumab Drugs 0.000 description 1
- 229950002817 burosumab Drugs 0.000 description 1
- 229960004015 calcitonin Drugs 0.000 description 1
- BBBFJLBPOGFECG-VJVYQDLKSA-N calcitonin Chemical compound N([C@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N1[C@@H](CCC1)C(N)=O)C(C)C)C(=O)[C@@H]1CSSC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1 BBBFJLBPOGFECG-VJVYQDLKSA-N 0.000 description 1
- 229960001838 canakinumab Drugs 0.000 description 1
- 229950002176 caplacizumab Drugs 0.000 description 1
- 108010023376 caplacizumab Proteins 0.000 description 1
- NSQLIUXCMFBZME-MPVJKSABSA-N carperitide Chemical compound C([C@H]1C(=O)NCC(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@H](C(NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CSSC[C@@H](C(=O)N1)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)=O)[C@@H](C)CC)C1=CC=CC=C1 NSQLIUXCMFBZME-MPVJKSABSA-N 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 229960000419 catumaxomab Drugs 0.000 description 1
- 229940121420 cemiplimab Drugs 0.000 description 1
- 210000003169 central nervous system Anatomy 0.000 description 1
- 229960003115 certolizumab pegol Drugs 0.000 description 1
- 229960005395 cetuximab Drugs 0.000 description 1
- AOXOCDRNSPFDPE-UKEONUMOSA-N chembl413654 Chemical compound C([C@H](C(=O)NCC(=O)N[C@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@H](CCSC)C(=O)N[C@H](CC(O)=O)C(=O)N[C@H](CC=1C=CC=CC=1)C(N)=O)NC(=O)[C@@H](C)NC(=O)[C@@H](CCC(O)=O)NC(=O)[C@@H](CCC(O)=O)NC(=O)[C@@H](CCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H]1N(CCC1)C(=O)CNC(=O)[C@@H](N)CCC(O)=O)C1=CC=C(O)C=C1 AOXOCDRNSPFDPE-UKEONUMOSA-N 0.000 description 1
- 229940107137 cholecystokinin Drugs 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 229940105778 coagulation factor viii Drugs 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 101150055601 cops2 gene Proteins 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 230000009089 cytolysis Effects 0.000 description 1
- 229960002806 daclizumab Drugs 0.000 description 1
- 229960002204 daratumumab Drugs 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 229960001251 denosumab Drugs 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 229960004497 dinutuximab Drugs 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000035475 disorder Diseases 0.000 description 1
- 231100000673 dose–response relationship Toxicity 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 229950003468 dupilumab Drugs 0.000 description 1
- 229950009791 durvalumab Drugs 0.000 description 1
- 229960002224 eculizumab Drugs 0.000 description 1
- 229960001776 edrecolomab Drugs 0.000 description 1
- 229960000284 efalizumab Drugs 0.000 description 1
- 239000012636 effector Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 229960004137 elotuzumab Drugs 0.000 description 1
- 238000010828 elution Methods 0.000 description 1
- 229950004645 emapalumab Drugs 0.000 description 1
- 229950006925 emicizumab Drugs 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000003248 enzyme activator Substances 0.000 description 1
- 229950006063 eptinezumab Drugs 0.000 description 1
- 229950001616 erenumab Drugs 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 229960002027 evolocumab Drugs 0.000 description 1
- 229960004222 factor ix Drugs 0.000 description 1
- 229960000301 factor viii Drugs 0.000 description 1
- 229940012426 factor x Drugs 0.000 description 1
- 229950003499 fibrin Drugs 0.000 description 1
- 239000003527 fibrinolytic agent Substances 0.000 description 1
- 229940126864 fibroblast growth factor Drugs 0.000 description 1
- 229950011509 fremanezumab Drugs 0.000 description 1
- 229930182830 galactose Natural products 0.000 description 1
- 229950000118 galcanezumab Drugs 0.000 description 1
- 229960003297 gemtuzumab ozogamicin Drugs 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 229960004666 glucagon Drugs 0.000 description 1
- MASNOZXLGMXCHN-ZLPAWPGGSA-N glucagon Chemical compound C([C@@H](C(=O)N[C@H](C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)C(C)C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](C)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CO)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC=1NC=NC=1)[C@@H](C)O)[C@@H](C)O)C1=CC=CC=C1 MASNOZXLGMXCHN-ZLPAWPGGSA-N 0.000 description 1
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 1
- 208000007345 glycogen storage disease Diseases 0.000 description 1
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 1
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 1
- 108010077435 glycyl-phenylalanyl-glycine Proteins 0.000 description 1
- 108010059898 glycyl-tyrosyl-lysine Proteins 0.000 description 1
- 108010050848 glycylleucine Proteins 0.000 description 1
- 108010077515 glycylproline Proteins 0.000 description 1
- 108010037850 glycylvaline Proteins 0.000 description 1
- 229960001743 golimumab Drugs 0.000 description 1
- XLXSAKCOAKORKW-AQJXLSMYSA-N gonadorelin Chemical compound C([C@@H](C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N1[C@@H](CCC1)C(=O)NCC(N)=O)NC(=O)[C@H](CO)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CC=1N=CNC=1)NC(=O)[C@H]1NC(=O)CC1)C1=CC=C(O)C=C1 XLXSAKCOAKORKW-AQJXLSMYSA-N 0.000 description 1
- 229940035638 gonadotropin-releasing hormone Drugs 0.000 description 1
- 229950010864 guselkumab Drugs 0.000 description 1
- 239000000185 hemagglutinin Substances 0.000 description 1
- 108010089932 heparan sulfate sulfatase Proteins 0.000 description 1
- 229940006607 hirudin Drugs 0.000 description 1
- WQPDUTSPKFMPDP-OUMQNGNKSA-N hirudin Chemical compound C([C@@H](C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C=CC(OS(O)(=O)=O)=CC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CCCCN)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](NC(=O)[C@H]1NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(O)=O)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]2CSSC[C@@H](C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(=O)N[C@H](C(NCC(=O)N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N2)=O)CSSC1)C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H]1NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)CNC(=O)[C@H](CO)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CC=2C=CC(O)=CC=2)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)C(C)C)[C@@H](C)O)CSSC1)C(C)C)[C@@H](C)O)[C@@H](C)O)C1=CC=CC=C1 WQPDUTSPKFMPDP-OUMQNGNKSA-N 0.000 description 1
- 108010040030 histidinoalanine Proteins 0.000 description 1
- 108010025306 histidylleucine Proteins 0.000 description 1
- 108010092114 histidylphenylalanine Proteins 0.000 description 1
- 102000053020 human ApoE Human genes 0.000 description 1
- 102000049157 human CALM1 Human genes 0.000 description 1
- 102000053929 human ENO2 Human genes 0.000 description 1
- 102000051520 human GFAP Human genes 0.000 description 1
- 102000056508 human PLP1 Human genes 0.000 description 1
- 102000056556 human TTR Human genes 0.000 description 1
- 102000058223 human VEGFA Human genes 0.000 description 1
- 229960002773 hyaluronidase Drugs 0.000 description 1
- 229950010245 ibalizumab Drugs 0.000 description 1
- 229960002308 idarucizumab Drugs 0.000 description 1
- 108010039650 imiglucerase Proteins 0.000 description 1
- 229960002127 imiglucerase Drugs 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 229960000598 infliximab Drugs 0.000 description 1
- 206010022000 influenza Diseases 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 229940125396 insulin Drugs 0.000 description 1
- 102000002467 interleukin receptors Human genes 0.000 description 1
- 108010093036 interleukin receptors Proteins 0.000 description 1
- 229940047122 interleukins Drugs 0.000 description 1
- 229960005386 ipilimumab Drugs 0.000 description 1
- 229950007752 isatuximab Drugs 0.000 description 1
- 229960005435 ixekizumab Drugs 0.000 description 1
- 229940121292 leronlimab Drugs 0.000 description 1
- 108010034529 leucyl-lysine Proteins 0.000 description 1
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 1
- 108010047926 leucyl-lysyl-tyrosine Proteins 0.000 description 1
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 1
- 108010057821 leucylproline Proteins 0.000 description 1
- 108010012058 leucyltyrosine Proteins 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 229940040129 luteinizing hormone Drugs 0.000 description 1
- 230000002132 lysosomal effect Effects 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 210000002540 macrophage Anatomy 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 229960005108 mepolizumab Drugs 0.000 description 1
- 229960000485 methotrexate Drugs 0.000 description 1
- CWWARWOPSKGELM-SARDKLJWSA-N methyl (2s)-2-[[(2s)-2-[[2-[[(2s)-2-[[(2s)-2-[[(2s)-5-amino-2-[[(2s)-5-amino-2-[[(2s)-1-[(2s)-6-amino-2-[[(2s)-1-[(2s)-2-amino-5-(diaminomethylideneamino)pentanoyl]pyrrolidine-2-carbonyl]amino]hexanoyl]pyrrolidine-2-carbonyl]amino]-5-oxopentanoyl]amino]-5 Chemical compound C([C@@H](C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)OC)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CCCCN)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CCCN=C(N)N)C1=CC=CC=C1 CWWARWOPSKGELM-SARDKLJWSA-N 0.000 description 1
- HPNSFSBZBAHARI-UHFFFAOYSA-N micophenolic acid Natural products OC1=C(CC=C(C)CCC(O)=O)C(OC)=C(C)C2=C1C(=O)OC2 HPNSFSBZBAHARI-UHFFFAOYSA-N 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 230000002025 microglial effect Effects 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 230000002438 mitochondrial effect Effects 0.000 description 1
- 229950007699 mogamulizumab Drugs 0.000 description 1
- 238000009126 molecular therapy Methods 0.000 description 1
- SLZIZIJTGAYEKK-CIJSCKBQSA-N molport-023-220-247 Chemical compound C([C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1N=CNC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1N=CNC=1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(N)=O)NC(=O)[C@H]1N(CCC1)C(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)CNC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)CN)[C@@H](C)O)C1=CNC=N1 SLZIZIJTGAYEKK-CIJSCKBQSA-N 0.000 description 1
- 229960003816 muromonab-cd3 Drugs 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 229960000951 mycophenolic acid Drugs 0.000 description 1
- HPNSFSBZBAHARI-RUDMXATFSA-N mycophenolic acid Chemical compound OC1=C(C\C=C(/C)CCC(O)=O)C(OC)=C(C)C2=C1C(=O)OC2 HPNSFSBZBAHARI-RUDMXATFSA-N 0.000 description 1
- 201000000050 myeloid neoplasm Diseases 0.000 description 1
- 229950006780 n-acetylglucosamine Drugs 0.000 description 1
- 229960005027 natalizumab Drugs 0.000 description 1
- 229960000513 necitumumab Drugs 0.000 description 1
- 210000004498 neuroglial cell Anatomy 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- PCJGZPGTCUMMOT-ISULXFBGSA-N neurotensin Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CC(C)C)NC(=O)[C@H]1NC(=O)CC1)C1=CC=C(O)C=C1 PCJGZPGTCUMMOT-ISULXFBGSA-N 0.000 description 1
- 229940032018 neurotrophin 3 Drugs 0.000 description 1
- 229940097998 neurotrophin 4 Drugs 0.000 description 1
- 229960003301 nivolumab Drugs 0.000 description 1
- URPYMXQQVHTUDU-OFGSCBOVSA-N nucleopeptide y Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(N)=O)NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CNC(=O)[C@H]1N(CCC1)C(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CO)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 URPYMXQQVHTUDU-OFGSCBOVSA-N 0.000 description 1
- 229960003347 obinutuzumab Drugs 0.000 description 1
- 229950005751 ocrelizumab Drugs 0.000 description 1
- 201000007909 oculocutaneous albinism Diseases 0.000 description 1
- 229960002450 ofatumumab Drugs 0.000 description 1
- 229950008516 olaratumab Drugs 0.000 description 1
- 210000004248 oligodendroglia Anatomy 0.000 description 1
- 229960000470 omalizumab Drugs 0.000 description 1
- 108091008819 oncoproteins Proteins 0.000 description 1
- 102000027450 oncoproteins Human genes 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 229960001723 oxytocin Drugs 0.000 description 1
- XNOPRXBHLZRZKH-DSZYJQQASA-N oxytocin Chemical compound C([C@H]1C(=O)N[C@H](C(N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CSSC[C@H](N)C(=O)N1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(C)C)C(=O)NCC(N)=O)=O)[C@@H](C)CC)C1=CC=C(O)C=C1 XNOPRXBHLZRZKH-DSZYJQQASA-N 0.000 description 1
- 229960000402 palivizumab Drugs 0.000 description 1
- 229960001972 panitumumab Drugs 0.000 description 1
- 229960002621 pembrolizumab Drugs 0.000 description 1
- 229960002087 pertuzumab Drugs 0.000 description 1
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 1
- 108010024607 phenylalanylalanine Proteins 0.000 description 1
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 230000001323 posttranslational effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 229940097325 prolactin Drugs 0.000 description 1
- 108010077112 prolyl-proline Proteins 0.000 description 1
- 108010015796 prolylisoleucine Proteins 0.000 description 1
- 108010090894 prolylleucine Proteins 0.000 description 1
- 235000019833 protease Nutrition 0.000 description 1
- 230000009145 protein modification Effects 0.000 description 1
- 229940023143 protein vaccine Drugs 0.000 description 1
- XNSAINXGIQZQOO-SRVKXCTJSA-N protirelin Chemical compound NC(=O)[C@@H]1CCCN1C(=O)[C@@H](NC(=O)[C@H]1NC(=O)CC1)CC1=CN=CN1 XNSAINXGIQZQOO-SRVKXCTJSA-N 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 238000013441 quality evaluation Methods 0.000 description 1
- 108010033990 rab27 GTP-Binding Proteins Proteins 0.000 description 1
- 102000006581 rab27 GTP-Binding Proteins Human genes 0.000 description 1
- 229960002633 ramucirumab Drugs 0.000 description 1
- 229960003876 ranibizumab Drugs 0.000 description 1
- 229950007085 ravulizumab Drugs 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 101150066583 rep gene Proteins 0.000 description 1
- 229960003254 reslizumab Drugs 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 229950007943 risankizumab Drugs 0.000 description 1
- 229960004641 rituximab Drugs 0.000 description 1
- 229950010968 romosozumab Drugs 0.000 description 1
- 108091008601 sVEGFR Proteins 0.000 description 1
- 229950001460 sacituzumab Drugs 0.000 description 1
- 229950006348 sarilumab Drugs 0.000 description 1
- 229960002101 secretin Drugs 0.000 description 1
- OWMZNFCDEHGFEP-NFBCVYDUSA-N secretin human Chemical compound C([C@@H](C(=O)N[C@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(N)=O)[C@@H](C)O)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC=1NC=NC=1)[C@@H](C)O)C1=CC=CC=C1 OWMZNFCDEHGFEP-NFBCVYDUSA-N 0.000 description 1
- 229960004540 secukinumab Drugs 0.000 description 1
- 239000006152 selective media Substances 0.000 description 1
- 108010026333 seryl-proline Proteins 0.000 description 1
- 229960003323 siltuximab Drugs 0.000 description 1
- IZTQOLKUZKXIRV-YRVFCXMDSA-N sincalide Chemical compound C([C@@H](C(=O)N[C@@H](CCSC)C(=O)NCC(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(N)=O)NC(=O)[C@@H](N)CC(O)=O)C1=CC=C(OS(O)(=O)=O)C=C1 IZTQOLKUZKXIRV-YRVFCXMDSA-N 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 229960000553 somatostatin Drugs 0.000 description 1
- NHXLMOGPVYXJNR-ATOGVRKGSA-N somatostatin Chemical compound C([C@H]1C(=O)N[C@H](C(N[C@@H](CO)C(=O)N[C@@H](CSSC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=2C=CC=CC=2)C(=O)N[C@@H](CC=2C=CC=CC=2)C(=O)N[C@@H](CC=2C3=CC=CC=C3NC=2)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(=O)N1)[C@@H](C)O)NC(=O)CNC(=O)[C@H](C)N)C(O)=O)=O)[C@H](O)C)C1=CC=CC=C1 NHXLMOGPVYXJNR-ATOGVRKGSA-N 0.000 description 1
- 238000001179 sorption measurement Methods 0.000 description 1
- 210000000130 stem cell Anatomy 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 108060007951 sulfatase Proteins 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 229950010259 teprotumumab Drugs 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- 108010061238 threonyl-glycine Proteins 0.000 description 1
- 229960004072 thrombin Drugs 0.000 description 1
- 229960000103 thrombolytic agent Drugs 0.000 description 1
- 229960000874 thyrotropin Drugs 0.000 description 1
- 230000001748 thyrotropin Effects 0.000 description 1
- 229940034199 thyrotropin-releasing hormone Drugs 0.000 description 1
- 229950005515 tildrakizumab Drugs 0.000 description 1
- 229960003989 tocilizumab Drugs 0.000 description 1
- 229960005267 tositumomab Drugs 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 238000003151 transfection method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000003146 transient transfection Methods 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- 229960000575 trastuzumab Drugs 0.000 description 1
- 108010015666 tryptophyl-leucyl-glutamic acid Proteins 0.000 description 1
- 108010038745 tryptophylglycine Proteins 0.000 description 1
- 108010045269 tryptophyltryptophan Proteins 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- VBEQCZHXXJYVRD-GACYYNSASA-N uroanthelone Chemical compound C([C@@H](C(=O)N[C@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)C(C)C)[C@@H](C)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CCSC)NC(=O)[C@H](CS)NC(=O)[C@@H](NC(=O)CNC(=O)CNC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CS)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CS)NC(=O)CNC(=O)[C@H]1N(CCC1)C(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O)C(C)C)[C@@H](C)CC)C1=CC=C(O)C=C1 VBEQCZHXXJYVRD-GACYYNSASA-N 0.000 description 1
- 229960003824 ustekinumab Drugs 0.000 description 1
- 229960003726 vasopressin Drugs 0.000 description 1
- 229960004914 vedolizumab Drugs 0.000 description 1
- 230000009385 viral infection Effects 0.000 description 1
- 230000006656 viral protein synthesis Effects 0.000 description 1
- PJVWKTKQMONHTI-UHFFFAOYSA-N warfarin Chemical compound OC=1C2=CC=CC=C2OC(=O)C=1C(CC(=O)C)C1=CC=CC=C1 PJVWKTKQMONHTI-UHFFFAOYSA-N 0.000 description 1
- 229960005080 warfarin Drugs 0.000 description 1
- 230000003442 weekly effect Effects 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/005—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K16/00—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
- C07K16/18—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
- C12N5/06—Animal cells or tissues; Human cells or tissues
- C12N5/0601—Invertebrate cells or tissues, e.g. insect cells; Culture media therefor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0071—Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y114/00—Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
- C12Y114/16—Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14) with reduced pteridine as one donor, and incorporation of one atom of oxygen (1.14.16)
- C12Y114/16001—Phenylalanine 4-monooxygenase (1.14.16.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y301/00—Hydrolases acting on ester bonds (3.1)
- C12Y301/06—Sulfuric ester hydrolases (3.1.6)
- C12Y301/06013—Iduronate-2-sulfatase (3.1.6.13)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14122—New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
- C12N2750/14143—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14151—Methods of production or purification of viral material
- C12N2750/14152—Methods of production or purification of viral material relating to complementing cells and packaging systems for producing virus or viral particles
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/40—Systems of functionally co-operating vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/50—Vector systems having a special element relevant for transcription regulating RNA stability, not being an intron, e.g. poly A signal
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biotechnology (AREA)
- Biochemistry (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Medicinal Chemistry (AREA)
- Biophysics (AREA)
- Virology (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Cell Biology (AREA)
- Immunology (AREA)
- Gastroenterology & Hepatology (AREA)
- Pharmacology & Pharmacy (AREA)
- Epidemiology (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
본원은 재조합 아데노-연관된 바이러스(rAAV)의 생산을 위한 이중 벡터 형질주입 시스템을 제공한다. 이중 벡터 형질주입 시스템은 일반적으로 다음을 포함한다: (1) AAV Rep 단백질을 코딩하는 제1 뉴클레오티드 서열, 트랜스진을 포함하는 rAAV 게놈을 포함하는 제2 뉴클레오티드 서열, 및 AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열을 포함하는, 제1 핵산 벡터; 및 (2) 헬퍼 바이러스 유전자를 포함하는 제2 핵산 벡터.
Description
관련 출원
본 출원은 2021 년 6 월 25 일자로 출원된 미국 가특허 출원 일련 번호 63/202,817, 2021 년 10 월 7 일자로 출원된 63/262,218, 및 2022 년 1 월 11 일자로 출원된 63/266,646에 대한 우선권을 주장하며, 이의 전체 개시내용은 참조로 본원에 원용된다.
서열 목록
본 출원은 ASCII 형식으로 전자적으로 제출되었고 그 전체가 본원에 참조로 원용되는 서열 목록을 함유한다 (2022 년 6 월 21 일에 생성된 상기 ASCII 사본은 "HMW-043_SL.txt"로 명명되고 336,866 바이트 크기임).
아데노-연관된 바이러스 (AAV)는 유전자 요법의 목적을 위해 외래 DNA를 세포 내로 전달하기 위한 벡터로서 매력적이게 만드는 독특한 특징을 보유하고 있다. AAV의 상업적 제조는 일반적으로 포유동물 세포 또는 곤충 세포 시스템을 사용한다. 상업적인 포유동물 세포-기반 AAV 생산 시스템은 전형적으로 다음의 3 개의 플라스미드의 세포 내로의 형질주입(transfection)을 수반한다: AAV Rep 및 AAV 캡시드 단백질을 코딩하는 서열을 함유하는 제1 플라스미드; AAV 벡터 게놈을 함유하는 제2 플라스미드; 및 하나 이상의 헬퍼 바이러스 유전자 (보통 아데노바이러스 또는 헤르페스바이러스 유전자)를 함유하는 제3 플라스미드. 효과적이긴 하지만, 이러한 3 개의 플라스미드 AAV 제조 시스템은 최적화하기 복잡하며, 상업적 AAV 치료제와 연관된 상품의 높은 비용에 기여한다.
따라서, 효율적인 AAV 생산을 초래하지만 감소된 복잡성 및 비용을 갖는 개선된 AAV 제조 시스템에 대한 필요성이 당업계에 존재한다.
본 개시내용은 재조합 아데노-연관된 바이러스 (rAAV)의 생산을 위한 이중 벡터 형질주입 시스템을 제공한다. 본원에 기재된 이중 벡터 형질주입 시스템은 일반적으로 다음을 포함한다: (1) AAV Rep 단백질을 코딩하는 제1 뉴클레오티드 서열, 트랜스진을 포함하는 rAAV 게놈을 포함하는 제2 뉴클레오티드 서열 및 AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열을 포함하는, 제1 핵산 벡터; 및 (2) 헬퍼 바이러스 유전자를 포함하는 제2 핵산 벡터. 이러한 이중 벡터 형질주입 시스템에서, 숙주 생산 세포와 함께 제1 핵산 벡터 및 제2 핵산 벡터는 AAV 생산에 필요한 모든 구성요소를 제공한다. 본원에 개시된 이중 벡터 형질주입 시스템은 기존의 삼중 벡터 형질주입 시스템과 비교하여 증가된 rAAV 생산성을 초래하는 것으로 밝혀졌다. 또한, 본원에 기재된 이중 벡터 형질주입 시스템에서 구성요소의 특이적 구성은 선행 기술의 이중 벡터 형질주입 시스템에 비해 우수한 rAAV 생산성을 초래하는 것으로 밝혀졌다.
따라서, 일 양태에서, 본 개시내용은 AAV Rep 단백질을 코딩하는 제1 뉴클레오티드 서열; 트랜스진을 포함하는 재조합 AAV (rAAV) 게놈을 포함하는 제2 뉴클레오티드 서열; 및 AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열을 포함하는, 제1 핵산 벡터를 제공하며, 여기서 핵산 벡터는 헬퍼 바이러스 유전자를 포함하지 않는다.
특정 실시양태에서, 핵산 벡터는 5'으로부터 3'으로, AAV Rep 단백질을 코딩하는 제1 뉴클레오티드 서열; 트랜스진을 포함하는 재조합 AAV (rAAV) 게놈을 포함하는 제2 뉴클레오티드 서열; 및 AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열을 포함하며, 여기서 핵산 벡터는 헬퍼 바이러스 유전자를 포함하지 않는다.
특정 실시양태에서, 핵산 벡터는 5'으로부터 3'으로, AAV Rep 단백질을 코딩하는 제1 뉴클레오티드 서열; 트랜스진을 포함하는 재조합 AAV (rAAV) 게놈을 포함하는 제2 뉴클레오티드 서열; 및 AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열을 포함하며, 여기서 핵산 벡터는 헬퍼 바이러스 유전자를 포함하지 않고, 트랜스진은 페닐알라닌 수산화효소 (PAH), 아릴설파타제 A (ARSA), 이두로네이트 2-설파타제 (I2S) 및 항-보체 구성요소 5 (C5) 항체로 이루어진 군으로부터 선택되지 않는다.
특정 실시양태에서, 핵산 벡터는 5'으로부터 3'으로, AAV Rep 단백질을 코딩하는 제1 뉴클레오티드 서열; 트랜스진을 포함하는 재조합 AAV (rAAV) 게놈을 포함하는 제2 뉴클레오티드 서열; 및 AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열을 포함하며, 여기서 핵산 벡터는 헬퍼 바이러스 유전자를 포함하지 않고, AAV 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16 또는 17의 아미노산 203-736의 아미노산 서열과 95% 이상 동일한 아미노산 서열을 포함하지 않으며, 여기서 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질의 아미노산은 C이거나; 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질의 아미노산은 H이거나; 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질의 아미노산은 Q이거나; 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질의 아미노산은 A이거나; 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질의 아미노산은 N이거나; 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질의 아미노산은 S이거나; 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질의 아미노산은 I이거나; 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질의 아미노산은 G 또는 Y이거나; 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질의 아미노산은 M이거나; 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질의 아미노산은 K이거나; 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질의 아미노산은 C이거나; 또는 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질의 아미노산은 G이다.
특정 실시양태에서, 핵산 벡터는 5'으로부터 3'으로, AAV Rep 단백질을 코딩하는 제1 뉴클레오티드 서열; 트랜스진을 포함하는 재조합 AAV (rAAV) 게놈을 포함하는 제2 뉴클레오티드 서열; 및 AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열을 포함하며, 여기서 핵산 벡터는 헬퍼 바이러스 유전자를 포함하지 않고, (i) 트랜스진은 페닐알라닌 수산화효소 (PAH), 아릴설파타제 A (ARSA), 이두로네이트 2-설파타제 (I2S) 및 항-보체 구성요소 5 (C5) 항체로 이루어진 군으로부터 선택되지 않고, (ii) AAV 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16 또는 17의 아미노산 203-736의 아미노산 서열과 95% 이상 동일한 아미노산 서열을 포함하지 않으며, 여기서 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질의 아미노산은 C이거나; 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질의 아미노산은 H이거나; 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질의 아미노산은 Q이거나; 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질의 아미노산은 A이거나; 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질의 아미노산은 N이거나; 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질의 아미노산은 S이거나; 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질의 아미노산은 I이거나; 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질의 아미노산은 G 또는 Y이거나; 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질의 아미노산은 M이거나; 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질의 아미노산은 K이거나; 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질의 아미노산은 C이거나; 또는 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질의 아미노산은 G이다.
특정 실시양태에서, 핵산 벡터는 5'으로부터 3'으로, AAV Rep 단백질을 코딩하는 제1 뉴클레오티드 서열; 트랜스진을 포함하는 재조합 AAV (rAAV) 게놈을 포함하는 제2 뉴클레오티드 서열; 및 AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열을 포함한다.
특정 실시양태에서, 핵산 벡터는 DNA 플라스미드 또는 DNA 최소 벡터이다.
다른 양태에서, 본 개시내용은 다음을 포함하는, 재조합 AAV (rAAV) 패키징 시스템을 제공한다: (i) 다음을 포함하는, 제1 핵산 벡터: AAV Rep 단백질을 코딩하는 제1 뉴클레오티드 서열; 트랜스진을 포함하는 재조합 AAV (rAAV) 게놈을 포함하는 제2 뉴클레오티드 서열; 및 AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열, 및 (ii) 헬퍼 바이러스 유전자를 포함하는 제2 핵산 벡터.
특정 실시양태에서, 제1 핵산 벡터는 5'으로부터 3'으로, AAV Rep 단백질을 코딩하는 제1 뉴클레오티드 서열; 트랜스진을 포함하는 재조합 AAV (rAAV) 게놈을 포함하는 제2 뉴클레오티드 서열; 및 AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열을 포함한다. 특정 실시양태에서, 트랜스진은 페닐알라닌 수산화효소 (PAH), 아릴설파타제 A (ARSA), 이두로네이트 2-설파타제 (I2S) 및 항-보체 구성요소 5 (C5) 항체로 이루어진 군으로부터 선택되지 않는다. 특정 실시양태에서, AAV 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16 또는 17의 아미노산 203-736의 아미노산 서열과 95% 이상 동일한 아미노산 서열을 포함하지 않으며, 여기서 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질의 아미노산은 C이거나; 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질의 아미노산은 H이거나; 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질의 아미노산은 Q이거나; 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질의 아미노산은 A이거나; 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질의 아미노산은 N이거나; 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질의 아미노산은 S이거나; 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질의 아미노산은 I이거나; 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질의 아미노산은 G 또는 Y이거나; 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질의 아미노산은 M이거나; 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질의 아미노산은 K이거나; 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질의 아미노산은 C이거나; 또는 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질의 아미노산은 G이다. 특정 실시양태에서, 트랜스진은 페닐알라닌 수산화효소 (PAH), 아릴설파타제 A (ARSA), 이두로네이트 2-설파타제 (I2S) 및 항-보체 구성요소 5 (C5) 항체로 이루어진 군으로부터 선택되지 않고, AAV 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16 또는 17의 아미노산 203-736의 아미노산 서열과 95% 이상 동일한 아미노산 서열을 포함하지 않으며, 여기서 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질의 아미노산은 C이거나; 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질의 아미노산은 H이거나; 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질의 아미노산은 Q이거나; 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질의 아미노산은 A이거나; 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질의 아미노산은 N이거나; 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질의 아미노산은 S이거나; 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질의 아미노산은 I이거나; 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질의 아미노산은 G 또는 Y이거나; 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질의 아미노산은 M이거나; 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질의 아미노산은 K이거나; 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질의 아미노산은 C이거나; 또는 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질의 아미노산은 G이다.
특정 실시양태에서, 제1 핵산 벡터는 DNA 플라스미드 또는 DNA 최소 벡터이다. 특정 실시양태에서, 제2 핵산 벡터는 DNA 플라스미드 또는 DNA 최소 벡터이다.
특정 실시양태에서, 트랜스진은 폴리펩티드를 코딩한다. 특정 실시양태에서, 트랜스진은 miRNA, shRNA, siRNA, 안티센스 RNA, gRNA, 안타고미르, miRNA 스폰지, RNA 압타자임, RNA 압타머, lncRNA, 리보자임 또는 mRNA를 코딩한다. 특정 실시양태에서, 트랜스진은 페닐알라닌 수산화효소 (PAH), 글루코스-6-포스파타제 (G6Pase), 이두로네이트-2-설파타제 (I2S), 아릴설파타제 A (ARSA) 및 프라탁신 (FXN)으로 이루어진 군으로부터 선택되는 단백질을 코딩한다. 특정 실시양태에서, 트랜스진은 글루코스-6-포스파타제 (G6Pase) 또는 프라탁신 (FXN)을 코딩한다.
특정 실시양태에서, rAAV 게놈은 트랜스진에 작동가능하게 연결된 전사 조절 요소를 추가로 포함한다. 특정 실시양태에서, 전사 조절 요소는 프로모터 요소 및/또는 인트론 요소를 포함한다.
특정 실시양태에서, rAAV 게놈은 폴리아데닐화 서열을 추가로 포함한다. 특정 실시양태에서, 폴리아데닐화 서열은 트랜스진에 대해 3'이다.
특정 실시양태에서, rAAV 게놈은 서열번호 71, 85, 86, 87 또는 88에 제시된 뉴클레오티드 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 뉴클레오티드 서열을 포함한다.
특정 실시양태에서, rAAV 게놈은 트랜스진의 5'의 5' 역전 말단 반복부 (5' ITR) 뉴클레오티드 서열, 및 트랜스진의 3'의 3' 역전 말단 반복부 (3' ITR) 뉴클레오티드 서열을 추가로 포함한다. 특정 실시양태에서, 5' ITR 뉴클레오티드 서열은 서열번호 39, 41 또는 42에 제시된 뉴클레오티드 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일하고/하거나, 3' ITR 뉴클레오티드 서열은 서열번호 40, 43 또는 44에 제시된 뉴클레오티드 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일하다.
특정 실시양태에서, rAAV 게놈은 서열번호 75, 78, 80, 82 또는 84에 제시된 뉴클레오티드 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 뉴클레오티드 서열을 포함한다.
특정 실시양태에서, AAV Rep 단백질은 야생형 Rep 단백질 또는 이의 변이체이다. 특정 실시양태에서, AAV Rep 단백질은 AAV2 Rep 단백질 또는 이의 변이체이다.
특정 실시양태에서, 제1 뉴클레오티드 서열은 AAV Rep 단백질 코딩 서열에 작동가능하게 연결된 전사 조절 요소를 추가로 포함한다. 특정 실시양태에서, 전사 조절 요소는 구성적 프로모터, 유도성 프로모터 및 천연 프로모터로 이루어진 군으로부터 선택되는 프로모터를 포함한다. 특정 실시양태에서, 프로모터는 P5 프로모터, P19 프로모터, 메탈로티오닌 (MT) 프로모터, 마우스 유방 종양 바이러스 (MMTV) 프로모터, T7 프로모터, 엑디손 곤충 프로모터, 테트라사이클린-억압성 프로모터, 테트라사이클린-유도성 프로모터, RU486-유도성 프로모터 및 라파마이신-유도성 프로모터로 이루어진 군으로부터 선택된다.
특정 실시양태에서, AAV 캡시드 단백질은 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAVrh10, AAVRh32.33, AAVrh74, AAV-DJ, AAV-LK03, NP59, VOY101, VOY201, VOY701, VOY801, VOY1101, AAVPHP.N, AAVPHP.A, AAVPHP.B, PHP.B2, PHP.B3, G2A3, G2B4, G2B5 및 PHP.S로 이루어진 군으로부터 선택된다. 특정 실시양태에서, AAV 캡시드 단백질은 AAV1, AAV2, AAV5, AAV6, AAV8, AAV9, AAVrh10 및 AAVrh74로 이루어진 군으로부터 선택된다. 특정 실시양태에서, AAV 캡시드 단백질은 AAV1, AAV2, AAV5, AAV6, AAV8 및 AAVrh74로 이루어진 군으로부터 선택된다.
특정 실시양태에서, AAV 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16 또는 17의 아미노산 203-736의 아미노산 서열과 85% 이상 동일한 아미노산 서열을 포함한다.
특정 실시양태에서, 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질의 아미노산은 C이거나; 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질의 아미노산은 H이거나; 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질의 아미노산은 Q이거나; 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질의 아미노산은 A이거나; 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질의 아미노산은 N이거나; 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질의 아미노산은 S이거나; 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질의 아미노산은 I이거나; 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질의 아미노산은 G 또는 Y이거나; 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질의 아미노산은 M이거나; 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질의 아미노산은 K이거나; 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질의 아미노산은 C이거나; 또는 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질의 아미노산은 G이다.
특정 실시양태에서, (a) 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질의 아미노산은 G이고, 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질의 아미노산은 G이거나; (b) 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질의 아미노산은 H이고, 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질의 아미노산은 N이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이고, 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질의 아미노산은 M이거나; (c) 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이고, 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질의 아미노산은 R이거나; (d) 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질의 아미노산은 A이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이거나; 또는 (e) 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질의 아미노산은 I이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이고, 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질의 아미노산은 C이다.
특정 실시양태에서, AAV 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16 또는 17의 아미노산 203-736의 아미노산 서열을 포함한다.
특정 실시양태에서, AAV 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16 또는 17의 아미노산 138-736의 아미노산 서열과 85% 이상 동일한 아미노산 서열을 포함한다.
특정 실시양태에서, 서열번호 16의 아미노산 151에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 160에 상응하는 캡시드 단백질의 아미노산은 D이거나; 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질의 아미노산은 C이거나; 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질의 아미노산은 H이거나; 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질의 아미노산은 Q이거나; 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질의 아미노산은 A이거나; 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질의 아미노산은 N이거나; 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질의 아미노산은 S이거나; 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질의 아미노산은 I이거나; 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질의 아미노산은 G 또는 Y이거나; 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질의 아미노산은 M이거나; 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질의 아미노산은 K이거나; 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질의 아미노산은 C이거나; 또는 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질의 아미노산은 G이다.
특정 실시양태에서, (a) 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질의 아미노산은 G이고, 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질의 아미노산은 G이거나; (b) 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질의 아미노산은 H이고, 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질의 아미노산은 N이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이고, 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질의 아미노산은 M이거나; (c) 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이고, 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질의 아미노산은 R이거나; (d) 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질의 아미노산은 A이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이거나; 또는 (e) 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질의 아미노산은 I이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이고, 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질의 아미노산은 C이다.
특정 실시양태에서, AAV 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 15, 16 또는 17의 아미노산 138-736의 아미노산 서열을 포함한다.
특정 실시양태에서, AAV 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16 또는 17의 아미노산 1-736의 아미노산 서열과 85% 이상 동일한 아미노산 서열을 포함한다.
특정 실시양태에서, 서열번호 16의 아미노산 2에 상응하는 캡시드 단백질의 아미노산은 T이거나; 서열번호 16의 아미노산 65에 상응하는 캡시드 단백질의 아미노산은 I이거나; 서열번호 16의 아미노산 68에 상응하는 캡시드 단백질의 아미노산은 V이거나; 서열번호 16의 아미노산 77에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 119에 상응하는 캡시드 단백질의 아미노산은 L이거나; 서열번호 16의 아미노산 151에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 160에 상응하는 캡시드 단백질의 아미노산은 D이거나; 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질의 아미노산은 C이거나; 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질의 아미노산은 H이거나; 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질의 아미노산은 Q이거나; 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질의 아미노산은 A이거나; 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질의 아미노산은 N이거나; 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질의 아미노산은 S이거나; 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질의 아미노산은 I이거나; 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질의 아미노산은 G 또는 Y이거나; 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질의 아미노산은 M이거나; 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질의 아미노산은 K이거나; 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질의 아미노산은 C이거나; 또는 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질의 아미노산은 G이다.
특정 실시양태에서, (a) 서열번호 16의 아미노산 2에 상응하는 캡시드 단백질의 아미노산은 T이고, 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질의 아미노산은 Q이거나; (b) 서열번호 16의 아미노산 65에 상응하는 캡시드 단백질의 아미노산은 I이고, 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질의 아미노산은 Y이거나; (c) 서열번호 16의 아미노산 77에 상응하는 캡시드 단백질의 아미노산은 R이고, 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질의 아미노산은 K이거나; (d) 서열번호 16의 아미노산 119에 상응하는 캡시드 단백질의 아미노산은 L이고, 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질의 아미노산은 S이거나; (e) 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질의 아미노산은 G이고, 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질의 아미노산은 G이거나; (f) 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질의 아미노산은 H이고, 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질의 아미노산은 N이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이고, 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질의 아미노산은 M이거나; (g) 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이고, 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질의 아미노산은 R이거나; (h) 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질의 아미노산은 A이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이거나; 또는 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질의 아미노산은 I이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이고, 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질의 아미노산은 C이다.
특정 실시양태에서, AAV 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16 또는 17의 아미노산 1-736의 아미노산 서열을 포함한다.
특정 실시양태에서, 제3 뉴클레오티드 서열은 AAV 캡시드 단백질 코딩 서열에 작동가능하게 연결된 전사 조절 요소를 추가로 포함한다. 특정 실시양태에서, 전사 조절 요소는 구성적 프로모터, 유도성 프로모터 및 천연 프로모터로 이루어진 군으로부터 선택되는 프로모터를 포함한다. 특정 실시양태에서, 프로모터는 P40 프로모터, 메탈로티오닌 (MT) 프로모터, 마우스 유방 종양 바이러스 (MMTV) 프로모터, T7 프로모터, 엑디손 곤충 프로모터, 테트라사이클린-억압성 프로모터, 테트라사이클린-유도성 프로모터, RU486-유도성 프로모터 및 라파마이신-유도성 프로모터로 이루어진 군으로부터 선택된다.
특정 실시양태에서, 제1 핵산 벡터는 서열번호 73 또는 77에 제시된 뉴클레오티드 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 뉴클레오티드 서열을 포함한다.
특정 실시양태에서, 제2 뉴클레오티드 서열은 서열번호 71, 75, 78, 80, 82, 84, 85, 86, 87 또는 88에 제시된 뉴클레오티드 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 서열을 포함한다.
특정 실시양태에서, 제1 뉴클레오티드 서열은 서열번호 50, 51, 52, 53, 54, 55, 56, 57, 58 또는 59에 제시된 뉴클레오티드 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 서열을 포함하고; 제2 뉴클레오티드 서열은 서열번호 71, 75, 78, 80, 82, 84, 85, 86, 87 또는 88에 제시된 뉴클레오티드 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 서열을 포함하고; 제3 뉴클레오티드 서열은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16 또는 17의 아미노산 203-736, 138-736 및/또는 1-736의 아미노산 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 아미노산 서열을 코딩한다.
특정 실시양태에서, 제1 핵산 벡터는 5'으로부터 3'으로, 제1 뉴클레오티드 서열; 제2 뉴클레오티드 서열; 및 제3 뉴클레오티드 서열을 포함한다.
특정 실시양태에서, 헬퍼 바이러스 유전자는 아데노바이러스, 헤르페스 바이러스, 폭스바이러스, 사이토메갈로바이러스 및 배큘로바이러스로 이루어진 군으로부터 선택되는 헬퍼 바이러스로부터 유래된다. 특정 실시양태에서, 헬퍼 바이러스 유전자는 E1, E2, E4 및 VA로 이루어진 군으로부터 선택되는 아데노바이러스로부터 유래된 RNA 유전자이다. 특정 실시양태에서, 헬퍼 바이러스 유전자는 UL5/8/52, ICP0, ICP4, ICP22 및 UL30/UL42로 이루어진 군으로부터 선택되는 헤르페스 바이러스로부터 유래된 유전자이다.
특정 실시양태에서, 제2 핵산 벡터는 헬퍼 바이러스 유전자에 작동가능하게 연결된 전사 조절 요소를 추가로 포함한다. 특정 실시양태에서, 전사 조절 요소는 구성적 프로모터, 유도성 프로모터 및 천연 프로모터로 이루어진 군으로부터 선택되는 프로모터를 포함한다. 특정 실시양태에서, 프로모터는 RSV LTR 프로모터, CMV 즉시 초기 프로모터, SV40 프로모터, 디하이드로폴레이트 환원효소 프로모터, 세포질 β-액틴 프로모터, 포스포글리세레이트 키나제 (PGK) 프로모터, 메탈로티오닌 (MT) 프로모터, 마우스 유방 종양 바이러스 (MMTV) 프로모터, T7 프로모터, 엑디손 곤충 프로모터, 테트라사이클린-억압성 프로모터, 테트라사이클린-유도성 프로모터, RU486-유도성 프로모터 및 라파마이신-유도성 프로모터로 이루어진 군으로부터 선택된다.
특정 실시양태에서, 제2 핵산 벡터는 서열번호 60, 61 또는 62에 제시된 뉴클레오티드 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 뉴클레오티드 서열을 포함한다.
특정 실시양태에서, 제2 핵산 벡터는 서열번호 63에 제시된 뉴클레오티드 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 뉴클레오티드 서열을 포함한다.
다른 양태에서, 본 개시내용은 본원에 기재된 핵산 벡터 또는 본원에 기재된 패키징 시스템을 포함하는 숙주 세포를 제공한다. 본 개시내용은 또한 이러한 숙주 세포의 집단을 제공한다. 특정 실시양태에서, 숙주 세포의 집단은 세포 배양물로 제공된다. 특정 실시양태에서, 세포 배양물은 2 리터 이상, 50 리터 이상, 또는 2000 리터 이상의 부피를 갖는다. 특정 실시양태에서, 세포 배양물은 약 2 리터 내지 약 5000 리터의 부피를 갖는다. 특정 실시양태에서, 세포 배양물은 약 2 리터 내지 약 4000 리터의 부피를 갖는다. 특정 실시양태에서, 세포 배양물은 약 2 리터 내지 약 3000 리터의 부피를 갖는다. 특정 실시양태에서, 세포 배양물은 약 2 리터 내지 약 2500 리터의 부피를 갖는다. 특정 실시양태에서, 세포 배양물은 약 2 리터 내지 약 2000 리터의 부피를 갖는다. 특정 실시양태에서, 세포 배양물은 약 2 리터 내지 약 1500 리터의 부피를 갖는다. 특정 실시양태에서, 세포 배양물은 약 2 리터 내지 약 1000 리터의 부피를 갖는다. 특정 실시양태에서, 세포 배양물은 약 2 리터 내지 약 500 리터의 부피를 갖는다. 특정 실시양태에서, 세포 배양물은 약 2 리터 내지 약 250 리터의 부피를 갖는다. 특정 실시양태에서, 세포 배양물은 약 2 리터 내지 약 100 리터의 부피를 갖는다. 특정 실시양태에서, 세포 배양물은 약 2 리터 내지 약 50 리터의 부피를 갖는다. 특정 실시양태에서, 세포 배양물은 약 2 리터 내지 약 25 리터의 부피를 갖는다.
특정 실시양태에서, 숙주 세포는 포유동물 세포이다. 특정 실시양태에서, 포유동물 세포는 COS 세포, CHO 세포, BHK 세포, MDCK 세포, HEK293 세포, HEK293T 세포, HEK293F 세포, NS0 세포, PER.C6 세포, VERO 세포, CRL7O3O 세포, HsS78Bst 세포, HeLa 세포, NIH 3T3 세포, HepG2 세포, SP210 세포, R1.1 세포, B-W 세포, L-M 세포, BSC1 세포, BSC40 세포, YB/20 세포 및 BMT10 세포로 이루어진 군으로부터 선택된다. 특정 실시양태에서, 포유동물 세포는 HEK293 세포이다.
다른 양태에서, 본 개시내용은 rAAV가 생산되는 조건 하에서 포유동물 세포 내로 본원에 기재된 패키징 시스템을 도입하는 단계를 포함하는, rAAV의 재조합 제조 방법을 제공한다.
특정 실시양태에서, 제1 핵산 벡터 대 제2 핵산 벡터의 비율, 또는 제2 핵산 벡터 대 제1 핵산 벡터의 비율은 1:0.2, 1:0.4, 1:0.6, 1:0.8, 1:1, 1:2, 1:3 또는 1:4로 이루어진 군으로부터 선택된다. 특정 실시양태에서, 제1 핵산 벡터 대 제2 핵산 벡터의 비율, 또는 제2 핵산 벡터 대 제1 핵산 벡터의 비율은 1:2이다. 특정 실시양태에서, 제1 핵산 벡터 대 제2 핵산 벡터의 비율, 또는 제2 핵산 벡터 대 제1 핵산 벡터의 비율은 1:0.2 내지 1:1이다. 특정 실시양태에서, 제1 핵산 벡터 대 제2 핵산 벡터의 비율, 또는 제2 핵산 벡터 대 제1 핵산 벡터의 비율은 1:0.6이다. 특정 실시양태에서, 제1 핵산 벡터 대 제2 핵산 벡터의 비율, 또는 제2 핵산 벡터 대 제1 핵산 벡터의 비율은 1:0.8이다. 특정 실시양태에서, 제1 핵산 벡터 대 제2 핵산 벡터의 비율, 또는 제2 핵산 벡터 대 제1 핵산 벡터의 비율은 1:1이다.
특정 실시양태에서, 방법은 패키징 시스템의 0.1 내지 4 μg의 DNA/1E6 세포를 도입하는 단계를 포함한다. 특정 실시양태에서, 방법은 패키징 시스템의 0.5 내지 1 μg의 DNA/1E6 세포를 도입하는 단계를 포함한다. 특정 실시양태에서, 방법은 패키징 시스템의 0.6, 0.7, 0.8, 0.9 또는 1 μg의 DNA/1E6 세포를 도입하는 단계를 포함한다. 특정 실시양태에서, 방법은 패키징 시스템의 0.75 μg의 DNA/1E6 세포를 도입하는 단계를 포함한다.
특정 실시양태에서, 제1 핵산 벡터 대 제2 벡터 핵산의 비율은 1:2, 1:3 또는 1:4이다. 특정 실시양태에서, 제1 핵산 벡터 대 제2 핵산 벡터의 비율은 1:2이다.
특정 실시양태에서, 방법은 (i) AAV Rep 단백질 및 AAV 캡시드 단백질을 코딩하는 뉴클레오티드 서열을 포함하는 제1 벡터; (ii) rAAV 게놈을 포함하는 제2 벡터; 및 (iii) 하나 이상의 헬퍼 바이러스 유전자를 포함하는 제3 벡터를 포함하는 포유동물 세포를 사용하여 rAAV를 생산하는 단계를 포함하는 방법과 비교하여 증가된 rAAV 역가를 초래한다.
특정 실시양태에서, 방법은 (i) AAV Rep 단백질 및 AAV 캡시드 단백질을 코딩하는 뉴클레오티드 서열을 포함하는 제1 벡터; (ii) rAAV 게놈을 포함하는 제2 벡터; 및 (iii) 하나 이상의 헬퍼 바이러스 유전자를 포함하는 제3 벡터를 포함하는 포유동물 세포를 사용하여 rAAV를 생산하는 단계를 포함하는 방법과 비교하여 온전한 벡터 게놈의 증가된 백분율을 초래한다.
특정 실시양태에서, 포유동물 세포는 COS 세포, CHO 세포, BHK 세포, MDCK 세포, HEK293 세포, HEK293T 세포, HEK293F 세포, NS0 세포, PER.C6 세포, VERO 세포, CRL7O3O 세포, HsS78Bst 세포, HeLa 세포, NIH 3T3 세포, HepG2 세포, SP210 세포, R1.1 세포, B-W 세포, L-M 세포, BSC1 세포, BSC40 세포, YB/20 세포 및 BMT10 세포로 이루어진 군으로부터 선택된다. 특정 실시양태에서, 포유동물 세포는 HEK293 세포이다.
도 1a-1c는 삼중 벡터 형질주입 시스템 (1) 및 이중 벡터 형질주입 시스템 (2)을 사용하여 소-규모 rAAV 생산으로부터 수득된 바이러스 게놈 (VG) 생산성 (도 1a), 캡시드 생산성 (도 1b), 및 온전한 벡터 게놈의 백분율 (도 1c)을 도시하는 그래프이다.
도 2a-2c는 삼중 벡터 형질주입 시스템 (1 및 3) 및 이중 벡터 형질주입 시스템 (2 및 4)을 사용하여 소-규모 rAAV 생산으로부터 수득된 VG 생산성 (도 2a), 캡시드 생산성 (도 2b), 및 온전한 벡터 게놈의 백분율 (도 2c)을 도시하는 그래프이다. rAAV 생산성은 다음의 2 개의 상이한 rAAV 유전자 편집 벡터에 대해 결정되었다: 인간-특이적 유전자 편집 벡터 (1 및 2) 및 마우스-특이적 벡터 (3 및 4). 다양한 조건은 표 3에 제시되어 있다.
도 3a-3c는 rAAV 이중 벡터 형질주입 시스템 설계-1 (도 3a), 설계-2 (도 3b) 및 설계-3 (도 3c)을 도시하는 개략도이다.
도 4a-4c는 이중 벡터 형질주입 시스템 설계-1 (1-3), 이중 벡터 형질주입 시스템 설계-2 (4-6), 및 삼중 벡터 형질주입 시스템 (7)을 사용하여 소-규모 rAAV 생산으로부터 수득된 VG 생산성 (도 4a), 캡시드 생산성 (도 4b), 및 온전한 벡터 게놈의 백분율 (도 4c)을 도시하는 그래프이다. 테스트된 이중 벡터 형질주입 시스템 설계는 도 3a 및 3b에 묘사된 바와 같다. 테스트된 각각의 이중 벡터 형질주입 시스템 설계에 대해, 다음의 3 개의 상이한 트랜스진 벡터 대 헬퍼 벡터 비율을 이용하여 형질주입을 수행하였다: 1:0.5 (1 및 4), 1:1 (2 및 5), 및 1:3 (3 및 6). 다양한 형질주입 조건은 표 4에 제시되어 있다.
도 5a-5c는 이중 벡터 형질주입 시스템 설계-1 (1), 이중 벡터 형질주입 시스템 설계-2 (2), 이중 벡터 형질주입 시스템 설계-3 (3) 및 삼중 벡터 형질주입 시스템 (4)을 사용하여 소-규모 rAAV 생산으로부터 수득된 VG 생산성 (도 5a), 캡시드 생산성 (도 5b), 및 온전한 벡터 게놈의 백분율 (도 5c; "전체 %")을 도시하는 그래프이다. 테스트된 이중 벡터 형질주입 시스템 설계는 도 3a-3c에 묘사된 바와 같다. 다양한 형질주입 조건은 표 5에 제시되어 있다.
도 6a-6c는 다양한 트랜스진 벡터 대 헬퍼 벡터 비율인 1:2 ("이중 1:2"), 1:3 ("이중 1:3") 및 1:4 ("이중 1:4")에서의 이중 벡터 형질주입 시스템 설계-1, 및 삼중 벡터 형질주입 시스템 (삼중)을 사용하여 2 L-규모 rAAV 생산으로부터 수득된 VG 생산성 (도 6a), 캡시드 생산성 (도 6b), 및 온전한 벡터 게놈의 백분율 (도 6c)을 도시하는 그래프이다. 6 개의 상이한 rAAV 벡터 게놈 (1-6)을 테스트하였다. 조건 1-5는 AAVHSC15 캡시드를 사용하였고, 조건 6은 AAVHSC17 캡시드를 사용하였다. 다양한 형질주입 조건은 표 6에 제시되어 있다.
도 7a-7c는 AAV2 캡시드를 활용하는, 이중 벡터 형질주입 시스템 설계-1 (2 TFX) 및 삼중 벡터 형질주입 시스템 (3 TFX)을 사용하여 소-규모 rAAV 생산으로부터 수득된 VG 생산성 (도 7a), 캡시드 생산성 (도 7b), 및 온전한 벡터 게놈의 백분율 (도 7c)을 도시하는 그래프이다. 다양한 형질주입 조건은 표 6에 제시되어 있다.
도 8은 설계-1 이중 플라스미드 시스템을 사용하여 rAAV 생산으로부터 수득된 온전한 벡터 게놈의 수를 도시하는 그래프이며, 각각의 경우에 상응하는 삼중 플라스미드 시스템 대조군으로부터 수득된 온전한 벡터 게놈의 수에 대한 백분율 증가로 표현된다. 4 개의 상이한 rAAV 벡터 게놈 (1-4)을 테스트하였다. 조건 1-3은 AAVHSC15 캡시드를 사용하였고, 조건 4는 AAVHSC17 캡시드를 사용하였다. 다양한 형질주입 조건이 표 7에 제시되어 있다.
도 9는 이중 벡터 형질주입 시스템 설계-1 및 설계-2로부터의 캡시드 생성의 수준과 함께 각각 각각의 설계의 Rep/Cap 서열을 함유하는 벡터로부터의 캡시드 생성의 수준을 도시하는 그래프이다. 다양한 형질주입 조건이 표 8에 제시되어 있다.
도 10a-10c는 이중 벡터 형질주입 시스템 설계-1 (2 TFX) 및 삼중 벡터 형질주입 시스템 (3 TFX)을 사용하여 50 L 생물반응기 rAAV 생산으로부터 수득된 VG 생산성 (도 10a), 캡시드 생산성 (도 10b), 및 온전한 벡터 게놈의 백분율 (도 10c)을 도시하는 그래프이다. 형질주입 조건은 표 6, 조건 4, 설계-1에 대한 벡터 비율 1:2 및 연관된 삼중 형질주입 대조군에 제시되어 있다. 도 10d-10f는 2 TFX 및 3 TFX 시스템을 사용하여 수득된 정제된 AAV 벡터에서의 순도 퍼센트 (도 10d), 응집 퍼센트 (도 10e) 및 잔여 숙주 세포 단백질의 수준 (도 10f)을 도시하는 그래프이다. 도 10g-10j는 2 TFX 및 3 TFX 시스템을 사용하여 수득된 정제된 AAV 벡터에 패키징된 잔류 숙주 세포 DNA (도 10g), Rep/Cap (도 10h), E1a (도 10i) 및 헬퍼 서열 (도 10j)의 양을 도시하는 그래프이다. 도 10f 및 10i에서, 수평 점선은 샘플이 정량 한계 미만 (BLoQ)인 것으로 결정된 검정에 대한 검출 한계를 나타낸다. ns는 유의하지 않음을 의미하고; *는 p<0.05에서 통계적으로 유의함을 의미하며; ***는 p<0.001에서 통계적으로 유의함을 의미한다.
도 11a-11b는 1E12 VG/kg (도 11a) 및 1E14 VG/kg (도 11b)의 용량에서, 설계 1 (2 TFX) 및 연관된 삼중 형질주입 대조군 (3 TFX)에 대해 1:4의 벡터 비율로 표 6의 조건 5로부터 수득된 AAV 벡터가 투여된 Pahenu2 마우스의 혈청에서 측정된 페닐알라닌 (Phe)의 수준을 도시하는 그래프이다. 비히클-단독 투여는 대조군 (비히클)으로서 수행되었다. 도 11c-11e는 투약-후 6 주째에 치료된 마우스에서 간에서의 벡터 게놈 (도 11c), 트랜스진 발현 (도 11d) 및 표적-내(on-target) 통합 (도 11e)의 정량을 도시하는 그래프이다. ns는 유의하지 않음을 의미한다.
도 12a-12c는 형질주입된 총 DNA의 다양한 수준 (x-축)에서, 벡터 V3 및 V12 사이에 표시된 바와 같은 다양한 비율을 테스트한, 이중 벡터 형질주입 시스템 설계-1을 사용하여 소규모 rAAV 생산으로부터 수득된 VG 생산성 (도 12a), 캡시드 생산성 (도 12b), 및 온전한 벡터 게놈의 백분율 (도 12c)을 도시하는 그래프이다. 사용된 PEI:DNA 비율은 2:1이었다.
도 13a-13c는 형질주입된 총 DNA의 다양한 수준 (x-축)에서, 벡터 V3 및 V8 사이에 표시된 바와 같은 다양한 비율을 테스트한, 이중 벡터 형질주입 시스템 설계-1을 사용하여 소규모 rAAV 생산으로부터 수득된 VG 생산성 (도 13a), 캡시드 생산성 (도 13b), 및 온전한 벡터 게놈의 백분율 (도 13c)을 도시하는 그래프이다. 사용된 PEI:DNA 비율은 2:1이었다.
도 14a-14c는 이중 벡터 형질주입 시스템 설계-1 및 AAV 캡시드 혈청형 AAV1, AAV2, AAV5, AAV6, AAV8, AAV9, AAVrh10 및 AAVrh74에 걸친 연관된 삼중 형질주입 대조군을 사용하여 2 L-규모의 rAAV 생산으로부터 수득된 VG 생산성 (도 14a), 캡시드 생산성 (도 14b) 및 온전한 벡터 게놈의 백분율 (도 14c)을 도시하는 그래프이다.
도 15는 이중 벡터 형질주입 시스템 설계-1을 사용하여 50 L 및 2000 L 생물반응기 rAAV 생산으로부터 수득된 VG 생산성을 도시하는 그래프이다.
도 2a-2c는 삼중 벡터 형질주입 시스템 (1 및 3) 및 이중 벡터 형질주입 시스템 (2 및 4)을 사용하여 소-규모 rAAV 생산으로부터 수득된 VG 생산성 (도 2a), 캡시드 생산성 (도 2b), 및 온전한 벡터 게놈의 백분율 (도 2c)을 도시하는 그래프이다. rAAV 생산성은 다음의 2 개의 상이한 rAAV 유전자 편집 벡터에 대해 결정되었다: 인간-특이적 유전자 편집 벡터 (1 및 2) 및 마우스-특이적 벡터 (3 및 4). 다양한 조건은 표 3에 제시되어 있다.
도 3a-3c는 rAAV 이중 벡터 형질주입 시스템 설계-1 (도 3a), 설계-2 (도 3b) 및 설계-3 (도 3c)을 도시하는 개략도이다.
도 4a-4c는 이중 벡터 형질주입 시스템 설계-1 (1-3), 이중 벡터 형질주입 시스템 설계-2 (4-6), 및 삼중 벡터 형질주입 시스템 (7)을 사용하여 소-규모 rAAV 생산으로부터 수득된 VG 생산성 (도 4a), 캡시드 생산성 (도 4b), 및 온전한 벡터 게놈의 백분율 (도 4c)을 도시하는 그래프이다. 테스트된 이중 벡터 형질주입 시스템 설계는 도 3a 및 3b에 묘사된 바와 같다. 테스트된 각각의 이중 벡터 형질주입 시스템 설계에 대해, 다음의 3 개의 상이한 트랜스진 벡터 대 헬퍼 벡터 비율을 이용하여 형질주입을 수행하였다: 1:0.5 (1 및 4), 1:1 (2 및 5), 및 1:3 (3 및 6). 다양한 형질주입 조건은 표 4에 제시되어 있다.
도 5a-5c는 이중 벡터 형질주입 시스템 설계-1 (1), 이중 벡터 형질주입 시스템 설계-2 (2), 이중 벡터 형질주입 시스템 설계-3 (3) 및 삼중 벡터 형질주입 시스템 (4)을 사용하여 소-규모 rAAV 생산으로부터 수득된 VG 생산성 (도 5a), 캡시드 생산성 (도 5b), 및 온전한 벡터 게놈의 백분율 (도 5c; "전체 %")을 도시하는 그래프이다. 테스트된 이중 벡터 형질주입 시스템 설계는 도 3a-3c에 묘사된 바와 같다. 다양한 형질주입 조건은 표 5에 제시되어 있다.
도 6a-6c는 다양한 트랜스진 벡터 대 헬퍼 벡터 비율인 1:2 ("이중 1:2"), 1:3 ("이중 1:3") 및 1:4 ("이중 1:4")에서의 이중 벡터 형질주입 시스템 설계-1, 및 삼중 벡터 형질주입 시스템 (삼중)을 사용하여 2 L-규모 rAAV 생산으로부터 수득된 VG 생산성 (도 6a), 캡시드 생산성 (도 6b), 및 온전한 벡터 게놈의 백분율 (도 6c)을 도시하는 그래프이다. 6 개의 상이한 rAAV 벡터 게놈 (1-6)을 테스트하였다. 조건 1-5는 AAVHSC15 캡시드를 사용하였고, 조건 6은 AAVHSC17 캡시드를 사용하였다. 다양한 형질주입 조건은 표 6에 제시되어 있다.
도 7a-7c는 AAV2 캡시드를 활용하는, 이중 벡터 형질주입 시스템 설계-1 (2 TFX) 및 삼중 벡터 형질주입 시스템 (3 TFX)을 사용하여 소-규모 rAAV 생산으로부터 수득된 VG 생산성 (도 7a), 캡시드 생산성 (도 7b), 및 온전한 벡터 게놈의 백분율 (도 7c)을 도시하는 그래프이다. 다양한 형질주입 조건은 표 6에 제시되어 있다.
도 8은 설계-1 이중 플라스미드 시스템을 사용하여 rAAV 생산으로부터 수득된 온전한 벡터 게놈의 수를 도시하는 그래프이며, 각각의 경우에 상응하는 삼중 플라스미드 시스템 대조군으로부터 수득된 온전한 벡터 게놈의 수에 대한 백분율 증가로 표현된다. 4 개의 상이한 rAAV 벡터 게놈 (1-4)을 테스트하였다. 조건 1-3은 AAVHSC15 캡시드를 사용하였고, 조건 4는 AAVHSC17 캡시드를 사용하였다. 다양한 형질주입 조건이 표 7에 제시되어 있다.
도 9는 이중 벡터 형질주입 시스템 설계-1 및 설계-2로부터의 캡시드 생성의 수준과 함께 각각 각각의 설계의 Rep/Cap 서열을 함유하는 벡터로부터의 캡시드 생성의 수준을 도시하는 그래프이다. 다양한 형질주입 조건이 표 8에 제시되어 있다.
도 10a-10c는 이중 벡터 형질주입 시스템 설계-1 (2 TFX) 및 삼중 벡터 형질주입 시스템 (3 TFX)을 사용하여 50 L 생물반응기 rAAV 생산으로부터 수득된 VG 생산성 (도 10a), 캡시드 생산성 (도 10b), 및 온전한 벡터 게놈의 백분율 (도 10c)을 도시하는 그래프이다. 형질주입 조건은 표 6, 조건 4, 설계-1에 대한 벡터 비율 1:2 및 연관된 삼중 형질주입 대조군에 제시되어 있다. 도 10d-10f는 2 TFX 및 3 TFX 시스템을 사용하여 수득된 정제된 AAV 벡터에서의 순도 퍼센트 (도 10d), 응집 퍼센트 (도 10e) 및 잔여 숙주 세포 단백질의 수준 (도 10f)을 도시하는 그래프이다. 도 10g-10j는 2 TFX 및 3 TFX 시스템을 사용하여 수득된 정제된 AAV 벡터에 패키징된 잔류 숙주 세포 DNA (도 10g), Rep/Cap (도 10h), E1a (도 10i) 및 헬퍼 서열 (도 10j)의 양을 도시하는 그래프이다. 도 10f 및 10i에서, 수평 점선은 샘플이 정량 한계 미만 (BLoQ)인 것으로 결정된 검정에 대한 검출 한계를 나타낸다. ns는 유의하지 않음을 의미하고; *는 p<0.05에서 통계적으로 유의함을 의미하며; ***는 p<0.001에서 통계적으로 유의함을 의미한다.
도 11a-11b는 1E12 VG/kg (도 11a) 및 1E14 VG/kg (도 11b)의 용량에서, 설계 1 (2 TFX) 및 연관된 삼중 형질주입 대조군 (3 TFX)에 대해 1:4의 벡터 비율로 표 6의 조건 5로부터 수득된 AAV 벡터가 투여된 Pahenu2 마우스의 혈청에서 측정된 페닐알라닌 (Phe)의 수준을 도시하는 그래프이다. 비히클-단독 투여는 대조군 (비히클)으로서 수행되었다. 도 11c-11e는 투약-후 6 주째에 치료된 마우스에서 간에서의 벡터 게놈 (도 11c), 트랜스진 발현 (도 11d) 및 표적-내(on-target) 통합 (도 11e)의 정량을 도시하는 그래프이다. ns는 유의하지 않음을 의미한다.
도 12a-12c는 형질주입된 총 DNA의 다양한 수준 (x-축)에서, 벡터 V3 및 V12 사이에 표시된 바와 같은 다양한 비율을 테스트한, 이중 벡터 형질주입 시스템 설계-1을 사용하여 소규모 rAAV 생산으로부터 수득된 VG 생산성 (도 12a), 캡시드 생산성 (도 12b), 및 온전한 벡터 게놈의 백분율 (도 12c)을 도시하는 그래프이다. 사용된 PEI:DNA 비율은 2:1이었다.
도 13a-13c는 형질주입된 총 DNA의 다양한 수준 (x-축)에서, 벡터 V3 및 V8 사이에 표시된 바와 같은 다양한 비율을 테스트한, 이중 벡터 형질주입 시스템 설계-1을 사용하여 소규모 rAAV 생산으로부터 수득된 VG 생산성 (도 13a), 캡시드 생산성 (도 13b), 및 온전한 벡터 게놈의 백분율 (도 13c)을 도시하는 그래프이다. 사용된 PEI:DNA 비율은 2:1이었다.
도 14a-14c는 이중 벡터 형질주입 시스템 설계-1 및 AAV 캡시드 혈청형 AAV1, AAV2, AAV5, AAV6, AAV8, AAV9, AAVrh10 및 AAVrh74에 걸친 연관된 삼중 형질주입 대조군을 사용하여 2 L-규모의 rAAV 생산으로부터 수득된 VG 생산성 (도 14a), 캡시드 생산성 (도 14b) 및 온전한 벡터 게놈의 백분율 (도 14c)을 도시하는 그래프이다.
도 15는 이중 벡터 형질주입 시스템 설계-1을 사용하여 50 L 및 2000 L 생물반응기 rAAV 생산으로부터 수득된 VG 생산성을 도시하는 그래프이다.
본 개시내용은 재조합 아데노-연관된 바이러스 (rAAV)의 생산을 위한 이중 벡터 형질주입 시스템을 제공한다. 본 개시내용은 본원에 기재된 이중 벡터 형질주입 접근법을 사용한 rAAV 생산이 기존의 삼중 벡터 형질주입 접근법에 비해 우수한 AAV 생산성을 초래한다는 발견에 기반한다. 본원에 기재된 이중 벡터 형질주입 시스템의 구성요소의 특이적 구성은 또한 선행 기술의 이중 벡터 형질주입 접근법에 비해 우수한 AAV 생산성을 초래한다.
I. 정의
본원에 사용된 바와 같이, 용어 "재조합 아데노-연관된 바이러스" 또는 "rAAV"는 기능적 rep 및 cap 유전자가 결여된 게놈을 포함하는 AAV를 지칭한다.
본원에 사용된 바와 같이, 용어 "cap 유전자"는 AAV 캡시드 단백질을 코딩하는 핵산 서열을 지칭한다.
본원에 사용된 바와 같이, 용어 "rep 유전자"는 AAV 복제에 필요한 AAV Rep 단백질 (예컨대, Rep78, Rep68, Rep52 및 Rep40)을 코딩하는 핵산 서열을 지칭한다.
본원에 사용된 바와 같이, 용어 "Rep-Cap 요소"는 AAV 복제에 필요한 AAV Rep 단백질 (예컨대, Rep78, Rep68, Rep52 및 Rep40)뿐만 아니라 AAV 캡시드 단백질 (예컨대, VP1, VP2 및 VP3)을 코딩하는 핵산 서열을 지칭한다.
본원에 사용된 바와 같이, 용어 "헬퍼 바이러스 유전자"는 AAV 복제를 매개하는 바이러스 유전자 (예컨대, 아데노바이러스 유전자 또는 헤르페스바이러스 유전자)를 코딩하는 핵산 서열을 지칭한다.
본원에 사용된 바와 같이, 용어 "rAAV 게놈"은 rAAV의 게놈 서열을 포함하는 핵산 분자를 지칭한다. 당업자는 rAAV 게놈이 트랜스진을 포함하는 경우, rAAV 게놈이 트랜스진의 전사의 방향에 대해 센스 또는 안티센스 배향일 수 있음을 이해할 것이다.
본원에 사용된 바와 같이, 용어 "편집 게놈"은 상동 재조합을 통해 편집 요소 (예컨대, 하나 이상의 뉴클레오티드 또는 뉴클레오티드간 결합)를 표적 유전자좌에 통합하여 표적 유전자 내 유전적 결함을 교정할 수 있는 재조합 AAV 게놈을 지칭한다. 당업자는 5' 상동성 아암, 편집 요소 및 3' 상동성 아암을 포함하는 편집 게놈의 일부가 표적 유전자좌에 대해 센스 또는 안티센스 배향일 수 있음을 이해할 것이다.
본원에 사용된 바와 같이, 용어 "편집 요소"는 표적 유전자좌에서 통합될 때 표적 유전자좌를 변형시키는 편집 게놈의 일부를 지칭한다. 편집 요소는 표적 유전자좌에서 하나 이상의 뉴클레오티드의 삽입, 결실 또는 치환을 매개할 수 있다. 본원에 사용된 바와 같이, 용어 "표적 유전자좌"는 편집 요소에 의해 변형되는 염색체의 영역 또는 뉴클레오티드간 결합 (예컨대, 표적 유전자의 영역 또는 뉴클레오티드간 결합)을 지칭한다.
본원에 사용된 바와 같이, 용어 "상동성 아암"은 표적 유전자좌에 측접하는 게놈과 실질적으로 동일한 편집 요소의 5' 또는 3'에 위치하는 편집 게놈의 일부를 지칭한다.
본원에 사용된 바와 같이, 2 개의 뉴클레오티드 서열 사이 또는 2 개의 아미노산 서열 사이의 "동일성 백분율"은 정렬된 서열의 쌍 사이의 매칭의 수에 100을 곱하고, 내부 갭(gap)을 포함하는 정렬된 영역의 길이로 나누어 계산된다. 동일성 스코어링은 완벽한 매칭만 카운팅하며, 아미노산 간의 유사성의 정도는 고려하지 않는다. 내부 갭만 길이에 포함되고 서열 단부에서의 갭은 포함되지 않는다는 점에 유의한다.
본원에 사용된 바와 같이, 용어 "코딩 서열"은 출발 코돈에서 시작하여 정지 코돈에서 끝나는, 폴리펩티드를 코딩하는 상보성 DNA (cDNA)의 일부를 지칭한다. 유전자는 대체 스플라이싱, 대체 번역 개시, 및 집단 내의 변이로 인해 하나 이상의 코딩 서열을 가질 수 있다. 코딩 서열은 야생형 또는 비-자연 발생 변이체 (예컨대, 코돈 최적화된 변이체)일 수 있다.
본원에 사용된 바와 같이, 용어 "전사 조절 요소" 또는 "TRE"는 RNA 분자를 형성하기 위해 RNA 중합효소에 의해 작동가능하게 연결된 뉴클레오티드 서열의 전사를 조절 (예컨대, 제어, 증가 또는 감소)시키는 시스-작용 뉴클레오티드 서열, 예를 들어, DNA 서열을 지칭한다. 전사를 조절하기 위해 TRE는 하나 이상의 트랜스-작용 분자, 예컨대, 전사 인자에 따라 좌우된다. 따라서, 하나의 TRE는 상이한 트랜스-작용 분자와 접촉할 때, 예를 들어, 상이한 유형의 세포에 있을 때, 상이한 방식으로 전사를 조절할 수 있다. TRE는 하나 이상의 프로모터 요소 및/또는 인핸서 요소를 포함할 수 있다. 당업자는 유전자 내의 프로모터 및 인핸서 요소가 위치가 가까울 수 있고, 용어 "프로모터"는 프로모터 요소 및 인핸서 요소를 포함하는 서열을 지칭할 수 있음을 이해할 것이다. 따라서, 용어 "프로모터"는 서열 내 인핸서 요소를 배제하지 않는다. 프로모터 및 인핸서 요소는 동일한 유전자 또는 종으로부터 유래될 필요가 없으며, 각각의 프로모터 또는 인핸서 요소의 서열은 게놈 내의 상응하는 내인성 서열과 동일하거나 실질적으로 동일할 수 있다.
본원에 사용된 바와 같이, 용어 "작동가능하게 연결된"은 TRE 및 전사될 코딩 서열 사이의 연접을 기재하기 위해 사용된다. 전형적으로, 유전자 발현은 하나 이상의 프로모터 및/또는 인핸서 요소를 포함하는 TRE의 제어 하에서 배치된다. 코딩 서열의 전사가 TRE에 의해 제어되거나 영향을 받는 경우 코딩 서열은 TRE에 "작동가능하게 연결된다". TRE의 프로모터 및 인핸서 요소는 원하는 전사 활성이 수득되는 한, 코딩 서열로부터 임의의 배향 및/또는 거리에 있을 수 있다. 특정 실시양태에서, TRE는 코딩 서열로부터 상류에 있다.
본원에 사용된 바와 같이, 용어 "폴리아데닐화 서열"은 RNA로 전사될 때 폴리아데닐화 신호 서열을 구성하는 DNA 서열을 지칭한다. 폴리아데닐화 서열은 천연 또는 외인성일 수 있다. 외인성 폴리아데닐화 서열은 포유동물 또는 바이러스 폴리아데닐화 서열 (예컨대, SV40 폴리아데닐화 서열)일 수 있다.
본원에 사용된 바와 같이, "외인성 폴리아데닐화 서열"은 트랜스진의 내인성 폴리아데닐화 서열과 동일하지 않거나 실질적으로 동일하지 않은 폴리아데닐화 서열을 지칭한다. 특정 실시양태에서, 외인성 폴리아데닐화 서열은 트랜스진과 상이하지만 동일한 종 (예컨대, 인간) 내에 있는 유전자의 폴리아데닐화 서열이다. 특정 실시양태에서, 외인성 폴리아데닐화 서열은 상이한 유기체 (예컨대, 바이러스)의 폴리아데닐화 서열이다.
II. 제1 핵산 벡터
rAAV의 생산을 위한 기존의 삼중 벡터 형질주입 시스템은 전형적으로 다음을 포함한다: AAV Rep 단백질 및 AAV 캡시드 단백질을 코딩하는 서열을 함유하는 제1 벡터; rAAV 게놈을 포함하는 제2 벡터; 및 하나 이상의 헬퍼 바이러스 유전자를 포함하는 제3 벡터. AAV Rep 단백질, AAV 캡시드 단백질 및 하나 이상의 헬퍼 바이러스 유전자를 코딩하는 유전자가 ("Rep-Cap-헬퍼 벡터")와 동일한 벡터에 클로닝될 수 있다는 것이 이전에 나타나있다. 이러한 경우에, rAAV 게놈을 포함하는 제2 벡터 (즉, Rep, Cap 및 헬퍼 유전자를 rAAV 게놈에 트랜스로 제공함)와 함께 Rep-Cap-헬퍼 벡터의 이중 형질주입을 사용하여, rAAV를 생성할 수 있다. 예컨대, 이의 개시내용이 그 전체가 본원에 참조로 원용되는 Grimm et al. (1998) Hum. Gene Ther. 9(18): 2745-2760 참고.
이전의 이중 벡터 형질주입 시스템과 대조적으로, 본 개시내용의 이중 벡터 형질주입 시스템은 rAAV 게놈과 함께 시스로 Rep 및 Cap 유전자를 제공한다. 따라서, 본 개시내용은 재조합 아데노-연관된 바이러스 (rAAV)의 생산을 위한 이중 벡터 형질주입 시스템을 제공하며, 여기서 본원에 기재된 이중 벡터 형질주입 시스템은 일반적으로 다음을 포함한다: (1) AAV Rep 단백질을 코딩하는 제1 뉴클레오티드 서열, 트랜스진을 포함하는 rAAV 게놈을 포함하는 제2 뉴클레오티드 서열 및 AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열을 포함하는, 제1 핵산 벡터; 및 (2) 헬퍼 바이러스 유전자를 포함하는 제2 핵산 벡터.
특정 실시양태에서, 제1 핵산 벡터는 5'으로부터 3'으로 다음을 포함한다: AAV Rep 단백질을 코딩하는 제1 뉴클레오티드 서열, 트랜스진을 포함하는 rAAV 게놈을 포함하는 제2 뉴클레오티드 서열, 및 AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열. 본 개시내용의 특정 양태는 제1 핵산 벡터가 헬퍼 바이러스 유전자 (예컨대, AAV 생산 헬퍼 인자를 코딩하는 유전자)를 포함하지 않는다는 것을 제공한다.
본원에 기재된 이중 벡터 형질주입 시스템은 일반적으로 AAV (예컨대, rAAV)를 생산하기 위해 적합한 숙주 세포 내로의 제1 핵산 벡터 및 제2 핵산 벡터의 형질주입을 수반한다. 특정 실시양태에서, 제1 핵산 벡터 및 제2 핵산 벡터는 함께 AAV (예컨대, rAAV) 생산에 필요한 모든 구성요소를 제공한다. 특정 실시양태에서, 제1 핵산 벡터 및 제2 핵산 벡터, 그리고 추가로, 숙주 세포는 함께 AAV (예컨대, rAAV) 생산에 필요한 모든 구성요소를 제공한다.
본원에 개시된 이중 벡터 형질주입 시스템은 기존의 삼중 벡터 형질주입 시스템 및 이전에 기재된 이중 벡터 형질주입 시스템 둘 모두와 비교하여 증가된 rAAV 생산성을 초래하는 것으로 밝혀졌다. 임의의 이론에도 얽매이지 않고, 출원인은 본원에 기재된 이중 벡터 형질주입 시스템에서 rAAV 게놈과 함께 시스로의 Rep 및 Cap 유전자의 제공이 부분적으로 더 적은 빈 AAV 캡시드가 생산되기 때문에 우수한 rAAV 생산성을 초래한다고 믿는다.
rAAV 게놈
본원에 개시된 이중 벡터 시스템에서, 제1 핵산 벡터는 일반적으로 rAAV 게놈을 포함하는 뉴클레오티드 서열을 포함한다. 특정 실시양태에서, rAAV 게놈은 트랜스진을 포함한다.
특정 실시양태에서, 트랜스진은 RNA 분자를 코딩하는 하나 이상의 서열을 포함한다. 적합한 RNA 분자는 제한 없이, miRNA, shRNA, siRNA, 안티센스 RNA, gRNA, 안타고미르, miRNA 스폰지, RNA 압타자임, RNA 압타머, mRNA, lncRNA, 리보자임, 및 당업계에 알려진 합성 RNA를 포함한다.
특정 실시양태에서, 트랜스진은 하나 이상의 폴리펩티드 또는 이의 단편을 코딩한다. 이러한 트랜스진은 폴리펩티드의 완전한 코딩 서열, 또는 폴리펩티드의 코딩 서열의 단편만을 포함할 수 있다. 특정 실시양태에서, 트랜스진은 대상체에서 질환 또는 장애를 치료하는 데 유용한 폴리펩티드를 코딩한다. 적합한 폴리펩티드는 제한 없이, β-글로빈, 헤모글로빈, 조직 플라스미노겐 활성화제 및 응고 인자; 콜로니 자극 인자 (CSF); 인터류킨, 예컨대, IL-1, IL-2, IL-3, IL-4, IL-5, IL-6, IL-7, IL-8, IL-9 등; 성장 인자, 예컨대, 각질형성세포 성장 인자 (KGF), 줄기 세포 인자 (SCF), 섬유아세포 성장 인자 (FGF, 예컨대, 염기성 FGF 및 산성 FGF), 간세포 성장 인자 (HGF), 인슐린-유사 성장 인자 (IGF), 뼈 형태발생 단백질 (BMP), 표피 성장 인자 (EGF), 성장 분화 인자-9 (GDF-9), 간종양 유래된 성장 인자 (HDGF), 미오스타틴 (GDF-8), 신경 성장 인자 (NGF), 뉴로트로핀, 혈소판-유래된 성장 인자 (PDGF), 트롬보포이에틴 (TPO), 형질전환 성장 인자 알파 (TGF-a) 및 형질전환 성장 인자 베타 (TGF-β) 등; 가용성 수용체, 예컨대, 가용성 TNF-a 수용체, 가용성 인터류킨 수용체 (예컨대, 가용성 IL-1 수용체 및 가용성 유형 II IL-1 수용체), 가용성 γ/ΔT 세포 수용체, 및 가용성 수용체의 리간드-결합 단편 등; 효소, 예컨대, a-글루코시다제, 이미글루세라제, β-글루코세레브로시다제 및 알글루세라제; 효소 활성화제, 예컨대, 조직 플라스미노겐 활성화제; 케모카인, 예컨대, IP-10, 인터페론-감마에 의해 유도된 모노카인 (Mig), Groα/IL-8, RANTES, MIP-1a, MIP-1β, MCP-1 및 PF-4 등; 혈관신생제, 예컨대, 혈관 내피 성장 인자 (VEGF, 예컨대, VEGF121, VEGF165, VEGF-C, VEGF-2), 신경교종-유래된 성장 인자, 안지오제닌 및 안지오제닌-2; 등; 항-혈관신생제, 예컨대, 가용성 VEGF 수용체; 단백질 백신; 신경자극성(neuroactive) 펩티드, 예컨대, 신경 성장 인자 (NGF), 브라디키닌, 콜레시스토키닌, 가스트린, 세크레틴, 옥시토신, 성선자극호르몬-방출 호르몬, 베타-엔돌핀, 엔케팔린, 물질 P, 소마토스타틴, 프로락틴, 갈라닌, 성장 호르몬-방출 호르몬, 봄베신, 디노르핀, 와파린, 뉴로텐신, 모틸린, 티로트로핀, 신경펩티드 Y, 황체형성 호르몬, 칼시토닌, 인슐린, 글루카곤, 바소프레신, 안지오텐신 II, 티로트로핀-방출 호르몬, 혈관작용 장 펩티드 및 수면 펩티드 등; 혈전용해제; 심방 나트륨이뇨 펩티드; 릴랙신; 신경교섬유성 산성 단백질; 난포 자극 호르몬 (FSH); 인간 알파-1 항트립신; 백혈병 억제 인자 (LIF); 조직 인자; 대식세포 활성화 인자; 종양 괴사 인자 (TNF); 호중구 화학주성 인자 (NCF); 메탈로프로테이나제의 조직 억제제; 혈관작용 장 펩티드; 안지오제닌; 안지오트로핀; 피브린; 히루딘; IL-1 수용체 길항제; 섬모 신경영양 인자 (CNTF); 뇌-유래된 신경영양 인자 (BDNF); 뉴로트로핀 3 및 4/5 (NT-3 및 -4/5); 신경교세포 유래된 신경영양 인자 (GDNF); 방향족 아미노산 탈탄산효소 (AADC); 인자 VIII, 인자 IX, 인자 X; 디스트로핀 또는 미니-디스트로핀; 리소좀 산 리파제; 페닐알라닌 수산화효소 (PAH); 글리코겐 저장 질환-관련된 효소, 예컨대, 글루코스-6-포스파타제, 산 말타제, 글리코겐 탈분지 효소, 근육 글리코겐 포스포릴라제, 간 글리코겐 포스포릴라제, 근육 포스포프럭토키나제, 포스포릴라제 키나제, 글루코스 수송체, 알돌라제 A, β-에놀라제, 글리코겐 합성효소; 리소좀 효소, 예컨대, 이두로네이트-2-설파타제 (I2S) 및 아릴설파타제 A; 및 미토콘드리아 단백질, 예컨대, 프라탁신을 포함한다.
특정 실시양태에서, 트랜스진은 하나 이상의 리소좀 저장 질환에 결함이 있을 수 있는 단백질을 코딩한다. 적합한 단백질은 제한 없이, α-시알리다제, 카텝신 A, α-만노시다제, β-만노시다제, 글리코실아스파라기나제, α-푸코시다제, α-N-아세틸글루코사미니다제, β-갈락토시다제, β-헥소사미니다제 α-서브유닛, β-헥소사미니다제 β-서브유닛, GM2 활성화제 단백질, 글루코세레브로시다제, 사포신 C, 아릴설파타제 A, 사포신 B, 포르밀-글리신 생성 효소, β-갈락토실세라미다제, α-갈락토시다제 A, 이두로네이트 설파타제, α-이두로니다제, 헤파란 N-설파타제, 아세틸-CoA 트랜스퍼라제, N-아세틸 글루코사미니다제, β-글루쿠로니다제, N-아세틸 글루코사민 6-설파타제, N-아세틸갈락토사민 4-설파타제, 갈락토스 6-설파타제, 히알루로니다제, α-글루코시다제, 산성 스핑고미엘리나제, 산성 세라미다제, 산성 리파제, 카텝신 K, 트리펩티딜 펩티다제, 팔미토일-단백질 티오에스테라제, 시스티노신, 시알린, UDP-N-아세틸글루코사민, 포스포트랜스퍼라제 γ-서브유닛, 뮤코리핀-1, LAMP-2, NPC1, CLN3, CLN 6, CLN 8, LYST, MYOV, RAB27A, 멜라노필린 및 AP3 β-서브유닛을 포함한다.
특정 실시양태에서, 트랜스진은 항체 또는 이의 단편 (예컨대, Fab, scFv 또는 전장 항체)을 코딩한다. 적합한 항체는 제한 없이, 뮤로모납-cd3, 에팔리주맙, 토시투모맙, 다클리주맙, 네바쿠맙, 카투막소맙, 에드레콜로맙, 압식시맙, 리툭시맙, 바실릭시맙, 팔리비주맙, 인플릭시맙, 트라스투주맙, 아달리무맙, 이브리투모맙 티욱세탄, 오말리주맙, 세툭시맙, 베바시주맙, 나탈리주맙, 파니투무맙, 라니비주맙, 에쿨리주맙, 세르톨리주맙, 우스테키누맙, 카나키누맙, 골리무맙, 오파투무맙, 토실리주맙, 데노수맙, 벨리무맙, 이필리무맙, 브렌툭시맙 베도틴, 페르투주맙, 락시바쿠맙, 오비누투주맙, 알렘투주맙, 실툭시맙, 라무시루맙, 베돌리주맙, 블리나투모맙, 니볼루맙, 펨브롤리주맙, 이다루시주맙, 네시투무맙, 디누툭시맙, 세쿠키누맙, 메폴리주맙, 알리로쿠맙, 에볼로쿠맙, 다라투무맙, 엘로투주맙, 익세키주맙, 레슬리주맙, 올라라투맙, 베즐로톡수맙, 아테졸리주맙, 오빌톡삭시맙, 이노투주맙 오조가미신, 브로달루맙, 구셀쿠맙, 두필루맙, 사릴루맙, 아벨루맙, 오크렐리주맙, 에미시주맙, 벤랄리주맙, 젬투주맙 오조가미신, 두르발루맙, 부로수맙, 에레누맙, 갈카네주맙, 라나델루맙, 모가물리주맙, 틸드라키주맙, 세미플리맙, 프레마네주맙, 라불리주맙, 에마팔루맙, 이발리주맙, 목세투모맙, 카플라시주맙, 로모소주맙, 리산키주맙, 폴라투주맙, 엡티네주맙, 레론리맙, 사시투주맙, 브로루시주맙, 이사툭시맙 및 테프로투무맙을 포함한다.
특정 실시양태에서, 트랜스진은 뉴클레아제를 코딩한다. 적합한 뉴클레아제는 제한 없이, 아연 핑거 뉴클레아제 (ZFN) (예컨대, 이들 각각이 그 전체가 본원에 참조로 원용되는, Porteus, and Baltimore (2003) Science 300: 763; Miller et al. (2007) Nat. Biotechnol. 25:778-785; Sander et al. (2011) Nature Methods 8:67-69; 및 Wood et al. (2011) Science 333:307 참고), 전사 활성화제-유사 이펙터 뉴클레아제 (TALEN) (예컨대, 이들 각각이 그 전체가 본원에 참조로 원용되는, Wood et al. (2011) Science 333:307; Boch et al. (2009) Science 326:1509-1512; Moscou and Bogdanove (2009) Science 326:1501; Christian et al. (2010) Genetics 186:757-761; Miller et al. (2011) Nat. Biotechnol. 29:143-148; Zhang et al. (2011) Nat. Biotechnol. 29:149-153; 및 Reyon et al. (2012) Nat. Biotechnol. 30(5): 460-465 참고), 귀소 엔도뉴클레아제, 메가뉴클레아제 (예컨대, 그 전체가 본원에 참조로 원용되는 미국 특허 공개공보 번호 US 2014/0121115 참고), 및 RNA-가이드된 뉴클레아제 (예컨대, 이들 각각이 그 전체가 본원에 참조로 원용되는, Makarova et al. (2018) The CRISPR Journal 1(5): 325-336; 및 Adli (2018) Nat. Communications 9:1911 참고)를 포함한다.
특정 실시양태에서, 트랜스진은 RNA-가이드된 뉴클레아제를 코딩한다. 적합한 RNA-가이드된 뉴클레아제는 제한 없이, 클래스 I 및 클래스 II 클러스터링 규칙적으로 간격을 둔 짧은 회문식 반복부 (CRISPR)-연관된 뉴클레아제를 포함한다. 클래스 I은 유형 I, III 및 IV로 나뉘며, 제한 없이, 유형 I (Cas3), 유형 I-A (Cas8a, Cas5), 유형 I-B (Cas8b), 유형 I-C (Cas8c), 유형 I-D (Cas10d), 유형 I-E (Csel, Cse2), 유형 I-F (Csyl, Csy2, Csy3), 유형 I-U (GSU0054), 유형 III (Cas10), 유형 III-A (Csm2), 유형 III-B (Cmr5), 유형 III-C (Csx10 또는 Csx11), 유형 III-D (Csx10) 및 유형 IV (Csf1)를 포함한다. 클래스 II는 유형 II, V 및 VI로 나뉘며, 제한 없이, 유형 II (Cas9), 유형 II-A (Csn2), 유형 II-B (Cas4), 유형 V (Cpf1, C2c1, C2c3), 및 유형 VI (Cas13a, Cas13b, Cas13c)를 포함한다. RNA-가이드된 뉴클레아제는 또한 자연-발생 클래스 II CRISPR 뉴클레아제, 예컨대, Cas9 (유형 II) 또는 Cas12a/Cpf1 (유형 V)뿐만 아니라 이로부터 유래 또는 수득된 기타 뉴클레아제를 포함한다. 본 발명에 사용될 수 있는 예시적인 Cas9 뉴클레아제는 S. 피오게네스(S. pyogenes) Cas9 (SpCas9), S. 아우레우스(S. aureus) Cas9 (SaCas9), N. 메닌기티디스(N. meningitidis) Cas9 (NmCas9), C. 제주니(C. jejuni) Cas9 (CjCas9) 및 지오바실러스(Geobacillus) Cas9 (GeoCas9)를 포함하나, 이에 제한되지 않는다.
특정 실시양태에서, 트랜스진은 발현 시 검출가능한 신호를 생산하는 하나 이상의 리포터 서열을 코딩한다. 이러한 리포터 서열은 제한 없이, β-락타마제, β-갈락토시다제 (LacZ), 알칼리성 포스파타제, 티미딘 키나제, 녹색 형광 단백질 (GFP), 적색 형광 단백질 (RFP), 클로람페니콜 아세틸트랜스퍼라제 (CAT), 루시퍼라제, 예를 들어, CD2, CD4, CD8, 인플루엔자 헤마글루티닌 단백질 및 그에 대해 지시된 고친화도 항체가 존재하거나 기존의 수단에 의해 생산될 수 있는 당업계에 잘 알려진 기타 단백질을 포함하는 막 결합된 단백질, 및 특히 헤마글루티닌 또는 Myc로부터의 항원 태그 도메인에 적절하게 융합된 막 결합된 단백질을 포함하는 융합 단백질을 포함한다.
특정 실시양태에서, rAAV 게놈은 트랜스진에 의해 코딩되는 RNA 또는 폴리펩티드의 발현을 제어하기 위해 트랜스진에 작동가능하게 연결된 전사 조절 요소 (TRE)를 포함한다. 특정 실시양태에서, TRE는 구성적 프로모터를 포함한다. 특정 실시양태에서, TRE는 임의의 포유동물 세포 (예컨대, 임의의 인간 세포)에서 활성일 수 있다. 특정 실시양태에서, TRE는 광범위한 인간 세포에서 활성이다. 이러한 TRE는 본원에 기재된 것들 중 임의의 것 및 당업자에게 알려진 것들 중 임의의 것을 포함하는, 구성적 프로모터 및/또는 인핸서 요소를 포함할 수 있다. 특정 실시양태에서, TRE는 유도성 프로모터를 포함한다. 특정 실시양태에서, TRE는 조직-특이적 TRE일 수 있으며, 즉, 이는 특이적 조직(들) 및/또는 기관(들)에서 활성이다. 조직-특이적 TRE는 하나 이상의 조직-특이적 프로모터 및/또는 인핸서 요소, 및 임의로 하나 이상의 구성적 프로모터 및/또는 인핸서 요소를 포함한다. 당업자는 조직-특이적 프로모터 및/또는 인핸서 요소가 당업계에 잘 알려진 방법에 의해 조직에서 특이적으로 발현되는 유전자로부터 단리될 수 있음을 이해할 것이다.
적합한 프로모터는 예컨대, 사이토메갈로바이러스 프로모터 (CMV)(Stinski et al. (1985) Journal of Virology 55(2): 431-441), CMV 초기 인핸서/닭 β-액틴 (CBA) 프로모터/토끼 β-글로빈 인트론 (CAG) (Miyazaki et al. (1989) Gene 79(2): 269-277), CBSB (Jacobson et al. (2006) Molecular Therapy 13(6): 1074-1084), 인간 신장 인자 1α 프로모터 (EF1α)(Kim et al. (1990) Gene 91 (2): 217-223), 인간 포스포글리세레이트 키나제 프로모터 (PGK)(Singer-Sam et al. (1984) Gene 32(3): 409-417), 미토콘드리아 중질-가닥 프로모터 (Lodeiro et al. (2012) PNAS 109(17): 6513-6518), 유비퀴틴 프로모터 (Wulff et al. (1990) FEBS Letters 261: 101-105)를 포함한다. 특정 실시양태에서, TRE는 사이토메갈로바이러스 (CMV) 프로모터/인핸서 (예컨대, 서열번호 18 또는 19와 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 동일한 뉴클레오티드 서열을 포함함), SV40 프로모터, 닭 베타 액틴 (CBA) 프로모터 (예컨대, 서열번호 20 또는 21과 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 동일한 뉴클레오티드 서열을 포함함), smCBA 프로모터 (예컨대, 서열번호 22와 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 동일한 뉴클레오티드 서열을 포함함), 인간 신장 인자 1 알파 (EF1α) 프로모터 (예컨대, 서열번호 23과 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 동일한 뉴클레오티드 서열을 포함함), 전사 인자 결합 부위를 포함하는 마우스의 미세(minute) 바이러스 (MVM) 인트론 (예컨대, 서열번호 24 또는 25와 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 동일한 뉴클레오티드 서열을 포함함), 인간 포스포글리세레이트 키나제 (PGK1) 프로모터, 인간 유비퀴틴 C (Ubc) 프로모터, 인간 베타 액틴 프로모터, 인간 뉴런-특이적 에놀라제 (ENO2) 프로모터, 인간 베타-글루쿠로니다제 (GUSB) 프로모터, 토끼 베타-글로빈 요소 (예컨대, 서열번호 26 또는 27과 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 동일한 뉴클레오티드 서열을 포함함), 인간 칼모듈린 1 (CALM1) 프로모터 (예컨대, 서열번호 28과 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 동일한 뉴클레오티드 서열을 포함함), 인간 ApoE/C-I 간 제어 영역 (HCR1) (예컨대, 서열번호 29와 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 동일한 뉴클레오티드 서열을 포함함), 인간 α1-항트립신 (hAAT) 프로모터 (예컨대, 서열번호 30, 31 또는 32와 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 동일한 뉴클레오티드 서열을 포함함), 연장된 HCR1 (예컨대, 서열번호 33과 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 동일한 뉴클레오티드 서열을 포함함), hAAT 프로모터의 HS-CRM8 요소 (예컨대, 서열번호 34와 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 동일한 뉴클레오티드 서열을 포함함), 인간 트랜스티레틴 (TTR) 프로모터 (예컨대, 서열번호 35와 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 동일한 뉴클레오티드 서열을 포함함), 및/또는 인간 메틸-CpG 결합 단백질 2 (MeCP2) 프로모터를 포함한다. 본원에 기재된 TRE 중 임의의 것은 효율적인 전사를 구동하기 위해 임의의 순서로 조합될 수 있다. 예를 들어, rAAV 게놈은 CMV 인핸서, CBA 프로모터, 및 총체적으로 CAG 프로모터 (예컨대, 서열번호 36과 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 동일한 뉴클레오티드 서열을 포함함)라고 불리는 토끼 베타-글로빈 유전자의 엑손 3으로부터의 스플라이스 수용자를 포함하는 TRE를 포함할 수 있다. 예를 들어, rAAV 게놈은 CMV 인핸서 및 CBA 프로모터의 하이브리드, 이어서, 총체적으로 CASI 프로모터 영역 (예컨대, 서열번호 37과 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 동일한 뉴클레오티드 서열을 포함함)이라고 불리는 스플라이스 공여자 및 스플라이스 수용자를 포함하는 TRE를 포함할 수 있다. 예를 들어, rAAV 게놈은 HCR1 및 hAAT 프로모터 (예컨대, 서열번호 38과 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 동일한 뉴클레오티드 서열을 포함하는, LP1 프로모터로서 또한 지칭됨)를 포함하는 TRE를 포함할 수 있다.
특정 실시양태에서, TRE는 뇌-특이적 (예컨대, 뉴런-특이적, 교세포-특이적, 성상교세포-특이적, 희돌기아교세포-특이적, 미세아교세포-특이적 및/또는 중추신경계-특이적)이다. 예시적인 뇌-특이적 TRE는 제한 없이, 인간 신경교섬유성 산성 단백질 (GFAP) 프로모터, 인간 시냅신 1 (SYN1) 프로모터, 인간 시냅신 2 (SYN2) 프로모터, 인간 메탈로티오네인 3 (MT3) 프로모터 및/또는 인간 단백지질 단백질 1 (PLP1) 프로모터로부터의 하나 이상의 요소를 포함할 수 있다. 보다 많은 뇌-특이적 프로모터 요소는 그 전체가 본원에 참조로 원용되는 WO 2016/100575A1에 개시되어 있다.
특정 실시양태에서, 트랜스진에 대한 천연 프로모터가 사용될 수 있다. 트랜스진의 발현이 천연 발현을 모방해야 하는 것이 바람직할 경우 천연 프로모터가 바람직할 수 있다. 천연 프로모터는 트랜스진의 발현이 일시적으로 또는 발달적으로, 또는 조직-특이적 방식으로, 또는 특이적 전사 자극에 반응하여 조절되어야 하는 경우 사용될 수 있다. 추가 실시양태에서, 다른 천연 발현 제어 요소, 예컨대, 인핸서 요소, 폴리아데닐화 부위 또는 Kozak 컨센서스 서열을 사용하여 천연 발현을 또한 모방할 수 있다.
특정 실시양태에서, rAAV 게놈은 편집 게놈을 포함한다. 편집 게놈은 편집 게놈과 세포 내 표적 유전자좌를 둘러싸는 게놈 영역의 상동 재조합에 의해 세포의 게놈을 편집하는 데 사용될 수 있다. 특정 실시양태에서, 편집 게놈은 상동 재조합에 의해 유전자의 유전적 결함을 교정하도록 설계된다. 편집 게놈은 일반적으로 (i) 표적 유전자 내의 표적 유전자좌를 편집하기 위한 편집 요소; (ii) 표적 유전자좌에 대해 5'인 제1 게놈 영역과 상동성을 갖는 편집 요소의 5'의 5' 상동성 아암 뉴클레오티드 서열; 및 (iii) 표적 유전자좌에 대해 3'인 제2 게놈 영역과 상동성을 갖는 편집 요소의 3'의 3' 상동성 아암 뉴클레오티드 서열을 포함하며, 여기서 5' 상동성 아암, 편집 요소 및 3' 상동성 아암을 포함하는 편집 게놈의 일부는 표적 유전자좌에 대해 센스 또는 안티센스 배향일 수 있다. 편집 게놈을 사용하여 편집하기에 적합한 표적 유전자는 제한 없이, 페닐알라닌 수산화효소 (PAH), 낭포성 섬유증 전도도 막관통 조절자 (CFTR), 베타 헤모글로빈 (HBB), 안구피부 백색증 II (OCA2), 헌팅틴 (HTT), 근긴장성 이영양증-단백질 키나제 (DMPK), 저-밀도 지질단백질 수용체 (LDLR), 아포지질단백질 B (APOB), 뉴로피브로민 1 (NF1), 다낭성 신장 질환 1 (PKD1), 다낭성 신장 질환 2 (PKD2), 응고 인자 VIII (F8), 디스트로핀 (DMD), 포스페이트-조절 엔도펩티다제 동족체, X-연결 (PHEX), 메틸-CpG-결합 단백질 2 (MECP2) 및 유비퀴틴-특이적 펩티다제 9Y, Y-연결 (USP9Y)을 포함한다.
특정 실시양태에서, 본원에 개시된 rAAV 게놈은 전사 종결인자 (예컨대, 폴리아데닐화 서열)를 추가로 포함한다. 특정 실시양태에서, 전사 종결인자는 트랜스진에 대해 3'이다. 전사 종결인자는 전사를 효과적으로 종결시키는 임의의 서열일 수 있으며, 당업자는 항체 코딩 서열의 적어도 일부의 전사가 요망되는 세포에서 발현되는 임의의 유전자로부터 이러한 서열이 단리될 수 있음을 이해할 것이다. 특정 실시양태에서, 전사 종결인자는 폴리아데닐화 서열을 포함한다. 특정 실시양태에서, 폴리아데닐화 서열은 면역글로불린 유전자의 내인성 폴리아데닐화 서열과 동일하거나 실질적으로 동일하다. 특정 실시양태에서, 폴리아데닐화 서열은 외인성 폴리아데닐화 서열이다. 특정 실시양태에서, 폴리아데닐화 서열은 SV40 폴리아데닐화 서열이다 (예컨대, 서열번호 65, 68 또는 69과 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 동일한 뉴클레오티드 서열, 또는 이에 상보적인 뉴클레오티드 서열을 포함함). 특정 실시양태에서, 폴리아데닐화 서열은 서열번호 65에 제시된 뉴클레오티드 서열을 포함한다. 특정 실시양태에서, 폴리아데닐화 서열은 서열번호 65에 제시된 뉴클레오티드 서열로 이루어진다. 특정 실시양태에서, 폴리아데닐화 서열은 소 성장 호르몬 (BGH) 폴리아데닐화 서열이다 (예컨대, 서열번호 67과 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 동일한 뉴클레오티드 서열, 또는 이에 상보적인 뉴클레오티드 서열을 포함함). 특정 실시양태에서, 폴리아데닐화 서열은 서열번호 67에 제시된 뉴클레오티드 서열을 포함한다. 특정 실시양태에서, 폴리아데닐화 서열은 서열번호 67에 제시된 뉴클레오티드 서열로 이루어진다.
특정 실시양태에서, rAAV 게놈은 서열번호 71, 85, 86, 87 또는 88에 제시된 서열과 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 동일한 뉴클레오티드 서열을 포함한다. 특정 실시양태에서, 편집 요소는 서열번호 71, 85, 86, 87 또는 88에 제시된 뉴클레오티드 서열을 포함한다. 특정 실시양태에서, 편집 요소는 서열번호 71, 85, 86, 87 또는 88에 제시된 뉴클레오티드 서열로 이루어진다.
특정 실시양태에서, 본원에 개시된 rAAV 게놈은 TRE의 5'의 5' 역전 말단 반복부 (5' ITR) 뉴클레오티드 서열, 및 항체 경쇄 코딩 서열과 연관된 폴리아데닐화 서열의 3'의 3' 역전 말단 반복부 (3' ITR) 뉴클레오티드 서열을 추가로 포함한다. 임의의 AAV 혈청형 또는 이의 변이체로부터의 ITR 서열은 본원에 개시된 rAAV 게놈에 사용될 수 있다. 5' 및 3' ITR은 동일한 혈청형의 AAV 또는 상이한 혈청형의 AAV로부터 유래될 수 있다. 본원에 개시된 rAAV 게놈에 사용하기 위한 예시적인 ITR은 본원의 서열번호 39, 40, 41, 42, 43 및 44에 제시되어 있다.
특정 실시양태에서, 5' ITR 또는 3' ITR은 AAV2로부터 유래된다. 특정 실시양태에서, 5' ITR 및 3' ITR 둘 모두는 AAV2로부터 유래된다. 특정 실시양태에서, 5' ITR 뉴클레오티드 서열은 서열번호 39와 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 서열 동일성을 갖거나, 3' ITR 뉴클레오티드 서열은 서열번호 40과 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 서열 동일성을 갖는다. 특정 실시양태에서, 5' ITR 뉴클레오티드 서열은 서열번호 39와 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 서열 동일성을 가지며, 3' ITR 뉴클레오티드 서열은 서열번호 40과 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 서열 동일성을 갖는다. 특정 실시양태에서, rAAV 게놈은 서열번호 39의 서열을 갖는 5' ITR 뉴클레오티드 서열, 및 서열번호 40의 서열을 갖는 3' ITR 뉴클레오티드 서열을 포함한다.
특정 실시양태에서, 5' ITR 또는 3' ITR은 AAV5로부터 유래된다. 특정 실시양태에서, 5' ITR 및 3' ITR 둘 모두는 AAV5로부터 유래된다. 특정 실시양태에서, 5' ITR 뉴클레오티드 서열은 서열번호 42와 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 서열 동일성을 갖거나, 3' ITR 뉴클레오티드 서열은 서열번호 43과 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 서열 동일성을 갖는다. 특정 실시양태에서, 5' ITR 뉴클레오티드 서열은 서열번호 42와 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 서열 동일성을 가지며, 3' ITR 뉴클레오티드 서열은 서열번호 43과 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 서열 동일성을 갖는다. 특정 실시양태에서, rAAV 게놈은 서열번호 42의 서열을 갖는 5' ITR 뉴클레오티드 서열, 및 서열번호 43의 서열을 갖는 3' ITR 뉴클레오티드 서열을 포함한다.
특정 실시양태에서, 5' ITR 뉴클레오티드 서열 및 3' ITR 뉴클레오티드 서열은 실질적으로 서로 상보적이다 (예컨대, 5' 또는 3' ITR에서 1, 2, 3, 4 또는 5 개의 뉴클레오티드 위치에서의 미스매치를 제외하고 서로 상보적임).
특정 실시양태에서, 5' ITR 또는 3' ITR은 변형되어, Rep 단백질에 의한 분해를 감소시키거나 폐지한다 ("비-분해가능한 ITR"). 특정 실시양태에서, 비-분해가능한 ITR은 말단 분해 부위의 뉴클레오티드 서열에서의 삽입, 결실 또는 치환을 포함한다. 이러한 변형은 rAAV 게놈이 감염된 세포에서 복제된 후 AAV의 자가-상보적인 이중-가닥 DNA 게놈의 형성을 가능하게 한다. 예시적인 비-분해가능한 ITR 서열은 당업계에 알려져 있다 (예컨대, 그 전체가 본원에 참조로 원용되는, 미국 특허 번호 7,790,154 및 9,783,824에 제공된 것들 참고). 특정 실시양태에서, 5' ITR은 서열번호 41과 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 동일한 뉴클레오티드 서열을 포함한다. 특정 실시양태에서, 5' ITR은 서열번호 41과 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 동일한 뉴클레오티드 서열로 이루어진다. 특정 실시양태에서, 5' ITR은 서열번호 41에 제시된 뉴클레오티드 서열로 이루어진다. 특정 실시양태에서, 3' ITR은 서열번호 44와 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 동일한 뉴클레오티드 서열을 포함한다. 특정 실시양태에서, 5' ITR은 서열번호 44와 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 동일한 뉴클레오티드 서열로 이루어진다. 특정 실시양태에서, 3' ITR은 서열번호 44에 제시된 뉴클레오티드 서열로 이루어진다. 특정 실시양태에서, 5' ITR은 서열번호 41에 제시된 뉴클레오티드 서열로 이루어지고, 3' ITR은 서열번호 44에 제시된 뉴클레오티드 서열로 이루어진다. 특정 실시양태에서, 5' ITR은 서열번호 41에 제시된 뉴클레오티드 서열로 이루어지고, 3' ITR은 서열번호 44에 제시된 뉴클레오티드 서열로 이루어진다.
특정 실시양태에서, 5' ITR은 야생형 AAV2 게놈 서열로부터 유래된 추가적인 뉴클레오티드 서열에 측접된다. 특정 실시양태에서, 5' ITR은 AAV2 게놈에서 야생형 AAV2 ITR에 인접한 야생형 AAV2 서열로부터 유래된 추가적인 46 bp 서열에 측접된다. 특정 실시양태에서, 추가적인 46 bp 서열은 rAAV 게놈에서 5' ITR에 대해 3'이다. 특정 실시양태에서, 46 bp 서열은 서열번호 45에 제시된 뉴클레오티드 서열로 이루어진다.
특정 실시양태에서, 3' ITR은 야생형 AAV2 게놈 서열로부터 유래된 추가적인 뉴클레오티드 서열에 측접된다. 특정 실시양태에서, 3' ITR은 AAV2 게놈에서 야생형 AAV2 ITR에 인접한 야생형 AAV2 서열로부터 유래된 추가적인 37 bp 서열에 측접된다. 예컨대, Savy et al., Human Gene Therapy Methods (2017) 28(5): 277-289 (이는 그 전체가 본원에 본원의 참조로 원용됨) 참고. 특정 실시양태에서, 추가적인 37 bp 서열은 rAAV 게놈에서 3' ITR에 대해 5'이다. 특정 실시양태에서, 37 bp 서열은 서열번호 46에 제시된 뉴클레오티드 서열로 이루어진다.
특정 실시양태에서, rAAV 게놈은 서열번호 75, 78, 80, 82 또는 84에 제시된 서열과 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 동일한 뉴클레오티드 서열을 포함한다. 특정 실시양태에서, 편집 요소는 서열번호 75, 78, 80, 82 또는 84에 제시된 뉴클레오티드 서열을 포함한다. 특정 실시양태에서, 편집 요소는 서열번호 75, 78, 80, 82 또는 84에 제시된 뉴클레오티드 서열로 이루어진다.
AAV Rep 단백질
본 개시내용은 Rep 단백질 코딩 서열 또는 이의 기능적 변이체의 코딩 서열을 포함하는 제1 핵산 벡터를 제공한다. AAV Rep 유전자의 발현은 2 개의 프로모터 및 대체 스플라이싱을 사용하여 제어되며, 4 개의 Rep 단백질인 Rep78, Rep68, Rep52 및 Rep40을 초래한다. Rep 단백질은 AAV 게놈 복제 및 바이러스 게놈의 패키징에 관여한다. Rep 단백질의 발현은 p5 및 p19 프로모터에 의해 제어된다. p5 프로모터는 대체 스플라이스 변이체 Rep78 및 Rep68의 발현을 구동한다. p19 프로모터는 대체 스플라이스 변이체 Rep52 및 Rep40의 발현을 구동한다. 따라서, 제1 핵산 벡터는 하나 이상의 Rep 단백질 또는 이의 기능적 변이체를 코딩하는 뉴클레오티드 서열을 포함할 수 있다.
하나 이상의 Rep 단백질은 AAV2로부터 유래될 수 있다. 예시적인 AAV2 게놈 서열은 NCBI 참조 서열 NC_001401.2를 통해 찾아볼 수 있다. NCBI 참조 서열에 따르면, Rep68은 뉴클레오티드 321 내지 2252에 의해 코딩되고; Rep78은 뉴클레오티드 321 내지 2186에 의해 코딩되고; Rep40은 뉴클레오티드 993 내지 2252에 의해 코딩되고; Rep52는 뉴클레오티드 993 내지 2186에 의해 코딩된다.
특정 실시양태에서, 본 개시내용은 Rep78을 코딩하는 뉴클레오티드 서열을 포함하는 핵산을 제공하며, 여기서 Rep78을 코딩하는 뉴클레오티드 서열은 서열번호 50에 제시된 서열과 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 갖는 서열을 포함한다. 특정 실시양태에서, Rep78을 코딩하는 뉴클레오티드 서열은 서열번호 50에 제시된 서열을 포함하거나 이로 이루어진다. 특정 실시양태에서, Rep78을 코딩하는 뉴클레오티드 서열을 포함하는 핵산은 Rep78을 코딩하는 뉴클레오티드 서열에 작동가능하게 연결된 전사 조절 요소를 포함한다. 특정 실시양태에서, Rep78을 코딩하는 뉴클레오티드 서열에 작동가능하게 연결된 전사 조절 요소는 서열번호 47에 제시된 서열과 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 갖는 서열을 포함한다. 특정 실시양태에서, Rep78을 코딩하는 뉴클레오티드 서열에 작동가능하게 연결된 전사 조절 요소는 서열번호 47에 제시된 서열을 포함하거나 이로 이루어진다. 특정 실시양태에서, Rep78을 코딩하는 뉴클레오티드 서열을 포함하는 핵산은 서열번호 51에 제시된 서열과 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 갖는 서열을 포함한다. 특정 실시양태에서, Rep78을 코딩하는 뉴클레오티드 서열을 포함하는 핵산은 서열번호 51에 제시된 서열을 포함하거나 이로 이루어진다. 특정 실시양태에서, 본 개시내용은 상이한 아데노바이러스 혈청형에서, AAV2에 대해 기재된 바와 같은 Rep78을 코딩하는 서열에 상응하는 뉴클레오티드 서열을 포함하는 핵산을 제공한다.
특정 실시양태에서, 본 개시내용은 Rep68을 코딩하는 뉴클레오티드 서열을 포함하는 핵산을 제공하며, 여기서 Rep68을 코딩하는 뉴클레오티드 서열은 서열번호 52에 제시된 서열과 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 갖는 서열을 포함한다. 특정 실시양태에서, Rep68을 코딩하는 뉴클레오티드 서열은 서열번호 52에 제시된 서열을 포함하거나 이로 이루어진다. 특정 실시양태에서, Rep68을 코딩하는 뉴클레오티드 서열을 포함하는 핵산은 Rep68을 코딩하는 뉴클레오티드 서열에 작동가능하게 연결된 전사 조절 요소를 포함한다. 특정 실시양태에서, Rep68을 코딩하는 뉴클레오티드 서열에 작동가능하게 연결된 전사 조절 요소는 서열번호 47에 제시된 서열과 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 갖는 서열을 포함한다. 특정 실시양태에서, Rep68을 코딩하는 뉴클레오티드 서열에 작동가능하게 연결된 전사 조절 요소는 서열번호 47에 제시된 서열을 포함하거나 이로 이루어진다. 특정 실시양태에서, Rep68을 코딩하는 뉴클레오티드 서열을 포함하는 핵산은 서열번호 53에 제시된 서열과 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 갖는 서열을 포함한다. 특정 실시양태에서, Rep68을 코딩하는 뉴클레오티드 서열을 포함하는 핵산은 서열번호 53에 제시된 서열을 포함하거나 이로 이루어진다. 특정 실시양태에서, 본 개시내용은 상이한 아데노바이러스 혈청형에서, AAV2에 대해 기재된 바와 같은 Rep68을 코딩하는 서열에 상응하는 뉴클레오티드 서열을 포함하는 핵산을 제공한다.
특정 실시양태에서, 본 개시내용은 Rep40을 코딩하는 뉴클레오티드 서열을 포함하는 핵산을 제공하며, 여기서 Rep40을 코딩하는 뉴클레오티드 서열은 서열번호 54에 제시된 서열과 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 갖는 서열을 포함한다. 특정 실시양태에서, Rep40을 코딩하는 뉴클레오티드 서열은 서열번호 54에 제시된 서열을 포함하거나 이로 이루어진다. 특정 실시양태에서, Rep40을 코딩하는 뉴클레오티드 서열을 포함하는 핵산은 Rep40을 코딩하는 뉴클레오티드 서열에 작동가능하게 연결된 전사 조절 요소를 포함한다. 특정 실시양태에서, Rep40을 코딩하는 뉴클레오티드 서열에 작동가능하게 연결된 전사 조절 요소는 서열번호 48에 제시된 서열과 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 갖는 서열을 포함한다. 특정 실시양태에서, Rep40을 코딩하는 뉴클레오티드 서열에 작동가능하게 연결된 전사 조절 요소는 서열번호 48에 제시된 서열을 포함하거나 이로 이루어진다. 특정 실시양태에서, Rep40을 코딩하는 뉴클레오티드 서열을 포함하는 핵산은 서열번호 55에 제시된 서열과 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 갖는 서열을 포함한다. 특정 실시양태에서, Rep40을 코딩하는 뉴클레오티드 서열을 포함하는 핵산은 서열번호 55에 제시된 서열을 포함하거나 이로 이루어진다. 특정 실시양태에서, 본 개시내용은 상이한 아데노바이러스 혈청형에서, AAV2에 대해 기재된 바와 같은 Rep40을 코딩하는 서열에 상응하는 뉴클레오티드 서열을 포함하는 핵산을 제공한다.
특정 실시양태에서, 본 개시내용은 Rep52를 코딩하는 뉴클레오티드 서열을 포함하는 핵산을 제공하며, 여기서 Rep52를 코딩하는 뉴클레오티드 서열은 서열번호 56에 제시된 서열과 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 갖는 서열을 포함한다. 특정 실시양태에서, Rep52를 코딩하는 뉴클레오티드 서열은 서열번호 56에 제시된 서열을 포함하거나 이로 이루어진다. 특정 실시양태에서, Rep52를 코딩하는 뉴클레오티드 서열을 포함하는 핵산은 Rep52를 코딩하는 뉴클레오티드 서열에 작동가능하게 연결된 전사 조절 요소를 포함한다. 특정 실시양태에서, Rep52를 코딩하는 뉴클레오티드 서열에 작동가능하게 연결된 전사 조절 요소는 서열번호 48에 제시된 서열과 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 갖는 서열을 포함한다. 특정 실시양태에서, Rep52를 코딩하는 뉴클레오티드 서열에 작동가능하게 연결된 전사 조절 요소는 서열번호 48에 제시된 서열을 포함하거나 이로 이루어진다. 특정 실시양태에서, Rep52를 코딩하는 뉴클레오티드 서열을 포함하는 핵산은 서열번호 57에 제시된 서열과 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 갖는 서열을 포함한다. 특정 실시양태에서, Rep52를 코딩하는 뉴클레오티드 서열을 포함하는 핵산은 서열번호 57에 제시된 서열을 포함하거나 이로 이루어진다. 특정 실시양태에서, 본 개시내용은 상이한 아데노바이러스 혈청형에서, AAV2에 대해 기재된 바와 같은 Rep52를 코딩하는 서열에 상응하는 뉴클레오티드 서열을 포함하는 핵산을 제공한다.
특정 실시양태에서, 본 개시내용은 Rep78, Rep68, Rep40 및 Rep52를 코딩하는 뉴클레오티드 서열을 포함하는 핵산을 제공하며, 여기서 Rep78, Rep68, Rep40 및 Rep52를 코딩하는 뉴클레오티드 서열은 서열번호 58에 제시된 서열과 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 갖는 서열을 포함한다. 특정 실시양태에서, Rep78, Rep68, Rep40 및 Rep52를 코딩하는 뉴클레오티드 서열은 서열번호 58에 제시된 서열을 포함하거나 이로 이루어진다. 특정 실시양태에서, Rep78, Rep68, Rep40 및 Rep52를 코딩하는 뉴클레오티드 서열을 포함하는 핵산은 Rep78, Rep68, Rep40 및 Rep52를 코딩하는 뉴클레오티드 서열 각각에 작동가능하게 연결될 수 있는 하나 이상의 전사 조절 요소를 포함한다. 특정 실시양태에서, Rep78, Rep68, Rep40 및 Rep52를 코딩하는 뉴클레오티드 서열을 포함하는 핵산은 서열번호 59에 제시된 서열과 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 갖는 서열을 포함한다. 특정 실시양태에서, Rep78, Rep68, Rep40 및 Rep52를 코딩하는 뉴클레오티드 서열을 포함하는 핵산은 서열번호 59에 제시된 서열을 포함하거나 이로 이루어진다.
AAV 캡시드 단백질
본 개시내용은 AAV 캡시드 단백질 코딩 서열을 포함하는 뉴클레오티드 서열을 포함하는 제1 핵산 벡터를 제공한다. 제1 핵산 벡터는 자연 AAV 단리물 및 이의 변이체를 포함하여 당업계에 알려진 임의의 AAV 캡시드로부터의 AAV 캡시드 단백질을 코딩하는 뉴클레오티드 서열을 포함할 수 있다.
AAV 캡시드 단백질은 VP1, VP2 및 VP3 캡시드 단백질을 포함한다. VP1, VP2 및/또는 VP3 캡시드 단백질은 rAAV 게놈을 둘러싸는 캡시드로 조립된다. 특정 실시양태에서, 캡시드 단백질의 조립은 조립-활성화 단백질 (AAP)에 의해 촉진된다. 특정 AAV 혈청형의 캡시드는 조립을 위해 캡시드 단백질을 핵소체로 운반하는 데 AAP의 역할이 필요하다. 예를 들어, AAV1, AAV2, AAV3, AAV6, AAV7, AAV8, AAV9, AAV10 및 AAV12는 캡시드를 형성하기 위해 AAP가 필요한 반면, AAV4, AAV5 및 AAV11의 캡시드는 AAP 없이 조립할 수 있다. 예컨대, Earley et al. (2017) J. Virol. 91(3): e01980-16 참고.
상이한 AAV 혈청형 또는 이의 변이체는 상이한 아미노산 서열을 갖는 AAV 캡시드 단백질을 포함한다. 적합한 AAV 캡시드 단백질은 제한 없이, AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAV13, AAV-DJ, AAV-LK03, NP59, VOY101, VOY201, VOY701, VOY801, VOY1101, AAVPHP.N, AAVPHP.A, AAVPHP.B, PHP.B2, PHP.B3, G2A3, G2B4, G2B5, PHP.S, AAVrh10, AAVRh32.33, AAVrh74, AAVHSC1, AAVHSC2, AAVHSC3, AAVHSC4, AAVHSC5, AAVHSC6, AAVHSC7, AAVHSC8, AAVHSC9, AAVHSC10, AAVHSC11, AAVHSC12, AAVHSC13, AAVHSC14, AAVHSC15, AAVHSC16, AAVHSC17 및 이들의 임의의 변이체로부터의 캡시드 단백질을 포함한다. 특정 실시양태에서, AAV 캡시드 단백질은 AAV1, AAV2, AAV5, AAV6, AAV8, AAV9, AAVrh10 및 AAVrh74로 이루어진 군으로부터 선택된다. 특정 실시양태에서, AAV 캡시드 단백질은 AAV1, AAV2, AAV5, AAV6, AAV8 및 AAVrh74로 이루어진 군으로부터 선택된다. 다양한 AAV 캡시드 단백질의 서열은 예컨대, 이의 개시내용이 그 전체가 본원에 참조로 원용되는, 미국 특허 공개공보 번호: US20030138772, US20140359799, US20150159173, US20150376607, US20170081680 및 US20170360962A1, 및 PCT 공개공보 번호 WO2020227515에 개시되어 있다.
예를 들어, 특정 실시양태에서, 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16 또는 17의 아미노산 203-736의 아미노산 서열과 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 갖는 아미노산 서열을 포함한다. 특정 실시양태에서, 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16 또는 17의 아미노산 203-736의 아미노산 서열과 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 갖는 아미노산 서열을 포함하며, 여기서 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질의 아미노산은 C이거나; 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질의 아미노산은 H이거나; 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질의 아미노산은 Q이거나; 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질의 아미노산은 A이거나; 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질의 아미노산은 N이거나; 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질의 아미노산은 S이거나; 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질의 아미노산은 I이거나; 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질의 아미노산은 G 또는 Y이거나; 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질의 아미노산은 M이거나; 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질의 아미노산은 K이거나; 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질의 아미노산은 C이거나; 또는 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질의 아미노산은 G이다. 특정 실시양태에서, 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질의 아미노산은 G이고, 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질의 아미노산은 G이다. 특정 실시양태에서, 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질의 아미노산은 H이고, 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질의 아미노산은 N이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이고, 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질의 아미노산은 M이다. 특정 실시양태에서, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이고, 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질의 아미노산은 R이다. 특정 실시양태에서, 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질의 아미노산은 A이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이다. 특정 실시양태에서, 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질의 아미노산은 I이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이고, 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질의 아미노산은 C이다. 특정 실시양태에서, 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16 또는 17의 아미노산 203-736의 아미노산 서열을 포함한다.
예를 들어, 특정 실시양태에서, 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16 또는 17의 아미노산 138-736의 아미노산 서열과 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 갖는 아미노산 서열을 포함한다. 특정 실시양태에서, 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16 또는 17의 아미노산 138-736의 아미노산 서열과 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 갖는 아미노산 서열을 포함하며, 여기서 서열번호 16의 아미노산 151에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 160에 상응하는 캡시드 단백질의 아미노산은 D이거나; 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질의 아미노산은 C이거나; 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질의 아미노산은 H이거나; 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질의 아미노산은 Q이거나; 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질의 아미노산은 A이거나; 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질의 아미노산은 N이거나; 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질의 아미노산은 S이거나; 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질의 아미노산은 I이거나; 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질의 아미노산은 G 또는 Y이거나; 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질의 아미노산은 M이거나; 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질의 아미노산은 K이거나; 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질의 아미노산은 C이거나; 또는 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질의 아미노산은 G이다. 특정 실시양태에서, 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질의 아미노산은 G이고, 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질의 아미노산은 G이다. 특정 실시양태에서, 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질의 아미노산은 H이고, 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질의 아미노산은 N이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이고, 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질의 아미노산은 M이다. 특정 실시양태에서, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이고, 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질의 아미노산은 R이다. 특정 실시양태에서, 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질의 아미노산은 A이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이다. 특정 실시양태에서, 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질의 아미노산은 I이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이고, 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질의 아미노산은 C이다. 특정 실시양태에서, 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16 또는 17의 아미노산 138-736의 아미노산 서열을 포함한다.
예를 들어, 특정 실시양태에서, 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16 또는 17의 아미노산 1-736의 아미노산 서열과 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 갖는 아미노산 서열을 포함한다. 특정 실시양태에서, 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16 또는 17의 아미노산 1-736의 아미노산 서열과 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 갖는 아미노산 서열을 포함하며, 여기서 서열번호 16의 아미노산 2에 상응하는 캡시드 단백질의 아미노산은 T이거나; 서열번호 16의 아미노산 65에 상응하는 캡시드 단백질의 아미노산은 I이거나; 서열번호 16의 아미노산 68에 상응하는 캡시드 단백질의 아미노산은 V이거나; 서열번호 16의 아미노산 77에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 119에 상응하는 캡시드 단백질의 아미노산은 L이거나; 서열번호 16의 아미노산 151에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 160에 상응하는 캡시드 단백질의 아미노산은 D이거나; 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질의 아미노산은 C이거나; 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질의 아미노산은 H이거나; 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질의 아미노산은 Q이거나; 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질의 아미노산은 A이거나; 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질의 아미노산은 N이거나; 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질의 아미노산은 S이거나; 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질의 아미노산은 I이거나; 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질의 아미노산은 G 또는 Y이거나; 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질의 아미노산은 M이거나; 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질의 아미노산은 R이거나; 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질의 아미노산은 K이거나; 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질의 아미노산은 C이거나; 또는 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질의 아미노산은 G이다. 특정 실시양태에서, 서열번호 16의 아미노산 2에 상응하는 캡시드 단백질의 아미노산은 T이고, 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질의 아미노산은 Q이다. 특정 실시양태에서, 서열번호 16의 아미노산 65에 상응하는 캡시드 단백질의 아미노산은 I이고, 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질의 아미노산은 Y이다. 특정 실시양태에서, 서열번호 16의 아미노산 77에 상응하는 캡시드 단백질의 아미노산은 R이고, 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질의 아미노산은 K이다. 특정 실시양태에서, 서열번호 16의 아미노산 119에 상응하는 캡시드 단백질의 아미노산은 L이고, 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질의 아미노산은 S이다. 특정 실시양태에서, 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질의 아미노산은 G이고, 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질의 아미노산은 G이다. 특정 실시양태에서, 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질의 아미노산은 H이고, 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질의 아미노산은 N이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이고, 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질의 아미노산은 M이다. 특정 실시양태에서, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이고, 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질의 아미노산은 R이다. 특정 실시양태에서, 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질의 아미노산은 A이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이다. 특정 실시양태에서, 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질의 아미노산은 I이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산은 R이고, 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질의 아미노산은 C이다. 특정 실시양태에서, 캡시드 단백질은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16 또는 17의 아미노산 1-736의 아미노산 서열을 포함한다.
특정 실시양태에서, AAV 캡시드는 다음 중 2 개 이상을 포함한다: (a) 서열번호 1, 2, 3, 4, 6, 7, 10, 11, 12, 13, 15, 16 또는 17의 아미노산 203-736의 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 1, 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 15, 16 또는 17의 아미노산 138-736의 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16 또는 17의 아미노산 1-736의 아미노산 서열을 포함하는 캡시드 단백질. 특정 실시양태에서, AAV 캡시드는 다음을 포함한다: (a) 서열번호 1, 2, 3, 4, 6, 7, 10, 11, 12, 13, 15, 16 또는 17의 아미노산 203-736으로 이루어진 아미노산 서열을 갖는 캡시드 단백질; (b) 서열번호 1, 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 15, 16 또는 17의 아미노산 138-736으로 이루어진 아미노산 서열을 갖는 캡시드 단백질; 및 (c) 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16 또는 17의 아미노산 1-736으로 이루어진 아미노산 서열을 갖는 캡시드 단백질.
특정 실시양태에서, AAV 캡시드는 다음 중 하나 이상을 포함한다: (a) 서열번호 8의 아미노산 203-736의 서열과 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 8의 아미노산 138-736의 서열과 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 8의 아미노산 1-736의 서열과 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질. 특정 실시양태에서, AAV 캡시드는 다음 중 하나 이상을 포함한다: (a) 서열번호 8의 아미노산 203-736의 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 8의 아미노산 138-736의 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 8의 아미노산 1-736의 아미노산 서열을 포함하는 캡시드 단백질. 특정 실시양태에서, AAV 캡시드는 다음 중 2 개 이상을 포함한다: (a) 서열번호 8의 아미노산 203-736의 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 8의 아미노산 138-736의 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 8의 아미노산 1-736의 아미노산 서열을 포함하는 캡시드 단백질. 특정 실시양태에서, AAV 캡시드는 다음을 포함한다: (a) 서열번호 8의 아미노산 203-736으로 이루어진 아미노산 서열을 갖는 캡시드 단백질; (b) 서열번호 8의 아미노산 138-736으로 이루어진 아미노산 서열을 갖는 캡시드 단백질; 및 (c) 서열번호 8의 아미노산 1-736으로 이루어진 아미노산 서열을 갖는 캡시드 단백질.
특정 실시양태에서, AAV 캡시드는 다음 중 하나 이상을 포함한다: (a) 서열번호 11의 아미노산 203-736의 서열과 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 11의 아미노산 138-736의 서열과 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 11의 아미노산 1-736의 서열과 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질. 특정 실시양태에서, AAV 캡시드는 다음 중 하나 이상을 포함한다: (a) 서열번호 11의 아미노산 203-736의 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 11의 아미노산 138-736의 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 11의 아미노산 1-736의 아미노산 서열을 포함하는 캡시드 단백질. 특정 실시양태에서, AAV 캡시드는 다음 중 2 개 이상을 포함한다: (a) 서열번호 11의 아미노산 203-736의 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 11의 아미노산 138-736의 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 11의 아미노산 1-736의 아미노산 서열을 포함하는 캡시드 단백질. 특정 실시양태에서, AAV 캡시드는 다음을 포함한다: (a) 서열번호 11의 아미노산 203-736으로 이루어진 아미노산 서열을 갖는 캡시드 단백질; (b) 서열번호 11의 아미노산 138-736으로 이루어진 아미노산 서열을 갖는 캡시드 단백질; 및 (c) 서열번호 11의 아미노산 1-736으로 이루어진 아미노산 서열을 갖는 캡시드 단백질.
특정 실시양태에서, AAV 캡시드는 다음 중 하나 이상을 포함한다: (a) 서열번호 13의 아미노산 203-736의 서열과 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 13의 아미노산 138-736의 서열과 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 13의 아미노산 1-736의 서열과 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질. 특정 실시양태에서, AAV 캡시드는 다음 중 하나 이상을 포함한다: (a) 서열번호 13의 아미노산 203-736의 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 13의 아미노산 138-736의 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 13의 아미노산 1-736의 아미노산 서열을 포함하는 캡시드 단백질. 특정 실시양태에서, AAV 캡시드는 다음 중 2 개 이상을 포함한다: (a) 서열번호 13의 아미노산 203-736의 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 13의 아미노산 138-736의 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 13의 아미노산 1-736의 아미노산 서열을 포함하는 캡시드 단백질. 특정 실시양태에서, AAV 캡시드는 다음을 포함한다: (a) 서열번호 13의 아미노산 203-736으로 이루어진 아미노산 서열을 갖는 캡시드 단백질; (b) 서열번호 13의 아미노산 138-736으로 이루어진 아미노산 서열을 갖는 캡시드 단백질; 및 (c) 서열번호 13의 아미노산 1-736으로 이루어진 아미노산 서열을 갖는 캡시드 단백질.
특정 실시양태에서, AAV 캡시드는 다음 중 하나 이상을 포함한다: (a) 서열번호 16의 아미노산 203-736의 서열과 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 16의 아미노산 138-736의 서열과 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 16의 아미노산 1-736의 서열과 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질. 특정 실시양태에서, AAV 캡시드는 다음 중 하나 이상을 포함한다: (a) 서열번호 16의 아미노산 203-736의 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 16의 아미노산 138-736의 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 16의 아미노산 1-736의 아미노산 서열을 포함하는 캡시드 단백질. 특정 실시양태에서, AAV 캡시드는 다음 중 2 개 이상을 포함한다: (a) 서열번호 16의 아미노산 203-736의 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 16의 아미노산 138-736의 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 16의 아미노산 1-736의 아미노산 서열을 포함하는 캡시드 단백질. 특정 실시양태에서, AAV 캡시드는 다음을 포함한다: (a) 서열번호 16의 아미노산 203-736으로 이루어진 아미노산 서열을 갖는 캡시드 단백질; (b) 서열번호 16의 아미노산 138-736으로 이루어진 아미노산 서열을 갖는 캡시드 단백질; 및 (c) 서열번호 16의 아미노산 1-736으로 이루어진 아미노산 서열을 갖는 캡시드 단백질.
특정 실시양태에서, AAV 캡시드 단백질을 코딩하는 뉴클레오티드는 AAV 캡시드 단백질의 발현을 제어하는 전사 조절 요소에 작동가능하게 연결된다. 특정 실시양태에서, 전사 조절 요소는 구성적 프로모터, 유도성 프로모터 및 천연 프로모터로 이루어진 군으로부터 선택되는 프로모터를 포함한다. AAV 캡시드 단백질의 발현을 제어할 수 있는 당업계에 알려진 임의의 프로모터가 사용될 수 있다. 사용하기에 적합한 프로모터는 당업자에게 알려져 있고, 제한 없이, p40 프로모터, 메탈로티오닌 (MT) 프로모터, 마우스 유방 종양 바이러스 (MMTV) 프로모터, T7 프로모터, 엑디손 곤충 프로모터, 테트라사이클린-억압성 프로모터, 테트라사이클린-유도성 프로모터, RU486-유도성 프로모터 및 라파마이신-유도성 프로모터를 포함한다. 다른 적합한 프로모터는 제한 없이, CMV 프로모터, CBA 프로모터 및 CAG 프로모터를 포함한다.
특정 실시양태에서, AAV 캡시드 단백질을 코딩하는 뉴클레오티드 서열에 작동가능하게 연결된 전사 조절 요소는 서열번호 47, 48 또는 49에 제시된 서열과 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 갖는 서열을 포함한다. 특정 실시양태에서, AAV 캡시드 단백질을 코딩하는 뉴클레오티드 서열에 작동가능하게 연결된 전사 조절 요소는 서열번호 47, 48 또는 49에 제시된 서열을 포함하거나 이로 이루어진다.
다른 양태에서, 본 개시내용은 Rep-Cap 요소를 포함하는 제1 뉴클레오티드 서열 및 트랜스진을 포함하는 rAAV 게놈을 포함하는 제2 뉴클레오티드 서열을 포함하는, 제1 핵산 벡터를 제공한다. 특정 실시양태에서, Rep-Cap 요소는 AAV Rep 단백질을 코딩하는 핵산 서열 및 AAV 캡시드 단백질을 코딩하는 핵산 서열을 포함한다. Rep-Cap 요소는 당업계에 알려진 임의의 AAV Rep 단백질을 코딩하는 핵산 서열 및 당업계에 알려진 임의의 AAV 캡시드 단백질을 코딩하는 핵산 서열을 포함할 수 있다. 특정 실시양태에서 Rep-Cap 요소는 서열번호 73 또는 77에 제시된 서열과 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 갖는 뉴클레오티드 서열을 포함한다.
III. 제2 핵산 벡터
본원에 기재된 이중 벡터 형질주입 시스템은 일반적으로 하나 이상의 헬퍼 바이러스 유전자를 포함하는 제2 핵산 벡터를 포함한다. 당업자가 인식하는 바와 같이, AAV의 복제는 헬퍼 바이러스 유전자에 의해 코딩되는 헬퍼 인자의 존재에 따라 좌우된다. 헬퍼 인자는 헬퍼 바이러스, 예컨대, 제한 없이, 아데노바이러스, 헤르페스바이러스, 유두종바이러스, 사이토메갈로바이러스, 배큘로바이러스 및 인간 보카바이러스로부터의 헬퍼 바이러스에 의한 동시감염을 통해 제공될 수 있다. 그러나, 헬퍼 바이러스의 존재 하에 AAV를 성장시키는 것은 숙주 세포의 용해 및/또는 AAV 생성물의 오염을 야기할 수 있다. 이와 같이, AAV 복제에 필요한 헬퍼 인자를 코딩하는 헬퍼 바이러스의 유전자는 숙주 세포를 형질주입시키는 데 사용되는 벡터에 제공될 수 있다.
본원에 기재된 이중 벡터 형질주입 시스템은 일반적으로 AAV (예컨대, rAAV) 생산을 위한 숙주 세포 내로의 다음의 2 개의 핵산 벡터의 형질주입을 수반한다: (1) AAV Rep 단백질을 코딩하는 제1 뉴클레오티드 서열, 트랜스진을 포함하는 rAAV 게놈을 포함하는 제2 뉴클레오티드 서열 및 AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열을 포함하는, 제1 핵산 벡터; 및 (2) 헬퍼 바이러스 유전자를 포함하는 제2 핵산 벡터. 특정 실시양태에서, 제2 핵산 벡터는 제1 핵산 벡터에서 발견되는 AAV 생산의 임의의 구성요소를 포함하지 않는다. 특정 실시양태에서, 제2 핵산 벡터는 트랜스진을 포함하는 rAAV 게놈을 포함하지 않는다. 특정 실시양태에서, 제2 핵산 벡터는 AAV 캡시드 단백질 코딩 서열을 포함하지 않는다. 특정 실시양태에서, 제2 핵산 벡터는 Rep 코딩 서열 또는 이의 기능적 단편의 코딩 서열을 포함하지 않는다. 특정 실시양태에서, 제2 핵산 벡터는 트랜스진을 포함하는 rAAV 게놈을 포함하지 않고/않거나, 제2 핵산 벡터는 AAV 캡시드 단백질 코딩 서열을 포함하지 않고/않거나, 제2 핵산 벡터는 Rep 코딩 서열 또는 이의 기능적 단편의 코딩 서열을 포함하지 않는다.
특정 실시양태에서, 제2 핵산 벡터는 아데노바이러스, 헤르페스바이러스, 폭스바이러스, 사이토메갈로바이러스 및 배큘로바이러스로 이루어진 군으로부터 선택되는 헬퍼 바이러스로부터 유래될 수 있는 하나 이상의 헬퍼 바이러스 유전자를 포함한다. 헬퍼 바이러스 유전자는 헬퍼 바이러스 유전자의 발현을 제어하는 전사 조절 요소에 작동가능하게 연결될 수 있다. 특정 실시양태에서, 전사 조절 요소는 구성적 프로모터, 유도성 프로모터 및 천연 프로모터로 이루어진 군으로부터 선택되는 프로모터를 포함한다. 사용하기에 적합한 프로모터는 당업자에게 알려져 있고, 제한 없이, RSV LTR 프로모터, CMV 즉시 초기 프로모터, SV40 프로모터, 디하이드로폴레이트 환원효소 프로모터, 세포질 β-액틴 프로모터, 포스포글리세레이트 키나제 (PGK) 프로모터, 메탈로티오닌 (MT) 프로모터, 마우스 유방 종양 바이러스 (MMTV) 프로모터, T7 프로모터, 엑디손 곤충 프로모터, 테트라사이클린-억압성 프로모터, 테트라사이클린-유도성 프로모터, RU486-유도성 프로모터 및 라파마이신-유도성 프로모터를 포함한다.
특정 실시양태에서, 제2 핵산 벡터는 하나 이상의 헬퍼 바이러스 유전자를 포함한다. 하나 이상의 헬퍼 바이러스 유전자는 아데노바이러스 (AdV)로부터 유래될 수 있다. 효율적인 AAV 생산에 필요한 것으로 알려진 최소 세트의 AdV 헬퍼 인자는 AdV 분자 E1, E2, E4 및 VA RNA로 이루어진다 (예컨대, Meier et al. (2020) Viruses 12(6): 662 참고). 특히, 효율적인 AAV 생산에 필요한 최소 세트의 AdV 헬퍼 인자는 AdV 분자 E1A, E1B, E2A, E4 및 VA RNA를 포함한다. 특정 실시양태에서, 제2 핵산 벡터는 숙주 세포 (예컨대, 숙주 AAV 생산 세포)에서 효율적인 AAV 생산 (예컨대, AAV 복제 및 패키징)을 허용할 충분한 세트의 헬퍼 바이러스 유전자를 포함한다.
전형적인 AdV 게놈은 초기 단계 및 후기 단계로 나누어지는 약 40 개의 엄격하게 조절되는 단백질을 발현한다. 초기 단계 단백질은 E1A, E1B, E2A 및 E4를 포함한다. 간략하게, E1A 및 E2A 단백질은 AAV Rep 단백질의 발현을 제어하는 AAV 프로모터 p5 및 p19를 활성화하는 기능을 한다. E1A 매개된 p5 활성은 AAV 복제에 필요한 것으로 밝혀졌다. E2A는 AAV 복제의 다양한 양태를 촉진하는 것으로 알려진 단일-가닥 DNA 결합 단백질이다. E1B 유전자는 E1B19K 및 E1B55K 종양단백질을 코딩한다. E1B19K는 E1A 유도된 아폽토시스를 억제하고, E1B55K는 종양 억압 단백질 p53을 억제한다. E1B55K는 E4orf6과 함께 기능하여, AAV 제2 가닥 합성 및 바이러스 DNA 복제를 촉진한다. E1B55K는 또한 AAV mRNA 수송(export)을 촉진하고 세포 mRNA 수송을 억제하여, 함께 AAV 유전자 발현을 촉진하는 것으로 나타났다. E1B19K는 E1A, E1B55K, E2A 및 E4orf6과 같은 다른 AdV 헬퍼 인자와 공동-발현될 때 AAV 역가를 향상시키는 기능을 하는 것으로 밝혀졌다.
VA RNA는 세포 내재 면역 단백질 이중-가닥 RNA-활성화된 키나제 (PKR)를 억제하는 기능을 하는 것으로 밝혀졌으며, 이의 억제는 효율적인 바이러스 단백질 합성을 보장한다. VA RNA는 또한 AAV 구조 단백질의 합성 및 조립을 촉진하는 것으로 나타났다. AdV 게놈 내의 VA 핵산은 VA RNA를 발생시키는 비-번역된 핵산 서열이라는 것이 당업자에게 용이하게 이해될 것이다.
가장 통상적으로 사용되는 헬퍼 기능 중 하나는 인간 AdV 유형 5로부터 비롯된다. 아데노바이러스 헬퍼 바이러스 유전자는 다른 알려진 아데노바이러스, 예를 들어, AdV 유형 2로부터 유래될 수 있다. AdV5 게놈은 약 36 킬로베이스이며, 예시적인 AdV5 게놈 서열은 NCBI 참조 서열 AC_000008.1을 통해 찾아볼 수 있다. NCBI 참조 서열에 따르면, E1A는 뉴클레오티드 560 내지 1545에 의해 코딩되고; E1B19K는 뉴클레오티드 1714 내지 2244에 의해 코딩되고; E1B55K는 뉴클레오티드 2019 내지 3509에 의해 코딩되고; E2A는 뉴클레오티드 22443 내지 24032에 의해 코딩되며; E4orf6/7은 뉴클레오티드 32914 내지 34077에 의해 코딩된다.
특정 실시양태에서, 본 개시내용은 AdV5 E2A를 코딩하는 뉴클레오티드 서열을 포함하는 핵산을 제공한다. 특정 실시양태에서, AdV5 E2A를 코딩하는 뉴클레오티드 서열을 포함하는 핵산은 AdV5 E2A를 코딩하는 뉴클레오티드 서열에 작동가능하게 연결된 전사 조절 요소를 포함한다. 특정 실시양태에서, AdV5 E2A를 코딩하는 뉴클레오티드 서열을 포함하는 핵산은 서열번호 60에 제시된 서열과 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 갖는 서열을 포함한다. 특정 실시양태에서, AdV5 E2A를 코딩하는 뉴클레오티드 서열을 포함하는 핵산은 서열번호 60에 제시된 서열을 포함하거나 이로 이루어진다. 특정 실시양태에서, 본 개시내용은 상이한 아데노바이러스 혈청형 (예컨대, AdV2)에서, AdV5에 대해 기재된 바와 같은 E2A를 코딩하는 서열에 상응하는 뉴클레오티드 서열을 포함하는 핵산을 제공한다.
특정 실시양태에서, 본 개시내용은 AdV5 E4를 코딩하는 뉴클레오티드 서열을 포함하는 핵산을 제공한다. 특정 실시양태에서, AdV5 E4를 코딩하는 뉴클레오티드 서열을 포함하는 핵산은 AdV5 E4를 코딩하는 뉴클레오티드 서열에 작동가능하게 연결된 전사 조절 요소를 포함한다. 특정 실시양태에서, AdV5 E4를 코딩하는 뉴클레오티드 서열을 포함하는 핵산은 서열번호 61에 제시된 서열과 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 갖는 서열을 포함한다. 특정 실시양태에서, AdV5 E4를 코딩하는 뉴클레오티드 서열을 포함하는 핵산은 서열번호 61에 제시된 서열을 포함하거나 이로 이루어진다. 특정 실시양태에서, 본 개시내용은 상이한 아데노바이러스 혈청형 (예컨대, AdV2)에서, AdV5에 대해 기재된 바와 같은 E4를 코딩하는 서열에 상응하는 뉴클레오티드 서열을 포함하는 핵산을 제공한다.
특정 실시양태에서, 본 개시내용은 AdV5 VA RNA를 코딩하는 뉴클레오티드 서열을 포함하는 핵산을 제공한다. 특정 실시양태에서, AdV5 VA RNA를 코딩하는 뉴클레오티드 서열을 포함하는 핵산은 AdV5 VA RNA를 코딩하는 뉴클레오티드 서열에 작동가능하게 연결된 전사 조절 요소를 포함한다. 특정 실시양태에서, AdV5 VA RNA를 코딩하는 뉴클레오티드 서열을 포함하는 핵산은 서열번호 62에 제시된 서열과 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 갖는 서열을 포함한다. 특정 실시양태에서, AdV5 VA RNA를 코딩하는 뉴클레오티드 서열을 포함하는 핵산은 서열번호 62에 제시된 서열을 포함하거나 이로 이루어진다. VA RNA 핵산 서열은 VA RNA를 발생시키는 (예컨대, "코딩하는") 비-번역된 핵산 서열이라는 것이 당업자에게 용이하게 이해될 것이다. 특정 실시양태에서, 본 개시내용은 상이한 아데노바이러스 혈청형 (예컨대, AdV2)에서, AdV5에 대해 기재된 바와 같은 VA RNA를 코딩하는 서열에 상응하는 뉴클레오티드 서열을 포함하는 핵산을 제공한다.
특정 실시양태에서, 본 개시내용은 AdV5 E2A, E4 및 VA RNA를 코딩하는 뉴클레오티드 서열을 포함하는 핵산을 제공한다. 특정 실시양태에서, AdV5 E2A, E4 및 VA RNA를 코딩하는 뉴클레오티드 서열을 포함하는 핵산은 AdV5 E2A, E4 및 VA RNA를 코딩하는 뉴클레오티드 서열 각각에 작동가능하게 연결될 수 있는 하나 이상의 전사 조절 요소를 포함한다. 특정 실시양태에서, AdV5 E2A, E4 및 VA RNA를 코딩하는 뉴클레오티드 서열을 포함하는 핵산은 서열번호 63에 제시된 서열과 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 갖는 서열을 포함한다. 특정 실시양태에서, AdV5 E2A, E4 및 VA RNA를 코딩하는 뉴클레오티드 서열을 포함하는 핵산은 서열번호 63에 제시된 서열을 포함하거나 이로 이루어진다.
특정 실시양태에서, 본 개시내용은 효율적인 AAV 생산에 필요한 최소 세트의 AdV 헬퍼 인자를 코딩하는 뉴클레오티드 서열을 포함하는 핵산을 제공한다. 특정 실시양태에서, 최소 세트의 AdV 헬퍼 인자를 코딩하는 뉴클레오티드를 포함하는 핵산은 AdV 분자 E1A, E1B, E2A, E4 및 VA RNA를 코딩한다.
특정 숙주 세포, 예컨대, HEK293T 세포는 필요한 헬퍼 인자 전부는 아니지만 일부를 내인적으로 제공하고, 나머지 헬퍼 인자는 플라스미드 형질주입을 통해 외인적으로 제공될 수 있다. 예를 들어, HEK293T 세포는 아데노바이러스 E1A 및 E1B 유전자를 내인적으로 발현하고, 나머지 아데노바이러스 헬퍼 유전자, 즉, AdV5 E4, E2A 및 바이러스-연관된 (VA) RNA를 코딩하는 유전자를 제공한다. 이러한 AdV5 헬퍼 유전자는 형질주입을 통해 단일 벡터에 의해 제공될 수 있다. 특정 실시양태에서, 본 개시내용은 E2A, E4 및 VA RNA로 이루어진 군으로부터 선택되는 AdV5 헬퍼 바이러스 유전자를 포함하는 제2 핵산 벡터를 제공한다. 특정 실시양태에서, 본 개시내용은 상이한 아데노바이러스 혈청형 (예컨대, AdV2)으로부터 유래된, AdV5에 대해 기재된 바와 같은 E2A, E4 및 VA RNA를 코딩하는 헬퍼 바이러스 유전자를 포함하는 제2 핵산 벡터를 제공한다.
헬퍼 바이러스 유전자는 또한 헤르페스바이러스, 유두종바이러스 및 인간 보카바이러스로부터 유래될 수 있다. 헬퍼 바이러스 인자가 유래될 수 있는 헤르페스바이러스의 예는 HSV-1 및 HSV-2를 포함한다. AAV 생산을 지지하는 데 관여하는 것으로 알려진 HSV-1로부터 유래된 헬퍼 바이러스 인자는 제한 없이, UL5, UL8, UL52, ICP8, ICP0, ICP4, ICP22, UL30 및 UL42를 포함한다. 이러한 HSV-1 헬퍼 바이러스 인자의 다양한 기능 및 이들이 AAV 생산을 지지하는 방법은 당업자에게 알려져 있다. 예를 들어, 단일-가닥 DNA 결합 단백질 ICP8 외에 HSV-1 헬리카제-프리마제 복합체 UL5/UL8/UL52는 AAV 감염 모델에서 AAV 자손 생산을 복원하는 데 충분한 것으로 알려져 있으며; ICP0, ICP4 및 ICP22는 Rep 단백질의 발현을 촉진하는 데 관여되어 있고; HSV-1 DNA 중합효소 UL30/UL42는 AAV DNA의 복제에 관여되어 있다. 따라서, 특정 실시양태에서, 제2 핵산 벡터는 UL5, UL8, UL52, ICP8, ICP0, ICP4, ICP22, UL30 및 UL42로 이루어진 군으로부터 선택되는 하나 이상의 헬퍼 바이러스 유전자를 포함한다. 헬퍼 바이러스 인자가 유래될 수 있는 유두종바이러스의 예는 HPV-16이다. 특정 실시양태에서, HPV-16으로부터 유래된 헬퍼 바이러스 인자는 AdV 헬퍼 인자의 존재 하에 AAV 생산을 향상시킬 수 있다. AAV 복제를 지지하는 데 관여하는 것으로 알려진 이러한 HPV-16 헬퍼 인자는 제한 없이, E1, E2 및 E6을 포함한다. 헬퍼 바이러스 인자가 유래될 수 있는 인간 보카바이러스의 예는 인간 보카바이러스 1 (HBoV1)이다. AAV 생산을 지지하는 데 관여하는 것으로 알려진 HBoV1로부터 유래된 헬퍼 바이러스 인자는 제한 없이, NP1, NS2, NS4 및 바이러스의 긴 비코딩 RNA BocaSR을 포함한다.
IV. 벡터 및 세포
본 개시내용은 AAV Rep 단백질을 코딩하는 제1 뉴클레오티드 서열, 트랜스진을 포함하는 rAAV 게놈을 포함하는 제2 뉴클레오티드 서열 및 AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열을 포함하는, 제1 핵산 벡터; 및 헬퍼 바이러스 유전자를 포함하는 제2 핵산 벡터를 제공한다.
제1 핵산 벡터 및 제2 핵산 벡터는 독립적으로 임의의 형태의 핵산 벡터일 수 있다. 적합한 벡터는 제한 없이, 플라스미드, 최소 벡터 (예컨대, 미니서클, 나노플라스미드(Nanoplasmids)TM, 도기본(doggybones) 및 MIDGE 벡터 등), 바이러스, 코스미드, 인공 염색체, 선형 DNA 및 mRNA를 포함한다. 특정 실시양태에서, 제1 핵산 벡터 및/또는 제2 핵산 벡터는 DNA 플라스미드 또는 DNA 최소 벡터이다. 필요한 벡터 요소를 수용할 수 있는 임의의 DNA 플라스미드 또는 DNA 최소 벡터가 제1 핵산 벡터 및 제2 핵산 벡터에 사용될 수 있다. 적합한 DNA 최소 벡터는 제한 없이, 선형 공유 폐쇄 DNA (예컨대, 미니스트링 DNA), 선형 공유 폐쇄 덤벨 모양의 DNA (예컨대, 도기본 DNA, 덤벨 DNA), 미니서클, 나노플라스미드TM, 최소한의 면역학적으로 정의된 유전자 발현 (MIDGE) 벡터, 및 당업자에게 알려진 기타를 포함한다. DNA 최소 벡터 및 이들의 생산 방법은 예컨대, 이들 모두가 그 전체가 본원에 참조로 원용되는 미국 특허 출원 번호 20100233814, 20120282283, 20130216562, 20150218565, 20150218586, 20160008488, 20160215296, 20160355827, 20190185924, 20200277624 및 20210010021에 기재되어 있다.
특정 실시양태에서, 본원에 개시된 벡터 내의 핵산은 예컨대, 코돈/RNA 최적화, 이종 신호 서열로의 대체 및/또는 mRNA 불안정성 요소의 제거에 의해 최적화된다. mRNA에서 코돈 변화를 도입하고/하거나 억제 영역을 제거함으로써 재조합 발현을 위한 최적화된 폴리뉴클레오티드를 생성하는 방법은 예컨대, 미국 특허 번호 5,965,726; 6,174,666; 6,291,664; 6,414,132; 및 6,794,498에 기재된 최적화 방법을 적용함으로써 수행될 수 있으며, 이들 모두는 이에 따라 그 전체가 참조로 본원에 원용된다. 예를 들어, RNA 내의 잠재적 스플라이스 부위 및 불안정성 요소 (예컨대, A/T 또는 A/U 풍부 요소)는 핵산 서열에 의해 코딩된 아미노산을 변경하지 않으면서 돌연변이되어, 재조합 발현을 위한 RNA의 안정성을 증가시킬 수 있다. 변경은 예컨대, 동일한 아미노산에 대해 대체 코돈을 사용하는 유전자 코드의 축퇴성을 활용한다. 특정 실시양태에서, 보존적 돌연변이, 예컨대, 원래의 아미노산과 유사한 화학적 구조 및 특성 및/또는 기능을 갖는 유사한 아미노산을 코딩하기 위해 하나 이상의 코돈을 변경하는 것이 바람직할 수 있다. 이러한 방법은 최적화되지 않은 폴리뉴클레오티드에 의해 코딩된 캡시드의 발현에 비해 코딩된 캡시드 단백질의 발현을 증가시킬 수 있다.
본원에 개시된 벡터는 벡터의 증식 및/또는 벡터에 의해 코딩된 단백질의 발현을 위해 (당업계에 알려진 임의의 기술을 사용하여) 세포 내로 도입될 수 있다. 따라서, 다른 양태에서, 본 개시내용은 본원에 개시된 벡터를 포함하는 재조합 세포를 제공한다. 그리고 추가로, 다른 양태에서, 본 개시내용은 rAAV를 생산하는 방법을 제공하며, 방법은 폴리뉴클레오티드가 발현되고 rAAV가 생산되는 조건 하에서 재조합 세포를 배양하는 단계를 포함한다.
다양한 숙주 세포 및 발현 시스템이 활용될 수 있다. 이러한 발현 시스템은 관심 코딩 서열이 생산되고 후속적으로 정제될 수 있는 비히클을 나타내지만, 또한 본원에 기재된 적절한 뉴클레오티드 코딩 서열로 형질전환되거나 형질주입될 때 rAAV를 생산할 수 있는 세포를 나타낸다. 이들은 예컨대, 본원에 기재된 뉴클레오티드 코딩 서열을 함유하는 재조합 박테리오파지 DNA, 플라스미드 DNA 또는 코스미드 DNA 발현 벡터로 형질전환된 미생물, 예컨대, 박테리아 (예컨대, 대장균 및 B. 서브틸리스(B. subtilis)); 예컨대, 본원에 기재된 뉴클레오티드 코딩 서열을 함유하는 재조합 효모 발현 벡터로 형질전환된 효모 (예컨대, 사카로마이세스 피키아(Saccharomyces Pichia)); 예컨대, 본원에 기재된 뉴클레오티드 코딩 서열을 함유하는 재조합 바이러스 발현 벡터 (예컨대, 배큘로바이러스)로 감염된 곤충 세포 시스템; 예컨대, 재조합 바이러스 발현 벡터 (예컨대, 콜리플라워 모자이크 바이러스, CaMV; 담배 모자이크 바이러스, TMV)로 감염되거나, 예컨대, 본원에 기재된 뉴클레오티드 코딩 서열을 함유하는 재조합 플라스미드 발현 벡터 (예컨대, Ti 플라스미드)로 형질전환된 식물 세포 시스템 (예컨대, 녹조류, 예컨대, 클라마이도모나스 레인하르티이(Chlamydomonas reinhardtii); 또는 예컨대, 포유동물 세포의 게놈으로부터 유래된 프로모터 (예컨대, 메탈로티오네인 프로모터) 또는 포유동물 바이러스로부터 유래된 프로모터 (예컨대, 아데노바이러스 후기 프로모터; 백시니아 바이러스 7.5K 프로모터)를 포함하는 본원에 기재된 뉴클레오티드 코딩 서열을 함유하는 재조합 발현 작제물을 보유하는 포유동물 세포 시스템 (예컨대, COS (예컨대, COS1 또는 COS), CHO, BHK, MDCK, HEK293, NS0, PER.C6, VERO, CRL7O3O, HsS78Bst, HeLa 및 NIH 3T3, HEK293T, HEK293F, HepG2, SP210, R1.1, B-W, L-M, BSC1, BSC40, YB/20 및 BMT10 세포)을 포함하나, 이에 제한되지 않는다. 특정 실시양태에서, 본원에 기재된 뉴클레오티드 코딩 서열을 발현하기 위한 세포는 인간 세포, 예컨대, 인간 세포주이다. 특정 실시양태에서, 포유동물 발현 벡터는 pOptiVECTM 또는 pcDNA3.3이다. 특정 실시양태에서, 박테리아 세포, 예컨대, 대장균 또는 진핵 세포 (예컨대, 포유동물 세포)는 본원에 기재된 뉴클레오티드 코딩 서열의 발현을 위해 사용된다. 예를 들어, 인간 사이토메갈로바이러스로부터의 주요 중간 초기 유전자 프로모터 요소와 같은 벡터 요소와 함께, 포유동물 세포, 예컨대, CHO 또는 HEK293 세포는 본원에 기재된 폴리뉴클레오티드에 대한 효과적인 발현 시스템이다.
박테리아 시스템에서, 발현될 단백질에 대해 의도된 용도에 따라 다수의 발현 벡터가 유리하게 선택될 수 있다. 예를 들어, 대량의 단백질이 생산되어야 하는 경우, 용이하게 정제되는 높은 수준의 융합 단백질 생성물의 발현을 지시하는 벡터가 바람직할 수 있다. 이러한 벡터는, 단백질 코딩 서열이 lac Z 코딩 영역과 함께 프레임 내 벡터에 개별적으로 결찰되어 융합 단백질이 생산될 수 있도록 하는 대장균 발현 벡터 pUR278 (Ruether U & Mueller-Hill B (1983) EMBO J 2: 1791-1794); 및 pIN 벡터 (Inouye S & Inouye M (1985) Nuc Acids Res 13: 3101-3109; Van Heeke G & Schuster SM (1989) J Biol Chem 24: 5503-5509); 등을 포함하나, 이에 제한되지 않으며, 이들 모두가 그 전체가 본원에 참조로 원용된다. 예를 들어, pGEX 벡터는 또한 글루타티온 5-트랜스퍼라제 (GST)와의 융합 단백질로서 외래 폴리펩티드를 발현시키기 위해 사용될 수 있다. 일반적으로, 이러한 융합 단백질은 가용성이며, 매트릭스 글루타티온 아가로스 비드에 대한 흡착 및 결합 후 유리 글루타티온의 존재 하의 용리에 의해 용해된 세포로부터 쉽게 정제될 수 있다. pGEX 벡터는 클로닝된 표적 유전자 산물이 GST 모이어티로부터 방출될 수 있도록 트롬빈 또는 인자 Xa 프로테아제 절단 부위를 포함하도록 설계된다.
곤충 시스템에서, 예를 들어, 오토그라파 칼리포르니카(Autographa californica) 핵 다각체증 바이러스 (AcNPV)는 외래 유전자를 발현하기 위한 벡터로서 사용될 수 있다. 바이러스는 스포도프테라 프루기페르다(Spodoptera frugiperda) 세포에서 성장한다. 단백질 코딩 서열은 바이러스의 비-필수 영역 (예를 들어, 폴리헤드린 유전자)에 개별적으로 클로닝될 수 있으며, AcNPV 프로모터 (예를 들어, 폴리헤드린 프로모터)의 제어 하에서 배치될 수 있다.
포유동물 숙주 세포에서, 다수의 바이러스-기반 발현 시스템이 활용될 수 있다. 아데노바이러스가 발현 벡터로서 사용되는 경우, 관심 단백질 코딩 서열은 아데노바이러스 전사/번역 제어 복합체, 예컨대, 후기 프로모터 및 3부분 리더(tripartite leader) 서열에 결찰될 수 있다. 그런 다음, 이 키메라 유전자는 생체 외 또는 생체 내 재조합에 의해 아데노바이러스 게놈에 삽입될 수 있다. 바이러스 게놈의 비-필수 영역 (예컨대, 영역 E1 또는 E3)에서의 삽입은 감염된 숙주에서 본원에 기재된 뉴클레오티드 코딩 서열을 발현할 수 있고 생존가능한 재조합 바이러스를 초래할 것이다 (예컨대, 그 전체가 본원에 참조로 원용되는 Logan J & Shenk T (1984) PNAS 81(12): 3655-9 참고). 삽입된 단백질 코딩 서열의 효율적인 번역을 위해 특이적 개시 신호가 또한 필요할 수 있다. 이러한 신호는 ATG 개시 코돈 및 인접 서열을 포함한다. 더욱이, 개시 코돈은 전체 삽입물의 번역을 보장하기 위해 원하는 코딩 서열의 리딩 프레임과 위상이 같아야 한다. 이러한 외인성 번역 제어 신호 및 개시 코돈은 자연 및 합성 둘 모두의 다양한 기원일 수 있다. 발현의 효율성은 적절한 전사 인핸서 요소, 전사 종결인자 등의 포함에 의해 향상될 수 있다 (예컨대, 그 전체가 본원에 참조로 원용되는 Bitter Get al. (1987) Methods Enzymol. 153: 516-544 참고).
게다가, 삽입된 서열의 발현을 조정하거나 원하는 특이적 방식으로 유전자 산물을 변형 및 처리하는 숙주 세포 균주가 선택될 수 있다. 단백질 산물의 이러한 변형 (예컨대, 글리코실화) 및 가공 (예컨대, 절단)은 단백질의 기능에 중요할 수 있다. 상이한 숙주 세포는 단백질 및 유전자 산물의 번역-후 가공 및 변형을 위한 특징적이고 특이적인 메커니즘을 가지고 있다. 발현된 외래 단백질의 올바른 변형 및 가공을 보장하기 위해 적절한 세포주 또는 숙주 시스템이 선택될 수 있다. 이를 위해, 일차 전사물의 적절한 가공, 글리코실화 및 유전자 산물의 인산화를 위한 세포 기구를 보유하는 진핵 숙주 세포가 사용될 수 있다. 이러한 포유동물 숙주 세포는 CHO, VERO, BHK, Hela, MDCK, HEK293, HEK293T, HEK293F, HEK293EBNA, NIH 3T3, W138, BT483, Hs578T, HTB2, BT2O 및 T47D, NS0 (내인적으로 임의의 면역글로불린 쇄를 생산하지 않는 뮤린 골수종 세포주), CAP, CAP-T, CRL7O3O, COS (예컨대, COS1 또는 COS), PER.C6, VERO, AGE1.CR, A549, HsS78Bst, HepG2, C139, EB66, SP210, R1.1, B-W, L-M, BSC1, BSC40, YB/20, BMT10 및 HsS78Bst 세포를 포함하나, 이에 제한되지 않는다.
특정 실시양태에서, 바이러스 복제 기점을 함유하는 발현 벡터를 사용하는 대신, 숙주 세포는 적절한 전사 조절 요소 (예컨대, 프로모터, 인핸서, 서열, 전사 종결인자, 폴리아데닐화 부위 등) 및 선택가능한 마커에 의해 제어되는 폴리뉴클레오티드 (예컨대, DNA 또는 RNA)로 형질전환될 수 있다. 폴리뉴클레오티드의 도입 후, 조작된 세포를 농축 배지에서 1-2 일 동안 성장시킨 다음, 선택 배지로 스위칭할 수 있다. 재조합 플라스미드의 선택가능한 마커는 선택에 대한 저항성을 부여하고, 세포가 플라스미드를 이들의 염색체에 안정적으로 통합하고 성장시켜 초점을 형성할 수 있도록 하며, 이는 결과적으로 클로닝되어 세포주로 확장될 수 있다. 이 방법은 유리하게는 본원에 기재된 단백질 또는 이의 단편을 발현하는 세포주를 조작하기 위해 사용될 수 있다.
이들 모두가 그 전체가 본원에 참조로 원용되는, 각각 tk-, hgprt- 또는 aprt-세포의 단순 헤르페스 바이러스 티미딘 키나제 (Wigler M et al. (1977) Cell 11(1): 223-32), 하이포크산틴구아닌 포스포리보실트랜스퍼라제 (Szybalska EH & Szybalski W (1962) PNAS 48(12): 2026-2034) 및 아데닌 포스포리보실트랜스퍼라제 (Lowy I et al. (1980) Cell 22(3): 817-23) 유전자를 비제한적으로 포함하는 다수의 선택 시스템이 사용될 수 있다. 또한, 항대사물질 저항성은 다음의 유전자에 대한 선택의 기초로서 사용될 수 있다: 이들 모두가 그 전체가 본원에 참조로 원용되는, 메토트렉세이트에 대한 저항성을 부여하는 dhfr (Wigler M et al. (1980) PNAS 77(6): 3567-70; O'Hare K et al. (1981) PNAS 78: 1527-31); 마이코페놀산에 대한 저항성을 부여하는 gpt (Mulligan RC & Berg P (1981) PNAS 78(4): 2072-6); 아미노글리코시드 G-418에 대한 저항성을 부여하는 neo (Wu GY & Wu CH (1991) Biotherapy 3: 87-95; Tolstoshev P (1993) Ann Rev Pharmacol Toxicol 32: 573-596; Mulligan RC (1993) Science 260: 926-932; 및 Morgan RA & Anderson WF (1993) Ann Rev Biochem 62: 191-217; Nabel GJ & Felgner PL (1993) Trends Biotechnol 11(5): 211-5); 및 하이그로마이신에 대한 저항성을 부여하는 hygro (Santerre RF et al. (1984) Gene 30(1-3): 147-56). 재조합 DNA 기술 분야에서 일반적으로 공지된 방법은 원하는 재조합 클론을 선택하기 위해 일상적으로 적용될 수 있으며, 이러한 방법은 이들 모두가 그 전체가 본원에 참조로 원용되는, 예를 들어 Ausubel FM et al. (eds.), Current Protocols in Molecular Biology, John Wiley & Sons, NY (1993); Kriegler M, Gene Transfer and Expression, A Laboratory Manual, Stockton Press, NY (1990); 및 제12장 및 제13장, Dracopoli NC et al. (eds.), Current Protocols in Human Genetics, John Wiley & Sons, NY (1994); Colbere-Garapin F et al. (1981) J Mol Biol 150: 1-14에 기재되어 있다.
V. 아데노-연관된 바이러스 패키징 시스템 및 방법
다른 양태에서, 본 개시내용은 본원에 개시된 재조합 아데노-연관된 바이러스 (rAAV)의 재조합 제조를 위한 패키징 시스템을 제공한다. 특히, 본 개시내용은 본원에 기재된 이중 벡터 형질주입 시스템 하에서 AAV 생산에 유용한 패키징 시스템을 제공한다 (예컨대, AAV 생산은 숙주 세포 내로 전달되는 제1 및 제2 핵산 벡터를 포함하는 패키징 시스템의 사용에 의해 매개됨). 이러한 패키징 시스템은 일반적으로 다음을 포함하거나 이로 이루어진다: (1) AAV Rep 단백질을 코딩하는 제1 뉴클레오티드 서열, 트랜스진을 포함하는 rAAV 게놈을 포함하는 제2 뉴클레오티드 서열 및 AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열을 포함하는, 제1 핵산 벡터; 및 (2) 헬퍼 바이러스 유전자를 포함하는 제2 핵산 벡터. 제1 핵산 벡터 및 제2 핵산 벡터는 함께 rAAV의 생산에 필요한 모든 구성요소를 제공할 수 있다. 특정 실시양태에서, rAAV의 생산에 필요한 구성요소는 rAAV가 생산되는 숙주 세포에 의해 제공된다. 이러한 실시양태에서, 제1 핵산 벡터 및 제2 핵산 벡터는 숙주 세포와 함께, rAAV의 생산에 필요한 모든 구성요소를 제공할 수 있다. 본원에 기재된 패키징 시스템은 rAAV 게놈을 캡시드에 동봉하여 rAAV를 형성하기 위한 세포에서 작동적이다.
특정 실시양태에서, 본 개시내용은 다음을 포함하는, rAAV 패키징 시스템을 제공한다: (1) AAV Rep 단백질을 코딩하는 제1 뉴클레오티드 서열, 트랜스진을 포함하는 rAAV 게놈을 포함하는 제2 뉴클레오티드 서열 및 AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열을 포함하는, 제1 핵산 벡터; 및 (2) 헬퍼 바이러스 유전자를 포함하는 제2 핵산 벡터. 특정 실시양태에서, 본 개시내용은 다음을 포함하는, rAAV 패키징 시스템을 제공한다: (1) 5'에서 3'으로, AAV Rep 단백질을 코딩하는 제1 뉴클레오티드 서열, 트랜스진을 포함하는 rAAV 게놈을 포함하는 제2 뉴클레오티드 서열 및 AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열을 포함하는, 제1 핵산 벡터; 및 (2) 헬퍼 바이러스 유전자를 포함하는 제2 핵산 벡터.
특정 실시양태에서, 패키징 시스템의 제1 핵산 벡터는 트랜스진을 포함하는 rAAV 게놈을 포함한다. 본 개시내용의 패키징 시스템의 제1 핵산 벡터는 AAV Rep 단백질 코딩 서열 또는 이의 기능적 변이체의 코딩 서열, 및 AAV 캡시드 단백질 코딩 서열을 추가로 포함한다. 따라서, 본 개시내용은 AAV Rep 단백질 또는 이의 기능적 변이체를 코딩하는 제1 뉴클레오티드 서열, 트랜스진을 포함하는 rAAV 게놈을 포함하는 제2 뉴클레오티드 서열, 및 AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열을 포함하는 패키징 시스템의 제1 핵산 벡터를 제공한다. 특정 실시양태에서, 패키징 시스템의 제1 핵산 벡터는 5'으로부터 3'으로, AAV Rep 단백질 또는 이의 기능적 변이체를 코딩하는 제1 뉴클레오티드 서열, 트랜스진을 포함하는 rAAV 게놈을 포함하는 제2 뉴클레오티드 서열, 및 AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열을 포함한다. 특정 실시양태에서, 패키징 시스템의 제1 핵산 벡터는 헬퍼 바이러스 유전자를 포함하지 않는다.
임의의 AAV Rep 단백질이 본원에 개시된 패키징 시스템에 사용될 수 있다. 패키징 시스템의 특정 실시양태에서, Rep 뉴클레오티드 서열은 AAV2 Rep 단백질을 코딩한다. 적합한 AAV2 Rep 단백질은 제한 없이, Rep 78/68 또는 Rep 68/52를 포함할 수 있다. 패키징 시스템의 특정 실시양태에서, AAV2 Rep 단백질을 코딩하는 뉴클레오티드 서열은 서열번호 64의 AAV2 Rep 아미노산 서열과 최소 퍼센트 서열 동일성을 갖는 단백질을 코딩하는 뉴클레오티드 서열을 포함하며, 여기서 최소 퍼센트 서열 동일성은 AAV2 Rep 단백질의 아미노산 서열의 길이에 걸쳐 70% 이상 (예컨대, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 95% 이상, 98% 이상, 99% 이상, 또는 100%)이다. 패키징 시스템의 특정 실시양태에서, AAV2 Rep 단백질은 서열번호 64에 제시된 아미노산 서열을 갖는다.
특정 실시양태에서, 패키징 시스템의 제2 핵산 벡터는 헬퍼 바이러스 유전자를 포함한다. 본 개시내용의 패키징 시스템의 제2 핵산 벡터는 하나 이상의 헬퍼 바이러스 유전자를 포함할 수 있다. 본 개시내용의 특정 양태는 패키징 시스템의 제2 핵산 벡터가 본원에 기재된 바와 같은 제1 핵산 벡터에서 발견되는 AAV 생산의 임의의 구성요소를 포함하지 않는다는 것을 제공한다. 특정 실시양태에서, 패키징 시스템의 제2 핵산 벡터는 트랜스진을 포함하는 rAAV 게놈을 포함하지 않는다. 특정 실시양태에서, 패키징 시스템의 제2 핵산 벡터는 AAV 캡시드 단백질 코딩 서열을 포함하지 않는다. 특정 실시양태에서, 패키징 시스템의 제2 핵산 벡터는 Rep 코딩 서열 또는 이의 기능적 변이체의 코딩 서열을 포함하지 않는다. 특정 실시양태에서, 패키징 시스템의 제2 핵산 벡터는 트랜스진을 포함하는 rAAV 게놈을 포함하지 않고/않거나, 패키징 시스템의 제2 핵산 벡터는 AAV 캡시드 단백질 코딩 서열을 포함하지 않고/않거나, 패키징 시스템의 제2 핵산 벡터는 Rep 코딩 서열 또는 이의 기능적 변이체의 코딩 서열을 포함하지 않는다.
패키징 시스템의 특정 실시양태에서, 헬퍼 바이러스는 아데노바이러스, 헤르페스 바이러스 (단순 헤르페스 바이러스 (HSV) 포함), 폭스바이러스 (예컨대, 백시니아 바이러스), 사이토메갈로바이러스 (CMV) 및 배큘로바이러스로 이루어진 군으로부터 선택된다. 헬퍼 바이러스가 아데노바이러스인 패키징 시스템의 특정 실시양태에서, 아데노바이러스 게놈은 E1, E2, E4 및 VA로 이루어진 군으로부터 선택되는 하나 이상의 아데노바이러스 RNA 유전자를 포함한다. 패키징 시스템의 특정 실시양태에서, 여기서 아데노바이러스 게놈은 E2, E4 및 VA로 이루어진 군으로부터 선택되는 하나 이상의 아데노바이러스 RNA 유전자를 포함한다. 헬퍼 바이러스가 HSV인 패키징 시스템의 특정 실시양태에서, HSV 게놈은 UL5/8/52, ICPO, ICP4, ICP22 및 UL30/UL42로 이루어진 군으로부터 선택되는 HSV 유전자 중 하나 이상을 포함한다.
패키징 시스템의 특정 실시양태에서, 패키징 시스템의 제1 및 제2 핵산 벡터는 2 개의 플라스미드 내에 함유된다. 특정 실시양태에서, 패키징 시스템의 제1 핵산 벡터는 제1 플라스미드 내에 함유된다. 특정 실시양태에서, 패키징 시스템의 제2 핵산 벡터는 제2 플라스미드 내에 함유된다.
패키징 시스템의 특정 실시양태에서, 패키징 시스템의 제1 및 제2 핵산 벡터는 2 개의 재조합 헬퍼 바이러스 내에 함유된다. 특정 실시양태에서, 패키징 시스템의 제1 핵산 벡터는 제1 재조합 헬퍼 바이러스 내에 함유된다. 특정 실시양태에서, 패키징 시스템의 제2 핵산 벡터는 제2 재조합 헬퍼 바이러스 내에 함유된다. 특정 실시양태에서, 패키징 시스템의 제1 및 제2 핵산 벡터는 단일 재조합 헬퍼 바이러스 내에 함유된다.
추가 양태에서, 본 개시내용은 rAAV의 재조합 제조 방법을 제공하며, 여기서 방법은 rAAV 게놈을 캡시드에 봉입하여 rAAV를 형성하도록 작동하는 조건 하에서 본원에 기재된 바와 같은 패키징 시스템으로 세포를 형질주입 또는 형질도입하는 단계를 포함한다. rAAV의 재조합 제조를 위한 예시적인 방법은 일시적 형질주입 (예컨대, 하나 이상의 형질주입 플라스미드를 이용한), 바이러스 감염 (예컨대, 하나 이상의 재조합 헬퍼 바이러스, 예컨대, 아데노바이러스, 폭스바이러스 (예컨대, 백시니아 바이러스), 헤르페스 바이러스 (HSV, 사이토메갈로바이러스 또는 배큘로바이러스 포함)를 이용한) 및 안정한 생산자 세포주 형질주입 또는 감염 (예컨대, 안정한 생산자 세포, 예컨대, 포유동물 또는 곤충 세포를 이용한)을 포함한다.
따라서, 본 개시내용은 rAAV의 제조를 위한 패키징 시스템을 제공하며, 여기서 패키징 시스템은 다음을 포함한다: (1) AAV Rep 단백질 또는 이의 기능적 변이체를 코딩하는 제1 뉴클레오티드 서열; rAAV 게놈을 포함하는 제2 뉴클레오티드 서열; 및 AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열을 포함하는, 제1 핵산 벡터, 및 (2) 헬퍼 바이러스 유전자를 포함하는 제2 핵산 벡터. 특정 실시양태에서, 본 개시내용은 rAAV의 제조를 위한 패키징 시스템을 제공하며, 여기서 패키징 시스템은 다음을 포함한다. (1) 5'에서 3'으로, AAV Rep 단백질 또는 이의 기능적 변이체를 코딩하는 제1 뉴클레오티드 서열; rAAV 게놈을 포함하는 제2 뉴클레오티드 서열; 및 AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열을 포함하는, 제1 핵산 벡터, 및 (2) 헬퍼 바이러스 유전자를 포함하는 제2 핵산 벡터.
따라서, 본 개시내용은 rAAV의 재조합 제조 방법을 제공하며, 여기서 방법은 다음을 포함하는, 패키징 시스템으로 세포를 형질주입 또는 형질도입하는 단계를 포함한다: (1) AAV Rep 단백질 또는 이의 기능적 변이체를 코딩하는 제1 뉴클레오티드 서열; rAAV 게놈을 포함하는 제2 뉴클레오티드 서열; 및 AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열을 포함하는, 제1 핵산 벡터, 및 (2) 헬퍼 바이러스 유전자를 포함하는 제2 핵산 벡터. 특정 실시양태에서, 본 개시내용은 rAAV의 재조합 제조 방법을 제공하며, 여기서 방법은 다음을 포함하는, 패키징 시스템으로 세포를 형질주입 또는 형질도입하는 단계를 포함한다: (1) 5'에서 3'으로, AAV Rep 단백질 또는 이의 기능적 변이체를 코딩하는 제1 뉴클레오티드 서열; rAAV 게놈을 포함하는 제2 뉴클레오티드 서열; 및 AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열을 포함하는, 제1 핵산 벡터, 및 (2) 헬퍼 바이러스 유전자를 포함하는 제2 핵산 벡터.
특정 실시양태에서, (1) AAV Rep 단백질 또는 이의 기능적 변이체를 코딩하는 제1 뉴클레오티드 서열; rAAV 게놈을 포함하는 제2 뉴클레오티드 서열; 및 AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열을 포함하는, 제1 핵산 벡터, 및 (2) 헬퍼 바이러스 유전자를 포함하는 제2 핵산 벡터를 포함하여 세포 내로 형질주입 또는 형질도입되는 핵산의 총량은 0.1 μg의 DNA/1E6 세포 내지 4 μg의 DNA/1E6 세포이다. 예를 들어, 제1 핵산 벡터 및 제2 핵산 벡터를 포함하여 세포 내로 형질주입 또는 형질도입되는 핵산의 총량은 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1, 1.1, 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9, 2, 2.1, 2.2, 2.3, 2.4, 2.5, 2.6, 2.7, 2.8, 2.9, 3, 3.1, 3.2, 3.3, 3.4, 3.5, 3.6, 3.7, 3.8, 3.9 또는 4 μg의 DNA/1E6 세포이다. 특정 실시양태에서, 제1 핵산 벡터 및 제2 핵산 벡터를 포함하여 세포 내로 형질주입 또는 형질도입되는 핵산의 총량은 1 μg의 DNA/1E6 세포이다. 특정 실시양태에서, 제1 핵산 벡터 및 제2 핵산 벡터를 포함하여 세포 내로 형질주입 또는 형질도입되는 핵산의 총량은 0.6 μg의 DNA/1E6 세포이다. 특정 실시양태에서, 제1 핵산 벡터 및 제2 핵산 벡터를 포함하여 세포 내로 형질주입 또는 형질도입되는 핵산의 총량은 0.7 μg의 DNA/1E6 세포이다. 특정 실시양태에서, 제1 핵산 벡터 및 제2 핵산 벡터를 포함하여 세포 내로 형질주입 또는 형질도입되는 핵산의 총량은 0.75 μg의 DNA/1E6 세포이다. 특정 실시양태에서, 제1 핵산 벡터 및 제2 핵산 벡터를 포함하여 세포 내로 형질주입 또는 형질도입되는 핵산의 총량은 0.8 μg의 DNA/1E6 세포이다. 특정 실시양태에서, 제1 핵산 벡터 및 제2 핵산 벡터를 포함하여 세포 내로 형질주입 또는 형질도입되는 핵산의 총량은 0.9 μg의 DNA/1E6 세포이다.
특정 실시양태에서, 제1 핵산 벡터 대 제2 핵산 벡터의 비율, 또는 제2 핵산 벡터 대 제1 핵산 벡터의 비율은 1:0.1 내지 1:20이다. 예를 들어, 제1 핵산 벡터 대 제2 핵산 벡터의 비율, 또는 제2 핵산 벡터 대 제1 핵산 벡터의 비율은 1:0.1, 1:0.2, 1:0.3, 1:0.4, 1:0.5, 1:0.6, 1:0.7, 1:0.8, 1:1, 1:1.1, 1:1.2, 1:1.3, 1:1.4, 1:1.5, 1:1.6, 1:1.7, 1:1.8, 1:1.9, 1:2, 1:2.1, 1:2.2, 1:2.3, 1:2.4, 1:2.5, 1:2.6, 1:2.7, 1:2.8, 1:2.9, 1:3, 1:3.1, 1:3.2, 1:3.2, 1:3.3, 1:3.4, 1:3.5, 1:3.6, 1:3.7, 1:3.8, 1:3.9, 1:4, 1.4.5, 1:5, 1:5.5, 1:6, 1:6.5, 1:7, 1:7.5, 1:8, 1:8.5, 1:9, 1:9.5, 1:10, 1:10.5, 1:11, 1:11.5, 1:12, 1:12.5, 1:13, 1:13.5, 1:14, 1:14.5, 1:15, 1:15.5, 1:16, 1:16.5, 1:17, 1:17.5, 1:18, 1:18.5, 1:19, 1:19.5 또는 1:20이다. 특정 실시양태에서, 제1 핵산 벡터 대 제2 핵산 벡터의 비율, 또는 제2 핵산 벡터 대 제1 핵산 벡터의 비율은 1:0.2, 1:0.4, 1:0.6, 1:0.8, 1:1, 1:2, 1:3 또는 1:4로 이루어진 군으로부터 선택된다. 특정 실시양태에서, 제1 핵산 벡터 대 제2 핵산 벡터의 비율, 또는 제2 핵산 벡터 대 제1 핵산 벡터의 비율은 1:2이다. 특정 실시양태에서, 제1 핵산 벡터 대 제2 핵산 벡터의 비율, 또는 제2 핵산 벡터 대 제1 핵산 벡터의 비율은 1:0.2 내지 1:1이다. 특정 실시양태에서, 제1 핵산 벡터 대 제2 핵산 벡터의 비율, 또는 제2 핵산 벡터 대 제1 핵산 벡터의 비율은 1:0.6이다. 특정 실시양태에서, 제1 핵산 벡터 대 제2 핵산 벡터의 비율, 또는 제2 핵산 벡터 대 제1 핵산 벡터의 비율은 1:0.8이다. 특정 실시양태에서, 제1 핵산 벡터 대 제2 핵산 벡터의 비율, 또는 제2 핵산 벡터 대 제1 핵산 벡터의 비율은 1:1이다.
특정 실시양태에서, 본원에 개시된 rAAV의 재조합 제조 방법은 다음을 포함하는 포유동물 세포를 사용하여 rAAV를 생산하는 단계를 포함하는 방법과 비교하여 증가된 rAAV 역가를 초래한다: (i) AAV Rep 단백질 및 AAV 캡시드 단백질을 코딩하는 뉴클레오티드 서열을 포함하는 제1 벡터; (ii) rAAV 게놈을 포함하는 제2 벡터; 및 (iii) 하나 이상의 헬퍼 바이러스 유전자를 포함하는 제3 벡터. 특정 실시양태에서, 본원에 개시된 rAAV의 재조합 제조 방법은 다음을 포함하는 포유동물 세포를 사용하여 rAAV를 생산하는 단계를 포함하는 방법과 비교하여 증가된 rAAV 역가를 초래한다: (i) AAV Rep 단백질 및 AAV 캡시드 단백질을 코딩하는 뉴클레오티드 서열을 포함하는 제1 벡터; (ii) rAAV 게놈을 포함하는 제2 벡터; 및 (iii) 하나 이상의 헬퍼 바이러스 유전자를 포함하는 제3 벡터.
특정 실시양태에서, 포유동물 세포는 세포 배양물로 제공된다. 특정 실시양태에서, 세포 배양물은 2 리터 이상, 50 리터 이상, 또는 2000 리터 이상의 부피를 갖는다. 특정 실시양태에서, 세포 배양물은 약 2 리터 내지 약 5000 리터의 부피를 갖는다. 특정 실시양태에서, 세포 배양물은 약 2 리터 내지 약 4000 리터의 부피를 갖는다. 특정 실시양태에서, 세포 배양물은 약 2 리터 내지 약 3000 리터의 부피를 갖는다. 특정 실시양태에서, 세포 배양물은 약 2 리터 내지 약 2500 리터의 부피를 갖는다. 특정 실시양태에서, 세포 배양물은 약 2 리터 내지 약 2000 리터의 부피를 갖는다. 특정 실시양태에서, 세포 배양물은 약 2 리터 내지 약 1500 리터의 부피를 갖는다. 특정 실시양태에서, 세포 배양물은 약 2 리터 내지 약 1000 리터의 부피를 갖는다. 특정 실시양태에서, 세포 배양물은 약 2 리터 내지 약 500 리터의 부피를 갖는다. 특정 실시양태에서, 세포 배양물은 약 2 리터 내지 약 250 리터의 부피를 갖는다. 특정 실시양태에서, 세포 배양물은 약 2 리터 내지 약 100 리터의 부피를 갖는다. 특정 실시양태에서, 세포 배양물은 약 2 리터 내지 약 50 리터의 부피를 갖는다. 특정 실시양태에서, 세포 배양물은 약 2 리터 내지 약 25 리터의 부피를 갖는다. 특정 실시양태에서, 본원에 기재된 방법은 2 리터 이상, 50 리터 이상, 또는 2000 리터 이상의 부피를 갖는 생물반응기에서 수행된다. 특정 실시양태에서, 본원에 기재된 방법은 2000 리터의 부피를 갖는 생물반응기에서 수행된다.
실시예
다음의 실시예는 제한이 아닌 예시를 위해 제공된다.
실시예 1: 재료 및 방법
다음의 실시예에서는 다음의 일반적인 재료 및 방법을 사용하였다.
소규모 생산: HEK293 세포를 1 회 이상의 계대 동안 확장시키고, 형질주입 전에 적절한 양의 세포 배양 배지를 함유하는 진탕 플라스크에 접종하였다. 진탕 플라스크를 진탕기에서 37℃, 8% CO2 및 135 rpm에서 항온처리하였다. 세포가 1.8E6 내지 2.4E6 개의 세포/mL (실시예 1-8의 경우) 또는 3.6E6 내지 5E6 개의 세포/mL (실시예 9의 경우)의 밀도에 도달하였을 때 세포를 형질주입시켰다. 계산된 부피의 벡터(들), OptiPro 배지 및 폴리에틸렌이민 (PEI)을 모두 주변 온도에서 혼합함으로써 형질주입 혼합물을 제조하였다. 그런 다음, 형질주입 혼합물을 진탕 플라스크에 첨가하고, 수확 전 72 시간 동안 37℃, 8% CO2 및 135 rpm에서 진탕기에서 항온처리하였다. 72 시간의 항온처리 후, 세포를 1 M Tris (pH 9.5), 10% Triton X-100, 1 M MgCl2, 엔도뉴클레아제 (예컨대, 벤조나제(BENZONASE)®, 데나라세(DENARASE)®) 및 5 M NaCl을 함유하는 용해 완충액을 사용하여 용해시키고, 진탕 플라스크를 37℃, 8% CO2 및 135 rpm에서 60 분 동안 항온처리하였다. 조질의 용해물 샘플을 원심분리에 의해 수집하였다.
2 L 생물반응기 생산: HEK293 세포를 1 회 이상의 계대 동안 확장시키고, 형질주입 전에 적절한 양의 세포 배양 배지를 함유하는 2 L 생물반응기 (Millipore Mobius)에 접종하였다. pH를 형질주입-전 7.1±0.1로 이동시키고, 세포를 1.8E6 내지 2.4E6 개의 세포/mL (실시예 4-8의 경우) 또는 3.6E6 내지 5E6 개의 세포/mL (실시예 9-11의 경우)의 밀도로 형질주입시켰다. 계산된 부피의 벡터(들), OptiPro SFM 배지 및 폴리에틸렌이민 (PEI)을 모두 주변 온도에서 혼합함으로써 형질주입 혼합물을 제조하고, 형질주입 혼합물을 세포에 첨가하기 전에 10 분 동안 평형화되도록 하였다. 형질주입 69-75 시간 후에 세포를 수확하였다. 수확된 세포를 1 M Tris (pH 9.5), 10% Triton X-100, 1 M MgCl2, 엔도뉴클레아제 (예컨대, 벤조나제®, 데나라세®) 및 5 M NaCl을 함유하는 용해 완충액을 사용하여 용해시켰다. 적절한 부피의 용해 완충액을 생물반응기에 첨가하고, 세포를 37℃ 및 283 rpm에서 120 분 동안 항온처리하였다. 세포 잔해물을 제거하기 위해 원심분리 후에 조질의 용해물 샘플을 수집하였다.
세포당 벡터 게놈의 수 (vg/세포)의 벡터 게놈 생산성은 트랜스진을 포함하는 벡터 (즉, 트랜스진 벡터)의 트랜스진 페이로드에 특이적인 프라이머/프로브 세트를 사용하는 표준 방법에 의해 액적 디지털 PCR (ddPCR)에 의해 결정되었다. 리터당 벡터 게놈의 수 (vg/L)의 벡터 게놈 생산성은 트랜스진을 포함하는 벡터 (즉, 트랜스진 벡터)의 트랜스진 페이로드에 특이적인 프라이머/프로브 세트를 사용하는 표준 방법에 의해 액적 디지털 PCR (ddPCR)에 의해 결정되었다. 세포당 캡시드의 수는 Cap 서열을 포함하는 벡터에 의해 코딩된 바와 같은 캡시드의 에피토프에 대해 지시된 고정화된 항체를 이용하는 표준 방법에 의한 효소-연결된 면역흡착 검정 (ELISA)을 사용하여 결정되었다. 온전한 벡터 게놈의 백분율 (즉, 전체 캡시드의 백분율)은 ddPCR에 의해 결정된 벡터 게놈 생산성을 (실시예 2-4에서의) ELISA에 의해 결정된 세포당 캡시드의 수로 나눔으로써 계산하거나, (실시예 5에서의) 분석적 초원심분리 침강 속도 (AUC) 분석에 의해 결정되었다.
실시예 2: 이중 및 삼중 형질주입 시스템 간의 비교
벡터 게놈 (VG) 생산성과 관련하여 이중 벡터 형질주입 시스템의 유용성 및 삼중 형질주입 시스템과 비교하여 수득될 수 있는 온전한 벡터 게놈의 백분율을 평가하기 위해 초기 소-규모 생산, 개념-증명 연구를 수행하였다. 형질주입 조건을 표 1에 제시된 조건에 따라 설정하였다.
표 1: 형질주입 조건
표 1에 제시된 바와 같이, 이중 벡터 형질주입 시스템은 제1 V4 벡터 및 제2 V3 벡터를 포함하였다. 삼중 벡터 형질주입 시스템은 벡터 V1, V2 및 V3을 포함한다. 표 1에서, 벡터 비율은 질량을 기반으로 하였다. 다양한 벡터 내에 함유된 요소는 표 2에 제시되어 있다.
계산된 부피의 벡터(들), OptiPro 배지 및 폴리에틸렌이민 (PEI)을 모두 주변 온도에서 첨가함으로써 적절한 크기의 원뿔형 튜브에서 각각의 형질주입 조건에 대한 형질주입 혼합물을 제조하였다. 형질주입 혼합물을 1 μg의 DNA/1E6 세포의 농도로 세포에 첨가하였다. 진탕 플라스크를 수확 전 72 시간 동안 항온처리하였다. 수확 시, 세포를 용해시키고, 후속 액적 디지털 PCR (ddPCR) 및 ELISA에 의한 캡시드 분석을 위해, 원심분리 후에 조질의 용해물 샘플을 수집하여 세포 잔해물을 제거하였다.
표 2: 벡터 요소
도 1a-1c는 이중 및 삼중 형질주입 시스템을 사용한 생산으로부터 수득된 VG 생산성 (도 1a), 캡시드 생산성 (도 1b), 및 온전한 벡터 게놈의 백분율 (도 1c)을 도시한다. 도 1a 및 1c에 도시된 바와 같이, 이중 벡터 형질주입 시스템을 사용한 생산으로부터 수득된 VG 생산성 및 온전한 벡터 게놈의 백분율은 삼중 벡터 형질주입 시스템으로부터 수득된 것보다 더 높은 것으로 밝혀졌다. 이들 데이터는 이중 벡터 형질주입 시스템을 사용하는 것이 대조군 삼중 벡터 형질주입 시스템과 비교하여 증가된 rAAV 역가를 초래한다는 것을 입증한다. 도 1a-1c에 도시된 다양한 조건이 표 1에 제시되어 있다.
이중 형질주입 시스템으로부터 수득된 증가된 VG 생산성 및 온전한 벡터 게놈의 증가된 백분율이 상이한 트랜스진 벡터를 사용하여 복제될 수 있는지 여부를 결정하기 위해 추가적인 형질주입 조건을 이용하여 확인 실험을 수행하였다. 형질주입 조건은 표 3에 제시된 조건에 따라 설정되었으며, 다양한 벡터 내에 함유된 요소는 표 2에 제시되어 있다. 표 2에서, 벡터 비율은 질량을 기반으로 하였다.
표 3: 형질주입 조건
계산된 부피의 벡터(들), OptiPro 배지 및 폴리에틸렌이민 (PEI)을 모두 주변 온도에서 첨가함으로써 적절한 크기의 원뿔형 튜브에서 각각의 형질주입 조건에 대한 형질주입 혼합물을 제조하였다. 형질주입 혼합물을 1 μg의 DNA/1E6 세포의 농도로 세포에 첨가하였다. 진탕 플라스크를 수확 전 72 시간 동안 항온처리하였다. 수확 시, 세포를 용해시키고, 후속 액적 디지털 PCR (ddPCR) 및 ELISA에 의한 캡시드 분석을 위해, 원심분리 후에 조질의 용해물 샘플을 수집하여 세포 잔해물을 제거하였다.
도 2a-2c는 이중 및 삼중 형질주입 시스템을 사용한 생산으로부터 수득된 VG 생산성 (도 2a), 캡시드 생산성 (도 2b), 및 온전한 벡터 게놈의 백분율 (도 2c)을 도시한다. 도 2a 및 2c에 도시된 바와 같이, 이중 벡터 형질주입 시스템을 사용한 생산으로부터 수득된 VG 생산성 및 온전한 벡터 게놈의 백분율은 삼중 벡터 형질주입 시스템으로부터 수득된 것보다 더 높은 것으로 밝혀졌다. 이중 벡터 형질주입 시스템의 증가된 생산성은 인간 게놈 특이적 상동성 아암을 포함하는 편집 게놈 (조건 1 및 2) 또는 마우스 게놈 특이적 상동성 아암을 포함하는 편집 게놈 (조건 3 및 4)을 포함하는 2 개 이상의 상이한 트랜스진 벡터에 걸쳐 일관된 것으로 밝혀졌다. 도 2a-2c에 도시된 다양한 조건은 표 3에 제시되어 있다.
종합하면, 본 실시예에 제시된 데이터는 삼중 형질주입 시스템과 비교하여 이중 벡터 형질주입 시스템의 효능을 나타낸다. 특히, 이중 벡터 형질주입 시스템은 조질의 용해물 역가 및 온전한 벡터 게놈의 백분율을 증가시켰다.
실시예 3: 이중 벡터 형질주입 시스템 설계 간의 비교
이중 벡터 형질주입 시스템에서 벡터 요소의 구성이 생산성에 영향을 미치는지 여부를 조사하기 위해, 2 개의 이중 벡터 형질주입 시스템 설계을 테스트하였다. 각각의 설계에 기반한 생산으로부터 수득된 벡터 게놈 (VG) 생산성 및 온전한 벡터 게놈의 백분율을 평가하였다. 이중 벡터 형질주입 시스템 설계-1 ("설계-1") 및 설계-2 ("설계-2")는 벡터 게놈 및 헬퍼 서열과 관련하여 Rep/Cap 서열이 상주하는 벡터가 상이하다. 도 3a-3b는 설계-1 (도 3a) 및 설계-2 (도 3b)의 개략도를 제공한다. 도시된 바와 같이, 설계-1은 Rep/Cap 서열 및 트랜스진 ("GOI")을 포함하는 제1 벡터, 및 헬퍼 서열을 포함하는 제2 벡터를 포함하고 (도 3a); 설계-2는 트랜스진 ("GOI")을 포함하는 제1 벡터, 및 헬퍼 및 Rep/Cap 서열 둘 모두를 포함하는 제2 벡터를 포함한다 (도 3b). 형질주입 조건은 표 4에 제시된 조건에 따라 설정되었다.
표 4: 형질주입 조건
표 4에 제시된 바와 같이, 설계-1은 제1 V4 벡터 및 제2 V3 벡터를 포함한다. 설계-2는 제1 V1 벡터 및 제2 V7 벡터를 포함한다. 삼중 형질주입으로부터 수득된 VG 생산성 및 온전한 벡터 게놈의 백분율을 대조군으로서 평가하였다. 다양한 벡터 내에 함유된 요소는 표 2에 제시되어 있다. 표 4에서, 벡터 비율은 이중 벡터 형질주입 시스템 설계를 비교할 때 벡터의 상이한 크기를 고려하기 위해 플라스미드 크기 (즉, 몰 비율)를 기반으로 하였다.
계산된 부피의 벡터(들), OptiPro 배지 및 폴리에틸렌이민 (PEI)을 모두 주변 온도에서 첨가함으로써 적절한 크기의 원뿔형 튜브에서 각각의 형질주입 조건에 대한 형질주입 혼합물을 제조하였다. 형질주입 혼합물을 1 μg의 DNA/1E6 세포의 농도로 세포에 첨가하였다. 진탕 플라스크를 수확 전 72 시간 동안 항온처리하였다. 수확 시, 세포를 용해시키고, 후속 액적 디지털 PCR (ddPCR) 및 ELISA에 의한 캡시드 분석을 위해, 원심분리 후에 조질의 용해물 샘플을 수집하여 세포 잔해물을 제거하였다.
도 4a-4c는 이중 및 삼중 형질주입 시스템을 사용한 생산으로부터 수득된 VG 생산성 (도 4a), 캡시드 생산성 (도 4b), 및 온전한 벡터 게놈의 백분율 (도 4c)을 도시한다. 도 4a 및 4c에 도시된 바와 같이, 설계-1을 사용한 생산으로부터 수득된 VG 생산성 및 온전한 벡터 게놈의 백분율은 삼중 형질주입 시스템으로부터 수득된 것보다 더 높은 것으로 밝혀졌다. 추가로, 도 4a 및 도 4c에 도시된 바와 같이, 설계-1을 사용한 생산으로부터 수득된 VG 생산성 및 계산된 온전한 벡터 게놈의 백분율은 설계-2를 사용한 생산으로부터 수득된 것들보다 더 높은 것으로 밝혀졌다. 이러한 결과에 기반하여, 추가 연구를 위해 설계-1을 선택하였다. 도 4a-4c에 도시된 다양한 조건이 표 4에 제시되어 있다.
제3 이중 벡터 형질주입 시스템 설계 ("설계-3")를 테스트하였다. 3 개의 설계 각각에 기반한 생산으로부터 수득된 벡터 게놈 (VG) 생산성 및 온전한 벡터 게놈의 백분율을 나란히 평가하였다. 위에 논의된 바와 같이, 설계-1은 Rep/Cap 서열 및 트랜스진 ("GOI")을 포함하는 제1 벡터, 및 헬퍼 서열을 포함하는 제2 벡터를 포함하고 (도 3a); 설계-2는 트랜스진 ("GOP")을 포함하는 제1 벡터, 및 헬퍼 및 Rep/Cap 서열 둘 모두를 포함하는 제2 벡터를 포함하고 (도 3b); 설계 3은 트랜스진 ("GOI") 및 헬퍼 서열을 포함하는 제1 벡터, 및 Rep/Cap 서열을 포함하는 제2 벡터를 포함한다 (도 3c). 형질주입 조건은 표 5에 제시된 조건에 따라 설정되었다.
표 5: 형질주입 조건
표 5에 기재된 바와 같이, 설계-1은 제1 V20 벡터 및 제2 V3 벡터를 포함한다. 설계-2는 제1 V19 벡터 및 제2 V7 벡터를 포함한다. 설계-3은 제1 V21 벡터 및 제2 V2 벡터를 포함한다. 삼중 형질주입으로부터 수득된 VG 생산성 및 온전한 벡터 게놈의 백분율을 대조군으로서 평가하였다. 다양한 벡터 내에 함유된 요소는 표 2에 제시되어 있다. 표 5에서, 벡터 비율은 1:1 (1:1:1) 몰 비율로부터 전환된 질량-기반 비율이었다.
계산된 부피의 벡터(들), OptiPro 배지 및 폴리에틸렌이민 (PEI)을 모두 주변 온도에서 첨가함으로써 적절한 크기의 원뿔형 튜브에서 각각의 형질주입 조건에 대한 형질주입 혼합물을 제조하였다. 형질주입 혼합물을 1 μg의 DNA/1E6 세포의 농도로 세포에 첨가하였다. 진탕 플라스크를 수확 전 72 시간 동안 항온처리하였다. 수확 시, 세포를 용해시키고, 후속 액적 디지털 PCR (ddPCR) 및 ELISA에 의한 캡시드 분석을 위해, 원심분리 후에 조질의 용해물 샘플을 수집하여 세포 잔해물을 제거하였다.
도 5a-5c는 이중 및 삼중 형질주입 시스템을 사용한 생산으로부터 수득된 VG 생산성 (도 5a), 캡시드 생산성 (도 5b), 및 온전한 벡터 게놈의 백분율 (도 5c)을 도시한다. 도 5a 및 5c에 도시된 바와 같이, 설계-1을 사용한 생산으로부터 수득된 VG 생산성 및 온전한 벡터 게놈의 백분율은 삼중 형질주입 시스템으로부터 수득된 것보다 더 높은 것으로 밝혀졌다. 추가로, 도 5a 및 도 5c에 도시된 바와 같이, 설계-1을 사용한 생산으로부터 수득된, VG 생산성 및 계산된 온전한 벡터 게놈의 백분율은 설계-2 및 설계-3을 사용한 생산으로부터 수득된 것보다 더 높은 것으로 밝혀졌다. 이들 데이터는 설계-1 이중 벡터 형질주입 시스템을 사용하는 것이 설계-2 이중 벡터 형질주입 시스템, 설계-3 이중 벡터 형질주입 시스템 및 대조군 삼중 벡터 형질주입 시스템과 비교하여 증가된 rAAV 역가를 초래한다는 것을 입증한다. 도 5a-5c에 도시된 다양한 조건이 표 5에 제시되어 있다.
실시예 4: 이중 및 삼중 형질주입 시스템 간의 비교
실시예 3에서 관찰된 삼중 형질주입에 비해 설계-1의 증가된 생산성을 확인하기 위해, 형질주입 조건을 설정하여, 증가된 효능이 더 큰 규모 (2 L 규모)에서 유지되는지 여부, 및 설계-1의 증가된 효능이 상이한 트랜스진을 갖는 그리고 상이한 캡시드로의 rAAV 게놈의 패키징 전반에 걸쳐 확장되는지 여부를 조사하였다. 형질주입 조건은 표 6에 제시된 조건에 따라 설정되었다. 표 6에서, 벡터 비율은 질량을 기반으로 하였다.
표 6: 형질주입 조건
표 6에 제시된 바와 같이, 형질주입 조건 1, 2, 3, 4, 5 및 6을 설정하여, 설계-1의 증가된 효능이 상이한 트랜스진을 갖는 rAAV 게놈의 패키징 전반에 걸쳐 확장되는지 여부를 조사하였다. 상이한 트랜스진을 갖는 rAAV 게놈의 패키징 전반에 걸쳐 설계-1의 효능을 조사하는 것 외에도, 조건 6 및 7은 또한 효능이 상이한 캡시드로의 rAAV 게놈의 패키징 전반에 걸쳐 확장되는지 여부를 평가한다. 조건 1-5는 각각 AAVHSCS15 캡시드를 활용하고, 조건 6은 AAVHSCS17 캡시드를 활용하고, 조건 7은 AAV2 캡시드를 활용하였다. 삼중 형질주입으로부터 수득된 VG 생산성 및 온전한 벡터 게놈의 백분율을 대조군으로서 평가하였다. 다양한 벡터 내에 함유된 요소는 표 2에 제시되어 있다.
계산된 부피의 벡터(들), OptiPro 배지 및 폴리에틸렌이민 (PEI)을 모두 주변 온도에서 첨가함으로써 적절한 크기의 전달 조립체(assembly)에서 각각의 형질주입 조건에 대한 형질주입 혼합물을 제조하였다. 형질주입 혼합물을 1 μg의 DNA/1E6 세포의 농도로 세포에 첨가하였다. 진탕 플라스크를 수확 전 72 시간 동안 항온처리하였다.
수확 시, 세포를 용해시키고, 후속 액적 디지털 PCR (ddPCR) 및 ELISA에 의한 캡시드 분석을 위해, 원심분리 후에 조질의 용해물 샘플을 수집하여 세포 잔해물을 제거하였다.
도 6a-6c는 설계-1 및 대조군 삼중 형질주입 시스템을 사용한 생산으로부터 수득된 VG 생산성 (도 6a), 캡시드 생산성 (도 6b) 및 온전한 벡터 게놈의 백분율 (도 6c)을 도시한다. 도 6a 및 6c에 도시된 바와 같이, 설계-1을 사용한 생산으로부터 수득된 VG 생산성 및 온전한 벡터 게놈의 백분율은 테스트된 모든 조건에서 삼중 형질주입 시스템으로부터 수득된 것보다 더 높은 것으로 밝혀졌다. 이들 결과에 기반하여, 상이한 캡시드에 상이한 트랜스진을 갖는 rAAV의 패키징 전반에 걸쳐, 삼중 형질주입에 비해 설계-1을 사용한 생산의 증가된 효능이 관찰되었다. 이중 벡터 형질주입 시스템의 증가된 생산성은 5 개의 상이한 rAAV 게놈에 대해 일관된 것으로 밝혀졌으며, 그 중 2 개는 편집 게놈 (조건 1 및 2)을 포함한다. 이들 데이터는 대조군 삼중 벡터 형질주입 시스템에 비해 설계-1 이중 벡터 형질주입 시스템을 사용하여 수득된 증가된 rAAV 역가가 상이한 캡시드에 상이한 트랜스진을 갖는 rAAV의 패키징 전반에 걸쳐 확장된다는 것을 입증한다. 도 6a-6c에 도시된 다양한 조건이 표 6에 제시되어 있다.
도 7a-7c는 설계-1을 사용한 AAV2 캡시드 (조건 7) 및 대조군 삼중 형질주입 시스템을 활용한 생산으로부터 수득된 VG 생산성 (도 7a), 캡시드 생산성 (도 7b) 및 온전한 벡터 게놈의 백분율 (도 7c)을 도시한다. 도 7a 및 7c에 도시된 바와 같이, 설계-1을 사용한 AAV2 캡시드를 활용한 생산으로부터 수득된 VG 생산성 및 온전한 벡터 게놈의 백분율은 삼중 형질주입 시스템으로부터 수득된 것보다 더 높은 것으로 밝혀졌다. 도 7a-7c의 데이터는 소-규모 생산 연구로부터 생성되었다.
별도의 실험에서, 설계-1이 또한 AAVHSC13 캡시드를 포함하는 rAAV를 생산할 수 있다는 것이 밝혀졌다 (그 전체가 본원에 원용되는 미국 특허 번호 9,803,218 참고).
이들 데이터는 (삼중 플라스미드 시스템 대조군에 비해) 설계-1 이중 플라스미드 시스템에 의해 나타난 AAV 생산의 개선이 일반적으로 적용가능할 가능성이 있음을 시사한다.
실시예 5: 이중 및 삼중 형질주입 시스템 간의 비교
실시예 3 및 4는 대조군 삼중 형질주입 시스템을 사용한 생산과 비교하여, 설계-1을 사용한 생산으로부터 수득된 조질의 용해물에서 측정된 증가된 VG 생산성 및 온전한 벡터 게놈의 증가된 백분율을 입증하였다.
증가된 VG 생산성 및 온전한 벡터 게놈의 증가된 백분율이 정제-후 유지되었는지 확인하기 위해, 표 7에 제시된 것들에 따라 설정된 형질주입으로부터 수득된 조질의 용해물을 정화하고, 후속적으로 친화도 및 음이온 교환 크로마토그래피에 의해 정제하였다. 표 7에서, 50 L 규모에서 수행한 조건 3을 제외하고, 조건 1, 2 및 4를 각각 표 6의 조건 2, 3 및 5 (즉, 2 L 규모)에 따라 수행하였다. 상이한 벡터 비율을 사용하여 생산된 용해물을 별도로 정제하였다. 조건 1-3은 각각 AAVHSCS15 캡시드를 활용한 반면, 조건 4는 AAVHSCS17 캡시드를 활용하였다. 설계-1 이중 플라스미드 시스템으로부터 수득된 온전한 벡터 게놈은 표시된 대조군 삼중 플라스미드 시스템으로부터 수득된 온전한 벡터 게놈의 양에 대한 백분율 증가로서 표현되었다 (표 7 및 도 8). 표 7에서, 벡터 비율은 질량을 기반으로 하였다. 다양한 벡터 내에 함유된 요소는 표 2에 제시되어 있다.
표 7: 형질주입 조건
도 8에 묘사된 데이터는 침강 계수에 기반하여 거대분자를 정량화하는 데 사용되는 방법인 분석적 초원심분리 침강 속도 (AUC) 분석에 기반한다. AUC는 상응하는 삼중 플라스미드 시스템 대조군에 비해, 각각의 설계-1 이중 플라스미드 시스템에 의해 생산된 벡터 게놈이 결여된 온전한 벡터 게놈 및 캡시드의 백분율을 결정하는 데 사용되었다. 도 8에서, 조건 1 및 2에 대해, 설계-1 벡터 비율 (즉, 표 7에 도시된 1:2, 1:3 및 1:4 비율) 각각으로부터 수득된 정제된 벡터에 대해 AUC를 수행하여, 온전한 벡터 게놈의 수를 결정한 다음, 평균화하고, 상응하는 삼중 플라스미드 시스템 대조군에 대한 퍼센트 증가로서 제시하였다. 도 8에 도시된 바와 같이, 테스트된 4 개의 설계-1 이중 플라스미드 시스템 각각에 대해 (상응하는 삼중 플라스미드 시스템 대조군으로부터 수득된 온전한 벡터 게놈의 수에 비해) 온전한 벡터 게놈의 수의 증가를 수득하였다. 이러한 데이터는 (삼중 플라스미드 시스템 대조군에 비해) 설계-1 이중 플라스미드 시스템에 의해 나타난 AAV 생산의 개선이 일반적으로 적용가능하고 확장가능할 가능성이 있음을 시사한다.
실시예 6: 이중 형질주입 시스템에서 캡시드 배경 발현
설계-1이 다른 이중 플라스미드 형질주입 시스템 설계를 능가하는 이유를 설명하기 위한 노력으로, 배경 캡시드 발현의 수준을 설계-1에서 결정하고, 설계-2의 배경 캡시드 발현의 수준과 비교하였다. 형질주입 조건은 표 8에 제시된 것들에 따라 설정되었다. 표 8에서, 벡터 비율은 질량을 기반으로 하였다.
표 8: 형질주입 조건
표 8에 도시된 바와 같이, 설계-1 및 설계-2를, 각각 각각의 이중 설계에 대해 Rep/Cap 함유 벡터만을 이용하여 함께 테스트하였다. 동일한 양의 Rep/Cap 함유 벡터를 단독으로 사용하거나 (예컨대, 조건 2 및 4), 이중 설계에서 벡터로서 사용하였다 (예컨대, 조건 1 및 3).
설계-2 (벡터 V7만의 형질주입; 조건 2)로부터의 배경 캡시드 생성의 수준은 설계-2의 이중 형질주입 (벡터 V1 및 V7 둘 모두의 형질주입; 조건 1)으로부터 생성된 배경 캡시드의 수준과 동일한 것으로 밝혀졌다 (도 9). 도 9에 도시된 바와 같이, 설계-1로부터의 배경 캡시드 생성은 설계-1의 이중 형질주입으로부터 생성된 배경 캡시드의 수준의 1% 미만이었다 (조건 4를 조건 3과 비교함).
실시예 7: 이중 및 삼중 형질주입 시스템으로부터 AAV의 대규모 생산 및 품질 평가
설계-1의 개선된 생산성이 대규모 생산에서 유지되는지 여부를 조사하기 위해, 설계-1에 대해 1:2의 벡터 비율에서 표 6의 조건 4를 50 L 생물반응기 규모에서 반복하였다. 진탕 플라스크 및 2 L 생물반응기 규모에서의 경향과 일관되게, 50 L 생물반응기로부터의 결과는 삼중 형질주입 시스템 ("3 TFX"; 삼중 형질주입 대조군의 조건에 대해 표 6 참고)으로부터 수득된 조질의 용해물과 비교하여 설계-1 ("2 TFX")로부터 수득된 조질의 용해물에서 VG 생산성의 거의 2-배의 증가, 비슷한 캡시드 생산 및 계산된 온전한 벡터 게놈의 배가(doubling)를 나타냈다 (도 10a-10c). 이러한 데이터는 대조군 삼중 벡터 형질주입 시스템과 비교하여 설계-1 이중 벡터 형질주입 시스템을 사용하여 수득된 증가된 rAAV 역가가 대규모 생산에서 유지된다는 것을 입증한다.
설계-1 및 삼중 형질주입 시스템으로부터 수득된 AAV 벡터의 산물 품질을 특성화하기 위해 다양한 분석적 방법을 사용하였다 (도 10d-10j). 도시된 바와 같이, 순도 퍼센트 (도 10d), 응집 퍼센트 (도 10e), 및 잔여 숙주 세포 단백질의 수준 (도 10f; BLoQ는 정량 한계 미만을 의미함)은 모두 형질주입 방법에 관계없이 일관되게 유지되었다. 삼중 형질주입 시스템으로부터 수득된 것들과 비교하여 설계-1로부터 수득된 정제된 AAV 벡터에 패키징된 잔류 숙주 세포 DNA (도 10g), Rep/Cap (도 10h), Ela (도 10i) 및 헬퍼 서열 (도 10j)의 양에서 편차가 발견되지 않았다.
실시예 8: 이중 및 삼중 형질주입 시스템으로부터 수득된 AAV 벡터의 생체활성
설계-1로부터 수득된 AAV 벡터 및 삼중 형질주입 시스템으로부터 수득된 AAV 벡터 간의 산물 비교성을 보장하기 위해, 설계 1에 대해 1:4의 벡터 비율에서 표 6의 조건 5로부터 수득된 AAV 벡터, 및 연관된 삼중 형질주입 대조군을 정제하고, 생체 내 생체활성에 대해 평가하였다. rAAV 게놈은 뮤린-특이적 상동성 아암에 측접된 간 특이적 프로모터의 제어 하에서 페닐알라닌 수산화효소 (PAH)를 발현하는 편집 게놈을 포함한다. 설계-1 및 삼중 형질주입 시스템으로부터 수득된 AAV 벡터를 고전적인 페닐케톤뇨증의 여러 특징을 나타내는 모델인 Pahenu2 마우스에 주사하였다. 2 개의 용량뿐만 아니라 비히클-단독 대조군을 평가하였다. 매주 혈청 샘플을 채취하고, 페닐알라닌 (Phe)의 수준을 분석하였다. 도 11a 및 11b에 도시된 바와 같이, 1E12 VG/kg (도 11a) 및 1E14 VG/kg (도 11b)의 두 용량 모두에서, 설계-1 및 삼중 형질주입 시스템으로부터 수득된 AAV 벡터의 투약-후 혈청 Phe 수준의 감소로 표시된 바와 같은 생체활성은 6-주 기간에 걸쳐 구별할 수 없었다. 더욱이, 6 주째에, 간에서의 벡터 게놈 및 PAH mRNA 발현의 정량은 VG 형질도입 및 트랜스진 발현의 용량 의존적 증가를 나타내었지만, 각각의 용량에서 설계-1 및 삼중 형질주입 그룹 사이에는 유의한 차이가 없었다 (도 11c 및 11d). 표적-내 통합의 정량은 1E14 VG/kg 용량에서 완료되었으며, 설계-1 또는 삼중 형질주입 시스템으로부터 생산된 AAV 벡터에 대해 비슷한 통합 효율성을 입증하였다 (도 11e).
실시예 9: 벡터 비율의 최적화
개선된 생산성을 초래하는 최적의 벡터 비율이 있는지 여부를 조사하기 위해, 다양한 설계-1 벡터 비율을 테스트하였다. 소규모 생산을 위해 실시예 1에 기재된 바와 같이 형질주입을 설정하였다.
도 12a-12c는 형질주입된 총 DNA의 다양한 수준 (x-축)에서, 표시된 V3:V12 벡터 비율을 테스트한, 조건 1 하에서의 생산으로부터 수득된 VG 생산성 (도 12a), 캡시드 생산성 (도 12b), 및 온전한 벡터 게놈의 백분율 (도 12c)을 도시한다. V3 및 V12 내에 함유된 요소는 표 2에 제시되어 있다. 도 12a-12c에 도시된 바와 같이, 개선된 VG 및 캡시드 생산성은 1E6 개의 세포당 0.6 내지 1 μg의 형질주입된 총 DNA를 사용하여 1:0.3 내지 1:1의 V3:V12 벡터 비율에서 달성되었다.
도 13a-13c는 형질주입된 총 DNA의 다양한 수준 (x-축)에서, 표시된 V3:V8 비율을 테스트한, 조건 2 하에서의 생산으로부터 수득된 VG 생산성 (도 13a), 캡시드 생산성 (도 13b), 및 온전한 벡터 게놈의 백분율 (도 13c)을 도시한다. V3 및 V8 내에 함유된 요소는 표 2에 제시되어 있다. 도 13a-13c에 도시된 바와 같이, 개선된 VG 및 캡시드 생산성은 1E6 개의 세포당 0.6 내지 1 μg의 형질주입된 총 DNA를 사용하여 1:0.6 내지 1:1의 V3:V8 벡터 비율에서 달성되었다. 이러한 데이터는 증가된 rAAV 역가가 이러한 벡터 비율 및 형질주입된 총 DNA의 수준을 사용하여 달성된다는 것을 입증한다.
실시예 10: 이중 플라스미드 형질주입을 사용한 다중 캡시드 혈청형의 평가
설계-1의 개선된 생산성이 다른 AAV 캡시드 혈청형에 걸쳐 유지되는지 여부를 조사하기 위해, 설계-1 또는 삼중 형질주입 시스템으로부터 생산된 AAV 벡터를 AAV 캡시드 혈청형 AAV1, AAV2, AAV5, AAV6, AAV8, AAV9, AAVrh10 및 AAVrh74를 활용하여 테스트하였다. 2 L 생물반응기 생산을 위해 실시예 1에 기재된 바와 같이 형질주입을 설정하였다. 형질주입 조건은 표 9에 제시된 것들에 따라 설정되었다.
표 9: 형질주입 조건
도 14a-14c는 표 9에 제시된 조건 하에서 생산으로부터 수득된 VG 생산성 (도 14a), 캡시드 생산성 (도 14b) 및 온전한 벡터 게놈의 백분율 (도 14c)을 도시한다. 도 14a에 도시된 바와 같이, 상응하는 삼중 형질주입 시스템 대조군에 비해 설계-1을 사용한 생산으로부터 수득된 개선된 VG 생산성은 테스트된 모든 AAV 캡시드 혈청형에 걸쳐 유지된다. 도 14b에 도시된 바와 같이, 상응하는 삼중 형질주입 시스템 대조군에 비해 설계-1을 사용한 생산으로부터 수득된 캡시드 생산성은 개선되거나 유지된다. 도 14c에 도시된 바와 같이, 상응하는 삼중 형질주입 시스템 대조군에 비해 설계-1을 사용한 생산으로부터 수득된 온전한 벡터 게놈의 백분율은 개선되거나 유지된다. 이러한 데이터는 대조군 삼중 벡터 형질주입 시스템과 비교하여 설계-1 이중 벡터 형질주입 시스템을 사용하여 수득된 증가된 rAAV 역가가 상이한 AAV 캡시드 혈청형에 걸쳐 확장된다는 것을 입증한다.
실시예 11: 2000 L까지의 이중 플라스미드 확장성
실시예 7은 설계-1의 개선된 생산성이 50 L 생물반응기 규모에서 유지된다는 것을 보여주었다. 50 L 생물반응기로부터의 결과는 삼중 형질주입 시스템 대조군으로부터 수득된 조질의 용해물과 비교하여 설계-1로부터 수득된 조질의 용해물에서의 VG 생산성의 거의 2-배 증가를 나타냈다.
설계-1의 개선된 VG 생산성이 확장가능한지 여부를 조사하기 위해, 50 L 생물반응기 규모에서의 생산성을 2000 L 생물반응기 규모에서의 생산성과 비교하였다. 세포를 50 L 및 2000 L 생물반응기에 접종한 것을 제외하고는, 2 L 생물반응기 생산을 위해 실시예 1에 기재된 바와 같이 형질주입을 설정하였다. 세포를 3.6E6 내지 5E6 개의 세포/mL의 밀도로 형질주입시켰다. 50 L 생물반응기 및 2000 L 생물반응기에 대한 형질주입 조건은 표 10에 제시된 조건에 따라 설정되었다.
표 10: 형질주입 조건
도 15는 50 L 및 2000 L 생물반응기 규모가 비슷한 VG 생산성을 달성한다는 것을 도시한다. 이러한 데이터는 설계-1 이중 플라스미드 형질주입 시스템의 확장성을 입증한다.
본 발명의 추가 실시양태는 다음의 조항에서 제시된다:
1. 제1 핵산 벡터로서, AAV Rep 단백질을 코딩하는 제1 뉴클레오티드 서열; 트랜스진을 포함하는 재조합 AAV (rAAV) 게놈을 포함하는 제2 뉴클레오티드 서열; 및 AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열을 포함하며, 여기서 핵산 벡터는 헬퍼 바이러스 유전자를 포함하지 않는, 핵산 벡터.
2. 조항 1에 있어서, 5'으로부터 3'으로, AAV Rep 단백질을 코딩하는 제1 뉴클레오티드 서열; 트랜스진을 포함하는 재조합 AAV (rAAV) 게놈을 포함하는 제2 뉴클레오티드 서열; 및 AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열을 포함하며, 여기서 핵산 벡터는 헬퍼 바이러스 유전자를 포함하지 않는, 핵산 벡터.
3. 조항 1에 있어서, 5'으로부터 3'으로 다음을 포함하는, 헥산 벡터: AAV Rep 단백질을 코딩하는 제1 뉴클레오티드 서열; 트랜스진을 포함하는 재조합 AAV (rAAV) 게놈을 포함하는 제2 뉴클레오티드 서열; 및 AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열.
4. 조항 1-3 중 어느 하나에 있어서, 핵산 벡터가 DNA 플라스미드 또는 DNA 최소 벡터인, 핵산 벡터.
5. 재조합 AAV (rAAV) 패키징 시스템으로서, (i) 다음을 포함하는 제1 핵산 벡터: AAV Rep 단백질을 코딩하는 제1 뉴클레오티드 서열; 트랜스진을 포함하는 재조합 AAV (rAAV) 게놈을 포함하는 제2 뉴클레오티드 서열; 및 AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열, 및 (ii) 헬퍼 바이러스 유전자를 포함하는 제2 핵산 벡터를 포함하는, 패키징 시스템.
6. 조항 5에 있어서, 제1 핵산 벡터가 5'으로부터 3'으로 다음을 포함하는, 패키징 시스템: AAV Rep 단백질을 코딩하는 제1 뉴클레오티드 서열; 트랜스진을 포함하는 재조합 AAV (rAAV) 게놈을 포함하는 제2 뉴클레오티드 서열; 및 AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열.
7. 조항 5 또는 6에 있어서, 제1 핵산 벡터가 DNA 플라스미드 또는 DNA 최소 벡터인, 패키징 시스템.
8. 조항 5-7 중 어느 하나에 있어서, 제2 핵산 벡터가 DNA 플라스미드 또는 DNA 최소 벡터인, 패키징 시스템.
9. 조항 1-8 중 어느 하나에 있어서, 트랜스진이 폴리펩티드를 코딩하는, 핵산 벡터 또는 패키징 시스템.
10. 조항 1-8 중 어느 하나에 있어서, 트랜스진이 miRNA, shRNA, siRNA, 안티센스 RNA, gRNA, 안타고미르, miRNA 스폰지, RNA 압타자임, RNA 압타머, lncRNA, 리보자임 또는 mRNA를 코딩하는, 핵산 벡터 또는 패키징 시스템.
11. 조항 1-8 중 어느 하나에 있어서, 트랜스진이 페닐알라닌 수산화효소 (PAH), 글루코스-6-포스파타제 (G6Pase), 이두로네이트-2-설파타제 (I2S), 아릴설파타제 A (ARSA) 및 프라탁신 (FXN)으로 이루어진 군으로부터 선택되는 단백질을 코딩하는, 핵산 벡터 또는 패키징 시스템.
12. 임의의 전술한 조항에 있어서, rAAV 게놈이 트랜스진에 작동가능하게 연결된 전사 조절 요소를 추가로 포함하는, 핵산 벡터 또는 패키징 시스템.
13. 조항 12에 있어서, 전사 조절 요소가 프로모터 요소 및/또는 인트론 요소를 포함하는, 핵산 벡터 또는 패키징 시스템.
14. 임의의 전술한 조항에 있어서, rAAV 게놈이 폴리아데닐화 서열을 추가로 포함하는, 핵산 벡터 또는 패키징 시스템.
15. 조항 14에 있어서, 폴리아데닐화 서열이 트랜스진에 대해 3'인, 핵산 벡터 또는 패키징 시스템.
16. 임의의 전술한 조항에 있어서, rAAV 게놈이 서열번호 71, 85, 86, 87 또는 88에 제시된 뉴클레오티드 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 뉴클레오티드 서열을 포함하는, 핵산 벡터 또는 패키징 시스템.
17. 임의의 전술한 조항에 있어서, rAAV 게놈이 트랜스진의 5'의 5' 역전 말단 반복부 (5' ITR) 뉴클레오티드 서열, 및 트랜스진의 3'의 3' 역전 말단 반복부 (3' ITR) 뉴클레오티드 서열을 추가로 포함하는, 핵산 벡터 또는 패키징 시스템.
18. 조항 17에 있어서, 5' ITR 뉴클레오티드 서열이 서열번호 39, 41 또는 42에 제시된 뉴클레오티드 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일하고/하거나, 3' ITR 뉴클레오티드 서열이 서열번호 40, 43 또는 44에 제시된 뉴클레오티드 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한, 핵산 벡터 또는 패키징 시스템.
19. 임의의 전술한 조항에 있어서, rAAV 게놈이 서열번호 75, 78, 80, 82 또는 84에 제시된 뉴클레오티드 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 뉴클레오티드 서열을 포함하는, 핵산 벡터 또는 패키징 시스템.
20. 임의의 전술한 조항에 있어서, AAV Rep 단백질이 야생형 Rep 단백질 또는 이의 변이체인, 핵산 벡터 또는 패키징 시스템.
21. 임의의 전술한 조항에 있어서, AAV Rep 단백질이 AAV2 Rep 단백질 또는 이의 변이체인, 핵산 벡터 또는 패키징 시스템.
22. 임의의 전술한 조항에 있어서, 제1 뉴클레오티드 서열이 AAV Rep 단백질 코딩 서열에 작동가능하게 연결된 전사 조절 요소를 추가로 포함하는, 핵산 벡터 또는 패키징 시스템.
23. 조항 22에 있어서, 전사 조절 요소가 구성적 프로모터, 유도성 프로모터 및 천연 프로모터로 이루어진 군으로부터 선택되는 프로모터를 포함하는, 핵산 벡터 또는 패키징 시스템.
24. 조항 23에 있어서, 프로모터가 P5 프로모터, P19 프로모터, 메탈로티오닌 (MT) 프로모터, 마우스 유방 종양 바이러스 (MMTV) 프로모터, T7 프로모터, 엑디손 곤충 프로모터, 테트라사이클린-억압성 프로모터, 테트라사이클린-유도성 프로모터, RU486-유도성 프로모터 및 라파마이신-유도성 프로모터로 이루어진 군으로부터 선택되는, 핵산 벡터 또는 패키징 시스템.
25. 임의의 전술한 조항에 있어서, AAV 캡시드 단백질이 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAVrh10, AAVRh32.33, AAVrh74, AAV-DJ, AAV-LK03, NP59, VOY101, VOY201, VOY701, VOY801, VOY1101, AAVPHP.N, AAVPHP.A, AAVPHP.B, PHP.B2, PHP.B3, G2A3, G2B4, G2B5 및 PHP.S로 이루어진 군으로부터 선택되는, 핵산 벡터 또는 패키징 시스템.
26. 임의의 전술한 조항에 있어서, AAV 캡시드 단백질이 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16 또는 17의 아미노산 203-736의 아미노산 서열과 85% 이상 동일한 아미노산 서열을 포함하는, 핵산 벡터 또는 패키징 시스템.
27. 조항 26에 있어서, 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질의 아미노산이 C이거나; 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질의 아미노산이 H이거나; 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질의 아미노산이 Q이거나; 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질의 아미노산이 A이거나; 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질의 아미노산이 N이거나; 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질의 아미노산이 S이거나; 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질의 아미노산이 I이거나; 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산이 R이거나; 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질의 아미노산이 R이거나; 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질의 아미노산이 G 또는 Y이거나; 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질의 아미노산이 M이거나; 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질의 아미노산이 R이거나; 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질의 아미노산이 K이거나; 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질의 아미노산이 C이거나; 또는 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질의 아미노산이 G인, 핵산 벡터 또는 패키징 시스템.
28. 조항 27에 있어서, (a) 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질의 아미노산이 G이고, 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질의 아미노산이 G이거나; (b) 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질의 아미노산이 H이고, 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질의 아미노산이 N이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산이 R이고, 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질의 아미노산이 M이거나; (c) 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산이 R이고, 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질의 아미노산이 R이거나; (d) 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질의 아미노산이 A이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산이 R이거나; 또는 (e) 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질의 아미노산이 I이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산이 R이고, 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질의 아미노산이 C인, 핵산 벡터 또는 패키징 시스템.
29. 조항 27에 있어서, AAV 캡시드 단백질이 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16 또는 17의 아미노산 203-736의 아미노산 서열을 포함하는, 핵산 벡터 또는 패키징 시스템.
30. 임의의 전술한 조항에 있어서, AAV 캡시드 단백질이 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16 또는 17의 아미노산 138-736의 아미노산 서열과 85% 이상 동일한 아미노산 서열을 포함하는, 핵산 벡터 또는 패키징 시스템.
31. 조항 30에 있어서, 서열번호 16의 아미노산 151에 상응하는 캡시드 단백질의 아미노산이 R이거나; 서열번호 16의 아미노산 160에 상응하는 캡시드 단백질의 아미노산이 D이거나; 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질의 아미노산이 C이거나; 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질의 아미노산이 H이거나; 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질의 아미노산이 Q이거나; 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질의 아미노산이 A이거나; 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질의 아미노산이 N이거나; 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질의 아미노산이 S이거나; 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질의 아미노산이 I이거나; 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산이 R이거나; 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질의 아미노산이 R이거나; 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질의 아미노산이 G 또는 Y이거나; 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질의 아미노산이 M이거나; 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질의 아미노산이 R이거나; 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질의 아미노산이 K이거나; 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질의 아미노산이 C이거나; 또는 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질의 아미노산이 G인, 핵산 벡터 또는 패키징 시스템.
32. 조항 31에 있어서, (a) 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질의 아미노산이 G이고, 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질의 아미노산이 G이거나; (b) 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질의 아미노산이 H이고, 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질의 아미노산이 N이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산이 R이고, 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질의 아미노산이 M이거나; (c) 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산이 R이고, 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질의 아미노산이 R이거나; (d) 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질의 아미노산이 A이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산이 R이거나; 또는 (e) 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질의 아미노산이 I이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산이 R이고, 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질의 아미노산이 C인, 핵산 벡터 또는 패키징 시스템.
33. 조항 31에 있어서, AAV 캡시드 단백질이 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16 또는 17의 아미노산 138-736의 아미노산 서열을 포함하는, 핵산 벡터 또는 패키징 시스템.
34. 임의의 전술한 조항에 있어서, AAV 캡시드 단백질이 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16 또는 17의 아미노산 1-736의 아미노산 서열과 85% 이상 동일한 아미노산 서열을 포함하는, 핵산 벡터 또는 패키징 시스템.
35. 조항 34에 있어서, 서열번호 16의 아미노산 2에 상응하는 캡시드 단백질의 아미노산이 T이거나; 서열번호 16의 아미노산 65에 상응하는 캡시드 단백질의 아미노산이 I이거나; 서열번호 16의 아미노산 68에 상응하는 캡시드 단백질의 아미노산이 V이거나; 서열번호 16의 아미노산 77에 상응하는 캡시드 단백질의 아미노산이 R이거나; 서열번호 16의 아미노산 119에 상응하는 캡시드 단백질의 아미노산이 L이거나; 서열번호 16의 아미노산 151에 상응하는 캡시드 단백질의 아미노산이 R이거나; 서열번호 16의 아미노산 160에 상응하는 캡시드 단백질의 아미노산이 D이거나; 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질의 아미노산이 C이거나; 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질의 아미노산이 H이거나; 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질의 아미노산이 Q이거나; 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질의 아미노산이 A이거나; 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질의 아미노산이 N이거나; 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질의 아미노산이 S이거나; 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질의 아미노산이 I이거나; 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산이 R이거나; 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질의 아미노산이 R이거나; 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질의 아미노산이 G 또는 Y이거나; 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질의 아미노산이 M이거나; 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질의 아미노산이 R이거나; 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질의 아미노산이 K이거나; 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질의 아미노산이 C이거나; 또는 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질의 아미노산이 G인, 핵산 벡터 또는 패키징 시스템.
36. 조항 35에 있어서, (a) 서열번호 16의 아미노산 2에 상응하는 캡시드 단백질의 아미노산이 T이고, 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질의 아미노산이 Q이거나; (b) 서열번호 16의 아미노산 65에 상응하는 캡시드 단백질의 아미노산이 I이고, 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질의 아미노산이 Y이거나; (c) 서열번호 16의 아미노산 77에 상응하는 캡시드 단백질의 아미노산이 R이고, 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질의 아미노산이 K이거나; (d) 서열번호 16의 아미노산 119에 상응하는 캡시드 단백질의 아미노산이 L이고, 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질의 아미노산이 S이거나; (e) 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질의 아미노산이 G이고, 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질의 아미노산이 G이거나; (f) 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질의 아미노산이 H이고, 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질의 아미노산이 N이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산이 R이고, 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질의 아미노산이 M이거나; (g) 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산이 R이고, 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질의 아미노산이 R이거나; (h) 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질의 아미노산이 A이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산이 R이거나; 또는 (i) 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질의 아미노산이 I이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질의 아미노산이 R이고, 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질의 아미노산이 C인, 핵산 벡터 또는 패키징 시스템.
37. 조항 35에 있어서, AAV 캡시드 단백질이 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16 또는 17의 아미노산 1-736의 아미노산 서열을 포함하는, 핵산 벡터 또는 패키징 시스템.
38. 임의의 전술한 조항에 있어서, 제3 뉴클레오티드 서열이 AAV 캡시드 단백질 코딩 서열에 작동가능하게 연결된 전사 조절 요소를 추가로 포함하는, 핵산 벡터 또는 패키징 시스템.
39. 조항 38에 있어서, 전사 조절 요소가 구성적 프로모터, 유도성 프로모터 및 천연 프로모터로 이루어진 군으로부터 선택되는 프로모터를 포함하는, 핵산 벡터 또는 패키징 시스템.
40. 조항 39에 있어서, 프로모터가 P40 프로모터, 메탈로티오닌 (MT) 프로모터, 마우스 유방 종양 바이러스 (MMTV) 프로모터, T7 프로모터, 엑디손 곤충 프로모터, 테트라사이클린-억압성 프로모터, 테트라사이클린-유도성 프로모터, RU486-유도성 프로모터 및 라파마이신-유도성 프로모터로 이루어진 군으로부터 선택되는, 핵산 벡터 또는 패키징 시스템.
41. 임의의 전술한 조항에 있어서, 제1 핵산 벡터가 서열번호 73 또는 77에 제시된 뉴클레오티드 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 뉴클레오티드 서열을 포함하는, 핵산 벡터 또는 패키징 시스템.
42. 임의의 전술한 조항에 있어서, 제2 뉴클레오티드 서열이 서열번호 71, 75, 78, 80, 82, 84, 85, 86, 87 또는 88에 제시된 뉴클레오티드 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 서열을 포함하는, 핵산 벡터 또는 패키징 시스템.
43. 임의의 전술한 조항에 있어서, 제1 뉴클레오티드 서열이 서열번호 50, 51, 52, 53, 54, 55, 56, 57, 58 또는 59에 제시된 뉴클레오티드 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 서열을 포함하고; 제2 뉴클레오티드 서열이 서열번호 71, 75, 78, 80, 82, 84, 85, 86, 87 또는 88에 제시된 뉴클레오티드 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 서열을 포함하고; 제3 뉴클레오티드 서열이 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16 또는 17의 아미노산 203-736, 138-736 및/또는 1-736의 아미노산 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 아미노산 서열을 코딩하는, 핵산 벡터 또는 패키징 시스템.
44. 조항 43에 있어서, 제1 핵산 벡터가 5'으로부터 3'으로 제1 뉴클레오티드 서열; 제2 뉴클레오티드 서열; 및 제3 뉴클레오티드 서열을 포함하는, 핵산 벡터 또는 패키징 시스템.
45. 조항 5-44 중 어느 하나에 있어서, 헬퍼 바이러스 유전자가 아데노바이러스, 헤르페스 바이러스, 폭스바이러스, 사이토메갈로바이러스 및 배큘로바이러스로 이루어진 군으로부터 선택되는 헬퍼 바이러스로부터 유래되는, 패키징 시스템.
46. 조항 5-45 중 어느 하나에 있어서, 헬퍼 바이러스 유전자가 E1, E2, E4 및 VA로 이루어진 군으로부터 선택되는 아데노바이러스로부터 유래된 RNA 유전자인, 패키징 시스템.
47. 조항 5-46 중 어느 하나에 있어서, 제2 핵산 벡터가 헬퍼 바이러스 유전자에 작동가능하게 연결된 전사 조절 요소를 추가로 포함하는, 패키징 시스템.
48. 조항 47에 있어서, 전사 조절 요소가 구성적 프로모터, 유도성 프로모터 및 천연 프로모터로 이루어진 군으로부터 선택되는 프로모터를 포함하는, 패키징 시스템.
49. 조항 48에 있어서, 프로모터가 RSV LTR 프로모터, CMV 즉시 초기 프로모터, SV40 프로모터, 디하이드로폴레이트 환원효소 프로모터, 세포질 β-액틴 프로모터, 포스포글리세레이트 키나제 (PGK) 프로모터, 메탈로티오닌 (MT) 프로모터, 마우스 유방 종양 바이러스 (MMTV) 프로모터, T7 프로모터, 엑디손 곤충 프로모터, 테트라사이클린-억압성 프로모터, 테트라사이클린-유도성 프로모터, RU486-유도성 프로모터 및 라파마이신-유도성 프로모터로 이루어진 군으로부터 선택되는, 패키징 시스템.
50. 조항 5-49 중 어느 하나에 있어서, 제2 핵산 벡터가 서열번호 60, 61 또는 62에 제시된 뉴클레오티드 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 뉴클레오티드 서열을 포함하는, 패키징 시스템.
51. 조항 5-50 중 어느 하나에 있어서, 제2 핵산 벡터가 서열번호 63에 제시된 뉴클레오티드 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 뉴클레오티드 서열을 포함하는, 패키징 시스템.
52. 조항 5-45 중 어느 하나에 있어서, 헬퍼 바이러스 유전자가 UL5/8/52, ICP0, ICP4, ICP22 및 UL30/UL42로 이루어진 군으로부터 선택되는 헤르페스 바이러스로부터 유래된 유전자인, 패키징 시스템.
53. 조항 52에 있어서, 제2 핵산 벡터가 헬퍼 바이러스 유전자에 작동가능하게 연결된 전사 조절 요소를 추가로 포함하는, 패키징 시스템.
54. 조항 53에 있어서, 전사 조절 요소가 구성적 프로모터, 유도성 프로모터 및 천연 프로모터로 이루어진 군으로부터 선택되는 프로모터를 포함하는, 패키징 시스템.
55. 조항 54에 있어서, 프로모터가 RSV LTR 프로모터, CMV 즉시 초기 프로모터, SV40 프로모터, 디하이드로폴레이트 환원효소 프로모터, 세포질 β-액틴 프로모터, 포스포글리세레이트 키나제 (PGK) 프로모터, 메탈로티오닌 (MT) 프로모터, 마우스 유방 종양 바이러스 (MMTV) 프로모터, T7 프로모터, 엑디손 곤충 프로모터, 테트라사이클린-억압성 프로모터, 테트라사이클린-유도성 프로모터, RU486-유도성 프로모터 및 라파마이신-유도성 프로모터로 이루어진 군으로부터 선택되는, 패키징 시스템.
56. 조항 1-4 또는 9-44 중 어느 하나의 핵산 벡터, 또는 조항 5-55 중 어느 하나의 패키징 시스템을 포함하는, 숙주 세포.
57. 조항 56에 있어서, 숙주 세포가 포유동물 세포인, 숙주 세포.
58. 조항 57에 있어서, 포유동물 세포가 COS 세포, CHO 세포, BHK 세포, MDCK 세포, HEK293 세포, HEK293T 세포, HEK293F 세포, NS0 세포, PER.C6 세포, VERO 세포, CRL7O3O 세포, HsS78Bst 세포, HeLa 세포, NIH 3T3 세포, HepG2 세포, SP210 세포, R1.1 세포, B-W 세포, L-M 세포, BSC1 세포, BSC40 세포, YB/20 세포 및 BMT10 세포로 이루어진 군으로부터 선택되는, 숙주 세포.
59. 조항 57 또는 58에 있어서, 포유동물 세포가 HEK293 세포인, 숙주 세포.
60. rAAV의 재조합 제조 방법으로서, rAAV가 생산되는 조건 하에서 조항 5-55 중 어느 하나의 패키징 시스템을 포유동물 세포에 도입하는 단계를 포함하는, 방법.
61. 조항 60에 있어서, 제1 핵산 벡터 대 제2 핵산 벡터의 비율, 또는 제2 핵산 벡터 대 제1 핵산 벡터의 비율이 1:0.2, 1:0.4, 1:0.6, 1:0.8, 1:1, 1:2, 1:3 또는 1:4로 이루어진 군으로부터 선택되는, 방법.
62. 조항 60 또는 61에 있어서, 제1 핵산 벡터 대 제2 핵산 벡터의 비율, 또는 제2 핵산 벡터 대 제1 핵산 벡터의 비율이 1:2인, 방법.
63. 조항 60 또는 61에 있어서, 제1 핵산 벡터 대 제2 핵산 벡터의 비율, 또는 제2 핵산 벡터 대 제1 핵산 벡터의 비율이 1:0.2 내지 1:1인, 방법.
64. 조항 63에 있어서, 제1 핵산 벡터 대 제2 핵산 벡터의 비율, 또는 제2 핵산 벡터 대 제1 핵산 벡터의 비율이 1:0.6인, 방법.
65. 조항 63에 있어서, 제1 핵산 벡터 대 제2 핵산 벡터의 비율, 또는 제2 핵산 벡터 대 제1 핵산 벡터의 비율이 1:0.8인, 방법.
66. 조항 63에 있어서, 제1 핵산 벡터 대 제2 핵산 벡터의 비율, 또는 제2 핵산 벡터 대 제1 핵산 벡터의 비율이 1:1인, 방법.
67. 조항 60-66 중 어느 하나에 있어서, 방법이 패키징 시스템의 0.1 내지 4 μg의 DNA/1E6 세포를 도입하는 단계를 포함하는, 방법.
68. 조항 60-67 중 어느 하나에 있어서, 방법이 패키징 시스템의 0.5 내지 1 μg의 DNA/1E6 세포를 도입하는 단계를 포함하는, 방법.
69. 조항 60-68 중 어느 하나에 있어서, 방법이 패키징 시스템의 0.6, 0.7, 0.8, 0.9 또는 1 μg의 DNA/1E6 세포를 도입하는 단계를 포함하는, 방법.
70. 조항 60-68 중 어느 하나에 있어서, 방법이 패키징 시스템의 0.75 μg의 DNA/1E6 세포를 도입하는 단계를 포함하는, 방법.
71. 조항 60-70 중 어느 하나에 있어서, 방법이 (i) AAV Rep 단백질 및 AAV 캡시드 단백질을 코딩하는 뉴클레오티드 서열을 포함하는 제1 벡터; (ii) rAAV 게놈을 포함하는 제2 벡터; 및 (iii) 하나 이상의 헬퍼 바이러스 유전자를 포함하는 제3 벡터를 포함하는 포유동물 세포를 사용하여 rAAV를 생산하는 단계를 포함하는 방법과 비교하여 증가된 rAAV 역가를 초래하는, 방법.
72. 조항 60-70 중 어느 하나에 있어서, 방법이 (i) AAV Rep 단백질 및 AAV 캡시드 단백질을 코딩하는 뉴클레오티드 서열을 포함하는 제1 벡터; (ii) rAAV 게놈을 포함하는 제2 벡터; 및 (iii) 하나 이상의 헬퍼 바이러스 유전자를 포함하는 제3 벡터를 포함하는 포유동물 세포를 사용하여 rAAV를 생산하는 단계를 포함하는 방법과 비교하여 온전한 벡터 게놈의 증가된 백분율을 초래하는, 방법.
73. 조항 60-72 중 어느 하나에 있어서, 포유동물 세포가 COS 세포, CHO 세포, BHK 세포, MDCK 세포, HEK293 세포, HEK293T 세포, HEK293F 세포, NS0 세포, PER.C6 세포, VERO 세포, CRL7O3O 세포, HsS78Bst 세포, HeLa 세포, NIH 3T3 세포, HepG2 세포, SP210 세포, R1.1 세포, B-W 세포, L-M 세포, BSC1 세포, BSC40 세포, YB/20 세포 및 BMT10 세포로 이루어진 군으로부터 선택되는, 방법.
74. 조항 60-73 중 어느 하나에 있어서, 포유동물 세포가 HEK293 세포인, 방법.
75. 조항 60-74 중 어느 하나에 있어서, 포유동물 세포가 세포 배양물에서 항온처리되는, 방법.
76. 조항 56-59 중 어느 하나에 정의된 바와 같은 숙주 세포의 집단으로서, 숙주 세포가 세포 배양물로 제공되는, 숙주 세포의 집단.
77. 조항 75 또는 조항 76에 있어서, 세포 배양물이 2 리터 이상, 50 리터 이상 또는 2000 리터 이상의 부피를 갖는, 방법 또는 숙주 세포의 집단.
본 발명은 본원에 기재된 구체적인 실시양태에 의해 범주가 제한되지 않는다. 실제로, 기재된 것들 외에 본 발명의 다양한 변형이 전술한 설명 및 첨부 도면으로부터 당업자에게 명백해질 것이다. 이러한 변형은 첨부된 청구범위의 범주 내에 속하도록 의도된다.
본원에 인용된 모든 참고문헌 (예컨대, 공개물 또는 특허 또는 특허 출원)은 각각의 개별 참고문헌 (예컨대, 공개물 또는 특허 또는 특허 출원)이 모든 목적을 위해 그 전체가 참조로 원용되도록 구체적으로 그리고 개별적으로 표시된 것과 동일한 정도로 모든 목적을 위해 그 전체가 참조로 본원에 원용된다. 다른 실시양태는 다음의 청구범위 내에 있다.
SEQUENCE LISTING
<110> OXFORD BIOMEDICA SOLUTIONS LLC
<120> ADENO-ASSOCIATED VIRUS PACKAGING SYSTEMS
<130> G211157PM
<140> PCT/US2022/073138
<141> 2022-06-24
<150> US 63/202,817
<151> 2021-06-25
<150> US 63/262,218
<151> 2021-10-07
<150> US 63/266,646
<151> 2022-01-11
<160> 106
<170> PatentIn version 3.5
<210> 1
<211> 736
<212> PRT
<213> Artificial Sequence
<220>
<223> Adeno-associated virus 9
<400> 1
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 2
<211> 736
<212> PRT
<213> Artificial Sequence
<220>
<223> AAV isolate
<400> 2
Met Thr Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Gln Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 3
<211> 736
<212> PRT
<213> Artificial Sequence
<220>
<223> AAV isolate
<400> 3
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Gly Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Gly Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 4
<211> 736
<212> PRT
<213> Artificial Sequence
<220>
<223> AAV isolate
<400> 4
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Ile Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Tyr Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 5
<211> 736
<212> PRT
<213> Artificial Sequence
<220>
<223> AAV isolate
<400> 5
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Asp
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 6
<211> 736
<212> PRT
<213> Artificial Sequence
<220>
<223> AAV isolate
<400> 6
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Leu Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Ser Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 7
<211> 736
<212> PRT
<213> Artificial Sequence
<220>
<223> AAV isolate
<400> 7
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Arg Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 8
<211> 736
<212> PRT
<213> Artificial Sequence
<220>
<223> AAV isolate
<400> 8
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Val Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 9
<211> 736
<212> PRT
<213> Artificial Sequence
<220>
<223> AAV isolate
<400> 9
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Arg Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 10
<211> 736
<212> PRT
<213> Artificial Sequence
<220>
<223> AAV isolate
<400> 10
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Cys Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 11
<211> 736
<212> PRT
<213> Artificial Sequence
<220>
<223> AAV isolate
<400> 11
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Arg Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Lys Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 12
<211> 736
<212> PRT
<213> Artificial Sequence
<220>
<223> AAV isolate
<400> 12
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro His Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Asn
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Arg Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Met Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 13
<211> 736
<212> PRT
<213> Artificial Sequence
<220>
<223> AAV isolate
<400> 13
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Arg Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 14
<211> 0
<212> PRT
<213> Artificial Sequence
<220>
<223> AAV isolate
<400> 14
000
<210> 15
<211> 736
<212> PRT
<213> Artificial Sequence
<220>
<223> AAV isolate
<400> 15
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Arg Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Arg Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 16
<211> 736
<212> PRT
<213> Artificial Sequence
<220>
<223> AAV isolate
<400> 16
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Ala Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Arg Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 17
<211> 736
<212> PRT
<213> Artificial Sequence
<220>
<223> AAV isolate
<400> 17
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Ile Ala Trp Pro Arg Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Cys Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 18
<211> 365
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 18
ctagttatta atagtaatca attacggggt cattagttca tagcccatat atggagttcc 60
gcgttacata acttacggta aatggcccgc ctggctgacc gcccaacgac ccccgcccat 120
tgacgtcaat aatgacgtat gttcccatag taacgccaat agggactttc cattgacgtc 180
aatgggtgga gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc 240
caagtccgcc ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt 300
acatgacctt acgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta 360
ccatg 365
<210> 19
<211> 380
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 19
ggcattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 60
catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120
acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180
ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg gcagtacatc 240
aagtgtatca tatgccaagt ccgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300
ggcattatgc ccagtacatg accttacggg actttcctac ttggcagtac atctacgtat 360
tagtcatcgc tattaccatg 380
<210> 20
<211> 479
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 20
tcgaggtgag ccccacgttc tgcttcactc tccccatctc ccccccctcc ccacccccaa 60
ttttgtattt atttattttt taattatttt gtgcagcgat gggggcgggg gggggggggg 120
ggcgcgcgcc aggcggggcg gggcggggcg aggggcgggg cggggcgagg cggagaggtg 180
cggcggcagc caatcagagc ggcgcgctcc gaaagtttcc ttttatggcg aggcggcggc 240
ggcggcggcc ctataaaaag cgaagcgcgc ggcgggcggg agtcgctgcg cgctgccttc 300
gccccgtgcc ccgctccgcc gccgcctcgc gccgcccgcc ccggctctga ctgaccgcgt 360
tactcccaca ggtgagcggg cgggacggcc cttctcctcc gggctgtaat tagcgcttgg 420
tttaatgacg gcttgtttct tttctgtggc tgcgtgaaag ccttgagggg ctccgggag 479
<210> 21
<211> 1246
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 21
tcgaggtgag ccccacgttc tgcttcactc tccccatctc ccccccctcc ccacccccaa 60
ttttgtattt atttattttt taattatttt gtgcagcgat gggggcgggg gggggggggg 120
ggcgcgcgcc aggcggggcg gggcggggcg aggggcgggg cggggcgagg cggagaggtg 180
cggcggcagc caatcagagc ggcgcgctcc gaaagtttcc ttttatggcg aggcggcggc 240
ggcggcggcc ctataaaaag cgaagcgcgc ggcgggcggg agtcgctgcg cgctgccttc 300
gccccgtgcc ccgctccgcc gccgcctcgc gccgcccgcc ccggctctga ctgaccgcgt 360
tactcccaca ggtgagcggg cgggacggcc cttctcctcc gggctgtaat tagcgcttgg 420
tttaatgacg gcttgtttct tttctgtggc tgcgtgaaag ccttgagggg ctccgggagg 480
gccctttgtg cggggggagc ggctcggggg gtgcgtgcgt gtgtgtgtgc gtggggagcg 540
ccgcgtgcgg ctccgcgctg cccggcggct gtgagcgctg cgggcgcggc gcggggcttt 600
gtgcgctccg cagtgtgcgc gaggggagcg cggccggggg cggtgccccg cggtgcgggg 660
ggggctgcga ggggaacaaa ggctgcgtgc ggggtgtgtg cgtggggggg tgagcagggg 720
gtgtgggcgc gtcggtcggg ctgcaacccc ccctgcaccc ccctccccga gttgctgagc 780
acggcccggc ttcgggtgcg gggctccgta cggggcgtgg cgcggggctc gccgtgccgg 840
gcggggggtg gcggcaggtg ggggtgccgg gcggggcggg gccgcctcgg gccggggagg 900
gctcggggga ggggcgcggc ggcccccgga gcgccggcgg ctgtcgaggc gcggcgagcc 960
gcagccattg ccttttatgg taatcgtgcg agagggcgca gggacttcct ttgtcccaaa 1020
tctgtgcgga gccgaaatct gggaggcgcc gccgcacccc ctctagcggg cgcggggcga 1080
agcggtgcgg cgccggcagg aaggaaatgg gcggggaggg ccttcgtgcg tcgccgcgcc 1140
gccgtcccct tctccctctc cagcctcggg gctgtccgcg gggggacggc tgccttcggg 1200
ggggacgggg cagggcgggg ttcggcttct ggcgtgtgac cggcgg 1246
<210> 22
<211> 953
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 22
aattcggtac cctagttatt aatagtaatc aattacgggg tcattagttc atagcccata 60
tatggagttc cgcgttacat aacttacggt aaatggcccg cctggctgac cgcccaacga 120
cccccgccca ttgacgtcaa taatgacgta tgttcccata gtaacgccaa tagggacttt 180
ccattgacgt caatgggtgg actatttacg gtaaactgcc cacttggcag tacatcaagt 240
gtatcatatg ccaagtacgc cccctattga cgtcaatgac ggtaaatggc ccgcctggca 300
ttatgcccag tacatgacct tatgggactt tcctacttgg cagtacatct acgtattagt 360
catcgctatt accatggtcg aggtgagccc cacgttctgc ttcactctcc ccatctcccc 420
cccctcccca cccccaattt tgtatttatt tattttttaa ttattttgtg cagcgatggg 480
ggcggggggg gggggggggc gcgcgccagg cggggcgggg cggggcgagg ggcggggcgg 540
ggcgaggcgg agaggtgcgg cggcagccaa tcagagcggc gcgctccgaa agtttccttt 600
tatggcgagg cggcggcggc ggcggcccta taaaaagcga agcgcgcggc gggcgggagt 660
cgctgcgacg ctgccttcgc cccgtgcccc gctccgccgc cgcctcgcgc cgcccgcccc 720
ggctctgact gaccgcgtta ctcccacagg tgagcgggcg ggacggccct tctcctccgg 780
gctgtaatta gcgcttggtt taatgacggc ttgtttcttt tctgtggctg cgtgaaagcc 840
ttgaggggct ccgggagcta gagcctctgc taaccatgtt catgccttct tctttttcct 900
acagctcctg ggcaacgtgc tggttattgt gctgtctcat cattttggca aag 953
<210> 23
<211> 1168
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 23
cgtgaggctc cggtgcccgt cagtgggcag agcgcacatc gcccacagtc cccgagaagt 60
tggggggagg ggtcggcaat tgaaccggtg cctagagaag gtggcgcggg gtaaactggg 120
aaagtgatgt cgtgtactgg ctccgccttt ttcccgaggg tgggggagaa ccgtatataa 180
gtgcagtagt cgccgtgaac gttctttttc gcaacgggtt tgccgccaga acacaggtaa 240
gtgccgtgtg tggttcccgc gggcctggcc tctttacggg ttatggccct tgcgtgcctt 300
gaattacttc cacctggctc cagtacgtga ttcttgatcc cgagctggag ccaggggcgg 360
gccttgcgct ttaggagccc cttcgcctcg tgcttgagtt gaggcctggc ctgggcgctg 420
gggccgccgc gtgcgaatct ggtggcacct tcgcgcctgt ctcgctgctt tcgataagtc 480
tctagccatt taaaattttt gatgacctgc tgcgacgctt tttttctggc aagatagtct 540
tgtaaatgcg ggccaggatc tgcacactgg tatttcggtt tttggggccg cgggcggcga 600
cggggcccgt gcgtcccagc gcacatgttc ggcgaggcgg ggcctgcgag cgcggccacc 660
gagaatcgga cgggggtagt ctcaagctgg ccggcctgct ctggtgcctg gcctcgcgcc 720
gccgtgtatc gccccgccct gggcggcaag gctggcccgg tcggcaccag ttgcgtgagc 780
ggaaagatgg ccgcttcccg gccctgctcc agggggctca aaatggagga cgcggcgctc 840
gggagagcgg gcgggtgagt cacccacaca aaggaaaggg gcctttccgt cctcagccgt 900
cgcttcatgt gactccacgg agtaccgggc gccgtccagg cacctcgatt agttctggag 960
cttttggagt acgtcgtctt taggttgggg ggaggggttt tatgcgatgg agtttcccca 1020
cactgagtgg gtggagactg aagttaggcc agcttggcac ttgatgtaat tctccttgga 1080
atttgccctt tttgagtttg gatcttggtt cattctcaag cctcagacag tggttcaaag 1140
tttttttctt ccatttcagg tgtcgtga 1168
<210> 24
<211> 92
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 24
aagaggtaag ggtttaaggg atggttggtt ggtggggtat taatgtttaa ttacctggag 60
cacctgcctg aaatcacttt ttttcaggtt gg 92
<210> 25
<211> 79
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 25
aagaggtaag ggtttaaggg atggttggtt ggtggggtat taatgtttaa ttacctggag 60
cacctgcctg aaatcactt 79
<210> 26
<211> 95
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 26
cctctgctaa ccatgttcat gccttcttct ttttcctaca gctcctgggc aacgtgctgg 60
ttattgtgct gtctcatcat tttggcaaag aattc 95
<210> 27
<211> 90
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 27
cctctgctaa ccatgttcat gccttcttct ttttcctaca gctcctgggc aacgtgctgg 60
ttattgtgct gtctcatcat tttggcaaag 90
<210> 28
<211> 918
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 28
ggcatcctaa aaaatattca gtggaaacgt aaaaacatta aagactgatt aaacatcgca 60
gcatgacaca gatttagcaa ctgagcataa ataatttgac tcggatactg ctccaaaatc 120
cgaagaggac caatttcttc caggaggaca actacctcgt cctctgcaga cccctctcct 180
cggcagctga aggagtgtgg ccaatctgcc tccacctccc cgcggacccc ctactctcag 240
gacctcctgc agcaccccaa actggaagtg gccgctgcag acccaaggac gaggggcacg 300
cgggagccgg cagccctagt ggagcggttg gagatgttga ggtgggaggg tcacccaggt 360
ggggtgaggc tggggtaggt agcggagtga acggcttccg aagctctggg ccgcccccag 420
gttggactaa gcaggcgctc tgtcttcgcc cccgcccagg gtgggcgtct cctgaggact 480
ccccgccaca cctgacccga gaccgcgcgc ccagcctaga acgcttcccc gacccagcgt 540
agggccgccg cgactggcgg gcgagggtcg gcgggaggcc tggcgaaccc gggggcggga 600
ccaggcgggc aaggcccggc tgccgcagcg ccgctctgcg cgaggcggct ccgccgcggc 660
ggagggatac ggcgcaccat atatatatcg cggggcgcag actcgcgctc cggcagtggt 720
gctgggagtg tcgtggacgc cgtgccgtta ctcgtagtca ggcggcggcg caggcggcgg 780
cggcggcata gcgcacagcg cgccttagca gcagcagcag cagcagcggc atcggaggta 840
cccccgccgt cgcagccccc gcgctggtgc agccaccctc gctccctctg ctcttcctcc 900
cttcgctcgc accaagag 918
<210> 29
<211> 192
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 29
ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc 60
tgaccttgga gctggggcag aggtcagaga cctctctggg cccatgccac ctccaacatc 120
cactcgaccc cttggaattt cggtggagag gagcagaggt tgtcctggcg tggtttaggt 180
agtgtgagag gg 192
<210> 30
<211> 205
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 30
aatgactcct ttcggtaagt gcagtggaag ctgtacactg cccaggcaaa gcgtccgggc 60
agcgtaggcg ggcgactcag atcccagcca gtggacttag cccctgtttg ctcctccgat 120
aactggggtg accttggtta atattcacca gcagcctccc ccgttgcccc tctggatcca 180
ctgcttaaat acggacgagg acagg 205
<210> 31
<211> 913
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 31
tagggaggtc ctgcacagaa ggggaggagg gggcagcagc tgtctgacca ctgttggtct 60
tgcaacttgt gtccccaggt taatttttaa aaagcagtca aaagtccaag tggcccttgg 120
cagcatttac tctctctgtt tgctctggtt aataatctca ggagcacaaa cattcctgga 180
ggcaggagaa gaaatcaaca tcctggactt atcctctggg cctctcccca cccccaggat 240
tgtaactgaa atgcttcact ggtgctcctt ttgttttaag gcattggatc ttcatagcta 300
ctgatcgtgc ccaagcacac agtatctgca gcaaccactt aggcctccag gaatgtggtg 360
accattgacc ctaattcatt ccccttcatg gatcctatgt aaccatcctc caaaaagagc 420
tttcgcaaac tcaaataaac acaggaaagg aagaccttct tatctttgag agtatatgtt 480
tagccctata gctctaaccc actctgatct cccagggcgg cagtaagtct tcagcatcag 540
gcattttggg gtgactcagt aaatggtaga tcttgctacc agtggaacag ccactaagga 600
ttctgcagtg agagcagagg gccagctaag tggtactctc ccagagactg tctgactcac 660
gccaccccct ccaccttgga cacaggacgc tgtggtttct gagccaggta caatgactcc 720
tttcggtaag tgcagtggaa gctgtacact gcccaggcaa agcgtccggg cagcgtaggc 780
gggcgactca gatcccagcc agtggactta gcccctgttt gctcctccga taactggggt 840
gaccttggtt aatattcacc agcagcctcc cccgttgccc ctctggatcc actgcttaaa 900
tacggacgag gac 913
<210> 32
<211> 423
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 32
gctctaaccc actctgatct cccagggcgg cagtaagtct tcagcatcag gcattttggg 60
gtgactcagt aaatggtaga tcttgctacc agtggaacag ccactaagga ttctgcagtg 120
agagcagagg gccagctaag tggtactctc ccagagactg tctgactcac gccaccccct 180
ccaccttgga cacaggacgc tgtggtttct gagccaggta caatgactcc tttcggtaag 240
tgcagtggaa gctgtacact gcccaggcaa agcgtccggg cagcgtaggc gggcgactca 300
gatcccagcc agtggactta gcccctgttt gctcctccga taactggggt gaccttggtt 360
aatattcacc agcagcctcc cccgttgccc ctctggatcc actgcttaaa tacggacgag 420
gac 423
<210> 33
<211> 592
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 33
gtaaatttta tggaatgtga atcataattc aatttttcaa catgcgttag gagggacatt 60
tcaaactctt ttttacccta gactttccta ccatcaccca gagtatccag ccaggagggg 120
aggggctaga gacaccagaa gtttagcagg gaggagggcg tagggattcg gggaatgaag 180
ggatgggatt cagactaggg ccaggaccca gggatggaga gaaagagatg agagtggttt 240
gggggcttgg tgacttagag aacagagctg caggctcaga ggcacacagg agtttctggg 300
ctcaccctgc ccccttccaa cccctcagtt cccatcctcc agcagctgtt tgtgtgctgc 360
ctctgaagtc cacactgaac aaacttcagc ctactcatgt ccctaaaatg ggcaaacatt 420
gcaagcagca aacagcaaac acacagccct ccctgcctgc tgaccttgga gctggggcag 480
aggtcagaga cctctctggg cccatgccac ctccaacatc cactcgaccc cttggaattt 540
cggtggagag gagcagaggt tgtcctggcg tggtttaggt agtgtgagag gg 592
<210> 34
<211> 72
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 34
gggggaggct gctggtgaat attaaccaag gtcaccccag ttatcggagg agcaaacagg 60
ggctaagtcc ac 72
<210> 35
<211> 170
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 35
cgatgctcta atctctctag acaaggttca tatttgtatg ggttacttat tctctctttg 60
ttgactaagt caataatcag aatcagcagg tttgcagtca gattggcagg gataagcagc 120
ctagctcagg agaagtgagt ataaaagccc caggctggga gcagccatca 170
<210> 36
<211> 1873
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 36
gatcttcaat attggccatt agccatatta ttcattggtt atatagcata aatcaatatt 60
ggctattggc cattgcatac gttgtatcta tatcataata tgtacattta tattggctca 120
tgtccaatat gaccgccatg ttggcattga ttattgacta gttattaata gtaatcaatt 180
acggggtcat tagttcatag cccatatatg gagttccgcg ttacataact tacggtaaat 240
ggcccgcctg gctgaccgcc caacgacccc cgcccattga cgtcaataat gacgtatgtt 300
cccatagtaa cgccaatagg gactttccat tgacgtcaat gggtggagta tttacggtaa 360
actgcccact tggcagtaca tcaagtgtat catatgccaa gtccgccccc tattgacgtc 420
aatgacggta aatggcccgc ctggcattat gcccagtaca tgaccttacg ggactttcct 480
acttggcagt acatctacgt attagtcatc gctattacca tggtcgaggt gagccccacg 540
ttctgcttca ctctccccat ctcccccccc tccccacccc caattttgta tttatttatt 600
ttttaattat tttgtgcagc gatgggggcg gggggggggg gggggcgcgc gccaggcggg 660
gcggggcggg gcgaggggcg gggcggggcg aggcggagag gtgcggcggc agccaatcag 720
agcggcgcgc tccgaaagtt tccttttatg gcgaggcggc ggcggcggcg gccctataaa 780
aagcgaagcg cgcggcgggc gggagtcgct gcgacgctgc cttcgccccg tgccccgctc 840
cgccgccgcc tcgcgccgcc cgccccggct ctgactgacc gcgttactcc cacaggtgag 900
cgggcgggac ggcccttctc ctccgggctg taattagcgc ttggtttaat gacggcttgt 960
ttcttttctg tggctgcgtg aaagccttga ggggctccgg gagggccctt tgtgcggggg 1020
ggagcggctc ggggggtgcg tgcgtgtgtg tgtgcgtggg gagcgccgcg tgcggcccgc 1080
gctgcccggc ggctgtgagc gctgcgggcg cggcgcgggg ctttgtgcgc tccgcagtgt 1140
gcgcgagggg agcgcggccg ggggcggtgc cccgcggtgc ggggggggct gcgaggggaa 1200
caaaggctgc gtgcggggtg tgtgcgtggg ggggtgagca gggggtgtgg gcgcggcggt 1260
cgggctgtaa cccccccctg cacccccctc cccgagttgc tgagcacggc ccggcttcgg 1320
gtgcggggct ccgtacgggg cgtggcgcgg ggctcgccgt gccgggcggg gggtggcggc 1380
aggtgggggt gccgggcggg gcggggccgc ctcgggccgg ggagggctcg ggggaggggc 1440
gcggcggccc ccggagcgcc ggcggctgtc gaggcgcggc gagccgcagc cattgccttt 1500
tatggtaatc gtgcgagagg gcgcagggac ttcctttgtc ccaaatctgt gcggagccga 1560
aatctgggag gcgccgccgc accccctcta gcgggcgcgg ggcgaagcgg tgcggcgccg 1620
gcaggaagga aatgggcggg gagggccttc gtgcgtcgcc gcgccgccgt ccccttctcc 1680
ctctccagcc tcggggctgt ccgcgggggg acggctgcct tcggggggga cggggcaggg 1740
cggggttcgg cttctggcgt gtgaccggcg gctctagagc ctctgctaac catgttcatg 1800
ccttcttctt tttcctacag ctcctgggca acgtgctggt tattgtgctg tctcatcatt 1860
ttggcaaaga att 1873
<210> 37
<211> 1061
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 37
tagggaggtc ctgcacgtta cataacttac ggtaaatggc ccgcctggct gaccgcccaa 60
cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc caatagggac 120
tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg cagtacatca 180
agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat ggcccgcctg 240
gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca tctacgtatt 300
agtcatcgct attaccatgg tcgaggtgag ccccacgttc tgcttcactc tccccatctc 360
ccccccctcc ccacccccaa ttttgtattt atttattttt taattatttt gtgcagcgat 420
gggggcgggg gggggggggg gcgcgcgcca ggcggggcgg ggcggggcga ggggcggggc 480
ggggcgaggc ggagaggtgc ggcggcagcc aatcagagcg gcgcgctccg aaagtttcct 540
tttatggcga ggcggcggcg gcggcggccc tataaaaagc gaagcgcgcg gcgggcggga 600
gtcgctgcgc gctgccttcg ccccgtgccc cgctccgccg ccgcctcgcg ccgcccgccc 660
cggctctgac tgaccgcgtt actaaaacag gtaagtccgg cctccgcgcc gggttttggc 720
gcctcccgcg ggcgcccccc tcctcacggc gagcgctgcc acgtcagacg aagggcgcag 780
cgagcgtcct gatccttccg cccggacgct caggacagcg gcccgctgct cataagactc 840
ggccttagaa ccccagtatc agcagaagga cattttagga cgggacttgg gtgactctag 900
ggcactggtt ttctttccag agagcggaac aggcgaggaa aagtagtccc ttctcggcga 960
ttctgcggag ggatctccgt ggggcggtga acgccgatga tgcctctact aaccatgttc 1020
atgttttctt tttttttcta caggtcctgg gtgacgaaca g 1061
<210> 38
<211> 398
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 38
ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc 60
tgaccttgga gctggggcag aggtcagaga cctctctggg cccatgccac ctccaacatc 120
cactcgaccc cttggaattt cggtggagag gagcagaggt tgtcctggcg tggtttaggt 180
agtgtgagag gggaatgact cctttcggta agtgcagtgg aagctgtaca ctgcccaggc 240
aaagcgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact tagcccctgt 300
ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct cccccgttgc 360
ccctctggat ccactgctta aatacggacg aggacagg 398
<210> 39
<211> 145
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 39
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcct 145
<210> 40
<211> 145
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 40
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120
gagcgcgcag agagggagtg gccaa 145
<210> 41
<211> 106
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 41
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtgg 106
<210> 42
<211> 167
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 42
ctctcccccc tgtcgcgttc gctcgctcgc tggctcgttt gggggggtgg cagctcaaag 60
agctgccaga cgacggccct ctggccgtcg cccccccaaa cgagccagcg agcgagcgaa 120
cgcgacaggg gggagagtgc cacactctca agcaaggggg ttttgta 167
<210> 43
<211> 167
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 43
tacaaaacct ccttgcttga gagtgtggca ctctcccccc tgtcgcgttc gctcgctcgc 60
tggctcgttt gggggggtgg cagctcaaag agctgccaga cgacggccct ctggccgtcg 120
cccccccaaa cgagccagcg agcgagcgaa cgcgacaggg gggagag 167
<210> 44
<211> 143
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 44
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120
gagcgcgcag agagggagtg gcc 143
<210> 45
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 45
ggaggggtgg agtcgtgacg tgaattacgt catagggtta gggagg 46
<210> 46
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 46
gtagataagt agcatggcgg gttaatcatt aactaca 37
<210> 47
<211> 96
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 47
tcctgtatta gaggtcacgt gagtgttttg cgacattttg cgacaccatg tggtcacgct 60
gggtatttaa gcccgagtga gcacgcaggg tctcca 96
<210> 48
<211> 135
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 48
gtcacaaaga ccagaaatgg cgccggaggc gggaacaagg tggtggatga gtgctacatc 60
cccaattact tgctccccaa aacccagcct gagctccagt gggcgtggac taatatggaa 120
cagtatttaa gcgcc 135
<210> 49
<211> 154
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 49
ggtcaccaag caggaagtca aagacttttt ccggtgggca aaggatcacg tggttgaggt 60
ggagcatgaa ttctacgtca aaaagggtgg agccaagaaa agacccgccc ccagtgacgc 120
agatataagt gagcccaaac gggtgcgcga gtca 154
<210> 50
<211> 1866
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 50
atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60
ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120
tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180
cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240
caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300
aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360
taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420
gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480
acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540
aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600
gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660
tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720
cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780
tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840
cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900
attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960
acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020
accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080
aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140
aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200
gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260
aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320
ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380
gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440
gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500
gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560
gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620
aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680
ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740
tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800
ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860
caataa 1866
<210> 51
<211> 1995
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 51
tcctgtatta gaggtcacgt gagtgttttg cgacattttg cgacaccatg tggtcacgct 60
gggtatttaa gcccgagtga gcacgcaggg tctccatttt gaagcgggag gtttgaacgc 120
gcagccgcca tgccggggtt ttacgagatt gtgattaagg tccccagcga ccttgacgag 180
catctgcccg gcatttctga cagctttgtg aactgggtgg ccgagaagga atgggagttg 240
ccgccagatt ctgacatgga tctgaatctg attgagcagg cacccctgac cgtggccgag 300
aagctgcagc gcgactttct gacggaatgg cgccgtgtga gtaaggcccc ggaggccctt 360
ttctttgtgc aatttgagaa gggagagagc tacttccaca tgcacgtgct cgtggaaacc 420
accggggtga aatccatggt tttgggacgt ttcctgagtc agattcgcga aaaactgatt 480
cagagaattt accgcgggat cgagccgact ttgccaaact ggttcgcggt cacaaagacc 540
agaaatggcg ccggaggcgg gaacaaggtg gtggatgagt gctacatccc caattacttg 600
ctccccaaaa cccagcctga gctccagtgg gcgtggacta atatggaaca gtatttaagc 660
gcctgtttga atctcacgga gcgtaaacgg ttggtggcgc agcatctgac gcacgtgtcg 720
cagacgcagg agcagaacaa agagaatcag aatcccaatt ctgatgcgcc ggtgatcaga 780
tcaaaaactt cagccaggta catggagctg gtcgggtggc tcgtggacaa ggggattacc 840
tcggagaagc agtggatcca ggaggaccag gcctcataca tctccttcaa tgcggcctcc 900
aactcgcggt cccaaatcaa ggctgccttg gacaatgcgg gaaagattat gagcctgact 960
aaaaccgccc ccgactacct ggtgggccag cagcccgtgg aggacatttc cagcaatcgg 1020
atttataaaa ttttggaact aaacgggtac gatccccaat atgcggcttc cgtctttctg 1080
ggatgggcca cgaaaaagtt cggcaagagg aacaccatct ggctgtttgg gcctgcaact 1140
accgggaaga ccaacatcgc ggaggccata gcccacactg tgcccttcta cgggtgcgta 1200
aactggacca atgagaactt tcccttcaac gactgtgtcg acaagatggt gatctggtgg 1260
gaggagggga agatgaccgc caaggtcgtg gagtcggcca aagccattct cggaggaagc 1320
aaggtgcgcg tggaccagaa atgcaagtcc tcggcccaga tagacccgac tcccgtgatc 1380
gtcacctcca acaccaacat gtgcgccgtg attgacggga actcaacgac cttcgaacac 1440
cagcagccgt tgcaagaccg gatgttcaaa tttgaactca cccgccgtct ggatcatgac 1500
tttgggaagg tcaccaagca ggaagtcaaa gactttttcc ggtgggcaaa ggatcacgtg 1560
gttgaggtgg agcatgaatt ctacgtcaaa aagggtggag ccaagaaaag acccgccccc 1620
agtgacgcag atataagtga gcccaaacgg gtgcgcgagt cagttgcgca gccatcgacg 1680
tcagacgcgg aagcttcgat caactacgca gacaggtacc aaaacaaatg ttctcgtcac 1740
gtgggcatga atctgatgct gtttccctgc agacaatgcg agagaatgaa tcagaattca 1800
aatatctgct tcactcacgg acagaaagac tgtttagagt gctttcccgt gtcagaatct 1860
caacccgttt ctgtcgtcaa aaaggcgtat cagaaactgt gctacattca tcatatcatg 1920
ggaaaggtgc cagacgcttg cactgcctgc gatctggtca atgtggattt ggatgactgc 1980
atctttgaac aataa 1995
<210> 52
<211> 1930
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 52
atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60
ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120
tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180
cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240
caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300
aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360
taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420
gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480
acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540
aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600
gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660
tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720
cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780
tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840
cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900
attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960
acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020
accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080
aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140
aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200
gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260
aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320
ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380
gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440
gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500
gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560
gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620
aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680
ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740
tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800
ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860
caataaatga cttaaaccag gtatggctgc cgatggttat cttccagatt ggctcgagga 1920
caaccttagt 1930
<210> 53
<211> 2059
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 53
tcctgtatta gaggtcacgt gagtgttttg cgacattttg cgacaccatg tggtcacgct 60
gggtatttaa gcccgagtga gcacgcaggg tctccatttt gaagcgggag gtttgaacgc 120
gcagccgcca tgccggggtt ttacgagatt gtgattaagg tccccagcga ccttgacgag 180
catctgcccg gcatttctga cagctttgtg aactgggtgg ccgagaagga atgggagttg 240
ccgccagatt ctgacatgga tctgaatctg attgagcagg cacccctgac cgtggccgag 300
aagctgcagc gcgactttct gacggaatgg cgccgtgtga gtaaggcccc ggaggccctt 360
ttctttgtgc aatttgagaa gggagagagc tacttccaca tgcacgtgct cgtggaaacc 420
accggggtga aatccatggt tttgggacgt ttcctgagtc agattcgcga aaaactgatt 480
cagagaattt accgcgggat cgagccgact ttgccaaact ggttcgcggt cacaaagacc 540
agaaatggcg ccggaggcgg gaacaaggtg gtggatgagt gctacatccc caattacttg 600
ctccccaaaa cccagcctga gctccagtgg gcgtggacta atatggaaca gtatttaagc 660
gcctgtttga atctcacgga gcgtaaacgg ttggtggcgc agcatctgac gcacgtgtcg 720
cagacgcagg agcagaacaa agagaatcag aatcccaatt ctgatgcgcc ggtgatcaga 780
tcaaaaactt cagccaggta catggagctg gtcgggtggc tcgtggacaa ggggattacc 840
tcggagaagc agtggatcca ggaggaccag gcctcataca tctccttcaa tgcggcctcc 900
aactcgcggt cccaaatcaa ggctgccttg gacaatgcgg gaaagattat gagcctgact 960
aaaaccgccc ccgactacct ggtgggccag cagcccgtgg aggacatttc cagcaatcgg 1020
atttataaaa ttttggaact aaacgggtac gatccccaat atgcggcttc cgtctttctg 1080
ggatgggcca cgaaaaagtt cggcaagagg aacaccatct ggctgtttgg gcctgcaact 1140
accgggaaga ccaacatcgc ggaggccata gcccacactg tgcccttcta cgggtgcgta 1200
aactggacca atgagaactt tcccttcaac gactgtgtcg acaagatggt gatctggtgg 1260
gaggagggga agatgaccgc caaggtcgtg gagtcggcca aagccattct cggaggaagc 1320
aaggtgcgcg tggaccagaa atgcaagtcc tcggcccaga tagacccgac tcccgtgatc 1380
gtcacctcca acaccaacat gtgcgccgtg attgacggga actcaacgac cttcgaacac 1440
cagcagccgt tgcaagaccg gatgttcaaa tttgaactca cccgccgtct ggatcatgac 1500
tttgggaagg tcaccaagca ggaagtcaaa gactttttcc ggtgggcaaa ggatcacgtg 1560
gttgaggtgg agcatgaatt ctacgtcaaa aagggtggag ccaagaaaag acccgccccc 1620
agtgacgcag atataagtga gcccaaacgg gtgcgcgagt cagttgcgca gccatcgacg 1680
tcagacgcgg aagcttcgat caactacgca gacaggtacc aaaacaaatg ttctcgtcac 1740
gtgggcatga atctgatgct gtttccctgc agacaatgcg agagaatgaa tcagaattca 1800
aatatctgct tcactcacgg acagaaagac tgtttagagt gctttcccgt gtcagaatct 1860
caacccgttt ctgtcgtcaa aaaggcgtat cagaaactgt gctacattca tcatatcatg 1920
ggaaaggtgc cagacgcttg cactgcctgc gatctggtca atgtggattt ggatgactgc 1980
atctttgaac aataaatgac ttaaaccagg tatggctgcc gatggttatc ttccagattg 2040
gctcgaggac aaccttagt 2059
<210> 54
<211> 1258
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 54
atggagctgg tcgggtggct cgtggacaag gggattacct cggagaagca gtggatccag 60
gaggaccagg cctcatacat ctccttcaat gcggcctcca actcgcggtc ccaaatcaag 120
gctgccttgg acaatgcggg aaagattatg agcctgacta aaaccgcccc cgactacctg 180
gtgggccagc agcccgtgga ggacatttcc agcaatcgga tttataaaat tttggaacta 240
aacgggtacg atccccaata tgcggcttcc gtctttctgg gatgggccac gaaaaagttc 300
ggcaagagga acaccatctg gctgtttggg cctgcaacta ccgggaagac caacatcgcg 360
gaggccatag cccacactgt gcccttctac gggtgcgtaa actggaccaa tgagaacttt 420
cccttcaacg actgtgtcga caagatggtg atctggtggg aggaggggaa gatgaccgcc 480
aaggtcgtgg agtcggccaa agccattctc ggaggaagca aggtgcgcgt ggaccagaaa 540
tgcaagtcct cggcccagat agacccgact cccgtgatcg tcacctccaa caccaacatg 600
tgcgccgtga ttgacgggaa ctcaacgacc ttcgaacacc agcagccgtt gcaagaccgg 660
atgttcaaat ttgaactcac ccgccgtctg gatcatgact ttgggaaggt caccaagcag 720
gaagtcaaag actttttccg gtgggcaaag gatcacgtgg ttgaggtgga gcatgaattc 780
tacgtcaaaa agggtggagc caagaaaaga cccgccccca gtgacgcaga tataagtgag 840
cccaaacggg tgcgcgagtc agttgcgcag ccatcgacgt cagacgcgga agcttcgatc 900
aactacgcag acaggtacca aaacaaatgt tctcgtcacg tgggcatgaa tctgatgctg 960
tttccctgca gacaatgcga gagaatgaat cagaattcaa atatctgctt cactcacgga 1020
cagaaagact gtttagagtg ctttcccgtg tcagaatctc aacccgtttc tgtcgtcaaa 1080
aaggcgtatc agaaactgtg ctacattcat catatcatgg gaaaggtgcc agacgcttgc 1140
actgcctgcg atctggtcaa tgtggatttg gatgactgca tctttgaaca ataaatgact 1200
taaaccaggt atggctgccg atggttatct tccagattgg ctcgaggaca accttagt 1258
<210> 55
<211> 1531
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 55
gtcacaaaga ccagaaatgg cgccggaggc gggaacaagg tggtggatga gtgctacatc 60
cccaattact tgctccccaa aacccagcct gagctccagt gggcgtggac taatatggaa 120
cagtatttaa gcgcctgttt gaatctcacg gagcgtaaac ggttggtggc gcagcatctg 180
acgcacgtgt cgcagacgca ggagcagaac aaagagaatc agaatcccaa ttctgatgcg 240
ccggtgatca gatcaaaaac ttcagccagg tacatggagc tggtcgggtg gctcgtggac 300
aaggggatta cctcggagaa gcagtggatc caggaggacc aggcctcata catctccttc 360
aatgcggcct ccaactcgcg gtcccaaatc aaggctgcct tggacaatgc gggaaagatt 420
atgagcctga ctaaaaccgc ccccgactac ctggtgggcc agcagcccgt ggaggacatt 480
tccagcaatc ggatttataa aattttggaa ctaaacgggt acgatcccca atatgcggct 540
tccgtctttc tgggatgggc cacgaaaaag ttcggcaaga ggaacaccat ctggctgttt 600
gggcctgcaa ctaccgggaa gaccaacatc gcggaggcca tagcccacac tgtgcccttc 660
tacgggtgcg taaactggac caatgagaac tttcccttca acgactgtgt cgacaagatg 720
gtgatctggt gggaggaggg gaagatgacc gccaaggtcg tggagtcggc caaagccatt 780
ctcggaggaa gcaaggtgcg cgtggaccag aaatgcaagt cctcggccca gatagacccg 840
actcccgtga tcgtcacctc caacaccaac atgtgcgccg tgattgacgg gaactcaacg 900
accttcgaac accagcagcc gttgcaagac cggatgttca aatttgaact cacccgccgt 960
ctggatcatg actttgggaa ggtcaccaag caggaagtca aagacttttt ccggtgggca 1020
aaggatcacg tggttgaggt ggagcatgaa ttctacgtca aaaagggtgg agccaagaaa 1080
agacccgccc ccagtgacgc agatataagt gagcccaaac gggtgcgcga gtcagttgcg 1140
cagccatcga cgtcagacgc ggaagcttcg atcaactacg cagacaggta ccaaaacaaa 1200
tgttctcgtc acgtgggcat gaatctgatg ctgtttccct gcagacaatg cgagagaatg 1260
aatcagaatt caaatatctg cttcactcac ggacagaaag actgtttaga gtgctttccc 1320
gtgtcagaat ctcaacccgt ttctgtcgtc aaaaaggcgt atcagaaact gtgctacatt 1380
catcatatca tgggaaaggt gccagacgct tgcactgcct gcgatctggt caatgtggat 1440
ttggatgact gcatctttga acaataaatg acttaaacca ggtatggctg ccgatggtta 1500
tcttccagat tggctcgagg acaaccttag t 1531
<210> 56
<211> 1194
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 56
atggagctgg tcgggtggct cgtggacaag gggattacct cggagaagca gtggatccag 60
gaggaccagg cctcatacat ctccttcaat gcggcctcca actcgcggtc ccaaatcaag 120
gctgccttgg acaatgcggg aaagattatg agcctgacta aaaccgcccc cgactacctg 180
gtgggccagc agcccgtgga ggacatttcc agcaatcgga tttataaaat tttggaacta 240
aacgggtacg atccccaata tgcggcttcc gtctttctgg gatgggccac gaaaaagttc 300
ggcaagagga acaccatctg gctgtttggg cctgcaacta ccgggaagac caacatcgcg 360
gaggccatag cccacactgt gcccttctac gggtgcgtaa actggaccaa tgagaacttt 420
cccttcaacg actgtgtcga caagatggtg atctggtggg aggaggggaa gatgaccgcc 480
aaggtcgtgg agtcggccaa agccattctc ggaggaagca aggtgcgcgt ggaccagaaa 540
tgcaagtcct cggcccagat agacccgact cccgtgatcg tcacctccaa caccaacatg 600
tgcgccgtga ttgacgggaa ctcaacgacc ttcgaacacc agcagccgtt gcaagaccgg 660
atgttcaaat ttgaactcac ccgccgtctg gatcatgact ttgggaaggt caccaagcag 720
gaagtcaaag actttttccg gtgggcaaag gatcacgtgg ttgaggtgga gcatgaattc 780
tacgtcaaaa agggtggagc caagaaaaga cccgccccca gtgacgcaga tataagtgag 840
cccaaacggg tgcgcgagtc agttgcgcag ccatcgacgt cagacgcgga agcttcgatc 900
aactacgcag acaggtacca aaacaaatgt tctcgtcacg tgggcatgaa tctgatgctg 960
tttccctgca gacaatgcga gagaatgaat cagaattcaa atatctgctt cactcacgga 1020
cagaaagact gtttagagtg ctttcccgtg tcagaatctc aacccgtttc tgtcgtcaaa 1080
aaggcgtatc agaaactgtg ctacattcat catatcatgg gaaaggtgcc agacgcttgc 1140
actgcctgcg atctggtcaa tgtggatttg gatgactgca tctttgaaca ataa 1194
<210> 57
<211> 1467
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 57
gtcacaaaga ccagaaatgg cgccggaggc gggaacaagg tggtggatga gtgctacatc 60
cccaattact tgctccccaa aacccagcct gagctccagt gggcgtggac taatatggaa 120
cagtatttaa gcgcctgttt gaatctcacg gagcgtaaac ggttggtggc gcagcatctg 180
acgcacgtgt cgcagacgca ggagcagaac aaagagaatc agaatcccaa ttctgatgcg 240
ccggtgatca gatcaaaaac ttcagccagg tacatggagc tggtcgggtg gctcgtggac 300
aaggggatta cctcggagaa gcagtggatc caggaggacc aggcctcata catctccttc 360
aatgcggcct ccaactcgcg gtcccaaatc aaggctgcct tggacaatgc gggaaagatt 420
atgagcctga ctaaaaccgc ccccgactac ctggtgggcc agcagcccgt ggaggacatt 480
tccagcaatc ggatttataa aattttggaa ctaaacgggt acgatcccca atatgcggct 540
tccgtctttc tgggatgggc cacgaaaaag ttcggcaaga ggaacaccat ctggctgttt 600
gggcctgcaa ctaccgggaa gaccaacatc gcggaggcca tagcccacac tgtgcccttc 660
tacgggtgcg taaactggac caatgagaac tttcccttca acgactgtgt cgacaagatg 720
gtgatctggt gggaggaggg gaagatgacc gccaaggtcg tggagtcggc caaagccatt 780
ctcggaggaa gcaaggtgcg cgtggaccag aaatgcaagt cctcggccca gatagacccg 840
actcccgtga tcgtcacctc caacaccaac atgtgcgccg tgattgacgg gaactcaacg 900
accttcgaac accagcagcc gttgcaagac cggatgttca aatttgaact cacccgccgt 960
ctggatcatg actttgggaa ggtcaccaag caggaagtca aagacttttt ccggtgggca 1020
aaggatcacg tggttgaggt ggagcatgaa ttctacgtca aaaagggtgg agccaagaaa 1080
agacccgccc ccagtgacgc agatataagt gagcccaaac gggtgcgcga gtcagttgcg 1140
cagccatcga cgtcagacgc ggaagcttcg atcaactacg cagacaggta ccaaaacaaa 1200
tgttctcgtc acgtgggcat gaatctgatg ctgtttccct gcagacaatg cgagagaatg 1260
aatcagaatt caaatatctg cttcactcac ggacagaaag actgtttaga gtgctttccc 1320
gtgtcagaat ctcaacccgt ttctgtcgtc aaaaaggcgt atcagaaact gtgctacatt 1380
catcatatca tgggaaaggt gccagacgct tgcactgcct gcgatctggt caatgtggat 1440
ttggatgact gcatctttga acaataa 1467
<210> 58
<211> 1930
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 58
atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60
ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120
tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180
cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240
caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300
aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360
taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420
gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480
acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540
aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600
gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660
tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720
cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780
tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840
cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900
attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960
acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020
accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080
aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140
aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200
gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260
aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320
ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380
gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440
gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500
gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560
gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620
aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680
ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740
tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800
ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860
caataaatga cttaaaccag gtatggctgc cgatggttat cttccagatt ggctcgagga 1920
caaccttagt 1930
<210> 59
<211> 2059
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 59
tcctgtatta gaggtcacgt gagtgttttg cgacattttg cgacaccatg tggtcacgct 60
gggtatttaa gcccgagtga gcacgcaggg tctccatttt gaagcgggag gtttgaacgc 120
gcagccgcca tgccggggtt ttacgagatt gtgattaagg tccccagcga ccttgacgag 180
catctgcccg gcatttctga cagctttgtg aactgggtgg ccgagaagga atgggagttg 240
ccgccagatt ctgacatgga tctgaatctg attgagcagg cacccctgac cgtggccgag 300
aagctgcagc gcgactttct gacggaatgg cgccgtgtga gtaaggcccc ggaggccctt 360
ttctttgtgc aatttgagaa gggagagagc tacttccaca tgcacgtgct cgtggaaacc 420
accggggtga aatccatggt tttgggacgt ttcctgagtc agattcgcga aaaactgatt 480
cagagaattt accgcgggat cgagccgact ttgccaaact ggttcgcggt cacaaagacc 540
agaaatggcg ccggaggcgg gaacaaggtg gtggatgagt gctacatccc caattacttg 600
ctccccaaaa cccagcctga gctccagtgg gcgtggacta atatggaaca gtatttaagc 660
gcctgtttga atctcacgga gcgtaaacgg ttggtggcgc agcatctgac gcacgtgtcg 720
cagacgcagg agcagaacaa agagaatcag aatcccaatt ctgatgcgcc ggtgatcaga 780
tcaaaaactt cagccaggta catggagctg gtcgggtggc tcgtggacaa ggggattacc 840
tcggagaagc agtggatcca ggaggaccag gcctcataca tctccttcaa tgcggcctcc 900
aactcgcggt cccaaatcaa ggctgccttg gacaatgcgg gaaagattat gagcctgact 960
aaaaccgccc ccgactacct ggtgggccag cagcccgtgg aggacatttc cagcaatcgg 1020
atttataaaa ttttggaact aaacgggtac gatccccaat atgcggcttc cgtctttctg 1080
ggatgggcca cgaaaaagtt cggcaagagg aacaccatct ggctgtttgg gcctgcaact 1140
accgggaaga ccaacatcgc ggaggccata gcccacactg tgcccttcta cgggtgcgta 1200
aactggacca atgagaactt tcccttcaac gactgtgtcg acaagatggt gatctggtgg 1260
gaggagggga agatgaccgc caaggtcgtg gagtcggcca aagccattct cggaggaagc 1320
aaggtgcgcg tggaccagaa atgcaagtcc tcggcccaga tagacccgac tcccgtgatc 1380
gtcacctcca acaccaacat gtgcgccgtg attgacggga actcaacgac cttcgaacac 1440
cagcagccgt tgcaagaccg gatgttcaaa tttgaactca cccgccgtct ggatcatgac 1500
tttgggaagg tcaccaagca ggaagtcaaa gactttttcc ggtgggcaaa ggatcacgtg 1560
gttgaggtgg agcatgaatt ctacgtcaaa aagggtggag ccaagaaaag acccgccccc 1620
agtgacgcag atataagtga gcccaaacgg gtgcgcgagt cagttgcgca gccatcgacg 1680
tcagacgcgg aagcttcgat caactacgca gacaggtacc aaaacaaatg ttctcgtcac 1740
gtgggcatga atctgatgct gtttccctgc agacaatgcg agagaatgaa tcagaattca 1800
aatatctgct tcactcacgg acagaaagac tgtttagagt gctttcccgt gtcagaatct 1860
caacccgttt ctgtcgtcaa aaaggcgtat cagaaactgt gctacattca tcatatcatg 1920
ggaaaggtgc cagacgcttg cactgcctgc gatctggtca atgtggattt ggatgactgc 1980
atctttgaac aataaatgac ttaaaccagg tatggctgcc gatggttatc ttccagattg 2040
gctcgaggac aaccttagt 2059
<210> 60
<211> 5336
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 60
ggtacccaac tccatgctta acagtcccca ggtacagccc accctgcgtc gcaaccagga 60
acagctctac agcttcctgg agcgccactc gccctacttc cgcagccaca gtgcgcagat 120
taggagcgcc acttcttttt gtcacttgaa aaacatgtaa aaataatgta ctaggagaca 180
ctttcaataa aggcaaatgt ttttatttgt acactctcgg gtgattattt accccccacc 240
cttgccgtct gcgccgttta aaaatcaaag gggttctgcc gcgcatcgct atgcgccact 300
ggcagggaca cgttgcgata ctggtgttta gtgctccact taaactcagg cacaaccatc 360
cgcggcagct cggtgaagtt ttcactccac aggctgcgca ccatcaccaa cgcgtttagc 420
aggtcgggcg ccgatatctt gaagtcgcag ttggggcctc cgccctgcgc gcgcgagttg 480
cgatacacag ggttgcagca ctggaacact atcagcgccg ggtggtgcac gctggccagc 540
acgctcttgt cggagatcag atccgcgtcc aggtcctccg cgttgctcag ggcgaacgga 600
gtcaactttg gtagctgcct tcccaaaaag ggtgcatgcc caggctttga gttgcactcg 660
caccgtagtg gcatcagaag gtgaccgtgc ccggtctggg cgttaggata cagcgcctgc 720
atgaaagcct tgatctgctt aaaagccacc tgagcctttg cgccttcaga gaagaacatg 780
ccgcaagact tgccggaaaa ctgattggcc ggacaggccg cgtcatgcac gcagcacctt 840
gcgtcggtgt tggagatctg caccacattt cggccccacc ggttcttcac gatcttggcc 900
ttgctagact gctccttcag cgcgcgctgc ccgttttcgc tcgtcacatc catttcaatc 960
acgtgctcct tatttatcat aatgctcccg tgtagacact taagctcgcc ttcgatctca 1020
gcgcagcggt gcagccacaa cgcgcagccc gtgggctcgt ggtgcttgta ggttacctct 1080
gcaaacgact gcaggtacgc ctgcaggaat cgccccatca tcgtcacaaa ggtcttgttg 1140
ctggtgaagg tcagctgcaa cccgcggtgc tcctcgttta gccaggtctt gcatacggcc 1200
gccagagctt ccacttggtc aggcagtagc ttgaagtttg cctttagatc gttatccacg 1260
tggtacttgt ccatcaacgc gcgcgcagcc tccatgccct tctcccacgc agacacgatc 1320
ggcaggctca gcgggtttat caccgtgctt tcactttccg cttcactgga ctcttccttt 1380
tcctcttgcg tccgcatacc ccgcgccact gggtcgtctt cattcagccg ccgcaccgtg 1440
cgcttacctc ccttgccgtg cttgattagc accggtgggt tgctgaaacc caccatttgt 1500
agcgccacat cttctctttc ttcctcgctg tccacgatca cctctgggga tggcgggcgc 1560
tcgggcttgg gagaggggcg cttctttttc tttttggacg caatggccaa atccgccgtc 1620
gaggtcgatg gccgcgggct gggtgtgcgc ggcaccagcg catcttgtga cgagtcttct 1680
tcgtcctcgg actcgagacg ccgcctcagc cgcttttttg ggggcgcgcg gggaggcggc 1740
ggcgacggcg acggggacga cacgtcctcc atggttggtg gacgtcgcgc cgcaccgcgt 1800
ccgcgctcgg gggtggtttc gcgctgctcc tcttcccgac tggccatttc cttctcctat 1860
aggcagaaaa agatcatgga gtcagtcgag aaggaggaca gcctaaccgc cccctttgag 1920
ttcgccacca ccgcctccac cgatgccgcc aacgcgccta ccaccttccc cgtcgaggca 1980
cccccgcttg aggaggagga agtgattatc gagcaggacc caggttttgt aagcgaagac 2040
gacgaggatc gctcagtacc aacagaggat aaaaagcaag accaggacga cgcagaggca 2100
aacgaggaac aagtcgggcg gggggaccaa aggcatggcg actacctaga tgtgggagac 2160
gacgtgctgt tgaagcatct gcagcgccag tgcgccatta tctgcgacgc gttgcaagag 2220
cgcagcgatg tgcccctcgc catagcggat gtcagccttg cctacgaacg ccacctgttc 2280
tcaccgcgcg taccccccaa acgccaagaa aacggcacat gcgagcccaa cccgcgcctc 2340
aacttctacc ccgtatttgc cgtgccagag gtgcttgcca cctatcacat ctttttccaa 2400
aactgcaaga tacccctatc ctgccgtgcc aaccgcagcc gagcggacaa gcagctggcc 2460
ttgcggcagg gcgctgtcat acctgatatc gcctcgctcg acgaagtgcc aaaaatcttt 2520
gagggtcttg gacgcgacga gaaacgcgcg gcaaacgctc tgcaacaaga aaacagcgaa 2580
aatgaaagtc actgtggagt gctggtggaa cttgagggtg acaacgcgcg cctagccgtg 2640
ctgaaacgca gcatcgaggt cacccacttt gcctacccgg cacttaacct accccccaag 2700
gttatgagca cagtcatgag cgagctgatc gtgcgccgtg cacgacccct ggagagggat 2760
gcaaacttgc aagaacaaac cgaggagggc ctacccgcag ttggcgatga gcagctggcg 2820
cgctggcttg agacgcgcga gcctgccgac ttggaggagc gacgcaagct aatgatggcc 2880
gcagtgcttg ttaccgtgga gcttgagtgc atgcagcggt tctttgctga cccggagatg 2940
cagcgcaagc tagaggaaac gttgcactac acctttcgcc agggctacgt gcgccaggcc 3000
tgcaaaattt ccaacgtgga gctctgcaac ctggtctcct accttggaat tttgcacgaa 3060
aaccgcctcg ggcaaaacgt gcttcattcc acgctcaagg gcgaggcgcg ccgcgactac 3120
gtccgcgact gcgtttactt atttctgtgc tacacctggc aaacggccat gggcgtgtgg 3180
cagcaatgcc tggaggagcg caacctaaag gagctgcaga agctgctaaa gcaaaacttg 3240
aaggacctat ggacggcctt caacgagcgc tccgtggccg cgcacctggc ggacattatc 3300
ttccccgaac gcctgcttaa aaccctgcaa cagggtctgc cagacttcac cagtcaaagc 3360
atgttgcaaa actttaggaa ctttatccta gagcgttcag gaattctgcc cgccacctgc 3420
tgtgcgcttc ctagcgactt tgtgcccatt aagtaccgtg aatgccctcc gccgctttgg 3480
ggtcactgct accttctgca gctagccaac taccttgcct accactccga catcatggaa 3540
gacgtgagcg gtgacggcct actggagtgt cactgtcgct gcaacctatg caccccgcac 3600
cgctccctgg tctgcaattc gcaactgctt agcgaaagtc aaattatcgg tacctttgag 3660
ctgcagggtc cctcgcctga cgaaaagtcc gcggctccgg ggttgaaact cactccgggg 3720
ctgtggacgt cggcttacct tcgcaaattt gtacctgagg actaccacgc ccacgagatt 3780
aggttctacg aagaccaatc ccgcccgcca aatgcggagc ttaccgcctg cgtcattacc 3840
cagggccaca tccttggcca attgcaagcc atcaacaaag cccgccaaga gtttctgcta 3900
cgaaagggac ggggggttta cctggacccc cagtccggcg aggagctcaa cccaatcccc 3960
ccgccgccgc agccctatca gcagccgcgg gcccttgctt cccaggatgg cacccaaaaa 4020
gaagctgcag ctgccgccgc cgccacccac ggacgaggag gaatactggg acagtcaggc 4080
agaggaggtt ttggacgagg aggaggagat gatggaagac tgggacagcc tagacgaagc 4140
ttccgaggcc gaagaggtgt cagacgaaac accgtcaccc tcggtcgcat tcccctcgcc 4200
ggcgccccag aaattggcaa ccgttcccag catcgctaca acctccgctc ctcaggcgcc 4260
gccggcactg cctgttcgcc gacccaaccg tagatgggac accactggaa ccagggccgg 4320
taagtctaag cagccgccgc cgttagccca agagcaacaa cagcgccaag gctaccgctc 4380
gtggcgcggg cacaagaacg ccatagttgc ttgcttgcaa gactgtgggg gcaacatctc 4440
cttcgcccgc cgctttcttc tctaccatca cggcgtggcc ttcccccgta acatcctgca 4500
ttactaccgt catctctaca gcccctactg caccggcggc agcggcagcg gcagcaacag 4560
cagcggtcac acagaagcaa aggcgaccgg atagcaagac tctgacaaag cccaagaaat 4620
ccacagcggc ggcagcagca ggaggaggag cgctgcgtct ggcgcccaac gaacccgtat 4680
cgacccgcga gcttagaaat aggatttttc ccactctgta tgctatattt caacaaagca 4740
ggggccaaga acaagagctg aaaataaaaa acaggtctct gcgctccctc acccgcagct 4800
gcctgtatca caaaagcgaa gatcagcttc ggcgcacgct ggaagacgcg gaggctctct 4860
tcagcaaata ctgcgcgctg actcttaagg actagtttcg cgccctttct caaatttaag 4920
cgcgaaaact acgtcatctc cagcggccac acccggcgcc agcacctgtc gtcagcgcca 4980
ttatgagcaa ggaaattccc acgccctaca tgtggagtta ccagccacaa atgggacttg 5040
cggctggagc tgcccaagac tactcaaccc gaataaacta catgagcgcg ggaccccaca 5100
tgatatcccg ggtcaacgga atccgcgccc accgaaaccg aattctcctc gaacaggcgg 5160
ctattaccac cacacctcgt aataacctta atccccgtag ttggcccgct gccctggtgt 5220
accaggaaag tcccgctccc accactgtgg tacttcccag agacgcccag gccgaagttc 5280
agatgactaa ctcaggggcg cagcttgcgg gcggctttcg tcacagggtg cggtcg 5336
<210> 61
<211> 3201
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 61
cccgggcgtt ttagggcgga gtaacttgca tgtattggga attgtagttt ttttaaaatg 60
ggaagtgacg tatcgtggga aaacggaagt gaagatttga ggaagttgtg ggttttttgg 120
ctttcgtttc tgggcgtagg ttcgcgtgcg gttttctggg tgttttttgt ggactttaac 180
cgttacgtca ttttttagtc ctatatatac tcgctctgta cttggccctt tttacactgt 240
gactgattga gctggtgccg tgtcgagtgg tgttttttaa taggtttttt tactggtaag 300
gctgactgtt atggctgccg ctgtggaagc gctgtatgtt gttctggagc gggagggtgc 360
tattttgcct aggcaggagg gtttttcagg tgtttatgtg tttttctctc ctattaattt 420
tgttatacct cctatggggg ctgtaatgtt gtctctacgc ctgcgggtat gtattccccc 480
gggctatttc ggtcgctttt tagcactgac cgatgttaac caacctgatg tgtttaccga 540
gtcttacatt atgactccgg acatgaccga ggaactgtcg gtggtgcttt ttaatcacgg 600
tgaccagttt ttttacggtc acgccggcat ggccgtagtc cgtcttatgc ttataagggt 660
tgtttttcct gttgtaagac aggcttctaa tgtttaaatg tttttttttt tgttatttta 720
ttttgtgttt aatgcaggaa cccgcagaca tgtttgagag aaaaatggtg tctttttctg 780
tggtggttcc ggaacttacc tgcctttatc tgcatgagca tgactacgat gtgcttgctt 840
ttttgcgcga ggctttgcct gattttttga gcagcacctt gcattttata tcgccgccca 900
tgcaacaagc ttacataggg gctacgctgg ttagcatagc tccgagtatg cgtgtcataa 960
tcagtgtggg ttcttttgtc atggttcctg gcggggaagt ggccgcgctg gtccgtgcag 1020
acctgcacga ttatgttcag ctggccctgc gaagggacct acgggatcgc ggtatttttg 1080
ttaatgttcc gcttttgaat cttatacagg tctgtgagga acctgaattt ttgcaatcat 1140
gattcgctgc ttgaggctga aggtggaggg cgctctggag cagattttta caatggccgg 1200
acttaatatt cgggatttgc ttagagacat attgataagg tggcgagatg aaaattattt 1260
gggcatggtt gaaggtgctg gaatgtttat agaggagatt caccctgaag ggtttagcct 1320
ttacgtccac ttggacgtga gggcagtttg ccttttggaa gccattgtgc aacatcttac 1380
aaatgccatt atctgttctt tggctgtaga gtttgaccac gccaccggag gggagcgcgt 1440
tcacttaata gatcttcatt ttgaggtttt ggataatctt ttggaataaa aaaaaaaaaa 1500
catggttctt ccagctcttc ccgctcctcc cgtgtgtgac tcgcagaacg aatgtgtagg 1560
ttggctgggt gtggcttatt ctgcggtggt ggatgttatc agggcagcgg cgcatgaagg 1620
agtttacata gaacccgaag ccagggggcg cctggatgct ttgagagagt ggatatacta 1680
caactactac acagagcgag ctaagcgacg agaccggaga cgcagatctg tttgtcacgc 1740
ccgcacctgg ttttgcttca ggaaatatga ctacgtccgg cgttccattt ggcatgacac 1800
tacgaccaac acgatctcgg ttgtctcggc gcactccgta cagtagggat cgcctacctc 1860
cttttgagac agagacccgc gctaccatac tggaggatca tccgctgctg cccgaatgta 1920
acactttgac aatgcacaac gtgagttacg tgcgaggtct tccctgcagt gtgggattta 1980
cgctgattca ggaatgggtt gttccctggg atatggttct gacgcgggag gagcttgtaa 2040
tcctgaggaa gtgtatgcac gtgtgcctgt gttgtgccaa cattgatatc atgacgagca 2100
tgatgatcca tggttacgag tcctgggctc tccactgtca ttgttccagt cccggttccc 2160
tgcagtgcat agccggcggg caggttttgg ccagctggtt taggatggtg gtggatggcg 2220
ccatgtttaa tcagaggttt atatggtacc gggaggtggt gaattacaac atgccaaaag 2280
aggtaatgtt tatgtccagc gtgtttatga ggggtcgcca cttaatctac ctgcgcttgt 2340
ggtatgatgg ccacgtgggt tctgtggtcc ccgccatgag ctttggatac agcgccttgc 2400
actgtgggat tttgaacaat attgtggtgc tgtgctgcag ttactgtgct gatttaagtg 2460
agatcagggt gcgctgctgt gcccggagga caaggcgtct catgctgcgg gcggtgcgaa 2520
tcatcgctga ggagaccact gccatgttgt attcctgcag gacggagcgg cggcggcagc 2580
agtttattcg cgcgctgctg cagcaccacc gccctatcct gatgcacgat tatgactcta 2640
cccccatgta ggcgtggact tccccttcgc cgcccgttga gcaaccgcaa gttggacagc 2700
agcctgtggc tcagcagctg gacagcgaca tgaacttaag cgagctgccc ggggagttta 2760
ttaatatcac tgatgagcgt ttggctcgac aggaaaccgt gtggaatata acacctaaga 2820
atatgtctgt tacccatgat atgatgcttt ttaaggccag ccggggagaa aggactgtgt 2880
actctgtgtg ttgggaggga ggtggcaggt tgaatactag ggttctgtga gtttgattaa 2940
ggtacggtga tcaatataag ctatgtggtg gtggggctat actactgaat gaaaaatgac 3000
ttgaaatttt ctgcaattga aaaataaaca cgttgaaaca taacatgcaa caggttcacg 3060
attctttatt cctgggcaat gtaggagaag gtgtaagagt tggtagcaaa agtttcagtg 3120
gtgtattttc cactttccca ggaccatgta aaagacatag agtaagtgct tacctcgcta 3180
gtttctgtgg attcactaga a 3201
<210> 62
<211> 743
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 62
tcgatgtagg atgttgcccc tcctgacgcg gtaggagaag gggagggtgc cctgcatgtc 60
tgccgctgct cttgctcttg ccgctgctga ggaggggggc gcatctgccg cagcaccgga 120
tgcatctggg aaaagcaaaa aaggggctcg tccctgtttc cggaggaatt tgcaagcggg 180
gtcttgcatg acggggaggc aaacccccgt tcgccgcagt ccggccggcc cgagactcga 240
accgggggtc ctgcgactca acccttggaa aataaccctc cggctacagg gagcgagcca 300
cttaatgctt tcgctttcca gcctaaccgc ttacgccgcg cgcggccagt ggccaaaaaa 360
gctagcgcag cagccgccgc gcctggaagg aagccaaaag gagcgctccc ccgttgtctg 420
acgtcgcaca cctgggttcg acacgcgggc ggtaaccgca tggatcacgg cggacggccg 480
gatccggggt tcgaaccccg gtcgtccgcc atgataccct tgcgaattta tccaccagac 540
cacggaagag tgcccgctta caggctctcc ttttgcacgg tctagagcgt caacgactgc 600
gcacgcctca ccggccagag cgtcccgacc atggagcact ttttgccgct gcgcaacatc 660
tggaaccgcg tccgcgactt tccgcgcgcc tccaccaccg ccgccggcat cacctggatg 720
tccaggtaca tctacggatt acg 743
<210> 63
<211> 9280
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 63
ggtacccaac tccatgctta acagtcccca ggtacagccc accctgcgtc gcaaccagga 60
acagctctac agcttcctgg agcgccactc gccctacttc cgcagccaca gtgcgcagat 120
taggagcgcc acttcttttt gtcacttgaa aaacatgtaa aaataatgta ctaggagaca 180
ctttcaataa aggcaaatgt ttttatttgt acactctcgg gtgattattt accccccacc 240
cttgccgtct gcgccgttta aaaatcaaag gggttctgcc gcgcatcgct atgcgccact 300
ggcagggaca cgttgcgata ctggtgttta gtgctccact taaactcagg cacaaccatc 360
cgcggcagct cggtgaagtt ttcactccac aggctgcgca ccatcaccaa cgcgtttagc 420
aggtcgggcg ccgatatctt gaagtcgcag ttggggcctc cgccctgcgc gcgcgagttg 480
cgatacacag ggttgcagca ctggaacact atcagcgccg ggtggtgcac gctggccagc 540
acgctcttgt cggagatcag atccgcgtcc aggtcctccg cgttgctcag ggcgaacgga 600
gtcaactttg gtagctgcct tcccaaaaag ggtgcatgcc caggctttga gttgcactcg 660
caccgtagtg gcatcagaag gtgaccgtgc ccggtctggg cgttaggata cagcgcctgc 720
atgaaagcct tgatctgctt aaaagccacc tgagcctttg cgccttcaga gaagaacatg 780
ccgcaagact tgccggaaaa ctgattggcc ggacaggccg cgtcatgcac gcagcacctt 840
gcgtcggtgt tggagatctg caccacattt cggccccacc ggttcttcac gatcttggcc 900
ttgctagact gctccttcag cgcgcgctgc ccgttttcgc tcgtcacatc catttcaatc 960
acgtgctcct tatttatcat aatgctcccg tgtagacact taagctcgcc ttcgatctca 1020
gcgcagcggt gcagccacaa cgcgcagccc gtgggctcgt ggtgcttgta ggttacctct 1080
gcaaacgact gcaggtacgc ctgcaggaat cgccccatca tcgtcacaaa ggtcttgttg 1140
ctggtgaagg tcagctgcaa cccgcggtgc tcctcgttta gccaggtctt gcatacggcc 1200
gccagagctt ccacttggtc aggcagtagc ttgaagtttg cctttagatc gttatccacg 1260
tggtacttgt ccatcaacgc gcgcgcagcc tccatgccct tctcccacgc agacacgatc 1320
ggcaggctca gcgggtttat caccgtgctt tcactttccg cttcactgga ctcttccttt 1380
tcctcttgcg tccgcatacc ccgcgccact gggtcgtctt cattcagccg ccgcaccgtg 1440
cgcttacctc ccttgccgtg cttgattagc accggtgggt tgctgaaacc caccatttgt 1500
agcgccacat cttctctttc ttcctcgctg tccacgatca cctctgggga tggcgggcgc 1560
tcgggcttgg gagaggggcg cttctttttc tttttggacg caatggccaa atccgccgtc 1620
gaggtcgatg gccgcgggct gggtgtgcgc ggcaccagcg catcttgtga cgagtcttct 1680
tcgtcctcgg actcgagacg ccgcctcagc cgcttttttg ggggcgcgcg gggaggcggc 1740
ggcgacggcg acggggacga cacgtcctcc atggttggtg gacgtcgcgc cgcaccgcgt 1800
ccgcgctcgg gggtggtttc gcgctgctcc tcttcccgac tggccatttc cttctcctat 1860
aggcagaaaa agatcatgga gtcagtcgag aaggaggaca gcctaaccgc cccctttgag 1920
ttcgccacca ccgcctccac cgatgccgcc aacgcgccta ccaccttccc cgtcgaggca 1980
cccccgcttg aggaggagga agtgattatc gagcaggacc caggttttgt aagcgaagac 2040
gacgaggatc gctcagtacc aacagaggat aaaaagcaag accaggacga cgcagaggca 2100
aacgaggaac aagtcgggcg gggggaccaa aggcatggcg actacctaga tgtgggagac 2160
gacgtgctgt tgaagcatct gcagcgccag tgcgccatta tctgcgacgc gttgcaagag 2220
cgcagcgatg tgcccctcgc catagcggat gtcagccttg cctacgaacg ccacctgttc 2280
tcaccgcgcg taccccccaa acgccaagaa aacggcacat gcgagcccaa cccgcgcctc 2340
aacttctacc ccgtatttgc cgtgccagag gtgcttgcca cctatcacat ctttttccaa 2400
aactgcaaga tacccctatc ctgccgtgcc aaccgcagcc gagcggacaa gcagctggcc 2460
ttgcggcagg gcgctgtcat acctgatatc gcctcgctcg acgaagtgcc aaaaatcttt 2520
gagggtcttg gacgcgacga gaaacgcgcg gcaaacgctc tgcaacaaga aaacagcgaa 2580
aatgaaagtc actgtggagt gctggtggaa cttgagggtg acaacgcgcg cctagccgtg 2640
ctgaaacgca gcatcgaggt cacccacttt gcctacccgg cacttaacct accccccaag 2700
gttatgagca cagtcatgag cgagctgatc gtgcgccgtg cacgacccct ggagagggat 2760
gcaaacttgc aagaacaaac cgaggagggc ctacccgcag ttggcgatga gcagctggcg 2820
cgctggcttg agacgcgcga gcctgccgac ttggaggagc gacgcaagct aatgatggcc 2880
gcagtgcttg ttaccgtgga gcttgagtgc atgcagcggt tctttgctga cccggagatg 2940
cagcgcaagc tagaggaaac gttgcactac acctttcgcc agggctacgt gcgccaggcc 3000
tgcaaaattt ccaacgtgga gctctgcaac ctggtctcct accttggaat tttgcacgaa 3060
aaccgcctcg ggcaaaacgt gcttcattcc acgctcaagg gcgaggcgcg ccgcgactac 3120
gtccgcgact gcgtttactt atttctgtgc tacacctggc aaacggccat gggcgtgtgg 3180
cagcaatgcc tggaggagcg caacctaaag gagctgcaga agctgctaaa gcaaaacttg 3240
aaggacctat ggacggcctt caacgagcgc tccgtggccg cgcacctggc ggacattatc 3300
ttccccgaac gcctgcttaa aaccctgcaa cagggtctgc cagacttcac cagtcaaagc 3360
atgttgcaaa actttaggaa ctttatccta gagcgttcag gaattctgcc cgccacctgc 3420
tgtgcgcttc ctagcgactt tgtgcccatt aagtaccgtg aatgccctcc gccgctttgg 3480
ggtcactgct accttctgca gctagccaac taccttgcct accactccga catcatggaa 3540
gacgtgagcg gtgacggcct actggagtgt cactgtcgct gcaacctatg caccccgcac 3600
cgctccctgg tctgcaattc gcaactgctt agcgaaagtc aaattatcgg tacctttgag 3660
ctgcagggtc cctcgcctga cgaaaagtcc gcggctccgg ggttgaaact cactccgggg 3720
ctgtggacgt cggcttacct tcgcaaattt gtacctgagg actaccacgc ccacgagatt 3780
aggttctacg aagaccaatc ccgcccgcca aatgcggagc ttaccgcctg cgtcattacc 3840
cagggccaca tccttggcca attgcaagcc atcaacaaag cccgccaaga gtttctgcta 3900
cgaaagggac ggggggttta cctggacccc cagtccggcg aggagctcaa cccaatcccc 3960
ccgccgccgc agccctatca gcagccgcgg gcccttgctt cccaggatgg cacccaaaaa 4020
gaagctgcag ctgccgccgc cgccacccac ggacgaggag gaatactggg acagtcaggc 4080
agaggaggtt ttggacgagg aggaggagat gatggaagac tgggacagcc tagacgaagc 4140
ttccgaggcc gaagaggtgt cagacgaaac accgtcaccc tcggtcgcat tcccctcgcc 4200
ggcgccccag aaattggcaa ccgttcccag catcgctaca acctccgctc ctcaggcgcc 4260
gccggcactg cctgttcgcc gacccaaccg tagatgggac accactggaa ccagggccgg 4320
taagtctaag cagccgccgc cgttagccca agagcaacaa cagcgccaag gctaccgctc 4380
gtggcgcggg cacaagaacg ccatagttgc ttgcttgcaa gactgtgggg gcaacatctc 4440
cttcgcccgc cgctttcttc tctaccatca cggcgtggcc ttcccccgta acatcctgca 4500
ttactaccgt catctctaca gcccctactg caccggcggc agcggcagcg gcagcaacag 4560
cagcggtcac acagaagcaa aggcgaccgg atagcaagac tctgacaaag cccaagaaat 4620
ccacagcggc ggcagcagca ggaggaggag cgctgcgtct ggcgcccaac gaacccgtat 4680
cgacccgcga gcttagaaat aggatttttc ccactctgta tgctatattt caacaaagca 4740
ggggccaaga acaagagctg aaaataaaaa acaggtctct gcgctccctc acccgcagct 4800
gcctgtatca caaaagcgaa gatcagcttc ggcgcacgct ggaagacgcg gaggctctct 4860
tcagcaaata ctgcgcgctg actcttaagg actagtttcg cgccctttct caaatttaag 4920
cgcgaaaact acgtcatctc cagcggccac acccggcgcc agcacctgtc gtcagcgcca 4980
ttatgagcaa ggaaattccc acgccctaca tgtggagtta ccagccacaa atgggacttg 5040
cggctggagc tgcccaagac tactcaaccc gaataaacta catgagcgcg ggaccccaca 5100
tgatatcccg ggtcaacgga atccgcgccc accgaaaccg aattctcctc gaacaggcgg 5160
ctattaccac cacacctcgt aataacctta atccccgtag ttggcccgct gccctggtgt 5220
accaggaaag tcccgctccc accactgtgg tacttcccag agacgcccag gccgaagttc 5280
agatgactaa ctcaggggcg cagcttgcgg gcggctttcg tcacagggtg cggtcgcccg 5340
ggcgttttag ggcggagtaa cttgcatgta ttgggaattg tagttttttt aaaatgggaa 5400
gtgacgtatc gtgggaaaac ggaagtgaag atttgaggaa gttgtgggtt ttttggcttt 5460
cgtttctggg cgtaggttcg cgtgcggttt tctgggtgtt ttttgtggac tttaaccgtt 5520
acgtcatttt ttagtcctat atatactcgc tctgtacttg gcccttttta cactgtgact 5580
gattgagctg gtgccgtgtc gagtggtgtt ttttaatagg tttttttact ggtaaggctg 5640
actgttatgg ctgccgctgt ggaagcgctg tatgttgttc tggagcggga gggtgctatt 5700
ttgcctaggc aggagggttt ttcaggtgtt tatgtgtttt tctctcctat taattttgtt 5760
atacctccta tgggggctgt aatgttgtct ctacgcctgc gggtatgtat tcccccgggc 5820
tatttcggtc gctttttagc actgaccgat gttaaccaac ctgatgtgtt taccgagtct 5880
tacattatga ctccggacat gaccgaggaa ctgtcggtgg tgctttttaa tcacggtgac 5940
cagttttttt acggtcacgc cggcatggcc gtagtccgtc ttatgcttat aagggttgtt 6000
tttcctgttg taagacaggc ttctaatgtt taaatgtttt tttttttgtt attttatttt 6060
gtgtttaatg caggaacccg cagacatgtt tgagagaaaa atggtgtctt tttctgtggt 6120
ggttccggaa cttacctgcc tttatctgca tgagcatgac tacgatgtgc ttgctttttt 6180
gcgcgaggct ttgcctgatt ttttgagcag caccttgcat tttatatcgc cgcccatgca 6240
acaagcttac ataggggcta cgctggttag catagctccg agtatgcgtg tcataatcag 6300
tgtgggttct tttgtcatgg ttcctggcgg ggaagtggcc gcgctggtcc gtgcagacct 6360
gcacgattat gttcagctgg ccctgcgaag ggacctacgg gatcgcggta tttttgttaa 6420
tgttccgctt ttgaatctta tacaggtctg tgaggaacct gaatttttgc aatcatgatt 6480
cgctgcttga ggctgaaggt ggagggcgct ctggagcaga tttttacaat ggccggactt 6540
aatattcggg atttgcttag agacatattg ataaggtggc gagatgaaaa ttatttgggc 6600
atggttgaag gtgctggaat gtttatagag gagattcacc ctgaagggtt tagcctttac 6660
gtccacttgg acgtgagggc agtttgcctt ttggaagcca ttgtgcaaca tcttacaaat 6720
gccattatct gttctttggc tgtagagttt gaccacgcca ccggagggga gcgcgttcac 6780
ttaatagatc ttcattttga ggttttggat aatcttttgg aataaaaaaa aaaaaacatg 6840
gttcttccag ctcttcccgc tcctcccgtg tgtgactcgc agaacgaatg tgtaggttgg 6900
ctgggtgtgg cttattctgc ggtggtggat gttatcaggg cagcggcgca tgaaggagtt 6960
tacatagaac ccgaagccag ggggcgcctg gatgctttga gagagtggat atactacaac 7020
tactacacag agcgagctaa gcgacgagac cggagacgca gatctgtttg tcacgcccgc 7080
acctggtttt gcttcaggaa atatgactac gtccggcgtt ccatttggca tgacactacg 7140
accaacacga tctcggttgt ctcggcgcac tccgtacagt agggatcgcc tacctccttt 7200
tgagacagag acccgcgcta ccatactgga ggatcatccg ctgctgcccg aatgtaacac 7260
tttgacaatg cacaacgtga gttacgtgcg aggtcttccc tgcagtgtgg gatttacgct 7320
gattcaggaa tgggttgttc cctgggatat ggttctgacg cgggaggagc ttgtaatcct 7380
gaggaagtgt atgcacgtgt gcctgtgttg tgccaacatt gatatcatga cgagcatgat 7440
gatccatggt tacgagtcct gggctctcca ctgtcattgt tccagtcccg gttccctgca 7500
gtgcatagcc ggcgggcagg ttttggccag ctggtttagg atggtggtgg atggcgccat 7560
gtttaatcag aggtttatat ggtaccggga ggtggtgaat tacaacatgc caaaagaggt 7620
aatgtttatg tccagcgtgt ttatgagggg tcgccactta atctacctgc gcttgtggta 7680
tgatggccac gtgggttctg tggtccccgc catgagcttt ggatacagcg ccttgcactg 7740
tgggattttg aacaatattg tggtgctgtg ctgcagttac tgtgctgatt taagtgagat 7800
cagggtgcgc tgctgtgccc ggaggacaag gcgtctcatg ctgcgggcgg tgcgaatcat 7860
cgctgaggag accactgcca tgttgtattc ctgcaggacg gagcggcggc ggcagcagtt 7920
tattcgcgcg ctgctgcagc accaccgccc tatcctgatg cacgattatg actctacccc 7980
catgtaggcg tggacttccc cttcgccgcc cgttgagcaa ccgcaagttg gacagcagcc 8040
tgtggctcag cagctggaca gcgacatgaa cttaagcgag ctgcccgggg agtttattaa 8100
tatcactgat gagcgtttgg ctcgacagga aaccgtgtgg aatataacac ctaagaatat 8160
gtctgttacc catgatatga tgctttttaa ggccagccgg ggagaaagga ctgtgtactc 8220
tgtgtgttgg gagggaggtg gcaggttgaa tactagggtt ctgtgagttt gattaaggta 8280
cggtgatcaa tataagctat gtggtggtgg ggctatacta ctgaatgaaa aatgacttga 8340
aattttctgc aattgaaaaa taaacacgtt gaaacataac atgcaacagg ttcacgattc 8400
tttattcctg ggcaatgtag gagaaggtgt aagagttggt agcaaaagtt tcagtggtgt 8460
attttccact ttcccaggac catgtaaaag acatagagta agtgcttacc tcgctagttt 8520
ctgtggattc actagaatcg atgtaggatg ttgcccctcc tgacgcggta ggagaagggg 8580
agggtgccct gcatgtctgc cgctgctctt gctcttgccg ctgctgagga ggggggcgca 8640
tctgccgcag caccggatgc atctgggaaa agcaaaaaag gggctcgtcc ctgtttccgg 8700
aggaatttgc aagcggggtc ttgcatgacg gggaggcaaa cccccgttcg ccgcagtccg 8760
gccggcccga gactcgaacc gggggtcctg cgactcaacc cttggaaaat aaccctccgg 8820
ctacagggag cgagccactt aatgctttcg ctttccagcc taaccgctta cgccgcgcgc 8880
ggccagtggc caaaaaagct agcgcagcag ccgccgcgcc tggaaggaag ccaaaaggag 8940
cgctcccccg ttgtctgacg tcgcacacct gggttcgaca cgcgggcggt aaccgcatgg 9000
atcacggcgg acggccggat ccggggttcg aaccccggtc gtccgccatg atacccttgc 9060
gaatttatcc accagaccac ggaagagtgc ccgcttacag gctctccttt tgcacggtct 9120
agagcgtcaa cgactgcgca cgcctcaccg gccagagcgt cccgaccatg gagcactttt 9180
tgccgctgcg caacatctgg aaccgcgtcc gcgactttcc gcgcgcctcc accaccgccg 9240
ccggcatcac ctggatgtcc aggtacatct acggattacg 9280
<210> 64
<211> 621
<212> PRT
<213> Artificial Sequence
<220>
<223> AAV2 Rep
<400> 64
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
1 5 10 15
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu
20 25 30
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile
35 40 45
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu
50 55 60
Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
65 70 75 80
Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu
85 90 95
Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile
100 105 110
Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu
115 120 125
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
130 135 140
Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
145 150 155 160
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu
165 170 175
Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His
180 185 190
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn
195 200 205
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
210 215 220
Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys
225 230 235 240
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
245 250 255
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
260 265 270
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln
275 280 285
Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu
290 295 300
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
305 310 315 320
Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
325 330 335
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro
340 345 350
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
355 360 365
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
370 375 380
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
385 390 395 400
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
405 410 415
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
420 425 430
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
435 440 445
Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln
450 455 460
Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val
465 470 475 480
Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala
485 490 495
Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val
500 505 510
Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp
515 520 525
Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu
530 535 540
Phe Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys
545 550 555 560
Phe Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu
565 570 575
Ser Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr
580 585 590
Ile His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp
595 600 605
Leu Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln
610 615 620
<210> 65
<211> 198
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 65
gatccagaca tgataagata cattgatgag tttggacaaa ccacaactag aatgcagtga 60
aaaaaatgct ttatttgtga aatttgtgat gctattgctt tatttgtaac cattataagc 120
tgcaataaac aagttaacaa caacaattgc attcatttta tgtttcaggt tcagggggag 180
gtgtgggagg ttttttaa 198
<210> 66
<211> 4186
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 66
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180
ggttagggag gtcctgcata tgcggccgca gcattagctt ccatttatgc agtgtaaatg 240
gtgagaacag ccccgactga atacccagag catcatctcg tctgtgtcat tcatgcacat 300
aacatatctc agcgaggtgg cccttctgtc ctctttgcag agacccagcc accatactag 360
tacctagaga actggctgga tttcagcccc gatacctccg ggcttttgct catgttcgcc 420
tcatagggtc atctgggtgg ttgcctaagg aaaagtatgt catggagact aacttgcttg 480
gcattgaata aaaggtgagt tgagagtgga gcgtgtttaa attgcaatcc tgcctctatt 540
tctgtgcttg cagggaacag tcatccttaa ttgctatcct ccatcatcat catgattatt 600
tctggttttt ctctggttgc ggagaatcca tactccaggt attccaatgt ctcagcattg 660
ccaggcctgt ctgagcgtca ggatgtaggt agtctgggct ctctgccttc tattcttgtc 720
caggatactc tgccaaaaga atcatgttgt ggctgccacc cctcccacaa agcctcccgc 780
ttgggtcagt ccaggactgg agttgggtat ggactgttca tgtctatcca ctgctacgtc 840
agggcaacac ccactgagag tgaccttgta gactgcagtg ggagacaccc ttcaaaacct 900
ctcctctcct gtcctgagag ccaggttaaa accatcagcc ccgcatcctg agtgcaaact 960
tttcctaacc ctgctgctaa gctagacacc tcacttactg agagccagcc cctaaaatgg 1020
gcaaacattg caagcagcaa acagcaaaca cacagccctc cctgcctgct gaccttggag 1080
ctggggcaga ggtcagagac ctctctgggc ccatgccacc tccaacatcc actcgacccc 1140
ttggaatttc ggtggagagg agcagaggtt gtcctggcgt ggtttaggta gtgtgagagg 1200
ggaatgactc ctttcggtaa gtgcagtgga agctgtacac tgcccaggca aagcgtccgg 1260
gcagcgtagg cgggcgactc agatcccagc cagtggactt agcccctgtt tgctcctccg 1320
ataactgggg tgaccttggt taatattcac cagcagcctc ccccgttgcc cctctggatc 1380
cactgcttaa atacggacga ggacagggcc ctgtctcctc agcttcaggc accaccactg 1440
acctgggaca gtgaatcctc taaggtaaat ataaaatttt taagtgtata atgtgttaaa 1500
ctactgattc taattgtttc tctcttttag attccaacct ttggaactga ccgccaccat 1560
gtccaccgct gtgctggaga accctgggct ggggaggaaa ctgtcagact tcgggcagga 1620
gacttcatac attgaggata actgtaacca gaatggcgcc atctctctga tcttcagcct 1680
gaaggaggaa gtgggcgccc tggcaaaggt gctgcgcctg tttgaggaga acgacgtgaa 1740
tctgacccac atcgagtccc ggccttctag actgaagaag gacgagtacg agttctttac 1800
ccacctggat aagcggtccc tgccagccct gacaaacatc atcaagatcc tgaggcacga 1860
catcggagca accgtgcacg agctgtctcg ggacaagaag aaggataccg tgccctggtt 1920
ccctcggaca atccaggagc tggatagatt tgccaaccag atcctgtctt acggagcaga 1980
gctggacgca gatcaccctg gcttcaagga cccagtgtat cgggcccgga gaaagcagtt 2040
tgccgatatc gcctacaatt ataggcacgg acagccaatc cctcgcgtgg agtatatgga 2100
ggaggagaag aagacctggg gcacagtgtt caagaccctg aagagcctgt acaagacaca 2160
cgcctgctac gagtataacc acatcttccc cctgctggag aagtattgtg gctttcacga 2220
ggacaatatc cctcagctgg aggacgtgag ccagttcctg cagacctgca caggctttag 2280
gctgaggcca gtggcaggac tgctgagctc ccgggacttc ctgggaggac tggccttcag 2340
agtgtttcac tgcacccagt acatcaggca cggctccaag ccaatgtata caccagagcc 2400
cgacatctgt cacgagctgc tgggccacgt gcccctgttt agcgatagat ccttcgccca 2460
gttttcccag gagatcggac tggcatctct gggagcacct gacgagtaca tcgagaagct 2520
ggccaccatc tattggttca cagtggagtt tggcctgtgc aagcagggcg atagcatcaa 2580
ggcctacgga gcaggactgc tgtctagctt cggcgagctg cagtattgtc tgtccgagaa 2640
gccaaagctg ctgcccctgg agctggagaa gaccgccatc cagaactaca ccgtgacaga 2700
gttccagccc ctgtactatg tggccgagtc ttttaacgat gccaaggaga aggtgagaaa 2760
tttcgccgcc acaatcccta ggcccttcag tgtgcgttac gacccttata cccagaggat 2820
cgaggtgctg gataatacac agcagctgaa gatcctggct gactcaatca atagcgaaat 2880
cggaatcctg tgctccgccc tgcagaaaat caaatgagaa ttcaaggcct ctcgagcctc 2940
tagaactata gtgagtcgta ttacgtagat ccagacatga taagatacat tgatgagttt 3000
ggacaaacca caactagaat gcagtgaaaa aaatgcttta tttgtgaaat ttgtgatgct 3060
attgctttat ttgtaaccat tataagctgc aataaacaag ttaacaacaa caattgcatt 3120
cattttatgt ttcaggttca gggggaggtg tgggaggttt tttaagcttt acgtacgatc 3180
gtcgagcagc tgttgtcctg gagaacggag tcctgagcag aaaactctca gactttgggc 3240
aggtaagcct gttgggcttc cactgctagg agagaattgg ttccccacat gtgaaagcag 3300
tctgggaaat gctggtattt ccagtctcct aaggctacta agaaatatga ctttatttag 3360
aggcgaggaa aatgcccagg aagtcaactg atgagactag tcttaacaag ttgaggatac 3420
agaaagttgg ggatctgagc tgctaccaac atctgtgtgt ctttgggtgg ctcattggta 3480
tcctctgcct attggcttta tcttctgtac actgaaagga aatggctggt ccttagtcac 3540
ctggggtggg agtccctatc tctccaggga tacttattca atcctttctt ctgggtatca 3600
aaatgacaag cttgtaagaa actgtcctct ttcggctttc aggaggtgat gtcgcatgaa 3660
gagaatttgg ggggggggac ttactcagaa ccaaggaggg agaaattaaa cagagaggga 3720
aatgaacagg agttagcccg gagcctgaag caccttgggg attatgctgg gggtggaggg 3780
aatccattgt cctccctagg gagggcttgc agaacatgtt cttttctgtg atatttgtac 3840
tttccccaga ttgcaaatca tggtttgtac actgagattc agtctctgga ggtaatatgc 3900
cttttctagc ttttccttgg acaggactaa ggggttgagg gttgcctgga gtcagagaaa 3960
tttgtgttaa agaaggttga tatgaaacct gcaggtctag atacgtagat aagtagcatg 4020
gcgggttaat cattaactac aaggaacccc tagtgatgga gttggccact ccctctctgc 4080
gcgctcgctc gctcactgag gccgggcgac caaaggtcgc ccgacgcccg ggctttgccc 4140
gggcggcctc agtgagcgag cgagcgcgca gagagggagt ggccaa 4186
<210> 67
<211> 171
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 67
ctgtgccttc tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc 60
tggaaggtgc cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc 120
tgagtaggtg tcattctatt ctggggggtg gggtggggca ggacagcaag g 171
<210> 68
<211> 122
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 68
aacttgttta ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca 60
aataaagcat ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct 120
ta 122
<210> 69
<211> 133
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 69
tgctttattt gtgaaatttg tgatgctatt gctttatttg taaccattat aagctgcaat 60
aaacaagtta acaacaacaa ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg 120
gaggtttttt aaa 133
<210> 70
<211> 3637
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 70
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180
ggttagggag gtcctgcata tgcggccgca gcattagctt ccatttatgc agtgtaaatg 240
gtgagaacag ccccgactga atacccagag catcatctcg tctgtgtcat tcatgcacat 300
aacatatctc agcgaggtgg cccttctgtc ctctttgcag agacccagcc accatactag 360
tacctagaga actggctgga tttcagcccc gatacctccg ggcttttgct catgttcgcc 420
tcatagggtc atctgggtgg ttgcctaagg aaaagtatgt catggagact aacttgcttg 480
gcattgaata aaaggtgagt tgagagtgga gcgtgtttaa attgcaatcc tgcctctatt 540
tctgtgcttg cagggaacag tcatccttaa ttgctatcct ccatcatcat catgattatt 600
tctggttttt ctctggttgc ggagaatcca tactccaggt attccaatgt ctcagcattg 660
ccaggcctgt ctgagcgtca ggatgtaggt agtctgggct ctctgccttc tattcttgtc 720
caggatactc tgccaaaaga atcatgttgt ggctgccacc cctcccacaa agcctcccgc 780
ttgggtcagt ccaggactgg agttgggtat ggactgttca tgtctatcca ctgctacgtc 840
agggcaacac ccactgagag tgaccttgta gactgcagtg ggagacaccc ttcaaaacct 900
ctcctctcct gtcctgagag ccaggttaaa accatcagcc ccgcatcctg agtgcaaact 960
tttcctaacc ctgctgctaa gctagacacc tcacttactg agagccagca tgtccaccgc 1020
tgtgctggag aaccctgggc tggggaggaa actgtcagac ttcgggcagg agacttcata 1080
cattgaggat aactgtaacc agaatggcgc catctctctg atcttcagcc tgaaggagga 1140
agtgggcgcc ctggcaaagg tgctgcgcct gtttgaggag aacgacgtga atctgaccca 1200
catcgagtcc cggccttcta gactgaagaa ggacgagtac gagttcttta cccacctgga 1260
taagcggtcc ctgccagccc tgacaaacat catcaagatc ctgaggcacg acatcggagc 1320
aaccgtgcac gagctgtctc gggacaagaa gaaggatacc gtgccctggt tccctcggac 1380
aatccaggag ctggatagat ttgccaacca gatcctgtct tacggagcag agctggacgc 1440
agatcaccct ggcttcaagg acccagtgta tcgggcccgg agaaagcagt ttgccgatat 1500
cgcctacaat tataggcacg gacagccaat ccctcgcgtg gagtatatgg aggaggagaa 1560
gaagacctgg ggcacagtgt tcaagaccct gaagagcctg tacaagacac acgcctgcta 1620
cgagtataac cacatcttcc ccctgctgga gaagtattgt ggctttcacg aggacaatat 1680
ccctcagctg gaggacgtga gccagttcct gcagacctgc acaggcttta ggctgaggcc 1740
agtggcagga ctgctgagct cccgggactt cctgggagga ctggccttca gagtgtttca 1800
ctgcacccag tacatcaggc acggctccaa gccaatgtat acaccagagc ccgacatctg 1860
tcacgagctg ctgggccacg tgcccctgtt tagcgataga tccttcgccc agttttccca 1920
ggagatcgga ctggcatctc tgggagcacc tgacgagtac atcgagaagc tggccaccat 1980
ctattggttc acagtggagt ttggcctgtg caagcagggc gatagcatca aggcctacgg 2040
agcaggactg ctgtctagct tcggcgagct gcagtattgt ctgtccgaga agccaaagct 2100
gctgcccctg gagctggaga agaccgccat ccagaactac accgtgacag agttccagcc 2160
cctgtactat gtggccgagt cttttaacga tgccaaggag aaggtgagaa atttcgccgc 2220
cacaatccct aggcccttca gcgtgcggta cgacccttat acccagagga tcgaggtgct 2280
ggataataca cagcagctga agatcctggc tgactcaatc aatagcgaaa tcggaatcct 2340
gtgctccgcc ctgcagaaaa tcaaatgaga attcaaggcc tctcgagcct ctagaactat 2400
agtgagtcgt attacgtaga tccagacatg ataagataca ttgatgagtt tggacaaacc 2460
acaactagaa tgcagtgaaa aaaatgcttt atttgtgaaa tttgtgatgc tattgcttta 2520
tttgtaacca ttataagctg caataaacaa gttaacaaca acaattgcat tcattttatg 2580
tttcaggttc agggggaggt gtgggaggtt ttttaagctt tacgtacgat cgtcgagcag 2640
ctgttgtcct ggagaacgga gtcctgagca gaaaactctc agactttggg caggtaagcc 2700
tgttgggctt ccactgctag gagagaattg gttccccaca tgtgaaagca gtctgggaaa 2760
tgctggtatt tccagtctcc taaggctact aagaaatatg actttattta gaggcgagga 2820
aaatgcccag gaagtcaact gatgagacta gtcttaacaa gttgaggata cagaaagttg 2880
gggatctgag ctgctaccaa catctgtgtg tctttgggtg gctcattggt atcctctgcc 2940
tattggcttt atcttctgta cactgaaagg aaatggctgg tccttagtca cctggggtgg 3000
gagtccctat ctctccaggg atacttattc aatcctttct tctgggtatc aaaatgacaa 3060
gcttgtaaga aactgtcctc tttcggcttt caggaggtga tgtcgcatga agagaatttg 3120
ggggggggga cttactcaga accaaggagg gagaaattaa acagagaggg aaatgaacag 3180
gagttagccc ggagcctgaa gcaccttggg gattatgctg ggggtggagg gaatccattg 3240
tcctccctag ggagggcttg cagaacatgt tcttttctgt gatatttgta ctttccccag 3300
attgcaaatc atggtttgta cactgagatt cagtctctgg aggtaatatg ccttttctag 3360
cttttccttg gacaggacta aggggttgag ggttgcctgg agtcagagaa atttgtgtta 3420
aagaaggttg atatgaaacc tgcaggtcta gatacgtaga taagtagcat ggcgggttaa 3480
tcattaacta caaggaaccc ctagtgatgg agttggccac tccctctctg cgcgctcgct 3540
cgctcactga ggccgggcga ccaaaggtcg cccgacgccc gggctttgcc cgggcggcct 3600
cagtgagcga gcgagcgcgc agagagggag tggccaa 3637
<210> 71
<211> 4075
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 71
ccttgctgtc ctgccccacc ccacccccca gaatagaatg acacctactc agacaatgcg 60
atgcaatttc ctcattttat taggaaagga cagtgggagt ggcaccttcc agggtcaagg 120
aaggcacggg ggaggggcaa acaacagatg gctggcaact agaaggcaca gcctcgagga 180
acgttttatt ttcccagaga caggctcagg gacttctggg tgtagtggct gtgcagggct 240
tcgtggagca cgctgcagct aaacacgttg ccctcttgcc atcggctctt gtccacggtc 300
agccgtgaat acaggaagaa gctgccatcg ctgtccagca ctggaggggt cgtcttgtag 360
ttgttttcag gctgtccgtt gctctcccat tcgacggcga tgtcgctggg gtagaagccc 420
ttcaccaggc aggtcagaga cacttggttc tttgtcattt cttcttgaga aggaggcagt 480
gtatagactt ggggctctct gggctggccc ttggcctttg agatggtctt ctcgatgctg 540
ctaggcaggc ccttgttaga caccttgcac ttgtactctt tgccgttcag ccagtcctgg 600
tgcagcactg tcagcacgga caccacccgg taggtgctgt taaactgttc ctcgcggggt 660
ttggtcttgg cattatgaac ttccactccg tcaacgtacc aattaaactg cacctcagga 720
tcctcctggg acacatccac caccacacat gtcacttcag gggtccggct gatcatcagg 780
gtgtctttgg gctttggtgg gaacaggaaa acagaagggc cggcgactgg tggagctgga 840
catggtgggc attccacgca gcactttctc tcaacggtct tatccacttt ggtgttgcta 900
ggcttgtggt ccacattaca ggtgtaggtc tgtgtgccga agttggagct aggaacggtg 960
accacgctac tcagagaata caggccagag ctctgcagca cggctgggaa ggtgtgcacg 1020
ccgcttgtca gggcgccgct gttccagctc actgtcacgg gttcggggaa gtagtctttg 1080
accagacaac ccagggcggc tgtgctttca gatgtgcttc tgctgcatgg ggccagtggg 1140
aacacgctgg gtcccttagt actggcgctg ctgacggtga caagggtgcc ttggccccac 1200
acgtcgaagt accagttagg ggatgagcca aaaaagtatc tggcgcagta gtacacagct 1260
gtgtcctcgc ttctcaggct gctcagttcc atgtacacgg tgcttgtgga ggtatctctg 1320
gtcatggtca ctctatcctt gaagttctct gtgtactcgg tgtggccaga tcctggcagg 1380
atctcgccca tccattccag gccttggcca ggggcctgcc gcacccactg gatccagtag 1440
ttgctgaaga tgtggccgct ggccttgcag gacaccttca cgctagctcc gggctttttc 1500
acttcggctc cgctttgaac cagctgcact tggctgtgca cgcctgtggc ggtggccacc 1560
aggaacagga tgatgcagga ccagcccatg gtggcactag ttcagttcca aaggttggaa 1620
tctaaaagag agaaacaatt agaatcagta gtttaacaca ttatacactt aaaaatttta 1680
tatttacctt agaggattca ctgtcccagg tcagtggtgg tgcctgaagc tgaggagaca 1740
gggccctgtc ctcgtccgta tttaagcagt ggatccagag gggcaacggg ggaggctgct 1800
ggtgaatatt aaccaaggtc accccagtta tcggaggagc aaacaggggc taagtccact 1860
ggctgggatc tgagtcgccc gcctacgctg cccggacgct ttgcctgggc agtgtacagc 1920
ttccactgca cttaccgaaa ggagtcattc ccctctcaca ctacctaaac cacgccagga 1980
caacctctgc tcctctccac cgaaattcca aggggtcgag tggatgttgg aggtggcatg 2040
ggcccagaga ggtctctgac ctctgcccca gctccaaggt cagcaggcag ggagggctgt 2100
gtgtttgctg tttgctgctt gcaatgtttg cccattttag ggccgcggca cgtgcttaag 2160
gccccctttt gcatccagtt tattcctaca tttgtcacac tgttaacagc ccaccccttc 2220
caatgagacc agtggtatca gtgagttgtg gagatcagga aaagggctca agagaaaggc 2280
agtcaaagcc ctttttctgt ccctgtccca gctgctttaa taagatctcc ataagagaag 2340
agggacagct atgactggga gtagtcagga gaggaggaaa aatctggcta gtaaaacatg 2400
taaggaaaat tttagggatg ttaaagaaaa aaataacaca aaacaaaata taaaaaaaat 2460
ctaacctcaa gtcaaggctt ttctatggaa taaggaatgg acagcagggg gctgtttcat 2520
atactgatga cctctttata gccaaccttt gttcatggca gccagcatat gggcatatgt 2580
tgccaaactc taaaccaaat actcattctg atgttttaaa tgatttgccc tcccatatgt 2640
ccttccgagt gagagacaca aaaaattcca acacactatt gcaatgaaaa taaatttcct 2700
ttattagcca gaagtcagat gctcaagggg cttcatgatg tccccataat ttttggcaga 2760
gggaaaaaga tctccggagg gggaggctgc tggtgaatat taaccaaggt caccccagtt 2820
atcggaggag caaacagggg ctaagtccac ctcgagccat ggcgatgctc taatctctct 2880
agacaaggtt catatttgta tgggttactt attctctctt tgttgactaa gtcaataatc 2940
agaatcagca ggtttgcagt cagattggca gggataagca gcctagctca ggagaagtga 3000
gtataaaagc cccaggctgg gagcagccat cagctagcgc cggcaagagg taagggttta 3060
agggatggtt ggttggtggg gtattaatgt ttaattacct ggagcacctg cctgaaatca 3120
ctttttttca ggttggaccg gtgccaccat ggacatgagg gtccctgctc agctgctggg 3180
gctcctgctg ctctggctca gcggtgccag atgtgatatc cagatgaccc agtctccatc 3240
tagcctgtcc gccagcgtgg gcgacagagt gaccatcacc tgcggcgcca gcgagaacat 3300
ctatggcgct ctgaactggt accagcagaa acctggcaag gcccctaagc tgctgatcta 3360
cggcgccacc aacctggccg atggcgtgcc tagtagattc agcggatctg gcagcggcac 3420
agacttcacc ctgaccatca gcagcctgca acctgaggac tttgccacat actactgcca 3480
gaacgtgctg aatacacctc tgacattcgg ccaaggaacc aaagtggaaa tcaagcggac 3540
cgtggccgct cctagcgtgt tcatcttccc tccttccgat gaacaactga agagcggaac 3600
cgcctctgtg gtgtgcctgc tgaacaactt ctaccctaga gaggccaagg tgcagtggaa 3660
ggtcgacaac gccctgcaga gcggcaacag ccaggagagc gtgacggaac aggacagcaa 3720
ggacagcacc tacagcctga gctccaccct tacactgtct aaagccgact acgagaagca 3780
caaggtgtac gcctgtgaag tgacacacca gggcctgagc agccctgtga ccaagtcttt 3840
taaccggggc gagtgctgaa ttcgaatcgt acctagggat ccagacatga taagatacat 3900
tgatgagttt ggacaaacca caactagaat gcagtgaaaa aaatgcttta tttgtgaaat 3960
ttgtgatgct attgctttat ttgtaaccat tataagctgc aataaacaag ttaacaacaa 4020
caattgcatt cattttatgt ttcaggttca gggggaggtg tgggaggttt tttaa 4075
<210> 72
<211> 2211
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 72
atggctgccg atggttatct tccagattgg ctcgaggaca accttagtga aggaattcgc 60
gagtggtggg ctttgaaacc tggagcccct caacccaagg caaatcaaca acatcaagac 120
aacgctcgag gtcttgtgct tccgggttac aaataccttg gacccggcaa cggactcgac 180
aagggggagc cggtcaacgc agcagacgcg gcggccctcg agcacgacaa ggcctacgac 240
cagcagctca aggccggaga caacccgtac ctcaagtaca accacgccga cgccgagttc 300
caggagcggc tcaaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360
gccaaaaaga ggcttcttga acctcttggt ctggttgagg aagcggctaa gacggctcct 420
ggaaagaaga ggcctgtaga gcagtctcct caggaaccgg actcctccgc gggtattggc 480
aaatcgggtg cacagcccgc taaaaagaga ctcaatttcg gtcagactgg cgacacagag 540
tcagtcccag accctcaacc aatcggagaa cctcccgcag ccccctcagg tgtgggatct 600
cttacaatgg cttcaggtgg tggcgcacca gtggcagaca ataacgaagg tgccgatgga 660
gtgggtagtt cctcgggaaa ttggcattgc gattcccaat ggctggggga cagagtcatc 720
accaccagca cccgaacctg ggccctgccc acctacaaca atcacctcta caagcaaatc 780
tccaacagca catctggagg atcttcaaat gacaacgcct acttcggcta cagcaccccc 840
tgggggtatt ttgacttcaa cagattccac tgccacttct caccacgtga ctggcagcga 900
ctcatcaaca acaactgggg attccggcct aagcgactca acttcaagct cttcaacatt 960
caggtcaaag aggttacgga caacaatgga gtcaagacca tcgccaataa ccttaccagc 1020
acggtccagg tcttcgcgga ctcagactat cagctcccgt acgtgctcgg gtcggctcac 1080
gagggctgcc tcccgccgtt cccagcggac gttttcatga ttcctcagta cgggtatctg 1140
acgcttaatg atggaagcca ggccgtgggt cgttcgtcct tttactgcct ggaatatttc 1200
ccgtcgcaaa tgctaagaac gggtaacaac ttccagttca gctacgagtt tgagaacgta 1260
cctttccata gcagctacgc tcacagccaa agcctggacc gactaatgaa tccactcatc 1320
gaccaatact tgtactatct ctcaaagact attaacggtt ctggacagaa tcaacaaacg 1380
ctaaaattca gtgtggccgg acccagcaac atggctgtcc agggaagaaa ctacatacct 1440
ggacccagct accgacaaca acgtgtctca accactgtga ctcaaaacaa caacagcgaa 1500
tttgcttggc ctagagcttc ttcttgggct ctcaatggac gtaatagctt gatgaatcct 1560
ggacctgcta tggccagcca caaagaagga gaggaccgtt tctttccttt gtctggatct 1620
ttaatttttg gcaaacaagg aactggaaga gacaacgtgg atgcggacaa agtcatgata 1680
accaacgaag aagaaattaa aactactaac ccggtagcaa cggagtccta tggacaagtg 1740
gccacaaacc accagagtgc ccaagcacag gcgcagaccg gctgggttca aaaccaagga 1800
atacttccgg gtatggtttg gcaggacaga gatgtgtacc tgcaaggacc catttgggcc 1860
aaaattcctc acacggacgg caactttcac ccttctccgc tgatgggagg gtttggaatg 1920
aagcacccgc ctcctcagat cctcatcaaa aacacacctg tacctgcgga tcctccaacg 1980
gccttcaaca aggacaagct gaactctttc atcacccagt attctactgg ccaagtcagc 2040
gtggagatcg agtgggagct gcagaaggaa aacagcaagc gctggaaccc ggagatccag 2100
tacacttcca actattacaa gtctaataat gttgaatttg ctgttaatac tgaaggtgta 2160
tatagtgaac cccgccccat tggcaccaga tacctgactc gtaatctgta a 2211
<210> 73
<211> 4093
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 73
atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60
ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120
tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180
cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240
caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300
aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360
taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420
gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480
acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540
aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600
gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660
tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720
cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780
tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840
cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900
attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960
acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020
accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080
aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140
aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200
gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260
aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320
ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380
gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440
gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500
gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560
gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620
aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680
ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740
tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800
ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860
caataaatga cttaaaccag gtatggctgc cgatggttat cttccagatt ggctcgagga 1920
caaccttagt gaaggaattc gcgagtggtg ggctttgaaa cctggagccc ctcaacccaa 1980
ggcaaatcaa caacatcaag acaacgctcg aggtcttgtg cttccgggtt acaaatacct 2040
tggacccggc aacggactcg acaaggggga gccggtcaac gcagcagacg cggcggccct 2100
cgagcacgac aaggcctacg accagcagct caaggccgga gacaacccgt acctcaagta 2160
caaccacgcc gacgccgagt tccaggagcg gctcaaagaa gatacgtctt ttgggggcaa 2220
cctcgggcga gcagtcttcc aggccaaaaa gaggcttctt gaacctcttg gtctggttga 2280
ggaagcggct aagacggctc ctggaaagaa gaggcctgta gagcagtctc ctcaggaacc 2340
ggactcctcc gcgggtattg gcaaatcggg tgcacagccc gctaaaaaga gactcaattt 2400
cggtcagact ggcgacacag agtcagtccc agaccctcaa ccaatcggag aacctcccgc 2460
agccccctca ggtgtgggat ctcttacaat ggcttcaggt ggtggcgcac cagtggcaga 2520
caataacgaa ggtgccgatg gagtgggtag ttcctcggga aattggcatt gcgattccca 2580
atggctgggg gacagagtca tcaccaccag cacccgaacc tgggccctgc ccacctacaa 2640
caatcacctc tacaagcaaa tctccaacag cacatctgga ggatcttcaa atgacaacgc 2700
ctacttcggc tacagcaccc cctgggggta ttttgacttc aacagattcc actgccactt 2760
ctcaccacgt gactggcagc gactcatcaa caacaactgg ggattccggc ctaagcgact 2820
caacttcaag ctcttcaaca ttcaggtcaa agaggttacg gacaacaatg gagtcaagac 2880
catcgccaat aaccttacca gcacggtcca ggtcttcgcg gactcagact atcagctccc 2940
gtacgtgctc gggtcggctc acgagggctg cctcccgccg ttcccagcgg acgttttcat 3000
gattcctcag tacgggtatc tgacgcttaa tgatggaagc caggccgtgg gtcgttcgtc 3060
cttttactgc ctggaatatt tcccgtcgca aatgctaaga acgggtaaca acttccagtt 3120
cagctacgag tttgagaacg tacctttcca tagcagctac gctcacagcc aaagcctgga 3180
ccgactaatg aatccactca tcgaccaata cttgtactat ctctcaaaga ctattaacgg 3240
ttctggacag aatcaacaaa cgctaaaatt cagtgtggcc ggacccagca acatggctgt 3300
ccagggaaga aactacatac ctggacccag ctaccgacaa caacgtgtct caaccactgt 3360
gactcaaaac aacaacagcg aatttgcttg gcctagagct tcttcttggg ctctcaatgg 3420
acgtaatagc ttgatgaatc ctggacctgc tatggccagc cacaaagaag gagaggaccg 3480
tttctttcct ttgtctggat ctttaatttt tggcaaacaa ggaactggaa gagacaacgt 3540
ggatgcggac aaagtcatga taaccaacga agaagaaatt aaaactacta acccggtagc 3600
aacggagtcc tatggacaag tggccacaaa ccaccagagt gcccaagcac aggcgcagac 3660
cggctgggtt caaaaccaag gaatacttcc gggtatggtt tggcaggaca gagatgtgta 3720
cctgcaagga cccatttggg ccaaaattcc tcacacggac ggcaactttc acccttctcc 3780
gctgatggga gggtttggaa tgaagcaccc gcctcctcag atcctcatca aaaacacacc 3840
tgtacctgcg gatcctccaa cggccttcaa caaggacaag ctgaactctt tcatcaccca 3900
gtattctact ggccaagtca gcgtggagat cgagtgggag ctgcagaagg aaaacagcaa 3960
gcgctggaac ccggagatcc agtacacttc caactattac aagtctaata atgttgaatt 4020
tgctgttaat actgaaggtg tatatagtga accccgcccc attggcacca gatacctgac 4080
tcgtaatctg taa 4093
<210> 74
<211> 1353
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 74
tccaccgctg tgctggagaa ccctgggctg gggaggaaac tgtcagactt cgggcaggag 60
acttcataca ttgaggataa ctgtaaccag aatggcgcca tctctctgat cttcagcctg 120
aaggaggaag tgggcgccct ggcaaaggtg ctgcgcctgt ttgaggagaa cgacgtgaat 180
ctgacccaca tcgagtcccg gccttctaga ctgaagaagg acgagtacga gttctttacc 240
cacctggata agcggtccct gccagccctg acaaacatca tcaagatcct gaggcacgac 300
atcggagcaa ccgtgcacga gctgtctcgg gacaagaaga aggataccgt gccctggttc 360
cctcggacaa tccaggagct ggatagattt gccaaccaga tcctgtctta cggagcagag 420
ctggacgcag atcaccctgg cttcaaggac ccagtgtatc gggcccggag aaagcagttt 480
gccgatatcg cctacaatta taggcacgga cagccaatcc ctcgcgtgga gtatatggag 540
gaggagaaga agacctgggg cacagtgttc aagaccctga agagcctgta caagacacac 600
gcctgctacg agtataacca catcttcccc ctgctggaga agtattgtgg ctttcacgag 660
gacaatatcc ctcagctgga ggacgtgagc cagttcctgc agacctgcac aggctttagg 720
ctgaggccag tggcaggact gctgagctcc cgggacttcc tgggaggact ggccttcaga 780
gtgtttcact gcacccagta catcaggcac ggctccaagc caatgtatac accagagccc 840
gacatctgtc acgagctgct gggccacgtg cccctgttta gcgatagatc cttcgcccag 900
ttttcccagg agatcggact ggcatctctg ggagcacctg acgagtacat cgagaagctg 960
gccaccatct attggttcac agtggagttt ggcctgtgca agcagggcga tagcatcaag 1020
gcctacggag caggactgct gtctagcttc ggcgagctgc agtattgtct gtccgagaag 1080
ccaaagctgc tgcccctgga gctggagaag accgccatcc agaactacac cgtgacagag 1140
ttccagcccc tgtactatgt ggccgagtct tttaacgatg ccaaggagaa ggtgagaaat 1200
ttcgccgcca caatccctag gcccttcagc gtgcggtacg acccttatac ccagaggatc 1260
gaggtgctgg ataatacaca gcagctgaag atcctggctg actcaatcaa tagcgaaatc 1320
ggaatcctgt gctccgccct gcagaaaatc aaa 1353
<210> 75
<211> 3939
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 75
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180
ggttagggag gtcctgcata tgcggccgct tcaggagcag ttgtgcgaat agctggagaa 240
caccaggctg gatttaaacc cagatcgctc ttacatttgc tctttacctg ctgtgctcag 300
cgttcacgtg ccctctagct gtagttttct gaagtcagcg cacagcaagg cagtgtgctt 360
agaggttaac agaagggaaa acaacaacaa caaaaatcta aatgagaatc ctgactgttt 420
cagctggggg taaggggggc ggattattca tataattgtt ataccagacg gtcgcaggct 480
tagtccaatt gcagagaact cgcttcccag gcttctgaga gtcccggaag tgcctaaacc 540
tgtctaatcg acggggcttg ggtggcccgt cgctccctgg cttcttccct ttacccaggg 600
cgggcagcga agtggtgcct cctgcgtccc ccacaccctc cctcagcccc tcccctccgg 660
cccgtcctgg gcaggtgacc tggagcatcc ggcaggctgc cctggcctcc tgcgtcagga 720
caacgcccac gaggggcgtt actgtgcgga gatgcaccac gcaagagaca ccctttgtaa 780
ctctcttctc ctccctagtg cgaggttaaa accttcagcc ccacgtgctg tttgcaaacc 840
tgcctgtacc tgaggcccta aaaagccaga gacctcactc ccggggagcc agcatgtcca 900
ctgcggtcct ggaaaaccca ggcttgggca ggaaactctc tgactttgga caggtgagcc 960
acggcagcct gagctgctca gttaggggaa tttgggcctc cagagaaaga gatctgaaga 1020
ctgctggtgc ttcctggttt cataagctca gtaagaagtc tgaattcgtt ggaagctgat 1080
gagaatatcc aggaagtcaa cagacaaatg tcctcaacaa ttgtttctaa gtaggagaac 1140
atctgtcctc ggtggctttc acaggaaaag cttctgacct cttctcttcc tcccacaggg 1200
cggtaccaga tctggcagcg gagagggcag aggaagtctt ctaacatgcg gtgacgtgga 1260
ggagaatccc ggcccttcca ccgctgtgct ggagaaccct gggctgggga ggaaactgtc 1320
agacttcggg caggagactt catacattga ggataactgt aaccagaatg gcgccatctc 1380
tctgatcttc agcctgaagg aggaagtggg cgccctggca aaggtgctgc gcctgtttga 1440
ggagaacgac gtgaatctga cccacatcga gtcccggcct tctagactga agaaggacga 1500
gtacgagttc tttacccacc tggataagcg gtccctgcca gccctgacaa acatcatcaa 1560
gatcctgagg cacgacatcg gagcaaccgt gcacgagctg tctcgggaca agaagaagga 1620
taccgtgccc tggttccctc ggacaatcca ggagctggat agatttgcca accagatcct 1680
gtcttacgga gcagagctgg acgcagatca ccctggcttc aaggacccag tgtatcgggc 1740
ccggagaaag cagtttgccg atatcgccta caattatagg cacggacagc caatccctcg 1800
cgtggagtat atggaggagg agaagaagac ctggggcaca gtgttcaaga ccctgaagag 1860
cctgtacaag acacacgcct gctacgagta taaccacatc ttccccctgc tggagaagta 1920
ttgtggcttt cacgaggaca atatccctca gctggaggac gtgagccagt tcctgcagac 1980
ctgcacaggc tttaggctga ggccagtggc aggactgctg agctcccggg acttcctggg 2040
aggactggcc ttcagagtgt ttcactgcac ccagtacatc aggcacggct ccaagccaat 2100
gtatacacca gagcccgaca tctgtcacga gctgctgggc cacgtgcccc tgtttagcga 2160
tagatccttc gcccagtttt cccaggagat cggactggca tctctgggag cacctgacga 2220
gtacatcgag aagctggcca ccatctattg gttcacagtg gagtttggcc tgtgcaagca 2280
gggcgatagc atcaaggcct acggagcagg actgctgtct agcttcggcg agctgcagta 2340
ttgtctgtcc gagaagccaa agctgctgcc cctggagctg gagaagaccg ccatccagaa 2400
ctacaccgtg acagagttcc agcccctgta ctatgtggcc gagtctttta acgatgccaa 2460
ggagaaggtg agaaatttcg ccgccacaat ccctaggccc ttcagcgtgc ggtacgaccc 2520
ttatacccag aggatcgagg tgctggataa tacacagcag ctgaagatcc tggctgactc 2580
aatcaatagc gaaatcggaa tcctgtgctc cgccctgcag aaaatcaaat gagatccaga 2640
catgataaga tacattgatg agtttggaca aaccacaact agaatgcagt gaaaaaaatg 2700
ctttatttgt gaaatttgtg atgctattgc tttatttgta accattataa gctgcaataa 2760
acaagttaac aacaacaatt gcattcattt tatgtttcag gttcaggggg aggtgtggga 2820
ggttttttaa ctgggatggg atgtggaatc cttctagatt tcttttgtaa tatttataaa 2880
gtgctctcag caaggtatca aaatggcaaa attgtgagta actatcctcc tttcattttg 2940
ggaagaagat gaggcatgaa gagaattcag acagaaactt actcagacca ggggaggcag 3000
aaactaagca gagaggaaaa tgaccaagag ttagccctgg gcatggaatg tgaaagaacc 3060
ctaaacgtga cttggaaata atgcccaagg tatattccat tctccgggat ttgttggcat 3120
tttcttgagg tgaagaattg cagaatacat tctttaatgt gacctacata tttacccatg 3180
ggaggaagtc tgctcctgga ctcttgagat tcagtcataa agcccaggcc agggaaataa 3240
tgtaagtctg caggcccctg tcatcagtag gattagggag aagagttctc agtagaaaac 3300
agggaggctg gagagaaaag aatggttaat gttaacgtta atataactag aaagactgca 3360
gaacttagga ctgattttta tttgaatcct taaaaaaaaa atttcttatg aaaatagtac 3420
atggctctta ggagacagaa cttattgtac agaggaacag cgtgagagtc agagtgatcc 3480
cagaacaggt cctggctcca tcctgcacat agttttggtg ctgctggcaa tacggtcccc 3540
acaactgtgg gaaggggtta ggggcaggga tctcatcagg aaagcatagg ggtttaaagt 3600
tctttataga gcacttagaa gattgagaat ccacaaatta tattaataac aaacaaagta 3660
gtgtcgtgtt atatagtaaa tgtgaatttg cagacacatt tagggaaaag ttataattaa 3720
aaaaataggc tgtatatata cctgcaggtc tagatacgta gataagtagc atggcgggtt 3780
aatcattaac tacaaggaac ccctagtgat ggagttggcc actccctctc tgcgcgctcg 3840
ctcgctcact gaggccgggc gaccaaaggt cgcccgacgc ccgggctttg cccgggcggc 3900
ctcagtgagc gagcgagcgc gcagagaggg agtggccaa 3939
<210> 76
<211> 2211
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 76
atggctgccg atggttatct tccagattgg ctcgaggaca accttagtga aggaattcgc 60
gagtggtggg ctttgaaacc tggagcccct caacccaagg caaatcaaca acatcaagac 120
aacgctcgag gtcttgtgct tccgggttac aaataccttg gacccggcaa cggactcgat 180
aagggggagc cggtcaacgc agcagacgcg gcggccctcg agcacgacaa ggcctacgac 240
cagcagctca aggccggaga caacccgtac ctcaagtaca accacgccga cgccgagttc 300
caggagcggc tcaaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360
gccaaaaaga ggcttcttga acctcttggt ctggttgagg aagcggctaa gacggctcct 420
ggaaagaaga ggcctgtaga gcagtctcct caggaaccgg actcctccgc gggtattggc 480
aaatcgggtg cacagcccgc taaaaagaga ctcaatttcg gtcagactgg cgacacagag 540
tcagtcccag accctcaacc aatcggagaa cctcccgcag ccccctcagg tgtgggatct 600
cttacaatgg cttcaggtgg tggcgcacca gtggcagaca ataacgaagg tgccgatgga 660
gtgggtagtt cctcgggaaa ttggcattgc gattcccaat ggctggggga cagagtcatc 720
accaccagca cccgaacctg ggccctgccc acctacaaca atcacctcta caagcaaatc 780
tccaacagca catctggagg atcttcaaat gacaacgcct acttcggcta cagcaccccc 840
tgggggtatt ttgacttcaa cagattccac tgccacttct caccacgtga ctggcagcga 900
ctcatcaaca acaactgggg attccggcct aagcgactca acttcaagct cttcaacatt 960
caggtcaaag aggttacgga caacaatgga gtcaagacca tcgccaataa ccttaccagc 1020
acggtccagg tcttcacgga ctcagactat cagctcccgt acgtgctcgg gtcggctcac 1080
gagggctgcc tcccgccgtt cccagcggac gttttcatga ttcctcagta cgggtatctg 1140
acgcttaatg atggaagcca ggccgtgggt cgttcgtcct tttactgcct ggaatatttc 1200
ccgtcgcaaa tgctaagaac gggtaacaac ttccagttca gctacgagtt tgagaacgta 1260
cctttccata gcagctacgc tcacagccaa agcctggacc gactaatgaa tccactcatc 1320
gaccaatact tgtactatct ctcaaagact attaacggtt ctggacagaa tcaacaaacg 1380
ctaaaattca gtgtggccgg acccagcaac atggctgtcc agggaagaaa ctacatacct 1440
ggacccagct accgacaaca acgtgtctca accactgtga ctcaaaacaa caacagcgaa 1500
tttgcttggc ctagagcttc ttcttgggct ctcaatggac gtaatagctt gatgaatcct 1560
ggacctgcta tggccagcca caaagaagga gaggaccgtt tctttccttt gtctggatct 1620
ttaatttttg gcaaacaagg aactggaaga gacaacgtgg atgcggacaa agtcatgata 1680
accaacgaag aagaaattaa aactactaac ccggtagcaa cggagtccta tggacaagtg 1740
gccacaaacc accagagtgc ccaagcacag gcgcagaccg gctgggttca aaaccaagga 1800
atacttccgg gtatggtttg gcaggacaga gatgtgtacc tgcaaggacc catttgggcc 1860
aaaattcctc acacggacgg caactttcac ccttctccgc tgatgggagg gtttggaatg 1920
aagcacccgc ctcctcagat cctcatcaaa aacacacctg tacctgcgga tcctccaacg 1980
gccttcaaca aggacaagct gaactctttc atcacccagt attctactgg ccaagtcagc 2040
gtggagatcg agtgggagct gcagaaggaa aacagcaagc gctggaaccc ggagatccag 2100
tacacttcca actattacaa gtctaataat gttgaatttg ctgttaatac tgaaggtgta 2160
tatagtgaac cccgccccat tggcaccaga tacctgactc gtaatctgta a 2211
<210> 77
<211> 4093
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 77
atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60
ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120
tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180
cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240
caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300
aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360
taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420
gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480
acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540
aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600
gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660
tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720
cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780
tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840
cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900
attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960
acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020
accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080
aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140
aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200
gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260
aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320
ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380
gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440
gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500
gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560
gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620
aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680
ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740
tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800
ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860
caataaatga cttaaaccag gtatggctgc cgatggttat cttccagatt ggctcgagga 1920
caaccttagt gaaggaattc gcgagtggtg ggctttgaaa cctggagccc ctcaacccaa 1980
ggcaaatcaa caacatcaag acaacgctcg aggtcttgtg cttccgggtt acaaatacct 2040
tggacccggc aacggactcg ataaggggga gccggtcaac gcagcagacg cggcggccct 2100
cgagcacgac aaggcctacg accagcagct caaggccgga gacaacccgt acctcaagta 2160
caaccacgcc gacgccgagt tccaggagcg gctcaaagaa gatacgtctt ttgggggcaa 2220
cctcgggcga gcagtcttcc aggccaaaaa gaggcttctt gaacctcttg gtctggttga 2280
ggaagcggct aagacggctc ctggaaagaa gaggcctgta gagcagtctc ctcaggaacc 2340
ggactcctcc gcgggtattg gcaaatcggg tgcacagccc gctaaaaaga gactcaattt 2400
cggtcagact ggcgacacag agtcagtccc agaccctcaa ccaatcggag aacctcccgc 2460
agccccctca ggtgtgggat ctcttacaat ggcttcaggt ggtggcgcac cagtggcaga 2520
caataacgaa ggtgccgatg gagtgggtag ttcctcggga aattggcatt gcgattccca 2580
atggctgggg gacagagtca tcaccaccag cacccgaacc tgggccctgc ccacctacaa 2640
caatcacctc tacaagcaaa tctccaacag cacatctgga ggatcttcaa atgacaacgc 2700
ctacttcggc tacagcaccc cctgggggta ttttgacttc aacagattcc actgccactt 2760
ctcaccacgt gactggcagc gactcatcaa caacaactgg ggattccggc ctaagcgact 2820
caacttcaag ctcttcaaca ttcaggtcaa agaggttacg gacaacaatg gagtcaagac 2880
catcgccaat aaccttacca gcacggtcca ggtcttcacg gactcagact atcagctccc 2940
gtacgtgctc gggtcggctc acgagggctg cctcccgccg ttcccagcgg acgttttcat 3000
gattcctcag tacgggtatc tgacgcttaa tgatggaagc caggccgtgg gtcgttcgtc 3060
cttttactgc ctggaatatt tcccgtcgca aatgctaaga acgggtaaca acttccagtt 3120
cagctacgag tttgagaacg tacctttcca tagcagctac gctcacagcc aaagcctgga 3180
ccgactaatg aatccactca tcgaccaata cttgtactat ctctcaaaga ctattaacgg 3240
ttctggacag aatcaacaaa cgctaaaatt cagtgtggcc ggacccagca acatggctgt 3300
ccagggaaga aactacatac ctggacccag ctaccgacaa caacgtgtct caaccactgt 3360
gactcaaaac aacaacagcg aatttgcttg gcctagagct tcttcttggg ctctcaatgg 3420
acgtaatagc ttgatgaatc ctggacctgc tatggccagc cacaaagaag gagaggaccg 3480
tttctttcct ttgtctggat ctttaatttt tggcaaacaa ggaactggaa gagacaacgt 3540
ggatgcggac aaagtcatga taaccaacga agaagaaatt aaaactacta acccggtagc 3600
aacggagtcc tatggacaag tggccacaaa ccaccagagt gcccaagcac aggcgcagac 3660
cggctgggtt caaaaccaag gaatacttcc gggtatggtt tggcaggaca gagatgtgta 3720
cctgcaagga cccatttggg ccaaaattcc tcacacggac ggcaactttc acccttctcc 3780
gctgatggga gggtttggaa tgaagcaccc gcctcctcag atcctcatca aaaacacacc 3840
tgtacctgcg gatcctccaa cggccttcaa caaggacaag ctgaactctt tcatcaccca 3900
gtattctact ggccaagtca gcgtggagat cgagtgggag ctgcagaagg aaaacagcaa 3960
gcgctggaac ccggagatcc agtacacttc caactattac aagtctaata atgttgaatt 4020
tgctgttaat actgaaggtg tatatagtga accccgcccc attggcacca gatacctgac 4080
tcgtaatctg taa 4093
<210> 78
<211> 2356
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 78
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggaatt cacgcgtgga 120
tctgaattca attcacgcgt ggtacctccc taaaatgggc aaacattgca agcagcaaac 180
agcaaacaca cagccctccc tgcctgctga ccttggagct ggggcagagg tcagagacct 240
ctctgggccc atgccacctc caacatccac tcgacccctt ggaatttcgg tggagaggag 300
cagaggttgt cctggcgtgg tttaggtagt gtgagagggg aatgactcct ttcggtaagt 360
gcagtggaag ctgtacactg cccaggcaaa gcgtccgggc agcgtaggcg ggcgactcag 420
atcccagcca gtggacttag cccctgtttg ctcctccgat aactggggtg accttggtta 480
atattcacca gcagcctccc ccgttgcccc tctggatcca ctgcttaaat acggacgagg 540
acagggccct gtctcctcag cttcaggcac caccactgac ctgggacagt gaatcctcta 600
aggtaaatat aaaattttta agtgtataat gtgttaaact actgattcta attgtttctc 660
tcttttagat tccaaccttt ggaactgacc gccaccatgt ccaccgctgt gctggagaac 720
cctgggctgg ggaggaaact gtcagacttc gggcaggaga cttcatacat tgaggataac 780
tgtaaccaga atggcgccat ctctctgatc ttcagcctga aggaggaagt gggcgccctg 840
gcaaaggtgc tgcgcctgtt tgaggagaac gacgtgaatc tgacccacat cgagtcccgg 900
ccttctagac tgaagaagga cgagtacgag ttctttaccc acctggataa gcggtccctg 960
ccagccctga caaacatcat caagatcctg aggcacgaca tcggagcaac cgtgcacgag 1020
ctgtctcggg acaagaagaa ggataccgtg ccctggttcc ctcggacaat ccaggagctg 1080
gatagatttg ccaaccagat cctgtcttac ggagcagagc tggacgcaga tcaccctggc 1140
ttcaaggacc cagtgtatcg ggcccggaga aagcagtttg ccgatatcgc ctacaattat 1200
aggcacggac agccaatccc tcgcgtggag tatatggagg aggagaagaa gacctggggc 1260
acagtgttca agaccctgaa gagcctgtac aagacacacg cctgctacga gtataaccac 1320
atcttccccc tgctggagaa gtattgtggc tttcacgagg acaatatccc tcagctggag 1380
gacgtgagcc agttcctgca gacctgcaca ggctttaggc tgaggccagt ggcaggactg 1440
ctgagctccc gggacttcct gggaggactg gccttcagag tgtttcactg cacccagtac 1500
atcaggcacg gctccaagcc aatgtataca ccagagcccg acatctgtca cgagctgctg 1560
ggccacgtgc ccctgtttag cgatagatcc ttcgcccagt tttcccagga gatcggactg 1620
gcatctctgg gagcacctga cgagtacatc gagaagctgg ccaccatcta ttggttcaca 1680
gtggagtttg gcctgtgcaa gcagggcgat agcatcaagg cctacggagc aggactgctg 1740
tctagcttcg gcgagctgca gtattgtctg tccgagaagc caaagctgct gcccctggag 1800
ctggagaaga ccgccatcca gaactacacc gtgacagagt tccagcccct gtactatgtg 1860
gccgagtctt ttaacgatgc caaggagaag gtgagaaatt tcgccgccac aatccctagg 1920
cccttcagcg tgcggtacga cccttatacc cagaggatcg aggtgctgga taatacacag 1980
cagctgaaga tcctggctga ctcaatcaat agcgaaatcg gaatcctgtg ctccgccctg 2040
cagaaaatca aatgaatgct ttatttgtga aatttgtgat gctattgctt tatttgtaac 2100
cattataagc tgcaataaac aagttaacaa caacaattgc attcatttta tgtttcaggt 2160
tcagggggag gtgtgggagg ttttttaaag catgctgggg agagatcgat ctgaggaacc 2220
cctagtgatg gagttggcca ctccctctct gcgcgctcgc tcgctcactg aggccgggcg 2280
accaaaggtc gcccgacgcc cgggctttgc ccgggcggcc tcagtgagcg agcgagcgcg 2340
cagagaggga gtggcc 2356
<210> 79
<211> 1359
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 79
atgtccaccg ctgtgctgga gaaccctggg ctggggagga aactgtcaga cttcgggcag 60
gagacttcat acattgagga taactgtaac cagaatggcg ccatctctct gatcttcagc 120
ctgaaggagg aagtgggcgc cctggcaaag gtgctgcgcc tgtttgagga gaacgacgtg 180
aatctgaccc acatcgagtc ccggccttct agactgaaga aggacgagta cgagttcttt 240
acccacctgg ataagcggtc cctgccagcc ctgacaaaca tcatcaagat cctgaggcac 300
gacatcggag caaccgtgca cgagctgtct cgggacaaga agaaggatac cgtgccctgg 360
ttccctcgga caatccagga gctggataga tttgccaacc agatcctgtc ttacggagca 420
gagctggacg cagatcaccc tggcttcaag gacccagtgt atcgggcccg gagaaagcag 480
tttgccgata tcgcctacaa ttataggcac ggacagccaa tccctcgcgt ggagtatatg 540
gaggaggaga agaagacctg gggcacagtg ttcaagaccc tgaagagcct gtacaagaca 600
cacgcctgct acgagtataa ccacatcttc cccctgctgg agaagtattg tggctttcac 660
gaggacaata tccctcagct ggaggacgtg agccagttcc tgcagacctg cacaggcttt 720
aggctgaggc cagtggcagg actgctgagc tcccgggact tcctgggagg actggccttc 780
agagtgtttc actgcaccca gtacatcagg cacggctcca agccaatgta tacaccagag 840
cccgacatct gtcacgagct gctgggccac gtgcccctgt ttagcgatag atccttcgcc 900
cagttttccc aggagatcgg actggcatct ctgggagcac ctgacgagta catcgagaag 960
ctggccacca tctattggtt cacagtggag tttggcctgt gcaagcaggg cgatagcatc 1020
aaggcctacg gagcaggact gctgtctagc ttcggcgagc tgcagtattg tctgtccgag 1080
aagccaaagc tgctgcccct ggagctggag aagaccgcca tccagaacta caccgtgaca 1140
gagttccagc ccctgtacta tgtggccgag tcttttaacg atgccaagga gaaggtgaga 1200
aatttcgccg ccacaatccc taggcccttc agtgtgcgtt acgaccctta tacccagagg 1260
atcgaggtgc tggataatac acagcagctg aagatcctgg ctgactcaat caatagcgaa 1320
atcggaatcc tgtgctccgc cctgcagaaa atcaaatga 1359
<210> 80
<211> 4452
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 80
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180
ggttagggag gtcctgcata tgcggccgct tcaggagcag ttgtgcgaat agctggagaa 240
caccaggctg gatttaaacc cagatcgctc ttacatttgc tctttacctg ctgtgctcag 300
cgttcacgtg ccctctagct gtagttttct gaagtcagcg cacagcaagg cagtgtgctt 360
agaggttaac agaagggaaa acaacaacaa caaaaatcta aatgagaatc ctgactgttt 420
cagctggggg taaggggggc ggattattca tataattgtt ataccagacg gtcgcaggct 480
tagtccaatt gcagagaact cgcttcccag gcttctgaga gtcccggaag tgcctaaacc 540
tgtctaatcg acggggcttg ggtggcccgt cgctccctgg cttcttccct ttacccaggg 600
cgggcagcga agtggtgcct cctgcgtccc ccacaccctc cctcagcccc tcccctccgg 660
cccgtcctgg gcaggtgacc tggagcatcc ggcaggctgc cctggcctcc tgcgtcagga 720
caacgcccac gaggggcgtt actgtgcgga gatgcaccac gcaagagaca ccctttgtaa 780
ctctcttctc ctccctagtg cgaggttaaa accttcagcc ccacgtgctg tttgcaaacc 840
tgcctgtacc tgaggcccta aaaagccaga gacctcactc ccggggagcc agcatgtcca 900
ctgcggtcct ggaaaaccca ggcttgggca ggaaactctc tgactttgga caggtgagcc 960
acggcagcct gagctgctca gttaggggaa tttgggcctc cagagaaaga gatctgaaga 1020
ctgctggtgc ttcctggttt cataagctca gtaagaagtc tgaattcgtt ggaagctgat 1080
gagaatatcc aggaagtcaa cagacaaatg tcctcaacaa ttgtttctaa gtaggagaac 1140
atctgtcctc ggtggctttc acaggaaccc taaaatgggc aaacattgca agcagcaaac 1200
agcaaacaca cagccctccc tgcctgctga ccttggagct ggggcagagg tcagagacct 1260
ctctgggccc atgccacctc caacatccac tcgacccctt ggaatttcgg tggagaggag 1320
cagaggttgt cctggcgtgg tttaggtagt gtgagagggg aatgactcct ttcggtaagt 1380
gcagtggaag ctgtacactg cccaggcaaa gcgtccgggc agcgtaggcg ggcgactcag 1440
atcccagcca gtggacttag cccctgtttg ctcctccgat aactggggtg accttggtta 1500
atattcacca gcagcctccc ccgttgcccc tctggatcca ctgcttaaat acggacgagg 1560
acagggccct gtctcctcag cttcaggcac caccactgac ctgggacagt gaatcctcta 1620
aggtaaatat aaaattttta agtgtataat gtgttaaact actgattcta attgtttctc 1680
tcttttagat tccaaccttt ggaactgacc gccaccatgt ccaccgctgt gctggagaac 1740
cctgggctgg ggaggaaact gtcagacttc gggcaggaga cttcatacat tgaggataac 1800
tgtaaccaga atggcgccat ctctctgatc ttcagcctga aggaggaagt gggcgccctg 1860
gcaaaggtgc tgcgcctgtt tgaggagaac gacgtgaatc tgacccacat cgagtcccgg 1920
ccttctagac tgaagaagga cgagtacgag ttctttaccc acctggataa gcggtccctg 1980
ccagccctga caaacatcat caagatcctg aggcacgaca tcggagcaac cgtgcacgag 2040
ctgtctcggg acaagaagaa ggataccgtg ccctggttcc ctcggacaat ccaggagctg 2100
gatagatttg ccaaccagat cctgtcttac ggagcagagc tggacgcaga tcaccctggc 2160
ttcaaggacc cagtgtatcg ggcccggaga aagcagtttg ccgatatcgc ctacaattat 2220
aggcacggac agccaatccc tcgcgtggag tatatggagg aggagaagaa gacctggggc 2280
acagtgttca agaccctgaa gagcctgtac aagacacacg cctgctacga gtataaccac 2340
atcttccccc tgctggagaa gtattgtggc tttcacgagg acaatatccc tcagctggag 2400
gacgtgagcc agttcctgca gacctgcaca ggctttaggc tgaggccagt ggcaggactg 2460
ctgagctccc gggacttcct gggaggactg gccttcagag tgtttcactg cacccagtac 2520
atcaggcacg gctccaagcc aatgtataca ccagagcccg acatctgtca cgagctgctg 2580
ggccacgtgc ccctgtttag cgatagatcc ttcgcccagt tttcccagga gatcggactg 2640
gcatctctgg gagcacctga cgagtacatc gagaagctgg ccaccatcta ttggttcaca 2700
gtggagtttg gcctgtgcaa gcagggcgat agcatcaagg cctacggagc aggactgctg 2760
tctagcttcg gcgagctgca gtattgtctg tccgagaagc caaagctgct gcccctggag 2820
ctggagaaga ccgccatcca gaactacacc gtgacagagt tccagcccct gtactatgtg 2880
gccgagtctt ttaacgatgc caaggagaag gtgagaaatt tcgccgccac aatccctagg 2940
cccttcagtg tgcgttacga cccttatacc cagaggatcg aggtgctgga taatacacag 3000
cagctgaaga tcctggctga ctcaatcaat agcgaaatcg gaatcctgtg ctccgccctg 3060
cagaaaatca aatgagaatt caaggcctct cgagcctcta gaactatagt gagtcgtatt 3120
acgtagatcc agacatgata agatacattg atgagtttgg acaaaccaca actagaatgc 3180
agtgaaaaaa atgctttatt tgtgaaattt gtgatgctat tgctttattt gtaaccatta 3240
taagctgcaa taaacaagtt aacaacaaca attgcattca ttttatgttt caggttcagg 3300
gggaggtgtg ggaggttttt taagctttac gtacgatcgt cgactgggat gggatgtgga 3360
atccttctag atttcttttg taatatttat aaagtgctct cagcaaggta tcaaaatggc 3420
aaaattgtga gtaactatcc tcctttcatt ttgggaagaa gatgaggcat gaagagaatt 3480
cagacagaaa cttactcaga ccaggggagg cagaaactaa gcagagagga aaatgaccaa 3540
gagttagccc tgggcatgga atgtgaaaga accctaaacg tgacttggaa ataatgccca 3600
aggtatattc cattctccgg gatttgttgg cattttcttg aggtgaagaa ttgcagaata 3660
cattctttaa tgtgacctac atatttaccc atgggaggaa gtctgctcct ggactcttga 3720
gattcagtca taaagcccag gccagggaaa taatgtaagt ctgcaggccc ctgtcatcag 3780
taggattagg gagaagagtt ctcagtagaa aacagggagg ctggagagaa aagaatggtt 3840
aatgttaacg ttaatataac tagaaagact gcagaactta ggactgattt ttatttgaat 3900
ccttaaaaaa aaaatttctt atgaaaatag tacatggctc ttaggagaca gaacttattg 3960
tacagaggaa cagcgtgaga gtcagagtga tcccagaaca ggtcctggct ccatcctgca 4020
catagttttg gtgctgctgg caatacggtc cccacaactg tgggaagggg ttaggggcag 4080
ggatctcatc aggaaagcat aggggtttaa agttctttat agagcactta gaagattgag 4140
aatccacaaa ttatattaat aacaaacaaa gtagtgtcgt gttatatagt aaatgtgaat 4200
ttgcagacac atttagggaa aagttataat taaaaaaata ggctgtatat atacctgcag 4260
gtctagatac gtagataagt agcatggcgg gttaatcatt aactacaagg aacccctagt 4320
gatggagttg gccactccct ctctgcgcgc tcgctcgctc actgaggccg ggcgaccaaa 4380
ggtcgcccga cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag cgcgcagaga 4440
gggagtggcc aa 4452
<210> 81
<211> 1735
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 81
atgcccccac ccaggaccgg aagaggcctg ctgtggctgg gcctggtgct ctcttccgtg 60
tgcgtggccc tgggaagcga aacccaggcc aacagcacaa ccgacgccct gaatgtgctg 120
ctgatcattg tggacgatct gagaccctcc ctgggctgtt acggcgacaa actggtgcgg 180
tccccaaaca tcgaccagct ggcctcccac tccctgctgt tccagaacgc cttcgcccag 240
caggccgtgt gtgcccccag cagggtgagc ttcctgaccg gcagaagacc tgacaccacc 300
aggctgtacg actttaacag ctactggcgg gtgcacgccg gcaatttcag caccattcct 360
cagtacttca aggagaatgg ctacgtgaca atgtccgtgg gcaaggtgtt tcatcccggc 420
attagctcca accacaccga cgatagccca tactcctggt ccttcccccc ctaccatccc 480
tccagcgaga agtacgagaa caccaaaacc tgcagaggcc ctgacggaga gctgcacgcc 540
aacctgctgt gccctgtgga tgtcctggat gtgcccgaag gtaagggttt aagggatggt 600
tggttggtgg ggtattaatg tttaattacc tggagcacct gcctgaaatc actttttttc 660
aggcaccctg ccagacaagc agtccacaga gcaggccatc cagctgctgg agaagatgaa 720
gacaagcgcc agccccttct ttctggccgt gggataccac aagcctcaca ttccattccg 780
gtacccaaaa gagttccaga agctgtaccc tctggaaaac atcaccctgg cccctgaccc 840
cgaggtgcca gacgggctgc ctcctgtggc ctacaatccc tggatggaca tcagacagcg 900
ggaggatgtg caggccctga atatttccgt gccctatggg cccatccctg tggactttca 960
gcggaaaatc agacagtctt actttgccag cgtgtcctac ctggacaccc aggtgggccg 1020
cctgctctca gccctggacg acctgcagct ggccaattcc accatcatcg ccttcaccag 1080
cgatcacggc tgggccctgg gcgagcacgg ggagtgggcc aaatacagca acttcgatgt 1140
ggccacccac gtgcctctga ttttttatgt gcccggccgg acagccagcc tgcccgaggc 1200
cggggagaag ctctttcctt acctggaccc tttcgactct gccagccagc tgatggaacc 1260
tggcagacag agcatggacc tggtggagct ggtgagcctc ttccccactc tggccggcct 1320
ggctggcctg caggtgccac caagatgccc agtgccttct ttccacgtgg agctgtgtag 1380
agagggaaag aacctgctga agcacttcag atttagagat ctggaggagg atccctacct 1440
gccaggcaac ccaagggagc tgatcgccta cagccagtat cccagaccct ctgatatccc 1500
ccagtggaac agcgataagc cctccctgaa agacatcaag attatgggct actccatcag 1560
gaccattgac taccggtaca cagtgtgggt gggcttcaac cccgatgagt ttctggccaa 1620
cttcagcgac atccacgccg gcgagctgta ttttgtggac tccgaccccc tgcaggacca 1680
caacatgtac aacgactccc agggcggcga cctgttccag ctgctgatgc cctga 1735
<210> 82
<211> 2521
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 82
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180
ggttagggag gtcctgcata tgcggccgca actcacgggg atttccaagt ctccacccca 240
ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg ggactttcca aaatgtcgta 300
ataaccccgc cccgttgacg caaatgggcg gtaggcgtgt acggtgggag gtctatataa 360
gcagagctcg tttagtgaac cgtgccacca tgcccccacc caggaccgga agaggcctgc 420
tgtggctggg cctggtgctc tcttccgtgt gcgtggccct gggaagcgaa acccaggcca 480
acagcacaac cgacgccctg aatgtgctgc tgatcattgt ggacgatctg agaccctccc 540
tgggctgtta cggcgacaaa ctggtgcggt ccccaaacat cgaccagctg gcctcccact 600
ccctgctgtt ccagaacgcc ttcgcccagc aggccgtgtg tgcccccagc agggtgagct 660
tcctgaccgg cagaagacct gacaccacca ggctgtacga ctttaacagc tactggcggg 720
tgcacgccgg caatttcagc accattcctc agtacttcaa ggagaatggc tacgtgacaa 780
tgtccgtggg caaggtgttt catcccggca ttagctccaa ccacaccgac gatagcccat 840
actcctggtc cttccccccc taccatccct ccagcgagaa gtacgagaac accaaaacct 900
gcagaggccc tgacggagag ctgcacgcca acctgctgtg ccctgtggat gtcctggatg 960
tgcccgaagg taagggttta agggatggtt ggttggtggg gtattaatgt ttaattacct 1020
ggagcacctg cctgaaatca ctttttttca ggcaccctgc cagacaagca gtccacagag 1080
caggccatcc agctgctgga gaagatgaag acaagcgcca gccccttctt tctggccgtg 1140
ggataccaca agcctcacat tccattccgg tacccaaaag agttccagaa gctgtaccct 1200
ctggaaaaca tcaccctggc ccctgacccc gaggtgccag acgggctgcc tcctgtggcc 1260
tacaatccct ggatggacat cagacagcgg gaggatgtgc aggccctgaa tatttccgtg 1320
ccctatgggc ccatccctgt ggactttcag cggaaaatca gacagtctta ctttgccagc 1380
gtgtcctacc tggacaccca ggtgggccgc ctgctctcag ccctggacga cctgcagctg 1440
gccaattcca ccatcatcgc cttcaccagc gatcacggct gggccctggg cgagcacggg 1500
gagtgggcca aatacagcaa cttcgatgtg gccacccacg tgcctctgat tttttatgtg 1560
cccggccgga cagccagcct gcccgaggcc ggggagaagc tctttcctta cctggaccct 1620
ttcgactctg ccagccagct gatggaacct ggcagacaga gcatggacct ggtggagctg 1680
gtgagcctct tccccactct ggccggcctg gctggcctgc aggtgccacc aagatgccca 1740
gtgccttctt tccacgtgga gctgtgtaga gagggaaaga acctgctgaa gcacttcaga 1800
tttagagatc tggaggagga tccctacctg ccaggcaacc caagggagct gatcgcctac 1860
agccagtatc ccagaccctc tgatatcccc cagtggaaca gcgataagcc ctccctgaaa 1920
gacatcaaga ttatgggcta ctccatcagg accattgact accggtacac agtgtgggtg 1980
ggcttcaacc ccgatgagtt tctggccaac ttcagcgaca tccacgccgg cgagctgtat 2040
tttgtggact ccgaccccct gcaggaccac aacatgtaca acgactccca gggcggcgac 2100
ctgttccagc tgctgatgcc ctgagatcca gacatgataa gatacattga tgagtttgga 2160
caaaccacaa ctagaatgca gtgaaaaaaa tgctttattt gtgaaatttg tgatgctatt 2220
gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa ttgcattcat 2280
tttatgtttc aggttcaggg ggaggtgtgg gaggtttttt aacctgcagg tctagatacg 2340
tagataagta gcatggcggg ttaatcatta actacaagga acccctagtg atggagttgg 2400
ccactccctc tctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 2460
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 2520
a 2521
<210> 83
<211> 3668
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 83
ttttcccaga gacaggctca gggacttctg ggtgtagtgg ctgtgcaggg cttcgtggag 60
cacgctgcag ctaaacacgt tgccctcttg ccatcggctc ttgtccacgg tcagccgtga 120
atacaggaag aagctgccat cgctgtccag cactggaggg gtcgtcttgt agttgttttc 180
aggctgtccg ttgctctccc attcgacggc gatgtcgctg gggtagaagc ccttcaccag 240
gcaggtcaga gacacttggt tctttgtcat ttcttcttga gaaggaggca gtgtatagac 300
ttggggctct ctgggctggc ccttggcctt tgagatggtc ttctcgatgc tgctaggcag 360
gcccttgtta gacaccttgc acttgtactc tttgccgttc agccagtcct ggtgcagcac 420
tgtcagcacg gacaccaccc ggtaggtgct gttaaactgt tcctcgcggg gtttggtctt 480
ggcattatga acttccactc cgtcaacgta ccaattaaac tgcacctcag gatcctcctg 540
ggacacatcc accaccacac atgtcacttc aggggtccgg ctgatcatca gggtgtcttt 600
gggctttggt gggaacagga aaacagaagg gccggcgact ggtggagctg gacatggtgg 660
gcattccacg cagcactttc tctcaacggt cttatccact ttggtgttgc taggcttgtg 720
gtccacatta caggtgtagg tctgtgtgcc gaagttggag ctaggaacgg tgaccacgct 780
actcagagaa tacaggccag agctctgcag cacggctggg aaggtgtgca cgccgcttgt 840
cagggcgccg ctgttccagc tcactgtcac gggttcgggg aagtagtctt tgaccagaca 900
acccagggcg gctgtgcttt cagatgtgct tctgctgcat ggggccagtg ggaacacgct 960
gggtccctta gtactggcgc tgctgacggt gacaagggtg ccttggcccc acacgtcgaa 1020
gtaccagtta ggggatgagc caaaaaagta tctggcgcag tagtacacag ctgtgtcctc 1080
gcttctcagg ctgctcagtt ccatgtacac ggtgcttgtg gaggtatctc tggtcatggt 1140
cactctatcc ttgaagttct ctgtgtactc ggtgtggcca gatcctggca ggatctcgcc 1200
catccattcc aggccttggc caggggcctg ccgcacccac tggatccagt agttgctgaa 1260
gatgtggccg ctggccttgc aggacacctt cacgctagct ccgggctttt tcacttcggc 1320
tccgctttga accagctgca cttggctgtg cacgcctgtg gcggtggcca ccaggaacag 1380
gatgatgcag gaccagccca tggtggcact agttcagttc caaaggttgg aatctaaaag 1440
agagaaacaa ttagaatcag tagtttaaca cattatacac ttaaaaattt tatatttacc 1500
ttagaggatt cactgtccca ggtcagtggt ggtgcctgaa gctgaggaga cagggccctg 1560
tcctcgtccg tatttaagca gtggatccag aggggcaacg ggggaggctg ctggtgaata 1620
ttaaccaagg tcaccccagt tatcggagga gcaaacaggg gctaagtcca ctggctggga 1680
tctgagtcgc ccgcctacgc tgcccggacg ctttgcctgg gcagtgtaca gcttccactg 1740
cacttaccga aaggagtcat tcccctctca cactacctaa accacgccag gacaacctct 1800
gctcctctcc accgaaattc caaggggtcg agtggatgtt ggaggtggca tgggcccaga 1860
gaggtctctg acctctgccc cagctccaag gtcagcaggc agggagggct gtgtgtttgc 1920
tgtttgctgc ttgcaatgtt tgcccatttt agggccgcgg cacgtgctta aggccccctt 1980
ttgcatccag tttattccta catttgtcac actgttaaca gcccacccct tccaatgaga 2040
ccagtggtat cagtgagttg tggagatcag gaaaagggct caagagaaag gcagtcaaag 2100
ccctttttct gtccctgtcc cagctgcttt aataagatct ccataagaga agagggacag 2160
ctatgactgg gagtagtcag gagaggagga aaaatctggc tagtaaaaca tgtaaggaaa 2220
attttaggga tgttaaagaa aaaaataaca caaaacaaaa tataaaaaaa atctaacctc 2280
aagtcaaggc ttttctatgg aataaggaat ggacagcagg gggctgtttc atatactgat 2340
gacctcttta tagccaacct ttgttcatgg cagccagcat atgggcatat gttgccaaac 2400
tctaaaccaa atactcattc tgatgtttta aatgatttgc cctcccatat gtccttccga 2460
gtgagagaca caaaaaattc caacacacta ttgcaatgaa aataaatttc ctttattagc 2520
cagaagtcag atgctcaagg ggcttcatga tgtccccata atttttggca gagggaaaaa 2580
gatctccgga gggggaggct gctggtgaat attaaccaag gtcaccccag ttatcggagg 2640
agcaaacagg ggctaagtcc acctcgagcc atggcgatgc tctaatctct ctagacaagg 2700
ttcatatttg tatgggttac ttattctctc tttgttgact aagtcaataa tcagaatcag 2760
caggtttgca gtcagattgg cagggataag cagcctagct caggagaagt gagtataaaa 2820
gccccaggct gggagcagcc atcagctagc gccggcaaga ggtaagggtt taagggatgg 2880
ttggttggtg gggtattaat gtttaattac ctggagcacc tgcctgaaat cacttttttt 2940
caggttggac cggtgccacc atggacatga gggtccctgc tcagctgctg gggctcctgc 3000
tgctctggct cagcggtgcc agatgtgata tccagatgac ccagtctcca tctagcctgt 3060
ccgccagcgt gggcgacaga gtgaccatca cctgcggcgc cagcgagaac atctatggcg 3120
ctctgaactg gtaccagcag aaacctggca aggcccctaa gctgctgatc tacggcgcca 3180
ccaacctggc cgatggcgtg cctagtagat tcagcggatc tggcagcggc acagacttca 3240
ccctgaccat cagcagcctg caacctgagg actttgccac atactactgc cagaacgtgc 3300
tgaatacacc tctgacattc ggccaaggaa ccaaagtgga aatcaagcgg accgtggccg 3360
ctcctagcgt gttcatcttc cctccttccg atgaacaact gaagagcgga accgcctctg 3420
tggtgtgcct gctgaacaac ttctacccta gagaggccaa ggtgcagtgg aaggtcgaca 3480
acgccctgca gagcggcaac agccaggaga gcgtgacgga acaggacagc aaggacagca 3540
cctacagcct gagctccacc cttacactgt ctaaagccga ctacgagaag cacaaggtgt 3600
acgcctgtga agtgacacac cagggcctga gcagccctgt gaccaagtct tttaaccggg 3660
gcgagtgc 3668
<210> 84
<211> 4483
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 84
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180
ggttagggag gtcctgcaca cgtgacgcgt ccttgctgtc ctgccccacc ccacccccca 240
gaatagaatg acacctactc agacaatgcg atgcaatttc ctcattttat taggaaagga 300
cagtgggagt ggcaccttcc agggtcaagg aaggcacggg ggaggggcaa acaacagatg 360
gctggcaact agaaggcaca gcctcgagga acgttttatt ttcccagaga caggctcagg 420
gacttctggg tgtagtggct gtgcagggct tcgtggagca cgctgcagct aaacacgttg 480
ccctcttgcc atcggctctt gtccacggtc agccgtgaat acaggaagaa gctgccatcg 540
ctgtccagca ctggaggggt cgtcttgtag ttgttttcag gctgtccgtt gctctcccat 600
tcgacggcga tgtcgctggg gtagaagccc ttcaccaggc aggtcagaga cacttggttc 660
tttgtcattt cttcttgaga aggaggcagt gtatagactt ggggctctct gggctggccc 720
ttggcctttg agatggtctt ctcgatgctg ctaggcaggc ccttgttaga caccttgcac 780
ttgtactctt tgccgttcag ccagtcctgg tgcagcactg tcagcacgga caccacccgg 840
taggtgctgt taaactgttc ctcgcggggt ttggtcttgg cattatgaac ttccactccg 900
tcaacgtacc aattaaactg cacctcagga tcctcctggg acacatccac caccacacat 960
gtcacttcag gggtccggct gatcatcagg gtgtctttgg gctttggtgg gaacaggaaa 1020
acagaagggc cggcgactgg tggagctgga catggtgggc attccacgca gcactttctc 1080
tcaacggtct tatccacttt ggtgttgcta ggcttgtggt ccacattaca ggtgtaggtc 1140
tgtgtgccga agttggagct aggaacggtg accacgctac tcagagaata caggccagag 1200
ctctgcagca cggctgggaa ggtgtgcacg ccgcttgtca gggcgccgct gttccagctc 1260
actgtcacgg gttcggggaa gtagtctttg accagacaac ccagggcggc tgtgctttca 1320
gatgtgcttc tgctgcatgg ggccagtggg aacacgctgg gtcccttagt actggcgctg 1380
ctgacggtga caagggtgcc ttggccccac acgtcgaagt accagttagg ggatgagcca 1440
aaaaagtatc tggcgcagta gtacacagct gtgtcctcgc ttctcaggct gctcagttcc 1500
atgtacacgg tgcttgtgga ggtatctctg gtcatggtca ctctatcctt gaagttctct 1560
gtgtactcgg tgtggccaga tcctggcagg atctcgccca tccattccag gccttggcca 1620
ggggcctgcc gcacccactg gatccagtag ttgctgaaga tgtggccgct ggccttgcag 1680
gacaccttca cgctagctcc gggctttttc acttcggctc cgctttgaac cagctgcact 1740
tggctgtgca cgcctgtggc ggtggccacc aggaacagga tgatgcagga ccagcccatg 1800
gtggcactag ttcagttcca aaggttggaa tctaaaagag agaaacaatt agaatcagta 1860
gtttaacaca ttatacactt aaaaatttta tatttacctt agaggattca ctgtcccagg 1920
tcagtggtgg tgcctgaagc tgaggagaca gggccctgtc ctcgtccgta tttaagcagt 1980
ggatccagag gggcaacggg ggaggctgct ggtgaatatt aaccaaggtc accccagtta 2040
tcggaggagc aaacaggggc taagtccact ggctgggatc tgagtcgccc gcctacgctg 2100
cccggacgct ttgcctgggc agtgtacagc ttccactgca cttaccgaaa ggagtcattc 2160
ccctctcaca ctacctaaac cacgccagga caacctctgc tcctctccac cgaaattcca 2220
aggggtcgag tggatgttgg aggtggcatg ggcccagaga ggtctctgac ctctgcccca 2280
gctccaaggt cagcaggcag ggagggctgt gtgtttgctg tttgctgctt gcaatgtttg 2340
cccattttag ggccgcggca cgtgcttaag gccccctttt gcatccagtt tattcctaca 2400
tttgtcacac tgttaacagc ccaccccttc caatgagacc agtggtatca gtgagttgtg 2460
gagatcagga aaagggctca agagaaaggc agtcaaagcc ctttttctgt ccctgtccca 2520
gctgctttaa taagatctcc ataagagaag agggacagct atgactggga gtagtcagga 2580
gaggaggaaa aatctggcta gtaaaacatg taaggaaaat tttagggatg ttaaagaaaa 2640
aaataacaca aaacaaaata taaaaaaaat ctaacctcaa gtcaaggctt ttctatggaa 2700
taaggaatgg acagcagggg gctgtttcat atactgatga cctctttata gccaaccttt 2760
gttcatggca gccagcatat gggcatatgt tgccaaactc taaaccaaat actcattctg 2820
atgttttaaa tgatttgccc tcccatatgt ccttccgagt gagagacaca aaaaattcca 2880
acacactatt gcaatgaaaa taaatttcct ttattagcca gaagtcagat gctcaagggg 2940
cttcatgatg tccccataat ttttggcaga gggaaaaaga tctccggagg gggaggctgc 3000
tggtgaatat taaccaaggt caccccagtt atcggaggag caaacagggg ctaagtccac 3060
ctcgagccat ggcgatgctc taatctctct agacaaggtt catatttgta tgggttactt 3120
attctctctt tgttgactaa gtcaataatc agaatcagca ggtttgcagt cagattggca 3180
gggataagca gcctagctca ggagaagtga gtataaaagc cccaggctgg gagcagccat 3240
cagctagcgc cggcaagagg taagggttta agggatggtt ggttggtggg gtattaatgt 3300
ttaattacct ggagcacctg cctgaaatca ctttttttca ggttggaccg gtgccaccat 3360
ggacatgagg gtccctgctc agctgctggg gctcctgctg ctctggctca gcggtgccag 3420
atgtgatatc cagatgaccc agtctccatc tagcctgtcc gccagcgtgg gcgacagagt 3480
gaccatcacc tgcggcgcca gcgagaacat ctatggcgct ctgaactggt accagcagaa 3540
acctggcaag gcccctaagc tgctgatcta cggcgccacc aacctggccg atggcgtgcc 3600
tagtagattc agcggatctg gcagcggcac agacttcacc ctgaccatca gcagcctgca 3660
acctgaggac tttgccacat actactgcca gaacgtgctg aatacacctc tgacattcgg 3720
ccaaggaacc aaagtggaaa tcaagcggac cgtggccgct cctagcgtgt tcatcttccc 3780
tccttccgat gaacaactga agagcggaac cgcctctgtg gtgtgcctgc tgaacaactt 3840
ctaccctaga gaggccaagg tgcagtggaa ggtcgacaac gccctgcaga gcggcaacag 3900
ccaggagagc gtgacggaac aggacagcaa ggacagcacc tacagcctga gctccaccct 3960
tacactgtct aaagccgact acgagaagca caaggtgtac gcctgtgaag tgacacacca 4020
gggcctgagc agccctgtga ccaagtcttt taaccggggc gagtgctgaa ttcgaatcgt 4080
acctagggat ccagacatga taagatacat tgatgagttt ggacaaacca caactagaat 4140
gcagtgaaaa aaatgcttta tttgtgaaat ttgtgatgct attgctttat ttgtaaccat 4200
tataagctgc aataaacaag ttaacaacaa caattgcatt cattttatgt ttcaggttca 4260
gggggaggtg tgggaggttt tttaagcttg tttaaacgta cgtagataag tagcatggcg 4320
ggttaatcat taactacaag gaacccctag tgatggagtt ggccactccc tctctgcgcg 4380
ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg acgcccgggc tttgcccggg 4440
cggcctcagt gagcgagcga gcgcgcagag agggagtggc caa 4483
<210> 85
<211> 3533
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 85
gcttcaggag cagttgtgcg aatagctgga gaacaccagg ctggatttaa acccagatcg 60
ctcttacatt tgctctttac ctgctgtgct cagcgttcac gtgccctcta gctgtagttt 120
tctgaagtca gcgcacagca aggcagtgtg cttagaggtt aacagaaggg aaaacaacaa 180
caacaaaaat ctaaatgaga atcctgactg tttcagctgg gggtaagggg ggcggattat 240
tcatataatt gttataccag acggtcgcag gcttagtcca attgcagaga actcgcttcc 300
caggcttctg agagtcccgg aagtgcctaa acctgtctaa tcgacggggc ttgggtggcc 360
cgtcgctccc tggcttcttc cctttaccca gggcgggcag cgaagtggtg cctcctgcgt 420
cccccacacc ctccctcagc ccctcccctc cggcccgtcc tgggcaggtg acctggagca 480
tccggcaggc tgccctggcc tcctgcgtca ggacaacgcc cacgaggggc gttactgtgc 540
ggagatgcac cacgcaagag acaccctttg taactctctt ctcctcccta gtgcgaggtt 600
aaaaccttca gccccacgtg ctgtttgcaa acctgcctgt acctgaggcc ctaaaaagcc 660
agagacctca ctcccgggga gccagcatgt ccactgcggt cctggaaaac ccaggcttgg 720
gcaggaaact ctctgacttt ggacaggtga gccacggcag cctgagctgc tcagttaggg 780
gaatttgggc ctccagagaa agagatctga agactgctgg tgcttcctgg tttcataagc 840
tcagtaagaa gtctgaattc gttggaagct gatgagaata tccaggaagt caacagacaa 900
atgtcctcaa caattgtttc taagtaggag aacatctgtc ctcggtggct ttcacaggaa 960
aagcttctga cctcttctct tcctcccaca gggcggtacc agatctggca gcggagaggg 1020
cagaggaagt cttctaacat gcggtgacgt ggaggagaat cccggccctt ccaccgctgt 1080
gctggagaac cctgggctgg ggaggaaact gtcagacttc gggcaggaga cttcatacat 1140
tgaggataac tgtaaccaga atggcgccat ctctctgatc ttcagcctga aggaggaagt 1200
gggcgccctg gcaaaggtgc tgcgcctgtt tgaggagaac gacgtgaatc tgacccacat 1260
cgagtcccgg ccttctagac tgaagaagga cgagtacgag ttctttaccc acctggataa 1320
gcggtccctg ccagccctga caaacatcat caagatcctg aggcacgaca tcggagcaac 1380
cgtgcacgag ctgtctcggg acaagaagaa ggataccgtg ccctggttcc ctcggacaat 1440
ccaggagctg gatagatttg ccaaccagat cctgtcttac ggagcagagc tggacgcaga 1500
tcaccctggc ttcaaggacc cagtgtatcg ggcccggaga aagcagtttg ccgatatcgc 1560
ctacaattat aggcacggac agccaatccc tcgcgtggag tatatggagg aggagaagaa 1620
gacctggggc acagtgttca agaccctgaa gagcctgtac aagacacacg cctgctacga 1680
gtataaccac atcttccccc tgctggagaa gtattgtggc tttcacgagg acaatatccc 1740
tcagctggag gacgtgagcc agttcctgca gacctgcaca ggctttaggc tgaggccagt 1800
ggcaggactg ctgagctccc gggacttcct gggaggactg gccttcagag tgtttcactg 1860
cacccagtac atcaggcacg gctccaagcc aatgtataca ccagagcccg acatctgtca 1920
cgagctgctg ggccacgtgc ccctgtttag cgatagatcc ttcgcccagt tttcccagga 1980
gatcggactg gcatctctgg gagcacctga cgagtacatc gagaagctgg ccaccatcta 2040
ttggttcaca gtggagtttg gcctgtgcaa gcagggcgat agcatcaagg cctacggagc 2100
aggactgctg tctagcttcg gcgagctgca gtattgtctg tccgagaagc caaagctgct 2160
gcccctggag ctggagaaga ccgccatcca gaactacacc gtgacagagt tccagcccct 2220
gtactatgtg gccgagtctt ttaacgatgc caaggagaag gtgagaaatt tcgccgccac 2280
aatccctagg cccttcagcg tgcggtacga cccttatacc cagaggatcg aggtgctgga 2340
taatacacag cagctgaaga tcctggctga ctcaatcaat agcgaaatcg gaatcctgtg 2400
ctccgccctg cagaaaatca aatgagatcc agacatgata agatacattg atgagtttgg 2460
acaaaccaca actagaatgc agtgaaaaaa atgctttatt tgtgaaattt gtgatgctat 2520
tgctttattt gtaaccatta taagctgcaa taaacaagtt aacaacaaca attgcattca 2580
ttttatgttt caggttcagg gggaggtgtg ggaggttttt taactgggat gggatgtgga 2640
atccttctag atttcttttg taatatttat aaagtgctct cagcaaggta tcaaaatggc 2700
aaaattgtga gtaactatcc tcctttcatt ttgggaagaa gatgaggcat gaagagaatt 2760
cagacagaaa cttactcaga ccaggggagg cagaaactaa gcagagagga aaatgaccaa 2820
gagttagccc tgggcatgga atgtgaaaga accctaaacg tgacttggaa ataatgccca 2880
aggtatattc cattctccgg gatttgttgg cattttcttg aggtgaagaa ttgcagaata 2940
cattctttaa tgtgacctac atatttaccc atgggaggaa gtctgctcct ggactcttga 3000
gattcagtca taaagcccag gccagggaaa taatgtaagt ctgcaggccc ctgtcatcag 3060
taggattagg gagaagagtt ctcagtagaa aacagggagg ctggagagaa aagaatggtt 3120
aatgttaacg ttaatataac tagaaagact gcagaactta ggactgattt ttatttgaat 3180
ccttaaaaaa aaaatttctt atgaaaatag tacatggctc ttaggagaca gaacttattg 3240
tacagaggaa cagcgtgaga gtcagagtga tcccagaaca ggtcctggct ccatcctgca 3300
catagttttg gtgctgctgg caatacggtc cccacaactg tgggaagggg ttaggggcag 3360
ggatctcatc aggaaagcat aggggtttaa agttctttat agagcactta gaagattgag 3420
aatccacaaa ttatattaat aacaaacaaa gtagtgtcgt gttatatagt aaatgtgaat 3480
ttgcagacac atttagggaa aagttataat taaaaaaata ggctgtatat ata 3533
<210> 86
<211> 4061
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 86
tgcggccgct tcaggagcag ttgtgcgaat agctggagaa caccaggctg gatttaaacc 60
cagatcgctc ttacatttgc tctttacctg ctgtgctcag cgttcacgtg ccctctagct 120
gtagttttct gaagtcagcg cacagcaagg cagtgtgctt agaggttaac agaagggaaa 180
acaacaacaa caaaaatcta aatgagaatc ctgactgttt cagctggggg taaggggggc 240
ggattattca tataattgtt ataccagacg gtcgcaggct tagtccaatt gcagagaact 300
cgcttcccag gcttctgaga gtcccggaag tgcctaaacc tgtctaatcg acggggcttg 360
ggtggcccgt cgctccctgg cttcttccct ttacccaggg cgggcagcga agtggtgcct 420
cctgcgtccc ccacaccctc cctcagcccc tcccctccgg cccgtcctgg gcaggtgacc 480
tggagcatcc ggcaggctgc cctggcctcc tgcgtcagga caacgcccac gaggggcgtt 540
actgtgcgga gatgcaccac gcaagagaca ccctttgtaa ctctcttctc ctccctagtg 600
cgaggttaaa accttcagcc ccacgtgctg tttgcaaacc tgcctgtacc tgaggcccta 660
aaaagccaga gacctcactc ccggggagcc agcatgtcca ctgcggtcct ggaaaaccca 720
ggcttgggca ggaaactctc tgactttgga caggtgagcc acggcagcct gagctgctca 780
gttaggggaa tttgggcctc cagagaaaga gatctgaaga ctgctggtgc ttcctggttt 840
cataagctca gtaagaagtc tgaattcgtt ggaagctgat gagaatatcc aggaagtcaa 900
cagacaaatg tcctcaacaa ttgtttctaa gtaggagaac atctgtcctc ggtggctttc 960
acaggaaccc taaaatgggc aaacattgca agcagcaaac agcaaacaca cagccctccc 1020
tgcctgctga ccttggagct ggggcagagg tcagagacct ctctgggccc atgccacctc 1080
caacatccac tcgacccctt ggaatttcgg tggagaggag cagaggttgt cctggcgtgg 1140
tttaggtagt gtgagagggg aatgactcct ttcggtaagt gcagtggaag ctgtacactg 1200
cccaggcaaa gcgtccgggc agcgtaggcg ggcgactcag atcccagcca gtggacttag 1260
cccctgtttg ctcctccgat aactggggtg accttggtta atattcacca gcagcctccc 1320
ccgttgcccc tctggatcca ctgcttaaat acggacgagg acagggccct gtctcctcag 1380
cttcaggcac caccactgac ctgggacagt gaatcctcta aggtaaatat aaaattttta 1440
agtgtataat gtgttaaact actgattcta attgtttctc tcttttagat tccaaccttt 1500
ggaactgacc gccaccatgt ccaccgctgt gctggagaac cctgggctgg ggaggaaact 1560
gtcagacttc gggcaggaga cttcatacat tgaggataac tgtaaccaga atggcgccat 1620
ctctctgatc ttcagcctga aggaggaagt gggcgccctg gcaaaggtgc tgcgcctgtt 1680
tgaggagaac gacgtgaatc tgacccacat cgagtcccgg ccttctagac tgaagaagga 1740
cgagtacgag ttctttaccc acctggataa gcggtccctg ccagccctga caaacatcat 1800
caagatcctg aggcacgaca tcggagcaac cgtgcacgag ctgtctcggg acaagaagaa 1860
ggataccgtg ccctggttcc ctcggacaat ccaggagctg gatagatttg ccaaccagat 1920
cctgtcttac ggagcagagc tggacgcaga tcaccctggc ttcaaggacc cagtgtatcg 1980
ggcccggaga aagcagtttg ccgatatcgc ctacaattat aggcacggac agccaatccc 2040
tcgcgtggag tatatggagg aggagaagaa gacctggggc acagtgttca agaccctgaa 2100
gagcctgtac aagacacacg cctgctacga gtataaccac atcttccccc tgctggagaa 2160
gtattgtggc tttcacgagg acaatatccc tcagctggag gacgtgagcc agttcctgca 2220
gacctgcaca ggctttaggc tgaggccagt ggcaggactg ctgagctccc gggacttcct 2280
gggaggactg gccttcagag tgtttcactg cacccagtac atcaggcacg gctccaagcc 2340
aatgtataca ccagagcccg acatctgtca cgagctgctg ggccacgtgc ccctgtttag 2400
cgatagatcc ttcgcccagt tttcccagga gatcggactg gcatctctgg gagcacctga 2460
cgagtacatc gagaagctgg ccaccatcta ttggttcaca gtggagtttg gcctgtgcaa 2520
gcagggcgat agcatcaagg cctacggagc aggactgctg tctagcttcg gcgagctgca 2580
gtattgtctg tccgagaagc caaagctgct gcccctggag ctggagaaga ccgccatcca 2640
gaactacacc gtgacagagt tccagcccct gtactatgtg gccgagtctt ttaacgatgc 2700
caaggagaag gtgagaaatt tcgccgccac aatccctagg cccttcagtg tgcgttacga 2760
cccttatacc cagaggatcg aggtgctgga taatacacag cagctgaaga tcctggctga 2820
ctcaatcaat agcgaaatcg gaatcctgtg ctccgccctg cagaaaatca aatgagaatt 2880
caaggcctct cgagcctcta gaactatagt gagtcgtatt acgtagatcc agacatgata 2940
agatacattg atgagtttgg acaaaccaca actagaatgc agtgaaaaaa atgctttatt 3000
tgtgaaattt gtgatgctat tgctttattt gtaaccatta taagctgcaa taaacaagtt 3060
aacaacaaca attgcattca ttttatgttt caggttcagg gggaggtgtg ggaggttttt 3120
taagctttac gtacgatcgt cgactgggat gggatgtgga atccttctag atttcttttg 3180
taatatttat aaagtgctct cagcaaggta tcaaaatggc aaaattgtga gtaactatcc 3240
tcctttcatt ttgggaagaa gatgaggcat gaagagaatt cagacagaaa cttactcaga 3300
ccaggggagg cagaaactaa gcagagagga aaatgaccaa gagttagccc tgggcatgga 3360
atgtgaaaga accctaaacg tgacttggaa ataatgccca aggtatattc cattctccgg 3420
gatttgttgg cattttcttg aggtgaagaa ttgcagaata cattctttaa tgtgacctac 3480
atatttaccc atgggaggaa gtctgctcct ggactcttga gattcagtca taaagcccag 3540
gccagggaaa taatgtaagt ctgcaggccc ctgtcatcag taggattagg gagaagagtt 3600
ctcagtagaa aacagggagg ctggagagaa aagaatggtt aatgttaacg ttaatataac 3660
tagaaagact gcagaactta ggactgattt ttatttgaat ccttaaaaaa aaaatttctt 3720
atgaaaatag tacatggctc ttaggagaca gaacttattg tacagaggaa cagcgtgaga 3780
gtcagagtga tcccagaaca ggtcctggct ccatcctgca catagttttg gtgctgctgg 3840
caatacggtc cccacaactg tgggaagggg ttaggggcag ggatctcatc aggaaagcat 3900
aggggtttaa agttctttat agagcactta gaagattgag aatccacaaa ttatattaat 3960
aacaaacaaa gtagtgtcgt gttatatagt aaatgtgaat ttgcagacac atttagggaa 4020
aagttataat taaaaaaata ggctgtatat atacctgcag g 4061
<210> 87
<211> 2141
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 87
gcggccgcaa ctcacgggga tttccaagtc tccaccccat tgacgtcaat gggagtttgt 60
tttggcacca aaatcaacgg gactttccaa aatgtcgtaa taaccccgcc ccgttgacgc 120
aaatgggcgg taggcgtgta cggtgggagg tctatataag cagagctcgt ttagtgaacc 180
gtgccaccat gcccccaccc aggaccggaa gaggcctgct gtggctgggc ctggtgctct 240
cttccgtgtg cgtggccctg ggaagcgaaa cccaggccaa cagcacaacc gacgccctga 300
atgtgctgct gatcattgtg gacgatctga gaccctccct gggctgttac ggcgacaaac 360
tggtgcggtc cccaaacatc gaccagctgg cctcccactc cctgctgttc cagaacgcct 420
tcgcccagca ggccgtgtgt gcccccagca gggtgagctt cctgaccggc agaagacctg 480
acaccaccag gctgtacgac tttaacagct actggcgggt gcacgccggc aatttcagca 540
ccattcctca gtacttcaag gagaatggct acgtgacaat gtccgtgggc aaggtgtttc 600
atcccggcat tagctccaac cacaccgacg atagcccata ctcctggtcc ttccccccct 660
accatccctc cagcgagaag tacgagaaca ccaaaacctg cagaggccct gacggagagc 720
tgcacgccaa cctgctgtgc cctgtggatg tcctggatgt gcccgaaggt aagggtttaa 780
gggatggttg gttggtgggg tattaatgtt taattacctg gagcacctgc ctgaaatcac 840
tttttttcag gcaccctgcc agacaagcag tccacagagc aggccatcca gctgctggag 900
aagatgaaga caagcgccag ccccttcttt ctggccgtgg gataccacaa gcctcacatt 960
ccattccggt acccaaaaga gttccagaag ctgtaccctc tggaaaacat caccctggcc 1020
cctgaccccg aggtgccaga cgggctgcct cctgtggcct acaatccctg gatggacatc 1080
agacagcggg aggatgtgca ggccctgaat atttccgtgc cctatgggcc catccctgtg 1140
gactttcagc ggaaaatcag acagtcttac tttgccagcg tgtcctacct ggacacccag 1200
gtgggccgcc tgctctcagc cctggacgac ctgcagctgg ccaattccac catcatcgcc 1260
ttcaccagcg atcacggctg ggccctgggc gagcacgggg agtgggccaa atacagcaac 1320
ttcgatgtgg ccacccacgt gcctctgatt ttttatgtgc ccggccggac agccagcctg 1380
cccgaggccg gggagaagct ctttccttac ctggaccctt tcgactctgc cagccagctg 1440
atggaacctg gcagacagag catggacctg gtggagctgg tgagcctctt ccccactctg 1500
gccggcctgg ctggcctgca ggtgccacca agatgcccag tgccttcttt ccacgtggag 1560
ctgtgtagag agggaaagaa cctgctgaag cacttcagat ttagagatct ggaggaggat 1620
ccctacctgc caggcaaccc aagggagctg atcgcctaca gccagtatcc cagaccctct 1680
gatatccccc agtggaacag cgataagccc tccctgaaag acatcaagat tatgggctac 1740
tccatcagga ccattgacta ccggtacaca gtgtgggtgg gcttcaaccc cgatgagttt 1800
ctggccaact tcagcgacat ccacgccggc gagctgtatt ttgtggactc cgaccccctg 1860
caggaccaca acatgtacaa cgactcccag ggcggcgacc tgttccagct gctgatgccc 1920
tgagatccag acatgataag atacattgat gagtttggac aaaccacaac tagaatgcag 1980
tgaaaaaaat gctttatttg tgaaatttgt gatgctattg ctttatttgt aaccattata 2040
agctgcaata aacaagttaa caacaacaat tgcattcatt ttatgtttca ggttcagggg 2100
gaggtgtggg aggtttttta acctgcaggt ctagatacgt a 2141
<210> 88
<211> 2042
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 88
ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc 60
tgaccttgga gctggggcag aggtcagaga cctctctggg cccatgccac ctccaacatc 120
cactcgaccc cttggaattt cggtggagag gagcagaggt tgtcctggcg tggtttaggt 180
agtgtgagag gggaatgact cctttcggta agtgcagtgg aagctgtaca ctgcccaggc 240
aaagcgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact tagcccctgt 300
ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct cccccgttgc 360
ccctctggat ccactgctta aatacggacg aggacagggc cctgtctcct cagcttcagg 420
caccaccact gacctgggac agtgaatcct ctaaggtaaa tataaaattt ttaagtgtat 480
aatgtgttaa actactgatt ctaattgttt ctctctttta gattccaacc tttggaactg 540
accgccacca tgtccaccgc tgtgctggag aaccctgggc tggggaggaa actgtcagac 600
ttcgggcagg agacttcata cattgaggat aactgtaacc agaatggcgc catctctctg 660
atcttcagcc tgaaggagga agtgggcgcc ctggcaaagg tgctgcgcct gtttgaggag 720
aacgacgtga atctgaccca catcgagtcc cggccttcta gactgaagaa ggacgagtac 780
gagttcttta cccacctgga taagcggtcc ctgccagccc tgacaaacat catcaagatc 840
ctgaggcacg acatcggagc aaccgtgcac gagctgtctc gggacaagaa gaaggatacc 900
gtgccctggt tccctcggac aatccaggag ctggatagat ttgccaacca gatcctgtct 960
tacggagcag agctggacgc agatcaccct ggcttcaagg acccagtgta tcgggcccgg 1020
agaaagcagt ttgccgatat cgcctacaat tataggcacg gacagccaat ccctcgcgtg 1080
gagtatatgg aggaggagaa gaagacctgg ggcacagtgt tcaagaccct gaagagcctg 1140
tacaagacac acgcctgcta cgagtataac cacatcttcc ccctgctgga gaagtattgt 1200
ggctttcacg aggacaatat ccctcagctg gaggacgtga gccagttcct gcagacctgc 1260
acaggcttta ggctgaggcc agtggcagga ctgctgagct cccgggactt cctgggagga 1320
ctggccttca gagtgtttca ctgcacccag tacatcaggc acggctccaa gccaatgtat 1380
acaccagagc ccgacatctg tcacgagctg ctgggccacg tgcccctgtt tagcgataga 1440
tccttcgccc agttttccca ggagatcgga ctggcatctc tgggagcacc tgacgagtac 1500
atcgagaagc tggccaccat ctattggttc acagtggagt ttggcctgtg caagcagggc 1560
gatagcatca aggcctacgg agcaggactg ctgtctagct tcggcgagct gcagtattgt 1620
ctgtccgaga agccaaagct gctgcccctg gagctggaga agaccgccat ccagaactac 1680
accgtgacag agttccagcc cctgtactat gtggccgagt cttttaacga tgccaaggag 1740
aaggtgagaa atttcgccgc cacaatccct aggcccttca gcgtgcggta cgacccttat 1800
acccagagga tcgaggtgct ggataataca cagcagctga agatcctggc tgactcaatc 1860
aatagcgaaa tcggaatcct gtgctccgcc ctgcagaaaa tcaaatgaat gctttatttg 1920
tgaaatttgt gatgctattg ctttatttgt aaccattata agctgcaata aacaagttaa 1980
caacaacaat tgcattcatt ttatgtttca ggttcagggg gaggtgtggg aggtttttta 2040
aa 2042
<210> 89
<211> 720
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 89
atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 60
ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga tgccacctac 120
ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc ctggcccacc 180
ctcgtgacca ccctgaccta cggcgtgcag tgcttcagcc gctaccccga ccacatgaag 240
cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg caccatcttc 300
ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 360
gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 420
aagctggagt acaactacaa cagccacaac gtctatatca tggccgacaa gcagaagaac 480
ggcatcaagg tgaacttcaa gatccgccac aacatcgagg acggcagcgt gcagctcgcc 540
gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 600
tacctgagca cccagtccgc cctgagcaaa gaccccaacg agaagcgcga tcacatggtc 660
ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaagtaa 720
<210> 90
<211> 2162
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 90
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180
ggttagggag gtcctgcata tgcggccgca cgcgtggtac ctctggtcgt tacataactt 240
acggtaaatg gcccgcctgg ctgaccgccc aacgaccccc gcccattgac gtcaataatg 300
acgtatgttc ccatagtaac gccaataggg actttccatt gacgtcaatg ggtggagtat 360
ttacggtaaa ctgcccactt ggcagtacat caagtgtatc atatgccaag tacgccccct 420
attgacgtca atgacggtaa atggcccgcc tggcattatg cccagtacat gaccttatgg 480
gactttccta cttggcagta catctactcg aggccacgtt ctgcttcact ctccccatct 540
cccccccctc cccaccccca attttgtatt tatttatttt ttaattattt tgtgcagcga 600
tgggggcggg gggggggggg gggcgcgcgc caggcggggc ggggcggggc gaggggcggg 660
gcggggcgag gcggagaggt gcggcggcag ccaatcagag cggcgcgctc cgaaagtttc 720
cttttatggc gaggcggcgg cggcggcggc cctataaaaa gcgaagcgcg cggcgggcgg 780
gagcgggatc agccaccgcg gtggcggcct agagtcgacg aggaactgaa aaaccagaaa 840
gttaactggt aagtttagtc tttttgtctt ttatttcagg tcccggatcc ggtggtggtg 900
caaatcaaag aactgctcct cagtggatgt tgcctttact tctaggcctg tacggaagtg 960
ttacttctgc tctaaaagct gcggaattgt acccgcggcc gatccaccgg tcgccaccat 1020
ggtgagcaag ggcgaggagc tgttcaccgg ggtggtgccc atcctggtcg agctggacgg 1080
cgacgtaaac ggccacaagt tcagcgtgtc cggcgagggc gagggcgatg ccacctacgg 1140
caagctgacc ctgaagttca tctgcaccac cggcaagctg cccgtgccct ggcccaccct 1200
cgtgaccacc ctgacctacg gcgtgcagtg cttcagccgc taccccgacc acatgaagca 1260
gcacgacttc ttcaagtccg ccatgcccga aggctacgtc caggagcgca ccatcttctt 1320
caaggacgac ggcaactaca agacccgcgc cgaggtgaag ttcgagggcg acaccctggt 1380
gaaccgcatc gagctgaagg gcatcgactt caaggaggac ggcaacatcc tggggcacaa 1440
gctggagtac aactacaaca gccacaacgt ctatatcatg gccgacaagc agaagaacgg 1500
catcaaggtg aacttcaaga tccgccacaa catcgaggac ggcagcgtgc agctcgccga 1560
ccactaccag cagaacaccc ccatcggcga cggccccgtg ctgctgcccg acaaccacta 1620
cctgagcacc cagtccgccc tgagcaaaga ccccaacgag aagcgcgatc acatggtcct 1680
gctggagttc gtgaccgccg ccgggatcac tctcggcatg gacgagctgt acaagtaaag 1740
cggccatcaa gcttatcgat accgtcgact agagctcgct gatcagcctc gactgtgcct 1800
tctagttgcc agccatctgt tgtttgcccc tcccccgtgc cttccttgac cctggaaggt 1860
gccactccca ctgtcctttc ctaataaaat gaggaaattg catcgcattg tctgagtagg 1920
tgtcattcta ttctgggggg tggggtgggg caggacagca aggcctgcag gtctagatac 1980
gtagataagt agcatggcgg gttaatcatt aactacaagg aacccctagt gatggagttg 2040
gccactccct ctctgcgcgc tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga 2100
cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc 2160
aa 2162
<210> 91
<211> 2208
<212> DNA
<213> Artificial Sequence
<220>
<223> Adeno-associated virus 2
<400> 91
ttacagatta cgagtcaggt atctggtgcc aatggggcga ggctctgaat acacgccatt 60
agtgtccaca gtaaagtcca cattaacaga cttgttgtag ttggaagtgt actgaatttc 120
gggattccag cgtttgctgt tttccttctg cagctcccac tcgatctcca cgctgacctg 180
tcccgtggag tactgtgtga tgaaggaagc aaactttgcc gcactgaagg tggtcgaagg 240
attcgcaggt accggggtgt tcttgatgag aatctgtgga ggagggtgtt taagtccgaa 300
tccacccatg aggggagagg ggtgaaaatg tccgtccgtg tgtggaatct ttgcccagat 360
gggcccctga aggtacacat ctctgtcctg ccagaccatg cctggaagaa cgccttgtgt 420
gttgacatct gcggtagctg cttgtctgtt gcctctctgg aggttggtag atacagaacc 480
atactgctcc gtagccacgg gattggttgt cctgatttcc tcttcgtctg taatcatgac 540
cttttcaatg tccacatttg ttttctctga gccttgcttc ccaaagatga gaaccccgct 600
ctgaggaaaa aacttttctt catcgtcctt gtggcttgcc atggccgggc ccggattcac 660
cagagagtct ctgccattga ggtggtactt ggtagctcca gtccacgagt attcactgtt 720
gttgttatcc gcagatgtct ttgatactcg ctgctggcgg taacagggtc caggaagcca 780
gttcctagac tggtcccgaa tgtcactcgc tccggcctga gaaaactgaa gccttgactg 840
cgtggtggtt ccacttggag tgtttgttct gctcaagtaa tacaggtact ggtcgatgag 900
aggattcatg agacggtcca gactctggct gtgagcgtag ctgctgtgga aaggaacgtc 960
ctcaaaagtg tagctgaagg taaagttgtt tccggtacgc agcatctgag aaggaaagta 1020
ctccaggcag taaaatgaag agcgtcctac tgcctgactc ccgttgttca gggtgaggta 1080
tccatactgt ggcaccatga agacgtctgc tgggaacggc gggaggcatc cttgatgcgc 1140
cgagccgagg acgtacggga gctggtactc cgagtcagta aacacctgaa ccgtgctggt 1200
aaggttattg gcaatcgtcg tcgtaccgtc attctgcgtg acctctttga cttgaatgtt 1260
aaagagcttg aagttgagtc tcttgggtcg gaatccccag ttgttgttga tgagtctttg 1320
ccagtcacgt ggtgaaaagt ggcagtggaa tctgttgaag tcaaaatacc cccaaggggt 1380
gctgtagcca aagtagtgat tgtcgttcga ggctcctgat tggctggaaa tttgtttgta 1440
gaggtggttg ttgtaggtgg gcagggccca ggttcgggtg ctggtggtga tgactctgtc 1500
gcccatccat gtggaatcgc aatgccaatt tcccgaggaa ttacccactc cgtcggcgcc 1560
ctcgttattg tctgccattg gtgcgccact gcctgtagcc atcgtattag ttcccagacc 1620
agagggggct gctggtggct gtccgagagg ctgggggtca ggtactgagt ctgcgtctcc 1680
agtctgacca aaattcaatc tttttcttgc aggctgctgg cccgcctttc cggttcccga 1740
ggaggagtct ggctccacag gagagtgctc taccggcctc ttttttcccg gagccgtctt 1800
aacaggttcc tcaaccaggc ccagaggttc aagaaccctc tttttcgcct ggaagactgc 1860
tcgtccgagg ttgcccccaa aagacgtatc ttctttaagg cgctcctgaa actccgcgtc 1920
ggcgtggttg tacttgaggt acgggttgtc tccgctgtcg agctgccggt cgtaggcttt 1980
gtcgtgctcg agggccgcgg cgtctgcctc gttgaccggc tctcccttgt cgagtccgtt 2040
gaagggtccg aggtacttgt acccaggaag cacaagaccc ctgctgtcgt ccttatgccg 2100
ctctgcgggc tttggtggtg gtgggccagg tttgagcttc caccactgtc ttattccttc 2160
agagagagtg tcctcgagcc aatctggaag ataaccatcg gcagccat 2208
<210> 92
<211> 4219
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 92
ttacagatta cgagtcaggt atctggtgcc aatggggcga ggctctgaat acacgccatt 60
agtgtccaca gtaaagtcca cattaacaga cttgttgtag ttggaagtgt actgaatttc 120
gggattccag cgtttgctgt tttccttctg cagctcccac tcgatctcca cgctgacctg 180
tcccgtggag tactgtgtga tgaaggaagc aaactttgcc gcactgaagg tggtcgaagg 240
attcgcaggt accggggtgt tcttgatgag aatctgtgga ggagggtgtt taagtccgaa 300
tccacccatg aggggagagg ggtgaaaatg tccgtccgtg tgtggaatct ttgcccagat 360
gggcccctga aggtacacat ctctgtcctg ccagaccatg cctggaagaa cgccttgtgt 420
gttgacatct gcggtagctg cttgtctgtt gcctctctgg aggttggtag atacagaacc 480
atactgctcc gtagccacgg gattggttgt cctgatttcc tcttcgtctg taatcatgac 540
cttttcaatg tccacatttg ttttctctga gccttgcttc ccaaagatga gaaccccgct 600
ctgaggaaaa aacttttctt catcgtcctt gtggcttgcc atggccgggc ccggattcac 660
cagagagtct ctgccattga ggtggtactt ggtagctcca gtccacgagt attcactgtt 720
gttgttatcc gcagatgtct ttgatactcg ctgctggcgg taacagggtc caggaagcca 780
gttcctagac tggtcccgaa tgtcactcgc tccggcctga gaaaactgaa gccttgactg 840
cgtggtggtt ccacttggag tgtttgttct gctcaagtaa tacaggtact ggtcgatgag 900
aggattcatg agacggtcca gactctggct gtgagcgtag ctgctgtgga aaggaacgtc 960
ctcaaaagtg tagctgaagg taaagttgtt tccggtacgc agcatctgag aaggaaagta 1020
ctccaggcag taaaatgaag agcgtcctac tgcctgactc ccgttgttca gggtgaggta 1080
tccatactgt ggcaccatga agacgtctgc tgggaacggc gggaggcatc cttgatgcgc 1140
cgagccgagg acgtacggga gctggtactc cgagtcagta aacacctgaa ccgtgctggt 1200
aaggttattg gcaatcgtcg tcgtaccgtc attctgcgtg acctctttga cttgaatgtt 1260
aaagagcttg aagttgagtc tcttgggtcg gaatccccag ttgttgttga tgagtctttg 1320
ccagtcacgt ggtgaaaagt ggcagtggaa tctgttgaag tcaaaatacc cccaaggggt 1380
gctgtagcca aagtagtgat tgtcgttcga ggctcctgat tggctggaaa tttgtttgta 1440
gaggtggttg ttgtaggtgg gcagggccca ggttcgggtg ctggtggtga tgactctgtc 1500
gcccatccat gtggaatcgc aatgccaatt tcccgaggaa ttacccactc cgtcggcgcc 1560
ctcgttattg tctgccattg gtgcgccact gcctgtagcc atcgtattag ttcccagacc 1620
agagggggct gctggtggct gtccgagagg ctgggggtca ggtactgagt ctgcgtctcc 1680
agtctgacca aaattcaatc tttttcttgc aggctgctgg cccgcctttc cggttcccga 1740
ggaggagtct ggctccacag gagagtgctc taccggcctc ttttttcccg gagccgtctt 1800
aacaggttcc tcaaccaggc ccagaggttc aagaaccctc tttttcgcct ggaagactgc 1860
tcgtccgagg ttgcccccaa aagacgtatc ttctttaagg cgctcctgaa actccgcgtc 1920
ggcgtggttg tacttgaggt acgggttgtc tccgctgtcg agctgccggt cgtaggcttt 1980
gtcgtgctcg agggccgcgg cgtctgcctc gttgaccggc tctcccttgt cgagtccgtt 2040
gaagggtccg aggtacttgt acccaggaag cacaagaccc ctgctgtcgt ccttatgccg 2100
ctctgcgggc tttggtggtg gtgggccagg tttgagcttc caccactgtc ttattccttc 2160
agagagagtg tcctcgagcc aatctggaag ataaccatcg gcagccatac ctggtttaag 2220
tcatttattg ttcaaagatg cagtcatcca aatccacatt gaccagatcg caggcagtgc 2280
aagcgtctgg cacctttccc atgatatgat gaatgtagca cagtttctga tacgcctttt 2340
tgacgacaga aacgggttga gattctgaca cgggaaagca ctctaaacag tctttctgtc 2400
cgtgagtgaa gcagatattt gaattctgat tcattctctc gcattgtctg cagggaaaca 2460
gcatcagatt catgcccacg tgacgagaac atttgttttg gtacctgtct gcgtagttga 2520
tcgaagcttc cgcgtctgac gtcgatggct gcgcaactga ctcgcgcacc cgtttgggct 2580
cacttatatc tgcgtcactg ggggcgggtc ttttcttggc tccacccttt ttgacgtaga 2640
attcatgctc cacctcaacc acgtgatcct ttgcccaccg gaaaaagtct ttgacttcct 2700
gcttggtgac cttcccaaag tcatgatcca gacggcgggt gagttcaaat ttgaacatcc 2760
ggtcttgcaa cggctgctgg tgttcgaagg tcgttgagtt cccgtcaatc acggcgcaca 2820
tgttggtgtt ggaggtgacg atcacgggag tcgggtctat ctgggccgag gacttgcatt 2880
tctggtccac gcgcaccttg cttcctccga gaatggcttt ggccgactcc acgaccttgg 2940
cggtcatctt cccctcctcc caccagatca ccatcttgtc gacacagtcg ttgaagggaa 3000
agttctcatt ggtccagttt acgcacccgt agaagggcac agtgtgggct atggcctccg 3060
cgatgttggt cttcccggta gttgcaggcc caaacagcca gatggtgttc ctcttgccga 3120
actttttcgt ggcccatccc agaaagacgg aagccgcata ttggggatcg tacccgttta 3180
gttccaaaat tttataaatc cgattgctgg aaatgtcctc cacgggctgc tggcccacca 3240
ggtagtcggg ggcggtttta gtcaggctca taatctttcc cgcattgtcc aaggcagcct 3300
tgatttggga ccgcgagttg gaggccgcat tgaaggagat gtatgaggcc tggtcctcct 3360
ggatccactg cttctccgag gtaatcccct tgtccacgag ccacccgacc agctccatgt 3420
acctggctga agtttttgat ctgatcaccg gcgcatcaga attgggattc tgattctctt 3480
tgttctgctc ctgcgtctgc gacacgtgcg tcagatgctg cgccaccaac cgtttacgct 3540
ccgtgagatt caaacaggcg cttaaatact gttccatatt agtccacgcc cactggagct 3600
caggctgggt tttggggagc aagtaattgg ggatgtagca ctcatccacc accttgttcc 3660
cgcctccggc gccatttctg gtctttgtga ccgcgaacca gtttggcaaa gtcggctcga 3720
tcccgcggta aattctctga atcagttttt cgcgaatctg actcaggaaa cgtcccaaaa 3780
ccatggattt caccccggtg gtttccacga gcacgtgcat gtggaagtag ctctctccct 3840
tctcaaattg cacaaagaaa agggcctccg gggccttact cacacggcgc cattccgtca 3900
gaaagtcgcg ctgcagcttc tcggccacgg tcaggggtgc ctgctcaatc agattcagat 3960
ccatgtcaga atctggcggc aactcccatt ccttctcggc cacccagttc acaaagctgt 4020
cagaaatgcc gggcagatgc tcgtcaaggt cgctggggac cttaatcaca atctcgtaaa 4080
accccggcat ggcggctgcg cgttcaaacc tcccgcttca aaatggagac cctgcgtgct 4140
cactcgggct taaataccca gcgtgaccac atggtgtcgc aaaatgtcgc aaaacactca 4200
cgtgacctct aatacagga 4219
<210> 93
<211> 2211
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 93
atggctgccg atggttatct tccagattgg ctcgaggaca acctctctga gggcattcgc 60
gagtggtggg acttgaaacc tggagccccg aagcccaaag ccaaccagca aaagcaggac 120
gacggccggg gtctggtgct tcctggctac aagtacctcg gacccttcaa cggactcgac 180
aagggggagc ccgtcaacgc ggcggacgca gcggccctcg agcacgacaa ggcctacgac 240
cagcagctca aagcgggtga caatccgtac ctgcggtata accacgccga cgccgagttt 300
caggagcgtc tgcaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360
gccaagaagc gggttctcga acctctcggt ctggttgagg aaggcgctaa gacggctcct 420
ggaaagaaac gtccggtaga gcagtcgcca caagagccag actcctcctc gggcatcggc 480
aagacaggcc agcagcccgc taaaaagaga ctcaattttg gtcagactgg cgactcagag 540
tcagtccccg atccacaacc tctcggagaa cctccagcaa cccccgctgc tgtgggacct 600
actacaatgg cttcaggcgg tggcgcacca atggcagaca ataacgaagg cgccgacgga 660
gtgggtaatg cctcaggaaa ttggcattgc gattccacat ggctgggcga cagagtcatc 720
accaccagca cccgcacctg ggccttgccc acctacaata accacctcta caagcaaatc 780
tccagtgctt caacgggggc cagcaacgac aaccactact tcggctacag caccccctgg 840
gggtattttg atttcaacag attccactgc cacttttcac cacgtgactg gcagcgactc 900
atcaacaaca attggggatt ccggcccaag agactcaact tcaaactctt caacatccaa 960
gtcaaggagg tcacgacgaa tgatggcgtc acaaccatcg ctaataacct taccagcacg 1020
gttcaagtct tctcggactc ggagtaccag cttccgtacg tcctcggctc tgcgcaccag 1080
ggctgcctcc ctccgttccc ggcggacgtg ttcatgattc cgcaatacgg ctacctgacg 1140
ctcaacaatg gcagccaagc cgtgggacgt tcatcctttt actgcctgga atatttccct 1200
tctcagatgc tgagaacggg caacaacttt accttcagct acacctttga ggaagtgcct 1260
ttccacagca gctacgcgca cagccagagc ctggaccggc tgatgaatcc tctcatcgac 1320
caatacctgt attacctgaa cagaactcaa aatcagtccg gaagtgccca aaacaaggac 1380
ttgctgttta gccgtgggtc tccagctggc atgtctgttc agcccaaaaa ctggctacct 1440
ggaccctgtt atcggcagca gcgcgtttct aaaacaaaaa cagacaacaa caacagcaat 1500
tttacctgga ctggtgcttc aaaatataac ctcaatgggc gtgaatccat catcaaccct 1560
ggcactgcta tggcctcaca caaagacgac gaagacaagt tctttcccat gagcggtgtc 1620
atgatttttg gaaaagagag cgccggagct tcaaacactg cattggacaa tgtcatgatt 1680
acagacgaag aggaaattaa agccactaac cctgtggcca ccgaaagatt tgggaccgtg 1740
gcagtcaatt tccagagcag cagcacagac cctgcgaccg gagatgtgca tgctatggga 1800
gcattacctg gcatggtgtg gcaagataga gacgtgtacc tgcagggtcc catttgggcc 1860
aaaattcctc acacagatgg acactttcac ccgtctcctc ttatgggcgg ctttggactc 1920
aagaacccgc ctcctcagat cctcatcaaa aacacgcctg ttcctgcgaa tcctccggcg 1980
gagttttcag ctacaaagtt tgcttcattc atcacccaat actccacagg acaagtgagt 2040
gtggaaattg aatgggagct gcagaaagaa aacagcaagc gctggaatcc cgaagtgcag 2100
tacacatcca attatgcaaa atctgccaac gttgatttta ctgtggacaa caatggactt 2160
tatactgagc ctcgccccat tggcacccgt taccttaccc gtcccctgta a 2211
<210> 94
<211> 4263
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 94
ggtggagtcg tgacgtgaat tacgtcatag ggttagggag gtcctgtatt agaggtcacg 60
tgagtgtttt gcgacatttt gcgacaccat gtggtcacgc tgggtattta agcccgagtg 120
agcacgcagg gtctccattt tgaagcggga ggtttgaacg cgcagccgcc atgccggggt 180
tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc ggcatttctg 240
acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat tctgacatgg 300
atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag cgcgactttc 360
tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg caatttgaga 420
agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg aaatccatgg 480
ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt taccgcggga 540
tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc gccggaggcg 600
ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa acccagcctg 660
agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg aatctcacgg 720
agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag gagcagaaca 780
aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact tcagccaggt 840
acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag cagtggatcc 900
aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg tcccaaatca 960
aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc cccgactacc 1020
tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa attttggaac 1080
taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc acgaaaaagt 1140
tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag accaacatcg 1200
cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc aatgagaact 1260
ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg aagatgaccg 1320
ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc gtggaccaga 1380
aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc aacaccaaca 1440
tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg ttgcaagacc 1500
ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag gtcaccaagc 1560
aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg gagcatgaat 1620
tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca gatataagtg 1680
agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg gaagcttcga 1740
tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg aatctgatgc 1800
tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc ttcactcacg 1860
gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt tctgtcgtca 1920
aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg ccagacgctt 1980
gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa caataaatga 2040
cttaaaccag gtatggctgc cgatggttat cttccagatt ggctcgagga caacctctct 2100
gagggcattc gcgagtggtg ggacttgaaa cctggagccc cgaagcccaa agccaaccag 2160
caaaagcagg acgacggccg gggtctggtg cttcctggct acaagtacct cggacccttc 2220
aacggactcg acaaggggga gcccgtcaac gcggcggacg cagcggccct cgagcacgac 2280
aaggcctacg accagcagct caaagcgggt gacaatccgt acctgcggta taaccacgcc 2340
gacgccgagt ttcaggagcg tctgcaagaa gatacgtctt ttgggggcaa cctcgggcga 2400
gcagtcttcc aggccaagaa gcgggttctc gaacctctcg gtctggttga ggaaggcgct 2460
aagacggctc ctggaaagaa acgtccggta gagcagtcgc cacaagagcc agactcctcc 2520
tcgggcatcg gcaagacagg ccagcagccc gctaaaaaga gactcaattt tggtcagact 2580
ggcgactcag agtcagtccc cgatccacaa cctctcggag aacctccagc aacccccgct 2640
gctgtgggac ctactacaat ggcttcaggc ggtggcgcac caatggcaga caataacgaa 2700
ggcgccgacg gagtgggtaa tgcctcagga aattggcatt gcgattccac atggctgggc 2760
gacagagtca tcaccaccag cacccgcacc tgggccttgc ccacctacaa taaccacctc 2820
tacaagcaaa tctccagtgc ttcaacgggg gccagcaacg acaaccacta cttcggctac 2880
agcaccccct gggggtattt tgatttcaac agattccact gccacttttc accacgtgac 2940
tggcagcgac tcatcaacaa caattgggga ttccggccca agagactcaa cttcaaactc 3000
ttcaacatcc aagtcaagga ggtcacgacg aatgatggcg tcacaaccat cgctaataac 3060
cttaccagca cggttcaagt cttctcggac tcggagtacc agcttccgta cgtcctcggc 3120
tctgcgcacc agggctgcct ccctccgttc ccggcggacg tgttcatgat tccgcaatac 3180
ggctacctga cgctcaacaa tggcagccaa gccgtgggac gttcatcctt ttactgcctg 3240
gaatatttcc cttctcagat gctgagaacg ggcaacaact ttaccttcag ctacaccttt 3300
gaggaagtgc ctttccacag cagctacgcg cacagccaga gcctggaccg gctgatgaat 3360
cctctcatcg accaatacct gtattacctg aacagaactc aaaatcagtc cggaagtgcc 3420
caaaacaagg acttgctgtt tagccgtggg tctccagctg gcatgtctgt tcagcccaaa 3480
aactggctac ctggaccctg ttatcggcag cagcgcgttt ctaaaacaaa aacagacaac 3540
aacaacagca attttacctg gactggtgct tcaaaatata acctcaatgg gcgtgaatcc 3600
atcatcaacc ctggcactgc tatggcctca cacaaagacg acgaagacaa gttctttccc 3660
atgagcggtg tcatgatttt tggaaaagag agcgccggag cttcaaacac tgcattggac 3720
aatgtcatga ttacagacga agaggaaatt aaagccacta accctgtggc caccgaaaga 3780
tttgggaccg tggcagtcaa tttccagagc agcagcacag accctgcgac cggagatgtg 3840
catgctatgg gagcattacc tggcatggtg tggcaagata gagacgtgta cctgcagggt 3900
cccatttggg ccaaaattcc tcacacagat ggacactttc acccgtctcc tcttatgggc 3960
ggctttggac tcaagaaccc gcctcctcag atcctcatca aaaacacgcc tgttcctgcg 4020
aatcctccgg cggagttttc agctacaaag tttgcttcat tcatcaccca atactccaca 4080
ggacaagtga gtgtggaaat tgaatgggag ctgcagaaag aaaacagcaa gcgctggaat 4140
cccgaagtgc agtacacatc caattatgca aaatctgcca acgttgattt tactgtggac 4200
aacaatggac tttatactga gcctcgcccc attggcaccc gttaccttac ccgtcccctg 4260
taa 4263
<210> 95
<211> 2175
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 95
atgtcttttg ttgatcaccc tccagattgg ttggaagaag ttggtgaagg tcttcgcgag 60
tttttgggcc ttgaagcggg cccaccgaaa ccaaaaccca atcagcagca tcaagatcaa 120
gcccgtggtc ttgtgctgcc tggttataac tatctcggac ccggaaacgg tctcgatcga 180
ggagagcctg tcaacagggc agacgaggtc gcgcgagagc acgacatctc gtacaacgag 240
cagcttgagg cgggagacaa cccctacctc aagtacaacc acgcggacgc cgagtttcag 300
gagaagctcg ccgacgacac atccttcggg ggaaacctcg gaaaggcagt ctttcaggcc 360
aagaaaaggg ttctcgaacc ttttggcctg gttgaagagg gtgctaagac ggcccctacc 420
ggaaagcgga tagacgacca ctttccaaaa agaaagaagg ctcggaccga agaggactcc 480
aagccttcca cctcgtcaga cgccgaagct ggacccagcg gatcccagca gctgcaaatc 540
ccagcccaac cagcctcaag tttgggagct gatacaatgt ctgcgggagg tggcggccca 600
ttgggcgaca ataaccaagg tgccgatgga gtgggcaatg cctcgggaga ttggcattgc 660
gattccacgt ggatggggga cagagtcgtc accaagtcca cccgaacctg ggtgctgccc 720
agctacaaca accaccagta ccgagagatc aaaagcggct ccgtcgacgg aagcaacgcc 780
aacgcctact ttggatacag caccccctgg gggtactttg actttaaccg cttccacagc 840
cactggagcc cccgagactg gcaaagactc atcaacaact actggggctt cagaccccgg 900
tccctcagag tcaaaatctt caacattcaa gtcaaagagg tcacggtgca ggactccacc 960
accaccatcg ccaacaacct cacctccacc gtccaagtgt ttacggacga cgactaccag 1020
ctgccctacg tcgtcggcaa cgggaccgag ggatgcctgc cggccttccc tccgcaggtc 1080
tttacgctgc cgcagtacgg ttacgcgacg ctgaaccgcg acaacacaga aaatcccacc 1140
gagaggagca gcttcttctg cctagagtac tttcccagca agatgctgag aacgggcaac 1200
aactttgagt ttacctacaa ctttgaggag gtgcccttcc actccagctt cgctcccagt 1260
cagaacctgt tcaagctggc caacccgctg gtggaccagt acttgtaccg cttcgtgagc 1320
acaaataaca ctggcggagt ccagttcaac aagaacctgg ccgggagata cgccaacacc 1380
tacaaaaact ggttcccggg gcccatgggc cgaacccagg gctggaacct gggctccggg 1440
gtcaaccgcg ccagtgtcag cgccttcgcc acgaccaata ggatggagct cgagggcgcg 1500
agttaccagg tgcccccgca gccgaacggc atgaccaaca acctccaggg cagcaacacc 1560
tatgccctgg agaacactat gatcttcaac agccagccgg cgaacccggg caccaccgcc 1620
acgtacctcg agggcaacat gctcatcacc agcgagagcg agacgcagcc ggtgaaccgc 1680
gtggcgtaca acgtcggcgg gcagatggcc accaacaacc agagctccac cactgccccc 1740
gcgaccggca cgtacaacct ccaggaaatc gtgcccggca gcgtgtggat ggagagggac 1800
gtgtacctcc aaggacccat ctgggccaag atcccagaga cgggggcgca ctttcacccc 1860
tctccggcca tgggcggatt cggactcaaa cacccaccgc ccatgatgct catcaagaac 1920
acgcctgtgc ccggaaatat caccagcttc tcggacgtgc ccgtcagcag cttcatcacc 1980
cagtacagca ccgggcaggt caccgtggag atggagtggg agctcaagaa ggaaaactcc 2040
aagaggtgga acccagagat ccagtacaca aacaactaca acgaccccca gtttgtggac 2100
tttgccccgg acagcaccgg ggaatacaga accaccagac ctatcggaac ccgatacctt 2160
acccgacccc tttaa 2175
<210> 96
<211> 4057
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 96
atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60
ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120
tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180
cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240
caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300
aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360
taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420
gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480
acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540
aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600
gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660
tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720
cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780
tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840
cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900
attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960
acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020
accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080
aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140
aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200
gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260
aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320
ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380
gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440
gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500
gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560
gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620
aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680
ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740
tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800
ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860
caataaatga cttaaaccag gtatgtcttt tgttgatcac cctccagatt ggttggaaga 1920
agttggtgaa ggtcttcgcg agtttttggg ccttgaagcg ggcccaccga aaccaaaacc 1980
caatcagcag catcaagatc aagcccgtgg tcttgtgctg cctggttata actatctcgg 2040
acccggaaac ggtctcgatc gaggagagcc tgtcaacagg gcagacgagg tcgcgcgaga 2100
gcacgacatc tcgtacaacg agcagcttga ggcgggagac aacccctacc tcaagtacaa 2160
ccacgcggac gccgagtttc aggagaagct cgccgacgac acatccttcg ggggaaacct 2220
cggaaaggca gtctttcagg ccaagaaaag ggttctcgaa ccttttggcc tggttgaaga 2280
gggtgctaag acggccccta ccggaaagcg gatagacgac cactttccaa aaagaaagaa 2340
ggctcggacc gaagaggact ccaagccttc cacctcgtca gacgccgaag ctggacccag 2400
cggatcccag cagctgcaaa tcccagccca accagcctca agtttgggag ctgatacaat 2460
gtctgcggga ggtggcggcc cattgggcga caataaccaa ggtgccgatg gagtgggcaa 2520
tgcctcggga gattggcatt gcgattccac gtggatgggg gacagagtcg tcaccaagtc 2580
cacccgaacc tgggtgctgc ccagctacaa caaccaccag taccgagaga tcaaaagcgg 2640
ctccgtcgac ggaagcaacg ccaacgccta ctttggatac agcaccccct gggggtactt 2700
tgactttaac cgcttccaca gccactggag cccccgagac tggcaaagac tcatcaacaa 2760
ctactggggc ttcagacccc ggtccctcag agtcaaaatc ttcaacattc aagtcaaaga 2820
ggtcacggtg caggactcca ccaccaccat cgccaacaac ctcacctcca ccgtccaagt 2880
gtttacggac gacgactacc agctgcccta cgtcgtcggc aacgggaccg agggatgcct 2940
gccggccttc cctccgcagg tctttacgct gccgcagtac ggttacgcga cgctgaaccg 3000
cgacaacaca gaaaatccca ccgagaggag cagcttcttc tgcctagagt actttcccag 3060
caagatgctg agaacgggca acaactttga gtttacctac aactttgagg aggtgccctt 3120
ccactccagc ttcgctccca gtcagaacct gttcaagctg gccaacccgc tggtggacca 3180
gtacttgtac cgcttcgtga gcacaaataa cactggcgga gtccagttca acaagaacct 3240
ggccgggaga tacgccaaca cctacaaaaa ctggttcccg gggcccatgg gccgaaccca 3300
gggctggaac ctgggctccg gggtcaaccg cgccagtgtc agcgccttcg ccacgaccaa 3360
taggatggag ctcgagggcg cgagttacca ggtgcccccg cagccgaacg gcatgaccaa 3420
caacctccag ggcagcaaca cctatgccct ggagaacact atgatcttca acagccagcc 3480
ggcgaacccg ggcaccaccg ccacgtacct cgagggcaac atgctcatca ccagcgagag 3540
cgagacgcag ccggtgaacc gcgtggcgta caacgtcggc gggcagatgg ccaccaacaa 3600
ccagagctcc accactgccc ccgcgaccgg cacgtacaac ctccaggaaa tcgtgcccgg 3660
cagcgtgtgg atggagaggg acgtgtacct ccaaggaccc atctgggcca agatcccaga 3720
gacgggggcg cactttcacc cctctccggc catgggcgga ttcggactca aacacccacc 3780
gcccatgatg ctcatcaaga acacgcctgt gcccggaaat atcaccagct tctcggacgt 3840
gcccgtcagc agcttcatca cccagtacag caccgggcag gtcaccgtgg agatggagtg 3900
ggagctcaag aaggaaaact ccaagaggtg gaacccagag atccagtaca caaacaacta 3960
caacgacccc cagtttgtgg actttgcccc ggacagcacc ggggaataca gaaccaccag 4020
acctatcgga acccgatacc ttacccgacc cctttaa 4057
<210> 97
<211> 2220
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 97
atggctgccg atggttatct tccagattgg ctcgaggaca acctctctga gggcattcgc 60
gagtggtggg acttgaaacc tggagccccg aaacccaaag ccaaccagca aaagcaggac 120
gacggccggg gtctggtgct tcctggctac aagtacctcg gacccttcaa cggactcgac 180
aagggggagc ccgtcaacgc ggcggatgca gcggccctcg agcacgacaa ggcctacgac 240
cagcagctca aagcgggtga caatccgtac ctgcggtata accacgccga cgccgagttt 300
caggagcgtc tgcaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360
gccaagaaga gggttctcga acctcttggt ctggttgagg aaggtgctaa gacggctcct 420
ggaaagaaac gtccggtaga gcagtcgcca caagagccag actcctcctc gggcattggc 480
aagacaggcc agcagcccgc taaaaagaga ctcaattttg gtcagactgg cgactcagag 540
tcagtccccg acccacaacc tctcggagaa cctccagcaa cccccgctgc tgtgggacct 600
actacaatgg cttcaggcgg tggcgcacca atggcagaca ataacgaagg cgccgacgga 660
gtgggtaatg cctcaggaaa ttggcattgc gattccacat ggctgggcga cagagtcatc 720
accaccagca cccgaacatg ggccttgccc acctataaca accacctcta caagcaaatc 780
tccagtgctt caacgggggc cagcaacgac aaccactact tcggctacag caccccctgg 840
gggtattttg atttcaacag attccactgc catttctcac cacgtgactg gcagcgactc 900
atcaacaaca attggggatt ccggcccaag agactcaact tcaagctctt caacatccaa 960
gtcaaggagg tcacgacgaa tgatggcgtc acgaccatcg ctaataacct taccagcacg 1020
gttcaagtct tctcggactc ggagtaccag ttgccgtacg tcctcggctc tgcgcaccag 1080
ggctgcctcc ctccgttccc ggcggacgtg ttcatgattc cgcagtacgg ctacctaacg 1140
ctcaacaatg gcagccaggc agtgggacgg tcatcctttt actgcctgga atatttccca 1200
tcgcagatgc tgagaacggg caataacttt accttcagct acaccttcga ggacgtgcct 1260
ttccacagca gctacgcgca cagccagagc ctggaccggc tgatgaatcc tctcatcgac 1320
cagtacctgt attacctgaa cagaactcag aatcagtccg gaagtgccca aaacaaggac 1380
ttgctgttta gccgggggtc tccagctggc atgtctgttc agcccaaaaa ctggctacct 1440
ggaccctgtt accggcagca gcgcgtttct aaaacaaaaa cagacaacaa caacagcaac 1500
tttacctgga ctggtgcttc aaaatataac cttaatgggc gtgaatctat aatcaaccct 1560
ggcactgcta tggcctcaca caaagacgac aaagacaagt tctttcccat gagcggtgtc 1620
atgatttttg gaaaggagag cgccggagct tcaaacactg cattggacaa tgtcatgatc 1680
acagacgaag aggaaatcaa agccactaac cccgtggcca ccgaaagatt tgggactgtg 1740
gcagtcaatc tccagagcag cagcacagac cctgcgaccg gagatgtgca tgttatggga 1800
gccttacctg gaatggtgtg gcaagacaga gacgtatacc tgcagggtcc tatttgggcc 1860
aaaattcctc acacggatgg acactttcac ccgtctcctc tcatgggcgg ctttggactt 1920
aagcacccgc ctcctcagat cctcatcaaa aacacgcctg ttcctgcgaa tcctccggca 1980
gagttttcgg ctacaaagtt tgcttcattc atcacccagt attccacagg acaagtgagc 2040
gtggagattg aatgggagct gcagaaagaa aacagcaaac gctggaatcc cgaagtgcag 2100
tatacatcta actatgcaaa atctgccaac gttgatttca ctgtggacaa caatggactt 2160
tatactgagc ctcgccccat tggcacccgt tacctcaccc gtcccctgta tgcttgttaa 2220
<210> 98
<211> 4102
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 98
atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60
ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120
tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180
cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240
caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300
aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360
taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420
gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480
acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540
aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600
gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660
tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720
cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780
tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840
cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900
attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960
acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020
accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080
aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140
aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200
gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260
aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320
ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380
gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440
gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500
gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560
gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620
aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680
ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740
tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800
ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860
caataaatga cttaaaccag gtatggctgc cgatggttat cttccagatt ggctcgagga 1920
caacctctct gagggcattc gcgagtggtg ggacttgaaa cctggagccc cgaaacccaa 1980
agccaaccag caaaagcagg acgacggccg gggtctggtg cttcctggct acaagtacct 2040
cggacccttc aacggactcg acaaggggga gcccgtcaac gcggcggatg cagcggccct 2100
cgagcacgac aaggcctacg accagcagct caaagcgggt gacaatccgt acctgcggta 2160
taaccacgcc gacgccgagt ttcaggagcg tctgcaagaa gatacgtctt ttgggggcaa 2220
cctcgggcga gcagtcttcc aggccaagaa gagggttctc gaacctcttg gtctggttga 2280
ggaaggtgct aagacggctc ctggaaagaa acgtccggta gagcagtcgc cacaagagcc 2340
agactcctcc tcgggcattg gcaagacagg ccagcagccc gctaaaaaga gactcaattt 2400
tggtcagact ggcgactcag agtcagtccc cgacccacaa cctctcggag aacctccagc 2460
aacccccgct gctgtgggac ctactacaat ggcttcaggc ggtggcgcac caatggcaga 2520
caataacgaa ggcgccgacg gagtgggtaa tgcctcagga aattggcatt gcgattccac 2580
atggctgggc gacagagtca tcaccaccag cacccgaaca tgggccttgc ccacctataa 2640
caaccacctc tacaagcaaa tctccagtgc ttcaacgggg gccagcaacg acaaccacta 2700
cttcggctac agcaccccct gggggtattt tgatttcaac agattccact gccatttctc 2760
accacgtgac tggcagcgac tcatcaacaa caattgggga ttccggccca agagactcaa 2820
cttcaagctc ttcaacatcc aagtcaagga ggtcacgacg aatgatggcg tcacgaccat 2880
cgctaataac cttaccagca cggttcaagt cttctcggac tcggagtacc agttgccgta 2940
cgtcctcggc tctgcgcacc agggctgcct ccctccgttc ccggcggacg tgttcatgat 3000
tccgcagtac ggctacctaa cgctcaacaa tggcagccag gcagtgggac ggtcatcctt 3060
ttactgcctg gaatatttcc catcgcagat gctgagaacg ggcaataact ttaccttcag 3120
ctacaccttc gaggacgtgc ctttccacag cagctacgcg cacagccaga gcctggaccg 3180
gctgatgaat cctctcatcg accagtacct gtattacctg aacagaactc agaatcagtc 3240
cggaagtgcc caaaacaagg acttgctgtt tagccggggg tctccagctg gcatgtctgt 3300
tcagcccaaa aactggctac ctggaccctg ttaccggcag cagcgcgttt ctaaaacaaa 3360
aacagacaac aacaacagca actttacctg gactggtgct tcaaaatata accttaatgg 3420
gcgtgaatct ataatcaacc ctggcactgc tatggcctca cacaaagacg acaaagacaa 3480
gttctttccc atgagcggtg tcatgatttt tggaaaggag agcgccggag cttcaaacac 3540
tgcattggac aatgtcatga tcacagacga agaggaaatc aaagccacta accccgtggc 3600
caccgaaaga tttgggactg tggcagtcaa tctccagagc agcagcacag accctgcgac 3660
cggagatgtg catgttatgg gagccttacc tggaatggtg tggcaagaca gagacgtata 3720
cctgcagggt cctatttggg ccaaaattcc tcacacggat ggacactttc acccgtctcc 3780
tctcatgggc ggctttggac ttaagcaccc gcctcctcag atcctcatca aaaacacgcc 3840
tgttcctgcg aatcctccgg cagagttttc ggctacaaag tttgcttcat tcatcaccca 3900
gtattccaca ggacaagtga gcgtggagat tgaatgggag ctgcagaaag aaaacagcaa 3960
acgctggaat cccgaagtgc agtatacatc taactatgca aaatctgcca acgttgattt 4020
cactgtggac aacaatggac tttatactga gcctcgcccc attggcaccc gttacctcac 4080
ccgtcccctg tatgcttgtt aa 4102
<210> 99
<211> 2217
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 99
atggctgccg atggttatct tccagattgg ctcgaggaca acctctctga gggcattcgc 60
gagtggtggg cgctgaaacc tggagccccg aagcccaaag ccaaccagca aaagcaggac 120
gacggccggg gtctggtgct tcctggctac aagtacctcg gacccttcaa cggactcgac 180
aagggggagc ccgtcaacgc ggcggacgca gcggccctcg agcacgacaa ggcctacgac 240
cagcagctgc aggcgggtga caatccgtac ctgcggtata accacgccga cgccgagttt 300
caggagcgtc tgcaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360
gccaagaagc gggttctcga acctctcggt ctggttgagg aaggcgctaa gacggctcct 420
ggaaagaaga gaccggtaga gccatcaccc cagcgttctc cagactcctc tacgggcatc 480
ggcaagaaag gccaacagcc cgccagaaaa agactcaatt ttggtcagac tggcgactca 540
gagtcagttc cagaccctca acctctcgga gaacctccag cagcgccctc tggtgtggga 600
cctaatacaa tggctgcagg cggtggcgca ccaatggcag acaataacga aggcgccgac 660
ggagtgggta gttcctcggg aaattggcat tgcgattcca catggctggg cgacagagtc 720
atcaccacca gcacccgaac ctgggccctg cccacctaca acaaccacct ctacaagcaa 780
atctccaacg ggacatcggg aggagccacc aacgacaaca cctacttcgg ctacagcacc 840
ccctgggggt attttgactt taacagattc cactgccact tttcaccacg tgactggcag 900
cgactcatca acaacaactg gggattccgg cccaagagac tcagcttcaa gctcttcaac 960
atccaggtca aggaggtcac gcagaatgaa ggcaccaaga ccatcgccaa taacctcacc 1020
agcaccatcc aggtgtttac ggactcggag taccagctgc cgtacgttct cggctctgcc 1080
caccagggct gcctgcctcc gttcccggcg gacgtgttca tgattcccca gtacggctac 1140
ctaacactca acaacggtag tcaggccgtg ggacgctcct ccttctactg cctggaatac 1200
tttccttcgc agatgctgag aaccggcaac aacttccagt ttacttacac cttcgaggac 1260
gtgcctttcc acagcagcta cgcccacagc cagagcttgg accggctgat gaatcctctg 1320
attgaccagt acctgtacta cttgtctcgg actcaaacaa caggaggcac ggcaaatacg 1380
cagactctgg gcttcagcca aggtgggcct aatacaatgg ccaatcaggc aaagaactgg 1440
ctgccaggac cctgttaccg ccaacaacgc gtctcaacga caaccgggca aaacaacaat 1500
agcaactttg cctggactgc tgggaccaaa taccatctga atggaagaaa ttcattggct 1560
aatcctggca tcgctatggc aacacacaaa gacgacgagg agcgtttttt tcccagtaac 1620
gggatcctga tttttggcaa acaaaatgct gccagagaca atgcggatta cagcgatgtc 1680
atgctcacca gcgaggaaga aatcaaaacc actaaccctg tggctacaga ggaatacggt 1740
atcgtggcag ataacttgca gcagcaaaac acggctcctc aaattggaac tgtcaacagc 1800
cagggggcct tacccggtat ggtctggcag aaccgggacg tgtacctgca gggtcccatc 1860
tgggccaaga ttcctcacac ggacggcaac ttccacccgt ctccgctgat gggcggcttt 1920
ggcctgaaac atcctccgcc tcagatcctg atcaagaaca cgcctgtacc tgcggatcct 1980
ccgaccacct tcaaccagtc aaagctgaac tctttcatca cgcaatacag caccggacag 2040
gtcagcgtgg aaattgaatg ggagctgcag aaggaaaaca gcaagcgctg gaaccccgag 2100
atccagtaca cctccaacta ctacaaatct acaagtgtgg actttgctgt taatacagaa 2160
ggcgtgtact ctgaaccccg ccccattggc acccgttacc tcacccgtaa tctgtaa 2217
<210> 100
<211> 4269
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 100
ggtggagtcg tgacgtgaat tacgtcatag ggttagggag gtcctgtatt agaggtcacg 60
tgagtgtttt gcgacatttt gcgacaccat gtggtcacgc tgggtattta agcccgagtg 120
agcacgcagg gtctccattt tgaagcggga ggtttgaacg cgcagccgcc atgccggggt 180
tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc ggcatttctg 240
acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat tctgacatgg 300
atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag cgcgactttc 360
tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg caatttgaga 420
agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg aaatccatgg 480
ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt taccgcggga 540
tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc gccggaggcg 600
ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa acccagcctg 660
agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg aatctcacgg 720
agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag gagcagaaca 780
aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact tcagccaggt 840
acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag cagtggatcc 900
aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg tcccaaatca 960
aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc cccgactacc 1020
tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa attttggaac 1080
taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc acgaaaaagt 1140
tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag accaacatcg 1200
cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc aatgagaact 1260
ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg aagatgaccg 1320
ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc gtggaccaga 1380
aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc aacaccaaca 1440
tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg ttgcaagacc 1500
ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag gtcaccaagc 1560
aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg gagcatgaat 1620
tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca gatataagtg 1680
agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg gaagcttcga 1740
tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg aatctgatgc 1800
tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc ttcactcacg 1860
gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt tctgtcgtca 1920
aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg ccagacgctt 1980
gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa caataaatga 2040
cttaaaccag gtatggctgc cgatggttat cttccagatt ggctcgagga caacctctct 2100
gagggcattc gcgagtggtg ggcgctgaaa cctggagccc cgaagcccaa agccaaccag 2160
caaaagcagg acgacggccg gggtctggtg cttcctggct acaagtacct cggacccttc 2220
aacggactcg acaaggggga gcccgtcaac gcggcggacg cagcggccct cgagcacgac 2280
aaggcctacg accagcagct gcaggcgggt gacaatccgt acctgcggta taaccacgcc 2340
gacgccgagt ttcaggagcg tctgcaagaa gatacgtctt ttgggggcaa cctcgggcga 2400
gcagtcttcc aggccaagaa gcgggttctc gaacctctcg gtctggttga ggaaggcgct 2460
aagacggctc ctggaaagaa gagaccggta gagccatcac cccagcgttc tccagactcc 2520
tctacgggca tcggcaagaa aggccaacag cccgccagaa aaagactcaa ttttggtcag 2580
actggcgact cagagtcagt tccagaccct caacctctcg gagaacctcc agcagcgccc 2640
tctggtgtgg gacctaatac aatggctgca ggcggtggcg caccaatggc agacaataac 2700
gaaggcgccg acggagtggg tagttcctcg ggaaattggc attgcgattc cacatggctg 2760
ggcgacagag tcatcaccac cagcacccga acctgggccc tgcccaccta caacaaccac 2820
ctctacaagc aaatctccaa cgggacatcg ggaggagcca ccaacgacaa cacctacttc 2880
ggctacagca ccccctgggg gtattttgac tttaacagat tccactgcca cttttcacca 2940
cgtgactggc agcgactcat caacaacaac tggggattcc ggcccaagag actcagcttc 3000
aagctcttca acatccaggt caaggaggtc acgcagaatg aaggcaccaa gaccatcgcc 3060
aataacctca ccagcaccat ccaggtgttt acggactcgg agtaccagct gccgtacgtt 3120
ctcggctctg cccaccaggg ctgcctgcct ccgttcccgg cggacgtgtt catgattccc 3180
cagtacggct acctaacact caacaacggt agtcaggccg tgggacgctc ctccttctac 3240
tgcctggaat actttccttc gcagatgctg agaaccggca acaacttcca gtttacttac 3300
accttcgagg acgtgccttt ccacagcagc tacgcccaca gccagagctt ggaccggctg 3360
atgaatcctc tgattgacca gtacctgtac tacttgtctc ggactcaaac aacaggaggc 3420
acggcaaata cgcagactct gggcttcagc caaggtgggc ctaatacaat ggccaatcag 3480
gcaaagaact ggctgccagg accctgttac cgccaacaac gcgtctcaac gacaaccggg 3540
caaaacaaca atagcaactt tgcctggact gctgggacca aataccatct gaatggaaga 3600
aattcattgg ctaatcctgg catcgctatg gcaacacaca aagacgacga ggagcgtttt 3660
tttcccagta acgggatcct gatttttggc aaacaaaatg ctgccagaga caatgcggat 3720
tacagcgatg tcatgctcac cagcgaggaa gaaatcaaaa ccactaaccc tgtggctaca 3780
gaggaatacg gtatcgtggc agataacttg cagcagcaaa acacggctcc tcaaattgga 3840
actgtcaaca gccagggggc cttacccggt atggtctggc agaaccggga cgtgtacctg 3900
cagggtccca tctgggccaa gattcctcac acggacggca acttccaccc gtctccgctg 3960
atgggcggct ttggcctgaa acatcctccg cctcagatcc tgatcaagaa cacgcctgta 4020
cctgcggatc ctccgaccac cttcaaccag tcaaagctga actctttcat cacgcaatac 4080
agcaccggac aggtcagcgt ggaaattgaa tgggagctgc agaaggaaaa cagcaagcgc 4140
tggaaccccg agatccagta cacctccaac tactacaaat ctacaagtgt ggactttgct 4200
gttaatacag aaggcgtgta ctctgaaccc cgccccattg gcacccgtta cctcacccgt 4260
aatctgtaa 4269
<210> 101
<211> 2211
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 101
atggctgccg atggttatct tccagattgg ctcgaggaca accttagtga aggaattcgc 60
gagtggtggg ctttgaaacc tggagcccct caacccaagg caaatcaaca acatcaagac 120
aacgctcgag gtcttgtgct tccgggttac aaataccttg gacccggcaa cggactcgac 180
aagggggagc cggtcaacgc agcagacgcg gcggccctcg agcacgacaa ggcctacgac 240
cagcagctca aggccggaga caacccgtac ctcaagtaca accacgccga cgccgagttc 300
caggagcggc tcaaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360
gccaaaaaga ggcttcttga acctcttggt ctggttgagg aagcggctaa gacggctcct 420
ggaaagaaga ggcctgtaga gcagtctcct caggaaccgg actcctccgc gggtattggc 480
aaatcgggtg cacagcccgc taaaaagaga ctcaatttcg gtcagactgg cgacacagag 540
tcagtcccag accctcaacc aatcggagaa cctcccgcag ccccctcagg tgtgggatct 600
cttacaatgg cttcaggtgg tggcgcacca gtggcagaca ataacgaagg tgccgatgga 660
gtgggtagtt cctcgggaaa ttggcattgc gattcccaat ggctggggga cagagtcatc 720
accaccagca cccgaacctg ggccctgccc acctacaaca atcacctcta caagcaaatc 780
tccaacagca catctggagg atcttcaaat gacaacgcct acttcggcta cagcaccccc 840
tgggggtatt ttgacttcaa cagattccac tgccacttct caccacgtga ctggcagcga 900
ctcatcaaca acaactgggg attccggcct aagcgactca acttcaagct cttcaacatt 960
caggtcaaag aggttacgga caacaatgga gtcaagacca tcgccaataa ccttaccagc 1020
acggtccagg tcttcacgga ctcagactat cagctcccgt acgtgctcgg gtcggctcac 1080
gagggctgcc tcccgccgtt cccagcggac gttttcatga ttcctcagta cgggtatctg 1140
acgcttaatg atggaagcca ggccgtgggt cgttcgtcct tttactgcct ggaatatttc 1200
ccgtcgcaaa tgctaagaac gggtaacaac ttccagttca gctacgagtt tgagaacgta 1260
cctttccata gcagctacgc tcacagccaa agcctggacc gactaatgaa tccactcatc 1320
gaccaatact tgtactatct ctcaaagact attaacggtt ctggacagaa tcaacaaacg 1380
ctaaaattca gtgtggccgg acccagcaac atggctgtcc agggaagaaa ctacatacct 1440
ggacccagct accgacaaca acgtgtctca accactgtga ctcaaaacaa caacagcgaa 1500
tttgcttggc ctggagcttc ttcttgggct ctcaatggac gtaatagctt gatgaatcct 1560
ggacctgcta tggccagcca caaagaagga gaggaccgtt tctttccttt gtctggatct 1620
ttaatttttg gcaaacaagg aactggaaga gacaacgtgg atgcggacaa agtcatgata 1680
accaacgaag aagaaattaa aactactaac ccggtagcaa cggagtccta tggacaagtg 1740
gccacaaacc accagagtgc ccaagcacag gcgcagaccg gctgggttca aaaccaagga 1800
atacttccgg gtatggtttg gcaggacaga gatgtgtacc tgcaaggacc catttgggcc 1860
aaaattcctc acacggacgg caactttcac ccttctccgc tgatgggagg gtttggaatg 1920
aagcacccgc ctcctcagat cctcatcaaa aacacacctg tacctgcgga tcctccaacg 1980
gccttcaaca aggacaagct gaactctttc atcacccagt attctactgg ccaagtcagc 2040
gtggagatcg agtgggagct gcagaaggaa aacagcaagc gctggaaccc ggagatccag 2100
tacacttcca actattacaa gtctaataat gttgaatttg ctgttaatac tgaaggtgta 2160
tatagtgaac cccgccccat tggcaccaga tacctgactc gtaatctgta a 2211
<210> 102
<211> 4093
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 102
atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60
ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120
tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180
cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240
caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300
aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360
taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420
gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480
acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540
aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600
gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660
tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720
cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780
tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840
cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900
attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960
acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020
accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080
aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140
aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200
gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260
aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320
ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380
gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440
gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500
gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560
gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620
aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680
ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740
tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800
ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860
caataaatga cttaaaccag gtatggctgc cgatggttat cttccagatt ggctcgagga 1920
caaccttagt gaaggaattc gcgagtggtg ggctttgaaa cctggagccc ctcaacccaa 1980
ggcaaatcaa caacatcaag acaacgctcg aggtcttgtg cttccgggtt acaaatacct 2040
tggacccggc aacggactcg acaaggggga gccggtcaac gcagcagacg cggcggccct 2100
cgagcacgac aaggcctacg accagcagct caaggccgga gacaacccgt acctcaagta 2160
caaccacgcc gacgccgagt tccaggagcg gctcaaagaa gatacgtctt ttgggggcaa 2220
cctcgggcga gcagtcttcc aggccaaaaa gaggcttctt gaacctcttg gtctggttga 2280
ggaagcggct aagacggctc ctggaaagaa gaggcctgta gagcagtctc ctcaggaacc 2340
ggactcctcc gcgggtattg gcaaatcggg tgcacagccc gctaaaaaga gactcaattt 2400
cggtcagact ggcgacacag agtcagtccc agaccctcaa ccaatcggag aacctcccgc 2460
agccccctca ggtgtgggat ctcttacaat ggcttcaggt ggtggcgcac cagtggcaga 2520
caataacgaa ggtgccgatg gagtgggtag ttcctcggga aattggcatt gcgattccca 2580
atggctgggg gacagagtca tcaccaccag cacccgaacc tgggccctgc ccacctacaa 2640
caatcacctc tacaagcaaa tctccaacag cacatctgga ggatcttcaa atgacaacgc 2700
ctacttcggc tacagcaccc cctgggggta ttttgacttc aacagattcc actgccactt 2760
ctcaccacgt gactggcagc gactcatcaa caacaactgg ggattccggc ctaagcgact 2820
caacttcaag ctcttcaaca ttcaggtcaa agaggttacg gacaacaatg gagtcaagac 2880
catcgccaat aaccttacca gcacggtcca ggtcttcacg gactcagact atcagctccc 2940
gtacgtgctc gggtcggctc acgagggctg cctcccgccg ttcccagcgg acgttttcat 3000
gattcctcag tacgggtatc tgacgcttaa tgatggaagc caggccgtgg gtcgttcgtc 3060
cttttactgc ctggaatatt tcccgtcgca aatgctaaga acgggtaaca acttccagtt 3120
cagctacgag tttgagaacg tacctttcca tagcagctac gctcacagcc aaagcctgga 3180
ccgactaatg aatccactca tcgaccaata cttgtactat ctctcaaaga ctattaacgg 3240
ttctggacag aatcaacaaa cgctaaaatt cagtgtggcc ggacccagca acatggctgt 3300
ccagggaaga aactacatac ctggacccag ctaccgacaa caacgtgtct caaccactgt 3360
gactcaaaac aacaacagcg aatttgcttg gcctggagct tcttcttggg ctctcaatgg 3420
acgtaatagc ttgatgaatc ctggacctgc tatggccagc cacaaagaag gagaggaccg 3480
tttctttcct ttgtctggat ctttaatttt tggcaaacaa ggaactggaa gagacaacgt 3540
ggatgcggac aaagtcatga taaccaacga agaagaaatt aaaactacta acccggtagc 3600
aacggagtcc tatggacaag tggccacaaa ccaccagagt gcccaagcac aggcgcagac 3660
cggctgggtt caaaaccaag gaatacttcc gggtatggtt tggcaggaca gagatgtgta 3720
cctgcaagga cccatttggg ccaaaattcc tcacacggac ggcaactttc acccttctcc 3780
gctgatggga gggtttggaa tgaagcaccc gcctcctcag atcctcatca aaaacacacc 3840
tgtacctgcg gatcctccaa cggccttcaa caaggacaag ctgaactctt tcatcaccca 3900
gtattctact ggccaagtca gcgtggagat cgagtgggag ctgcagaagg aaaacagcaa 3960
gcgctggaac ccggagatcc agtacacttc caactattac aagtctaata atgttgaatt 4020
tgctgttaat actgaaggtg tatatagtga accccgcccc attggcacca gatacctgac 4080
tcgtaatctg taa 4093
<210> 103
<211> 2217
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 103
atggctgccg atggttatct tccagattgg ctcgaggaca acctctctga gggcattcgc 60
gagtggtggg acttgaaacc tggagccccg aaacccaaag ccaaccagca aaagcaggac 120
gacggccggg gtctggtgct tcctggctac aagtacctcg gacccttcaa cggactcgac 180
aagggggagc ccgtcaacgc ggcggacgca gcggccctcg agcacgacaa ggcctacgac 240
cagcagctca aagcgggtga caatccgtac ctgcggtata accacgccga cgccgagttt 300
caggagcgtc tgcaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360
gccaagaagc gggttctcga acctctcggt ctggttgagg aaggcgctaa gacggctcct 420
ggaaagaaga gaccggtaga gccatcaccc cagcgttctc cagactcctc tacgggcatc 480
ggcaagaaag gccagcagcc cgcgaaaaag agactcaact ttgggcagac tggcgactca 540
gagtcagtgc ccgaccctca accaatcgga gaaccccccg caggcccctc tggtctggga 600
tctggtacaa tggctgcagg cggtggcgct ccaatggcag acaataacga aggcgccgac 660
ggagtgggta gttcctcagg aaattggcat tgcgattcca catggctggg cgacagagtc 720
atcaccacca gcacccgaac ctgggccctc cccacctaca acaaccacct ctacaagcaa 780
atctccaacg ggacttcggg aggaagcacc aacgacaaca cctacttcgg ctacagcacc 840
ccctgggggt attttgactt taacagattc cactgccact tctcaccacg tgactggcag 900
cgactcatca acaacaactg gggattccgg cccaagagac tcaacttcaa gctcttcaac 960
atccaggtca aggaggtcac gcagaatgaa ggcaccaaga ccatcgccaa taaccttacc 1020
agcacgattc aggtctttac ggactcggaa taccagctcc cgtacgtcct cggctctgcg 1080
caccagggct gcctgcctcc gttcccggcg gacgtcttca tgattcctca gtacgggtac 1140
ctgactctga acaatggcag tcaggccgtg ggccgttcct ccttctactg cctggagtac 1200
tttccttctc aaatgctgag aacgggcaac aactttgagt tcagctacca gtttgaggac 1260
gtgccttttc acagcagcta cgcgcacagc caaagcctgg accggctgat gaaccccctc 1320
atcgaccagt acctgtacta cctgtctcgg actcagtcca cgggaggtac cgcaggaact 1380
cagcagttgc tattttctca ggccgggcct aataacatgt cggctcaggc caaaaactgg 1440
ctacccgggc cctgctaccg gcagcaacgc gtctccacga cactgtcgca aaataacaac 1500
agcaactttg cctggaccgg tgccaccaag tatcatctga atggcagaga ctctctggta 1560
aatcccggtg tcgctatggc aacccacaag gacgacgaag agcgattttt tccgtccagc 1620
ggagtcttaa tgtttgggaa acagggagct ggaaaagaca acgtggacta tagcagcgtt 1680
atgctaacca gtgaggaaga aattaaaacc accaacccag tggccacaga acagtacggc 1740
gtggtggccg ataacctgca acagcaaaac gccgctccta ttgtaggggc cgtcaacagt 1800
caaggagcct tacctggcat ggtctggcag aaccgggacg tgtacctgca gggtcctatc 1860
tgggccaaga ttcctcacac ggacggaaac tttcatccct cgccgctgat gggaggcttt 1920
ggactgaaac acccgcctcc tcagatcctg attaagaata cacctgttcc cgcggatcct 1980
ccaactacct tcagtcaagc taagctggcg tcgttcatca cgcagtacag caccggacag 2040
gtcagcgtgg aaattgaatg ggagctgcag aaagaaaaca gcaaacgctg gaacccagag 2100
attcaataca cttccaacta ctacaaatct acaaatgtgg actttgctgt taacacagat 2160
ggcacttatt ctgagcctcg ccccatcggc acccgttacc tcacccgtaa tctgtaa 2217
<210> 104
<211> 4269
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 104
ggtggagtcg tgacgtgaat tacgtcatag ggttagggag gtcctgtatt agaggtcacg 60
tgagtgtttt gcgacatttt gcgacaccat gtggtcacgc tgggtattta agcccgagtg 120
agcacgcagg gtctccattt tgaagcggga ggtttgaacg cgcagccgcc atgccggggt 180
tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc ggcatttctg 240
acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat tctgacatgg 300
atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag cgcgactttc 360
tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg caatttgaga 420
agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg aaatccatgg 480
ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt taccgcggga 540
tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc gccggaggcg 600
ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa acccagcctg 660
agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg aatctcacgg 720
agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag gagcagaaca 780
aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact tcagccaggt 840
acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag cagtggatcc 900
aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg tcccaaatca 960
aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc cccgactacc 1020
tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa attttggaac 1080
taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc acgaaaaagt 1140
tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag accaacatcg 1200
cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc aatgagaact 1260
ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg aagatgaccg 1320
ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc gtggaccaga 1380
aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc aacaccaaca 1440
tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg ttgcaagacc 1500
ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag gtcaccaagc 1560
aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg gagcatgaat 1620
tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca gatataagtg 1680
agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg gaagcttcga 1740
tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg aatctgatgc 1800
tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc ttcactcacg 1860
gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt tctgtcgtca 1920
aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg ccagacgctt 1980
gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa caataaatga 2040
cttaaaccag gtatggctgc cgatggttat cttccagatt ggctcgagga caacctctct 2100
gagggcattc gcgagtggtg ggacttgaaa cctggagccc cgaaacccaa agccaaccag 2160
caaaagcagg acgacggccg gggtctggtg cttcctggct acaagtacct cggacccttc 2220
aacggactcg acaaggggga gcccgtcaac gcggcggacg cagcggccct cgagcacgac 2280
aaggcctacg accagcagct caaagcgggt gacaatccgt acctgcggta taaccacgcc 2340
gacgccgagt ttcaggagcg tctgcaagaa gatacgtctt ttgggggcaa cctcgggcga 2400
gcagtcttcc aggccaagaa gcgggttctc gaacctctcg gtctggttga ggaaggcgct 2460
aagacggctc ctggaaagaa gagaccggta gagccatcac cccagcgttc tccagactcc 2520
tctacgggca tcggcaagaa aggccagcag cccgcgaaaa agagactcaa ctttgggcag 2580
actggcgact cagagtcagt gcccgaccct caaccaatcg gagaaccccc cgcaggcccc 2640
tctggtctgg gatctggtac aatggctgca ggcggtggcg ctccaatggc agacaataac 2700
gaaggcgccg acggagtggg tagttcctca ggaaattggc attgcgattc cacatggctg 2760
ggcgacagag tcatcaccac cagcacccga acctgggccc tccccaccta caacaaccac 2820
ctctacaagc aaatctccaa cgggacttcg ggaggaagca ccaacgacaa cacctacttc 2880
ggctacagca ccccctgggg gtattttgac tttaacagat tccactgcca cttctcacca 2940
cgtgactggc agcgactcat caacaacaac tggggattcc ggcccaagag actcaacttc 3000
aagctcttca acatccaggt caaggaggtc acgcagaatg aaggcaccaa gaccatcgcc 3060
aataacctta ccagcacgat tcaggtcttt acggactcgg aataccagct cccgtacgtc 3120
ctcggctctg cgcaccaggg ctgcctgcct ccgttcccgg cggacgtctt catgattcct 3180
cagtacgggt acctgactct gaacaatggc agtcaggccg tgggccgttc ctccttctac 3240
tgcctggagt actttccttc tcaaatgctg agaacgggca acaactttga gttcagctac 3300
cagtttgagg acgtgccttt tcacagcagc tacgcgcaca gccaaagcct ggaccggctg 3360
atgaaccccc tcatcgacca gtacctgtac tacctgtctc ggactcagtc cacgggaggt 3420
accgcaggaa ctcagcagtt gctattttct caggccgggc ctaataacat gtcggctcag 3480
gccaaaaact ggctacccgg gccctgctac cggcagcaac gcgtctccac gacactgtcg 3540
caaaataaca acagcaactt tgcctggacc ggtgccacca agtatcatct gaatggcaga 3600
gactctctgg taaatcccgg tgtcgctatg gcaacccaca aggacgacga agagcgattt 3660
tttccgtcca gcggagtctt aatgtttggg aaacagggag ctggaaaaga caacgtggac 3720
tatagcagcg ttatgctaac cagtgaggaa gaaattaaaa ccaccaaccc agtggccaca 3780
gaacagtacg gcgtggtggc cgataacctg caacagcaaa acgccgctcc tattgtaggg 3840
gccgtcaaca gtcaaggagc cttacctggc atggtctggc agaaccggga cgtgtacctg 3900
cagggtccta tctgggccaa gattcctcac acggacggaa actttcatcc ctcgccgctg 3960
atgggaggct ttggactgaa acacccgcct cctcagatcc tgattaagaa tacacctgtt 4020
cccgcggatc ctccaactac cttcagtcaa gctaagctgg cgtcgttcat cacgcagtac 4080
agcaccggac aggtcagcgt ggaaattgaa tgggagctgc agaaagaaaa cagcaaacgc 4140
tggaacccag agattcaata cacttccaac tactacaaat ctacaaatgt ggactttgct 4200
gttaacacag atggcactta ttctgagcct cgccccatcg gcacccgtta cctcacccgt 4260
aatctgtaa 4269
<210> 105
<211> 2217
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 105
atggctgccg atggttatct tccagattgg ctcgaggaca acctctctga gggcattcgc 60
gagtggtggg acctgaaacc tggagccccg aaacccaaag ccaaccagca aaagcaggac 120
aacggccggg gtctggtgct tcctggctac aagtacctcg gacccttcaa cggactcgac 180
aagggggagc ccgtcaacgc ggcggacgca gcggccctcg agcacgacaa ggcctacgac 240
cagcagctcc aagcgggtga caatccgtac ctgcggtata atcacgccga cgccgagttt 300
caggagcgtc tgcaagaaga tacgtctttt gggggcaacc tcgggcgcgc agtcttccag 360
gccaaaaagc gggttctcga acctctgggc ctggttgaat cgccggttaa gacggctcct 420
ggaaagaaga gaccggtaga gccatcaccc cagcgctctc cagactcctc tacgggcatc 480
ggcaagaaag gccagcagcc cgcaaaaaag agactcaatt ttgggcagac tggcgactca 540
gagtcagtcc ccgaccctca accaatcgga gaaccaccag caggcccctc tggtctggga 600
tctggtacaa tggctgcagg cggtggcgct ccaatggcag acaataacga aggcgccgac 660
ggagtgggta gttcctcagg aaattggcat tgcgattcca catggctggg cgacagagtc 720
atcaccacca gcacccgcac ctgggccctg cccacctaca acaaccacct ctacaagcaa 780
atctccaacg ggacctcggg aggaagcacc aacgacaaca cctacttcgg ctacagcacc 840
ccctgggggt attttgactt caacagattc cactgccact tttcaccacg tgactggcag 900
cgactcatca acaacaactg gggattccgg cccaagaggc tcaacttcaa gctcttcaac 960
atccaagtca aggaggtcac gcagaatgaa ggcaccaaga ccatcgccaa taaccttacc 1020
agcacgattc aggtctttac ggactcggaa taccagctcc cgtacgtgct cggctcggcg 1080
caccagggct gcctgcctcc gttcccggcg gacgtcttca tgattcctca gtacgggtac 1140
ctgactctga acaatggcag tcaggctgtg ggccggtcgt ccttctactg cctggagtac 1200
tttccttctc aaatgctgag aacgggcaac aactttgaat tcagctacaa cttcgaggac 1260
gtgcccttcc acagcagcta cgcgcacagc cagagcctgg accggctgat gaaccctctc 1320
atcgaccagt acttgtacta cctgtcccgg actcaaagca cgggcggtac tgcaggaact 1380
cagcagttgc tattttctca ggccgggcct aacaacatgt cggctcaggc caagaactgg 1440
ctacccggtc cctgctaccg gcagcaacgc gtctccacga cactgtcgca gaacaacaac 1500
agcaactttg cctggacggg tgccaccaag tatcatctga atggcagaga ctctctggtg 1560
aatcctggcg ttgccatggc tacccacaag gacgacgaag agcgattttt tccatccagc 1620
ggagtcttaa tgtttgggaa acagggagct ggaaaagaca acgtggacta tagcagcgtg 1680
atgctaacca gcgaggaaga aataaagacc accaacccag tggccacaga acagtacggc 1740
gtggtggccg ataacctgca acagcaaaac gccgctccta ttgtaggggc cgtcaatagt 1800
caaggagcct tacctgggat ggtgtggcag aaccgggacg tgtacctgca gggtcccatc 1860
tgggccaaga ttcctcatac ggacggcaac tttcatccct cgccgctgat gggaggcttt 1920
ggactgaagc atccgcctcc tcagatcctg attaaaaaca cacctgttcc cgcggatcct 1980
ccgaccacct tcaatcaggc caagctggct tctttcatca cgcagtacag taccggccag 2040
gtcagcgtgg agatcgagtg ggagctgcag aaggagaaca gcaaacgctg gaacccagag 2100
attcagtaca cttccaacta ctacaaatct acaaatgtgg actttgctgt caatactgag 2160
ggtacttatt ccgagcctcg ccccattggc acccgttacc tcacccgtaa tctgtaa 2217
<210> 106
<211> 4099
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 106
atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60
ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120
tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180
cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240
caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300
aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360
taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420
gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480
acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540
aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600
gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660
tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720
cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780
tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840
cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900
attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960
acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020
accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080
aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140
aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200
gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260
aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320
ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380
gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440
gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500
gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560
gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620
aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680
ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740
tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800
ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860
caataaatga cttaaaccag gtatggctgc cgatggttat cttccagatt ggctcgagga 1920
caacctctct gagggcattc gcgagtggtg ggacctgaaa cctggagccc cgaaacccaa 1980
agccaaccag caaaagcagg acaacggccg gggtctggtg cttcctggct acaagtacct 2040
cggacccttc aacggactcg acaaggggga gcccgtcaac gcggcggacg cagcggccct 2100
cgagcacgac aaggcctacg accagcagct ccaagcgggt gacaatccgt acctgcggta 2160
taatcacgcc gacgccgagt ttcaggagcg tctgcaagaa gatacgtctt ttgggggcaa 2220
cctcgggcgc gcagtcttcc aggccaaaaa gcgggttctc gaacctctgg gcctggttga 2280
atcgccggtt aagacggctc ctggaaagaa gagaccggta gagccatcac cccagcgctc 2340
tccagactcc tctacgggca tcggcaagaa aggccagcag cccgcaaaaa agagactcaa 2400
ttttgggcag actggcgact cagagtcagt ccccgaccct caaccaatcg gagaaccacc 2460
agcaggcccc tctggtctgg gatctggtac aatggctgca ggcggtggcg ctccaatggc 2520
agacaataac gaaggcgccg acggagtggg tagttcctca ggaaattggc attgcgattc 2580
cacatggctg ggcgacagag tcatcaccac cagcacccgc acctgggccc tgcccaccta 2640
caacaaccac ctctacaagc aaatctccaa cgggacctcg ggaggaagca ccaacgacaa 2700
cacctacttc ggctacagca ccccctgggg gtattttgac ttcaacagat tccactgcca 2760
cttttcacca cgtgactggc agcgactcat caacaacaac tggggattcc ggcccaagag 2820
gctcaacttc aagctcttca acatccaagt caaggaggtc acgcagaatg aaggcaccaa 2880
gaccatcgcc aataacctta ccagcacgat tcaggtcttt acggactcgg aataccagct 2940
cccgtacgtg ctcggctcgg cgcaccaggg ctgcctgcct ccgttcccgg cggacgtctt 3000
catgattcct cagtacgggt acctgactct gaacaatggc agtcaggctg tgggccggtc 3060
gtccttctac tgcctggagt actttccttc tcaaatgctg agaacgggca acaactttga 3120
attcagctac aacttcgagg acgtgccctt ccacagcagc tacgcgcaca gccagagcct 3180
ggaccggctg atgaaccctc tcatcgacca gtacttgtac tacctgtccc ggactcaaag 3240
cacgggcggt actgcaggaa ctcagcagtt gctattttct caggccgggc ctaacaacat 3300
gtcggctcag gccaagaact ggctacccgg tccctgctac cggcagcaac gcgtctccac 3360
gacactgtcg cagaacaaca acagcaactt tgcctggacg ggtgccacca agtatcatct 3420
gaatggcaga gactctctgg tgaatcctgg cgttgccatg gctacccaca aggacgacga 3480
agagcgattt tttccatcca gcggagtctt aatgtttggg aaacagggag ctggaaaaga 3540
caacgtggac tatagcagcg tgatgctaac cagcgaggaa gaaataaaga ccaccaaccc 3600
agtggccaca gaacagtacg gcgtggtggc cgataacctg caacagcaaa acgccgctcc 3660
tattgtaggg gccgtcaata gtcaaggagc cttacctggg atggtgtggc agaaccggga 3720
cgtgtacctg cagggtccca tctgggccaa gattcctcat acggacggca actttcatcc 3780
ctcgccgctg atgggaggct ttggactgaa gcatccgcct cctcagatcc tgattaaaaa 3840
cacacctgtt cccgcggatc ctccgaccac cttcaatcag gccaagctgg cttctttcat 3900
cacgcagtac agtaccggcc aggtcagcgt ggagatcgag tgggagctgc agaaggagaa 3960
cagcaaacgc tggaacccag agattcagta cacttccaac tactacaaat ctacaaatgt 4020
ggactttgct gtcaatactg agggtactta ttccgagcct cgccccattg gcacccgtta 4080
cctcacccgt aatctgtaa 4099
Claims (58)
- 제1 핵산 벡터로서,
AAV Rep 단백질을 코딩하는 제1 뉴클레오티드 서열;
트랜스진을 포함하는 재조합 AAV (rAAV) 게놈을 포함하는 제2 뉴클레오티드 서열; 및
AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열
을 포함하고, 헬퍼 바이러스 유전자를 포함하지 않는 핵산 벡터. - 제1항에 있어서,
5'으로부터 3'으로
AAV Rep 단백질을 코딩하는 제1 뉴클레오티드 서열;
트랜스진을 포함하는 재조합 AAV (rAAV) 게놈을 포함하는 제2 뉴클레오티드 서열; 및
AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열
을 포함하고, 헬퍼 바이러스 유전자를 포함하지 않는 핵산 벡터. - 제1항에 있어서,
5'으로부터 3'으로
AAV Rep 단백질을 코딩하는 제1 뉴클레오티드 서열;
트랜스진을 포함하는 재조합 AAV (rAAV) 게놈을 포함하는 제2 뉴클레오티드 서열; 및
AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열
을 포함하는 핵산 벡터. - 제1항 내지 제3항 중 어느 한 항에 있어서,
DNA 플라스미드 또는 DNA 최소 벡터인 핵산 벡터. - 재조합 AAV (rAAV) 패키징 시스템으로서,
(i) AAV Rep 단백질을 코딩하는 제1 뉴클레오티드 서열;
트랜스진을 포함하는 재조합 AAV (rAAV) 게놈을 포함하는 제2 뉴클레오티드 서열; 및
AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열
을 포함하는 제1 핵산 벡터, 및
(ii) 헬퍼 바이러스 유전자를 포함하는 제2 핵산 벡터
를 포함하는 패키징 시스템. - 제5항에 있어서,
상기 제1 핵산 벡터가 5'으로부터 3'으로
AAV Rep 단백질을 코딩하는 제1 뉴클레오티드 서열;
트랜스진을 포함하는 재조합 AAV (rAAV) 게놈을 포함하는 제2 뉴클레오티드 서열; 및
AAV 캡시드 단백질을 코딩하는 제3 뉴클레오티드 서열
을 포함하는, 패키징 시스템. - 제5항 또는 제6항에 있어서,
상기 제1 핵산 벡터가 DNA 플라스미드 또는 DNA 최소 벡터인, 패키징 시스템. - 제5항 내지 제7항 중 어느 한 항에 있어서,
상기 제2 핵산 벡터가 DNA 플라스미드 또는 DNA 최소 벡터인, 패키징 시스템. - 제1항 내지 제8항 중 어느 한 항에 있어서,
상기 트랜스진이 폴리펩티드를 코딩하는, 핵산 벡터 또는 패키징 시스템. - 제1항 내지 제8항 중 어느 한 항에 있어서,
상기 트랜스진이 miRNA, shRNA, siRNA, 안티센스 RNA, gRNA, 안타고미르, miRNA 스폰지, RNA 압타자임, RNA 압타머, lncRNA, 리보자임 또는 mRNA를 코딩하는, 핵산 벡터 또는 패키징 시스템. - 제1항 내지 제8항 중 어느 한 항에 있어서,
상기 트랜스진이 글루코스-6-포스파타제 (G6Pase) 또는 프라탁신 (FXN)을 코딩하는, 핵산 벡터 또는 패키징 시스템. - 제1항 내지 제11항 중 어느 한 항에 있어서,
상기 rAAV 게놈이 트랜스진에 작동가능하게 연결된 전사 조절 요소를 추가로 포함하는, 핵산 벡터 또는 패키징 시스템. - 제12항에 있어서,
상기 전사 조절 요소가 프로모터 요소 및/또는 인트론 요소를 포함하는, 핵산 벡터 또는 패키징 시스템. - 제1항 내지 제13항 중 어느 한 항에 있어서,
상기 rAAV 게놈이 폴리아데닐화 서열을 추가로 포함하는, 핵산 벡터 또는 패키징 시스템. - 제14항에 있어서,
상기 폴리아데닐화 서열이 트랜스진에 대해 3'인, 핵산 벡터 또는 패키징 시스템. - 제1항 내지 제15항 중 어느 한 항에 있어서,
상기 rAAV 게놈이 트랜스진의 5'의 5' 역전 말단 반복부 (5' ITR) 뉴클레오티드 서열, 및 트랜스진의 3'의 3' 역전 말단 반복부 (3' ITR) 뉴클레오티드 서열을 추가로 포함하는, 핵산 벡터 또는 패키징 시스템. - 제1항 내지 제16항 중 어느 한 항에 있어서,
상기 AAV Rep 단백질이 야생형 Rep 단백질 또는 이의 변이체인, 핵산 벡터 또는 패키징 시스템. - 제1항 내지 제17항 중 어느 한 항에 있어서,
상기 AAV Rep 단백질이 AAV2 Rep 단백질 또는 이의 변이체인, 핵산 벡터 또는 패키징 시스템. - 제1항 내지 제18항 중 어느 한 항에 있어서,
상기 제1 뉴클레오티드 서열이 AAV Rep 단백질 코딩 서열에 작동가능하게 연결된 전사 조절 요소를 추가로 포함하는, 핵산 벡터 또는 패키징 시스템. - 제19항에 있어서,
상기 전사 조절 요소가 구성적 프로모터, 유도성 프로모터 및 천연 프로모터로 이루어진 군으로부터 선택되는 프로모터를 포함하는, 핵산 벡터 또는 패키징 시스템. - 제20항에 있어서,
상기 프로모터가 P5 프로모터, P19 프로모터, 메탈로티오닌 (MT) 프로모터, 마우스 유방 종양 바이러스 (MMTV) 프로모터, T7 프로모터, 엑디손 곤충 프로모터, 테트라사이클린-억압성 프로모터, 테트라사이클린-유도성 프로모터, RU486-유도성 프로모터 및 라파마이신-유도성 프로모터로 이루어진 군으로부터 선택되는, 핵산 벡터 또는 패키징 시스템. - 제1항 내지 제21항 중 어느 한 항에 있어서,
상기 AAV 캡시드 단백질이 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAVrh10, AAVRh32.33, AAVrh74, AAV-DJ, AAV-LK03, NP59, VOY101, VOY201, VOY701, VOY801, VOY1101, AAVPHP.N, AAVPHP.A, AAVPHP.B, PHP.B2, PHP.B3, G2A3, G2B4, G2B5 및 PHP.S로 이루어진 군으로부터 선택되는, 핵산 벡터 또는 패키징 시스템. - 제1항 내지 제22항 중 어느 한 항에 있어서,
상기 제3 뉴클레오티드 서열이 AAV 캡시드 단백질 코딩 서열에 작동가능하게 연결된 전사 조절 요소를 추가로 포함하는, 핵산 벡터 또는 패키징 시스템. - 제23항에 있어서,
상기 전사 조절 요소가 구성적 프로모터, 유도성 프로모터 및 천연 프로모터로 이루어진 군으로부터 선택되는 프로모터를 포함하는, 핵산 벡터 또는 패키징 시스템. - 제24항에 있어서,
상기 프로모터가 P40 프로모터, 메탈로티오닌 (MT) 프로모터, 마우스 유방 종양 바이러스 (MMTV) 프로모터, T7 프로모터, 엑디손 곤충 프로모터, 테트라사이클린-억압성 프로모터, 테트라사이클린-유도성 프로모터, RU486-유도성 프로모터 및 라파마이신-유도성 프로모터로 이루어진 군으로부터 선택되는, 핵산 벡터 또는 패키징 시스템. - 제5항 내지 제25항 중 어느 한 항에 있어서,
상기 헬퍼 바이러스 유전자가 아데노바이러스, 헤르페스 바이러스, 폭스바이러스, 사이토메갈로바이러스 및 배큘로바이러스로 이루어진 군으로부터 선택되는 헬퍼 바이러스로부터 유래되는, 패키징 시스템. - 제5항 내지 제26항 중 어느 한 항에 있어서,
상기 헬퍼 바이러스 유전자가 E1, E2, E4 및 VA로 이루어진 군으로부터 선택되는 아데노바이러스로부터 유래된 RNA 유전자인, 패키징 시스템. - 제5항 내지 제27항 중 어느 한 항에 있어서,
상기 제2 핵산 벡터가 헬퍼 바이러스 유전자에 작동가능하게 연결된 전사 조절 요소를 추가로 포함하는, 패키징 시스템. - 제28항에 있어서,
상기 전사 조절 요소가 구성적 프로모터, 유도성 프로모터 및 천연 프로모터로 이루어진 군으로부터 선택되는 프로모터를 포함하는, 패키징 시스템. - 제29항에 있어서,
상기 프로모터가 RSV LTR 프로모터, CMV 즉시 초기 프로모터, SV40 프로모터, 디하이드로폴레이트 환원효소 프로모터, 세포질 β-액틴 프로모터, 포스포글리세레이트 키나제 (PGK) 프로모터, 메탈로티오닌 (MT) 프로모터, 마우스 유방 종양 바이러스 (MMTV) 프로모터, T7 프로모터, 엑디손 곤충 프로모터, 테트라사이클린-억압성 프로모터, 테트라사이클린-유도성 프로모터, RU486-유도성 프로모터 및 라파마이신-유도성 프로모터로 이루어진 군으로부터 선택되는, 패키징 시스템. - 제5항 내지 제30항 중 어느 한 항에 있어서,
상기 제2 핵산 벡터가 서열번호 60, 61 또는 62에 제시된 뉴클레오티드 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 뉴클레오티드 서열을 포함하는, 패키징 시스템. - 제5항 내지 제31항 중 어느 한 항에 있어서,
상기 제2 핵산 벡터가 서열번호 63에 제시된 뉴클레오티드 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 뉴클레오티드 서열을 포함하는, 패키징 시스템. - 제5항 내지 제32항 중 어느 한 항에 있어서,
상기 헬퍼 바이러스 유전자가 UL5/8/52, ICP0, ICP4, ICP22 및 UL30/UL42로 이루어진 군으로부터 선택되는 헤르페스 바이러스로부터 유래된 유전자인, 패키징 시스템. - 제33항에 있어서,
상기 제2 핵산 벡터가 헬퍼 바이러스 유전자에 작동가능하게 연결된 전사 조절 요소를 추가로 포함하는, 패키징 시스템. - 제34항에 있어서,
상기 전사 조절 요소가 구성적 프로모터, 유도성 프로모터 및 천연 프로모터로 이루어진 군으로부터 선택되는 프로모터를 포함하는, 패키징 시스템. - 제35항에 있어서,
상기 프로모터가 RSV LTR 프로모터, CMV 즉시 초기 프로모터, SV40 프로모터, 디하이드로폴레이트 환원효소 프로모터, 세포질 β-액틴 프로모터, 포스포글리세레이트 키나제 (PGK) 프로모터, 메탈로티오닌 (MT) 프로모터, 마우스 유방 종양 바이러스 (MMTV) 프로모터, T7 프로모터, 엑디손 곤충 프로모터, 테트라사이클린-억압성 프로모터, 테트라사이클린-유도성 프로모터, RU486-유도성 프로모터 및 라파마이신-유도성 프로모터로 이루어진 군으로부터 선택되는, 패키징 시스템. - 제1항 내지 제4항 및 제9항 내지 제25항 중 어느 한 항의 핵산 벡터, 또는 제5항 내지 제36항 중 어느 한 항의 패키징 시스템을 포함하는 숙주 세포.
- 제37항에 있어서,
상기 숙주 세포가 포유동물 세포인, 숙주 세포. - 제38항에 있어서,
상기 포유동물 세포가 COS 세포, CHO 세포, BHK 세포, MDCK 세포, HEK293 세포, HEK293T 세포, HEK293F 세포, NS0 세포, PER.C6 세포, VERO 세포, CRL7O3O 세포, HsS78Bst 세포, HeLa 세포, NIH 3T3 세포, HepG2 세포, SP210 세포, R1.1 세포, B-W 세포, L-M 세포, BSC1 세포, BSC40 세포, YB/20 세포 및 BMT10 세포로 이루어진 군으로부터 선택되는, 숙주 세포. - 제38항 또는 제39항에 있어서,
상기 포유동물 세포가 HEK293 세포인, 숙주 세포. - rAAV가 생산되는 조건 하에서 포유동물 세포에 제5항 내지 제36항 중 어느 한 항의 패키징 시스템을 도입하는 단계를 포함하는, rAAV의 재조합 제조 방법.
- 제41항에 있어서,
상기 제1 핵산 벡터 대 제2 핵산 벡터의 비율, 또는 제2 핵산 벡터 대 제1 핵산 벡터의 비율이 1:0.2, 1:0.4, 1:0.6, 1:0.8, 1:1, 1:2, 1:3 및 1:4로 이루어진 군으로부터 선택되는, 방법. - 제41항 또는 제42항에 있어서,
상기 제1 핵산 벡터 대 제2 핵산 벡터의 비율, 또는 제2 핵산 벡터 대 제1 핵산 벡터의 비율이 1:2인, 방법. - 제41항 또는 제42항에 있어서,
상기 제1 핵산 벡터 대 제2 핵산 벡터의 비율, 또는 제2 핵산 벡터 대 제1 핵산 벡터의 비율이 1:0.2 내지 1:1인, 방법. - 제44항에 있어서,
상기 제1 핵산 벡터 대 제2 핵산 벡터의 비율, 또는 제2 핵산 벡터 대 제1 핵산 벡터의 비율이 1:0.6인, 방법. - 제44항에 있어서,
상기 제1 핵산 벡터 대 제2 핵산 벡터의 비율, 또는 제2 핵산 벡터 대 제1 핵산 벡터의 비율이 1:0.8인, 방법. - 제44항에 있어서,
상기 제1 핵산 벡터 대 제2 핵산 벡터의 비율, 또는 제2 핵산 벡터 대 제1 핵산 벡터의 비율이 1:1인, 방법. - 제41항 내지 제47항 중 어느 한 항에 있어서,
상기 패키징 시스템의 0.1 내지 4 μg의 DNA/1E6 세포를 도입하는 단계를 포함하는 방법. - 제41항 내지 제48항 중 어느 한 항에 있어서,
상기 패키징 시스템의 0.5 내지 1 μg의 DNA/1E6 세포를 도입하는 단계를 포함하는 방법. - 제41항 내지 제49항 중 어느 한 항에 있어서,
상기 패키징 시스템의 0.6, 0.7, 0.8, 0.9 또는 1 μg의 DNA/1E6 세포를 도입하는 단계를 포함하는 방법. - 제41항 내지 제49항 중 어느 한 항에 있어서,
상기 패키징 시스템의 0.75 μg의 DNA/1E6 세포를 도입하는 단계를 포함하는 방법. - 제41항 내지 제51항 중 어느 한 항에 있어서,
(i) AAV Rep 단백질 및 AAV 캡시드 단백질을 코딩하는 뉴클레오티드 서열을 포함하는 제1 벡터;
(ii) rAAV 게놈을 포함하는 제2 벡터; 및
(iii) 하나 이상의 헬퍼 바이러스 유전자를 포함하는 제3 벡터
를 포함하는 포유동물 세포를 사용하여 rAAV를 생산하는 단계를 포함하는 방법과 비교하여 증가된 rAAV 역가를 초래하는 방법. - 제41항 내지 제51항 중 어느 한 항에 있어서,
(i) AAV Rep 단백질 및 AAV 캡시드 단백질을 코딩하는 뉴클레오티드 서열을 포함하는 제1 벡터;
(ii) rAAV 게놈을 포함하는 제2 벡터; 및
(iii) 하나 이상의 헬퍼 바이러스 유전자를 포함하는 제3 벡터
를 포함하는 포유동물 세포를 사용하여 rAAV를 생산하는 단계를 포함하는 방법과 비교하여 온전한 벡터 게놈의 증가된 백분율을 초래하는 방법. - 제41항 내지 제53항 중 어느 한 항에 있어서,
상기 포유동물 세포가 COS 세포, CHO 세포, BHK 세포, MDCK 세포, HEK293 세포, HEK293T 세포, HEK293F 세포, NS0 세포, PER.C6 세포, VERO 세포, CRL7O3O 세포, HsS78Bst 세포, HeLa 세포, NIH 3T3 세포, HepG2 세포, SP210 세포, R1.1 세포, B-W 세포, L-M 세포, BSC1 세포, BSC40 세포, YB/20 세포 및 BMT10 세포로 이루어진 군으로부터 선택되는, 방법. - 제41항 내지 제54항 중 어느 한 항에 있어서,
상기 포유동물 세포가 HEK293 세포인, 방법. - 제41항 내지 제55항 중 어느 한 항에 있어서,
상기 포유동물 세포가 세포 배양물로 제공되는, 방법. - 제37항 내지 제40항 중 어느 한 항에 있어서,
상기 숙주 세포의 집단이 세포 배양물로 제공되는, 숙주 세포의 집단. - 제56항 또는 제57항에 있어서,
상기 세포 배양물이 2 리터 이상, 50 리터 이상, 또는 2000 리터 이상의 부피를 갖는, 방법 또는 숙주 세포의 집단.
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202163202817P | 2021-06-25 | 2021-06-25 | |
US63/202,817 | 2021-06-25 | ||
US202163262218P | 2021-10-07 | 2021-10-07 | |
US63/262,218 | 2021-10-07 | ||
US202263266646P | 2022-01-11 | 2022-01-11 | |
US63/266,646 | 2022-01-11 | ||
PCT/US2022/073138 WO2022272297A1 (en) | 2021-06-25 | 2022-06-24 | Adeno-associated virus packaging systems |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20240025645A true KR20240025645A (ko) | 2024-02-27 |
Family
ID=83080718
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020247002671A KR20240025645A (ko) | 2021-06-25 | 2022-06-24 | 아데노-연관된 바이러스 패키징 시스템 |
Country Status (7)
Country | Link |
---|---|
US (2) | US20230038295A1 (ko) |
EP (1) | EP4359549A1 (ko) |
KR (1) | KR20240025645A (ko) |
AU (1) | AU2022299552A1 (ko) |
CA (1) | CA3223292A1 (ko) |
IL (1) | IL309532A (ko) |
WO (2) | WO2022272296A2 (ko) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024046403A1 (zh) * | 2022-08-31 | 2024-03-07 | 江苏金斯瑞蓬勃生物科技有限公司 | 能够提高腺相关病毒滴度的腺相关病毒结构质粒 |
Family Cites Families (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6174666B1 (en) | 1992-03-27 | 2001-01-16 | The United States Of America As Represented By The Department Of Health And Human Services | Method of eliminating inhibitory/instability regions from mRNA |
EP1290205B1 (en) | 2000-06-01 | 2006-03-01 | University Of North Carolina At Chapel Hill | Duplexed parvovirus vectors |
PL220644B1 (pl) | 2001-11-13 | 2015-11-30 | Univ Pennsylvania | Wirus stowarzyszony z adenowirusem (AAV), kompozycja, wyizolowane białko kapsydowe, wyizolowane lub syntetyczne cząsteczki kwasu nukleinowego, sposób wytwarzania zrekombinowanego wirusa, komórka gospodarza |
ES2602352T3 (es) * | 2001-12-17 | 2017-02-20 | The Trustees Of The University Of Pennsylvania | Secuencias de serotipo 8 de virus adenoasociado (VAA), vectores que las contienen y usos de las mismas |
EP2559759A1 (en) | 2003-01-28 | 2013-02-20 | Cellectis | Custom-made meganuclease and use thereof |
EP4234687A2 (en) | 2005-04-07 | 2023-08-30 | The Trustees of the University of Pennsylvania | Method of increasing the function of an aav vector |
US9029134B2 (en) | 2006-01-12 | 2015-05-12 | Lucigen Corporation | Linear vectors, host cells and cloning methods |
US9150882B2 (en) | 2006-01-31 | 2015-10-06 | The Board Of Trustees Of The Leland Stanford Junior University | Self-complementary parvoviral vectors, and methods for making and using the same |
CN101484005A (zh) * | 2006-05-04 | 2009-07-15 | 韦恩州立大学 | 通过向体内递送视紫红质核酸恢复视觉响应 |
WO2009025690A2 (en) | 2007-05-23 | 2009-02-26 | Nature Technology Corporation | Improved e. coli plasmid dna production |
EP2152889B1 (en) | 2007-05-29 | 2017-03-15 | Nature Technology Corporation | Vectors and methods for genetic immunization |
GB0901593D0 (en) | 2009-01-30 | 2009-03-11 | Touchlight Genetics Ltd | Production of closed linear DNA |
US9012226B2 (en) | 2009-03-13 | 2015-04-21 | Nature Technology Corporation | Bacterial strains with improved plasmid stability |
US8927514B2 (en) | 2010-04-30 | 2015-01-06 | City Of Hope | Recombinant adeno-associated vectors for targeted treatment |
GB201013153D0 (en) | 2010-08-04 | 2010-09-22 | Touchlight Genetics Ltd | Primer for production of closed linear DNA |
EP3147295B2 (en) | 2011-08-24 | 2023-11-22 | The Board of Trustees of the Leland Stanford Junior University | New avv capsid proteins for nucleic acid transfer |
US20140359799A1 (en) | 2011-12-23 | 2014-12-04 | Case Western Reserve University | Targeted gene modification using hybrid recombinant adeno-associated virus |
WO2014077863A1 (en) | 2012-11-19 | 2014-05-22 | Nature Technology Corporation | Replicative minicircle vectors with improved expression |
DE102013220859B4 (de) | 2013-10-15 | 2016-09-08 | Plasmidfactory Gmbh & Co. Kg | Minicircles mit viralen Expressionskassetten und ihre Verwendung zur Transformation von Zellen zur Erzeugung rekombinanter Viren oder viraler Genvektoren |
KR20230067694A (ko) | 2014-09-24 | 2023-05-16 | 시티 오브 호프 | 고효율 게놈 편집을 위한 아데노-관련 바이러스 벡터 변이체 및 이의 방법 |
JP6754361B2 (ja) | 2014-12-16 | 2020-09-09 | ボード オブ リージェンツ オブ ザ ユニバーシティ オブ ネブラスカ | 若年型バッテン病のための遺伝子療法 |
US10179176B2 (en) | 2016-02-16 | 2019-01-15 | The Board Of Trustees Of The Leland Stanford Junior University | Recombinant adeno-associated virus capsids resistant to pre-existing human neutralizing antibodies |
WO2018033730A1 (en) | 2016-08-16 | 2018-02-22 | Touchlight IP Limited | Closed linear dna production |
GB201706451D0 (en) * | 2017-04-24 | 2017-06-07 | Imp Innovations Ltd | Cancer treatment |
ES2821655T3 (es) | 2017-09-19 | 2021-04-27 | Deutsches Krebsforsch | Vectores de ADN no integrantes para la modificación genética de células |
US10610606B2 (en) * | 2018-02-01 | 2020-04-07 | Homology Medicines, Inc. | Adeno-associated virus compositions for PAH gene transfer and methods of use thereof |
SG11202009009UA (en) | 2018-03-21 | 2020-10-29 | Nature Tech Corporation | Viral and non-viral nanoplasmid vectors with improved production |
BR112021005110A2 (pt) * | 2018-09-21 | 2021-06-15 | Nightstarx Limited | composições e métodos para fabricação de vetores de terapia genética |
EP3966227A1 (en) | 2019-05-07 | 2022-03-16 | Voyager Therapeutics, Inc. | Compositions and methods for the vectored augmentation of protein destruction, expression and/or regulation |
-
2022
- 2022-06-24 AU AU2022299552A patent/AU2022299552A1/en active Pending
- 2022-06-24 IL IL309532A patent/IL309532A/en unknown
- 2022-06-24 CA CA3223292A patent/CA3223292A1/en active Pending
- 2022-06-24 US US17/808,630 patent/US20230038295A1/en active Pending
- 2022-06-24 KR KR1020247002671A patent/KR20240025645A/ko unknown
- 2022-06-24 US US17/808,637 patent/US20230055381A1/en active Pending
- 2022-06-24 WO PCT/US2022/073136 patent/WO2022272296A2/en unknown
- 2022-06-24 EP EP22760849.4A patent/EP4359549A1/en active Pending
- 2022-06-24 WO PCT/US2022/073138 patent/WO2022272297A1/en active Application Filing
Also Published As
Publication number | Publication date |
---|---|
US20230055381A1 (en) | 2023-02-23 |
WO2022272296A2 (en) | 2022-12-29 |
IL309532A (en) | 2024-02-01 |
WO2022272296A9 (en) | 2023-09-28 |
WO2022272296A3 (en) | 2023-03-02 |
AU2022299552A1 (en) | 2024-01-04 |
WO2022272297A1 (en) | 2022-12-29 |
US20230038295A1 (en) | 2023-02-09 |
EP4359549A1 (en) | 2024-05-01 |
CA3223292A1 (en) | 2022-12-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2022200502B2 (en) | Adeno-associated virus vector variants for high efficiency genome editing and methods thereof | |
KR100403708B1 (ko) | 재조합아데노-수반바이러스(aav)제조방법및이의용도 | |
EP1064393B1 (en) | Compositions and methods for helper-free production of recombinant adeno-associated viruses | |
US6953690B1 (en) | Compositions and methods for helper-free production of recombinant adeno-associated viruses | |
US5756283A (en) | Method for improved production of recombinant adeno-associated viruses for gene therapy | |
KR100510822B1 (ko) | 재조합 아데노바이러스 제조용 세포 | |
JP3755827B2 (ja) | 組み込み可能な組み換えアデノウィルス、それらの製造及びそれらの治療的利用 | |
US7115391B1 (en) | Production of recombinant AAV using adenovirus comprising AAV rep/cap genes | |
CN113302201A (zh) | 重组病毒载体和用于产生所述重组病毒载体的核酸 | |
KR20210132684A (ko) | 비에띠 결정 이상증을 치료하기 위한 조성물 및 방법 | |
CA2945965C (en) | Codon optimized nucleic acid encoding a retinitis pigmentosa gtpase regulator (rpgr) | |
JP2024059727A (ja) | Cns変性のための遺伝子治療法 | |
US6383794B1 (en) | Methods of producing high titer recombinant adeno-associated virus | |
CA2206244A1 (en) | Adeno-associated derived vector systems for gene delivery and integration into target cells | |
JP2001506132A (ja) | Aavベクターの産生における使用のためのリコンビナーゼ活性化可能aavパッケージングカセット | |
KR20230043869A (ko) | Aav 벡터를 사용한 플라코필린-2(pkp2) 유전자 요법 | |
WO2008095027A2 (en) | Adenoviral vector comprising herpes simplex virus type 1 thymidine kinase and a transgene for increasing the expression of the transgene | |
CN115298316A (zh) | 用于制备腺相关病毒载体的方法 | |
KR20240025645A (ko) | 아데노-연관된 바이러스 패키징 시스템 | |
CN117545842A (zh) | SMN1和miR-23a在治疗脊髓性肌萎缩中的协同效应 | |
KR20230019162A (ko) | Smn1 단백질을 코딩하는 코돈-최적화된 핵산 | |
JP2003511037A (ja) | AAVrep/cap遺伝子を含むアデノウイルスを使用する組換えAAVの産生 | |
CN117716042A (zh) | 腺相关病毒包装系统 | |
TW202229558A (zh) | 用於同時基因活化的核酸構建體 | |
EP4112731A1 (en) | System for high-level raav production |