KR20210086645A - Aav 삼중-플라스미드 시스템 - Google Patents
Aav 삼중-플라스미드 시스템 Download PDFInfo
- Publication number
- KR20210086645A KR20210086645A KR1020217014276A KR20217014276A KR20210086645A KR 20210086645 A KR20210086645 A KR 20210086645A KR 1020217014276 A KR1020217014276 A KR 1020217014276A KR 20217014276 A KR20217014276 A KR 20217014276A KR 20210086645 A KR20210086645 A KR 20210086645A
- Authority
- KR
- South Korea
- Prior art keywords
- plasmid
- sequence
- nucleic acid
- seq
- itr
- Prior art date
Links
- 239000013612 plasmid Substances 0.000 title claims abstract description 350
- 150000007523 nucleic acids Chemical group 0.000 claims abstract description 148
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 138
- 108700019146 Transgenes Proteins 0.000 claims abstract description 90
- 108091028043 Nucleic acid sequence Proteins 0.000 claims abstract description 84
- 210000000234 capsid Anatomy 0.000 claims abstract description 27
- 230000010076 replication Effects 0.000 claims abstract description 17
- 241000701161 unidentified adenovirus Species 0.000 claims abstract description 16
- 108020004414 DNA Proteins 0.000 claims description 186
- 125000003729 nucleotide group Chemical group 0.000 claims description 72
- 239000002773 nucleotide Substances 0.000 claims description 71
- 210000004027 cell Anatomy 0.000 claims description 65
- 230000014509 gene expression Effects 0.000 claims description 60
- 102000039446 nucleic acids Human genes 0.000 claims description 58
- 108020004707 nucleic acids Proteins 0.000 claims description 58
- 238000000034 method Methods 0.000 claims description 53
- 102000004169 proteins and genes Human genes 0.000 claims description 50
- 238000011144 upstream manufacturing Methods 0.000 claims description 49
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 48
- 239000012634 fragment Substances 0.000 claims description 39
- 238000004519 manufacturing process Methods 0.000 claims description 34
- 239000013598 vector Substances 0.000 claims description 27
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 26
- 229920001184 polypeptide Polymers 0.000 claims description 17
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 15
- 101150066583 rep gene Proteins 0.000 claims description 14
- -1 antibody Proteins 0.000 claims description 13
- 101150044789 Cap gene Proteins 0.000 claims description 12
- 230000000692 anti-sense effect Effects 0.000 claims description 12
- 201000010099 disease Diseases 0.000 claims description 12
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 11
- 241000282414 Homo sapiens Species 0.000 claims description 11
- 239000003623 enhancer Substances 0.000 claims description 9
- 238000004448 titration Methods 0.000 claims description 9
- 239000013603 viral vector Substances 0.000 claims description 8
- 108091023037 Aptamer Proteins 0.000 claims description 7
- 239000003814 drug Substances 0.000 claims description 6
- 239000000203 mixture Substances 0.000 claims description 6
- 108091027963 non-coding RNA Proteins 0.000 claims description 6
- 102000042567 non-coding RNA Human genes 0.000 claims description 6
- 239000013607 AAV vector Substances 0.000 claims description 5
- 108090000994 Catalytic RNA Proteins 0.000 claims description 5
- 102000053642 Catalytic RNA Human genes 0.000 claims description 5
- 108091027967 Small hairpin RNA Proteins 0.000 claims description 5
- 108091034131 VA RNA Proteins 0.000 claims description 5
- 230000027455 binding Effects 0.000 claims description 5
- 108091070501 miRNA Proteins 0.000 claims description 5
- 239000002679 microRNA Substances 0.000 claims description 5
- 108091092562 ribozyme Proteins 0.000 claims description 5
- 239000004055 small Interfering RNA Substances 0.000 claims description 5
- 102000004190 Enzymes Human genes 0.000 claims description 4
- 108090000790 Enzymes Proteins 0.000 claims description 4
- 102100031181 Glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 claims description 4
- 108020005004 Guide RNA Proteins 0.000 claims description 4
- 108020004459 Small interfering RNA Proteins 0.000 claims description 4
- 108091027544 Subgenomic mRNA Proteins 0.000 claims description 4
- 238000010362 genome editing Methods 0.000 claims description 4
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 claims description 4
- 239000008194 pharmaceutical composition Substances 0.000 claims description 4
- 239000002924 silencing RNA Substances 0.000 claims description 4
- 230000002463 transducing effect Effects 0.000 claims description 4
- 108091008875 B cell receptors Proteins 0.000 claims description 3
- 108091008874 T cell receptors Proteins 0.000 claims description 3
- 102000016266 T-Cell Antigen Receptors Human genes 0.000 claims description 3
- 208000035475 disorder Diseases 0.000 claims description 3
- 239000003446 ligand Substances 0.000 claims description 3
- 108020003175 receptors Proteins 0.000 claims description 3
- 102000005962 receptors Human genes 0.000 claims description 3
- 230000008685 targeting Effects 0.000 claims description 3
- 229940124597 therapeutic agent Drugs 0.000 claims description 3
- 102100021244 Integral membrane protein GPR180 Human genes 0.000 claims 19
- 241000702421 Dependoparvovirus Species 0.000 abstract description 10
- 102000040430 polynucleotide Human genes 0.000 description 67
- 108091033319 polynucleotide Proteins 0.000 description 67
- 239000002157 polynucleotide Substances 0.000 description 67
- 238000011282 treatment Methods 0.000 description 40
- 150000001413 amino acids Chemical class 0.000 description 30
- 241000700605 Viruses Species 0.000 description 26
- 230000006870 function Effects 0.000 description 24
- 238000011529 RT qPCR Methods 0.000 description 19
- 230000003612 virological effect Effects 0.000 description 19
- 238000001415 gene therapy Methods 0.000 description 18
- 241000702423 Adeno-associated virus - 2 Species 0.000 description 16
- 108091026890 Coding region Proteins 0.000 description 14
- 239000013642 negative control Substances 0.000 description 14
- 238000004806 packaging method and process Methods 0.000 description 14
- 239000013641 positive control Substances 0.000 description 14
- 108700026244 Open Reading Frames Proteins 0.000 description 12
- 241001164825 Adeno-associated virus - 8 Species 0.000 description 10
- 238000003556 assay Methods 0.000 description 10
- 230000001105 regulatory effect Effects 0.000 description 10
- 230000001225 therapeutic effect Effects 0.000 description 10
- 241001634120 Adeno-associated virus - 5 Species 0.000 description 9
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 description 9
- 230000003115 biocidal effect Effects 0.000 description 9
- 108010048367 enhanced green fluorescent protein Proteins 0.000 description 9
- 238000012360 testing method Methods 0.000 description 9
- 210000002845 virion Anatomy 0.000 description 9
- 108700008625 Reporter Genes Proteins 0.000 description 8
- 239000013592 cell lysate Substances 0.000 description 8
- 150000001875 compounds Chemical class 0.000 description 8
- 230000004048 modification Effects 0.000 description 8
- 238000012986 modification Methods 0.000 description 8
- 208000005340 mucopolysaccharidosis III Diseases 0.000 description 8
- 239000002245 particle Substances 0.000 description 8
- 101710084218 Master replication protein Proteins 0.000 description 7
- 101710112078 Para-Rep C2 Proteins 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 7
- 238000003776 cleavage reaction Methods 0.000 description 7
- 230000001939 inductive effect Effects 0.000 description 7
- 230000007017 scission Effects 0.000 description 7
- 108090000565 Capsid Proteins Proteins 0.000 description 6
- 102100023321 Ceruloplasmin Human genes 0.000 description 6
- CEAZRRDELHUEMR-URQXQFDESA-N Gentamicin Chemical class O1[C@H](C(C)NC)CC[C@@H](N)[C@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](NC)[C@@](C)(O)CO2)O)[C@H](N)C[C@@H]1N CEAZRRDELHUEMR-URQXQFDESA-N 0.000 description 6
- 238000012217 deletion Methods 0.000 description 6
- 230000037430 deletion Effects 0.000 description 6
- 230000002068 genetic effect Effects 0.000 description 6
- 238000000338 in vitro Methods 0.000 description 6
- 208000015181 infectious disease Diseases 0.000 description 6
- 238000006467 substitution reaction Methods 0.000 description 6
- 210000001519 tissue Anatomy 0.000 description 6
- 230000010415 tropism Effects 0.000 description 6
- 238000001262 western blot Methods 0.000 description 6
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 5
- 241001655883 Adeno-associated virus - 1 Species 0.000 description 5
- 241000202702 Adeno-associated virus - 3 Species 0.000 description 5
- 241000580270 Adeno-associated virus - 4 Species 0.000 description 5
- 241000972680 Adeno-associated virus - 6 Species 0.000 description 5
- 241001164823 Adeno-associated virus - 7 Species 0.000 description 5
- 241000649045 Adeno-associated virus 10 Species 0.000 description 5
- 241000649046 Adeno-associated virus 11 Species 0.000 description 5
- 108060003951 Immunoglobulin Proteins 0.000 description 5
- 241001465754 Metazoa Species 0.000 description 5
- 102100038313 Transcription factor E2-alpha Human genes 0.000 description 5
- 239000003242 anti bacterial agent Substances 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 239000005090 green fluorescent protein Substances 0.000 description 5
- 230000028993 immune response Effects 0.000 description 5
- 102000018358 immunoglobulin Human genes 0.000 description 5
- 238000001890 transfection Methods 0.000 description 5
- 238000013519 translation Methods 0.000 description 5
- 102100022641 Coagulation factor IX Human genes 0.000 description 4
- 241000701022 Cytomegalovirus Species 0.000 description 4
- 230000004543 DNA replication Effects 0.000 description 4
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 4
- 208000009292 Hemophilia A Diseases 0.000 description 4
- 206010028095 Mucopolysaccharidosis IV Diseases 0.000 description 4
- 229960000723 ampicillin Drugs 0.000 description 4
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 210000004556 brain Anatomy 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 229940072221 immunoglobulins Drugs 0.000 description 4
- 239000006166 lysate Substances 0.000 description 4
- 108020004999 messenger RNA Proteins 0.000 description 4
- 208000011045 mucopolysaccharidosis type 3 Diseases 0.000 description 4
- 208000010978 mucopolysaccharidosis type 4 Diseases 0.000 description 4
- 230000035772 mutation Effects 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 238000010361 transduction Methods 0.000 description 4
- 230000026683 transduction Effects 0.000 description 4
- 101150014715 CAP2 gene Proteins 0.000 description 3
- 108020004705 Codon Proteins 0.000 description 3
- 108010076282 Factor IX Proteins 0.000 description 3
- 108010054218 Factor VIII Proteins 0.000 description 3
- 102000001690 Factor VIII Human genes 0.000 description 3
- 229930182566 Gentamicin Natural products 0.000 description 3
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 3
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 3
- 208000031220 Hemophilia Diseases 0.000 description 3
- 241000282412 Homo Species 0.000 description 3
- 206010056893 Mucopolysaccharidosis VII Diseases 0.000 description 3
- 101100260872 Mus musculus Tmprss4 gene Proteins 0.000 description 3
- 102100031688 N-acetylgalactosamine-6-sulfatase Human genes 0.000 description 3
- 102100027661 N-sulphoglucosamine sulphohydrolase Human genes 0.000 description 3
- 101710163270 Nuclease Proteins 0.000 description 3
- 241000125945 Protoparvovirus Species 0.000 description 3
- 108700005077 Viral Genes Proteins 0.000 description 3
- 238000007792 addition Methods 0.000 description 3
- 229940088710 antibiotic agent Drugs 0.000 description 3
- 230000033228 biological regulation Effects 0.000 description 3
- 108091005948 blue fluorescent proteins Proteins 0.000 description 3
- 210000003169 central nervous system Anatomy 0.000 description 3
- 238000010367 cloning Methods 0.000 description 3
- 229940079593 drug Drugs 0.000 description 3
- 229940088598 enzyme Drugs 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 229960004222 factor ix Drugs 0.000 description 3
- 229960000301 factor viii Drugs 0.000 description 3
- 108020001507 fusion proteins Proteins 0.000 description 3
- 102000037865 fusion proteins Human genes 0.000 description 3
- 229960002518 gentamicin Drugs 0.000 description 3
- 210000000987 immune system Anatomy 0.000 description 3
- 238000002347 injection Methods 0.000 description 3
- 239000007924 injection Substances 0.000 description 3
- 229930027917 kanamycin Natural products 0.000 description 3
- 229960000318 kanamycin Drugs 0.000 description 3
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 3
- 229930182823 kanamycin A Natural products 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 208000025919 mucopolysaccharidosis type 7 Diseases 0.000 description 3
- 230000008488 polyadenylation Effects 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 238000013518 transcription Methods 0.000 description 3
- 230000035897 transcription Effects 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 108091005957 yellow fluorescent proteins Proteins 0.000 description 3
- DIGQNXIGRZPYDK-WKSCXVIASA-N (2R)-6-amino-2-[[2-[[(2S)-2-[[2-[[(2R)-2-[[(2S)-2-[[(2R,3S)-2-[[2-[[(2S)-2-[[2-[[(2S)-2-[[(2S)-2-[[(2R)-2-[[(2S,3S)-2-[[(2R)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[2-[[(2S)-2-[[(2R)-2-[[2-[[2-[[2-[(2-amino-1-hydroxyethylidene)amino]-3-carboxy-1-hydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1,5-dihydroxy-5-iminopentylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]hexanoic acid Chemical compound C[C@@H]([C@@H](C(=N[C@@H](CS)C(=N[C@@H](C)C(=N[C@@H](CO)C(=NCC(=N[C@@H](CCC(=N)O)C(=NC(CS)C(=N[C@H]([C@H](C)O)C(=N[C@H](CS)C(=N[C@H](CO)C(=NCC(=N[C@H](CS)C(=NCC(=N[C@H](CCCCN)C(=O)O)O)O)O)O)O)O)O)O)O)O)O)O)O)N=C([C@H](CS)N=C([C@H](CO)N=C([C@H](CO)N=C([C@H](C)N=C(CN=C([C@H](CO)N=C([C@H](CS)N=C(CN=C(C(CS)N=C(C(CC(=O)O)N=C(CN)O)O)O)O)O)O)O)O)O)O)O)O DIGQNXIGRZPYDK-WKSCXVIASA-N 0.000 description 2
- BRPMXFSTKXXNHF-IUCAKERBSA-N (2s)-1-[2-[[(2s)-pyrrolidine-2-carbonyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound OC(=O)[C@@H]1CCCN1C(=O)CNC(=O)[C@H]1NCCC1 BRPMXFSTKXXNHF-IUCAKERBSA-N 0.000 description 2
- 108010085238 Actins Proteins 0.000 description 2
- 101100524317 Adeno-associated virus 2 (isolate Srivastava/1982) Rep40 gene Proteins 0.000 description 2
- 101100524319 Adeno-associated virus 2 (isolate Srivastava/1982) Rep52 gene Proteins 0.000 description 2
- 101100524321 Adeno-associated virus 2 (isolate Srivastava/1982) Rep68 gene Proteins 0.000 description 2
- 101100524324 Adeno-associated virus 2 (isolate Srivastava/1982) Rep78 gene Proteins 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- 102100026189 Beta-galactosidase Human genes 0.000 description 2
- 241000283690 Bos taurus Species 0.000 description 2
- 241000282472 Canis lupus familiaris Species 0.000 description 2
- 108010035563 Chloramphenicol O-acetyltransferase Proteins 0.000 description 2
- 102000053602 DNA Human genes 0.000 description 2
- 241000006867 Discosoma Species 0.000 description 2
- UPEZCKBFRMILAV-JNEQICEOSA-N Ecdysone Natural products O=C1[C@H]2[C@@](C)([C@@H]3C([C@@]4(O)[C@@](C)([C@H]([C@H]([C@@H](O)CCC(O)(C)C)C)CC4)CC3)=C1)C[C@H](O)[C@H](O)C2 UPEZCKBFRMILAV-JNEQICEOSA-N 0.000 description 2
- 241000282326 Felis catus Species 0.000 description 2
- 102000053187 Glucuronidase Human genes 0.000 description 2
- 108010060309 Glucuronidase Proteins 0.000 description 2
- TZOVVRJYUDETQG-RCOVLWMOSA-N Gly-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN TZOVVRJYUDETQG-RCOVLWMOSA-N 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- 206010019860 Hereditary angioedema Diseases 0.000 description 2
- 101001066129 Homo sapiens Glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 2
- 108700037017 Hyaluronidase Deficiency Proteins 0.000 description 2
- 208000005503 Hyaluronidase deficiency Diseases 0.000 description 2
- 208000026350 Inborn Genetic disease Diseases 0.000 description 2
- 108091092195 Intron Proteins 0.000 description 2
- LRQKBLKVPFOOQJ-YFKPBYRVSA-N L-norleucine Chemical compound CCCC[C@H]([NH3+])C([O-])=O LRQKBLKVPFOOQJ-YFKPBYRVSA-N 0.000 description 2
- 239000012480 LAL reagent Substances 0.000 description 2
- 101710173438 Late L2 mu core protein Proteins 0.000 description 2
- 102100024640 Low-density lipoprotein receptor Human genes 0.000 description 2
- 102100033448 Lysosomal alpha-glucosidase Human genes 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- 102000003792 Metallothionein Human genes 0.000 description 2
- 108090000157 Metallothionein Proteins 0.000 description 2
- 108010072388 Methyl-CpG-Binding Protein 2 Proteins 0.000 description 2
- 102100039124 Methyl-CpG-binding protein 2 Human genes 0.000 description 2
- 208000025797 Mucopolysaccharidosis type 4A Diseases 0.000 description 2
- 208000025923 Mucopolysaccharidosis type 4B Diseases 0.000 description 2
- 208000025915 Mucopolysaccharidosis type 6 Diseases 0.000 description 2
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 2
- 206010028980 Neoplasm Diseases 0.000 description 2
- 108091034117 Oligonucleotide Proteins 0.000 description 2
- 102100028200 Ornithine transcarbamylase, mitochondrial Human genes 0.000 description 2
- 108091093037 Peptide nucleic acid Proteins 0.000 description 2
- 108010069013 Phenylalanine Hydroxylase Proteins 0.000 description 2
- 102100038223 Phenylalanine-4-hydroxylase Human genes 0.000 description 2
- 201000011252 Phenylketonuria Diseases 0.000 description 2
- 101710188315 Protein X Proteins 0.000 description 2
- 108091028664 Ribonucleotide Proteins 0.000 description 2
- 208000025816 Sanfilippo syndrome type A Diseases 0.000 description 2
- 208000025820 Sanfilippo syndrome type B Diseases 0.000 description 2
- 208000025802 Sanfilippo syndrome type C Diseases 0.000 description 2
- 208000025804 Sanfilippo syndrome type D Diseases 0.000 description 2
- 108010034546 Serratia marcescens nuclease Proteins 0.000 description 2
- 108091081024 Start codon Proteins 0.000 description 2
- 108091000117 Tyrosine 3-Monooxygenase Proteins 0.000 description 2
- 102000048218 Tyrosine 3-monooxygenases Human genes 0.000 description 2
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 2
- ZSLZBFCDCINBPY-ZSJPKINUSA-N acetyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 ZSLZBFCDCINBPY-ZSJPKINUSA-N 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- 208000037919 acquired disease Diseases 0.000 description 2
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 2
- UPEZCKBFRMILAV-UHFFFAOYSA-N alpha-Ecdysone Natural products C1C(O)C(O)CC2(C)C(CCC3(C(C(C(O)CCC(C)(C)O)C)CCC33O)C)C3=CC(=O)C21 UPEZCKBFRMILAV-UHFFFAOYSA-N 0.000 description 2
- 238000010171 animal model Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 108010077245 asparaginyl-proline Proteins 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- 108010005774 beta-Galactosidase Proteins 0.000 description 2
- 230000004071 biological effect Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 2
- 238000007385 chemical modification Methods 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 108010082025 cyan fluorescent protein Proteins 0.000 description 2
- 230000009089 cytolysis Effects 0.000 description 2
- 230000007812 deficiency Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- UPEZCKBFRMILAV-JMZLNJERSA-N ecdysone Chemical compound C1[C@@H](O)[C@@H](O)C[C@]2(C)[C@@H](CC[C@@]3([C@@H]([C@@H]([C@H](O)CCC(C)(C)O)C)CC[C@]33O)C)C3=CC(=O)[C@@H]21 UPEZCKBFRMILAV-JMZLNJERSA-N 0.000 description 2
- 201000007219 factor XI deficiency Diseases 0.000 description 2
- 208000016361 genetic disease Diseases 0.000 description 2
- 108010077515 glycylproline Proteins 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 102000047486 human GAPDH Human genes 0.000 description 2
- 230000005847 immunogenicity Effects 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- 238000010348 incorporation Methods 0.000 description 2
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 2
- 238000007917 intracranial administration Methods 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 229930182817 methionine Natural products 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 238000009126 molecular therapy Methods 0.000 description 2
- 201000002273 mucopolysaccharidosis II Diseases 0.000 description 2
- 208000000690 mucopolysaccharidosis VI Diseases 0.000 description 2
- 208000022018 mucopolysaccharidosis type 2 Diseases 0.000 description 2
- 208000036707 mucopolysaccharidosis type 3C Diseases 0.000 description 2
- 208000036725 mucopolysaccharidosis type 3D Diseases 0.000 description 2
- 208000020004 mucopolysaccharidosis type 9 Diseases 0.000 description 2
- 208000012226 mucopolysaccharidosis type IIIA Diseases 0.000 description 2
- 208000012227 mucopolysaccharidosis type IIIB Diseases 0.000 description 2
- 208000012224 mucopolysaccharidosis type IIIC Diseases 0.000 description 2
- 208000027333 mucopolysaccharidosis type IIID Diseases 0.000 description 2
- 208000012091 mucopolysaccharidosis type IVB Diseases 0.000 description 2
- 210000003205 muscle Anatomy 0.000 description 2
- 210000001577 neostriatum Anatomy 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 210000004940 nucleus Anatomy 0.000 description 2
- RXWNCPJZOCPEPQ-NVWDDTSBSA-N puromycin Chemical compound C1=CC(OC)=CC=C1C[C@H](N)C(=O)N[C@H]1[C@@H](O)[C@H](N2C3=NC=NC(=C3N=C2)N(C)C)O[C@@H]1CO RXWNCPJZOCPEPQ-NVWDDTSBSA-N 0.000 description 2
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 239000002336 ribonucleotide Substances 0.000 description 2
- 210000000278 spinal cord Anatomy 0.000 description 2
- 238000010561 standard procedure Methods 0.000 description 2
- 208000024891 symptom Diseases 0.000 description 2
- 230000002103 transcriptional effect Effects 0.000 description 2
- 238000003146 transient transfection Methods 0.000 description 2
- CXNPLSGKWMLZPZ-GIFSMMMISA-N (2r,3r,6s)-3-[[(3s)-3-amino-5-[carbamimidoyl(methyl)amino]pentanoyl]amino]-6-(4-amino-2-oxopyrimidin-1-yl)-3,6-dihydro-2h-pyran-2-carboxylic acid Chemical compound O1[C@@H](C(O)=O)[C@H](NC(=O)C[C@@H](N)CCN(C)C(N)=N)C=C[C@H]1N1C(=O)N=C(N)C=C1 CXNPLSGKWMLZPZ-GIFSMMMISA-N 0.000 description 1
- COAABSMONFNYQH-TTWCUHKNSA-N (2r,3s,4s,5r,6s)-2-(hydroxymethyl)-6-(oxiran-2-ylmethylsulfanyl)oxane-3,4,5-triol Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1SCC1OC1 COAABSMONFNYQH-TTWCUHKNSA-N 0.000 description 1
- UKAUYVFTDYCKQA-UHFFFAOYSA-N -2-Amino-4-hydroxybutanoic acid Natural products OC(=O)C(N)CCO UKAUYVFTDYCKQA-UHFFFAOYSA-N 0.000 description 1
- IPVFGAYTKQKGBM-BYPJNBLXSA-N 1-[(2r,3s,4r,5r)-3-fluoro-4-hydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-iodopyrimidine-2,4-dione Chemical compound F[C@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(I)=C1 IPVFGAYTKQKGBM-BYPJNBLXSA-N 0.000 description 1
- 108010046716 3-Methyl-2-Oxobutanoate Dehydrogenase (Lipoamide) Proteins 0.000 description 1
- 101710169336 5'-deoxyadenosine deaminase Proteins 0.000 description 1
- 102100020973 ATP-binding cassette sub-family D member 3 Human genes 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 208000005452 Acute intermittent porphyria Diseases 0.000 description 1
- 102000002735 Acyl-CoA Dehydrogenase Human genes 0.000 description 1
- 108010001058 Acyl-CoA Dehydrogenase Proteins 0.000 description 1
- 102100036664 Adenosine deaminase Human genes 0.000 description 1
- 108010024878 Adenovirus E1A Proteins Proteins 0.000 description 1
- 108010087905 Adenovirus E1B Proteins Proteins 0.000 description 1
- 108010057856 Adenovirus E2 Proteins Proteins 0.000 description 1
- XQNRANMFRPCFFW-GCJQMDKQSA-N Ala-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C)N)O XQNRANMFRPCFFW-GCJQMDKQSA-N 0.000 description 1
- 108700028369 Alleles Proteins 0.000 description 1
- 102100022712 Alpha-1-antitrypsin Human genes 0.000 description 1
- 102100026277 Alpha-galactosidase A Human genes 0.000 description 1
- 101100165660 Alternaria brassicicola bsc6 gene Proteins 0.000 description 1
- 102000009088 Angiopoietin-1 Human genes 0.000 description 1
- 108010048154 Angiopoietin-1 Proteins 0.000 description 1
- 108020005544 Antisense RNA Proteins 0.000 description 1
- 102000053640 Argininosuccinate synthases Human genes 0.000 description 1
- 108700024106 Argininosuccinate synthases Proteins 0.000 description 1
- 206010058298 Argininosuccinate synthetase deficiency Diseases 0.000 description 1
- 208000002109 Argyria Diseases 0.000 description 1
- 102000003823 Aromatic-L-amino-acid decarboxylases Human genes 0.000 description 1
- 108090000121 Aromatic-L-amino-acid decarboxylases Proteins 0.000 description 1
- 102100031491 Arylsulfatase B Human genes 0.000 description 1
- GKKUBLFXKRDMFC-BQBZGAKWSA-N Asn-Pro-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O GKKUBLFXKRDMFC-BQBZGAKWSA-N 0.000 description 1
- JPPLRQVZMZFOSX-UWJYBYFXSA-N Asn-Tyr-Ala Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=C(O)C=C1 JPPLRQVZMZFOSX-UWJYBYFXSA-N 0.000 description 1
- 201000001320 Atherosclerosis Diseases 0.000 description 1
- 101000588395 Bacillus subtilis (strain 168) Beta-hexosaminidase Proteins 0.000 description 1
- 101100499295 Bacillus subtilis (strain 168) disA gene Proteins 0.000 description 1
- 102100021277 Beta-secretase 2 Human genes 0.000 description 1
- 101710150190 Beta-secretase 2 Proteins 0.000 description 1
- 108010039206 Biotinidase Proteins 0.000 description 1
- 102100026044 Biotinidase Human genes 0.000 description 1
- 108010039209 Blood Coagulation Factors Proteins 0.000 description 1
- 102000015081 Blood Coagulation Factors Human genes 0.000 description 1
- 208000019838 Blood disease Diseases 0.000 description 1
- 241000701822 Bovine papillomavirus Species 0.000 description 1
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 1
- QCMYYKRYFNMIEC-UHFFFAOYSA-N COP(O)=O Chemical class COP(O)=O QCMYYKRYFNMIEC-UHFFFAOYSA-N 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical group [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 206010007559 Cardiac failure congestive Diseases 0.000 description 1
- 102100025064 Cellular tumor antigen p53 Human genes 0.000 description 1
- 108020004638 Circular DNA Proteins 0.000 description 1
- 201000011297 Citrullinemia Diseases 0.000 description 1
- 102100023804 Coagulation factor VII Human genes 0.000 description 1
- 102100026735 Coagulation factor VIII Human genes 0.000 description 1
- 206010010099 Combined immunodeficiency Diseases 0.000 description 1
- 108010028774 Complement C1 Proteins 0.000 description 1
- 102100025406 Complement C1s subcomponent Human genes 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- 102100027591 Copper-transporting ATPase 2 Human genes 0.000 description 1
- 102000004420 Creatine Kinase Human genes 0.000 description 1
- 108010042126 Creatine kinase Proteins 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- 102000003844 DNA helicases Human genes 0.000 description 1
- 108090000133 DNA helicases Proteins 0.000 description 1
- 101710177611 DNA polymerase II large subunit Proteins 0.000 description 1
- 101710184669 DNA polymerase II small subunit Proteins 0.000 description 1
- 230000004568 DNA-binding Effects 0.000 description 1
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 1
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 1
- 206010059866 Drug resistance Diseases 0.000 description 1
- 102000001039 Dystrophin Human genes 0.000 description 1
- 108010069091 Dystrophin Proteins 0.000 description 1
- 238000002965 ELISA Methods 0.000 description 1
- 208000005189 Embolism Diseases 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 206010014561 Emphysema Diseases 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- 102000004533 Endonucleases Human genes 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 102000003951 Erythropoietin Human genes 0.000 description 1
- 108090000394 Erythropoietin Proteins 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 208000024720 Fabry Disease Diseases 0.000 description 1
- 108010023321 Factor VII Proteins 0.000 description 1
- 201000003542 Factor VIII deficiency Diseases 0.000 description 1
- 108010014173 Factor X Proteins 0.000 description 1
- 108010074864 Factor XI Proteins 0.000 description 1
- 108010071289 Factor XIII Proteins 0.000 description 1
- 201000007371 Factor XIII Deficiency Diseases 0.000 description 1
- 102000018233 Fibroblast Growth Factor Human genes 0.000 description 1
- 108050007372 Fibroblast Growth Factor Proteins 0.000 description 1
- 108090000331 Firefly luciferases Proteins 0.000 description 1
- 102100029115 Fumarylacetoacetase Human genes 0.000 description 1
- 208000027472 Galactosemias Diseases 0.000 description 1
- 208000015872 Gaucher disease Diseases 0.000 description 1
- 241000963438 Gaussia <copepod> Species 0.000 description 1
- COYGBRTZEVWZBW-XKBZYTNZSA-N Gln-Cys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CCC(N)=O COYGBRTZEVWZBW-XKBZYTNZSA-N 0.000 description 1
- LXAUHIRMWXQRKI-XHNCKOQMSA-N Glu-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O LXAUHIRMWXQRKI-XHNCKOQMSA-N 0.000 description 1
- QQLBPVKLJBAXBS-FXQIFTODSA-N Glu-Glu-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QQLBPVKLJBAXBS-FXQIFTODSA-N 0.000 description 1
- PXXGVUVQWQGGIG-YUMQZZPRSA-N Glu-Gly-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N PXXGVUVQWQGGIG-YUMQZZPRSA-N 0.000 description 1
- ALMBZBOCGSVSAI-ACZMJKKPSA-N Glu-Ser-Asn Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ALMBZBOCGSVSAI-ACZMJKKPSA-N 0.000 description 1
- 102000003638 Glucose-6-Phosphatase Human genes 0.000 description 1
- 108010086800 Glucose-6-Phosphatase Proteins 0.000 description 1
- 102000004547 Glucosylceramidase Human genes 0.000 description 1
- 108010017544 Glucosylceramidase Proteins 0.000 description 1
- 102000016354 Glucuronosyltransferase Human genes 0.000 description 1
- 108010092364 Glucuronosyltransferase Proteins 0.000 description 1
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 229920002527 Glycogen Polymers 0.000 description 1
- 208000032007 Glycogen storage disease due to acid maltase deficiency Diseases 0.000 description 1
- 206010053185 Glycogen storage disease type II Diseases 0.000 description 1
- 229920002683 Glycosaminoglycan Polymers 0.000 description 1
- 201000005569 Gout Diseases 0.000 description 1
- 206010019280 Heart failures Diseases 0.000 description 1
- 229920002971 Heparan sulfate Polymers 0.000 description 1
- 102100039991 Heparan-alpha-glucosaminide N-acetyltransferase Human genes 0.000 description 1
- 108030000639 Heparan-alpha-glucosaminide N-acetyltransferases Proteins 0.000 description 1
- 208000002972 Hepatolenticular Degeneration Diseases 0.000 description 1
- 101000783770 Homo sapiens ATP-binding cassette sub-family D member 3 Proteins 0.000 description 1
- 101000911390 Homo sapiens Coagulation factor VIII Proteins 0.000 description 1
- 101000936280 Homo sapiens Copper-transporting ATPase 2 Proteins 0.000 description 1
- 101000986595 Homo sapiens Ornithine transcarbamylase, mitochondrial Proteins 0.000 description 1
- 101000801643 Homo sapiens Retinal-specific phospholipid-transporting ATPase ABCA4 Proteins 0.000 description 1
- 241000701024 Human betaherpesvirus 5 Species 0.000 description 1
- 108010003272 Hyaluronate lyase Proteins 0.000 description 1
- 102000001974 Hyaluronidases Human genes 0.000 description 1
- 108010056651 Hydroxymethylbilane synthase Proteins 0.000 description 1
- PMMYEEVYMWASQN-DMTCNVIQSA-N Hydroxyproline Chemical compound O[C@H]1CN[C@H](C(O)=O)C1 PMMYEEVYMWASQN-DMTCNVIQSA-N 0.000 description 1
- GRRNUXAQVGOGFE-UHFFFAOYSA-N Hygromycin-B Natural products OC1C(NC)CC(N)C(O)C1OC1C2OC3(C(C(O)C(O)C(C(N)CO)O3)O)OC2C(O)C(CO)O1 GRRNUXAQVGOGFE-UHFFFAOYSA-N 0.000 description 1
- 208000000563 Hyperlipoproteinemia Type II Diseases 0.000 description 1
- 206010020751 Hypersensitivity Diseases 0.000 description 1
- 108010091358 Hypoxanthine Phosphoribosyltransferase Proteins 0.000 description 1
- 102100029098 Hypoxanthine-guanine phosphoribosyltransferase Human genes 0.000 description 1
- 108010053927 Iduronate Sulfatase Proteins 0.000 description 1
- 102000004627 Iduronidase Human genes 0.000 description 1
- 108010003381 Iduronidase Proteins 0.000 description 1
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 1
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 1
- 102100023915 Insulin Human genes 0.000 description 1
- 108090001061 Insulin Proteins 0.000 description 1
- 102000015696 Interleukins Human genes 0.000 description 1
- 108010063738 Interleukins Proteins 0.000 description 1
- 150000008575 L-amino acids Chemical class 0.000 description 1
- UKAUYVFTDYCKQA-VKHMYHEASA-N L-homoserine Chemical compound OC(=O)[C@@H](N)CCO UKAUYVFTDYCKQA-VKHMYHEASA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- QEFRNWWLZKMPFJ-ZXPFJRLXSA-N L-methionine (R)-S-oxide Chemical compound C[S@@](=O)CC[C@H]([NH3+])C([O-])=O QEFRNWWLZKMPFJ-ZXPFJRLXSA-N 0.000 description 1
- QEFRNWWLZKMPFJ-UHFFFAOYSA-N L-methionine sulphoxide Natural products CS(=O)CCC(N)C(O)=O QEFRNWWLZKMPFJ-UHFFFAOYSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- 108010001831 LDL receptors Proteins 0.000 description 1
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 1
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 1
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 1
- ZGUMORRUBUCXEH-AVGNSLFASA-N Leu-Lys-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZGUMORRUBUCXEH-AVGNSLFASA-N 0.000 description 1
- BGZCJDGBBUUBHA-KKUMJFAQSA-N Leu-Lys-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O BGZCJDGBBUUBHA-KKUMJFAQSA-N 0.000 description 1
- LINKCQUOMUDLKN-KATARQTJSA-N Leu-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(C)C)N)O LINKCQUOMUDLKN-KATARQTJSA-N 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- 208000030162 Maple syrup disease Diseases 0.000 description 1
- 102000019010 Methylmalonyl-CoA Mutase Human genes 0.000 description 1
- 108010051862 Methylmalonyl-CoA mutase Proteins 0.000 description 1
- 241001529936 Murinae Species 0.000 description 1
- 101000574441 Mus musculus Alkaline phosphatase, germ cell type Proteins 0.000 description 1
- 108010027520 N-Acetylgalactosamine-4-Sulfatase Proteins 0.000 description 1
- 101710099863 N-acetylgalactosamine-6-sulfatase Proteins 0.000 description 1
- 102100023282 N-acetylglucosamine-6-sulfatase Human genes 0.000 description 1
- 108010023320 N-acetylglucosamine-6-sulfatase Proteins 0.000 description 1
- 108010079364 N-glycylalanine Proteins 0.000 description 1
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 1
- 108010006140 N-sulfoglucosamine sulfohydrolase Proteins 0.000 description 1
- 101100005280 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) cat-3 gene Proteins 0.000 description 1
- 101150007210 ORF6 gene Proteins 0.000 description 1
- 208000000599 Ornithine Carbamoyltransferase Deficiency Disease Diseases 0.000 description 1
- 101710198224 Ornithine carbamoyltransferase, mitochondrial Proteins 0.000 description 1
- 206010052450 Ornithine transcarbamoylase deficiency Diseases 0.000 description 1
- 208000035903 Ornithine transcarbamylase deficiency Diseases 0.000 description 1
- 208000018737 Parkinson disease Diseases 0.000 description 1
- 241000701945 Parvoviridae Species 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 229930182555 Penicillin Natural products 0.000 description 1
- JGSARLDLIJGVTE-MBNYWOFBSA-N Penicillin G Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)CC1=CC=CC=C1 JGSARLDLIJGVTE-MBNYWOFBSA-N 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- RIYZXJVARWJLKS-KKUMJFAQSA-N Phe-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 RIYZXJVARWJLKS-KKUMJFAQSA-N 0.000 description 1
- UNBFGVQVQGXXCK-KKUMJFAQSA-N Phe-Ser-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O UNBFGVQVQGXXCK-KKUMJFAQSA-N 0.000 description 1
- 101100226894 Phomopsis amygdali PaGT gene Proteins 0.000 description 1
- 208000005746 Phosphoenolpyruvate carboxykinase deficiency Diseases 0.000 description 1
- 102100034391 Porphobilinogen deaminase Human genes 0.000 description 1
- 206010036182 Porphyria acute Diseases 0.000 description 1
- 101710193132 Pre-hexon-linking protein VIII Proteins 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 101800004937 Protein C Proteins 0.000 description 1
- 102000017975 Protein C Human genes 0.000 description 1
- 201000005660 Protein C Deficiency Diseases 0.000 description 1
- 101710150114 Protein rep Proteins 0.000 description 1
- 101000932966 Pseudomonas aeruginosa CD-NTase-associated protein 8 Proteins 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 102000018120 Recombinases Human genes 0.000 description 1
- 108010091086 Recombinases Proteins 0.000 description 1
- 208000001647 Renal Insufficiency Diseases 0.000 description 1
- 108010052090 Renilla Luciferases Proteins 0.000 description 1
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 1
- 101710152114 Replication protein Proteins 0.000 description 1
- 241000725643 Respiratory syncytial virus Species 0.000 description 1
- 102100033617 Retinal-specific phospholipid-transporting ATPase ABCA4 Human genes 0.000 description 1
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 1
- 101800001700 Saposin-D Proteins 0.000 description 1
- 206010039491 Sarcoma Diseases 0.000 description 1
- 241000700584 Simplexvirus Species 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 201000001828 Sly syndrome Diseases 0.000 description 1
- 208000027073 Stargardt disease Diseases 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- 208000002903 Thalassemia Diseases 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical class OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 1
- IMDMLDSVUSMAEJ-HJGDQZAQSA-N Thr-Leu-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IMDMLDSVUSMAEJ-HJGDQZAQSA-N 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- 108010079274 Thrombomodulin Proteins 0.000 description 1
- 102100026966 Thrombomodulin Human genes 0.000 description 1
- 108010000499 Thromboplastin Proteins 0.000 description 1
- 102000002262 Thromboplastin Human genes 0.000 description 1
- 208000007536 Thrombosis Diseases 0.000 description 1
- 229920004890 Triton X-100 Polymers 0.000 description 1
- 239000013504 Triton X-100 Substances 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 102000044209 Tumor Suppressor Genes Human genes 0.000 description 1
- 108700025716 Tumor Suppressor Genes Proteins 0.000 description 1
- 206010045261 Type IIa hyperlipidaemia Diseases 0.000 description 1
- 108010058532 UTP-hexose-1-phosphate uridylyltransferase Proteins 0.000 description 1
- 102000006321 UTP-hexose-1-phosphate uridylyltransferase Human genes 0.000 description 1
- OQWNEUXPKHIEJO-NRPADANISA-N Val-Glu-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N OQWNEUXPKHIEJO-NRPADANISA-N 0.000 description 1
- WBAJDGWKRIHOAC-GVXVVHGQSA-N Val-Lys-Gln Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O WBAJDGWKRIHOAC-GVXVVHGQSA-N 0.000 description 1
- 108010073929 Vascular Endothelial Growth Factor A Proteins 0.000 description 1
- 102000005789 Vascular Endothelial Growth Factors Human genes 0.000 description 1
- 108010019530 Vascular Endothelial Growth Factors Proteins 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 208000018839 Wilson disease Diseases 0.000 description 1
- 201000004525 Zellweger Syndrome Diseases 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 229960005305 adenosine Drugs 0.000 description 1
- 108700019030 adenovirus E4orf6 Proteins 0.000 description 1
- 108060000200 adenylate cyclase Proteins 0.000 description 1
- 102000030621 adenylate cyclase Human genes 0.000 description 1
- 230000001464 adherent effect Effects 0.000 description 1
- 108010039538 alanyl-glycyl-aspartyl-valine Proteins 0.000 description 1
- 108010050122 alpha 1-Antitrypsin Proteins 0.000 description 1
- 208000006682 alpha 1-Antitrypsin Deficiency Diseases 0.000 description 1
- 229940024142 alpha 1-antitrypsin Drugs 0.000 description 1
- 108010030291 alpha-Galactosidase Proteins 0.000 description 1
- 108010028144 alpha-Glucosidases Proteins 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 125000003277 amino group Chemical group 0.000 description 1
- 239000003098 androgen Substances 0.000 description 1
- 208000007502 anemia Diseases 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 101150010487 are gene Proteins 0.000 description 1
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 1
- 210000001367 artery Anatomy 0.000 description 1
- 210000001130 astrocyte Anatomy 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 102000012740 beta Adrenergic Receptors Human genes 0.000 description 1
- 108010079452 beta Adrenergic Receptors Proteins 0.000 description 1
- 239000003782 beta lactam antibiotic agent Substances 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 206010071434 biotinidase deficiency Diseases 0.000 description 1
- CXNPLSGKWMLZPZ-UHFFFAOYSA-N blasticidin-S Natural products O1C(C(O)=O)C(NC(=O)CC(N)CCN(C)C(N)=N)C=CC1N1C(=O)N=C(N)C=C1 CXNPLSGKWMLZPZ-UHFFFAOYSA-N 0.000 description 1
- 230000023555 blood coagulation Effects 0.000 description 1
- 239000003114 blood coagulation factor Substances 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 238000010804 cDNA synthesis Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 229910052799 carbon Chemical group 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 230000000747 cardiac effect Effects 0.000 description 1
- 210000000845 cartilage Anatomy 0.000 description 1
- 210000001159 caudate nucleus Anatomy 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 210000003855 cell nucleus Anatomy 0.000 description 1
- 238000002659 cell therapy Methods 0.000 description 1
- 229940121378 cell therapy substance Drugs 0.000 description 1
- 108091092356 cellular DNA Proteins 0.000 description 1
- 108091092328 cellular RNA Proteins 0.000 description 1
- 230000002490 cerebral effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 239000003184 complementary RNA Substances 0.000 description 1
- 238000013329 compounding Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 108010016616 cysteinylglycine Proteins 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 206010012601 diabetes mellitus Diseases 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 230000006806 disease prevention Effects 0.000 description 1
- PMMYEEVYMWASQN-UHFFFAOYSA-N dl-hydroxyproline Natural products OC1C[NH2+]C(C([O-])=O)C1 PMMYEEVYMWASQN-UHFFFAOYSA-N 0.000 description 1
- 239000002552 dosage form Substances 0.000 description 1
- 229940126534 drug product Drugs 0.000 description 1
- 239000012636 effector Substances 0.000 description 1
- 238000001493 electron microscopy Methods 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 210000002472 endoplasmic reticulum Anatomy 0.000 description 1
- 230000007893 endotoxin activity Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 229940105423 erythropoietin Drugs 0.000 description 1
- 229940011871 estrogen Drugs 0.000 description 1
- 239000000262 estrogen Substances 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 201000007386 factor VII deficiency Diseases 0.000 description 1
- 208000005376 factor X deficiency Diseases 0.000 description 1
- 229940012413 factor vii Drugs 0.000 description 1
- 229940012444 factor xiii Drugs 0.000 description 1
- 201000001386 familial hypercholesterolemia Diseases 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 229940126864 fibroblast growth factor Drugs 0.000 description 1
- 239000000945 filler Substances 0.000 description 1
- 108010022687 fumarylacetoacetase Proteins 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- IRSCQMHQWWYFCW-UHFFFAOYSA-N ganciclovir Chemical compound O=C1NC(N)=NC2=C1N=CN2COC(CO)CO IRSCQMHQWWYFCW-UHFFFAOYSA-N 0.000 description 1
- 229960002963 ganciclovir Drugs 0.000 description 1
- 102000054767 gene variant Human genes 0.000 description 1
- 229940096919 glycogen Drugs 0.000 description 1
- 201000004502 glycogen storage disease II Diseases 0.000 description 1
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 1
- 108010010147 glycylglutamine Proteins 0.000 description 1
- 108010037850 glycylvaline Proteins 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 208000014951 hematologic disease Diseases 0.000 description 1
- 208000018706 hematopoietic system disease Diseases 0.000 description 1
- 208000009429 hemophilia B Diseases 0.000 description 1
- 208000013746 hereditary thrombophilia due to congenital protein C deficiency Diseases 0.000 description 1
- 229960002773 hyaluronidase Drugs 0.000 description 1
- 150000002431 hydrogen Chemical group 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 229960002591 hydroxyproline Drugs 0.000 description 1
- GRRNUXAQVGOGFE-NZSRVPFOSA-N hygromycin B Chemical compound O[C@@H]1[C@@H](NC)C[C@@H](N)[C@H](O)[C@H]1O[C@H]1[C@H]2O[C@@]3([C@@H]([C@@H](O)[C@@H](O)[C@@H](C(N)CO)O3)O)O[C@H]2[C@@H](O)[C@@H](CO)O1 GRRNUXAQVGOGFE-NZSRVPFOSA-N 0.000 description 1
- 229940097277 hygromycin b Drugs 0.000 description 1
- 210000001822 immobilized cell Anatomy 0.000 description 1
- 208000026278 immune system disease Diseases 0.000 description 1
- 230000036039 immunity Effects 0.000 description 1
- 230000002163 immunogen Effects 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000002458 infectious effect Effects 0.000 description 1
- 208000027866 inflammatory disease Diseases 0.000 description 1
- 230000002757 inflammatory effect Effects 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 229940125396 insulin Drugs 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 229940047122 interleukins Drugs 0.000 description 1
- 239000000543 intermediate Substances 0.000 description 1
- 238000007918 intramuscular administration Methods 0.000 description 1
- 238000010255 intramuscular injection Methods 0.000 description 1
- 239000007927 intramuscular injection Substances 0.000 description 1
- 238000007913 intrathecal administration Methods 0.000 description 1
- 208000023589 ischemic disease Diseases 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 201000006370 kidney failure Diseases 0.000 description 1
- 101150066555 lacZ gene Proteins 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 208000024393 maple syrup urine disease Diseases 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 239000002609 medium Substances 0.000 description 1
- 201000003694 methylmalonic acidemia Diseases 0.000 description 1
- HPNSFSBZBAHARI-UHFFFAOYSA-N micophenolic acid Natural products OC1=C(CC=C(C)CCC(O)=O)C(OC)=C(C)C2=C1C(=O)OC2 HPNSFSBZBAHARI-UHFFFAOYSA-N 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 230000002438 mitochondrial effect Effects 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 108091005601 modified peptides Proteins 0.000 description 1
- 238000001823 molecular biology technique Methods 0.000 description 1
- 210000000663 muscle cell Anatomy 0.000 description 1
- 201000006938 muscular dystrophy Diseases 0.000 description 1
- 229960000951 mycophenolic acid Drugs 0.000 description 1
- HPNSFSBZBAHARI-RUDMXATFSA-N mycophenolic acid Chemical compound OC1=C(C\C=C(/C)CCC(O)=O)C(OC)=C(C)C2=C1C(=O)OC2 HPNSFSBZBAHARI-RUDMXATFSA-N 0.000 description 1
- 239000002105 nanoparticle Substances 0.000 description 1
- 210000004498 neuroglial cell Anatomy 0.000 description 1
- 210000000715 neuromuscular junction Anatomy 0.000 description 1
- 244000309711 non-enveloped viruses Species 0.000 description 1
- 238000007899 nucleic acid hybridization Methods 0.000 description 1
- 238000002515 oligonucleotide synthesis Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 201000011278 ornithine carbamoyltransferase deficiency Diseases 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- 229940049954 penicillin Drugs 0.000 description 1
- 230000010412 perfusion Effects 0.000 description 1
- 239000000825 pharmaceutical preparation Substances 0.000 description 1
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 1
- 150000008298 phosphoramidates Chemical class 0.000 description 1
- BZQFBWGGLXLEPQ-REOHCLBHSA-N phosphoserine Chemical compound OC(=O)[C@@H](N)COP(O)(O)=O BZQFBWGGLXLEPQ-REOHCLBHSA-N 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- OXCMYAYHXIHQOA-UHFFFAOYSA-N potassium;[2-butyl-5-chloro-3-[[4-[2-(1,2,4-triaza-3-azanidacyclopenta-1,4-dien-5-yl)phenyl]phenyl]methyl]imidazol-4-yl]methanol Chemical compound [K+].CCCCC1=NC(Cl)=C(CO)N1CC1=CC=C(C=2C(=CC=CC=2)C2=N[N-]N=N2)C=C1 OXCMYAYHXIHQOA-UHFFFAOYSA-N 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 125000001500 prolyl group Chemical group [H]N1C([H])(C(=O)[*])C([H])([H])C([H])([H])C1([H])[H] 0.000 description 1
- 238000011321 prophylaxis Methods 0.000 description 1
- 229960000856 protein c Drugs 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 229950010131 puromycin Drugs 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 239000013647 rAAV8 vector Substances 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000007115 recruitment Effects 0.000 description 1
- 108010054624 red fluorescent protein Proteins 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000004043 responsiveness Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 210000001908 sarcoplasmic reticulum Anatomy 0.000 description 1
- 238000013341 scale-up Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 208000002491 severe combined immunodeficiency Diseases 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 150000003431 steroids Chemical class 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- RWSOTUBLDIXVET-UHFFFAOYSA-O sulfonium Chemical compound [SH3+] RWSOTUBLDIXVET-UHFFFAOYSA-O 0.000 description 1
- 208000011580 syndromic disease Diseases 0.000 description 1
- 230000001839 systemic circulation Effects 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 108700020534 tetracycline resistance-encoding transposon repressor Proteins 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 230000005100 tissue tropism Effects 0.000 description 1
- FGMPLJWBKKVCDB-UHFFFAOYSA-N trans-L-hydroxy-proline Natural products ON1CCCC1C(O)=O FGMPLJWBKKVCDB-UHFFFAOYSA-N 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 108091006106 transcriptional activators Proteins 0.000 description 1
- 108091006107 transcriptional repressors Proteins 0.000 description 1
- 238000003151 transfection method Methods 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 241001529453 unidentified herpesvirus Species 0.000 description 1
- 230000002792 vascular Effects 0.000 description 1
- 210000003462 vein Anatomy 0.000 description 1
- 230000002861 ventricular Effects 0.000 description 1
- 230000006648 viral gene expression Effects 0.000 description 1
- 230000029812 viral genome replication Effects 0.000 description 1
- 230000009385 viral infection Effects 0.000 description 1
- 238000011179 visual inspection Methods 0.000 description 1
- 239000002132 β-lactam antibiotic Substances 0.000 description 1
- 229940124586 β-lactam antibiotics Drugs 0.000 description 1
Images
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K35/00—Medicinal preparations containing materials or reaction products thereof with undetermined constitution
- A61K35/66—Microorganisms or materials therefrom
- A61K35/76—Viruses; Subviral particles; Bacteriophages
- A61K35/761—Adenovirus
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K35/00—Medicinal preparations containing materials or reaction products thereof with undetermined constitution
- A61K35/66—Microorganisms or materials therefrom
- A61K35/76—Viruses; Subviral particles; Bacteriophages
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
- A61K38/16—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- A61K38/17—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
- C12N2750/14143—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14151—Methods of production or purification of viral material
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/40—Systems of functionally co-operating vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/50—Vectors for producing vectors
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- Zoology (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Wood Science & Technology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Virology (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Epidemiology (AREA)
- Pharmacology & Pharmacy (AREA)
- Medicinal Chemistry (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- Plant Pathology (AREA)
- Mycology (AREA)
- Gastroenterology & Hepatology (AREA)
- Immunology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
Abstract
재조합 아데노-연관 바이러스를 생산하기 위한 삼중-플라스미드 시스템이 개시되어 있다. 한 측면에서, 본 발명은 (i) 5' 및 3' AAV 역위 말단 반복부 (ITR)에 의해 플랭킹된 적어도 하나의 이종 핵산 서열 및 ITR 외부의 스터퍼 서열을 포함하는 트랜스진-함유 플라스미드; (ii) AAV 복제 (Rep) 및 캡시드 (Cap) 유전자 서열을 포함하는 플라스미드; 및 (iii) 아데노바이러스 (Ad) 헬퍼 플라스미드를 포함하는, 재조합 아데노-연관 바이러스 벡터 (rAAV) 생산을 위한 플라스미드 시스템에 관한 것이다.
Description
상호 참조
본 출원은 2018년 10월 25일에 출원된 미국 특허 가출원 번호 62/750,603을 우선권 주장하며, 이는 그 전문이 본원에 참조로 포함된다.
서열 목록
본 출원은 ASCII 포맷으로 전자적으로 제출된 서열 목록을 포함하며, 이는 그 전문이 본원에 참조로 포함된다. 2019년 10월 22일에 생성된 상기 ASCII 카피는 파일명이 250478_001858_SL.txt이고 크기가 274,165 바이트이다.
아데노-연관 바이러스 (AAV)는 인간 및 다양한 다른 동물 종, 예컨대 영장류, 소, 고양이 및 개를 감염시키는 DNA 파르보바이러스이다. 이는 AAV에 의한 생산적 감염이 헬퍼 바이러스 (예를 들어, 아데노바이러스 또는 헤르페스 바이러스)의 존재 하에서만 발생하기 때문에, 파르보비리다에(Parvoviridae) 과에 속하고, 데펜도바이러스(Dependovirus) 속에 위치한다. 이 작은 비-외피보유 바이러스는 복제 (Rep) 및 캡시드 (Cap) 단백질 세트를 코딩하는 4.6 kbase 단일 가닥 DNA 게놈을 함유한다. 예를 들어, Rep 단백질 (Rep78, Rep68, Rep52 및 Rep40)은 AAV 게놈의 복제, 구조 및 통합에 관여하고, Cap 단백질 (VP1, VP2 및 VP3)은 구조적 기능을 제공하고 비리온 캡시드를 형성한다. 5' 및 3' 말단에서 Rep 및 Cap 오픈 리딩 프레임을 플랭킹하는 것은 145 bp 역위 말단 반복부 (ITR)이다. ITR은 시스에서 핵산 복제 기점으로 및 바이러스에 대한 패키징 신호로 기능한다.
감염이 발생하면 AAV 수명 주기에는 두 단계가 있다: 1) 용해 단계 및 2) 용원 단계. 헬퍼 바이러스의 도움으로 용해 단계가 시작된다. 이 단계 동안, AAV는 생산적 감염을 시작하여 게놈 복제, 바이러스 유전자 발현 및 비리온 생산을 초래한다. 아데노바이러스 헬퍼의 경우, AAV 발현에 대한 헬퍼 기능을 제공하는 아데노바이러스 단백질은 E1a, E1b, E2a, E4 및 VA RNA를 포함한다. 아데노바이러스는 AAV 생산적 감염을 위해 적절한 환경을 제공함으로써 세포 유전자 발현을 조절하는데 도움을 준다. 문헌 [Daya and Berns Clinical Microbiology Reviews Oct 2008, p. 583-593]을 참조한다.
AAV는 유전자 요법을 위해 조작될 수 있는 다목적 바이러스이다. 유전자 요법에 사용되는 그의 DNA 게놈에 바이러스 유전자가 결여된 재조합 아데노-연관 바이러스 벡터 (rAAV)는 주로 그의 DNA 화물을 세포 핵으로 수송 및 전달하기 위해 세포막을 통과하도록 조작된 단백질-기반 나노입자이다. rAAV DNA 게놈은 형질도입된 세포의 핵에서 에피솜으로 지속되는 원형 콘카타머를 형성할 수 있다. rAAV DNA가 숙주 게놈으로 통합되지 않아 장기적인 유전자 발현 및 내구성에 기여하기 때문에, 이는 rAAV가 유전자 요법에 이상적인 이유 중 하나이다.
재조합 형태의 AAV (rAAV)는 벡터 패키징 및 DNA 복제에 필요한 유일한 시스 요소인 ITR을 유지하면서 모든 바이러스 유전자를 치료용 트랜스진 발현 카세트로 대체함으로써 벡터로 개발되었다. 예를 들어, 미국 특허 번호 4,797,368; 5,153,414; 5,139,941; 5,252,479; 및 5,354,678; 및 국제 공개 번호 WO1991/018088; WO1993/024641 및 WO1994/13788을 참조한다. 초기 rAAV 생산 방법은 하기를 포함하는 2-플라스미드 시스템에 의존한다: 1) AAV 헬퍼 플라스미드 (일반적으로 AAV Rep 및 Cap 코딩 영역을 포함하는 반면 AAV ITR이 결여되어 있어 자체 복제하거나 패키징할 수 없음) 및 2) ITR-함유 플라스미드 (일반적으로 바이러스 복제 및 패키징 기능을 제공하는 AAV ITR에 의해 결합된 선택된 관심 트랜스진을 포함함). 헬퍼 플라스미드 및 선택된 유전자를 보유하는 ITR-함유 플라스미드 둘 다는 일시적 형질감염에 의한 생산을 위해 적합한 세포에 도입될 수 있다. 그 후, 형질감염된 세포는 헬퍼 바이러스, 예컨대 아데노바이러스 또는 단순 헤르페스 바이러스로 감염될 수 있으며, 이는 AAV Rep 및 Cap 영역의 전사 및 번역을 지시하는 헬퍼 플라스미드에 존재하는 AAV 프로모터를 전사활성화시킨다. Ad 헬퍼 바이러스와 관련하여, E1a, E1b, E2a, E4 및 VA RNA 유전자는 rAAV 생산에 필요한 헬퍼 기능을 제공할 수 있다. rAAV를 생성하기 위한 생산자 세포로의 헬퍼 바이러스의 감염은 rAAV를 생산하는데 효과적이었으나; 결과적으로 또한 숙주로부터 면역 반응을 유도할 수 있는 헬퍼 바이러스 입자를 생산할 수 있다. 특정 플랫폼에서, AAV 제조에 필요한 바이러스 헬퍼 유전자는 제조 세포주 (예를 들어, HEK293 세포)에 안정적으로 형질감염될 수 있으며, 그에 의해 미량 수준의 잔류 헬퍼 바이러스로부터 나오는 숙주 면역계에 의한 항-헬퍼 바이러스 면역 반응의 가능성을 감소시킨다.
보다 최근에, 삼중-플라스미드 형질감염 방법이 개발되었다. 이 방법은 AAV 혈청형-특이적 Rep 및 Cap 플라스미드 뿐만 아니라 트랜스진-함유 플라스미드를 사용하지만, 제3 플라스미드에 필수 헬퍼 바이러스 유전자를 공급하여 (즉, 바이러스 코딩 서열이 제거되거나 감소됨), 그러므로 숙주 면역계에 의한 잠재적인 항-헬퍼 바이러스 면역 반응을 낮춤으로써 헬퍼 바이러스 감염의 사용을 제거하였다. 제3 플라스미드에 바이러스 헬퍼 유전자를 공급하는 것은 rAAV만을 제공하는 형질감염된 세포에서 헬퍼 바이러스 생산을 크게 감소시킨다. 접착성 HEK293 세포의 다중 플라스미드 일시적 형질감염은 rAAV 생산에 일반적으로 사용되는 방법이다.
다중 플라스미드 시스템에서는 적절한 플라스미드 크기를 유지하는 것이 중요하다. 그러므로, 플라스미드가 최적 크기를 갖도록 보장하기 위해 핵산 서열 (일명 "스터퍼 서열")을 첨가하는 것이 중요할 수 있다. 예를 들어, ITR-함유 플라스미드의 플라스미드 백본이 벡터 캡시드에 패키징되지 않도록 하기 위해, 백본이 너무 커서 캡시드에 효과적으로 패키징될 수 없도록 스터퍼 서열을 첨가해야 할 수 있다. 그러나, 스터퍼 서열이 "침묵"하고 플라스미드가 패키징될 가능성이 적어 면역계를 활성화하지 않는 것이 중요하다.
따라서, 필요한 것은 rAAV를 생산하기 위한 개선된 삼중-플라스미드 기반 시스템이다. 플라스미드 시스템은 트랜스진의 최적 발현을 여전히 유지하면서 개선된 형질감염 및 감소된 면역원성을 제공해야 한다. 본 개시내용의 실시양태는 이러한 플라스미드 시스템에 관한 것이다.
배경기술 섹션에 명시된 바와 같이, rAAV-기반 유전자 요법을 위한 rAAV 플라스미드 시스템을 개선하는 것에 대하여 관련 기술분야에 큰 요구가 있다. 본 개시내용은 이러한 요구 및 다른 요구를 충족시킨다. 본 개시내용의 실시양태는 일반적으로 rAAV의 생산을 위한 플라스미드 시스템 및 보다 구체적으로 삼중-플라스미드 기반 시스템에 관한 것이다.
한 측면에서, 본 발명은 (i) 5' 및 3' AAV 역위 말단 반복부 (ITR)에 의해 플랭킹된 적어도 하나의 이종 핵산 서열 및 ITR 외부의 스터퍼 서열을 포함하는 트랜스진-함유 플라스미드; (ii) AAV 복제 (Rep) 및 캡시드 (Cap) 유전자 서열을 포함하는 플라스미드; 및 (iii) 아데노바이러스 (Ad) 헬퍼 플라스미드를 포함하는, 재조합 아데노-연관 바이러스 벡터 (rAAV) 생산을 위한 플라스미드 시스템에 관한 것이다.
특정 실시양태에서, 스터퍼 서열은 트랜스진-함유 플라스미드 백본의 크기를 증가시킨다. 특정 실시양태에서, 스터퍼 서열은 트랜스진-함유 플라스미드 백본의 크기를 증가시켜 트랜스진-함유 플라스미드 백본이 rAAV 캡시드에 패키징되지 않도록 한다. 특정 실시양태에서, rAAV로의 플라스미드 백본 혼입은 검출 한계 미만이다. 특정 실시양태에서, 트랜스진-함유 플라스미드의 백본은 스터퍼 서열의 첨가 후 야생형 AAV 게놈보다 더 크다.
특정 실시양태에서, 스터퍼 서열에는 인핸서, 프로모터, 스플라이싱 조절인자, 비코딩 RNA, 안티센스 서열, 코딩 서열 또는 이들의 임의의 조합이 없다. 특정 실시양태에서, 스터퍼 서열에는 인핸서, 프로모터, 스플라이싱 조절인자, 비코딩 RNA, 안티센스 서열 및 코딩 서열이 없다. 특정 실시양태에서, 스터퍼 서열은 인간 게놈에서 발견되는 불활성 인트론 DNA 서열을 포함한다.
특정 실시양태에서, 스터퍼 서열은 1000 내지 5000개 뉴클레오티드 길이의 핵산 서열 또는 1000 내지 2000개 뉴클레오티드 길이의 핵산 서열을 포함한다.
특정 실시양태에서, 스터퍼 서열은 GAPDH 인트론 2, 단편, 또는 그의 돌연변이체를 포함한다. 특정 실시양태에서, 스터퍼 서열은 불활성화된 겐타마이신 유전자를 포함한다.
특정 실시양태에서, 스터퍼 서열은 서열식별번호(SEQ ID NO): 9와 적어도 약 40%, 약 50%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98% 또는 약 99% 동일성을 갖는 핵산을 포함한다. 특정 실시양태에서, 스터퍼 서열은 서열식별번호: 9 또는 그의 단편을 포함한다. 특정 실시양태에서, 단편은 800-1000개 뉴클레오티드 길이이다.
특정 실시양태에서, 스터퍼 서열은 서열식별번호: 9와 적어도 약 40%, 약 50%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98% 또는 약 99% 동일성을 갖는 핵산으로 이루어진다. 특정 실시양태에서, 스터퍼 서열은 서열식별번호: 9 또는 그의 단편으로 이루어진다. 특정 실시양태에서, 단편은 800-1000개 뉴클레오티드 길이이다.
특정 실시양태에서, 트랜스진-함유 플라스미드는 도 3a와 동일한 순서의 구조를 갖는 플라스미드를 포함하며, 여기서 eGFP 및 SEAP 트랜스진은 적어도 하나의 이종 핵산 서열로 대체될 수 있다.
특정 실시양태에서, 트랜스진-함유 플라스미드는 도 3b와 동일한 순서의 구조를 갖는 플라스미드를 포함하며, 여기서 eGFP 트랜스진은 적어도 하나의 이종 핵산 서열로 대체될 수 있다.
특정 실시양태에서, 트랜스진-함유 플라스미드는 5'에서 3' 방향으로 5' ITR (예를 들어, 서열식별번호: 2 또는 43), 프로모터 (예를 들어, 서열식별번호: 4), 적어도 하나의 이종 핵산 서열, 폴리A 서열 (예를 들어, 서열식별번호: 8), 3' ITR (예를 들어, 서열식별번호: 3), 및 스터퍼 서열 (예를 들어, 서열식별번호: 9)의 핵산 서열을 포함하며, 여기서 각 핵산 서열은 그의 상응하는 기능적 단편 또는 유도체 또는 그와 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 치환될 수 있거나 또는 그를 코딩한다.
특정 실시양태에서, 트랜스진-함유 플라스미드는 발현 카세트 외부에 그러나 5' ITR과 3' ITR 사이에 DNA 역가 태그를 추가로 포함한다.
특정 실시양태에서, 트랜스진-함유 플라스미드는 i) 3' ITR의 상류 및 폴리A 서열의 하류 또는 ii) 3' ITR의 상류 및 적어도 하나의 이종 핵산 서열의 하류; 또는 iii) 5' ITR의 하류 및 적어도 하나의 이종 핵산 서열의 상류; 또는 iv) 5' ITR의 하류 및 적어도 하나의 이종 핵산 서열에 대한 프로모터의 상류; 또는 v) 5' ITR의 하류 및 3' ITR의 상류에 DNA 역가 태그를 추가로 포함한다.
특정 실시양태에서, 트랜스진-함유 플라스미드는 i) 3' ITR (예를 들어, 서열식별번호: 3)의 상류 및 폴리A 서열 (예를 들어, 서열식별번호: 8)의 하류 또는 ii) 3' ITR (예를 들어, 서열식별번호: 3)의 상류 및 적어도 하나의 이종 핵산 서열의 하류; 또는 iii) 5' ITR (예를 들어, 서열식별번호: 2 또는 43)의 하류 및 적어도 하나의 이종 핵산 서열의 상류; 또는 iv) 5' ITR (예를 들어, 서열식별번호: 2 또는 43)의 하류 및 프로모터 (예를 들어, 서열식별번호: 4)의 상류; 또는 v) 5' ITR (예를 들어, 서열식별번호: 2 또는 43)의 하류 및 3' ITR (예를 들어, 서열식별번호: 3)의 상류에 DNA 역가 태그를 추가로 포함한다.
특정 실시양태에서, 트랜스진-함유 플라스미드는 5'에서 3' 방향으로 5' ITR (예를 들어, 서열식별번호: 2 또는 43), 프로모터 (예를 들어, 서열식별번호: 4), 적어도 하나의 이종 핵산 서열, 폴리A 서열 (예를 들어, 서열식별번호: 8), 3' ITR (예를 들어, 서열식별번호: 3), 및 스터퍼 서열 (예를 들어, 서열식별번호: 9)의 핵산 서열을 포함하며, 여기서 각 핵산 서열은 그의 상응하는 기능적 단편 또는 유도체 또는 그와 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 치환될 수 있거나 또는 그를 코딩한다.
특정 실시양태에서, 트랜스진-함유 플라스미드는 발현 카세트 외부에 그러나 5' ITR과 3' ITR 사이에 DNA 역가 태그를 추가로 포함한다.
특정 실시양태에서, 트랜스진-함유 플라스미드는 i) 3' ITR의 상류 및 폴리A 서열의 하류 또는 ii) 3' ITR의 상류 및 적어도 하나의 이종 핵산 서열의 하류; 또는 iii) 5' ITR의 하류 및 적어도 하나의 이종 핵산 서열의 상류; 또는 iv) 5' ITR의 하류 및 적어도 하나의 이종 핵산 서열에 대한 프로모터의 상류; 또는 v) 5' ITR의 하류 및 3' ITR의 상류에 DNA 역가 태그를 추가로 포함한다.
특정 실시양태에서, 트랜스진-함유 플라스미드는 i) 3' ITR (예를 들어, 서열식별번호: 3)의 상류 및 폴리A 서열 (예를 들어, 서열식별번호: 8)의 하류 또는 ii) 3' ITR (예를 들어, 서열식별번호: 3)의 상류 및 적어도 하나의 이종 핵산 서열의 하류; 또는 iii) 5' ITR (예를 들어, 서열식별번호: 2 또는 43)의 하류 및 적어도 하나의 이종 핵산 서열의 상류; 또는 iv) 5' ITR (예를 들어, 서열식별번호: 2 또는 43)의 하류 및 프로모터 (예를 들어, 서열식별번호: 4)의 상류; 또는 v) 5' ITR (예를 들어, 서열식별번호: 2 또는 43)의 하류 및 3' ITR (예를 들어, 서열식별번호: 3)의 상류에 DNA 역가 태그를 추가로 포함한다.
특정 실시양태에서, AAV Rep 유전자 서열은 AAV 혈청형 2, 5, 8, 9, 또는 이들의 하이브리드로부터 유래된다. 특정 실시양태에서, AAV Cap 유전자 서열은 AAV 혈청형 2, 5, 8, 9, 또는 이들의 하이브리드로부터 유래된다. 특정 실시양태에서, Rep 및 Cap 유전자 서열을 포함하는 플라스미드는 프로모터를 추가로 포함한다. 특정 실시양태에서, 프로모터는 AAV 프로모터이다. 특정 실시양태에서, 프로모터는 AAV P5 프로모터이다.
특정 실시양태에서, Ad 헬퍼 플라스미드는 E1a, E1b, E2a, E4orf6, 또는 VA RNA로부터 선택된 하나 이상의 아데노바이러스 유전자를 포함한다.
특정 실시양태에서, Ad 헬퍼 플라스미드는 5'에서 3' 방향으로 서열식별번호: 18, 17, 16 및 20의 핵산 서열을 포함하며, 여기서 각 핵산 서열은 그의 상응하는 기능적 단편 또는 유도체 또는 그와 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 치환될 수 있다.
특정 실시양태에서, Ad 헬퍼 플라스미드는 5'에서 3' 방향으로 서열식별번호: 21, 16, 39, 40, 22, 23 및 20의 핵산 서열을 포함하며, 여기서 각 핵산 서열은 그의 상응하는 기능적 단편 또는 유도체 또는 그와 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 치환될 수 있거나 또는 그를 코딩한다.
특정 실시양태에서, Ad 헬퍼 플라스미드는 도 5의 어느 하나의 구축물과 동일한 순서의 구조를 포함한다.
특정 실시양태에서, Ad 헬퍼 플라스미드는 서열식별번호: 14와 적어도 약 40%, 약 50%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98% 또는 약 99% 동일성을 갖는 핵산을 포함한다.
특정 실시양태에서, Ad 헬퍼 플라스미드는 서열식별번호: 15와 적어도 약 40%, 약 50%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98% 또는 약 99% 동일성을 갖는 핵산을 포함한다.
특정 실시양태에서, 이종 핵산 서열은 펩티드, 폴리펩티드 또는 단백질을 코딩하는 관심 이종 유전자이다. 특정 실시양태에서, 펩티드, 폴리펩티드 또는 단백질은 효소, 항체, MHC 분자, T-세포 수용체, B-세포 수용체, 압타머, 아비머, 수용체-결합 리간드, 표적화 펩티드, 치료제, 또는 유전자 편집 분자이다. 특정 실시양태에서, 이종 핵산 서열은 핵산 서열, 예컨대 안티센스, siRNA, shRNA, miRNA, EGS, gRNA, sgRNA, 리보자임 또는 압타머이다.
또 다른 측면에서, 본 발명은 본원에 기재된 플라스미드 시스템 중 어느 하나를 포함하는 숙주 세포에 관한 것이다.
또 다른 측면에서, 본 발명은 본원에 기재된 플라스미드 시스템 중 어느 하나에 의해 생산된 rAAV에 관한 것이다.
또 다른 측면에서, 본 발명은 트랜스진-함유 플라스미드 내의 이종 핵산 서열의 핵산 서열로부터 상류 또는 하류에 약 60개 뉴클레오티드 내지 약 100개 뉴클레오티드 길이의 핵산 태그 서열을 포함하며, 여기서 핵산 태그 서열은 적어도 2개의 상이한 유형의 AAV 벡터 사이에서 범용 벡터 게놈 역가측정을 허용하기 위해 적어도 2개의 상이한 트랜스진-함유 플라스미드에서 사용될 수 있는 것인, 범용 벡터 역가측정을 허용하는 DNA 역가 태그에 관한 것이다. 특정 실시양태에서, 핵산 태그 서열은 약 100개 뉴클레오티드 길이이다.
특정 실시양태에서, 핵산 태그 서열은 트랜스진-함유 플라스미드의 3' ITR 서열로부터 상류에 있지만 트랜스진-함유 플라스미드의 발현 카세트 내에 없다.
특정 실시양태에서, 핵산 태그 서열은 트랜스진-함유 플라스미드의 5' ITR 서열로부터 하류에 있지만 트랜스진-함유 플라스미드의 발현 카세트 내에 없다.
특정 실시양태에서, DNA 역가 태그는 서열식별번호: 61-70의 핵산 서열 중 어느 하나를 포함한다.
또 다른 측면에서, 본 발명은 본원에 기재된 플라스미드 시스템 중 어느 하나로 세포를 형질도입하고, rAAV를 단리하는 것을 포함하는, rAAV를 생산하는 방법에 관한 것이다. 또 다른 측면에서, 본 발명은 상기 방법에 의해 생산된 rAAV에 관한 것이다.
또 다른 측면에서, 본 발명은 본 발명의 플라스미드 시스템을 포함하는 조성물에 관한 것이다.
또 다른 측면에서, 본 발명은 본 발명의 플라스미드 시스템에 의해 생산된 rAAV를 포함하는 제약 조성물에 관한 것이다.
또 다른 측면에서, 본 발명은 본 발명의 플라스미드 시스템에 의해 생산된 rAAV를 대상체에게 투여하며, 그에 의해 핵산 서열을 세포로 전달하는 것을 포함하는, 핵산 서열을 대상체의 세포로 전달하거나 또는 전이시키는 방법에 관한 것이다. 특정 실시양태에서, 대상체의 세포는 배양 중이거나 또는 대상체에 존재한다.
또 다른 측면에서, 본 발명은 본 발명의 플라스미드 시스템에 의해 생산된 rAAV를 질환 또는 장애의 치료 또는 예방을 필요로 하는 대상체에게 투여하는 것을 포함하는, 대상체에서 질환 또는 장애를 치료하거나 또는 예방하는 방법에 관한 것이다.
또 다른 측면에서, 본 발명은 본 발명의 플라스미드 시스템에 의해 생산된 rAAV와 숙주 세포를 접촉시키는 것을 포함하는, 숙주 세포를 형질도입하는 방법에 관한 것이다.
본 개시내용의 이들 및 다른 목적, 특색 및 장점은 첨부된 설명, 청구범위 및 도면과 함께 하기 명세서를 읽으면 더욱 명백해질 것이다.
도 1은 본 개시내용의 일부 실시양태에 따른 rAAV 생산을 위한 예시적인 삼중-플라스미드 시스템을 도시한다.
도 2는 본 개시내용의 일부 실시양태에 따른, 트랜스진으로서 eGFP 및 SEAP를 혼입한 rAAV 생산을 위한 예시적인 트랜스진-함유 플라스미드를 도시한다.
도 3a-3b는 단일-가닥 (ss) (도 3a) 및 자가-상보적 (sc) rAAV (도 3b) 생산을 위한 트랜스진-함유 플라스미드의 예시적인 유전자 구축물을 제시한다.
도 4a-4b: 도 4a는 본 개시내용의 일부 실시양태에 따른, 상이한 AAV Rep 및 Cap 유전자를 혼입한 예시적인 AAV Rep-Cap 플라스미드를 도시한다. 도 4b는 AAV 혈청형 2로부터의 프로모터를 혼입한 예시적인 AAV Rep-Cap 플라스미드를 도시한다.
도 5는 짧은 (상단 패널) 및 긴 (하단 패널) 실시양태에서 예시적인 Ad 헬퍼 플라스미드를 도시한다.
도 6은 본 개시내용에 따른 플라스미드로부터의 상이한 AAV 혈청형으로부터의 Cap 단백질의 발현 수준을 제시하는 웨스턴 블롯이다.
도 7은 본 개시내용에 따른 플라스미드로부터의 상이한 AAV 혈청형으로부터의 Cap 단백질의 발현 수준을 제시하는 웨스턴 블롯이다. 모노클로날 B1 클론을 블롯 분석에 사용하였다.
도 8은 본 개시내용에 따른 플라스미드로부터의 상이한 AAV 혈청형으로부터의 Cap 단백질의 AAV P5-구동 발현 수준을 제시하는 웨스턴 블롯이다. - : P5 프로모터가 없는 플라스미드 구축물; + : P5 프로모터를 갖는 플라스미드 구축물. 모노클로날 B1 클론을 블롯 분석에 사용하였다.
도 9는 본 개시내용에 따른 짧은 Ad 헬퍼 플라스미드를 사용한 바이러스 게놈 카피 수의 qPCR 검정 결과를 제시한다. 1: 음성 대조군 1 (p헬퍼+pAAV-RC2 (애질런트(Agilent))); 2: 음성 대조군 2 (p헬퍼+pTRUF11); 3: 양성 대조군 (p헬퍼+pAAV-RC2+pTRUF11); 4: 짧은 Ad 헬퍼 시험 (짧은-헬퍼 (서열식별번호: 14)+pAAV-RC2 +pTRUF11).
도 10은 본 개시내용에 따른 긴 Ad 헬퍼 플라스미드를 사용한 바이러스 게놈 카피 수의 qPCR 검정 결과를 제시한다. 1: 음성 대조군 1 (pTRUF11+pAAV-RC2 (Rep2Cap2 (애질런트)); 2: 양성 대조군 2 (p헬퍼+ pAAV-RC2+pTRUF11); 3: 짧은 Ad 헬퍼 시험 (짧은-헬퍼 (서열식별번호: 14)+ pUC19-Rep2Cap8 +pITRs (서열식별번호: 1)); 4: 긴 Ad 헬퍼 시험 (긴-헬퍼 (서열식별번호: 15)+ pUC19-Rep2Cap8+pITRs (서열식별번호: 1)).
도 11은 rAAV 생산을 위한 상응하는 트랜스진-함유 플라스미드를 사용하여 생산된 단일-가닥 (상단 패널) 또는 자가-상보적 (하단 패널) DNA 게놈을 함유하는 rAAV에 대한 세포 용해물 ml당 바이러스 게놈 카피 수를 제시한다. 상단 패널의 경우: 1: 음성 대조군 (p헬퍼+AAV-RC2); 2: 양성 대조군 (p헬퍼+pAAV-RC2+pTRUF11); 3: ssITR (p헬퍼+pAAV-RC2+ ssITR) (서열식별번호: 1). 하단 패널의 경우: 1: 음성 대조군 (p헬퍼+AAV-RC2); 2: 양성 대조군 (p헬퍼+pAAV-RC2+pTRUF11); 3: scITR (p헬퍼+pAAV-RC2+ scITR (서열식별번호: 42).
도 12는 양성 및 음성 대조군과 함께, 본 개시내용에 따른 삼중-플라스미드 시스템에 대한 다중 캡시드 혈청형의 세포 용해물 ml당 바이러스 게놈 카피 수를 제시한다. 1: 음성 대조군 (p헬퍼+pTRUF11); 2: 양성 대조군 (p헬퍼+pTRUF11+pAAV-RC2); 3: p헬퍼+pTRUF11+pUC19-P5-Rep2Cap2 (서열식별번호: 31); 4: p헬퍼+pTRUF11+pUC19-Rep2/5Cap5 (서열식별번호: 24); 5: p헬퍼+pTRUF11+pUC19-P5-Rep2Cap8 (서열식별번호: 35); 6: p헬퍼+pTRUF11+pUC19-P5-Rep2Cap9 (서열식별번호: 37); 7: 짧은-헬퍼 (서열식별번호: 14)+ ssITR (서열식별번호: 1)+pUC19-P5-Rep2Cap2 (서열식별번호: 31); 8: 짧은-헬퍼 (서열식별번호: 14)+ ssITR (서열식별번호: 1)+pUC19-Rep2/5Cap5 (서열식별번호: 24); 9: 짧은-헬퍼 (서열식별번호: 14)+ ssITR (서열식별번호: 1)+pUC19-P5-Rep2Cap8 (서열식별번호: 35); 10: 짧은-헬퍼 (서열식별번호: 14)+ ssITR (서열식별번호: 1)+pUC19-P5-Rep2Cap9 (서열식별번호: 37); 11: 짧은-헬퍼 (서열식별번호: 14)+ ssITR (서열식별번호: 1)+pAAV-RC2.
도 13a-13b는 SV40 폴리A 및 qPCR 분석을 위한 100개 뉴클레오티드 길이 DNA 역가 태그 둘 다를 사용한 단일 가닥 ITR (ssITR) 트랜스진 플라스미드 (도 13a) 및 자가-상보적 ITR (scITR) 플라스미드에 대한 용해물 ml당 바이러스 게놈 카피 수를 제시한다.
도 14a-14b: 도 14a는 본 개시내용의 일부 실시양태에 따른, 상이한 AAV Rep 및 Cap 유전자를 혼입한 예시적인 AAV Rep-Cap 플라스미드를 도시한다. 도 14b는 본 개시내용의 일부 실시양태에 따른, 상이한 AAV Rep 및 Cap 유전자를 혼입하고 P5 프로모터를 혼입한 예시적인 AAV Rep-Cap 플라스미드를 도시한다.
도 15는 단일-가닥 (ss) (도 15a) 및 자가-상보적 (sc) rAAV (도 15b) 생산을 위한 트랜스진-함유 플라스미드의 예시적인 ene 구축물을 제시한다. 변형된 플라스미드 둘 다는 더 높은 개발가능성을 갖는 개선된 플라스미드 백본을 함유하였다.
도 16은 qPCR 분석을 위한 100개 뉴클레오티드 길이 DNA 역가 태그를 사용한 변형된 단일 가닥 ITR (ssITR) 트랜스진 플라스미드 (도 16a) 및 변형된 자가-상보적 ITR (scITR) 플라스미드에 대한 용해물 ml당 바이러스 게놈 카피 수를 제시한다.
도 2는 본 개시내용의 일부 실시양태에 따른, 트랜스진으로서 eGFP 및 SEAP를 혼입한 rAAV 생산을 위한 예시적인 트랜스진-함유 플라스미드를 도시한다.
도 3a-3b는 단일-가닥 (ss) (도 3a) 및 자가-상보적 (sc) rAAV (도 3b) 생산을 위한 트랜스진-함유 플라스미드의 예시적인 유전자 구축물을 제시한다.
도 4a-4b: 도 4a는 본 개시내용의 일부 실시양태에 따른, 상이한 AAV Rep 및 Cap 유전자를 혼입한 예시적인 AAV Rep-Cap 플라스미드를 도시한다. 도 4b는 AAV 혈청형 2로부터의 프로모터를 혼입한 예시적인 AAV Rep-Cap 플라스미드를 도시한다.
도 5는 짧은 (상단 패널) 및 긴 (하단 패널) 실시양태에서 예시적인 Ad 헬퍼 플라스미드를 도시한다.
도 6은 본 개시내용에 따른 플라스미드로부터의 상이한 AAV 혈청형으로부터의 Cap 단백질의 발현 수준을 제시하는 웨스턴 블롯이다.
도 7은 본 개시내용에 따른 플라스미드로부터의 상이한 AAV 혈청형으로부터의 Cap 단백질의 발현 수준을 제시하는 웨스턴 블롯이다. 모노클로날 B1 클론을 블롯 분석에 사용하였다.
도 8은 본 개시내용에 따른 플라스미드로부터의 상이한 AAV 혈청형으로부터의 Cap 단백질의 AAV P5-구동 발현 수준을 제시하는 웨스턴 블롯이다. - : P5 프로모터가 없는 플라스미드 구축물; + : P5 프로모터를 갖는 플라스미드 구축물. 모노클로날 B1 클론을 블롯 분석에 사용하였다.
도 9는 본 개시내용에 따른 짧은 Ad 헬퍼 플라스미드를 사용한 바이러스 게놈 카피 수의 qPCR 검정 결과를 제시한다. 1: 음성 대조군 1 (p헬퍼+pAAV-RC2 (애질런트(Agilent))); 2: 음성 대조군 2 (p헬퍼+pTRUF11); 3: 양성 대조군 (p헬퍼+pAAV-RC2+pTRUF11); 4: 짧은 Ad 헬퍼 시험 (짧은-헬퍼 (서열식별번호: 14)+pAAV-RC2 +pTRUF11).
도 10은 본 개시내용에 따른 긴 Ad 헬퍼 플라스미드를 사용한 바이러스 게놈 카피 수의 qPCR 검정 결과를 제시한다. 1: 음성 대조군 1 (pTRUF11+pAAV-RC2 (Rep2Cap2 (애질런트)); 2: 양성 대조군 2 (p헬퍼+ pAAV-RC2+pTRUF11); 3: 짧은 Ad 헬퍼 시험 (짧은-헬퍼 (서열식별번호: 14)+ pUC19-Rep2Cap8 +pITRs (서열식별번호: 1)); 4: 긴 Ad 헬퍼 시험 (긴-헬퍼 (서열식별번호: 15)+ pUC19-Rep2Cap8+pITRs (서열식별번호: 1)).
도 11은 rAAV 생산을 위한 상응하는 트랜스진-함유 플라스미드를 사용하여 생산된 단일-가닥 (상단 패널) 또는 자가-상보적 (하단 패널) DNA 게놈을 함유하는 rAAV에 대한 세포 용해물 ml당 바이러스 게놈 카피 수를 제시한다. 상단 패널의 경우: 1: 음성 대조군 (p헬퍼+AAV-RC2); 2: 양성 대조군 (p헬퍼+pAAV-RC2+pTRUF11); 3: ssITR (p헬퍼+pAAV-RC2+ ssITR) (서열식별번호: 1). 하단 패널의 경우: 1: 음성 대조군 (p헬퍼+AAV-RC2); 2: 양성 대조군 (p헬퍼+pAAV-RC2+pTRUF11); 3: scITR (p헬퍼+pAAV-RC2+ scITR (서열식별번호: 42).
도 12는 양성 및 음성 대조군과 함께, 본 개시내용에 따른 삼중-플라스미드 시스템에 대한 다중 캡시드 혈청형의 세포 용해물 ml당 바이러스 게놈 카피 수를 제시한다. 1: 음성 대조군 (p헬퍼+pTRUF11); 2: 양성 대조군 (p헬퍼+pTRUF11+pAAV-RC2); 3: p헬퍼+pTRUF11+pUC19-P5-Rep2Cap2 (서열식별번호: 31); 4: p헬퍼+pTRUF11+pUC19-Rep2/5Cap5 (서열식별번호: 24); 5: p헬퍼+pTRUF11+pUC19-P5-Rep2Cap8 (서열식별번호: 35); 6: p헬퍼+pTRUF11+pUC19-P5-Rep2Cap9 (서열식별번호: 37); 7: 짧은-헬퍼 (서열식별번호: 14)+ ssITR (서열식별번호: 1)+pUC19-P5-Rep2Cap2 (서열식별번호: 31); 8: 짧은-헬퍼 (서열식별번호: 14)+ ssITR (서열식별번호: 1)+pUC19-Rep2/5Cap5 (서열식별번호: 24); 9: 짧은-헬퍼 (서열식별번호: 14)+ ssITR (서열식별번호: 1)+pUC19-P5-Rep2Cap8 (서열식별번호: 35); 10: 짧은-헬퍼 (서열식별번호: 14)+ ssITR (서열식별번호: 1)+pUC19-P5-Rep2Cap9 (서열식별번호: 37); 11: 짧은-헬퍼 (서열식별번호: 14)+ ssITR (서열식별번호: 1)+pAAV-RC2.
도 13a-13b는 SV40 폴리A 및 qPCR 분석을 위한 100개 뉴클레오티드 길이 DNA 역가 태그 둘 다를 사용한 단일 가닥 ITR (ssITR) 트랜스진 플라스미드 (도 13a) 및 자가-상보적 ITR (scITR) 플라스미드에 대한 용해물 ml당 바이러스 게놈 카피 수를 제시한다.
도 14a-14b: 도 14a는 본 개시내용의 일부 실시양태에 따른, 상이한 AAV Rep 및 Cap 유전자를 혼입한 예시적인 AAV Rep-Cap 플라스미드를 도시한다. 도 14b는 본 개시내용의 일부 실시양태에 따른, 상이한 AAV Rep 및 Cap 유전자를 혼입하고 P5 프로모터를 혼입한 예시적인 AAV Rep-Cap 플라스미드를 도시한다.
도 15는 단일-가닥 (ss) (도 15a) 및 자가-상보적 (sc) rAAV (도 15b) 생산을 위한 트랜스진-함유 플라스미드의 예시적인 ene 구축물을 제시한다. 변형된 플라스미드 둘 다는 더 높은 개발가능성을 갖는 개선된 플라스미드 백본을 함유하였다.
도 16은 qPCR 분석을 위한 100개 뉴클레오티드 길이 DNA 역가 태그를 사용한 변형된 단일 가닥 ITR (ssITR) 트랜스진 플라스미드 (도 16a) 및 변형된 자가-상보적 ITR (scITR) 플라스미드에 대한 용해물 ml당 바이러스 게놈 카피 수를 제시한다.
배경기술 섹션에 명시된 바와 같이, rAAV-기반 유전자 요법을 생성하기 위한 rAAV 생산 기술을 확인하는 것에 대하여 관련 기술분야에 큰 요구가 있다. 본 개시내용은 이러한 요구 및 다른 요구를 충족시킨다. 본 개시내용의 실시양태는 일반적으로 rAAV 생산 및 보다 구체적으로 rAAV 생산을 위한 삼중-플라스미드 기반 시스템에 관한 것이다.
본 개시내용의 다양한 실시양태의 원리 및 특색의 이해를 용이하게 하기 위해, 다양한 예시적인 실시양태가 하기 설명된다. 본 개시내용의 예시적인 실시양태가 상세히 설명되어 있지만, 다른 실시양태가 고려된다는 것을 이해해야 한다. 따라서, 본 개시내용은 하기 설명 또는 실시예에 기재된 성분의 구축 및 배열의 세부사항으로 그 범위가 제한되는 것으로 의도되지 않는다. 본 개시내용은 다른 실시양태가 가능하고, 다양한 방식으로 실행 또는 수행될 수 있다. 또한, 예시적인 실시양태를 설명함에 있어서, 명료성을 위해 특정 용어가 재분류될 것이다.
각 용어는 관련 기술분야의 통상의 기술자에 의해 이해되는 바와 같은 가장 넓은 의미를 고려하고 유사한 목적을 달성하기 위해 유사한 방식으로 작동하는 모든 기술적 등가물을 포함하는 것으로 의도된다. 개시된 기술의 실시양태는 이들 특정 세부사항 없이 실행될 수 있음을 이해해야 한다. 다른 경우에, 널리 공지된 방법, 구조 및 기술은 이 설명의 이해를 모호하게 하지 않기 위해 상세히 제시되지 않았다. "한 실시양태", "하나의 실시양태", "예시 실시양태", "일부 실시양태", "특정 실시양태", "다양한 실시양태" 등에 대한 언급은 이렇게 설명된 개시된 기술의 실시양태(들)가 특정한 특색, 구조 또는 특징을 포함할 수 있지만, 모든 실시양태가 반드시 특정한 특색, 구조 또는 특징을 포함하는 것은 아니라는 것을 나타낸다. 또한, 문구 "한 실시양태에서"의 반복된 사용이 반드시 동일한 실시양태를 지칭하는 것은 아니지만, 그럴 수도 있다.
또한, 명세서 및 첨부된 청구범위에서 사용된 바와 같은 단수 형태 "하나"는 문맥상 분명하게 달리 지시하지 않는 한 복수 지시대상을 포함한다는 점에 유의해야 한다. 예를 들어, 성분에 대한 언급은 또한 복수의 성분의 조성물을 포함하도록 의도된다. "하나"의 구성요소를 함유하는 조성물에 대한 언급은 명명된 구성요소 외에 다른 구성요소를 포함하도록 의도된다. 다시 말해서, 용어 "하나"는 수량의 제한을 의미하는 것이 아니라, 언급된 항목 중 "적어도 하나"의 존재를 의미한다.
본원에 사용된 바와 같은 용어 "및/또는"은 "및"을 의미할 수 있고/거나, "또는"을 의미할 수 있고/거나, "배타적-또는"을 의미할 수 있고/거나, "하나"를 의미할 수 있고/거나, "일부, 그러나 전부는 아님"을 의미할 수 있고/거나, "둘 다 아님"을 의미할 수 있고/거나, "둘 다"를 의미할 수 있다. 용어 "또는"은 포괄적인 "또는"을 의미하도록 의도된다.
범위는 본원에서 "약" 또는 "대략" 또는 "실질적으로" 하나의 특정한 값으로부터 및/또는 "약" 또는 "대략" 또는 "실질적으로" 또 다른 특정한 값까지로 표현될 수 있다. 이러한 범위가 표현된 경우, 다른 예시적인 실시양태는 하나의 특정한 값으로부터 및/또는 다른 특정한 값까지를 포함한다. 또한, 용어 "약"은 관련 기술분야의 통상의 기술자에 의해 결정된 바와 같은 특정한 값에 대한 허용가능한 오차 범위 이내를 의미하며, 이는 값이 측정 또는 결정되는 방법, 즉, 측정 시스템의 한계에 부분적으로 의존할 것이다. 예를 들어, "약"은 관련 기술분야의 실행에 따라 허용가능한 표준 편차 이내를 의미할 수 있다. 대안적으로, "약"은 주어진 값의 최대 ±20%, 바람직하게는 최대 ±10%, 보다 바람직하게는 최대 ±5%, 및 보다 바람직하게는 여전히 최대 ±1%의 범위를 의미할 수 있다. 대안적으로, 특히 생물학적 시스템 또는 프로세스와 관련하여, 용어는 값의 10배 이내, 바람직하게는 2배 이내를 의미할 수 있다. 특정한 값이 출원 및 청구범위에 기재되어 있는 경우, 달리 언급되지 않는 한, 용어 "약"은 암시적이며 이 문맥에서 특정한 값에 대한 허용가능한 오차 범위 이내를 의미한다.
"포함하는" 또는 "함유하는" 또는 "비롯한"은 적어도 명명된 화합물, 요소, 입자 또는 방법 단계가 조성물 또는 물품 또는 방법에 존재하지만, 다른 이러한 화합물, 물질, 입자, 방법 단계가 명명된 것과 동일한 기능을 갖더라도, 다른 화합물, 물질, 입자, 방법 단계의 존재를 배제하지 않음을 의미한다.
본 설명 전반에 걸쳐, 특정한 값 또는 파라미터를 갖는 다양한 성분이 확인될 수 있으나, 이들 항목은 예시적인 실시양태로서 제공된다. 실제로, 예시적인 실시양태는 많은 비교가능한 파라미터, 크기, 범위 및/또는 값이 구현될 수 있으므로 본 개시내용의 다양한 측면 및 개념을 제한하지 않는다. 용어 "제1", "제2" 등, "일차", "이차" 등은 임의의 순서, 수량 또는 중요도를 나타내지 않고, 한 요소를 또 다른 요소와 구별하는데 사용된다.
"구체적으로", "바람직하게는", "전형적으로", "일반적으로" 및 "종종"과 같은 용어는 청구된 개시내용의 범위를 제한하거나 특정 특색이 청구된 개시내용의 구조 또는 기능에 중요하거나 필수적이거나 심지어 중요하다는 것을 암시하기 위해 본원에서 사용되지 않는다는 점에 유의한다. 오히려, 이들 용어는 단지 본 개시내용의 특정한 실시양태에서 사용되거나 사용되지 않을 수 있는 대안적인 또는 추가적인 특색을 강조하기 위한 것이다. 또한, "실질적으로" 및 "약"과 같은 용어는 임의의 정량적 비교, 값, 측정 또는 다른 표시에 기인할 수 있는 고유한 불확실성의 정도를 나타내기 위해 본원에서 사용된다는 점에 유의한다.
본원에 개시된 치수 및 값은 인용된 정확한 수치로 엄격히 제한되는 것으로 이해되어서는 안된다. 대신에, 달리 특정되지 않는 한, 각 이러한 치수는 인용된 값 및 해당 값 주변의 기능적으로 동등한 범위 둘 다를 의미하는 것으로 의도된다. 예를 들어, "50 mm"로 개시된 치수는 "약 50 mm"를 의미하는 것으로 의도된다.
또한, 하나 이상의 방법 단계의 언급이 명시적으로 확인된 단계들 사이에 추가 방법 단계 또는 개재 방법 단계의 존재를 배제하지 않는다는 것을 이해해야 한다. 유사하게, 조성물 내의 하나 이상의 성분의 언급이 명시적으로 확인된 것 외의 추가 성분의 존재를 배제하지 않는다는 것도 이해해야 한다.
본원에 사용된 바와 같은 용어 "대상체", "환자", "개체" 및 "동물"은 본원에서 상호교환적으로 사용되며, 제한 없이, 인간 및 수의학 동물 (예를 들어, 고양이, 개, 소, 말, 양, 돼지 등)을 포함하는 포유동물 및 실험 동물 모델을 지칭한다. 바람직한 실시양태에서, 대상체는 인간이다.
본원에 사용된 바와 같은 용어 "유전자 요법"은 질환 또는 상태와 연관된 하나 이상의 증상 (예를 들어, 임상 인자)을 완화시키거나 감쇠시키거나 재발을 방지하기 위해 환자에게 치료용 유전자 (예를 들어, 인자 VIII/IX/X)를 코딩하는 핵산을 제공하는 임의의 치료적 접근법을 포함한다. 상기 용어는 질환 또는 상태를 갖는 개체의 건강을 유지 또는 개선하기 위해 임의의 변형된 형태의 유전자 (예를 들어, 인자 VIII/IX/X 변이체)를 비롯한 치료용 유전자를 코딩하는 핵산을 포함하는 임의의 화합물, 약물, 절차 또는 요법을 투여하는 것을 포함한다. 관련 기술분야의 통상의 기술자는 유전자 요법의 과정 또는 유전자 치료제의 용량이 예를 들어, 본 개시내용에 따라 수득된 결과에 기초하여 변경될 수 있음을 이해할 것이다.
본원에 사용된 바와 같이, 용량 또는 양에 적용되는 용어 "치료 유효"는 상태, 장애 또는 병태를 치료 (예를 들어, 예방 또는 호전)하기 위해 대상체에게 투여될 때 이러한 치료에 영향을 미치기에 충분한 화합물 또는 제약 조성물의 양을 지칭한다. 예를 들어, 혈우병 치료에 유용한 약물의 치료 유효량은 혈우병과 연관된 하나 이상의 증상을 예방 또는 완화시킬 수 있는 양일 수 있다. "치료 유효량"은 투여되는 화합물 또는 박테리아 또는 유사체 뿐만 아니라 질환 및 그의 중증도 및 치료될 포유동물의 연령, 체중, 신체 상태 및 반응성에 따라 달라질 것이다. 정확한 용량은 치료 목적에 따라 달라질 것이며, 공지된 기술을 사용하여 관련 기술분야의 통상의 기술자에 의해 확인가능할 것이다 (예를 들어, 문헌 [Lieberman, Pharmaceutical Dosage Forms (vols. 1-3, 1992)]; [Lloyd, The Art, Science and Technology of Pharmaceutical Compounding (1999)]; [Pickar, Dosage Calculations (1999)]; 및 [Remington: The Science and Practice of Pharmacy, 20th Edition, 2003, Gennaro, Ed., Lippincott, Williams & Wilkins] 참조).
본원에 사용된 바와 같은 용어 "벡터"는 핵산 (예를 들어, 유전자 요법 구축물을 코딩하는)을 숙주 세포로 전이시키는데 사용되는 임의의 비히클을 지칭한다. 일부 실시양태에서, 벡터는 표적 핵산과 함께 비히클을 복제하는 기능을 하는 레플리콘을 포함한다. 일부 실시양태에서, 벡터는 표적 핵산 (예를 들어, 치료용 유전자 또는 치료용 유전자 변이체를 코딩하는 코돈-변경된 폴리뉴클레오티드)을 도입하기 위한 바이러스 입자이다. 유전자 요법에 유용한 많은 변형된 진핵 바이러스가 관련 기술분야에 공지되어 있다. 예를 들어, 아데노-연관 바이러스 (AAV)는 인간이 바이러스를 위한 자연 숙주이고, 천연 바이러스가 임의의 질환에 기여하는 것으로 공지되어 있지 않았으며, 바이러스가 가벼운 면역 반응을 유발하기 때문에 인간 유전자 요법에 사용하기에 특히 적합하다. "재조합 AAV" (rAAV) 및 "AAV"는 본원 전반에 걸쳐 상호교환적으로 사용된다.
용어 "플라스미드"는 주어진 박테리아 세포에서 자율 복제가 가능한 염색체외 원형 DNA를 지칭한다. 예시적인 플라스미드는 pBR322, pUC, pUC19, pUC57, pJ241, 또는 pJ247, pBluescript, pREP4, pCEP4, pCI, 및 p 폴리로부터 유래된 것들을 포함하나 이에 제한되지는 않는다 (Lathe et al., Gene 57 (1987), 193-201). 플라스미드는 또한 표준 분자 생물학 기술에 의해 조작될 수 있다 (Sambrook et al., Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor (1989), N.Y.). 또한, 이는 형질감염된 세포 (예를 들어, 세포 영양요구성의 보완 또는 항생제 내성에 의해), 안정화 요소 (예를 들어, cer 서열) 또는 통합적 요소 (예를 들어, LTR 바이러스 서열 및 트랜스포존)를 선택 또는 확인하기 위해 선택 유전자를 포함할 수 있다.
본원에 사용된 바와 같은 용어 "플라스미드 백본"은 전형적으로 복제 기점 (예를 들어, 서열식별번호: 20 및 26), 및 적절한 플라스미드로 형질전환된 숙주만의 특이적 성장에 필요한 항생제 선택 유전자를 함유하는 DNA의 서열을 지칭한다. 특정 실시양태에서, 이들 요소는 rAAV 캡시드에 패키징되도록 의도되지 않는다.
본원에 사용된 바와 같은 용어 "유전자"는 폴리펩티드 쇄를 코딩하는 DNA 분자의 세그먼트 (예를 들어, 코딩 영역)를 지칭한다. 일부 실시양태에서, 유전자는 폴리펩티드 쇄를 생산하는데 관여하는 코딩 영역 (예를 들어, 조절 요소, 예컨대 프로모터, 인핸서, 폴리아데닐화 서열, 5'-비번역된 영역, 3'-비번역된 영역, 또는 인트론) 바로 앞, 뒤 및/또는 개재 영역에 의해 위치된다.
본원에 사용된 바와 같은 용어 "조절 요소"는 세포에서 코딩 서열의 발현을 제공하는 핵산 서열, 예컨대 프로모터, 인핸서, 종결자, 폴리아데닐화 서열, 인트론 등을 지칭한다.
본원에 사용된 바와 같은 용어 "프로모터 요소"는 코딩 서열의 발현 제어를 보조하는 핵산 서열을 지칭한다. 일반적으로, 프로모터 요소는 유전자의 번역 출발 부위의 5'에 위치된다. 그러나, 특정 실시양태에서, 프로모터 요소는 인트론 서열 내에, 또는 코딩 서열의 3'에 위치될 수 있다. 일부 실시양태에서, 유전자 요법에 유용한 프로모터는 표적 단백질의 천연 유전자로부터 유래된다. 일부 실시양태에서, 유전자 요법에 유용한 프로모터는 표적 유기체의 특정한 세포 또는 조직에서의 발현에 특이적이다 (예를 들어, 간-특이적 프로모터) (문헌 [Wu Z et al. Molecular Therapy 16(2):280-9], [Choi VW et al. Molecular Therapy Methods & Clinical Development 2015. 2:15022], 상기 문헌 둘 다는 의도된 모든 목적을 위해 그 전문이 본원에 포함됨). 또 다른 실시양태에서, 복수의 잘 특징화된 프로모터 요소 중 하나가 본원에 기재된 유전자 요법에 사용된다. 잘 특징화된 프로모터 요소의 비제한적인 예는 CMV 초기 프로모터 (예를 들어, hCMVie (서열식별번호: 4))), 3-액틴 프로모터, 및 메틸 CpG 결합 단백질 2 (MeCP2) 프로모터를 포함한다. 일부 실시양태에서, 프로모터는 표적 단백질의 실질적으로 일정한 발현을 구동하는 구성적 프로모터이다. 다른 실시양태에서, 프로모터는 특정한 자극 (예를 들어, 특정한 치료제 또는 작용제에 대한 노출)에 반응하여 표적 단백질의 발현을 구동하는 유도성 프로모터이다. AAV-매개 유전자 요법을 위한 프로모터 설계에 대한 검토는 문헌 [Gray et al. (Human Gene Therapy 22:1143-53 (2011))]을 참조하며, 그의 내용은 모든 목적을 위해 그 전문이 참조로 명시적으로 포함된다.
본원에 사용된 바와 같은 용어 "트랜스진"은 광범위하게 아마도 정상적으로 게놈에 존재하지 않는 서열을 갖는 유전자 또는 핵산, 주어진 게놈에 존재하지만 정상적으로 전사 및 번역 ("발현")되지 않는 유전자, 또는 게놈에 도입하고자 하는 임의의 다른 유전자 또는 핵산을 포함하나 이에 제한되지는 않는, 동물 게놈에 도입되는 임의의 핵산을 지칭한다. 이는 정상적으로 비-트랜스제닉 게놈에 존재할 수 있지만 발현이 변경되기를 원하거나 비-돌연변이된 형태 또는 변경된 또는 변이체 형태로 도입하기를 원하는 유전자를 포함할 수 있다. 트랜스진은 정의된 유전자좌로 특이적으로 표적화될 수 있거나, 염색체 내에 무작위로 통합될 수 있거나, 염색체외 복제 DNA일 수 있다. 트랜스진은 하나 이상의 전사 조절성 서열, 및 선택된 핵산의 최적 발현에 필요할 수 있는 임의의 다른 핵산, 예컨대 인트론을 포함할 수 있다. 트랜스진은 몇 개의 뉴클레오티드 길이만큼 작을 수 있지만, 바람직하게는 적어도 약 50, 100, 150, 200, 250, 300, 350, 400 또는 500개 뉴클레오티드 길이이거나 훨씬 더 길고, 예를 들어, 전체 바이러스 게놈일 수 있다. 트랜스진은 코딩 또는 비-코딩 서열, 또는 이들의 조합일 수 있다. 트랜스진은 일반적으로 적절한 조건 하에 하나 이상의 트랜스진의 발현을 구동할 수 있는 조절 요소를 포함한다.
본원에 사용된 바와 같이, 핵산 서열, 예컨대 코딩 서열 및/또는 제어 서열과 관련된 용어 "이종"은 정상적으로 함께 연결되지 않고/거나 정상적으로 특정한 세포와 회합되지 않은 서열을 나타낸다. 그러므로, "이종" 핵산 서열은 핵산 서열이 AAV 이외의 유기체로부터 유래되거나 합성적으로 유래된 것을 의미한다. 특정 실시양태에서, 이종 핵산 서열 (예를 들어, 관심 이종 유전자)은 폴리펩티드, 예컨대 응고 인자, 효소, 항체 또는 다른 관심 폴리펩티드 (이에 제한되지는 않음)를 코딩할 수 있다. 특정 실시양태에서, 이종 핵산 서열은 구조적 또는 치료적 기능을 갖는 RNA, 예컨대 안티센스, siRNA, shRNA, miRNA, EGS, gRNA, sgRNA, 리보자임 또는 압타머 (이에 제한되지는 않음)를 코딩할 수 있다. 유사하게, 세포에 정상적으로 존재하지 않는 구축물로 형질전환된 세포는 본 발명의 목적을 위해 이종으로 간주될 것이다.
"작동가능하게-연결된"은 서열 중 하나의 기능이 또 다른 서열에 의해 영향을 받도록 물리적으로 연결된 2개 이상의 핵산 서열 요소의 회합을 지칭한다. 예를 들어, 조절성 DNA 서열이 코딩 DNA 서열의 발현에 영향을 미치도록 두 서열이 위치하는 경우 (즉, 코딩 서열 또는 기능적 RNA가 프로모터의 전사 제어 하에 있음) 조절성 DNA 서열은 RNA 또는 폴리펩티드를 코딩하는 DNA 서열에 "작동가능하게 연결된" 또는 "그와 회합"된다고 한다. 코딩 서열은 센스 또는 안티센스 배향으로 조절성 서열에 작동가능하게-연결될 수 있다.
본원에 사용된 바와 같은 용어 "핵산"은 단일- 또는 이중-가닥 형태의 데옥시리보뉴클레오티드 또는 리보뉴클레오티드 및 이들의 중합체 및 이들의 보체를 지칭한다. 상기 용어는 합성, 자연 발생 및 비-자연 발생이고, 참조 핵산과 유사한 결합 특성을 갖고, 참조 뉴클레오티드와 유사한 방식으로 대사되는 공지된 뉴클레오티드 유사체 또는 변형된 백본 잔기 또는 연결을 함유하는 핵산을 포함한다. 이러한 유사체의 예는 제한 없이, 포스포로티오에이트, 포스포라미데이트, 메틸 포스포네이트, 키랄-메틸 포스포네이트, 2-O-메틸 리보뉴클레오티드, 및 펩티드-핵산 (PNA)을 포함한다.
용어 "아미노산"은 자연 발생 아미노산과 유사한 방식으로 기능하는 아미노산 유사체 및 아미노산 모방체를 비롯한, 자연 발생 및 비천연 아미노산을 지칭한다. 자연 발생 아미노산은 유전자 코드에 의해 코딩된 것, 뿐만 아니라 나중에 변형되는 아미노산, 예를 들어, 히드록시프롤린, y-카르복시글루타메이트, 및 O-포스포세린을 포함한다. 자연 발생 아미노산은 예를 들어, D- 및 L-아미노산을 포함할 수 있다. 본원에서 사용된 아미노산은 또한 비천연 아미노산을 포함할 수 있다. 아미노산 유사체는 자연 발생 아미노산과 동일한 기본 화학 구조 (즉, 수소, 카르복실기, 아미노기, 및 R 기에 결합된 임의의 탄소)를 갖는 화합물, 예를 들어, 호모세린, 노르류신, 메티오닌 술폭시드, 또는 메티오닌 메틸 술포늄을 지칭한다. 이러한 유사체는 변형된 R 기 (예를 들어, 노르류신) 또는 변형된 펩티드 백본을 갖지만, 자연 발생 아미노산과 동일한 기본 화학 구조를 유지한다. 아미노산 모방체는 아미노산의 일반적인 화학 구조와 상이한 구조를 갖지만, 자연 발생 아미노산과 유사한 방식으로 기능하는 화합물을 지칭한다. 아미노산은 본원에서 이들의 일반적으로 공지된 세 글자 기호 또는 IUPAC-IUB 생화학 명명 위원회에서 권장하는 한 글자 기호로 언급될 수 있다. 마찬가지로, 뉴클레오티드는 이들의 일반적으로 허용되는 단일-글자 코드로 언급될 수 있다.
본원에 사용된 바와 같은 용어 "유도체"는 상응하는 전장 야생형 핵산, 펩티드 또는 단백질과 비교하여 하나 이상의 돌연변이 및/또는 화학적 변형을 포함하는 핵산, 펩티드 또는 단백질 또는 그의 변이체 또는 유사체를 지칭한다. 핵산을 포함하는 화학적 변형의 비제한적인 예는 예를 들어, 염기 모이어티, 당 모이어티, 포스페이트 모이어티, 포스페이트-당 백본 또는 이들의 조합에 대한 변형을 포함한다.
본원에 기재된 플라스미드 시스템에 유용할 수 있는 돌연변이체 유전자 구축물을 코딩하는 핵산 서열은 야생형 (즉, 비돌연변이된) 서열과 동일할 수 있거나, 상이한 코딩 서열일 수 있으며, 유전자 코드의 중복성 또는 동의성의 결과로 이 서열은 야생형 코딩 서열과 동일한 폴리펩티드를 코딩한다. 관련 기술분야의 통상의 기술자는 핵산 내의 각 코돈 (일반적으로 메티오닌에 대한 유일한 코돈인 AUG, 및 일반적으로 트립토판에 대한 유일한 코돈인 TGG 제외)이 기능적으로 동일한 분자를 생성하도록 변형될 수 있음을 인식할 것이다. 따라서, 동일한 폴리펩티드를 코딩하는 핵산의 각 변이는 발현 산물과 관련하여 각 기재된 서열에 내포되어 있지만, 실제 유전자 요법 구축물과 관련해서는 아니다.
아미노산 서열과 관련하여, 관련 기술분야의 통상의 기술자는 코딩된 서열 내의 단일 아미노산 또는 작은 백분율의 아미노산을 변경, 첨가 또는 결실시키는 핵산 또는 펩티드 서열에 대한 개별 치환, 결실 또는 첨가가, 변경이 화학적으로 유사한 아미노산으로의 아미노산의 치환을 초래하는 "보존적으로 변형된 변이체"임을 인식할 것이다. 기능적으로 유사한 아미노산을 제공하는 보존적 치환 표는 관련 기술분야에 널리 공지되어 있다. 이러한 보존적으로 변형된 변이체는 본 개시내용의 다형성 변이체, 종간 상동체 및 대립유전자에 추가되고 배제되지 않는다. 기능적으로 유사한 아미노산을 제공하는 보존적 아미노산 치환은 관련 기술분야에 널리 공지되어 있다. 특정한 아미노산의 기능성, 예를 들어 촉매적, 구조적 또는 입체적으로 중요한 아미노산에 따라, 상이한 그룹의 아미노산이 서로에 대한 보존적 치환으로 간주될 수 있다.
2개 이상의 핵산 또는 펩티드 서열의 문맥에서 용어 "동일한" 또는 퍼센트 (%) "동일성"은 동일하거나 특정된 백분율의 아미노산 잔기를 갖는 2개 이상의 서열 또는 하위서열, 또는 하기 기재된 디폴트 파라미터와 함께 BLAST 또는 BLAST 2.0 서열 비교 알고리즘을 사용하여 또는 수동 정렬 및 육안 검사에 의해 측정된 바와 같이 동일한 (즉, 비교 창 또는 지정된 영역에 걸쳐 최대 상응성을 위해 비교 및 정렬된 경우 특정된 영역에 걸쳐 약 60% 동일성, 바람직하게는 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 초과의 동일성) 뉴클레오티드를 지칭한다.
관련 기술분야에 공지된 바와 같이, 단백질 (또는 하기 논의된 바와 같은 핵산)이 공지된 서열과 서열 동일성 또는 유사성을 갖는지를 확인하기 위해 수많은 상이한 프로그램이 사용될 수 있다. 서열 동일성 및/또는 유사성은 하기를 포함하나 이에 제한되지는 않는 관련 기술분야에 공지된 표준 기술을 사용하여 결정된다: 문헌 [Smith & Waterman, Adv. Appl. Math., 2:482 (1981)]의 국부 서열 동일성 알고리즘에 의해, 문헌 [Needleman & Wunsch, J. Mol. Biol., 48:443 (1970)]의 서열 동일성 정렬 알고리즘에 의해, 문헌 [Pearson & Lipman, Proc. Natl. Acad. Sci. U.S.A., 85:2444 (1988)]의 유사성 검색 방법에 의해, 이들 알고리즘의 컴퓨터화된 구현 (위스콘신 지네틱스 소프트웨어 패키지에서 GAP, BESTFIT, FASTA 및 TFASTA, 지네틱스 컴퓨터 그룹(Genetics Computer Group), 미국 위스콘신주 매디슨 사이언스 드라이브 575), 문헌 [Devereux et al., Nucl. Acid Res., 12:387-395 (1984)]에 기재된 최량 적합 서열 프로그램에 의해, 바람직하게는 디폴트 설정을 사용하여 또는 검사에 의해. 바람직하게는, 퍼센트 동일성은 하기 파라미터를 기반으로 FastDB에 의해 계산된다: 1의 미스매치 페널티; 1의 갭 페널티; 0.33의 갭 크기 페널티; 및 30의 연결 페널티, 문헌 ["Current Methods in Sequence Comparison and Analysis," Macromolecule Sequencing and Synthesis, Selected Methods and Applications, pp 127-149 (1988), Alan R. Liss, Inc], 이들 모두는 참조로 포함된다.
본 개시내용에 따르면, 관련 기술분야의 기술 내에서 통상적인 분자 생물학, 미생물학 및 재조합 DNA 기술이 사용될 수 있다. 이러한 기술은 문헌에 자세히 설명되어 있다. 예를 들어, 특히 문헌 [Sambrook, Fritsch & Maniatis, Molecular Cloning: A Laboratory Manual, Second Edition (1989) Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York] (본원에서 "Sambrook et al., 1989"); [DNA Cloning: A Practical Approach, Volumes I and II (D.N. Glover ed. 1985)]; [Oligonucleotide Synthesis (M.J. Gait ed. 1984)]; [Nucleic Acid Hybridization (B.D. Hames & S.J. Higgins eds.(1985)]; [Transcription and Translation (B.D. Hames & S.J. Higgins, eds. (1984)]; [Animal Cell Culture (R.I. Freshney, ed. (1986)]; [Immobilized Cells and Enzymes (IRL Press, (1986)]; [B. Perbal, A Practical Guide To Molecular Cloning (1984)]; [F.M. Ausubel et al. (eds.), Current Protocols in Molecular Biology, John Wiley & Sons, Inc. (1994)]을 참조한다.
본 개시내용의 플라스미드 시스템
한 측면에서, 본 개시내용은 재조합 아데노 연관 바이러스 벡터 (rAAV)를 조작 및 생산하기 위한 삼중-플라스미드 시스템을 제공한다. 특정 실시양태에서, 3개의 플라스미드 백본은 모두 동일하다. 특정 실시양태에서, 3개의 플라스미드 백본 중 적어도 하나는 상이하다. 특정 실시양태에서, 3개의 플라스미드 백본 모두가 상이하다. 특정 실시양태에서, 3개의 플라스미드 백본 모두는 완전한 AAV 게놈의 재구축을 초래할 수 있는 재조합 발생을 방지하기 위해 상이하다. 특정 실시양태에서, 3개의 플라스미드는 예를 들어 및 제한 없이, pUC19, pBR322, pUC57, pJ241 또는 pJ247에 기초한 플라스미드 백본을 포함한다. 특정 실시양태에서, 3개의 플라스미드는 pUC19, pJ241 및 pJ247에 기초한 플라스미드 백본을 포함한다.
특정 실시양태에서, 한 플라스미드는 rAAV 생산 구축물을 위한 트랜스진-함유 플라스미드로 작용하고, 제2 플라스미드는 AAV Rep-Cap 구축물로 작용하고, 제3 플라스미드는 아데노바이러스 (Ad) 헬퍼 구축물로 작용한다. 각 유형의 예시적인 플라스미드는 도 1에 제시되어 있다.
rAAV 생산을 위한 트랜스진-함유 플라스미드
rAAV 생산을 위한 트랜스진-함유 플라스미드는 AAV 게놈의 내부 부분이 발현 카세트 내에서 관심 이종 핵산 서열로 대체된 적어도 하나의 관심 이종 핵산 서열 (예를 들어, 안티센스 RNA 분자, shRNA, miRNA, 리보자임, 또는 관심 폴리펩티드를 코딩하는 유전자)을 운반하도록 조작된다. 본원에 사용된 바와 같은 "발현 카세트"는 적절한 숙주 세포 (예를 들어, 포유동물)에서 특정한 이종 핵산 서열의 발현을 지시할 수 있는 핵산 서열을 의미하며, 이는 종결 신호에 작동가능하게 연결될 수 있는 관심 핵산 서열에 작동가능하게 연결된 프로모터를 포함할 수 있다. 관심 이종 핵산 서열을 포함하는 발현 카세트는 키메라일 수 있다. 발현 카세트는 또한 자연적으로 발생하지만 이종 발현에 유용한 재조합 형태로 수득된 것일 수 있다.
특정 실시양태에서, 트랜스진-함유 플라스미드는 항생제 내성 유전자를 포함하지 않는다. 특정 실시양태에서, 트랜스진-함유 플라스미드는 암피실린 내성 유전자 (예를 들어, 서열식별번호: 71 및 73)를 포함하지 않는다. 항생제 내성 유전자는 일반적으로 플라스미드 생산을 위한 선택 마커로 사용되지만, 항생제 내성 유전자 (예를 들어, 암피실린 내성 유전자)의 포함은 안전성 문제를 유발할 수 있다. 예를 들어, 환자의 박테리아로의 수평 유전자 전이가 있을 수 있으며, 이는 유전자가 플라스미드에 존재하지 않는 경우 방지될 것이다. 항생제 내성 형질이 환경 미생물에 전파될 불필요한 위험을 회피하기 위해 (예를 들어, 암피실린) 유의한 임상 용도인 항생제를 포함하는 항생제 선택 마커의 사용을 회피하는 것이 특히 중요하다. 또한, 제약 조성물에 잔류 항생제 (예를 들어, 페니실린 및 다른 β-락탐 항생제)가 있을 수 있으므로, 환자에서 심각한 과민 반응을 일으키는 항생제에 대한 항생제 내성 유전자의 사용을 회피해야 한다.
본 발명에 따른 예시적인 트랜스진-함유 플라스미드, 또는 서열식별번호: 1, 42, 71 및 73과 적어도 약 40%, 약 50%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98% 또는 약 99% 동일성을 갖는 플라스미드는 도 2, 3a, 3b, 15a 및 15b 및 서열식별번호: 1, 42, 71 및 73에 제시되어 있다. 도 2, 3a, 3b, 15a 및 15b는 본 발명의 트랜스진-함유 플라스미드의 요소의 순서의 예를 제공한다.
서열식별번호: 71 및 73에 따른 트랜스진-함유 플라스미드는 암피실린 내성 유전자의 모든 흔적을 제거하고 또한 추가 스터퍼 서열로서 작용하는 불활성화된 겐타마이신 내성 유전자를 포함하기 때문에 유리하다 (예를 들어, 오픈 리딩 프레임으로부터 출발 코돈이 제거됨).
트랜스진-함유 플라스미드는 적어도 전사 방향으로 작동가능하게 연결된 성분, 전사 개시 영역을 포함하는 제어 요소, 관심 DNA 및 전사 종결 영역을 제공하기 위해 공지된 기술을 사용하여 구축된다. 제어 요소는 포유동물 세포에서 기능적이 되도록 선택된다. 작동가능하게 연결된 성분을 함유하는 생성된 구축물은 기능적 AAV 역위 말단 반복부 (ITR) 서열과 플랭킹된다 (5' 및 3'). 종결 신호, 예컨대 폴리아데닐화 부위가 또한 플라스미드에 포함될 수 있다.
ITR은 rAAV를 생성하기 위한 바이러스 유전자의 완전한 소화를 허용하는 패키징에 필요한 유일한 시스 요소인 것으로 나타났다. 롤링-서클 DNA 복제 메카니즘이 주로 ITR 내의 D 서열의 존재로 인해 ITR에 의해 플랭킹된 트랜스진 발현 카세트 DNA 서열을 증폭 (즉, 복제)하지만, 플라스미드 DNA 백본 (예를 들어, 복제 기점, 항생제 내성 유전자 발현 카세트 등)은 또한 플랭킹 D 서열 도메인의 부재로 인해 비록 더 낮은 빈도일지라도 벡터 캡시드에 패키징될 수 있다. AAV는 야생형 바이러스 게놈 (~4.7 kbase)과 유사하거나 더 작은 게놈 크기를 패키징하는데 효율적이다. 백본이 캡시드에 패키징되는 것이 불리한 정도로 백본의 크기를 증가시킴으로써 플라스미드 백본의 패키징을 방지할 수 있다. 백본의 확대는 추가 "스터퍼" 서열 (즉, 충전제 성분)에 의해 달성될 수 있으며, 결과적으로 야생형 AAV 게놈보다 더 큰 플라스미드 백본 크기가 생성된다. 이론에 얽매이는 것을 원하지 않지만, 확대된 플라스미드 백본의 존재는 플라스미드 백본을 벡터 캡시드에 패키징하는 rAAV의 확률을 감소시킬 수 있다고 제안된다. 일부 실시양태에서, 확대된 플라스미드 백본은 스터퍼 서열의 사용에 의해 생성된다.
특정 실시양태에서, 스터퍼 서열에는 인핸서, 프로모터, 스플라이싱 조절인자, 비코딩 RNA, 안티센스 서열 및/또는 코딩 서열 중 적어도 하나가 없다는 점에서 생물학적 활성 측면에서 침묵한다. 특정 실시양태에서, 각각의 인핸서, 프로모터, 스플라이싱 조절인자, 비코딩 RNA, 안티센스 서열 및 코딩 서열이 부재한다.
특정 실시양태에서, 스터퍼 서열은 인간 게놈에서 발견되는 불활성 인트론 DNA 서열을 포함한다. 인간 게놈으로부터의 DNA 서열을 사용함으로써, 플라스미드가 캡시드에 패키징되는 경우 스터퍼 서열이 면역 반응을 유발할 확률이 낮아질 것이다. 스터퍼 서열이 오픈 리딩 프레임을 포함하지 않는 것이 또한 중요하다.
스터퍼 서열은 플라스미드 백본이 벡터 캡시드에 패키징되지 않도록 플라스미드 백본의 크기가 rAAV의 최적 패키징 크기보다 더 클만큼 충분히 커야 한다. 스터퍼 서열은 적어도 10, 적어도 20, 적어도 30, 적어도 40, 적어도 50, 적어도 60, 적어도 70, 적어도 80, 적어도 90, 적어도 100, 적어도 200, 적어도 300, 적어도 400, 적어도 500, 적어도 600, 적어도 700, 적어도 800, 적어도 900, 적어도 1000, 적어도 2000, 적어도 3000, 적어도 4000, 적어도 5000, 적어도 6000, 적어도 7000, 적어도 8000, 적어도 9000 또는 적어도 10000개 뉴클레오티드로 이루어질 수 있다. 특정 실시양태에서, 스터퍼 서열은 1000 내지 5000개 뉴클레오티드 길이의 핵산을 포함한다. 특정 실시양태에서, 스터퍼 서열은 1000 내지 2000개 뉴클레오티드 길이의 핵산을 포함한다. 특정 실시양태에서, 스터퍼 서열은 800 내지 1500개 뉴클레오티드 길이의 핵산을 포함한다. 특정 실시양태에서, 스터퍼 서열은 800 내지 1000개 뉴클레오티드 길이의 핵산을 포함한다.
바람직한 실시양태에서, 스터퍼 서열은 인간 GAPDH 인트론 2 (NG007073.2)를 포함한다. 이론에 얽매이는 것을 원하지 않지만, 인간 GAPDH 인트론 2의 사용은 이미 인간 게놈에 존재하기 때문에 더 낮은 면역원성을 가지며, 그러므로 우연히 패키징된 경우 면역 반응을 유발하지 않아야 한다. GAPDH 인트론 2는 단일 자연 발생 서열이므로 스터퍼 서열로서 이상적이다. 임의의 추가 뉴클레오티드를 포함하거나 1개 초과의 서열을 함께 연결할 필요가 없으며, 이는 DNA 서열의 비자연적인 부벽을 초래할 것이다.
특정 실시양태에서, 스터퍼 서열은 서열식별번호: 9 또는 그의 단편과 적어도 약 40%, 약 50%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98% 또는 약 99% 동일성을 갖는 핵산을 포함하거나 이로 이루어지거나 이로 본질적으로 이루어진다. 특정 실시양태에서, 스터퍼 서열은 서열식별번호: 9 또는 그의 단편을 포함하거나 이로 이루어지거나 이로 본질적으로 이루어진다.
특정 실시양태에서, 스터퍼 서열은 불활성화된 겐타마이신 유전자를 포함한다. 특정 실시양태에서, 겐타마이신 유전자는 발현되지 않도록 변형된다. 예를 들어, 출발 코돈은 제거될 수 있다.
특정 실시양태에서, 스터퍼 서열은 서열식별번호: 72 또는 그의 단편과 적어도 약 40%, 약 50%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98% 또는 약 99% 동일성을 갖는 핵산을 포함하거나 이로 이루어지거나 이로 본질적으로 이루어진다. 특정 실시양태에서, 스터퍼 서열은 서열식별번호: 72 또는 그의 비기능적 단편을 포함하거나 이로 이루어지거나 이로 본질적으로 이루어진다.
트랜스진-함유 플라스미드는 임의의 다양한 AAV 혈청형으로부터 ITR을 사용하여 구축될 수 있다. 이들 ITR은 염기 쌍형성하여 상보적 DNA 가닥의 합성을 허용한다. ITR은 이러한 플라스미드에서 기능을 유지하여 관심 이종 핵산 서열을 함유하는 rAAV의 복제 및 패키징을 허용한다. AAV 플라스미드의 말단 반복 서열 내의 돌연변이는 기능적 AAV 벡터의 생성에서 잘 용인된다. 예를 들어, 문헌 [Samulski et al., 1983]; [Muzyczka et al., 1984]; 및 미국 특허 번호 9,163,259를 참조하며, 이들은 모든 목적을 위해 그 전문이 본원에 포함된다. 2개의 ITR 중 하나가 결실된 플라스미드조차도, 구축물 내의 기존 ITR이 전체 AAV ITR 서열을 함유하는 한, AAV 서열은 구조되고, 복제되고, 감염성 비리온을 생산할 수 있다.
AAV ITR 영역의 핵산 서열은 공지되어 있다. ITR은 야생형 핵산 서열을 가질 필요는 없지만, 예를 들어, 뉴클레오티드의 삽입, 결실 또는 치환에 의해 변경될 수 있다. 추가로, AAV ITR은 제한 없이, AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, 또는 그의 키메라를 포함하는 여러 AAV 혈청형 중 임의의 것으로부터 유래될 수 있다. 더욱이, AAV 벡터에서 선택된 핵산 서열을 플랭킹하는 5' 및 3' ITR은 의도된 바와 같이 기능하는 한, 즉, 숙주 세포 게놈으로부터의 관심 서열의 절제 및 구조를 허용하기 위해 반드시 동일하거나 동일한 AAV 혈청형 또는 단리물로부터 유래할 필요는 없다. 이 문서에 기재된 rAAV의 5' ITR 서열의 예로서 서열식별번호: 2 및 43이 사용되지만, 말단 분해 부위를 운반하는 임의의 5' ITR 서열은 동일한 기능성을 갖는 벡터를 생산할 것으로 예상된다. 마찬가지로, 이 문서에 기재된 rAAV의 3' ITR 서열의 예로서 서열식별번호: 3이 사용되지만, 말단 분해 부위를 운반하는 임의의 3' ITR 서열은 동일한 기능성을 갖는 벡터를 생산할 것으로 예상된다.
특정 실시양태에서, 5' ITR 서열은 서열식별번호: 2 또는 서열식별번호 43 또는 그의 기능적 단편 또는 유도체와 적어도 약 40%, 약 50%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98% 또는 약 99% 동일성을 갖는 핵산을 포함하거나 이로 이루어지거나 이로 본질적으로 이루어진다. 특정 실시양태에서, 5' ITR은 서열식별번호: 2 또는 서열식별번호 43, 또는 그의 기능적 단편 또는 유도체를 포함하거나 이로 이루어지거나 이로 본질적으로 이루어진다.
특정 실시양태에서, 3' ITR 서열은 서열식별번호: 3 또는 그의 기능적 단편 또는 유도체와 적어도 약 40%, 약 50%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98% 또는 약 99% 동일성을 갖는 핵산을 포함하거나 이로 이루어지거나 이로 본질적으로 이루어진다. 특정 실시양태에서, 3' ITR은 서열식별번호: 3, 또는 그의 기능적 단편 또는 유도체를 포함하거나 이로 이루어지거나 이로 본질적으로 이루어진다.
특정 실시양태에서, 상기 기재된 바와 같은 스터퍼 서열을 포함하는 트랜스진-함유 플라스미드는 발현 카세트에 작동가능하게 연결된다.
특정 실시양태에서, 발현 카세트는 프로모터를 포함한다. 특정 실시양태에서, 적어도 하나의 이종 핵산 서열 (예를 들어, 관심 이종 유전자)은 이종 핵산 서열이 적절한 또는 바람직한 조건 하에 환자의 표적 세포에서 발현될 수 있도록 pol II 프로모터 (구성적, 세포-특이적 또는 유도성)에 작동가능하게 연결된다. 구성적, 세포-특이적 및 유도성 프로모터의 수많은 예가 관련 기술분야에 공지되어 있으며, 통상의 기술자는 특정 의도된 용도를 위한 프로모터, 예를 들어, 근육 세포-특이적 발현을 위한 근육-특이적 골격 α-액틴 프로모터 또는 근육-특이적 크레아틴 키나제 프로모터/인핸서의 선택, 강한 수준의 연속적 또는 거의 연속적 발현을 위한 구성적 CMV 프로모터 (예를 들어, hCMVie (서열식별번호: 4))의 선택, 또는 유도된 발현을 위한 유도성 엑디손 프로모터의 선택을 쉽게 선택할 수 있다. 유도된 발현은 관련 기술분야의 통상의 기술자가 합성되는 단백질의 양을 제어할 수 있도록 한다. 이러한 방식으로, 치료용 산물의 농도를 변경할 수 있다. 널리 공지된 유도성 프로모터의 다른 예는 하기와 같다: 스테로이드 프로모터 (예를 들어, 에스트로겐 및 안드로겐 프로모터) 및 메탈로티오네인 프로모터. 특정 실시양태에서, 프로모터는 pol III 프로모터이다. 특정 실시양태에서, 프로모터는 U6 프로모터이다. 특정 실시양태에서, 프로모터는 H1 프로모터이다. 특정 실시양태에서, 유전자 발현 카세트는 프로모터가 없다.
특정 실시양태에서, 트랜스진-함유 플라스미드는 멀티시스트론이며, 즉, 1개 초과의 유전자를 운반한다. 발현되는 각 유전자에 대해 고유한 mRNA 전사체를 생성할 프로모터와 달리, 멀티시스트론 플라스미드는 동일한 mRNA로부터 2개 이상의 별도의 단백질을 동시에 발현한다. 이러한 경우, 다중 유전자는 각 유전자에 대한 별도의 번역을 허용하는 요소 (예를 들어, 내부 리보솜 진입 부위 (IRES) 또는 2A 펩티드)에 의해 분리된다.
이 문서에 기재된 rAAV의 IRES 서열의 예로서 서열식별번호: 6이 사용되지만, 말단 분해 부위를 운반하는 임의의 5' ITR 서열은 동일한 기능성을 갖는 벡터를 생산할 것으로 예상된다.
IRES는 또 다른 리보솜 동원 부위로서 작용함으로써 mRNA의 내부 영역으로부터 번역의 개시를 허용한다. 특정 실시양태에서, IRES 서열은 서열식별번호: 6 또는 그의 기능적 단편 또는 유도체와 적어도 약 40%, 약 50%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98% 또는 약 99% 동일성을 갖는 핵산을 포함하거나 이로 이루어지거나 이로 본질적으로 이루어진다. 특정 실시양태에서, IRES는 서열식별번호: 6 또는 그의 기능적 단편 또는 유도체를 포함하거나 이로 이루어지거나 이로 본질적으로 이루어진다.
특정 실시양태에서, 트랜스진-함유 플라스미드는 2A 펩티드를 코딩한다. IRES 요소의 일부 단점을 극복하기 위해 2A 펩티드 (하기 표 1의 비제한적인 예 참조)가 생성되었다. 특히 2A 펩티드는 리보솜이 2A 요소의 C-말단에서 펩티드 결합의 합성을 건너뛰게 하여 2A 서열의 말단 및 다음 펩티드 하류 사이에 분리를 유발함으로써 이들 펩티드가 기능하는 것으로 생각된다는 점에서 "자가-절단"이다. "절단"은 C-말단에서 발견되는 글리신 및 프롤린 잔기 사이에 발생하며, 이는 상류 시스트론은 말단에 첨가된 몇 개의 추가 잔기를 갖는 반면, 하류 시스트론은 프롤린으로 시작될 것임을 의미한다. 2A 절단은 진핵 세포에서 보편적이며, 일부 과학자들은 거의 100% 절단을 보고한다. 특이적 2A 펩티드의 선택은 궁극적으로 수많은 인자, 예컨대 세포 유형 또는 실험 조건에 따라 달라질 것이며, 통상의 기술자는 어느 것을 선택할지를 이해할 것이다.
표 1 4개의 공통 2A 펩티드의 예.
* (GSG) 잔기는 절단 효율을 개선하기 위해 펩티드의 5' 말단에 첨가될 수 있다.
한 실시양태에서, 플라스미드는 AAV로부터의 5' 및 3' ITR을 포함하며, 여기서 ITR은 적어도 하나의 유전자를 둘러싼다. 특정 실시양태에서, 스터퍼 서열은 3' ITR의 하류에 위치된다. 특정 실시양태에서, 스터퍼 서열은 5' ITR의 상류에 있다. ITR은 AAV 혈청형 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10 및/또는 AAV11, 또는 그의 키메라로부터 유래될 수 있다. 특정 실시양태에서, ITR은 AAV 혈청형 AAV2 및/또는 AAV5로부터 유래된다. 특정 실시양태에서, ITR은 서열식별번호: 2, 3, 또는 43, 또는 그의 기능적 단편 또는 유도체일 수 있다. 일부 실시양태에서, 유전자는 예를 들어 및 제한 없이 eGFP (예를 들어, 서열식별번호: 5) 및/또는 SEAP (예를 들어, 서열식별번호: 7)와 같은 리포터 유전자이다. 일부 실시양태에서, 스터퍼 서열은 GAPDH 인트론 2 또는 그의 단편 또는 변이체이다. 일부 실시양태에서, 스터퍼 서열은 서열식별번호: 9 또는 그의 단편이다. ssAAV (도 3a) 및 scAAV (도 3b) rAAV를 생성하기 위해 플라스미드에서 사용하기 위한 예시적인 유전자 구축물이 도 3에 제시되어 있다.
Rep-Cap 플라스미드
제2 플라스미드는 AAV 복제 (Rep) 및 캡시드 (Cap) 유전자 서열을 포함한다. AAV Rep-Cap 플라스미드는 주요 AAV 유전자 오픈 리딩 프레임 (ORF), Rep 유전자 및 Cap 유전자 둘 다를 포함한다. Rep 단백질은 특히 DNA 복제의 AAV 기점의 인식, 결합 및 니킹; DNA 헬리카제 활성; 및 AAV (또는 다른 이종) 프로모터로부터의 전사 조정을 포함하는 많은 기능을 보유하는 것으로 나타났다. Cap 단백질은 필요한 패키징 기능을 공급하고 바이러스 캡시드 쉘에 어셈블리한다. AAV 헬퍼 기능은 본원에서 AAV 벡터로부터 누락된 트랜스에서 AAV 기능을 보완하기 위해 사용된다. Rep 및 Cap 유전자는 번역되어 다중 별개의 단백질 (Rep78, Rep68, Rep52, Rep40 - AAV 수명 주기에 필요함; VP1, VP2, VP3 - 캡시드 단백질)을 생산한다. Rep 및/또는 Cap 유전자는 AAV 혈청형 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10 및/또는 AAV11, 또는 그의 키메라로부터 유래될 수 있다. 특정 실시양태에서, AAV Rep 및/또는 Cap 유전자는 유전자 조작된 AAV 및/또는 화학적으로 변형된 AAV를 코딩한다. 예를 들어, 모든 의도된 목적을 위해 본원에 참조로 포함된 U.S. 7,259,151에 인용된 것과 같이 더 적은 면역원성이 되도록 돌연변이된 AAV 비리온을 참조한다. AAV 혈청형의 선택은 AAV 혈청형의 향성에 대해 선택될 수 있다. 하기 표 2는 가장 널리 사용되는 AAV 혈청형의 향성의 예를 제한 없이 제공한다. AAV의 향성은 또한 슈도타이핑 (즉, 상이한 바이러스 혈청형으로부터의 ITR로부터 캡시드 및 게놈의 혼합)을 통해 변형될 수 있다. 이들 혈청형은 슬래시를 사용하여 표시되므로, AAV2/5는 혈청형 5로부터의 캡시드에 패키징된 혈청형 2의 ITR을 운반하는 게놈을 함유하는 바이러스를 나타낸다. 이들 슈도타이핑된 바이러스의 사용은 형질도입 효율을 개선할 수 있을 뿐만 아니라 향성을 변경시킬 수 있다. 예를 들어, AAV2에 의해 효율적으로 형질도입되지 않은 뉴런은 AAV2/5를 사용할 수 있으며, 이는 뇌에 더 널리 분포되어 있으며 개선된 형질도입 효율을 갖는 것으로 나타났다. 또한 다중 상이한 혈청형으로부터 유래된 하이브리드 캡시드를 사용할 수 있으며, 이는 또한 바이러스 향성을 변경시킨다. 예를 들어, 8개의 혈청형으로부터 유래된 하이브리드 캡시드를 함유하는 AAV-DJ는 임의의 야생형 혈청형보다 시험관내에서 더 높은 형질도입 효율을 나타내며; 생체내에서 광범위한 범위의 세포 유형에 걸쳐 매우 높은 감염성을 나타낸다. 돌연변이체 AAV-DJ8은 AAV-DJ의 특성을 나타내지만 향상된 뇌 흡수를 나타낸다. 수많은 AAV 헬퍼 플라스미드, 예컨대 Rep 및 Cap 유전자 발현 산물 둘 다를 코딩하는 일반적으로 사용되는 플라스미드 pAAV/Ad 및 pIM29+45가 기재된 바 있다. 예를 들어, 문헌 [Samulski et al. (1989) J. Virol. 63:3822-3828]; 및 [McCarty et al. (1991) J. Virol. 65:2936-2945] 및 미국 특허 번호 5,139,941; 6,001,650; 6,376,237; 7,259,151을 참조하며, 이들 각각은 모든 목적을 위해 그 전문이 본원에 참조로 포함된다.
표 2 AAV 혈청형의 조직 향성
본 발명에 따른 예시적인 Rep-Cap 플라스미드, 또는 서열식별번호: 24, 31, 33, 35, 37, 41, 59 또는 60과 적어도 약 40%, 약 50%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98% 또는 약 99% 동일성을 갖는 플라스미드는 도 4a, 4b, 14a 및 14b; 및 서열식별번호: 24, 31, 33, 35, 37, 41, 59 및 60에 제시되어 있다. 도 4a, 4b, 14a 및 14b는 본 발명의 AAV Rep-Cap 플라스미드의 플라스미드에서 요소 순서의 예를 제공한다.
특정 실시양태에서, Rep 유전자는 AAV 혈청형 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10 및/또는 AAV11, 또는 그의 키메라로부터 유래될 수 있다. 특정 실시양태에서, AAV Rep 유전자는 유전자 조작된 AAV 및/또는 화학적으로 변형된 AAV이다. 특정 실시양태에서, Rep 유전자는 AAV 혈청형 2 (Rep2) 및/또는 Rep5로부터의 유전자를 포함하며, 이는 키메라 (예를 들어, AAV Rep2/5)를 포함한다.
특정 실시양태에서, Cap 유전자는 AAV 혈청형 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10 및/또는 AAV11, 또는 그의 키메라로부터 유래될 수 있다. 특정 실시양태에서, AAV Cap 유전자는 유전자 조작된 AAV 및/또는 화학적으로 변형된 AAV이다. 전술한 실시양태 중 임의의 것에서, Cap 유전자는 Rep 유전자와 동일한 AAV 혈청형 또는 Rep 유전자와 상이한 AAV 혈청형으로부터 유래될 수 있다. 전술한 실시양태 중 임의의 것에서, 플라스미드는 상기 혈청형으로부터의 Cap 단백질의 하이브리드를 포함하는 키메라 단백질을 포함하는 AAV 혈청형 2, 5, 8 및/또는 9 중 임의의 것으로부터의 Cap 유전자 (각각 Cap2, Cap5, Cap8 및 Cap9)를 추가로 포함한다.
특정 실시양태에서, Rep-Cap 플라스미드는 AAV 혈청형 2로부터의 Rep 유전자 서열 및 1개 초과의 혈청형으로부터 조합된 키메라 Rep 단백질, 예를 들어 Rep2/5로서, 및 AAV2, AAV5, AAV8 및/또는 AAV9를 포함하는 임의의 AAV 캡시드 혈청형으로부터의 캡시드 유전자 서열을 포함하나 이에 제한되지는 않는다.
특정 실시양태에서, Rep 유전자 서열은 서열식별번호: 11, 12, 28 또는 30, 또는 그의 기능적 단편 또는 유도체와 적어도 약 40%, 약 50%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98% 또는 약 99% 동일성을 갖는 핵산을 포함하거나 이로 이루어지거나 이로 본질적으로 이루어진다. 특정 실시양태에서, Rep 유전자 서열은 서열식별번호: 11, 12, 28 또는 30, 또는 그의 기능적 단편 또는 유도체를 포함하거나 이로 이루어지거나 이로 본질적으로 이루어진다.
특정 실시양태에서, Cap 유전자 서열은 서열식별번호: 13, 29, 32 또는 36, 또는 그의 기능적 단편 또는 유도체와 적어도 약 40%, 약 50%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98% 또는 약 99% 동일성을 갖는 핵산을 포함하거나 이로 이루어지거나 이로 본질적으로 이루어진다. 특정 실시양태에서, Cap 유전자 서열은 서열식별번호: 13, 29, 32 또는 36, 또는 그의 기능적 단편 또는 유도체를 포함하거나 이로 이루어지거나 이로 본질적으로 이루어진다.
특정 실시양태에서, 프로모터 서열은 서열식별번호: 34, 또는 그의 기능적 단편 또는 유도체와 적어도 약 40%, 약 50%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98% 또는 약 99% 동일성을 갖는 핵산을 포함하거나 이로 이루어지거나 이로 본질적으로 이루어진다. 특정 실시양태에서, 프로모터 서열은 서열식별번호: 34, 또는 그의 기능적 단편 또는 유도체를 포함하거나 이로 이루어지거나 이로 본질적으로 이루어진다.
한 실시양태에서, Rep-Cap 플라스미드는 본원에 기재된 AAV Rep 및 Cap 단백질의 발현을 제어하기 위해 AAV 프로모터를 추가로 포함한다. 프로모터는 공지된 고려사항, 예컨대 프로모터에 기능적으로 연결된 핵산의 발현 수준 및 벡터가 사용될 세포 유형에 의해 선택된 임의의 원하는 프로모터일 수 있다. 즉, 프로모터는 조직/세포-특이적일 수 있다. 프로모터는 원핵, 진핵, 진균, 핵, 미토콘드리아, 바이러스 또는 식물 프로모터일 수 있다. 프로모터는 벡터에 의해 형질도입되는 세포 유형에 대해 외인성 또는 내인성일 수 있다. 프로모터는 예를 들어, 박테리아 프로모터, 공지된 강한 프로모터, 예컨대 SV40 또는 유도성 메탈로티오네인 프로모터, 또는 AAV 프로모터, 예컨대 AAV P5 프로모터를 포함할 수 있다. 추가적으로, 표적화된 유전자 발현을 위한 키메라 조절성 프로모터가 사용될 수 있다. 관련 기술분야에 공지된 이들 조절 시스템의 예는 에스케리키아 콜라이의 tet 레프레서에 융합된 VPl 6 활성화 도메인을 함유하는 키메라 단백질인 tet 전사활성화제 단백질 (tTA)을 이용하는 테트라사이클린 기반 조절 시스템, EPTG 기반 조절 시스템, CID 기반 조절 시스템, 및 엑디손 기반 조절 시스템을 포함한다. 다른 프로모터는 액틴 유전자, 면역글로불린 유전자, 사이토메갈로바이러스 (CMV) (예를 들어, hCMVie (서열식별번호: 4), 아데노바이러스, 소 유두종 바이러스, 아데노바이러스 프로모터, 예컨대 아데노바이러스 주요 후기 프로모터, 유도성 열충격 프로모터, 호흡기 세포융합 바이러스, 라우스 육종 바이러스 (RSV) 등으로부터 유래된 프로모터를 포함한다. 프로모터는 임의의 AAV 혈청형의 프로모터일 수 있으며, pl9 프로모터 또는 p40 프로모터일 수 있다. 특정 실시양태에서, 프로모터는 AAV2 P5 프로모터 또는 AAV5 P5 프로모터 또는 AAV P5 프로모터일 수 있다. 더욱이, 프로모터 활성을 유지하는 P5 프로모터의 더 작은 단편은 예를 들어, P5 프로모터에서 일련의 결실을 구축하고, 결실을 리포터 유전자에 연결하고, 리포터 유전자가 발현 (즉, 전사 및/또는 번역)되는지 여부를 결정하는 것을 포함하는 표준 절차에 의해 쉽게 결정될 수 있다. 잠재적인 프로모터의 예는 모든 의도된 목적을 위해 본원에 참조로 포함된 WO2005017101에서 찾을 수 있다. 특정 실시양태에서, AAV 프로모터는 AAV 혈청형 2로부터 유래된다. AAV2 프로모터 P5를 포함하는 예시적인 P5-Rep-Cap 플라스미드는 도 4b 및 14b 및 서열식별번호: 34에 제시되어 있다.
Rep-Cap 플라스미드에 적합한 플라스미드 백본은 pHLP19, pUC18, pUC19 및 pAAV-RC2를 포함하나 이에 제한되지는 않으며, 또한 미국 특허 번호 6,001,650 및 6,156,303에 기재된 플라스미드 백본을 참조하며, 둘 다는 모든 목적을 위해 그 전문이 본원에 참조로 포함된다. 특정 실시양태에서, Rep-Cap 플라스미드 백본은 pUC19이다.
Ad 헬퍼 플라스미드
한 실시양태에서, Ad 헬퍼 플라스미드는 Ad2 및/또는 Ad5를 포함하나 이에 제한되지는 않는 아데노바이러스 유전자를 포함한다. 한 실시양태에서, Ad 헬퍼 플라스미드는 Ad5 유전자를 포함한다. Ad5가 rAAV에 대한 효율적인 헬퍼 바이러스이기 때문에 Ad5 유전자 서열이 사용된다. 헬퍼 기능을 위해 아데노바이러스 유전자의 완전한-보체가 필요하지 않다는 것이 공지되어 있다. 실제로, 완전한 보체를 갖지 않는 것이 더 바람직하다. 예를 들어, DNA 복제 및 후기 유전자 합성이 불가능한 아데노바이러스 돌연변이체는 AAV 복제를 허용하는 것으로 나타났다. 문헌 [Ito et al., (1970) J. Gen. Virol. 9: 243; Ishibashi et al., (1971) Virology 45: 317]. 그러므로, Ad 헬퍼 플라스미드는 rAAV 생산에 필요한 필수 Ad 유전자만을 운반하고 감소된 플라스미드 크기 구축물로서 역할을 하도록 최소 크기로 설계된다. E1 영역에 결손이 있거나 결실된 E4 영역을 갖는 아데노바이러스는 AAV 복제를 지원할 수 없는 것으로 나타났다. 그러므로, E1A 및/또는 E4 영역은 직접적으로 또는 간접적으로 AAV 복제에 필수적일 가능성이 있다. 문헌 [Laughlin et al., (1982) J. Virol. 41: 868; Janik et al., (1981) Proc. Natl. Acad. Sci. USA 78: 1925; Carter et al., (1983) Virology 126: 505]. 다른 특징화된 Ad 돌연변이체는 하기를 포함한다: E1B (Laughlin et al. (1982), supra; Janik et al. (1981), supra; Ostrove et al., (1980) Virology 104: 502); E2A (Handa et al., (1975) J. Gen. Virol. 29: 239; Strauss et al., (1976) J. Virol. 17: 140; Myers et al., (1980) J. Virol. 35: 665; Jay et al., (1981) Proc. Natl. Acad. Sci. USA 78: 2927; Myers et al., (1981) J. Biol. Chem. 256: 567); E2B (Carter, Adeno-Associated Virus Helper Functions, in I CRC Handbook of Parvoviruses (P. Tijssen ed., 1990)); E3 (Carter et al. (1983), supra); and E4 (Carter et al. (1983), supra; Carter (1995)). E1B 코딩 영역에 돌연변이를 갖는 아데노바이러스에 의해 제공되는 보조 기능의 연구는 상충되는 결과를 생성하였지만, 문헌 [Samulski et al., (1988) J. Virol. 62: 206-210]은 최근에 E1B55k는 AAV 비리온 생산에 필요하지만 E1B19k는 필요하지 않다고 보고하였다. 또한, 국제 공개 WO 97/17458 및 문헌 [Matshushita et al., (1998) Gene Therapy 5: 938-945]은 다양한 Ad 유전자를 코딩하는 보조 단백질을 설명한다. 특히 바람직한 보조 기능 플라스미드는 아데노바이러스 VA RNA 코딩 영역, 아데노바이러스 E4 ORF6 코딩 영역, 아데노바이러스 E2A 72 kD 코딩 영역, 아데노바이러스 E1A 코딩 영역, 및 무손상 E1B55k 코딩 영역이 결여된 아데노바이러스 E1B 영역을 포함한다. 이들 플라스미드의 예는 국제 공개 번호 WO 01/83797에 기재되어 있다. 이 단락에서 인용된 각 참고문헌은 모든 목적을 위해 그 전문이 본원에 참조로 포함된다.
본 발명에 따른 예시적인 Ad 헬퍼 플라스미드, 또는 서열식별번호: 14 및 15와 적어도 약 40%, 약 50%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98% 또는 약 99% 동일성을 갖는 플라스미드는 도 5 및 서열식별번호: 14 및 15에 제시되어 있다. 도 5는 본 발명의 Ad 헬퍼 플라스미드의 플라스미드에서 요소의 순서의 예를 제공한다.
특정 실시양태에서, Ad 헬퍼 플라스미드는 E2a, E4 (orf6), VA1 RNA 유전자 및 파르보바이러스 VP 캡시드 유전자 단위에 대한 아데노바이러스 유전자 서열을 제한 없이 포함할 수 있다. 특정 실시양태에서, Ad 헬퍼 플라스미드는 VA, E4 및 E2A 유전자를 포함할 수 있다. rAAV 생산을 위해 얼마나 많은 플라스미드를 세포에 효율적으로 형질감염시킬 수 있는지에 대한 제한이 있기 때문에, 이들 Ad 유전자를 운반하는 감소된 크기의 플라스미드를 갖는 것은 형질감염에 사용된 3개의 플라스미드 모두의 몰 함량을 증가시키는데 도움이 될 수 있으므로, rAAV를 더 높은 수율로 생산할 확률을 증가시킨다.
한 실시양태에서, Ad 헬퍼 플라스미드는 E2A, E4 ORF 1, 2, 3, 4 및 6/7, 및 VA ("짧은 Ad 헬퍼 플라스미드")를 포함한다. 예시적인 짧은 Ad 헬퍼 플라스미드는 도 5의 상단 패널에 제시되어 있다. 본원에 기재된 더 짧은 플라스미드는 형질감염 단계 동안 "플라스미드 부하"를 감소시켜 3개의 플라스미드 모두의 플라스미드의 전체 카피 수가 증가되어 rAAV 생산을 위한 유전자 발현 및 복제를 위한 더 많은 수의 플라스미드 주형을 제공할 수 있다. 감소된 플라스미드 부하는 놀랍게도 더 큰 배치에 유용하다. 이는 소규모 연구 생산에서 중요한 파라미터가 아닐 수 있지만, 규모 확장 시 훨씬 더 중요할 수 있다. 이러한 예시적인 짧은 Ad 헬퍼 플라스미드는 대략 12 kb이다. 또 다른 실시양태에서, Ad 헬퍼 플라스미드는 E2A, E4 ORF 1, 2, 3, 4 및 6/7, 및 VA, 뿐만 아니라 프로테아제 및 섬유 및 프로모터 pVIII을 코딩하는 유전자를 포함한다 ("긴 Ad 헬퍼 플라스미드"). 예시적인 긴 Ad 헬퍼 플라스미드는 도 5의 하단 패널에 제시되어 있다. 이러한 예시적인 긴 Ad 헬퍼 플라스미드는 대략 18 kb이다.
짧은 구축물 및 긴 구축물 간의 차이는 도 5에 제시되어 있다. 3개의 필수 유전자 요소의 배향은 상이하다. 긴 버전은 rAAV 생산에 영향을 미치는 기능을 가질 수 있는 아데노바이러스 게놈으로부터의 추가 요소를 운반한다. 짧은 버전은 rAAV 생산을 지원할 수 있는 것으로 공지된 최소 유전자 서열을 함유한다.
특정 실시양태에서, VA 서열은 서열식별번호: 16 또는 48-50, 또는 그의 기능적 단편 또는 유도체와 적어도 약 40%, 약 50%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98% 또는 약 99% 동일성을 갖는 핵산을 포함하거나 이로 이루어지거나 이로 본질적으로 이루어진다. 특정 실시양태에서, VA 서열은 서열식별번호: 16 또는 48-50, 또는 그의 기능적 단편 또는 유도체를 포함하거나 이로 이루어지거나 이로 본질적으로 이루어진다.
특정 실시양태에서, E4 서열은 서열식별번호: 17, 40, 47, 또는 55-58, 또는 그의 기능적 단편 또는 유도체와 적어도 약 40%, 약 50%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98% 또는 약 99% 동일성을 갖는 핵산을 포함하거나 이로 이루어지거나 이로 본질적으로 이루어진다. 특정 실시양태에서, E4 서열은 서열식별번호: 17, 40, 47, 또는 55-58, 또는 그의 기능적 단편 또는 유도체를 포함하거나 이로 이루어지거나 이로 본질적으로 이루어진다.
특정 실시양태에서, E2A 서열은 서열식별번호: 18, 39, 46 또는 51, 또는 그의 기능적 단편 또는 유도체와 적어도 약 40%, 약 50%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98% 또는 약 99% 동일성을 갖는 핵산을 포함하거나 이로 이루어지거나 이로 본질적으로 이루어진다. 특정 실시양태에서, E2A 서열은 서열식별번호: 18, 39, 46 또는 51, 또는 그의 기능적 단편 또는 유도체를 포함하거나 이로 이루어지거나 이로 본질적으로 이루어진다.
Ad 헬퍼 플라스미드에 적합한 플라스미드는 pJ241을 포함하나 이에 제한되지는 않으며, 또한 미국 특허 번호 6,001,650 및 6,156,303에 기재된 플라스미드를 참조하며, 둘 다의 전문은 본원에 참조로 포함된다. 특정 실시양태에서, Ad 헬퍼 플라스미드 백본은 pUC57이다.
추가 유전자
추가 실시양태에서, 3개의 플라스미드 모두는 선택 마커를 함유한다. 선택 마커의 예는 G418 (neor 포함), 퓨로마이신 (puror 포함), 히그로마이신 B (hygr 포함), 블라스티시딘 S (bsrr 포함), 미코페놀산 및 6-티오(구아닌) (gpt 포함) 및 간시클로비르 또는 1 (2'-데옥시-2'-플루오로-베타-D-아라비노푸라노실)-5-아이오도우라실 (FIAU) (HSV-tk 포함), 겐타마이신, 및/또는 카나마이신 (kanr 포함)을 포함하나 이에 제한되지는 않는 약물 내성 유전자와 같은 양성 선택 마커를 포함하나 이에 제한되지는 않는다. 추가 실시양태에서, 모든 3개의 플라스미드 상의 약물 선택 마커는 카나마이신이다. 특정 실시양태에서, 카나마이신 유전자는 서열식별번호: 19 또는 25, 또는 그의 기능적 단편 또는 유도체를 포함하거나 이로 이루어진다. 특정 실시양태에서, 겐타마이신 유전자는 서열식별번호: 44 또는 72, 또는 그의 기능적 단편 또는 유도체를 포함하거나 이로 이루어진다.
한 실시양태에서, 3개의 플라스미드 중 하나 이상은 하나 이상의 리포터 유전자를 운반한다. 여러 리포터 유전자가 관련 기술분야에 공지되어 있으며, 일부는 상업적으로 이용가능하다 (문헌 [Alam and Cook, supra] 참조). 리포터 유전자는 유기체 및 분자 생물학 조작에 특히 적합한 플라스미드 내에 삽입될 수 있다. 리포터 유전자의 발현이 프로모터의 제어 하에 있도록 관심 프로모터를 클로닝 부위에 삽입할 수 있다 (문헌 [Rosenthal, N., Methods Enzymol. 152: 704-720 (1987)]; 및 [Shiau, A. and Smith, J. M., Gene 67: 295-299 (1988)] 참조). 이들 플라스미드를 세포 유형 또는 전체 유기체에 도입하기 위해 공지된 방법이 사용된다 (문헌 [Sambrook et al., Molecular Biology, A Laboratory Manual, Cold Spring Harbor Laboratory Press (1989)]; 및 [Nolan, In: Molecular Cloning, Cold Spring Harbor Laboratory Press, (1989)] 참조). 리포터 유전자의 예는 제한 없이, β-갈락토시다제 (LacZ), 반딧불이 루시페라제, 레닐라 루시페라제, 가우시아 루시페라제, 클로람페니콜 아세틸트랜스퍼라제 (CAT), 분비된 배아 알칼리성 포스파타제 (SEAP), 시안 형광 단백질 (CFP), 그린 형광 단백질 (GFP), 향상된 GFP (eGFP), 옐로우 형광 단백질 (YFP), 향상된 YFP (eYFP), 블루 형광 단백질 (BFP), 향상된 BFP (eBFP), 디스코소마 코랄(Discosoma coral)로부터의 레드 형광 단백질 (DsRed), 및/또는 MmGFP (Zemicka-Goetz et al. (1997) Development 124: 1133-1137) 또는 관련 기술분야의 통상의 기술자에게 친숙한 다른 것들을 포함한다. 또 다른 실시양태에서, 3개의 플라스미드 중 하나 이상은 eGFP 및 SEAP 둘 다를 포함하는 리포터 구축물을 운반하며, 내부 리보솜 진입 부위 (IRES)는 eGFP 및 SEAP 사이에 위치된다. 이러한 실시양태에서, 핵에 편재화된 eGFP는 rAAV의 벡터 형질도입 향성을 결정하는데 사용될 수 있는 반면, 세포 외부에서 분비되는 SEAP는 시험관내 설정에서 배양 배지에서 또는 생체내 설정에서 대상체의 혈류에서 형질도입 효율의 정량적 측정을 허용할 수 있다. LacZ는 클로닝된 유전자에 의한 lacZ 유전자의 파괴에 기초하여 원하는 클론의 색상-기반 선택을 가능하게 할 수 있다.
한 실시양태에서, 각 플라스미드는 고유한 DNA 역가 태그를 포함한다. 특정 실시양태에서, DNA 역가 태그는 트랜스진-함유 플라스미드에서만 나타난다. 특정 실시양태에서 DNA 역가 태그는 모든 플라스미드 시스템에서 나타난다. 이 고유한 DNA 역가 태그는 존재하는 벡터의 양을 정량화하기 위해, 예를 들어 qPCR (또는 ddPCR)-기반 벡터 게놈 역가측정 검정을 통해 범용 벡터 게놈 역가측정을 가능하게 하기 위해 포함될 수 있다. 특정 실시양태에서, DNA 역가 태그는 발현 카세트 외부에 그러나 2개의 ITR 사이에 있을 수 있어 패키징되도록 보장할 수 있다. 예를 들어, DNA 역가 태그는 3'ITR 서열의 상류에 있을 수 있다. 또 다른 예로서, DNA 역가 태그는 5'ITR 서열의 하류에 있을 수 있다. 특정 실시양태에서, DNA 역가 태그는 대상체의 게놈 내에서 내인성으로 나타나지 않도록 구축된다. 예를 들어, 서열은 대상체의 DNA와 비교될 수 있다 (예를 들어, Blast 검색 또는 다른 정렬 검색 도구를 통해). 또한, qPCR 분석을 실행하는데 사용되는 프라이머를 분석하여, 비리온을 패키징하는데 사용되는 숙주 세포에서 발견되는 임의의 서열을 확인하지 않는 것을 보장할 수 있다.
DNA 역가 태그는 효율적인 qPCR 분석을 허용하지만 또한 플라스미드에서 최소 양의 게놈 공간을 차지하는 크기일 수 있다. 특정 실시양태에서, DNA 역가 태그 서열은 약 60개 뉴클레오티드 내지 약 100개 뉴클레오티드 길이이고 (예를 들어 서열식별번호: 10), 인간 또는 표준 실험실 동물에 존재하지 않는 서열을 기반으로 설계된다. 특정 실시양태에서, DNA 역가 태그 서열은 약 60개 뉴클레오티드 내지 약 80개 뉴클레오티드, 약 65개 뉴클레오티드 내지 약 95개 뉴클레오티드, 약 70개 뉴클레오티드 내지 약 90개 뉴클레오티드, 또는 약 75개 뉴클레오티드 내지 약 85개 뉴클레오티드이다. 특정 실시양태에서, DNA 역가 태그 서열은 약 60개 뉴클레오티드 내지 약 70개 뉴클레오티드, 약 65개 뉴클레오티드 내지 약 75개 뉴클레오티드, 약 70개 뉴클레오티드 내지 약 80개 뉴클레오티드, 약 75개 뉴클레오티드 내지 약 85개 뉴클레오티드, 약 80개 뉴클레오티드 내지 약 90개 뉴클레오티드, 약 85개 뉴클레오티드 내지 약 95개 뉴클레오티드, 또는 약 90개 뉴클레오티드 내지 약 100개 뉴클레오티드이다. 특정 실시양태에서, DNA 역가 태그 서열은 적어도 약 60개 뉴클레오티드, 적어도 약 65개 뉴클레오티드, 적어도 약 70개 뉴클레오티드, 적어도 약 75개 뉴클레오티드, 적어도 약 80개 뉴클레오티드, 적어도 약 85개 뉴클레오티드, 적어도 약 90개 뉴클레오티드, 적어도 약 95개 뉴클레오티드, 또는 적어도 약 100개 뉴클레오티드이다. 특정 실시양태에서, DNA 역가 서열의 스트레치는 100개 뉴클레오티드 길이이다. 특정 실시양태에서, 100개 뉴클레오티드의 역가 태그는 신속한 qPCR 검정에서 유리할 수 있고, 전체 플라스미드 크기 및 패키징 제한으로 인해 효율적인 패키징을 허용할 수 있다.
DNA 역가 태그를 코딩하는 핵산 서열의 비제한적인 예는 서열식별번호: 61-70을 포함한다.
이종 핵산 서열
본 발명의 플라스미드에 의해 제조된 재조합 AAV는 대상체의 하나 이상의 세포 또는 조직에 투여될 수 있다. 그러므로, 본 발명은 대상체의 세포 또는 조직을 조정하는데 유용할 수 있는 이종 핵산 서열의 전달을 포함한다. 예를 들어, rAAV는 세포 또는 조직의 활성 또는 산물을 상향조절 또는 하향조절할 수 있다.
특정 실시양태에서, 이종 핵산 서열은 하나 이상의 펩티드, 폴리펩티드 또는 단백질을 코딩하는 관심 이종 유전자일 수 있다. 특정 실시양태에서, 이종 핵산 서열은 특정 관심 표적에 결합하는 펩티드, 폴리펩티드 또는 단백질을 코딩할 수 있으며, 이는 대상체에서 질환의 치료 또는 예방에 유용할 수 있다. 이러한 이종 핵산 서열 및 연관 펩티드, 폴리펩티드 또는 단백질의 예는 항체, MHC 분자, T-세포 수용체, B-세포 수용체, 압타머, 아비머, 수용체-결합 리간드, 또는 표적화 펩티드를 코딩하는 유전자를 포함하나 이에 제한되지는 않는다. 본 발명에 유용한 항체는 모노클로날 항체, 폴리클로날 항체, 항체 단편 (예를 들어, Fab, Fab', F(ab')2, Fv, Fc 등), 키메라 항체, 이중특이적 항체, 이종접합체 항체, 단일 쇄 (ScFv), 그의 돌연변이체, 항체 일부를 포함하는 융합 단백질, 인간화 항체, 및 항체의 글리코실화 변이체, 항체의 아미노산 서열 변이체, 및 공유결합으로 변형된 항체를 포함하여 필요한 특이성의 항원 인식 부위를 포함하는 면역글로불린 분자의 임의의 다른 변형된 구성을 포함할 수 있다. 항체는 뮤린, 래트, 인간, 또는 임의의 다른 기원 (키메라 또는 인간화 항체 포함)일 수 있다. 항체는 임의의 클래스의 항체, 예컨대 IgG, IgA 또는 IgM (또는 그의 서브클래스)을 포함하며, 항체는 임의의 특정한 클래스일 필요는 없다. 그의 중쇄의 불변 도메인의 항체 아미노산 서열에 따라, 면역글로불린은 상이한 클래스에 할당될 수 있다. 5개의 주요 클래스의 면역글로불린: IgA, IgD, IgE, IgG 및 IgM이 있으며, 이들 중 여러개는 서브클래스 (이소타입), 예를 들어 IgG1, IgG2, IgG3, IgG4, IgA1 및 IgA2로 추가로 나뉠 수 있다. 상이한 클래스의 면역글로불린에 상응하는 중쇄 불변 도메인은 각각 알파, 델타, 엡실론, 감마 및 뮤라고 불린다. 상이한 클래스의 면역글로불린의 서브유닛 구조 및 3차원 구성은 널리 공지되어 있다.
특정 실시양태에서, 이종 핵산 서열 (예를 들어, 관심 이종 유전자)은 대상체에서 질환의 치료 또는 예방에 유용할 수 있는 펩티드, 폴리펩티드 또는 단백질을 코딩할 수 있다. 예를 들어, 이종 핵산 서열은 질환 Y의 치료를 위해 단백질 X를 코딩할 수 있다. 단백질 X는 예를 들어, 돌연변이된 단백질을 치환하거나 돌연변이된 단백질을 차단하는 작용을 할 수 있다. 이러한 핵산 서열 및 연관 질환은 하기를 포함하나 이에 제한되지는 않는다: 글리코겐 저장 결핍 유형 1A와 연관된 글루코스-6-포스파타제를 코딩하는 핵산 서열; Pepck 결핍과 연관된 포스포에놀피루베이트-카르복시키나제를 코딩하는 DNA; 갈락토스혈증과 연관된 갈락토스-1 포스페이트 우리딜 트랜스퍼라제를 코딩하는 DNA; 페닐케톤뇨증과 연관된 페닐알라닌 히드록실라제를 코딩하는 DNA; 메이플 시럽 소변 질환과 연관된 분지쇄 알파-케토산 데히드로게나제를 코딩하는 DNA; 티로신혈증 유형 1과 연관된 푸마릴아세토아세테이트 히드롤라제를 코딩하는 DNA; 메틸말론산혈증과 연관된 메틸말로닐-CoA 뮤타제를 코딩하는 DNA; 중간쇄 아세틸 CoA 결핍과 연관된 중간쇄 아실 CoA 데히드로게나제를 코딩하는 DNA; 오르니틴 트랜스카르바밀라제 결핍과 연관된 오르니틴 트랜스카르바밀라제를 코딩하는 DNA; 시트룰린혈증과 연관된 아르기니노숙신산 신세타제를 코딩하는 DNA; 가족성 고콜레스테롤혈증과 연관된 저밀도 지단백질 수용체 단백질을 코딩하는 DNA; 크리글러-나자르병과 연관된 UDP-글루쿠로노실트랜스퍼라제를 코딩하는 DNA; 중증 복합 면역결핍 질환과 연관된 아데노신 데아미나제를 코딩하는 DNA; 통풍 및 레쉬-니한 증후군과 연관된 히포크산틴 구아닌 포스포리보실 트랜스퍼라제를 코딩하는 DNA; 비오티니다제 결핍과 연관된 비오티니다제를 코딩하는 DNA; 파브리병과 연관된 알파-갈락토시다제-A를 코딩하는 DNA; 고쉐병과 연관된 베타-글루코세레브로시다제를 코딩하는 DNA; Sly 증후군과 연관된 베타-글루쿠로니다제를 코딩하는 DNA; 젤웨거 증후군과 연관된 퍼옥시좀 막 단백질 70 kDa을 코딩하는 DNA; 급성 간헐성 포르피린증과 연관된 포르포빌리노겐 데아미나제를 코딩하는 DNA; 알파-1 항트립신 결핍 (폐기종)의 치료를 위한 알파-1 항트립신을 코딩하는 DNA; 유전성 혈관부종 (HAE)의 치료를 위한 C1-에스테라제를 코딩하는 DNA; 페닐케톤뇨증의 치료를 위한 페닐알라닌 히드록실라제를 코딩하는 DNA; 폼페병의 치료를 위한 산 알파-글루코시다제를 코딩하는 DNA; 윌슨병의 치료를 위한 ATP7B를 코딩하는 DNA; 뮤코다당질축적증 유형 I (MPSI)의 치료를 위한 알파-L-이두로니다제를 코딩하는 DNA; 뮤코다당질축적증 유형 II (MPSII)의 치료를 위한 이두로네이트 술파타제를 코딩하는 DNA; 뮤코다당질축적증 유형 IIIA (MPSIIIA)의 치료를 위한 헤파란 술파미다제를 코딩하는 DNA; 뮤코다당질축적증 유형 IIIB (MPSIIIB)의 치료를 위한 N-아세틸글루코사미니다제를 코딩하는 DNA; 뮤코다당질축적증 유형 IIIC (MPSIIIC)의 치료를 위한 헤파란-알파-글루코사미니드 N-아세틸트랜스퍼라제를 코딩하는 DNA; 뮤코다당질축적증 유형 IIID (MPSIIID)의 치료를 위한 N-아세틸글루코사민 6-술파타제를 코딩하는 DNA; 뮤코다당질축적증 유형 IVA (MPSIVA)의 치료를 위한 갈락토스-6-술페이트 술파타제를 코딩하는 DNA; 뮤코다당질축적증 유형 IVB (MPSIVB)의 치료를 위한 베타-갈락토시다제를 코딩하는 DNA; 뮤코다당질축적증 유형 VI (MPSVI)의 치료를 위한 N-아세틸갈락토사민-4-술파타제를 코딩하는 DNA; 뮤코다당질축적증 유형 VII (MPSVII)의 치료를 위한 베타-글루쿠로니다제를 코딩하는 DNA; 뮤코다당질축적증 유형 IX (MPSIX)의 치료를 위한 히알루로니다제를 코딩하는 DNA; 지중해빈혈증 또는 신부전으로 인한 빈혈의 치료를 위한 에리트로포이에틴을 코딩하는 DNA; 허혈성 질환의 치료를 위한 혈관 내피 성장 인자를 코딩하는 DNA, 안지오포이에틴-1을 코딩하는 DNA, 및 섬유모세포 성장 인자를 코딩하는 DNA; 예를 들어, 죽상경화증, 혈전증 또는 색전증에서 나타나는 바와 같은 폐색 혈관의 치료를 위한 트롬보모듈린 및 조직 인자 경로 억제제를 코딩하는 DNA; 파킨슨병의 치료를 위한 방향족 아미노산 데카르복실라제 (AADC)를 코딩하는 DNA 및 티로신 히드록실라제 (TH)를 코딩하는 DNA; 울혈성 심부전의 치료를 위한 베타 아드레날린 수용체를 코딩하는 DNA, 포스포람반에 대한 안티센스를 코딩하는 DNA 또는 이의 돌연변이체 형태를 코딩하는 DNA, 근소포체(소포체) 아데노신 트리포스파타제-2 (SERCA2)를 코딩하는 DNA, 및 심장 아데닐릴 시클라제를 코딩하는 DNA; 다양한 암의 치료를 위한 종양 억제 유전자, 예컨대 p53을 코딩하는 DNA; 염증성 및 면역 장애 및 암의 치료를 위한 시토카인, 예컨대 다양한 인터루킨 중 하나를 코딩하는 DNA; 근디스트로피의 치료를 위한 디스트로핀 또는 미니디스트로핀을 코딩하는 DNA 및 우트로핀 또는 미니우트로핀을 코딩하는 DNA; 스타가르트병의 치료를 위한 ABCA4를 코딩하는 DNA; 및 당뇨병의 치료를 위한 인슐린을 코딩하는 DNA.
특정 실시양태에서, 이종 핵산 서열 (예를 들어, 관심 이종 유전자)은 혈액 응고 단백질을 코딩하는 펩티드, 폴리펩티드 또는 단백질을 코딩할 수 있으며, 상기 단백질은 혈액 장애 (예를 들어, 혈우병)를 갖는 대상체의 세포로 전달될 수 있다. 이러한 핵산 및 연관 펩티드, 폴리펩티드 또는 단백질의 예는 혈우병 B의 치료를 위한 대상체에게 인자 IX, 혈우병 A의 치료를 위한 대상체에게 인자 VIII, 인자 VII 결핍의 치료를 위한 인자 VII, 인자 X 결핍의 치료를 위한 인자 X, 인자 XI 결핍의 치료를 위한 인자 XI, 인자 XIII 결핍의 치료를 위한 인자 XIII, 및 단백질 C 결핍의 치료를 위한 단백질 C를 코딩하는 DNA를 포함하나 이에 제한되지는 않는다.
본 발명은 또한 유전적 및/또는 후천성 질환에 대한 유전자 발현 수준을 높이거나 낮추기 위해 숙주 세포 게놈과 상호작용할 수 있는 조작된 인공 DNA 결합 도메인 펩티드, 전사 활성화제 또는 전사 레프레서 및 뉴클레아제의 발현을 포함한다.
본 발명은 또한 안티센스, siRNA, shRNA, miRNA, EGS, gRNA, sgRNA, 리보자임 또는 압타머를 포함하나 이에 제한되지는 않는 이종 핵산 서열의 발현을 포함하며, 이는 유전적 및/또는 후천성 질환에 대한 단백질의 유전자 발현 또는 활성을 변경할 수 있는 세포 DNA, RNA 및/또는 단백질과 상호작용할 수 있다.
본 발명은 또한 세포를 감염시켜 유전자 조작된 세포 요법 물질 또는 약물 산물을 생성하는데 사용되는 rAAV를 포함하나 이에 제한되지는 않는 세포 요법을 위한 중간체 및/또는 중요한 원료의 발현을 포함한다.
본 발명은 또한 세포에서 관심 게놈 유전자좌 (즉, 표적)를 변형시키는데 사용되는 유전자 편집 분자인 이종 핵산 서열을 포함한다. 이러한 변형은 유전자의 표적 유전자좌에서 유전자 서열의 파괴, 결실, 복구, 돌연변이, 첨가, 변경 또는 변형을 포함하나 이에 제한되지는 않는다. 유전자-편집 분자의 예는 엔도뉴클레아제, 예컨대 아연 핑거 뉴클레아제 (ZFn), 전사 활성화제-유사 이펙터 뉴클레아제 (TALEN), 메가뉴클레아제, 제한 엔도뉴클레아제, 레콤비나제, 및 클러스터링된 규칙적으로 산재된 짧은 회문 반복부 (CRISPR)/CRISPR-연관 (Cas) 단백질을 포함하나 이에 제한되지는 않는다.
rAAV의 전달
본원에 기재된 재조합 AAV는 본 발명의 플라스미드에 의해 제조된 rAAV의 유효량을 그를 필요로 하는 대상체에게 투여함으로써 관심 질환의 치료 및/또는 예방을 위한 치료적으로 유용한 농도로 사용될 수 있다. 본 발명의 플라스미드에 의해 제조된 rAAV로 치료될 대상체는 또한 질환을 치료하거나 또는 예방하기 위한 공지된 효능을 갖는 다른 치료제 또는 장치와 함께 투여될 수 있다.
대상체에게 rAAV의 전달은 근육내 주사 또는 대상체의 혈류로의 투여에 의해 이루어질 수 있다. 혈류로의 투여는 수술 분야에서 널리 공지된 기술인 단리된 사지 관류에 의해 돌연변이체 비리온을 혈류로 정맥, 동맥 또는 임의의 다른 혈관 도관으로 주사함으로써 이루어질 수 있으며, 상기 방법은 본질적으로 통상의 기술자가 rAAV의 투여전 전신 순환으로부터 사지를 단리할 수 있게 한다. 더욱이, 특정 조건의 경우, 돌연변이체 비리온을 대상체의 CNS에 전달하는 것이 바람직할 수 있다. "CNS"는 척추동물의 뇌 및 척수의 모든 세포 및 조직을 의미한다. 그러므로, 상기 용어는 신경 세포, 아교 세포, 성상세포, 뇌척수액 (CSF), 간질 공간, 골, 연골, 뇌내 뇌실, 두개내, 대수조 주사, 경막내, 경동맥내, 비강내 등을 포함하나 이에 제한되지는 않는다. 시험관내에서 형질도입된 rAAV 또는 세포는 관련 기술분야에 공지된 신경외과 기술을 사용하여, 예컨대 정위 주사에 의해 바늘, 카테터 또는 관련 장치로 예를 들어, 뇌실 영역, 뿐만 아니라 선조체 (예를 들어, 선조체의 꼬리핵 또는 피각), 척수 및 신경근 접합부 또는 소뇌 소엽으로 주사에 의해 CNS 또는 뇌로 직접적으로 전달될 수 있다. 예를 들어, 문헌 [Stein et al., J Virol 73:3424-3429, 1999]; [Davidson et al., PNAS 97:3428-3432, 2000]; [Davidson et al., Nat. Genet. 3:219-223, 1993]; 및 [Alisky and Davidson, Hum. Gene Ther. 11:2315-2329, 2000]을 참조하며, 이들 각각은 모든 목적을 위해 그 전문이 본원에 포함된다. 눈에 투여하기 위한 방법은 망막하, 유리체내, 경공막 또는 두개내를 포함할 수 있다.
표 3 본 발명의 플라스미드에서 사용하기 위한 예시적인 서열
실시예
본 개시내용은 또한 하기 실시예에 의해 설명되고 입증된다. 그러나, 명세서의 어느 곳에서나 이들 및 다른 실시예의 사용은 단지 예시일 뿐이며, 본 개시내용 또는 임의의 예시된 용어의 범위 및 의미를 제한하지 않는다. 마찬가지로, 본 개시내용은 본원에 기재된 임의의 바람직한 실시양태로 제한되지 않는다. 실제로, 본 명세서를 읽으면 본 개시내용의 많은 변형 및 변경이 관련 기술분야의 통상의 기술자에게 명백할 수 있고, 이러한 변경은 본 개시내용의 취지 또는 범위에서 벗어나지 않고 이루어질 수 있다. 따라서, 본 개시내용은 그 청구범위가 자격이 되는 등가물의 전체 범위와 함께 첨부된 청구범위의 조건에 의해서만 제한되어야 한다.
실시예 1: Cap 단백질의 시험관내 발현
본 실시예는 Rep2 및 Cap2 유전자를 운반하는 대조군 pAAV-RC2 기반 플라스미드 (애질런트)로부터의 동일한 캡시드 단백질의 발현 수준과 비교하여 pUC19-기반 플라스미드로부터의 AAV293 (애질런트) 세포에서 캡시드 단백질의 시험관내 발현을 조사하였다 (도 4a).
Rep2Cap2-pAAV-RC (즉, 도 4a에 제시된 바와 같은 pAAV-RC2)로 출발하여 다양한 Rep 및 Cap 유전자를 갖는 4개의 플라스미드의 제1 세트를 pAAV-RC 배경에서 생성하였다. pAAV-RC2를 사용하여 Rep2/5Cap5-pAAV-RC, Rep2Cap8-pAAV-RC, 및 Rep2Cap9-pAAV-RC를 생성하였다 (도 4a).
제1 세트와 동일한 복제 및 캡시드 단백질을 사용하여 pUC19-Kan 배경에서 4개의 플라스미드의 제2 세트를 생성하였다. 그러므로, Rep2Cap2-pUC19-Kan, Rep2/5Cap5-pUC19-Kan, Rep2Cap8-pUC19-Kan, 및 Rep2Cap9-pUC19-Kan (도 4a 및 14a).
실험을 위해, 8개의 플라스미드를 각각 Ad 헬퍼 플라스미드, p헬퍼 (애질런트) (예를 들어, 서열식별번호: 45)와 함께 1:1 비율로 별도로 형질감염시켰다.
pUC19-Kan-기반 플라스미드로부터의 Cap 단백질의 발현 수준을 모노클로날 B1 항체를 사용하여 웨스턴 블로팅을 통해 pAAV-RC2-기반 플라스미드로부터의 동일한 Cap 단백질의 발현 수준과 비교하였다 (도 6). 양성 대조군 AAV2 참조 표준 물질 (RSM) 및 AAV8 RSM은 AAV2 및 AAV8 Cap 단백질을 함유하는 참조 표준 물질인 반면, 음성 대조군은 어떠한 Cap-보유 플라스미드도 없는 HEK293으로부터의 세포 용해물이었다. 캡시드 단백질의 발현 수준은 pUC19-기반 플라스미드 및 pAAV-RC2-기반 플라스미드 둘 다에 대해 AAV5 > AAV8 > AAV9 > AAV2였다.
도 7은 Cap 단백질 VP1-VP3의 양을 보다 명확하게 구체적으로 분석하기 위해 감소된 샘플로 수행된 웨스턴 블롯 분석이다.
다음으로, AAV2 P5 프로모터를 Rep2Cap2 pUC19-Kan, Rep2Cap8 pUC19-Kan 및 Rep2Cap9 pUC19-Kan 플라스미드에 첨가하였다 (예를 들어, 도 4b 및 14b). 도 8은 P5 프로모터가 없는 것과 비교하여 상기 기재된 것과 동일한 조건 하에 시험된 P5 프로모터를 사용하여 발현된 AAV 혈청형 2, 8 및 9로부터의 Cap 단백질의 발현 수준을 제시한다. P5 프로모터가 더 높은 수준의 캡시드 단백질 발현을 제공하는 것으로 밝혀졌다. 트랜스진-함유 플라스미드 및 Ad 헬퍼 플라스미드를 1:1 비율로 투여하였다.
실시예 2: 짧은 및 긴 Ad 헬퍼 플라스미드의 기능 시험
본 실시예의 목적은 짧은 Ad 헬퍼 플라스미드 및 긴 Ad 헬퍼 플라스미드 대 상업용 p헬퍼의 기능을 시험하는 것이었다. 각 플라스미드를 조합하여 사용하기 전에 각 플라스미드가 기능하는지를 보장하기 위해 개별적으로 시험하였다.
도 9는 HEK293 숙주 세포 시스템에서 짧은 Ad 헬퍼 플라스미드 (서열식별번호: 14)를 사용한 양성 시험 결과를 제시한다. ITR과 AAV Rep2 및 Cap2 유전자를 운반하는 애질런트 RC2 플라스미드 사이에 트랜스진으로서 GFP를 운반하는 pTRUF11 트랜스진-함유 플라스미드와 함께 짧은 헬퍼 플라스미드를 공동-형질감염시킴으로써 짧은 Ad 헬퍼 플라스미드 (서열식별번호: 14)를 시험하였다. 음성 대조군은 1) 상업용 Ad 헬퍼 플라스미드 (p헬퍼) 및 애질런트 플라스미드 RC2 및 2) p헬퍼 및 pTRUF11로 이루어지고; 양성 대조군은 p헬퍼, pTRUF11 및 애질런트 RC2 플라스미드로 이루어졌다. 48시간 후, HEK293 세포를 트리톤 X-100으로 용해시키고, 벤조나제 뉴클레아제로 처리하여 DNA 및 RNA로 분해하였다. AAV 입자를 함유하는 세포 용해물을 DNase I로 처리하고, qPCR을 수행하기 전에 계열 희석하여 세포 용해물 ml당 바이러스 게놈 카피 수를 결정하였다. 도 9는 qPCR 검정 결과를 보여주며, 칼럼 1 및 2는 음성 대조군을 나타내고, 칼럼 3은 양성 대조군을 제시하며, 칼럼 4는 rAAV를 생산하기 위해 짧은 Ad 헬퍼 플라스미드를 2개의 다른 플라스미드와 함께 사용하였을 때 수득된 바이러스 게놈 카피 수를 제시한다.
본 개시내용에 따라 긴 Ad 헬퍼 플라스미드 (서열식별번호: 15)를 시험하기 위해 유사한 실험을 수행하였다 (도 10). 도 10은 qPCR에 의해 결정된 바와 같이 음성 대조군 (칼럼 1), 양성 대조군 (칼럼 2), 짧은 Ad 헬퍼 플라스미드 (서열식별번호: 14) + Rep-Cap 보유 플라스미드 + ITR-GFP 보유 플라스미드 (칼럼 3), 및 긴 Ad 헬퍼 플라스미드 + Rep-Cap 보유 플라스미드 + ITR-GFP 보유 플라스미드 (칼럼 4)의 세포 용해물 ml당 바이러스 게놈 카피 수를 제시한다. 따라서, 긴 Ad 헬퍼 플라스미드도 AAV 생산을 초래하였다.
실시예 3: 삼중-플라스미드 시스템을 사용한 rAAV 비리온 생산
rAAV 비리온을 형성하는 본 개시내용에 따른 단일 가닥 (ss)- 및 자가-상보적 (sc)-ITR-보유 플라스미드의 능력을 시험하였다. 본 실험에서, 플라스미드를 HEK293 세포 (애질런트)에 공동-형질감염시켰다. 각 형질감염의 경우, Ad-헬퍼 플라스미드, Rep-Cap 플라스미드 및 트랜스진-함유 플라스미드를 1:1:1 몰비로 사용하고, 10 cm 플레이트당 총 DNA 10 ug을 사용하였다. 음성 대조군은 시판되는 Ad 헬퍼 플라스미드 (애질런트) 및 시판되는 Rep-Cap-보유 플라스미드 (애질런트)인 반면, 양성 대조군은 상이한 ITR-보유 플라스미드 (ATCC)를 사용하였다. 도 11의 상단 패널은 ss-ITR-보유 플라스미드에 대한 세포 용해물 ml당 바이러스 게놈 카피 수를 제시하는 반면 (상기와 같이 qPCR에 의해 측정됨), 하단 패널은 sc-ITR-보유 플라스미드에 대한 세포 용해물 ml당 바이러스 게놈 카피 수를 제시한다. 두 패널 모두에서, 칼럼 1은 음성 대조군에 대한 카피 수를 나타내고, 칼럼 2는 양성 대조군을 나타내고, 칼럼 3은 본 개시내용에 따른 플라스미드를 제시한다.
다음으로, 본 개시내용에 따른 3개의 플라스미드를 qPCR 검정을 위해 HEK293 세포 (다시, 1:1:1 비율)에 공동-형질감염시켰다. 음성 대조군 (도 12의 칼럼 1)은 시판되는 Ad 헬퍼 플라스미드 및 ITR-보유 플라스미드였다. 양성 대조군 (도 12의 칼럼 2)은 시판되는 Rep-Cap-보유 플라스미드를 포함하였다. 칼럼 3-6은 AAV 혈청형 2, 5, 8 또는 9로부터의 Rep 및 Cap 단백질을 코딩하는 pUC19-기반 플라스미드와 함께 동일한 시판되는 Ad 헬퍼 플라스미드 및 ITR-보유 플라스미드로 형질감염된 세포로부터의 AAV 게놈 카피 수에 상응한다 (도면의 상단에 걸쳐 표시됨). 도 12의 칼럼 7-10은 본 개시내용에 따른 Ad 헬퍼 플라스미드, pUC19-기반 Rep-Cap-보유 플라스미드, 및 ITR-보유 플라스미드로 형질감염된 세포로부터의 AAV 게놈 카피 수에 상응한다. 도 12의 칼럼 11은 본 개시내용에 따른 Ad 헬퍼 플라스미드 및 ss-ITR 플라스미드 및 시판되는 Rep-Cap-보유 플라스미드로 형질감염된 세포로부터의 AAV 게놈 카피 수에 상응하는 또 다른 양성 대조군이다.
실시예 4: rAAV의 정제 및 생산
HEK293 세포를 본 개시내용에 따른 3개의 플라스미드를 포함하는 플라스미드 시스템으로 공동-형질감염시켰다. 세포를 화학적으로 용해시키고, 세포 펠릿 및 배지를 수집하였다. 세포 용해물을 청징화하고 벤조나제로 처리하였다. 청징화된 용해물을 적절한 친화성 칼럼에서 실행시켰다 (예를 들어, AAV8 캡시드를 포함하는 플라스미드 시스템의 경우, 친화성 칼럼은 AVB였고; AAV9를 포함하는 플라스미드 시스템의 경우, 친화성 칼럼은 AAV9-POROS 캡쳐셀렉트(CaptureSelect)였음). 완충액 교환 후, rAAV를 칼럼으로부터 용출하였다. 그 후, 바이러스 게놈 카피 수를 결정하기 위해 qPCR에 의해 제한이 아닌 예로서 rAAV를 특징화하였다 (도 9-13, 16 참조). 순도 및 동일성을 결정하기 위한 은 염색에 의해, 내독소 활성 및 미생물 오염을 측정하기 위한 리물루스 아메바세포 용해물(Limulus amebocyte lysate) (LAL) 검정에 의해, 및 생물학적 활성을 결정하기 위한 시험관내 형질도입 검정에 의해 rAAV를 추가로 평가할 수 있다. 다른 특징화 검정은 바이러스 게놈의 크기 및 무결성을 시험하기 위한 알칼리성 전기영동, 캡시드를 검사하기 위한 ELISA, rAAV 입자의 감염성을 결정하기 위한 감염성 센터 검정, 및 rAAV 입자를 관찰하기 위한 전자 현미경검사법을 포함한다. 특정 단백질에 대한 웨스턴 블로팅을 또한 적절한 항체를 사용함으로써 수행할 수 있다 (도 6-8 참조).
실시예 5: 벡터 게놈을 역가측정하기 위한 태그의 사용
서열, 예컨대 폴리A 서열을 qPCR 정량화에 사용할 수 있지만, 범용 역가측정을 위해 이러한 서열을 사용하는 것은 이상적이지 않다. 예를 들어, 각 트랜스진은 상이한 폴리A 서열 (예를 들어, SV40, bGH 폴리A 등)을 사용하며, 그에 의해 모든 트랜스진 플랫폼에 걸쳐 벡터를 정량하는데 사용하지 못하게 할 수 있다. 따라서, 트랜스진 카세트 외부에 있는 별도의 DNA 역가 태그 (즉, 트랜스진 mRNA 전사체의 일부로서 전사되지 않음)를 임의의 트랜스진 카세트를 보편적으로 정량하는 그의 능력에 대해 시험하였다.
100개 뉴클레오티드 DNA 역가 태그가 3' ITR 서열의 상류에 포함되었다. 이 동일한 역가 태그는 임의의 프로젝트에 대한 단일 참조 표준으로 사용될 수 있는 qPCR 기술을 통해 범용 벡터 게놈 역가측정을 허용하기 위해 rAAV 생산을 위한 임의의 트랜스진-함유 플라스미드에서 사용할 수 있다. 표적 서열로서 SV40 폴리A 또는 100개 뉴클레오티드 DNA 역가 태그를 사용하여 AAV의 동일한 배치에 대해 qPCR 적정 결과를 비교하였다.
2개의 상이한 바이러스 벡터: rAAV8-ssITR (서열식별번호: 1) 및 rAAV8-scITR (서열식별번호: 42)을 단일-가닥 (서열식별번호: 1) 또는 자가-상보적 (서열식별번호: 42) 트랜스진-함유 플라스미드인 트랜스진-함유 플라스미드와 함께 생산하였다. 2개의 상이한 표적 서열을 사용하여 유사한 qPCR 역가를 수득하였으며, 이는 100개 뉴클레오티드 DNA 역가 태그가 qPCR-기반 벡터 적정을 위해 현장에서 널리 사용된 SV40 폴리A와 동일하게 작동함을 나타낸다 (도 13a (rAAV8-ssITR) 및 13B (rAAV8-scITR)).
실시예 6: 벡터 게놈을 역가측정하기 위한 태그의 사용
DNA 역가 태그의 유용성을 추가로 확인하기 위해, 실시예 5에서 사용된 동일한 100개 뉴클레오티드 DNA 역가 태그를 2개의 추가 바이러스 벡터: rAAV9-ssITR (서열식별번호: 71) 및 rAAV9-scITR (서열식별번호: 73)에서 3' ITR 서열의 상류에 포함시켰다.
여러 가능한 실시양태가 상기 개시되어 있지만, 본 개시내용의 실시양태는 그렇게 제한되지 않는다. 이들 예시적인 실시양태는 본 개시내용의 범위를 완전하게 하거나 불필요하게 제한하려는 것이 아니라, 대신에 관련 기술분야의 통상의 기술자가 본 개시내용을 실시할 수 있도록 본 개시내용의 원리를 설명하기 위해 선택되고 설명되었다. 실제로, 본원에 설명된 것들에 더하여 본 개시내용의 다양한 변형은 전술한 설명으로부터 관련 기술분야의 통상의 기술자에게 명백하게 될 것이다. 이러한 변형은 첨부된 청구항의 범위 내에 속하도록 의도된다. 또한, 본원에서 사용된 용어는 예시적인 실시양태를 설명하기 위한 목적으로만 사용되며, 본 개시내용의 다양한 실시양태의 범위는 첨부된 청구범위 및 그의 균등물에 의해서만 제한될 것이기 때문에 용어는 제한하려는 의도가 아니다. 따라서, 본 개시내용의 범위는 전술한 설명 및 상기 논의된 실시양태가 아니라 다음의 청구범위에 의해 표시되고, 그 균등물의 의미 및 범위 내에 있는 모든 변경이 본원에 포함되도록 의도된다.
본원에서 인용된 모든 특허, 출원, 간행물, 시험 방법, 문헌 및 기타 자료는 본 명세서에 물리적으로 존재하는 것처럼 그 전문이 본원에 참조로 포함된다.
SEQUENCE LISTING
<110> BAXALTA INCORPORATED
BAXALTA GMBH
<120> AAV TRIPLE-PLASMID SYSTEM
<130> 250478.001858
<140>
<141>
<150> 62/750,603
<151> 2018-10-25
<160> 77
<170> PatentIn version 3.5
<210> 1
<211> 10630
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<221> modified_base
<222> (6316)..(6415)
<223> a, c, t, g, unknown or other
<220>
<221> misc_feature
<222> (6316)..(6415)
<223> This region may encompass 60-100 nucleotides
<400> 1
tagggaaata ggccaggttt tcaccgtaac acgccacatc ttgcgaatat atgtgtagaa 60
actgccggaa atcgtcgtgt gcactcatgg aaaacggtgt aacaagggtg aacactatcc 120
catatcacca gctcaccgtc tttcattgcc atacggaact ccggatgagc attcatcagg 180
cgggcaagaa tgtgaataaa ggccggataa aacttgtgct tatttttctt tacggtcttt 240
aaaaaggccg taatatccag ctgaacggtc tggttatagg tacattgagc aactgactga 300
aatgcctcaa aatgttcttt acgatgccat tgggatatat caacggtggt atatccagtg 360
atttttttct ccattttttt ttcctccttt agaaaaactc atcgagcatc aaatgaaact 420
gcaatttatt catatcagga ttatcaatac catatttttg aaaaagccgt ttctgtaatg 480
aaggagaaaa ctcaccgagg cagttccata ggatggcaag atcctggtat cggtctgcga 540
ttccgactcg tccaacatca atacaaccta ttaatttccc ctcgtcaaaa ataaggttat 600
caagtgagaa atcaccatga gtgacgactg aatccggtga gaatggcaaa agtttatgca 660
tttctttcca gacttgttca acaggccagc cattacgctc gtcatcaaaa tcactcgcat 720
caaccaaacc gttattcatt cgtgattgcg cctgagcgag gcgaaatacg cgatcgctgt 780
taaaaggaca attacaaaca ggaatcgagt gcaaccggcg caggaacact gccagcgcat 840
caacaatatt ttcacctgaa tcaggatatt cttctaatac ctggaacgct gtttttccgg 900
ggatcgcagt ggtgagtaac catgcatcat caggagtacg gataaaatgc ttgatggtcg 960
gaagtggcat aaattccgtc agccagttta gtctgaccat ctcatctgta acatcattgg 1020
caacgctacc tttgccatgt ttcagaaaca actctggcgc atcgggcttc ccatacaagc 1080
gatagattgt cgcacctgat tgcccgacat tatcgcgagc ccatttatac ccatataaat 1140
cagcatccat gttggaattt aatcgcggcc tcgacgtttc ccgttgaata tggctcattt 1200
ttttttcctc ctttaccaat gcttaatcag tgaggcacct atctcagcga tctgtctatt 1260
tcgttcatcc atagttgcct gactccccgt cgtgtagata actacgatac gggagggctt 1320
accatctggc cccagcgctg cgatgatacc gcgagaacca cgctcaccgg ctccggattt 1380
atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg caactttatc 1440
cgcctccatc cagtctatta attgttgccg ggaagctaga gtaagtagtt cgccagttaa 1500
tagtttgcgc aacgttgttg ccatcgctac aggcatcgtg gtgtcacgct cgtcgtttgg 1560
tatggcttca ttcagctccg gttcccaacg atcaaggcga gttacatgat cccccatgtt 1620
gtgcacgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg 1680
cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca 1740
accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata 1800
cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct 1860
tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact 1920
cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa 1980
acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc 2040
atattcttcc tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga 2100
tacatatttg aatgtattta gaaaaataaa caaatagggg tcagtgttac aaccaattaa 2160
ccaattctga acattatcgc gagcccattt atacctgaat atggctcata acaccccttg 2220
tttgcctggc ggcagtagcg cggtggtccc acctgacccc atgccgaact cagaagtgaa 2280
acgccgtagc gccgatggta gtgtggggac tccccatgcg agagtaggga actgccaggc 2340
atcaaataaa acgaaaggct cagtcgaaag actgggcctt tcgcccgggc taattgaggg 2400
gtgtcgccct tattcgactc ggggctcgag ctgcgcgctc gctcgctcac tgaggccgcc 2460
cgggcaaagc ccgggcgtcg ggcgaccttt ggtcgcccgg cctcagtgag cgagcgagcg 2520
cgcagagagg gagtggccaa ctccatcact aggggttcct ttaattaaac gcgtttacat 2580
aacttacggt aaatggcccg cctggctgac cgcccaacga cccccgccca ttgacgtcaa 2640
taatgacgta tgttcccata gtaacgccaa tagggacttt ccattgacgt caatgggtgg 2700
actatttacg gtaaactgcc cacttggcag tacatcaagt gtatcatatg ccaagtacgc 2760
cccctattga cgtcaatgac ggtaaatggc ccgcctggca ttatgcccag tacatgacct 2820
tatgggactt tcctacttgg cagtacatct acgtattagt catcgctatt accatggtga 2880
tgcggttttg gcagtacatc aatgggcgtg gatagcggtt tgactcacgg ggatttccaa 2940
gtctccaccc cattgacgtc aatgggagtt tgttttggca ccaaaatcaa cgggactttc 3000
caaaatgtcg taacaactcc gccccattga cgcaaatggg cggtaggcgt gtacggtggg 3060
aggtctatat aggcgcgccg aactgaaaaa ccagaaagtt aactggtaag tttagtcttt 3120
ttgtctttta tttcaggtcc cggatccggt ggtggtgcaa atcaaagaac tgctcctcag 3180
tggatgttgc ctttacttct aggcctgtac ggaagtgtta cttctgctct aaaagctcct 3240
gcagggaatt cgccaccatg gtgagcaagg gcgaggagct gttcaccggg gtggtgccca 3300
tcctggtcga gctggacggc gacgtaaacg gccacaagtt cagcgtgtcc ggcgagggcg 3360
agggcgatgc cacctacggc aagctgaccc tgaagttcat ctgcaccacc ggcaagctgc 3420
ccgtgccctg gcccaccctc gtgaccaccc tgacctacgg cgtgcagtgc ttcagccgct 3480
accccgacca catgaagcag cacgacttct tcaagtccgc catgcccgaa ggctacgtcc 3540
aggagcgcac catcttcttc aaggacgacg gcaactacaa gacccgcgcc gaggtgaagt 3600
tcgagggcga caccctggtg aaccgcatcg agctgaaggg catcgacttc aaggaggacg 3660
gcaacatcct ggggcacaag ctggagtaca actacaacag ccacaacgtc tatatcatgg 3720
ccgacaagca gaagaacggc atcaaggtga acttcaagat ccgccacaac atcgaggacg 3780
gcagcgtgca gctcgccgac cactaccagc agaacacccc catcggcgac ggccccgtgc 3840
tgctgcccga caaccactac ctgagcaccc agtccgccct gagcaaagac cccaacgaga 3900
agcgcgatca catggtcctg ctggagttcg tgaccgccgc cgggatcact ctcggcatgg 3960
acgagctgta caagtaatag actagtgccc ctctccctcc ccccccccta acgttactgg 4020
ccgaagccgc ttggaataag gccggtgtgc gtttgtctat atgttatttt ccaccatatt 4080
gccgtctttt ggcaatgtga gggcccggaa acctggccct gtcttcttga cgagcattcc 4140
taggggtctt tcccctctcg ccaaaggaat gcaaggtctg ttgaatgtcg tgaaggaagc 4200
agttcctctg gaagcttctt gaagacaaac aacgtctgta gcgacccttt gcaggcagcg 4260
gaacccccca cctggcgaca ggtgcctctg cggccaaaag ccacgtgtat aagatacacc 4320
tgcaaaggcg gcacaacccc agtgccacgt tgtgagttgg atagttgtgg aaagagtcaa 4380
atggctcacc tcaagcgtat tcaacaaggg gctgaaggat gcccagaagg taccccattg 4440
tatgggatct gatctggggc ctcggtgcac atgctttaca tgtgtttagt cgaggttaaa 4500
aaacgtctag gccccccgaa ccacggggac gtggttttcc tttgaaaaac acgatgataa 4560
taccggtgcc accatgctgc tgctgctgct gctgctgggc ctgaggctac agctctccct 4620
gggcatcatc ccagttgagg aggagaaccc ggacttctgg aaccgcgagg cagccgaggc 4680
cctgggtgcc gccaagaagc tgcagcctgc acagacagcc gccaagaacc tcatcatctt 4740
cctgggcgat gggatggggg tgtctacggt gacagctgcc aggatcctaa aagggcagaa 4800
gaaggacaaa ctggggcctg agatacccct ggccatggac cgcttcccat atgtggctct 4860
gtccaagaca tacaatgtag acaaacatgt gccagacagt ggagccacag ccacggccta 4920
cctgtgcggg gtcaagggca acttccagac cattggcttg agtgcagccg cccgctttaa 4980
ccagtgcaac acgacacgcg gcaacgaggt catctccgtg atgaatcggg ccaagaaagc 5040
agggaagtca gtgggagtgg taaccaccac acgagtgcag cacgcctcgc cagccggcac 5100
ctacgcccac acggtgaacc gcaactggta ctcggacgcc gacgtgcctg cctcggcccg 5160
ccaggagggg tgccaggaca tcgctacgca gctcatctcc aacatggaca ttgacgtgat 5220
cctaggtgga ggccgaaagt acatgtttcg catgggaacc ccagaccctg agtacccaga 5280
tgactacagc caaggtggga ccaggctgga cgggaagaat ctggtgcagg aatggctggc 5340
gaagcgccag ggtgcccggt atgtgtggaa ccgcactgag ctcatgcagg cttccctgga 5400
cccgtctgtg acccatctca tgggtctctt tgagcctgga gacatgaaat acgagatcca 5460
ccgagactcc acactggacc cctccctgat ggagatgaca gaggctgccc tgcgcctgct 5520
gagcaggaac ccccgcggct tcttcctctt cgtggagggt ggtcgcatcg accatggtca 5580
tcatgaaagc agggcttacc gggcactgac tgagacgatc atgttcgacg acgccattga 5640
gagggcgggc cagctcacca gcgaggagga cacgctgagc ctcgtcactg ccgaccactc 5700
ccacgtcttc tccttcggag gctaccccct gcgagggagc tccatcttcg ggctggcccc 5760
tggcaaggcc cgggacagga aggcctacac ggtcctccta tacggaaacg gtccaggcta 5820
tgtgctcaag gacggcgccc ggccggatgt taccgagagc gagagcggga gccccgagta 5880
tcggcagcag tcagcagtgc ccctggacga agagacccac gcaggcgagg acgtggcggt 5940
gttcgcgcgc ggcccgcagg cgcacctggt tcacggcgtg caggagcaga ccttcatagc 6000
gcacgtcatg gccttcgccg cctgcctgga gccctacacc gcctgcgacc tggcgccccc 6060
cgccggcacc accgacgccg cgcacccggg ttactctaga gtcggggcgg ccggccgctt 6120
cgagcagaca tgagtcgaca gatcttttaa aaaacctccc acacaattgt tgttgttaac 6180
ttgtttattg cagcttataa tggttacaaa taaagcaata gcatcacaaa tttcacaaat 6240
aaagcatttt tttcactgca ttctagttgt ggtttgtcca aactcatcaa tgtatcttat 6300
catgtctgtt taaacnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 6360
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnattta 6420
aataggaacc cctagtgatg gagttggcca ctccctctct gcgcgctcgc tcgctcactg 6480
aggccgggcg accaaaggtc gcccgacgcc cgggctttgc ccgggcggcc tcagtgagcg 6540
agcgagcgcg cagagagtat acatcgatgt gagttcgcgg gtggctgggg ggccctgggc 6600
tgcgaccgcc cccgaaccgc gtctacgagc cttgcgggct ccgggtcttt gcagtcgtat 6660
gggggcaggg tagctgttcc ccgcaaggag agctcaaggt cagcgctcgg acctggcgga 6720
gccccgcacc caggctgtgg cgccctgtgc agctccgccc ttgcggcgcc atctgcccgg 6780
agcctccttc ccctagtccc cagaaacagg aggtccctac tcccgcccga gatcccgacc 6840
cggaccccta ggtgggggac gctttctttc ctttcgcgct ctgcggggtc acgtgtcgca 6900
gaggagcccc tcccccacgg cctccggcac cgcaggcccc gggatgctag tgcgcagcgg 6960
gtgcatccct gtccggatgc tgcgcctgcg gtagagcggc cgccatgttg caaccgggaa 7020
ggaaatgaat gggcagccgt taggaaagcc tgccggtgac taaccctgcg ctcctgcctc 7080
gatgggtgga gtcgcgtgtg gcggggaagt caggtggagc gaggctagct ggcccgattt 7140
ctcctccggg tgatgctttt cctagattat tctctggtaa atcaaagaag tgggtttatg 7200
gaggtcctct tgtgtcccct ccccgcagag gtgtggtggc tgtggcatgg tgccaagccg 7260
ggagaagctg agtcatgggt agttggaaaa ggacatttcc accgcaaaat ggcccctctg 7320
gtggtggccc cttcctgcag cgccggctca cctcacggcc ccgcccttcc cctgccagcc 7380
tagcgttgac ccgaccccaa aggccaggct gtaaatgtca ccgggaggat tgggtgtctg 7440
ggcgcctcgg ggaacctgcc cttctcccca ttccgtcttc cggaaaccag atctcccacc 7500
gcaccctggt ctgaggttaa atatagctgc tgacctttct gtagctgggg gcctgggctg 7560
gggctctctc ccatcccttc tccccacaca catgcactta cctgtgctcc cactcctgat 7620
ttctggaaaa gagctaggaa ggacaggcaa cttggcaaat caaagccctg ggactagggg 7680
gttaaaatac agcttcccct cttcccaccc gccccagtct ctgtcccttt tgtaggaggg 7740
acttagagaa ggggtgggct tgccctgtcc agttaatttc tgacctttac tcctgccctt 7800
tgagtttgat gatgctgagt gtacaagcgt tttctcccta aagggtgcag ctgagctagg 7860
cagcagcaag cattcctggg gtggcatagt ggggtggtga ataccatgta caaagcttgt 7920
gcccagactg tgggtggcag tgccccacat ggccgcttct cctggaaggg cttcgtatga 7980
ctgggggtgt tgggcagccc tggagccttc agttgcagcc atgccttaag ccaggccagc 8040
ctggcaggga agctcaaggg agataaaatt caacctcttg ggccctcctg ggggtaagga 8100
gatgctgcat tcgccctctt aatggggagg tggcctaggg ctgctcacat attctggagg 8160
agcctcccct cctcatgcct tcttgcctct tgtctcttag gcatgcaaaa gagtcgaata 8220
agggcgacac aaaatttatt ctaaatgcat aataaatact gataacatct tatagtttgt 8280
attatatttt gtattatcgt tgacatgtat aattttgata tcaaaaactg attttccctt 8340
tattattttc gagatttatt ttcttaattc tctttaacaa actagaaata ttgtatatac 8400
aaaaaatcat aaataataga tgaatagttt aattataggt gttcatcaat cgaaaaagca 8460
acgtatctta tttaaagtgc gttgcttttt tctcatttat aaggttaaat aattctcata 8520
tatcaagcaa agtgacaggc gcccttaaat attctgacaa atgctctttc cctaaactcc 8580
ccccataaaa aaacccgccg aagcgggttt ttacgttatt tgcggattaa cgattactcg 8640
ttatcagaac cgcccagggg gcccgagctt aagactggcc gtcgttttac aacacagaaa 8700
gagtttgtag aaacgcaaaa aggccatccg tcaggggcct tctgcttagt ttgatgcctg 8760
gcagttccct actctcgcct tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc 8820
ggctgcggcg agcggtatca gctcactcaa aggcggtaat acggttatcc acagaatcag 8880
gggataacgc aggaaagaac atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa 8940
aggccgcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat cacaaaaatc 9000
gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag gcgtttcccc 9060
ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga tacctgtccg 9120
cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg tatctcagtt 9180
cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt cagcccgacc 9240
gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac gacttatcgc 9300
cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag 9360
agttcttgaa gtggtgggct aactacggct acactagaag aacagtattt ggtatctgcg 9420
ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa 9480
ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag 9540
gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg aacgacgcgc 9600
gcgtaactca cgttaaggga ttttggtcat gagcttgcgc cgtcccgtca agtcagcgta 9660
atgctctgct taggtggcgg tacttgggtc gatatcaaag tgcatcactt cttcccgtat 9720
gcccaacttt gtatagagag ccactgcggg atcgtcaccg taatctgctt gcacgtagat 9780
cacataagca ccaagcgcgt tggcctcatg cttgaggaga ttgatgagcg cggtggcaat 9840
gccctgcctc cggtgctcgc cggagactgc gagatcatag atatagatct cactacgcgg 9900
ctgctcaaac ttgggcagaa cgtaagccgc gagagcgcca acaaccgctt cttggtcgaa 9960
ggcagcaagc gcgatgaatg tcttactacg gagcaagttc ccgaggtaat cggagtccgg 10020
ctgatgttgg gagtaggtgg ctacgtcacc gaactcacga ccgaaaagat caagagcagc 10080
ccgcatggat ttgacttggt cagggccgag cctacatgtg cgaatgatgc ccatacttga 10140
gccacctaac tttgttttag ggcgactgcc ctgctgcgta acatcgttgc tgctccataa 10200
catcaaacat cgacccacgg cgtaacgcgc ttgctgcttg gatgcccgag gcatagactg 10260
tacaaaaaaa cagtcataac aagccatgaa aaccgccact gcgccgttac caccgctgcg 10320
ttcggtcaag gttctggacc agttgcgtga gcgcattttt ttttcctcct cggcgtttac 10380
gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct gccgacatgg 10440
aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac cttgtcgcct 10500
tgcgtataat atttgcccat agtgaaaacg ggggcgaaga agttgtccat attggccacg 10560
tttaaatcaa aactggtgaa actcacccag ggattggcgc tgacgaaaaa catattctca 10620
ataaaccctt 10630
<210> 2
<211> 130
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 2
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct 130
<210> 3
<211> 133
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 3
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120
gagcgcgcag aga 133
<210> 4
<211> 503
<212> DNA
<213> Human cytomegalovirus
<400> 4
acgcgtttac ataacttacg gtaaatggcc cgcctggctg accgcccaac gacccccgcc 60
cattgacgtc aataatgacg tatgttccca tagtaacgcc aatagggact ttccattgac 120
gtcaatgggt ggactattta cggtaaactg cccacttggc agtacatcaa gtgtatcata 180
tgccaagtac gccccctatt gacgtcaatg acggtaaatg gcccgcctgg cattatgccc 240
agtacatgac cttatgggac tttcctactt ggcagtacat ctacgtatta gtcatcgcta 300
ttaccatggt gatgcggttt tggcagtaca tcaatgggcg tggatagcgg tttgactcac 360
ggggatttcc aagtctccac cccattgacg tcaatgggag tttgttttgg caccaaaatc 420
aacgggactt tccaaaatgt cgtaacaact ccgccccatt gacgcaaatg ggcggtaggc 480
gtgtacggtg ggaggtctat ata 503
<210> 5
<211> 723
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 5
atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 60
ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga tgccacctac 120
ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc ctggcccacc 180
ctcgtgacca ccctgaccta cggcgtgcag tgcttcagcc gctaccccga ccacatgaag 240
cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg caccatcttc 300
ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 360
gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 420
aagctggagt acaactacaa cagccacaac gtctatatca tggccgacaa gcagaagaac 480
ggcatcaagg tgaacttcaa gatccgccac aacatcgagg acggcagcgt gcagctcgcc 540
gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 600
tacctgagca cccagtccgc cctgagcaaa gaccccaacg agaagcgcga tcacatggtc 660
ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaagtaa 720
tag 723
<210> 6
<211> 575
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 6
gcccctctcc ctcccccccc cctaacgtta ctggccgaag ccgcttggaa taaggccggt 60
gtgcgtttgt ctatatgtta ttttccacca tattgccgtc ttttggcaat gtgagggccc 120
ggaaacctgg ccctgtcttc ttgacgagca ttcctagggg tctttcccct ctcgccaaag 180
gaatgcaagg tctgttgaat gtcgtgaagg aagcagttcc tctggaagct tcttgaagac 240
aaacaacgtc tgtagcgacc ctttgcaggc agcggaaccc cccacctggc gacaggtgcc 300
tctgcggcca aaagccacgt gtataagata cacctgcaaa ggcggcacaa ccccagtgcc 360
acgttgtgag ttggatagtt gtggaaagag tcaaatggct cacctcaagc gtattcaaca 420
aggggctgaa ggatgcccag aaggtacccc attgtatggg atctgatctg gggcctcggt 480
gcacatgctt tacatgtgtt tagtcgaggt taaaaaacgt ctaggccccc cgaaccacgg 540
ggacgtggtt ttcctttgaa aaacacgatg ataat 575
<210> 7
<211> 1560
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 7
atgctgctgc tgctgctgct gctgggcctg aggctacagc tctccctggg catcatccca 60
gttgaggagg agaacccgga cttctggaac cgcgaggcag ccgaggccct gggtgccgcc 120
aagaagctgc agcctgcaca gacagccgcc aagaacctca tcatcttcct gggcgatggg 180
atgggggtgt ctacggtgac agctgccagg atcctaaaag ggcagaagaa ggacaaactg 240
gggcctgaga tacccctggc catggaccgc ttcccatatg tggctctgtc caagacatac 300
aatgtagaca aacatgtgcc agacagtgga gccacagcca cggcctacct gtgcggggtc 360
aagggcaact tccagaccat tggcttgagt gcagccgccc gctttaacca gtgcaacacg 420
acacgcggca acgaggtcat ctccgtgatg aatcgggcca agaaagcagg gaagtcagtg 480
ggagtggtaa ccaccacacg agtgcagcac gcctcgccag ccggcaccta cgcccacacg 540
gtgaaccgca actggtactc ggacgccgac gtgcctgcct cggcccgcca ggaggggtgc 600
caggacatcg ctacgcagct catctccaac atggacattg acgtgatcct aggtggaggc 660
cgaaagtaca tgtttcgcat gggaacccca gaccctgagt acccagatga ctacagccaa 720
ggtgggacca ggctggacgg gaagaatctg gtgcaggaat ggctggcgaa gcgccagggt 780
gcccggtatg tgtggaaccg cactgagctc atgcaggctt ccctggaccc gtctgtgacc 840
catctcatgg gtctctttga gcctggagac atgaaatacg agatccaccg agactccaca 900
ctggacccct ccctgatgga gatgacagag gctgccctgc gcctgctgag caggaacccc 960
cgcggcttct tcctcttcgt ggagggtggt cgcatcgacc atggtcatca tgaaagcagg 1020
gcttaccggg cactgactga gacgatcatg ttcgacgacg ccattgagag ggcgggccag 1080
ctcaccagcg aggaggacac gctgagcctc gtcactgccg accactccca cgtcttctcc 1140
ttcggaggct accccctgcg agggagctcc atcttcgggc tggcccctgg caaggcccgg 1200
gacaggaagg cctacacggt cctcctatac ggaaacggtc caggctatgt gctcaaggac 1260
ggcgcccggc cggatgttac cgagagcgag agcgggagcc ccgagtatcg gcagcagtca 1320
gcagtgcccc tggacgaaga gacccacgca ggcgaggacg tggcggtgtt cgcgcgcggc 1380
ccgcaggcgc acctggttca cggcgtgcag gagcagacct tcatagcgca cgtcatggcc 1440
ttcgccgcct gcctggagcc ctacaccgcc tgcgacctgg cgccccccgc cggcaccacc 1500
gacgccgcgc acccgggtta ctctagagtc ggggcggccg gccgcttcga gcagacatga 1560
<210> 8
<211> 168
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 8
agatctttta aaaaacctcc cacacaattg ttgttgttaa cttgtttatt gcagcttata 60
atggttacaa ataaagcaat agcatcacaa atttcacaaa taaagcattt ttttcactgc 120
attctagttg tggtttgtcc aaactcatca atgtatctta tcatgtct 168
<210> 9
<211> 1632
<212> DNA
<213> Homo sapiens
<400> 9
gtgagttcgc gggtggctgg ggggccctgg gctgcgaccg cccccgaacc gcgtctacga 60
gccttgcggg ctccgggtct ttgcagtcgt atgggggcag ggtagctgtt ccccgcaagg 120
agagctcaag gtcagcgctc ggacctggcg gagccccgca cccaggctgt ggcgccctgt 180
gcagctccgc ccttgcggcg ccatctgccc ggagcctcct tcccctagtc cccagaaaca 240
ggaggtccct actcccgccc gagatcccga cccggacccc taggtggggg acgctttctt 300
tcctttcgcg ctctgcgggg tcacgtgtcg cagaggagcc cctcccccac ggcctccggc 360
accgcaggcc ccgggatgct agtgcgcagc gggtgcatcc ctgtccggat gctgcgcctg 420
cggtagagcg gccgccatgt tgcaaccggg aaggaaatga atgggcagcc gttaggaaag 480
cctgccggtg actaaccctg cgctcctgcc tcgatgggtg gagtcgcgtg tggcggggaa 540
gtcaggtgga gcgaggctag ctggcccgat ttctcctccg ggtgatgctt ttcctagatt 600
attctctggt aaatcaaaga agtgggttta tggaggtcct cttgtgtccc ctccccgcag 660
aggtgtggtg gctgtggcat ggtgccaagc cgggagaagc tgagtcatgg gtagttggaa 720
aaggacattt ccaccgcaaa atggcccctc tggtggtggc cccttcctgc agcgccggct 780
cacctcacgg ccccgccctt cccctgccag cctagcgttg acccgacccc aaaggccagg 840
ctgtaaatgt caccgggagg attgggtgtc tgggcgcctc ggggaacctg cccttctccc 900
cattccgtct tccggaaacc agatctccca ccgcaccctg gtctgaggtt aaatatagct 960
gctgaccttt ctgtagctgg gggcctgggc tggggctctc tcccatccct tctccccaca 1020
cacatgcact tacctgtgct cccactcctg atttctggaa aagagctagg aaggacaggc 1080
aacttggcaa atcaaagccc tgggactagg gggttaaaat acagcttccc ctcttcccac 1140
ccgccccagt ctctgtccct tttgtaggag ggacttagag aaggggtggg cttgccctgt 1200
ccagttaatt tctgaccttt actcctgccc tttgagtttg atgatgctga gtgtacaagc 1260
gttttctccc taaagggtgc agctgagcta ggcagcagca agcattcctg gggtggcata 1320
gtggggtggt gaataccatg tacaaagctt gtgcccagac tgtgggtggc agtgccccac 1380
atggccgctt ctcctggaag ggcttcgtat gactgggggt gttgggcagc cctggagcct 1440
tcagttgcag ccatgcctta agccaggcca gcctggcagg gaagctcaag ggagataaaa 1500
ttcaacctct tgggccctcc tgggggtaag gagatgctgc attcgccctc ttaatgggga 1560
ggtggcctag ggctgctcac atattctgga ggagcctccc ctcctcatgc cttcttgcct 1620
cttgtctctt ag 1632
<210> 10
<211> 100
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<221> modified_base
<222> (1)..(100)
<223> a, c, t, g, unknown or other
<220>
<221> misc_feature
<222> (1)..(100)
<223> This sequence may encompass 60-100 nucleotides
<400> 10
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 60
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 100
<210> 11
<211> 1845
<212> DNA
<213> Adeno-associated virus
<400> 11
atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60
ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120
tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180
cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240
caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300
aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360
taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420
gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480
acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540
aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600
gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660
tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720
cagtggatcc aggaaaatca ggagagctac ctctccttca actccaccgg caactctcgg 780
agccagatca aggccgcgct cgacaacgcg accaaaatta tgagtctgac aaaaagcgcg 840
gtggactacc tcgtggggag ctccgttccc gaggacattt caaaaaacag aatctggcaa 900
atttttgaga tgaatggcta cgacccggcc tacgcgggat ccatcctcta cggctggtgt 960
cagcgctcct tcaacaagag gaacaccgtc tggctctacg gacccgccac gaccggcaag 1020
accaacatcg cggaggccat cgcccacact gtgccctttt acggctgcgt gaactggacc 1080
aatgaaaact ttccctttaa tgactgtgtg gacaaaatgc tcatttggtg ggaggaggga 1140
aagatgacca acaaggtggt tgaatccgcc aaggccatcc tggggggctc aaaggtgcgg 1200
gtcgatcaga aatgtaaatc ctctgttcaa attgattcta cccctgtcat tgtaacttcc 1260
aatacaaaca tgtgtgtggt ggtggatggg aattccacga cctttgaaca ccagcagccg 1320
ctggaggacc gcatgttcaa atttgaactg actaagcggc tcccgccaga ttttggcaag 1380
attactaagc aggaagtcaa ggactttttt gcttgggcaa aggtcaatca ggtgccggtg 1440
actcacgagt ttaaagttcc cagggaattg gcgggaacta aaggggcgga gaaatctcta 1500
aaacgcccac tgggtgacgt caccaatact agctataaaa gtctggagaa gcgggccagg 1560
ctctcatttg ttcccgagac gcctcgcagt tcagacgtga ctgttgatcc cgctcctctg 1620
cgaccgctca attggaattc aaggtatgat tgcaaatgtg actatcatgc tcaatttgac 1680
aacatttcta acaaatgtga tgaatgtgaa tatttgaatc ggggcaaaaa tggatgtatc 1740
tgtcacaatg taactcactg tcaaatttgt catgggattc ccccctggga aaaggaaaac 1800
ttgtcagatt ttggggattt tgacgatgcc aataaagaac agtaa 1845
<210> 12
<211> 1866
<212> DNA
<213> Adeno-associated virus
<400> 12
atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60
ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120
tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180
cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240
caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300
aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360
taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420
gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480
acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540
aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600
gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660
tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720
cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780
tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840
cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900
attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960
acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020
accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080
aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140
aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200
gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260
aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320
ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380
gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440
gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500
gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560
gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620
aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680
ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740
tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800
ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860
caataa 1866
<210> 13
<211> 2211
<212> DNA
<213> Adeno-associated virus
<400> 13
atggctgccg atggttatct tccagattgg ctcgaggaca accttagtga aggaattcgc 60
gagtggtggg ctttgaaacc tggagcccct caacccaagg caaatcaaca acatcaagac 120
aacgctcgag gtcttgtgct tccgggttac aaataccttg gacccggcaa cggactcgac 180
aagggggagc cggtcaacgc agcagacgcg gcggccctcg agcacgacaa ggcctacgac 240
cagcagctca aggccggaga caacccgtac ctcaagtaca accacgccga cgccgagttc 300
caggagcggc tcaaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360
gccaaaaaga ggcttcttga acctcttggt ctggttgagg aagcggctaa gacggctcct 420
ggaaagaaga ggcctgtaga gcagtctcct caggaaccgg actcctccgc gggtattggc 480
aaatcgggtg cacagcccgc taaaaagaga ctcaatttcg gtcagactgg cgacacagag 540
tcagtcccag accctcaacc aatcggagaa cctcccgcag ccccctcagg tgtgggatct 600
cttacaatgg cttcaggtgg tggcgcacca gtggcagaca ataacgaagg tgccgatgga 660
gtgggtagtt cctcgggaaa ttggcattgc gattcccaat ggctggggga cagagtcatc 720
accaccagca cccgaacctg ggccctgccc acctacaaca atcacctcta caagcaaatc 780
tccaacagca catctggagg atcttcaaat gacaacgcct acttcggcta cagcaccccc 840
tgggggtatt ttgacttcaa cagattccac tgccacttct caccacgtga ctggcagcga 900
ctcatcaaca acaactgggg attccggcct aagcgactca acttcaagct cttcaacatt 960
caggtcaaag aggttacgga caacaatgga gtcaagacca tcgccaataa ccttaccagc 1020
acggtccagg tcttcacgga ctcagactat cagctcccgt acgtgctcgg gtcggctcac 1080
gagggctgcc tcccgccgtt cccagcggac gttttcatga ttcctcagta cgggtatctg 1140
acgcttaatg atggaagcca ggccgtgggt cgttcgtcct tttactgcct ggaatatttc 1200
ccgtcgcaaa tgctaagaac gggtaacaac ttccagttca gctacgagtt tgagaacgta 1260
cctttccata gcagctacgc tcacagccaa agcctggacc gactaatgaa tccactcatc 1320
gaccaatact tgtactatct ctcaaagact attaacggtt ctggacagaa tcaacaaacg 1380
ctaaaattca gtgtggccgg acccagcaac atggctgtcc agggaagaaa ctacatacct 1440
ggacccagct accgacaaca acgtgtctca accactgtga ctcaaaacaa caacagcgaa 1500
tttgcttggc ctggagcttc ttcttgggct ctcaatggac gtaatagctt gatgaatcct 1560
ggacctgcta tggccagcca caaagaagga gaggaccgtt tctttccttt gtctggatct 1620
ttaatttttg gcaaacaagg aactggaaga gacaacgtgg atgcggacaa agtcatgata 1680
accaacgaag aagaaattaa aactactaac ccggtagcaa cggagtccta tggacaagtg 1740
gccacaaacc accagagtgc ccaagcacag gcgcagaccg gctgggttca aaaccaagga 1800
atacttccgg gtatggtttg gcaggacaga gatgtgtacc tgcaaggacc catttgggcc 1860
aaaattcctc acacggacgg caactttcac ccttctccgc tgatgggagg gtttggaatg 1920
aagcacccgc ctcctcagat cctcatcaaa aacacacctg tacctgcgga tcctccaacg 1980
gccttcaaca aggacaagct gaactctttc atcacccagt attctactgg ccaagtcagc 2040
gtggagatcg agtgggagct gcagaaggaa aacagcaagc gctggaaccc ggagatccag 2100
tacacttcca actattacaa gtctaataat gttgaatttg ctgttaatac tgaaggtgta 2160
tatagtgaac cccgccccat tggcaccaga tacctgactc gtaatctgta a 2211
<210> 14
<211> 12003
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 14
aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga 60
cgcgcgcgta actcacgtta agggattttg gtcatgagct tgcgccgtcc cgtcaagtca 120
gcgtaatgct ctgcttttag aaaaactcat cgagcatcaa atgaaactgc aatttattca 180
tatcaggatt atcaatacca tatttttgaa aaagccgttt ctgtaatgaa ggagaaaact 240
caccgaggca gttccatagg atggcaagat cctggtatcg gtctgcgatt ccgactcgtc 300
caacatcaat acaacctatt aatttcccct cgtcaaaaat aaggttatca agtgagaaat 360
caccatgagt gacgactgaa tccggtgaga atggcaaaag tttatgcatt tctttccaga 420
cttgttcaac aggccagcca ttacgctcgt catcaaaatc actcgcatca accaaaccgt 480
tattcattcg tgattgcgcc tgagcgaggc gaaatacgcg atcgctgtta aaaggacaat 540
tacaaacagg aatcgagtgc aaccggcgca ggaacactgc cagcgcatca acaatatttt 600
cacctgaatc aggatattct tctaatacct ggaacgctgt ttttccgggg atcgcagtgg 660
tgagtaacca tgcatcatca ggagtacgga taaaatgctt gatggtcgga agtggcataa 720
attccgtcag ccagtttagt ctgaccatct catctgtaac atcattggca acgctacctt 780
tgccatgttt cagaaacaac tctggcgcat cgggcttccc atacaagcga tagattgtcg 840
cacctgattg cccgacatta tcgcgagccc atttataccc atataaatca gcatccatgt 900
tggaatttaa tcgcggcctc gacgtttccc gttgaatatg gctcatattc ttcctttttc 960
aatattattg aagcatttat cagggttatt gtctcatgag cggatacata tttgaatgta 1020
tttagaaaaa taaacaaata ggggtcagtg ttacaaccaa ttaaccaatt ctgaacatta 1080
tcgcgagccc atttatacct gaatatggct cataacaccc cttgtttgcc tggcggcagt 1140
agcgcggtgg tcccacctga ccccatgccg aactcagaag tgaaacgccg tagcgccgat 1200
ggtagtgtgg ggactcccca tgcgagagta gggaactgcc aggcatcaaa taaaacgaaa 1260
ggctcagtcg aaagactggg cctttcgccc gggctaatta gggggtgtcg cccttcgctg 1320
aaggggtgcg cggatccgta tacgtttaaa cgcggccgcg gtacccaact ccatgctcaa 1380
cagtccccag gtacagccca ccctgcgtcg caaccaggaa cagctctaca gcttcctgga 1440
gcgccactcg ccctacttcc gcagccacag tgcgcagatt aggagcgcca cttctttttg 1500
tcacttgaaa aacatgtaaa aataatgtac tagagacact ttcaataaag gcaaatgctt 1560
ttatttgtac actctcgggt gattatttac ccccaccctt gccgtctgcg ccgtttaaaa 1620
atcaaagggg ttctgccgcg catcgctatg cgccactggc agggacacgt tgcgatactg 1680
gtgtttagtg ctccacttaa actcaggcac aaccatccgc ggcagctcgg tgaagttttc 1740
actccacagg ctgcgcacca tcaccaacgc gtttagcagg tcgggcgccg atatcttgaa 1800
gtcgcagttg gggcctccgc cctgcgcgcg cgagttgcga tacacagggt tgcagcactg 1860
gaacactatc agcgccgggt ggtgcacgct ggccagcacg ctcttgtcgg agatcagatc 1920
cgcgtccagg tcctccgcgt tgctcagggc gaacggagtc aactttggta gctgccttcc 1980
caaaaagggc gcgtgcccag gctttgagtt gcactcgcac cgtagtggca tcaaaaggtg 2040
accgtgcccg gtctgggcgt taggatacag cgcctgcata aaagccttga tctgcttaaa 2100
agccacctga gcctttgcgc cttcagagaa gaacatgccg caagacttgc cggaaaactg 2160
attggccgga caggccgcgt cgtgcacgca gcaccttgcg tcggtgttgg agatctgcac 2220
cacatttcgg ccccaccggt tcttcacgat cttggccttg ctagactgct ccttcagcgc 2280
gcgctgcccg ttttcgctcg tcacatccat ttcaatcacg tgctccttat ttatcataat 2340
gcttccgtgt agacacttaa gctcgccttc gatctcagcg cagcggtgca gccacaacgc 2400
gcagcccgtg ggctcgtgat gcttgtaggt cacctctgca aacgactgca ggtacgcctg 2460
caggaatcgc cccatcatcg tcacaaaggt cttgttgctg gtgaaggtca gctgcaaccc 2520
gcggtgctcc tcgttcagcc aggtcttgca tacggccgcc agagcttcca cttggtcagg 2580
cagtagtttg aagttcgcct ttagatcgtt atccacgtgg tacttgtcca tcagcgcgcg 2640
cgcagcctcc atgcccttct cccacgcaga cacgatcggc acactcagcg ggttcatcac 2700
cgtaatttca ctttccgctt cgctgggctc ttcctcttcc tcttgcgtcc gcataccacg 2760
cgccactggg tcgtcttcat tcagccgccg cactgtgcgc ttacctcctt tgccatgctt 2820
gattagcacc ggtgggttgc tgaaacccac catttgtagc gccacatctt ctctttcttc 2880
ctcgctgtcc acgattacct ctggtgatgg cgggcgctcg ggcttgggag aagggcgctt 2940
ctttttcttc ttgggcgcaa tggccaaatc cgccgccgag gtcgatggcc gcgggctggg 3000
tgtgcgcggc accagcgcgt cttgtgatga gtcttcctcg tcctcggact cgatacgccg 3060
cctcatccgc ttttttgggg gcgcccgggg aggcggcggc gacggggacg gggacgacac 3120
gtcctccatg gttgggggac gtcgcgccgc accgcgtccg cgctcggggg tggtttcgcg 3180
ctgctcctct tcccgactgg ccatttcctt ctcctatagg cagaaaaaga tcatggagtc 3240
agtcgagaag aaggacagcc taaccgcccc ctctgagttc gccaccaccg cctccaccga 3300
tgccgccaac gcgcctacca ccttccccgt cgaggcaccc ccgcttgagg aggaggaagt 3360
gattatcgag caggacccag gttttgtaag cgaagacgac gaggaccgct cagtaccaac 3420
agaggataaa aagcaagacc aggacaacgc agaggcaaac gaggaacaag tcgggcgggg 3480
ggacgaaagg catggcgact acctagatgt gggagacgac gtgctgttga agcatctgca 3540
gcgccagtgc gccattatct gcgacgcgtt gcaagagcgc agcgatgtgc ccctcgccat 3600
agcggatgtc agccttgcct acgaacgcca cctattctca ccgcgcgtac cccccaaacg 3660
ccaagaaaac ggcacatgcg agcccaaccc gcgcctcaac ttctaccccg tatttgccgt 3720
gccagaggtg cttgccacct atcacatctt tttccaaaac tgcaagatac ccctatcctg 3780
ccgtgccaac cgcagccgag cggacaagca gctggccttg cggcagggcg ctgtcatacc 3840
tgatatcgcc tcgctcaacg aagtgccaaa aatctttgag ggtcttggac gcgacgagaa 3900
gcgcgcggca aacgctctgc aacaggaaaa cagcgaaaat gaaagtcact ctggagtgtt 3960
ggtggaactc gagggtgaca acgcgcgcct agccgtacta aaacgcagca tcgaggtcac 4020
ccactttgcc tacccggcac ttaacctacc ccccaaggtc atgagcacag tcatgagtga 4080
gctgatcgtg cgccgtgcgc agcccctgga gagggatgca aatttgcaag aacaaacaga 4140
ggagggccta cccgcagttg gcgacgagca gctagcgcgc tggcttcaaa cgcgcgagcc 4200
tgccgacttg gaggagcgac gcaaactaat gatggccgca gtgctcgtta ccgtggagct 4260
tgagtgcatg cagcggttct ttgctgaccc ggagatgcag cgcaagctag aggaaacatt 4320
gcactacacc tttcgacagg gctacgtacg ccaggcctgc aagatctcca acgtggagct 4380
ctgcaacctg gtctcctacc ttggaatttt gcacgaaaac cgccttgggc aaaacgtgct 4440
tcattccacg ctcaagggcg aggcgcgccg cgactacgtc cgcgactgcg tttacttatt 4500
tctatgctac acctggcaga cggccatggg cgtttggcag cagtgcttgg aggagtgcaa 4560
cctcaaggag ctgcagaaac tgctaaagca aaacttgaag gacctatgga cggccttcaa 4620
cgagcgctcc gtggccgcgc acctggcgga catcattttc cccgaacgcc tgcttaaaac 4680
cctgcaacag ggtctgccag acttcaccag tcaaagcatg ttgcagaact ttaggaactt 4740
tatcctagag cgctcaggaa tcttgcccgc cacctgctgt gcacttccta gcgactttgt 4800
gcccattaag taccgcgaat gccctccgcc gctttggggc cactgctacc ttctgcagct 4860
agccaactac cttgcctacc actctgacat aatggaagac gtgagcggtg acggtctact 4920
ggagtgtcac tgtcgctgca acctatgcac cccgcaccgc tccctggttt gcaattcgca 4980
gctgcttaac gaaagtcaaa ttatcggtac ctttgagctg cagggtccct cgcctgacga 5040
aaagtccgcg gctccggggt tgaaactcac tccggggctg tggacgtcgg cttaccttcg 5100
caaatttgta cctgaggact accacgccca cgagattagg ttctacgaag accaatcccg 5160
cccgccaaat gcggagctta ccgcctgcgt cattacccag ggccacattc ttggccaatt 5220
gcaagccatc aacaaagccc gccaagagtt tctgctacga aagggacggg gggtttactt 5280
ggacccccag tccggcgagg agctcaaccc aatccccccg ccgccgcagc cctatcagca 5340
gcagccgcgg gcccttgctt cccaggatgg cacccaaaaa gaagctgcag ctgccgccgc 5400
cacccacgga cgaggaggaa tactgggaca gtcaggcaga ggaggttttg gacgaggagg 5460
aggaggacat gatggaagac tgggagagcc tagacgagga agcttccgag gtcgaagagg 5520
tgtcagacga aacaccgtca ccctcggtcg cattcccctc gccggcgccc cagaaatcgg 5580
caaccggttc cagcatggct acaacctccg ctcctcaggc gccgccggca ctgcccgttc 5640
gccgacccaa ccgtagatgg gacaccactg gaaccagggc cggtaagtcc aagcagccgc 5700
cgccgttagc ccaagagcaa caacagcgcc aaggctaccg ctcatggcgc gggcacaaga 5760
acgccatagt tgcttgcttg caagactgtg ggggcaacat ctccttcgcc cgccgctttc 5820
ttctctacca tcacggcgtg gccttccccc gtaacatcct gcattactac cgtcatctct 5880
acagcccata ctgcaccggc ggcagcggca gcggcagcaa cagcagcggc cacacagaag 5940
caaaggcgac cggatagcaa gactctgaca aagcccaaga aatccacagc ggcggcagca 6000
gcaggaggag gagcgctgcg tctggcgccc aacgaacccg tatcgacccg cgagcttaga 6060
aacaggattt ttcccactct gtatgctata tttcaacaga gcaggggcca agaacaagag 6120
ctgaaaataa aaaacaggtc tctgcgatcc ctcacccgca gctgcctgta tcacaaaagc 6180
gaagatcagc ttcggcgcac gctggaagac gcggaggctc tcttcagtaa atactgcgcg 6240
ctgactctta aggactagtt tcgcgccctt tctcaaattt aagcgcgaaa actacgtcat 6300
ctccagcggc cacacccggc gccagcacct gtcgtcagcg ccattatgag caaggaaatt 6360
cccacgccct acatgtggag ttaccagcca caaatgggac ttgcggctgg agctgcccaa 6420
gactactcaa cccgaataaa ctacatgagc gcgggacccc acatgatatc ccgggtcaac 6480
ggaatccgcg cccaccgaaa ccgaattctc ttggaacagg cggctattac caccacacct 6540
cgtaataacc ttaatccccg tagttggccc gctgccctgg tgtaccagga aagtcccgct 6600
cccaccactg tggtacttcc cagagacgcc caggccgaag ttcagatgac taactcaggg 6660
gcgcagcttg cgggcggctt tcgtcacagg gtgcggtcgc ccgggcgacg taggttttag 6720
ggcggagtaa cttgtatgtg ttgggaattg tagttttctt aaaatgggaa gttacgtaac 6780
gtgggaaaac ggaagtgacg atttgaggaa gttgtgggtt ttttggcttt cgtttctggg 6840
cgtaggttcg cgtgcggttt tctgggtgtt ttttgtggac tttaaccgtt acgtcatttt 6900
ttagtcctat atatactcgc tctgcacttg gccctttttt acactgtgac tgattgagct 6960
ggtgccgtgt cgagtggtgt ttttttaata ggttttcttt tttactggta aggctgactg 7020
ttatggctgc cgctgtggaa gcgctgtatg ttgttctgga gcgggagggt gctattttgc 7080
ctaggcagga gggtttttca ggtgtttatg tgtttttctc tcctattaat tttgttatac 7140
ctcctatggg ggctgtaatg ttgtctctac gcctgcgggt atgtattccc ccgggctatt 7200
tcggtcgctt tttagcactg accgatgtga atcaacctga tgtgtttacc gagtcttaca 7260
ttatgactcc ggacatgacc gaggagctgt cggtggtgct ttttaatcac ggtgaccagt 7320
ttttttacgg tcacgccggc atggccgtag tccgtcttat gcttataagg gttgtttttc 7380
ctgttgtaag acaggcttct aatgtttaaa tgtttttttg ttattttatt ttgtgtttat 7440
gcagaaaccc gcagacatgt ttgagagaaa aatggtgtct ttttctgtgg tggttccgga 7500
gcttacctgc ctttatctgc atgagcatga ctacgatgtg ctttcttttt tgcgcgaggc 7560
tttgcctgat tttttgagca gcaccttgca ttttatatcg ccgcccatgc aacaagctta 7620
catcggggct acgctggtta gcatagctcc gagtatgcgt gtcataatca gtgtgggttc 7680
ttttgtcatg gttcctggcg gggaagtggc cgcgctggtc cgtgcagacc tgcacgatta 7740
tgttcagctg gccctgcgaa gggacctacg ggatcgcggt atttttgtta atgttccgct 7800
tttgaatctt atacaggtct gtgaggaacc tgaatttttg caatcatgat tcgctgcttg 7860
aggctgaagg tggagggcgc tctggagcag atttttacaa tggccggact taatattcgg 7920
gatttgctta gagatatatt gagaaggtgg cgagatgaga attatttggg catggttgaa 7980
ggtgctggaa tgtttataga ggagattcac cctgaagggt ttagccttta cgtccacttg 8040
gacgtgaggg ccgtttgcct tttggaagcc attgtgcaac atcttacaaa tgccattatc 8100
tgttctttgg ctgtagagtt tgaccacgcc accggagggg agcgcgttca cttaatagat 8160
cttcattttg aggttttgga taatcttttg gaataaaaaa aaaaacatgg ttcttccagc 8220
tcttcccgct cctcccgtgt gtgactcgca gaacgaatgt gtaggttggc tgggtgtggc 8280
ttattctgcg gtggtggatg ttatcagggc agcggcgcat gaaggagttt acatagaacc 8340
cgaagccagg gggcgcctgg atgctttgag agagtggata tactacaact actacacaga 8400
gcgatctaag cggcgagacc ggagacgcag atctgtttgt cacgcccgca cctggttttg 8460
cttcaggaaa tatgactacg tccggcgttc catttggcat gacactacga ccaacacgat 8520
ctcggttgtc tcggcgcact ccgtacagta gggatcgtct acctcctttt gagacagaaa 8580
cccgcgctac catactggag gatcatccgc tgctgcccga atgtaacact ttgacaatgc 8640
acaacgtgag ttacgtgcga ggtcttccct gcagtgtggg atttacgctg attcaggaat 8700
gggttgttcc ctgggatatg gttctaacgc gggaggagct tgtaatcctg aggaagtgta 8760
tgcacgtgtg cctgtgttgt gccaacattg atatcatgac gagcatgatg atccatggtt 8820
acgagtcctg ggctctccac tgtcattgtt ccagtcccgg ttccctgcag tgtatagccg 8880
gcgggcaggt tttggccagc tggtttagga tggtggtgga tggcgccatg tttaatcaga 8940
ggtttatatg gtaccgggag gtggtgaatt acaacatgcc aaaagaggta atgtttatgt 9000
ccagcgtgtt tatgaggggt cgccacttaa tctacctgcg cttgtggtat gatggccacg 9060
tgggttctgt ggtccccgcc atgagctttg gatacagcgc cttgcactgt gggattttga 9120
acaatattgt ggtgctgtgc tgcagttact gtgctgattt aagtgagatc agggtgcgct 9180
gctgtgcccg gaggacaagg cgccttatgc tgcgggcggt gcgaatcatc gctgaggaga 9240
ccactgccat gttgtattcc tgcaggacgg agcggcggcg gcagcagttt attcgcgcgc 9300
tgctgcagca ccaccgccct atcctgatgc acgattatga ctctaccccc atgtaggcgt 9360
ggacttctcc ttcgccgccc gttaagcaac cgcaagttgg acagcagcct gtggctcagc 9420
agctggacag cgacatgaac ttaagtgagc tgcccgggga gtttattaat atcactgatg 9480
agcgtttggc tcgacaggaa accgtgtgga atataacacc taagaatatg tctgttaccc 9540
atgatatgat gctttttaag gccagccggg gagaaaggac tgtgtactct gtgtgttggg 9600
agggaggtgg caggttgaat actagggttc tgtgagtttg attaaggtac ggtgatctgt 9660
ataagctatg tggtggtggg gctatactac tgaatgaaaa atgacttgaa attttctgca 9720
attgaaaaat aaacacgttg aaacataaca caaacgattc tttattcttg ggcaatgtat 9780
gaaaaagtgt aagaggatgt ggcaaatatt tcattaatgt agttgtggcc agaccagtcc 9840
catgaaaatg acatagagta tgcacttgga gttgtgtctc ctgtttcctg tgtaccgttt 9900
agtgtaattc aaccgcggat gtcgcccctc ctgacgcggt aggaggaggg gagggtgccc 9960
tgcatgtctg ccgctgctct tgctcttgcc gctgctgagg aggggggcgc atctgccgca 10020
gcaccggatg catctgggaa aagcaaaaaa ggggctcgtc cctgtttccg gaggaatttg 10080
caagcggggt cttgcatgac ggggaggcaa acccccgttc gccgcagtcc ggccggtccg 10140
agactcgaac cgggggtccc gcgactcaac ccttggaaaa taaccctccg gctacaggga 10200
gcgagccact taatgctttc gctttccagc ctaaccgctt acgctgcgcg cggccagtgg 10260
ccaaaaaagc tagcgcagca gccgccgcgc ctggaaggaa gccaaaagga gcactccccc 10320
gttgtctgac gtcgcacacc tgggttcgac acgcgggcgg taaccgcatg gatcacggcg 10380
gacggccgga tacggggctc gaaccccggt cgtccgccat gatacccttg cgaatttatc 10440
caccagacca cggaagagtg cccgcttaca ggctctcctt ttgcacggtc tagagcgtca 10500
acgattgcgc gcgcctgacc ggccagagcg tcccgaccat ggagcacttt ttgccgctgc 10560
gcaacatctg gaaccgcgtc cgcgactttc cgcgcgcctc caccaccgcc gccggcatca 10620
cctggatgtc caggtacatc tacggatatc atttaattaa gtactgtcga cgcgtacaaa 10680
acgtcaaaag ggcgacacaa aatttattct aaatgcataa taaatactga taacatctta 10740
tagtttgtat tatattttgt attatcgttg acatgtataa ttttgatatc aaaaactgat 10800
tttcccttta ttattttcga gatttatttt cttaattctc tttaacaaac tagaaatatt 10860
gtatatacaa aaaatcataa ataatagatg aatagtttaa ttataggtgt tcatcaatcg 10920
aaaaagcaac gtatcttatt taaagtgcgt tgcttttttc tcatttataa ggttaaataa 10980
ttctcatata tcaagcaaag tgacaggcgc ccttaaatat tctgacaaat gctctttccc 11040
taaactcccc ccataaaaaa acccgccgaa gcgggttttt acgttatttg cggattaacg 11100
attactcgtt atcagaaccg cccagggggc ccgagcttaa gactggccgt cgttttacaa 11160
cacagaaaga gtttgtagaa acgcaaaaag gccatccgtc aggggccttc tgcttagttt 11220
gatgcctggc agttccctac tctcgccttc cgcttcctcg ctcactgact cgctgcgctc 11280
ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac 11340
agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa 11400
ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg acgagcatca 11460
caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc 11520
gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata 11580
cctgtccgcc tttctccctt cgggaagcgt ggcgctttct catagctcac gctgtaggta 11640
tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca 11700
gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga 11760
cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg 11820
tgctacagag ttcttgaagt ggtgggctaa ctacggctac actagaagaa cagtatttgg 11880
tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg 11940
caaacaaacc accgctggta gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag 12000
aaa 12003
<210> 15
<211> 17817
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 15
ttagaaaaac tcatcgagca tcaaatgaaa ctgcaattta ttcatatcag gattatcaat 60
accatatttt tgaaaaagcc gtttctgtaa tgaaggagaa aactcaccga ggcagttcca 120
taggatggca agatcctggt atcggtctgc gattccgact cgtccaacat caatacaacc 180
tattaatttc ccctcgtcaa aaataaggtt atcaagtgag aaatcaccat gagtgacgac 240
tgaatccggt gagaatggca aaagtttatg catttctttc cagacttgtt caacaggcca 300
gccattacgc tcgtcatcaa aatcactcgc atcaaccaaa ccgttattca ttcgtgattg 360
cgcctgagcg aggcgaaata cgcgatcgct gttaaaagga caattacaaa caggaatcga 420
gtgcaaccgg cgcaggaaca ctgccagcgc atcaacaata ttttcacctg aatcaggata 480
ttcttctaat acctggaacg ctgtttttcc ggggatcgca gtggtgagta accatgcatc 540
atcaggagta cggataaaat gcttgatggt cggaagtggc ataaattccg tcagccagtt 600
tagtctgacc atctcatctg taacatcatt ggcaacgcta cctttgccat gtttcagaaa 660
caactctggc gcatcgggct tcccatacaa gcgatagatt gtcgcacctg attgcccgac 720
attatcgcga gcccatttat acccatataa atcagcatcc atgttggaat ttaatcgcgg 780
cctcgacgtt tcccgttgaa tatggctcat attcttcctt tttcaatatt attgaagcat 840
ttatcagggt tattgtctca tgagcggata catatttgaa tgtatttaga aaaataaaca 900
aataggggtc agtgttacaa ccaattaacc aattctgaac attatcgcga gcccatttat 960
acctgaatat ggctcataac accccttgtt tgcctggcgg cagtagcgcg gtggtcccac 1020
ctgaccccat gccgaactca gaagtgaaac gccgtagcgc cgatggtagt gtggggactc 1080
cccatgcgag agtagggaac tgccaggcat caaataaaac gaaaggctca gtcgaaagac 1140
tgggcctttc gcccgggcta attagggggt gtcgcccttc gctgaagggg tgaccgtata 1200
cgtttaaact taattaatcg acagaagcac catgtccttg ggtccggcct gctgaatgcg 1260
caggcggtcg gccatgcccc aggcttcgtt ttgacatcgg cgcaggtctt tgtagtagtc 1320
ttgcatgagc ctttctaccg gcacttcttc ttctccttcc tcttgtcctg catctcttgc 1380
atctatcgct gcggcggcgg cggagtttgg ccgtaggtgg cgccctcttc ctcccatgcg 1440
tgtgaccccg aagcccctca tcggctgaag cagggctagg tcggcgacaa cgcgctcggc 1500
taatatggcc tgctgcacct gcgtgagggt agactggaag tcatccatgt ccacaaagcg 1560
gtggtatgcg cccgtgttga tggtgtaagt gcagttggcc ataacggacc agttaacggt 1620
ctggtgaccc ggctgcgaga gctcggtgta cctgagacgc gagtaagccc tcgagtcaaa 1680
tacgtagtcg ttgcaagtcc gcaccaggta ctggtatccc accaaaaagt gcggcggcgg 1740
ctggcggtag aggggccagc gtagggtggc cggggctccg ggggcgagat cttccaacat 1800
aaggcgatga tatccgtaga tgtacctgga catccaggtg atgccggcgg cggtggtgga 1860
ggcgcgcgga aagtcgcgga cgcggttcca gatgttgcgc agcggcaaaa agtgctccat 1920
ggtcgggacg ctctggccgg tcaggcgcgc gcaatcgttg acgctctaga ccgtgcaaaa 1980
ggagagcctg taagcgggca ctcttccgtg gtctggtgga taaattcgca agggtatcat 2040
ggcggacgac cggggttcga gccccgtatc cggccgtccg ccgtgatcca tgcggttacc 2100
gcccgcgtgt cgaacccagg tgtgcgacgt cagacaacgg gggagtgctc cttttggctt 2160
ccttccaggc gcggcggctg ctgcgctagc ttttttggcc actggccgcg cgcagcgtaa 2220
gcggttaggc tggaaagcga aagcattaag tggctcgctc cctgtagccg gagggttatt 2280
ttccaagggt tgagtcgcgg gacccccggt tcgagtctcg gaccggccgg actgcggcga 2340
acgggggttt gcctccccgt catgcaagac cccgcttgca aattcctccg gaaacaggga 2400
cgagcccctt ttttgctttt cccagatgca tccggtgctg cggcagatgc gcccccctcc 2460
tcagcagcgg caagagcaag agcagcggca gacatgcagg gcaccctccc ctcctcctac 2520
cgcgtcagga ggggcgacat ccgcggttga cgcggcagca gatggtgatt acgaaccccc 2580
gcggcgccgg gcccggcact acctggactt ggaggagggc gagggcctgg cgcggctagg 2640
agcgccctct cctgagcggt acccaagggt gcagctgaag cgtgatacgc gtgaggcgta 2700
cgtgccgcgg cagaacctgt ttcgcgaccg cgagggagag gagcccgagg agatgcggga 2760
tcgaaagttc cacgcagggc gcgagctgcg gcatggcctg aatcgcgagc ggttgctgcg 2820
cgaggaggac tttgagcccg acgcgcgaac cgggattagt cccgcgcgcg cacacgtggc 2880
ggccgccgac ctggtaaccg catacgagca gacggtgaac caggagatta actttcaaaa 2940
aagctttaac aaccacgtgc gtacgcttgt ggcgcgcgag gaggtggcta taggactgat 3000
gcatctgtgg gactttgtaa gcgcgctgga gcaaaaccca aatagcaagc cgctcatggc 3060
gcagctgttc cttatagtgc agcacagcag ggacaacgag gcattcaggg atgcgctgct 3120
aaacatagta gagcccgagg gccgctggct gctcgatttg ataaacatcc tgcagagcat 3180
agtggtgcag gagcgcagct tgagcctggc tgacaaggtg gccgccatca actattccat 3240
gcttagcctg ggcaagtttt acgcccgcaa gatataccat accccttacg ttcccataga 3300
caaggaggta aagatcgagg ggttctacat gcgcatggcg ctgaaggtgc ttaccttgag 3360
cgacgacctg ggcgtttatc gcaacgagcg catccacaag gccgtgagcg tgagccggcg 3420
gcgcgagctc agcgaccgcg agctgatgca cagcctgcaa agggccctgg ctggcacggg 3480
cagcggcgat agagaggccg agtcctactt tgacgcgggc gctgacctgc gctgggcccc 3540
aagccgacgc gccctggagg cagctggggc cggacctggg ctggcggtgg cacccgcgcg 3600
cgctggcaac gtcggcggcg tggaggaata tgacgaggac gatgagtacg agccagagga 3660
cggcgagtac taagcggtga tgtttctgat cagatgatgc aagacgcaac ggacccggcg 3720
gtgcgggcgg cgctgcagag ccagccgtcc ggccttaact ccacggacga ctggcgccag 3780
gtcatggacc gcatcatgtc gctgactgcg cgcaatcctg acgcgttccg gcagcagccg 3840
caggccaacc ggctctccgc aattctggaa gcggtggtcc cggcgcgcgc aaaccccacg 3900
cacgagaagg tgctggcgat cgtaaacgcg ctggccgaaa acagggccat ccggcccgac 3960
gaggccggcc tggtctacga cgcgctgctt cagcgcgtgg ctcgttacaa cagcggcaac 4020
gtgcagacca acctggaccg gctggtgggg gatgtgcgcg aggccgtggc gcagcgtgag 4080
cgcgcgcagc agcagggcaa cctgggctcc atggttgcac taaacgcctt cctgagtaca 4140
cagcccgcca acgtgccgcg gggacaggag gactacacca actttgtgag cgcactgcgg 4200
ctaatggtga ctgagacacc gcaaagtgag gtgtaccagt ctgggccaga ctattttttc 4260
cagaccagta gacaaggcct gcagaccgta aacctgagcc aggctttcaa aaacttgcag 4320
gggctgtggg gggtgcgggc tcccacaggc gaccgcgcga ccgtgtctag cttgctgacg 4380
cccaactcgc gcctgttgct gctgctaata gcgcccttca cggacagtgg cagcgtgtcc 4440
cgggacacat acctaggtca cttgctgaca ctgtaccgcg aggccatagg tcaggcgcat 4500
gtggacgagc atactttcca ggagattaca agtgtcagcc gcgcgctggg gcaggaggac 4560
acgggcagcc tggaggcaac cctaaactac ctgctgacca accggcggca gaagatcccc 4620
tcgttgcaca gtttcgcacc ctttggcgca tcccattctc cagtaacttt atgtccatgg 4680
gcgcactcac agacctgggc caaaaccttc tctacgccaa ctccgcccac gcgctagaca 4740
tgacttttga ggtggatccc atggacgagc ccacccttct ttatgttttg tttgaagtct 4800
ttgacgtggt ccgtgtgcac cggccgcacc gcggcgtcat cgaaaccgtg tacctgcgca 4860
cgcccttctc ggccggcaac gccacaacat aaagaagcaa gcaacatcaa caacagctgc 4920
cgccatgggc tccagtgagc aggaactgaa agccattgtc aaagatcttg gttgtgggcc 4980
atattttttg ggcacctatg acaagcgctt tccaggcttt gtttctccac acaagctcgc 5040
ctgcgccata gtcaatacgg ccggtcgcga gactgggggc gtacactgga tggcctttgc 5100
ctggaacccg cactcaaaaa catgctacct ctttgagccc tttggctttt ctgaccagcg 5160
actcaagcag gtttaccagt ttgagtacga gtcactcctg cgccgtagcg ccattgcttc 5220
ttcccccgac cgctgtataa cgctggaaaa gtccacccaa agcgtacagg ggcccaactc 5280
ggccgcctgt ggactattct gctgcatgtt tctccacgcc tttgccaact ggccccaaac 5340
tcccatggat cacaacccca ccatgaacct tattaccggg gtacccaact ccatgctcaa 5400
cagtccccag gtacagccca ccctgcgtcg caaccaggaa cagctctaca gcttcctgga 5460
gcgccactcg ccctacttcc gcagccacag tgcgcagatt aggagcgcca cttctttttg 5520
tcacttgaaa aacatgtaaa aataatgtac tagagacact ttcaataaag gcaaatgctt 5580
ttatttgtac actctcgggt gattatttac ccccaccctt gccgtctgcg ccgtttaaaa 5640
atcaaagggg ttctgccgcg catcgctatg cgccactggc agggacacgt tgcgatactg 5700
gtgtttagtg ctccacttaa actcaggcac aaccatccgc ggcagctcgg tgaagttttc 5760
actccacagg ctgcgcacca tcaccaacgc gtttagcagg tcgggcgccg atatcttgaa 5820
gtcgcagttg gggcctccgc cctgcgcgcg cgagttgcga tacacagggt tgcagcactg 5880
gaacactatc agcgccgggt ggtgcacgct ggccagcacg ctcttgtcgg agatcagatc 5940
cgcgtccagg tcctccgcgt tgctcagggc gaacggagtc aactttggta gctgccttcc 6000
caaaaagggc gcgtgcccag gctttgagtt gcactcgcac cgtagtggca tcaaaaggtg 6060
accgtgcccg gtctgggcgt taggatacag cgcctgcata aaagccttga tctgcttaaa 6120
agccacctga gcctttgcgc cttcagagaa gaacatgccg caagacttgc cggaaaactg 6180
attggccgga caggccgcgt cgtgcacgca gcaccttgcg tcggtgttgg agatctgcac 6240
cacatttcgg ccccaccggt tcttcacgat cttggccttg ctagactgct ccttcagcgc 6300
gcgctgcccg ttttcgctcg tcacatccat ttcaatcacg tgctccttat ttatcataat 6360
gcttccgtgt agacacttaa gctcgccttc gatctcagcg cagcggtgca gccacaacgc 6420
gcagcccgtg ggctcgtgat gcttgtaggt cacctctgca aacgactgca ggtacgcctg 6480
caggaatcgc cccatcatcg tcacaaaggt cttgttgctg gtgaaggtca gctgcaaccc 6540
gcggtgctcc tcgttcagcc aggtcttgca tacggccgcc agagcttcca cttggtcagg 6600
cagtagtttg aagttcgcct ttagatcgtt atccacgtgg tacttgtcca tcagcgcgcg 6660
cgcagcctcc atgcccttct cccacgcaga cacgatcggc acactcagcg ggttcatcac 6720
cgtaatttca ctttccgctt cgctgggctc ttcctcttcc tcttgcgtcc gcataccacg 6780
cgccactggg tcgtcttcat tcagccgccg cactgtgcgc ttacctcctt tgccatgctt 6840
gattagcacc ggtgggttgc tgaaacccac catttgtagc gccacatctt ctctttcttc 6900
ctcgctgtcc acgattacct ctggtgatgg cgggcgctcg ggcttgggag aagggcgctt 6960
ctttttcttc ttgggcgcaa tggccaaatc cgccgccgag gtcgatggcc gcgggctggg 7020
tgtgcgcggc accagcgcgt cttgtgatga gtcttcctcg tcctcggact cgatacgccg 7080
cctcatccgc ttttttgggg gcgcccgggg aggcggcggc gacggggacg gggacgacac 7140
gtcctccatg gttgggggac gtcgcgccgc accgcgtccg cgctcggggg tggtttcgcg 7200
ctgctcctct tcccgactgg ccatttcctt ctcctatagg cagaaaaaga tcatggagtc 7260
agtcgagaag aaggacagcc taaccgcccc ctctgagttc gccaccaccg cctccaccga 7320
tgccgccaac gcgcctacca ccttccccgt cgaggcaccc ccgcttgagg aggaggaagt 7380
gattatcgag caggacccag gttttgtaag cgaagacgac gaggaccgct cagtaccaac 7440
agaggataaa aagcaagacc aggacaacgc agaggcaaac gaggaacaag tcgggcgggg 7500
ggacgaaagg catggcgact acctagatgt gggagacgac gtgctgttga agcatctgca 7560
gcgccagtgc gccattatct gcgacgcgtt gcaagagcgc agcgatgtgc ccctcgccat 7620
agcggatgtc agccttgcct acgaacgcca cctattctca ccgcgcgtac cccccaaacg 7680
ccaagaaaac ggcacatgcg agcccaaccc gcgcctcaac ttctaccccg tatttgccgt 7740
gccagaggtg cttgccacct atcacatctt tttccaaaac tgcaagatac ccctatcctg 7800
ccgtgccaac cgcagccgag cggacaagca gctggccttg cggcagggcg ctgtcatacc 7860
tgatatcgcc tcgctcaacg aagtgccaaa aatctttgag ggtcttggac gcgacgagaa 7920
gcgcgcggca aacgctctgc aacaggaaaa cagcgaaaat gaaagtcact ctggagtgtt 7980
ggtggaactc gagggtgaca acgcgcgcct agccgtacta aaacgcagca tcgaggtcac 8040
ccactttgcc tacccggcac ttaacctacc ccccaaggtc atgagcacag tcatgagtga 8100
gctgatcgtg cgccgtgcgc agcccctgga gagggatgca aatttgcaag aacaaacaga 8160
ggagggccta cccgcagttg gcgacgagca gctagcgcgc tggcttcaaa cgcgcgagcc 8220
tgccgacttg gaggagcgac gcaaactaat gatggccgca gtgctcgtta ccgtggagct 8280
tgagtgcatg cagcggttct ttgctgaccc ggagatgcag cgcaagctag aggaaacatt 8340
gcactacacc tttcgacagg gctacgtacg ccaggcctgc aagatctcca acgtggagct 8400
ctgcaacctg gtctcctacc ttggaatttt gcacgaaaac cgccttgggc aaaacgtgct 8460
tcattccacg ctcaagggcg aggcgcgccg cgactacgtc cgcgactgcg tttacttatt 8520
tctatgctac acctggcaga cggccatggg cgtttggcag cagtgcttgg aggagtgcaa 8580
cctcaaggag ctgcagaaac tgctaaagca aaacttgaag gacctatgga cggccttcaa 8640
cgagcgctcc gtggccgcgc acctggcgga catcattttc cccgaacgcc tgcttaaaac 8700
cctgcaacag ggtctgccag acttcaccag tcaaagcatg ttgcagaact ttaggaactt 8760
tatcctagag cgctcaggaa tcttgcccgc cacctgctgt gcacttccta gcgactttgt 8820
gcccattaag taccgcgaat gccctccgcc gctttggggc cactgctacc ttctgcagct 8880
agccaactac cttgcctacc actctgacat aatggaagac gtgagcggtg acggtctact 8940
ggagtgtcac tgtcgctgca acctatgcac cccgcaccgc tccctggttt gcaattcgca 9000
gctgcttaac gaaagtcaaa ttatcggtac ctttgagctg cagggtccct cgcctgacga 9060
aaagtccgcg gctccggggt tgaaactcac tccggggctg tggacgtcgg cttaccttcg 9120
caaatttgta cctgaggact accacgccca cgagattagg ttctacgaag accaatcccg 9180
cccgccaaat gcggagctta ccgcctgcgt cattacccag ggccacattc ttggccaatt 9240
gcaagccatc aacaaagccc gccaagagtt tctgctacga aagggacggg gggtttactt 9300
ggacccccag tccggcgagg agctcaaccc aatccccccg ccgccgcagc cctatcagca 9360
gcagccgcgg gcccttgctt cccaggatgg cacccaaaaa gaagctgcag ctgccgccgc 9420
cacccacgga cgaggaggaa tactgggaca gtcaggcaga ggaggttttg gacgaggagg 9480
aggaggacat gatggaagac tgggagagcc tagacgagga agcttccgag gtcgaagagg 9540
tgtcagacga aacaccgtca ccctcggtcg cattcccctc gccggcgccc cagaaatcgg 9600
caaccggttc cagcatggct acaacctccg ctcctcaggc gccgccggca ctgcccgttc 9660
gccgacccaa ccgtagatgg gacaccactg gaaccagggc cggtaagtcc aagcagccgc 9720
cgccgttagc ccaagagcaa caacagcgcc aaggctaccg ctcatggcgc gggcacaaga 9780
acgccatagt tgcttgcttg caagactgtg ggggcaacat ctccttcgcc cgccgctttc 9840
ttctctacca tcacggcgtg gccttccccc gtaacatcct gcattactac cgtcatctct 9900
acagcccata ctgcaccggc ggcagcggca gcggcagcaa cagcagcggc cacacagaag 9960
caaaggcgac cggatagcaa gactctgaca aagcccaaga aatccacagc ggcggcagca 10020
gcaggaggag gagcgctgcg tctggcgccc aacgaacccg tatcgacccg cgagcttaga 10080
aacaggattt ttcccactct gtatgctata tttcaacaga gcaggggcca agaacaagag 10140
ctgaaaataa aaaacaggtc tctgcgatcc ctcacccgca gctgcctgta tcacaaaagc 10200
gaagatcagc ttcggcgcac gctggaagac gcggaggctc tcttcagtaa atactgcgcg 10260
ctgactctta aggactagtt tcgcgccctt tctcaaattt aagcgcgaaa actacgtcat 10320
ctccagcggc cacacccggc gccagcacct gtcgtcagcg ccattatgag caaggaaatt 10380
cccacgccct acatgtggag ttaccagcca caaatgggac ttgcggctgg agctgcccaa 10440
gactactcaa cccgaataaa ctacatgagc gcgggacccc acatgatatc ccgggtcaac 10500
ggaatccgcg cccaccgaaa ccgaattctc ttggaacagg cggctattac caccacacct 10560
cgtaataacc ttaatccccg tagttggccc gctgccctgg tgtaccagga aagtcccgct 10620
cccaccactg tggtacttcc cagagacgcc caggccgaag ttcagatgac taactcaggg 10680
gcgcagcttg cgggcggctt tcgtcacagg gtgcggtcgc ccgggcaggg tataactcac 10740
ctgacaatca gagggcgagg tattcagctc aacgacgagt cggtgagctc ctcgcttggt 10800
ctccgtccgg acgggacatt tcagatcggc ggcgccggcc gtccttcatt cacgcctcgt 10860
caggcaatcc taactctgca gacctcgtcc tctgagccgc gctctggagg cattggaact 10920
ctgcaattta ttgaggagtt tgtgccatcg gtctacttta accccttctc gggacctccc 10980
ggccactatc cggatcaatt tattcctaac tttgacgcgg taaaggactc ggcggacggc 11040
tacgactgaa tgttaagtgg agaggcagag caactgcgcc tgaaacacct ggtccactgt 11100
cgccgccaca agtgctttgc ccgcgactcc ggtgagtttt gctactttga attgcccgag 11160
gatcatatcg agggcccggc gcacggcgtc cggcttaccg cccagggaga gcttgcccgt 11220
agcctgattc gggagtttac ccagcgcccc ctgctagttg agcgggacag gggaccctgt 11280
gttctcactg tgatttgcaa ctgtcgatct tattcccttt aactaataaa aaaaaataat 11340
aaagcatcac ttacttaaaa tcagttagca aatttctgtc cagtttattc agcagcacct 11400
ccttgccctc ctcccagctc tggtattgca gcttcctcct ggctgcaaac tttctccaca 11460
atctaaatgg aatgtcagtt tcctcctgtt cctgtccatc cgcacccact atcttcatgt 11520
tgttgcagat gaagcgcgca agaccgtctg aagatacctt caaccccgtg tatccatatg 11580
acacggaaac cggtcctcca actgtgcctt ttcttactcc tccctttgta tcccccaatg 11640
ggtttcaaga gagtccccct ggggtactct ctttgcgcct atccgaacct ctagttacct 11700
ccaatggcat gcttgcgctc aaaatgggca acggcctctc tctggacgag gccggcaacc 11760
ttacctccca aaatgtaacc actgtgagcc cacctctcaa aaaaaccaag tcaaacataa 11820
acctggaaat atctgcaccc ctcacagtta cctcagaagc cctaactgtg gctgccgccg 11880
cacctctaat ggtcgcgggc aacacactca ccatgcaatc acaggccccg ctaaccgtgc 11940
acgactccaa acttagcatt gccacccaag gacccctcac agtgtcagaa ggaaagctag 12000
ccctgcaaac atcaggcccc ctcaccacca ccgatagcag tacccttact atcactgcct 12060
caccccctct aactactgcc actggtagct tgggcattga cttgaaagag cccatttata 12120
cacaaaatgg aaaactagga ctaaagtacg gggctccttt gcatgtaaca gacgacctaa 12180
acactttgac cgtagcaact ggtccaggtg tgactattaa taatacttcc ttgcaaacta 12240
aagttactgg agccttgggt tttgattcac aaggcaatat gcaacttaat gtagcaggag 12300
gactaaggat tgattctcaa aacagacgcc ttatacttga tgttagttat ccgtttgatg 12360
ctcaaaacca actaaatcta agactaggac agggccctct ttttataaac tcagcccaca 12420
acttggatat taactacaac aaaggccttt acttgtttac agcttcaaac aattccaaaa 12480
agcttgaggt taacctaagc actgccaagg ggttgatgtt tgacgctaca gccatagcca 12540
ttaatgcagg agatgggctt gaatttggtt cacctaatgc accaaacaca aatcccctca 12600
aaacaaaaat tggccatggc ctagaatttg attcaaacaa ggctatggtt cctaaactag 12660
gaactggcct tagttttgac agcacaggtg ccattacagt aggaaacaaa aataatgata 12720
agctaacttt gtggaccaca ccagctccat ctcctaactg tagactaaat gcagagaaag 12780
atgctaaact cactttggtc ttaacaaaat gtggcagtca aatacttgct acagtttcag 12840
ttttggctgt taaaggcagt ttggctccaa tatctggaac agttcaaagt gctcatctta 12900
ttataagatt tgacgaaaat ggagtgctac taaacaattc cttcctggac ccagaatatt 12960
ggaactttag aaatggagat cttactgaag gcacagccta tacaaacgct gttggattta 13020
tgcctaacct atcagcttat ccaaaatctc acggtaaaac tgccaaaagt aacattgtca 13080
gtcaagttta cttaaacgga gacaaaacta aacctgtaac actaaccatt acactaaacg 13140
gtacacagga aacaggagac acaactccaa gtgcatactc tatgtcattt tcatgggact 13200
ggtctggcca caactacatt aatgaaatat ttgccacatc ctcttacact ttttcataca 13260
ttgcccaaga ataaagaatc gtttgtgtta tgtttcaacg tgtttatttt tcaattgcag 13320
aaaatttcaa gtcatttttc attcagtagt atagccccac caccacatag cttatacaga 13380
tcaccgtacc ttaatcaaac tcacagaacc ctagtattca acctgccacc tccctcccaa 13440
cacacagagt acacagtcct ttctccccgg ctggccttaa aaagcatcat atcatgggta 13500
acagacatat tcttaggtgt tatattccac acggtttcct gtcgagccaa acgctcatca 13560
gtgatattaa taaactcccc gggcagctca cttaagttca tgtcgctgtc cagctgctga 13620
gccacaggct gctgtccaac ttgcggttgc ttaacgggcg gcgaaggaga agtccacgcc 13680
tacatggggg tagagtcata atcgtgcatc aggatagggc ggtggtgctg cagcagcgcg 13740
cgaataaact gctgccgccg ccgctccgtc ctgcaggaat acaacatggc agtggtctcc 13800
tcagcgatga ttcgcaccgc ccgcagcata aggcgccttg tcctccgggc acagcagcgc 13860
accctgatct cacttaaatc agcacagtaa ctgcagcaca gcaccacaat attgttcaaa 13920
atcccacagt gcaaggcgct gtatccaaag ctcatggcgg ggaccacaga acccacgtgg 13980
ccatcatacc acaagcgcag gtagattaag tggcgacccc tcataaacac gctggacata 14040
aacattacct cttttggcat gttgtaattc accacctccc ggtaccatat aaacctctga 14100
ttaaacatgg cgccatccac caccatccta aaccagctgg ccaaaacctg cccgccggct 14160
atacactgca gggaaccggg actggaacaa tgacagtgga gagcccagga ctcgtaacca 14220
tggatcatca tgctcgtcat gatatcaatg ttggcacaac acaggcacac gtgcatacac 14280
ttcctcagga ttacaagctc ctcccgcgtt agaaccatat cccagggaac aacccattcc 14340
tgaatcagcg taaatcccac actgcaggga agacctcgca cgtaactcac gttgtgcatt 14400
gtcaaagtgt tacattcggg cagcagcgga tgatcctcca gtatggtagc gcgggtttct 14460
gtctcaaaag gaggtagacg atccctactg tacggagtgc gccgagacaa ccgagatcgt 14520
gttggtcgta gtgtcatgcc aaatggaacg ccggacgtag tcatatttcc tgaagcaaaa 14580
ccaggtgcgg gcgtgacaaa cagatctgcg tctccggtct cgccgcttag atcgctctgt 14640
gtagtagttg tagtatatcc actctctcaa agcatccagg cgccccctgg cttcgggttc 14700
tatgtaaact ccttcatgcg ccgctgccct gataacatcc accaccgcag aataagccac 14760
acccagccaa cctacacatt cgttctgcga gtcacacacg ggaggagcgg gaagagctgg 14820
aagaaccatg tttttttttt tattccaaaa gattatccaa aacctcaaaa tgaagatcta 14880
ttaagtgaac gcgctcccct ccggtggcgt ggtcaaactc tacagccaaa gaacagataa 14940
tggcatttgt aagatgttgc acaatggctt ccaaaaggca aacggccctc acgtccaagt 15000
ggacgtaaag gctaaaccct tcagggtgaa tctcctctat aaacattcca gcaccttcaa 15060
ccatgcccaa ataattctca tctcgccacc ttctcaatat atctctaagc aaatcccgaa 15120
tattaagtcc ggccattgta aaaatctgct ccagagcgcc ctccaccttc agcctcaagc 15180
agcgaatcat gattgcaaaa attcaggttc ctcacagacc tgtataagat tcaaaagcgg 15240
aacattaaca aaaataccgc gatcccgtag gtcccttcgc agggccagct gaacataatc 15300
gtgcaggtct gcacggacca gcgcggccac ttccccgcca ggaaccatga caaaagaacc 15360
cacactgatt atgacacgca tactcggagc tatgctaacc agcgtagccc cgatgtaagc 15420
ttgttgcatg ggcggcgata taaaatgcaa ggtgctgctc aaaaaatcag gcaaagcctc 15480
gcgcaaaaaa gaaagcacat cgtagtcatg ctcatgcaga taaaggcagg taagctccgg 15540
aaccaccaca gaaaaagaca ccatttttct ctcaaacatg tctgcgggtt tctgcataaa 15600
cacaaaataa aataacaaaa aaacatttaa acattagaag cctgtcttac aacaggaaaa 15660
acaaccctta taagcataag acggactacg gccatgccgg cgtgaccgta aaaaaactgg 15720
tcaccgtgat taaaaagcac caccgacagc tcctcggtca tgtccggagt cataatgtaa 15780
gactcggtaa acacatcagg ttgattcaca tcggtcagtg ctaaaaagcg accgaaatag 15840
cccgggggaa tacatacccg caggcgtaga gacaacatta cagcccccat aggaggtata 15900
acaaaattaa taggagagaa aaacacataa acacctgaaa aaccctcctg cctaggcaaa 15960
atagcaccct cccgctccag aacaacatac agcgcttcca cagcggcagc cataacagtc 16020
agccttacca gtaaaaaaga aaacctatta aaaaaacacc actcgacacg gcaccagctc 16080
aatcagtcac agtgtaaaaa agggccaagt gcagagcgag tatatatagg actaaaaaat 16140
gacgtaacgg ttaaagtcca caaaaaacac ccagaaaacc gcacgcgaac ctacgcccag 16200
aaacgaaagc caaaaaaccc acaacttcct caaatcgtca cttccgtttt cccacgttac 16260
gtaacttccc attttaagaa aactacaatt cccaacacat acaagttact ccgccctaaa 16320
acctacgtca acgttattta aatgtcgacg cgtacaaaac gtcaaaaggg cgacacaaaa 16380
tttattctaa atgcataata aatactgata acatcttata gtttgtatta tattttgtat 16440
tatcgttgac atgtataatt ttgatatcaa aaactgattt tccctttatt attttcgaga 16500
tttattttct taattctctt taacaaacta gaaatattgt atatacaaaa aatcataaat 16560
aatagatgaa tagtttaatt ataggtgttc atcaatcgaa aaagcaacgt atcttattta 16620
aagtgcgttg cttttttctc atttataagg ttaaataatt ctcatatatc aagcaaagtg 16680
acaggcgccc ttaaatattc tgacaaatgc tctttcccta aactcccccc ataaaaaaac 16740
ccgccgaagc gggtttttac gttatttgcg gattaacgat tactcgttat cagaaccgcc 16800
cagggggccc gagcttaaga ctggccgtcg ttttacaaca cagaaagagt ttgtagaaac 16860
gcaaaaaggc catccgtcag gggccttctg cttagtttga tgcctggcag ttccctactc 16920
tcgccttccg cttcctcgct cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg 16980
gtatcagctc actcaaaggc ggtaatacgg ttatccacag aatcagggga taacgcagga 17040
aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg 17100
gcgtttttcc ataggctccg cccccctgac gagcatcaca aaaatcgacg ctcaagtcag 17160
aggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg aagctccctc 17220
gtgcgctctc ctgttccgac cctgccgctt accggatacc tgtccgcctt tctcccttcg 17280
ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt 17340
cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc 17400
ggtaactatc gtcttgagtc caacccggta agacacgact tatcgccact ggcagcagcc 17460
actggtaaca ggattagcag agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg 17520
tgggctaact acggctacac tagaagaaca gtatttggta tctgcgctct gctgaagcca 17580
gttaccttcg gaaaaagagt tggtagctct tgatccggca aacaaaccac cgctggtagc 17640
ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat 17700
cctttgatct tttctacggg gtctgacgct cagtggaacg acgcgcgcgt aactcacgtt 17760
aagggatttt ggtcatgagc ttgcgccgtc ccgtcaagtc agcgtaatgc tctgctt 17817
<210> 16
<211> 743
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 16
tgatatccgt agatgtacct ggacatccag gtgatgccgg cggcggtggt ggaggcgcgc 60
ggaaagtcgc ggacgcggtt ccagatgttg cgcagcggca aaaagtgctc catggtcggg 120
acgctctggc cggtcaggcg cgcgcaatcg ttgacgctct agaccgtgca aaaggagagc 180
ctgtaagcgg gcactcttcc gtggtctggt ggataaattc gcaagggtat catggcggac 240
gaccggggtt cgagccccgt atccggccgt ccgccgtgat ccatgcggtt accgcccgcg 300
tgtcgaaccc aggtgtgcga cgtcagacaa cgggggagtg ctccttttgg cttccttcca 360
ggcgcggcgg ctgctgcgct agcttttttg gccactggcc gcgcgcagcg taagcggtta 420
ggctggaaag cgaaagcatt aagtggctcg ctccctgtag ccggagggtt attttccaag 480
ggttgagtcg cgggaccccc ggttcgagtc tcggaccggc cggactgcgg cgaacggggg 540
tttgcctccc cgtcatgcaa gaccccgctt gcaaattcct ccggaaacag ggacgagccc 600
cttttttgct tttcccagat gcatccggtg ctgcggcaga tgcgcccccc tcctcagcag 660
cggcaagagc aagagcagcg gcagacatgc agggcaccct cccctcctcc taccgcgtca 720
ggaggggcga catccgcggt tga 743
<210> 17
<211> 3201
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 17
cgacgtaggt tttagggcgg agtaacttgt atgtgttggg aattgtagtt ttcttaaaat 60
gggaagttac gtaacgtggg aaaacggaag tgacgatttg aggaagttgt gggttttttg 120
gctttcgttt ctgggcgtag gttcgcgtgc ggttttctgg gtgttttttg tggactttaa 180
ccgttacgtc attttttagt cctatatata ctcgctctgc acttggccct tttttacact 240
gtgactgatt gagctggtgc cgtgtcgagt ggtgtttttt taataggttt tcttttttac 300
tggtaaggct gactgttatg gctgccgctg tggaagcgct gtatgttgtt ctggagcggg 360
agggtgctat tttgcctagg caggagggtt tttcaggtgt ttatgtgttt ttctctccta 420
ttaattttgt tatacctcct atgggggctg taatgttgtc tctacgcctg cgggtatgta 480
ttcccccggg ctatttcggt cgctttttag cactgaccga tgtgaatcaa cctgatgtgt 540
ttaccgagtc ttacattatg actccggaca tgaccgagga gctgtcggtg gtgcttttta 600
atcacggtga ccagtttttt tacggtcacg ccggcatggc cgtagtccgt cttatgctta 660
taagggttgt ttttcctgtt gtaagacagg cttctaatgt ttaaatgttt ttttgttatt 720
ttattttgtg tttatgcaga aacccgcaga catgtttgag agaaaaatgg tgtctttttc 780
tgtggtggtt ccggagctta cctgccttta tctgcatgag catgactacg atgtgctttc 840
ttttttgcgc gaggctttgc ctgatttttt gagcagcacc ttgcatttta tatcgccgcc 900
catgcaacaa gcttacatcg gggctacgct ggttagcata gctccgagta tgcgtgtcat 960
aatcagtgtg ggttcttttg tcatggttcc tggcggggaa gtggccgcgc tggtccgtgc 1020
agacctgcac gattatgttc agctggccct gcgaagggac ctacgggatc gcggtatttt 1080
tgttaatgtt ccgcttttga atcttataca ggtctgtgag gaacctgaat ttttgcaatc 1140
atgattcgct gcttgaggct gaaggtggag ggcgctctgg agcagatttt tacaatggcc 1200
ggacttaata ttcgggattt gcttagagat atattgagaa ggtggcgaga tgagaattat 1260
ttgggcatgg ttgaaggtgc tggaatgttt atagaggaga ttcaccctga agggtttagc 1320
ctttacgtcc acttggacgt gagggccgtt tgccttttgg aagccattgt gcaacatctt 1380
acaaatgcca ttatctgttc tttggctgta gagtttgacc acgccaccgg aggggagcgc 1440
gttcacttaa tagatcttca ttttgaggtt ttggataatc ttttggaata aaaaaaaaaa 1500
catggttctt ccagctcttc ccgctcctcc cgtgtgtgac tcgcagaacg aatgtgtagg 1560
ttggctgggt gtggcttatt ctgcggtggt ggatgttatc agggcagcgg cgcatgaagg 1620
agtttacata gaacccgaag ccagggggcg cctggatgct ttgagagagt ggatatacta 1680
caactactac acagagcgat ctaagcggcg agaccggaga cgcagatctg tttgtcacgc 1740
ccgcacctgg ttttgcttca ggaaatatga ctacgtccgg cgttccattt ggcatgacac 1800
tacgaccaac acgatctcgg ttgtctcggc gcactccgta cagtagggat cgtctacctc 1860
cttttgagac agaaacccgc gctaccatac tggaggatca tccgctgctg cccgaatgta 1920
acactttgac aatgcacaac gtgagttacg tgcgaggtct tccctgcagt gtgggattta 1980
cgctgattca ggaatgggtt gttccctggg atatggttct aacgcgggag gagcttgtaa 2040
tcctgaggaa gtgtatgcac gtgtgcctgt gttgtgccaa cattgatatc atgacgagca 2100
tgatgatcca tggttacgag tcctgggctc tccactgtca ttgttccagt cccggttccc 2160
tgcagtgtat agccggcggg caggttttgg ccagctggtt taggatggtg gtggatggcg 2220
ccatgtttaa tcagaggttt atatggtacc gggaggtggt gaattacaac atgccaaaag 2280
aggtaatgtt tatgtccagc gtgtttatga ggggtcgcca cttaatctac ctgcgcttgt 2340
ggtatgatgg ccacgtgggt tctgtggtcc ccgccatgag ctttggatac agcgccttgc 2400
actgtgggat tttgaacaat attgtggtgc tgtgctgcag ttactgtgct gatttaagtg 2460
agatcagggt gcgctgctgt gcccggagga caaggcgcct tatgctgcgg gcggtgcgaa 2520
tcatcgctga ggagaccact gccatgttgt attcctgcag gacggagcgg cggcggcagc 2580
agtttattcg cgcgctgctg cagcaccacc gccctatcct gatgcacgat tatgactcta 2640
cccccatgta ggcgtggact tctccttcgc cgcccgttaa gcaaccgcaa gttggacagc 2700
agcctgtggc tcagcagctg gacagcgaca tgaacttaag tgagctgccc ggggagttta 2760
ttaatatcac tgatgagcgt ttggctcgac aggaaaccgt gtggaatata acacctaaga 2820
atatgtctgt tacccatgat atgatgcttt ttaaggccag ccggggagaa aggactgtgt 2880
actctgtgtg ttgggaggga ggtggcaggt tgaatactag ggttctgtga gtttgattaa 2940
ggtacggtga tctgtataag ctatgtggtg gtggggctat actactgaat gaaaaatgac 3000
ttgaaatttt ctgcaattga aaaataaaca cgttgaaaca taacacaaac gattctttat 3060
tcttgggcaa tgtatgaaaa agtgtaagag gatgtggcaa atatttcatt aatgtagttg 3120
tggccagacc agtcccatga aaatgacata gagtatgcac ttggagttgt gtctcctgtt 3180
tcctgtgtac cgtttagtgt a 3201
<210> 18
<211> 5336
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 18
caccctgtga cgaaagccgc ccgcaagctg cgcccctgag ttagtcatct gaacttcggc 60
ctgggcgtct ctgggaagta ccacagtggt gggagcggga ctttcctggt acaccagggc 120
agcgggccaa ctacggggat taaggttatt acgaggtgtg gtggtaatag ccgcctgttc 180
caagagaatt cggtttcggt gggcgcggat tccgttgacc cgggatatca tgtggggtcc 240
cgcgctcatg tagtttattc gggttgagta gtcttgggca gctccagccg caagtcccat 300
ttgtggctgg taactccaca tgtagggcgt gggaatttcc ttgctcataa tggcgctgac 360
gacaggtgct ggcgccgggt gtggccgctg gagatgacgt agttttcgcg cttaaatttg 420
agaaagggcg cgaaactagt ccttaagagt cagcgcgcag tatttactga agagagcctc 480
cgcgtcttcc agcgtgcgcc gaagctgatc ttcgcttttg tgatacaggc agctgcgggt 540
gagggatcgc agagacctgt tttttatttt cagctcttgt tcttggcccc tgctctgttg 600
aaatatagca tacagagtgg gaaaaatcct gtttctaagc tcgcgggtcg atacgggttc 660
gttgggcgcc agacgcagcg ctcctcctcc tgctgctgcc gccgctgtgg atttcttggg 720
ctttgtcaga gtcttgctat ccggtcgcct ttgcttctgt gtggccgctg ctgttgctgc 780
cgctgccgct gccgccggtg cagtatgggc tgtagagatg acggtagtaa tgcaggatgt 840
tacgggggaa ggccacgccg tgatggtaga gaagaaagcg gcgggcgaag gagatgttgc 900
ccccacagtc ttgcaagcaa gcaactatgg cgttcttgtg cccgcgccat gagcggtagc 960
cttggcgctg ttgttgctct tgggctaacg gcggcggctg cttggactta ccggccctgg 1020
ttccagtggt gtcccatcta cggttgggtc ggcgaacggg cagtgccggc ggcgcctgag 1080
gagcggaggt tgtagccatg ctggaaccgg ttgccgattt ctggggcgcc ggcgagggga 1140
atgcgaccga gggtgacggt gtttcgtctg acacctcttc gacctcggaa gcttcctcgt 1200
ctaggctctc ccagtcttcc atcatgtcct cctcctcctc gtccaaaacc tcctctgcct 1260
gactgtccca gtattcctcc tcgtccgtgg gtggcggcgg cagctgcagc ttctttttgg 1320
gtgccatcct gggaagcaag ggcccgcggc tgctgctgat agggctgcgg cggcgggggg 1380
attgggttga gctcctcgcc ggactggggg tccaagtaaa ccccccgtcc ctttcgtagc 1440
agaaactctt ggcgggcttt gttgatggct tgcaattggc caagaatgtg gccctgggta 1500
atgacgcagg cggtaagctc cgcatttggc gggcgggatt ggtcttcgta gaacctaatc 1560
tcgtgggcgt ggtagtcctc aggtacaaat ttgcgaaggt aagccgacgt ccacagcccc 1620
ggagtgagtt tcaaccccgg agccgcggac ttttcgtcag gcgagggacc ctgcagctca 1680
aaggtaccga taatttgact ttcgttaagc agctgcgaat tgcaaaccag ggagcggtgc 1740
ggggtgcata ggttgcagcg acagtgacac tccagtagac cgtcaccgct cacgtcttcc 1800
attatgtcag agtggtaggc aaggtagttg gctagctgca gaaggtagca gtggccccaa 1860
agcggcggag ggcattcgcg gtacttaatg ggcacaaagt cgctaggaag tgcacagcag 1920
gtggcgggca agattcctga gcgctctagg ataaagttcc taaagttctg caacatgctt 1980
tgactggtga agtctggcag accctgttgc agggttttaa gcaggcgttc ggggaaaatg 2040
atgtccgcca ggtgcgcggc cacggagcgc tcgttgaagg ccgtccatag gtccttcaag 2100
ttttgcttta gcagtttctg cagctccttg aggttgcact cctccaagca ctgctgccaa 2160
acgcccatgg ccgtctgcca ggtgtagcat agaaataagt aaacgcagtc gcggacgtag 2220
tcgcggcgcg cctcgccctt gagcgtggaa tgaagcacgt tttgcccaag gcggttttcg 2280
tgcaaaattc caaggtagga gaccaggttg cagagctcca cgttggagat cttgcaggcc 2340
tggcgtacgt agccctgtcg aaaggtgtag tgcaatgttt cctctagctt gcgctgcatc 2400
tccgggtcag caaagaaccg ctgcatgcac tcaagctcca cggtaacgag cactgcggcc 2460
atcattagtt tgcgtcgctc ctccaagtcg gcaggctcgc gcgtttgaag ccagcgcgct 2520
agctgctcgt cgccaactgc gggtaggccc tcctctgttt gttcttgcaa atttgcatcc 2580
ctctccaggg gctgcgcacg gcgcacgatc agctcactca tgactgtgct catgaccttg 2640
gggggtaggt taagtgccgg gtaggcaaag tgggtgacct cgatgctgcg ttttagtacg 2700
gctaggcgcg cgttgtcacc ctcgagttcc accaacactc cagagtgact ttcattttcg 2760
ctgttttcct gttgcagagc gtttgccgcg cgcttctcgt cgcgtccaag accctcaaag 2820
atttttggca cttcgttgag cgaggcgata tcaggtatga cagcgccctg ccgcaaggcc 2880
agctgcttgt ccgctcggct gcggttggca cggcaggata ggggtatctt gcagttttgg 2940
aaaaagatgt gataggtggc aagcacctct ggcacggcaa atacggggta gaagttgagg 3000
cgcgggttgg gctcgcatgt gccgttttct tggcgtttgg ggggtacgcg cggtgagaat 3060
aggtggcgtt cgtaggcaag gctgacatcc gctatggcga ggggcacatc gctgcgctct 3120
tgcaacgcgt cgcagataat ggcgcactgg cgctgcagat gcttcaacag cacgtcgtct 3180
cccacatcta ggtagtcgcc atgcctttcg tccccccgcc cgacttgttc ctcgtttgcc 3240
tctgcgttgt cctggtcttg ctttttatcc tctgttggta ctgagcggtc ctcgtcgtct 3300
tcgcttacaa aacctgggtc ctgctcgata atcacttcct cctcctcaag cgggggtgcc 3360
tcgacgggga aggtggtagg cgcgttggcg gcatcggtgg aggcggtggt ggcgaactca 3420
gagggggcgg ttaggctgtc cttcttctcg actgactcca tgatcttttt ctgcctatag 3480
gagaaggaaa tggccagtcg ggaagaggag cagcgcgaaa ccacccccga gcgcggacgc 3540
ggtgcggcgc gacgtccccc aaccatggag gacgtgtcgt ccccgtcccc gtcgccgccg 3600
cctccccggg cgcccccaaa aaagcggatg aggcggcgta tcgagtccga ggacgaggaa 3660
gactcatcac aagacgcgct ggtgccgcgc acacccagcc cgcggccatc gacctcggcg 3720
gcggatttgg ccattgcgcc caagaagaaa aagaagcgcc cttctcccaa gcccgagcgc 3780
ccgccatcac cagaggtaat cgtggacagc gaggaagaaa gagaagatgt ggcgctacaa 3840
atggtgggtt tcagcaaccc accggtgcta atcaagcatg gcaaaggagg taagcgcaca 3900
gtgcggcggc tgaatgaaga cgacccagtg gcgcgtggta tgcggacgca agaggaagag 3960
gaagagccca gcgaagcgga aagtgaaatt acggtgatga acccgctgag tgtgccgatc 4020
gtgtctgcgt gggagaaggg catggaggct gcgcgcgcgc tgatggacaa gtaccacgtg 4080
gataacgatc taaaggcgaa cttcaaacta ctgcctgacc aagtggaagc tctggcggcc 4140
gtatgcaaga cctggctgaa cgaggagcac cgcgggttgc agctgacctt caccagcaac 4200
aagacctttg tgacgatgat ggggcgattc ctgcaggcgt acctgcagtc gtttgcagag 4260
gtgacctaca agcatcacga gcccacgggc tgcgcgttgt ggctgcaccg ctgcgctgag 4320
atcgaaggcg agcttaagtg tctacacgga agcattatga taaataagga gcacgtgatt 4380
gaaatggatg tgacgagcga aaacgggcag cgcgcgctga aggagcagtc tagcaaggcc 4440
aagatcgtga agaaccggtg gggccgaaat gtggtgcaga tctccaacac cgacgcaagg 4500
tgctgcgtgc acgacgcggc ctgtccggcc aatcagtttt ccggcaagtc ttgcggcatg 4560
ttcttctctg aaggcgcaaa ggctcaggtg gcttttaagc agatcaaggc ttttatgcag 4620
gcgctgtatc ctaacgccca gaccgggcac ggtcaccttt tgatgccact acggtgcgag 4680
tgcaactcaa agcctgggca cgcgcccttt ttgggaaggc agctaccaaa gttgactccg 4740
ttcgccctga gcaacgcgga ggacctggac gcggatctga tctccgacaa gagcgtgctg 4800
gccagcgtgc accacccggc gctgatagtg ttccagtgct gcaaccctgt gtatcgcaac 4860
tcgcgcgcgc agggcggagg ccccaactgc gacttcaaga tatcggcgcc cgacctgcta 4920
aacgcgttgg tgatggtgcg cagcctgtgg agtgaaaact tcaccgagct gccgcggatg 4980
gttgtgcctg agtttaagtg gagcactaaa caccagtatc gcaacgtgtc cctgccagtg 5040
gcgcatagcg atgcgcggca gaaccccttt gatttttaaa cggcgcagac ggcaagggtg 5100
ggggtaaata atcacccgag agtgtacaaa taaaagcatt tgcctttatt gaaagtgtct 5160
ctagtacatt atttttacat gtttttcaag tgacaaaaag aagtggcgct cctaatctgc 5220
gcactgtggc tgcggaagta gggcgagtgg cgctccagga agctgtagag ctgttcctgg 5280
ttgcgacgca gggtgggctg tacctgggga ctgttgagca tggagttggg taccgc 5336
<210> 19
<211> 810
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 19
ttagaaaaac tcatcgagca tcaaatgaaa ctgcaattta ttcatatcag gattatcaat 60
accatatttt tgaaaaagcc gtttctgtaa tgaaggagaa aactcaccga ggcagttcca 120
taggatggca agatcctggt atcggtctgc gattccgact cgtccaacat caatacaacc 180
tattaatttc ccctcgtcaa aaataaggtt atcaagtgag aaatcaccat gagtgacgac 240
tgaatccggt gagaatggca aaagtttatg catttctttc cagacttgtt caacaggcca 300
gccattacgc tcgtcatcaa aatcactcgc atcaaccaaa ccgttattca ttcgtgattg 360
cgcctgagcg aggcgaaata cgcgatcgct gttaaaagga caattacaaa caggaatcga 420
gtgcaaccgg cgcaggaaca ctgccagcgc atcaacaata ttttcacctg aatcaggata 480
ttcttctaat acctggaacg ctgtttttcc ggggatcgca gtggtgagta accatgcatc 540
atcaggagta cggataaaat gcttgatggt cggaagtggc ataaattccg tcagccagtt 600
tagtctgacc atctcatctg taacatcatt ggcaacgcta cctttgccat gtttcagaaa 660
caactctggc gcatcgggct tcccatacaa gcgatagatt gtcgcacctg attgcccgac 720
attatcgcga gcccatttat acccatataa atcagcatcc atgttggaat ttaatcgcgg 780
cctcgacgtt tcccgttgaa tatggctcat 810
<210> 20
<211> 674
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 20
atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt 60
ttccataggc tccgcccccc tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg 120
cgaaacccga caggactata aagataccag gcgtttcccc ctggaagctc cctcgtgcgc 180
tctcctgttc cgaccctgcc gcttaccgga tacctgtccg cctttctccc ttcgggaagc 240
gtggcgcttt ctcatagctc acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc 300
aagctgggct gtgtgcacga accccccgtt cagcccgacc gctgcgcctt atccggtaac 360
tatcgtcttg agtccaaccc ggtaagacac gacttatcgc cactggcagc agccactggt 420
aacaggatta gcagagcgag gtatgtaggc ggtgctacag agttcttgaa gtggtgggct 480
aactacggct acactagaag aacagtattt ggtatctgcg ctctgctgaa gccagttacc 540
ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt 600
ttttttgttt gcaagcagca gattacgcgc agaaaaaaag gatctcaaga agatcctttg 660
atcttttcta cggg 674
<210> 21
<211> 118
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 21
tttcaatatt attgaagcat ttatcagggt tattgtctca tgagcggata catatttgaa 60
tgtatttaga aaaataaaca aataggggtc agtgttacaa ccaattaacc aattctga 118
<210> 22
<211> 301
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 22
tattctaaat gcataataaa tactgataac atcttatagt ttgtattata ttttgtatta 60
tcgttgacat gtataatttt gatatcaaaa actgattttc cctttattat tttcgagatt 120
tattttctta attctcttta acaaactaga aatattgtat atacaaaaaa tcataaataa 180
tagatgaata gtttaattat aggtgttcat caatcgaaaa agcaacgtat cttatttaaa 240
gtgcgttgct tttttctcat ttataaggtt aaataattct catatatcaa gcaaagtgac 300
a 301
<210> 23
<211> 120
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 23
ggcgccctta aatattctga caaatgctct ttccctaaac tccccccata aaaaaacccg 60
ccgaagcggg tttttacgtt atttgcggat taacgattac tcgttatcag aaccgcccag 120
<210> 24
<211> 6838
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 24
ctagagtcga cctgcaggca tgcaagcttg gcgtaatcat ggtcatagct gtttcctgtg 60
tgaaattgtt atccgctcac aattccacac aacatacgag ccggaagcat aaagtgtaaa 120
gcctggggtg cctaatgagt gagctaactc acattaattg cgttgcgctc actgcccgct 180
ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa tcggccaacg cgcggggaga 240
ggcggtttgc gtattgggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc 300
gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa 360
tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt 420
aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa 480
aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt 540
ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg 600
tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg taggtatctc 660
agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc 720
gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta 780
tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct 840
acagagttct tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc 900
tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa 960
caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa 1020
aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa 1080
aactcacgtt aagggatttt ggtcatgtga ttatcaaaaa ggatcttcac ctagatcctt 1140
ttaaattaaa aatgaagttt taaatcaatc taaagtatat atgagtaaac ttggtctgac 1200
agttagaaaa actcatcgag catcaaatga aactgcaatt tattcatatc aggattatca 1260
ataccatatt tttgaaaaag ccgtttctgt aatgaaggag aaaactcacc gaggcagttc 1320
cataggatgg caagatcctg gtatcggtct gcgattccga ctcgtccaac atcaatacaa 1380
cctattaatt tcccctcgtc aaaaataagg ttatcaagtg agaaatcacc atgagtgacg 1440
actgaatccg gtgagaatgg caaaagttta tgcatttctt tccagacttg ttcaacaggc 1500
cagccattac gctcgtcatc aaaatcactc gcatcaacca aaccgttatt cattcgtgat 1560
tgcgcctgag cgagacgaaa tacgcgatcg ctgttaaaag gacaattaca aacaggaatc 1620
gaatgcaacc ggcgcaggaa cactgccagc gcatcaacaa tattttcacc tgaatcagga 1680
tattcttcta atacctggaa tgctgttttc ccagggatcg cagtggtgag taaccatgca 1740
tcatcaggag tacggataaa atgcttgatg gtcggaagag gcataaattc cgtcagccag 1800
tttagtctga ccatctcatc tgtaacatca ttggcaacgc tacctttgcc atgtttcaga 1860
aacaactctg gcgcatcggg cttcccatac aatcgataga ttgtcgcacc tgattgcccg 1920
acattatcgc gagcccattt atacccatat aaatcagcat ccatgttgga atttaatcgc 1980
ggcctagagc aagacgtttc ccgttgaata tggctcatac tcttcctttt tcaatattat 2040
tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg tatttagaaa 2100
aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga cgtctaagaa 2160
accattatta acatgacatt aacctataaa aataggcgta tcacgaggcc ctttcgtctc 2220
gcgcgtttcg gtgatgacgg tgaaaacctc tgacacatgc agctcccgga gacggtcaca 2280
gcttgtctgt aagcggatgc cgggagcaga caagcccgtc agggcgcgtc agcgggtgtt 2340
ggcgggtgtc ggggctggct taactatgcg gcatcagagc agattgtact gagagtgcac 2400
catatgcggt gtgaaatacc gcacagatgc gtaaggagaa aataccgcat caggcgccat 2460
tcgccattca ggctgcgcaa ctgttgggaa gggcgatcgg tgcgggcctc ttcgctatta 2520
cgccagctgg cgaaaggggg atgtgctgca aggcgattaa gttgggtaac gccagggttt 2580
tcccagtcac gacgttgtaa aacgacggcc agtgaattcg agctcggtac ccgtaacaaa 2640
agcttatcga gcggccgcaa gaggcagtat tttactgaca cgaatacacg gtttattgag 2700
ggtatgcgac atgaatgggt taaaggggtc gggtaaggta tcgggttccg ataggtctgg 2760
tggttctgta ttccccggtg ctgtccgggg caaagtccac aaactggggg tcgttgtagt 2820
tgtttgtgta ctggatctct gggttccacc tcttggagtt ttccttcttg agctcccact 2880
ccatctccac ggtgacctgc ccggtgctgt actgggtgat gaagctgctg acgggcacgt 2940
ccgagaagct ggtgatattt ccgggcacag gcgtgttctt gatgagcatc atgggcggtg 3000
ggtgtttgag tccgaatccg cccatggccg gagaggggtg aaagtgcgcc cccgtctctg 3060
ggatcttggc ccagatgggt ccttggaggt acacgtccct ctccatccac acgctgccgg 3120
gcacgatttc ctggaggttg tacgtgccgg tcgcgggggc agtggtggag ctctggttgt 3180
tggtggccat ctgcccgccg acgttgtacg ccacgcggtt caccggctgc gtctcgctct 3240
cgctggtgat gagcatgttg ccctcgaggt acgtggcggt ggtgcccggg ttcgccggct 3300
ggctgttgaa gatcatagtg ttctccaggg cataggtgtt gctgccctgg aggttgttgg 3360
tcatgccgtt cggctgcggg ggcacctggt aactcgcgcc ctcgagctcc atcctattgg 3420
tcgtggcgaa ggcgctgaca ctggcgcggt tgaccccgga gcccaggttc cagccctggg 3480
ttcggcccat gggccccggg aaccagtttt tgtaggtgtt ggcgtatctc ccggccaggt 3540
tcttgttgaa ctggactccg ccagtgttat ttgtgctcac gaagcggtac aagtactggt 3600
ccaccagcgg gttggccagc ttgaacaggt tctgactggg agcgaagctg gagtggaagg 3660
gcacctcctc aaagttgtag gtaaactcaa agttgttgcc cgttctcagc atcttgctgg 3720
gaaagtactc taggcagaag aagctgctcc tctcggtggg attttctgtg ttgtcgcggt 3780
tcagcgtcgc gtaaccgtac tgcggcagcg taaagacctg cggagggaag gccggcaggc 3840
atccctcggt cccgttgccg acgacgtagg gcagctggta gtcgtcgtcc gtaaacactt 3900
ggacggtgga ggtgaggttg ttggcgatgg tggtggtgga gtcctgcacc gtgacctctt 3960
tgacttgaat gttgaagatt ttgactctga gggaccgggg tctgaagccc cagtagttgt 4020
tgatgagtct ttgccagtct cgggggctcc agtggctgtg gaagcggtta aagtcaaagt 4080
acccccaggg ggtgctgtat ccaaagtagg cgttggcgtt gcttccgtcg acggagccgc 4140
ttttgatctc tcggtactgg tggttgttgt agctgggcag cacccaggtt cgggtggact 4200
tggtgacgac tctgtccccc atccacgtgg aatcgcaatg ccaatctccc gaggcattgc 4260
ccactccatc ggcaccttgg ttattgtcgc ccaatgggcc gccacctccc gcagacattg 4320
tatcagctcc caaacttgag gctggttggg ctgggatttg cagctgctgg gatccgctgg 4380
gtccagcttc ggcgtctgac gaggtggaag gcttggagtc ctcttcggtc cgagccttct 4440
ttctttttgg aaagtggtcg tctatccgct ttccggtagg ggccgtctta gcaccctctt 4500
caaccaggcc aaaaggttcg agaacccttt tcttggcctg aaagactgcc tttccgaggt 4560
ttcccccgaa ggatgtgtcg tcggcgagct tctcctgaaa ctcggcgtcc gcgtggttgt 4620
acttgaggta ggggttgtct cccgcctcaa gctgctcgtt gtacgagatg tcgtgctctc 4680
gcgcgacctc gtctgccctg ttgacaggct ctcctcgatc gagaccgttt ccgggtccga 4740
gatagttata accaggcagc acaagaccac gggcttgatc ttgatgctgc tgattgggtt 4800
ttggtttcgg tgggcccgct tcaaggccca aaaactcgcg aagaccttca ccaacttctt 4860
ccaaccaatc tggagggtga tcaacaaaag acatgactac tcgctttatt tactgttctt 4920
tattggcatc gtcaaaatcc ccaaaatctg acaagttttc cttttcccag gggggaatcc 4980
catgacaaat ttgacagtga gttacattgt gacagataca tccatttttg ccccgattca 5040
aatattcaca ttcatcacat ttgttagaaa tgttgtcaaa ttgagcatga tagtcacatt 5100
tgcaatcata ccttgaattc caattgagcg gtcgcagagg agcgggatca acagtcacgt 5160
ctgaactgcg aggcgtctcg ggaacaaatg agagcctggc ccgcttctcc agacttttat 5220
agctagtatt ggtgacgtca cccagtgggc gttttagaga tttctccgcc cctttagttc 5280
ccgccaattc cctgggaact ttaaactcgt gagtcaccgg cacctgattg acctttgccc 5340
aagcaaaaaa gtccttgact tcctgcttag taatcttgcc aaaatctggc gggagccgct 5400
tagtcagttc aaatttgaac atgcggtcct ccagcggctg ctggtgttca aaggtcgtgg 5460
aattcccatc caccaccaca cacatgtttg tattggaagt tacaatgaca ggggtagaat 5520
caatttgaac agaggattta catttctgat cgacccgcac ctttgagccc cccaggatgg 5580
ccttggcgga ttcaaccacc ttgttggtca tctttccctc ctcccaccaa atgagcattt 5640
tgtccacaca gtcattaaag ggaaagtttt cattggtcca gttcacgcag ccgtaaaagg 5700
gcacagtgtg ggcgatggcc tccgcgatgt tggtcttgcc ggtcgtggcg ggtccgtaga 5760
gccagacggt gttcctcttg ttgaaggagc gctgacacca gccgtagagg atggatcccg 5820
cgtaggccgg gtcgtagcca ttcatctcaa aaatttgcca gattctgttt tttgaaatgt 5880
cctcgggaac ggagctcccc acgaggtagt ccaccgcgct ttttgtcaga ctcataattt 5940
tggtcgcgtt gtcgagcgcg gccttgatct ggctccgaga gttgccggtg gagttgaagg 6000
agaggtagct ctcctgattt tcctggatcc actgcttctc cgaggtaatc cccttgtcca 6060
cgagccaccc gaccagctcc atgtacctgg ctgaagtttt tgatctgatc accggcgcat 6120
cagaattggg attctgattc tctttgttct gctcctgcgt ctgcgacacg tgcgtcagat 6180
gctgcgccac caaccgttta cgctccgtga gattcaaaca ggcgcttaaa tactgttcca 6240
tattagtcca cgcccactgg agctcaggct gggttttggg gagcaagtaa ttggggatgt 6300
agcactcatc caccaccttg ttcccgcctc cggcgccatt tctggtcttt gtgaccgcga 6360
accagtttgg caaagtcggc tcgatcccgc ggtaaattct ctgaatcagt ttttcgcgaa 6420
tctgactcag gaaacgtccc aaaaccatgg atttcacccc ggtggtttcc acgagcacgt 6480
gcatgtggaa gtagctctct cccttctcaa attgcacaaa gaaaagggcc tccggggcct 6540
tactcacacg gcgccattcc gtcagaaagt cgcgctgcag cttctcggcc acggtcaggg 6600
gtgcctgctc aatcagattc agatccatgt cagaatctgg cggcaactcc cattccttct 6660
cggccaccca gttcacaaag ctgtcagaaa tgccgggcag atgctcgtca aggtcgctgg 6720
ggaccttaat cacaatctcg taaaaccccg gcatggcggc tgcgcagatc agaagttcct 6780
atactttcta gagaatagga acttcggaat aggaacttct gatcttccgg gggatcca 6838
<210> 25
<211> 816
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 25
ttagaaaaac tcatcgagca tcaaatgaaa ctgcaattta ttcatatcag gattatcaat 60
accatatttt tgaaaaagcc gtttctgtaa tgaaggagaa aactcaccga ggcagttcca 120
taggatggca agatcctggt atcggtctgc gattccgact cgtccaacat caatacaacc 180
tattaatttc ccctcgtcaa aaataaggtt atcaagtgag aaatcaccat gagtgacgac 240
tgaatccggt gagaatggca aaagtttatg catttctttc cagacttgtt caacaggcca 300
gccattacgc tcgtcatcaa aatcactcgc atcaaccaaa ccgttattca ttcgtgattg 360
cgcctgagcg agacgaaata cgcgatcgct gttaaaagga caattacaaa caggaatcga 420
atgcaaccgg cgcaggaaca ctgccagcgc atcaacaata ttttcacctg aatcaggata 480
ttcttctaat acctggaatg ctgttttccc agggatcgca gtggtgagta accatgcatc 540
atcaggagta cggataaaat gcttgatggt cggaagaggc ataaattccg tcagccagtt 600
tagtctgacc atctcatctg taacatcatt ggcaacgcta cctttgccat gtttcagaaa 660
caactctggc gcatcgggct tcccatacaa tcgatagatt gtcgcacctg attgcccgac 720
attatcgcga gcccatttat acccatataa atcagcatcc atgttggaat ttaatcgcgg 780
cctagagcaa gacgtttccc gttgaatatg gctcat 816
<210> 26
<211> 673
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 26
tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt 60
tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc 120
gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct 180
ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg 240
tggcgctttc tcatagctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca 300
agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact 360
atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta 420
acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta 480
actacggcta cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct 540
tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt 600
tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga 660
tcttttctac ggg 673
<210> 27
<211> 143
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 27
aattgttatc cgctcacaat tccacacaac atacgagccg gaagcataaa gtgtaaagcc 60
tggggtgcct aatgagtgag ctaactcaca ttaattgcgt tgcgctcact gcccgctttc 120
cagtcgggaa acctgtcgtg cca 143
<210> 28
<211> 5121
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 28
ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa acaaaccacc 60
gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct 120
caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga aaactcacgt 180
taagggattt tggtcatgtg attatcaaaa aggatcttca cctagatcct tttaaattaa 240
aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa cttggtctga cagttagaaa 300
aactcatcga gcatcaaatg aaactgcaat ttattcatat caggattatc aataccatat 360
ttttgaaaaa gccgtttctg taatgaagga gaaaactcac cgaggcagtt ccataggatg 420
gcaagatcct ggtatcggtc tgcgattccg actcgtccaa catcaataca acctattaat 480
ttcccctcgt caaaaataag gttatcaagt gagaaatcac catgagtgac gactgaatcc 540
ggtgagaatg gcaaaagttt atgcatttct ttccagactt gttcaacagg ccagccatta 600
cgctcgtcat caaaatcact cgcatcaacc aaaccgttat tcattcgtga ttgcgcctga 660
gcgagacgaa atacgcgatc gctgttaaaa ggacaattac aaacaggaat cgaatgcaac 720
cggcgcagga acactgccag cgcatcaaca atattttcac ctgaatcagg atattcttct 780
aatacctgga atgctgtttt cccagggatc gcagtggtga gtaaccatgc atcatcagga 840
gtacggataa aatgcttgat ggtcggaaga ggcataaatt ccgtcagcca gtttagtctg 900
accatctcat ctgtaacatc attggcaacg ctacctttgc catgtttcag aaacaactct 960
ggcgcatcgg gcttcccata caatcgatag attgtcgcac ctgattgccc gacattatcg 1020
cgagcccatt tatacccata taaatcagca tccatgttgg aatttaatcg cggcctagag 1080
caagacgttt cccgttgaat atggctcata ctcttccttt ttcaatatta ttgaagcatt 1140
tatcagggtt attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa 1200
ataggggttc cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga aaccattatt 1260
aacatgacat taacctataa aaataggcgt atcacgaggc cctttcgtct cgcgcgtttc 1320
ggtgatgacg gtgaaaacct ctgacacatg cagctcccgg agacggtcac agcttgtctg 1380
taagcggatg ccgggagcag acaagcccgt cagggcgcgt cagcgggtgt tggcgggtgt 1440
cggggctggc ttaactatgc ggcatcagag cagattgtac tgagagtgca ccatatgcgg 1500
tgtgaaatac cgcacagatg cgtaaggaga aaataccgca tcaggcgcca ttcgccattc 1560
aggctgcgca actgttggga agggcgatcg gtgcgggcct cttcgctatt acgccagctg 1620
gcgaaagggg gatgtgctgc aaggcgatta agttgggtaa cgccagggtt ttcccagtca 1680
cgacgttgta aaacgacggc cagtgaattc gagctcggta cccgtaacaa aagcttatcg 1740
agcggccgca agaggcagta ttttactgac acgaatacac ggtttattga gggtatgcga 1800
catgaatggg ttaaaggggt cgggtaaggt atcgggttcc gataggtctg gtggttctgt 1860
attccccggt gctgtccggg gcaaagtcca caaactgggg gtcgttgtag ttgtttgtgt 1920
actggatctc tgggttccac ctcttggagt tttccttctt gagctcccac tccatctcca 1980
cggtgacctg cccggtgctg tactgggtga tgaagctgct gacgggcacg tccgagaagc 2040
tggtgatatt tccgggcaca ggcgtgttct tgatgagcat catgggcggt gggtgtttga 2100
gtccgaatcc gcccatggcc ggagaggggt gaaagtgcgc ccccgtctct gggatcttgg 2160
cccagatggg tccttggagg tacacgtccc tctccatcca cacgctgccg ggcacgattt 2220
cctggaggtt gtacgtgccg gtcgcggggg cagtggtgga gctctggttg ttggtggcca 2280
tctgcccgcc gacgttgtac gccacgcggt tcaccggctg cgtctcgctc tcgctggtga 2340
tgagcatgtt gccctcgagg tacgtggcgg tggtgcccgg gttcgccggc tggctgttga 2400
agatcatagt gttctccagg gcataggtgt tgctgccctg gaggttgttg gtcatgccgt 2460
tcggctgcgg gggcacctgg taactcgcgc cctcgagctc catcctattg gtcgtggcga 2520
aggcgctgac actggcgcgg ttgaccccgg agcccaggtt ccagccctgg gttcggccca 2580
tgggccccgg gaaccagttt ttgtaggtgt tggcgtatct cccggccagg ttcttgttga 2640
actggactcc gccagtgtta tttgtgctca cgaagcggta caagtactgg tccaccagcg 2700
ggttggccag cttgaacagg ttctgactgg gagcgaagct ggagtggaag ggcacctcct 2760
caaagttgta ggtaaactca aagttgttgc ccgttctcag catcttgctg ggaaagtact 2820
ctaggcagaa gaagctgctc ctctcggtgg gattttctgt gttgtcgcgg ttcagcgtcg 2880
cgtaaccgta ctgcggcagc gtaaagacct gcggagggaa ggccggcagg catccctcgg 2940
tcccgttgcc gacgacgtag ggcagctggt agtcgtcgtc cgtaaacact tggacggtgg 3000
aggtgaggtt gttggcgatg gtggtggtgg agtcctgcac cgtgacctct ttgacttgaa 3060
tgttgaagat tttgactctg agggaccggg gtctgaagcc ccagtagttg ttgatgagtc 3120
tttgccagtc tcgggggctc cagtggctgt ggaagcggtt aaagtcaaag tacccccagg 3180
gggtgctgta tccaaagtag gcgttggcgt tgcttccgtc gacggagccg cttttgatct 3240
ctcggtactg gtggttgttg tagctgggca gcacccaggt tcgggtggac ttggtgacga 3300
ctctgtcccc catccacgtg gaatcgcaat gccaatctcc cgaggcattg cccactccat 3360
cggcaccttg gttattgtcg cccaatgggc cgccacctcc cgcagacatt gtatcagctc 3420
ccaaacttga ggctggttgg gctgggattt gcagctgctg ggatccgctg ggtccagctt 3480
cggcgtctga cgaggtggaa ggcttggagt cctcttcggt ccgagccttc tttctttttg 3540
gaaagtggtc gtctatccgc tttccggtag gggccgtctt agcaccctct tcaaccaggc 3600
caaaaggttc gagaaccctt ttcttggcct gaaagactgc ctttccgagg tttcccccga 3660
aggatgtgtc gtcggcgagc ttctcctgaa actcggcgtc cgcgtggttg tacttgaggt 3720
aggggttgtc tcccgcctca agctgctcgt tgtacgagat gtcgtgctct cgcgcgacct 3780
cgtctgccct gttgacaggc tctcctcgat cgagaccgtt tccgggtccg agatagttat 3840
aaccaggcag cacaagacca cgggcttgat cttgatgctg ctgattgggt tttggtttcg 3900
gtgggcccgc ttcaaggccc aaaaactcgc gaagaccttc accaacttct tccaaccaat 3960
ctggagggtg atcaacaaaa gacatgacta ctcgctttat ttactgttct ttattggcat 4020
cgtcaaaatc cccaaaatct gacaagtttt ccttttccca ggggggaatc ccatgacaaa 4080
tttgacagtg agttacattg tgacagatac atccattttt gccccgattc aaatattcac 4140
attcatcaca tttgttagaa atgttgtcaa attgagcatg atagtcacat ttgcaatcat 4200
accttgaatt ccaattgagc ggtcgcagag gagcgggatc aacagtcacg tctgaactgc 4260
gaggcgtctc gggaacaaat gagagcctgg cccgcttctc cagactttta tagctagtat 4320
tggtgacgtc acccagtggg cgttttagag atttctccgc ccctttagtt cccgccaatt 4380
ccctgggaac tttaaactcg tgagtcaccg gcacctgatt gacctttgcc caagcaaaaa 4440
agtccttgac ttcctgctta gtaatcttgc caaaatctgg cgggagccgc ttagtcagtt 4500
caaatttgaa catgcggtcc tccagcggct gctggtgttc aaaggtcgtg gaattcccat 4560
ccaccaccac acacatgttt gtattggaag ttacaatgac aggggtagaa tcaatttgaa 4620
cagaggattt acatttctga tcgacccgca cctttgagcc ccccaggatg gccttggcgg 4680
attcaaccac cttgttggtc atctttccct cctcccacca aatgagcatt ttgtccacac 4740
agtcattaaa gggaaagttt tcattggtcc agttcacgca gccgtaaaag ggcacagtgt 4800
gggcgatggc ctccgcgatg ttggtcttgc cggtcgtggc gggtccgtag agccagacgg 4860
tgttcctctt gttgaaggag cgctgacacc agccgtagag gatggatccc gcgtaggccg 4920
ggtcgtagcc attcatctca aaaatttgcc agattctgtt ttttgaaatg tcctcgggaa 4980
cggagctccc cacgaggtag tccaccgcgc tttttgtcag actcataatt ttggtcgcgt 5040
tgtcgagcgc ggccttgatc tggctccgag agttgccggt ggagttgaag gagaggtagc 5100
tctcctgatt ttcctggatc c 5121
<210> 29
<211> 2175
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 29
ttaaaggggt cgggtaaggt atcgggttcc gataggtctg gtggttctgt attccccggt 60
gctgtccggg gcaaagtcca caaactgggg gtcgttgtag ttgtttgtgt actggatctc 120
tgggttccac ctcttggagt tttccttctt gagctcccac tccatctcca cggtgacctg 180
cccggtgctg tactgggtga tgaagctgct gacgggcacg tccgagaagc tggtgatatt 240
tccgggcaca ggcgtgttct tgatgagcat catgggcggt gggtgtttga gtccgaatcc 300
gcccatggcc ggagaggggt gaaagtgcgc ccccgtctct gggatcttgg cccagatggg 360
tccttggagg tacacgtccc tctccatcca cacgctgccg ggcacgattt cctggaggtt 420
gtacgtgccg gtcgcggggg cagtggtgga gctctggttg ttggtggcca tctgcccgcc 480
gacgttgtac gccacgcggt tcaccggctg cgtctcgctc tcgctggtga tgagcatgtt 540
gccctcgagg tacgtggcgg tggtgcccgg gttcgccggc tggctgttga agatcatagt 600
gttctccagg gcataggtgt tgctgccctg gaggttgttg gtcatgccgt tcggctgcgg 660
gggcacctgg taactcgcgc cctcgagctc catcctattg gtcgtggcga aggcgctgac 720
actggcgcgg ttgaccccgg agcccaggtt ccagccctgg gttcggccca tgggccccgg 780
gaaccagttt ttgtaggtgt tggcgtatct cccggccagg ttcttgttga actggactcc 840
gccagtgtta tttgtgctca cgaagcggta caagtactgg tccaccagcg ggttggccag 900
cttgaacagg ttctgactgg gagcgaagct ggagtggaag ggcacctcct caaagttgta 960
ggtaaactca aagttgttgc ccgttctcag catcttgctg ggaaagtact ctaggcagaa 1020
gaagctgctc ctctcggtgg gattttctgt gttgtcgcgg ttcagcgtcg cgtaaccgta 1080
ctgcggcagc gtaaagacct gcggagggaa ggccggcagg catccctcgg tcccgttgcc 1140
gacgacgtag ggcagctggt agtcgtcgtc cgtaaacact tggacggtgg aggtgaggtt 1200
gttggcgatg gtggtggtgg agtcctgcac cgtgacctct ttgacttgaa tgttgaagat 1260
tttgactctg agggaccggg gtctgaagcc ccagtagttg ttgatgagtc tttgccagtc 1320
tcgggggctc cagtggctgt ggaagcggtt aaagtcaaag tacccccagg gggtgctgta 1380
tccaaagtag gcgttggcgt tgcttccgtc gacggagccg cttttgatct ctcggtactg 1440
gtggttgttg tagctgggca gcacccaggt tcgggtggac ttggtgacga ctctgtcccc 1500
catccacgtg gaatcgcaat gccaatctcc cgaggcattg cccactccat cggcaccttg 1560
gttattgtcg cccaatgggc cgccacctcc cgcagacatt gtatcagctc ccaaacttga 1620
ggctggttgg gctgggattt gcagctgctg ggatccgctg ggtccagctt cggcgtctga 1680
cgaggtggaa ggcttggagt cctcttcggt ccgagccttc tttctttttg gaaagtggtc 1740
gtctatccgc tttccggtag gggccgtctt agcaccctct tcaaccaggc caaaaggttc 1800
gagaaccctt ttcttggcct gaaagactgc ctttccgagg tttcccccga aggatgtgtc 1860
gtcggcgagc ttctcctgaa actcggcgtc cgcgtggttg tacttgaggt aggggttgtc 1920
tcccgcctca agctgctcgt tgtacgagat gtcgtgctct cgcgcgacct cgtctgccct 1980
gttgacaggc tctcctcgat cgagaccgtt tccgggtccg agatagttat aaccaggcag 2040
cacaagacca cgggcttgat cttgatgctg ctgattgggt tttggtttcg gtgggcccgc 2100
ttcaaggccc aaaaactcgc gaagaccttc accaacttct tccaaccaat ctggagggtg 2160
atcaacaaaa gacat 2175
<210> 30
<211> 3
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 30
cat 3
<210> 31
<211> 6980
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 31
ctagagtcga cctgcaggca tgcaagcttg gcgtaatcat ggtcatagct gtttcctgtg 60
tgaaattgtt atccgctcac aattccacac aacatacgag ccggaagcat aaagtgtaaa 120
gcctggggtg cctaatgagt gagctaactc acattaattg cgttgcgctc actgcccgct 180
ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa tcggccaacg cgcggggaga 240
ggcggtttgc gtattgggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc 300
gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa 360
tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt 420
aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa 480
aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt 540
ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg 600
tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg taggtatctc 660
agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc 720
gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta 780
tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct 840
acagagttct tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc 900
tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa 960
caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa 1020
aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa 1080
aactcacgtt aagggatttt ggtcatgtga ttatcaaaaa ggatcttcac ctagatcctt 1140
ttaaattaaa aatgaagttt taaatcaatc taaagtatat atgagtaaac ttggtctgac 1200
agttagaaaa actcatcgag catcaaatga aactgcaatt tattcatatc aggattatca 1260
ataccatatt tttgaaaaag ccgtttctgt aatgaaggag aaaactcacc gaggcagttc 1320
cataggatgg caagatcctg gtatcggtct gcgattccga ctcgtccaac atcaatacaa 1380
cctattaatt tcccctcgtc aaaaataagg ttatcaagtg agaaatcacc atgagtgacg 1440
actgaatccg gtgagaatgg caaaagttta tgcatttctt tccagacttg ttcaacaggc 1500
cagccattac gctcgtcatc aaaatcactc gcatcaacca aaccgttatt cattcgtgat 1560
tgcgcctgag cgagacgaaa tacgcgatcg ctgttaaaag gacaattaca aacaggaatc 1620
gaatgcaacc ggcgcaggaa cactgccagc gcatcaacaa tattttcacc tgaatcagga 1680
tattcttcta atacctggaa tgctgttttc ccagggatcg cagtggtgag taaccatgca 1740
tcatcaggag tacggataaa atgcttgatg gtcggaagag gcataaattc cgtcagccag 1800
tttagtctga ccatctcatc tgtaacatca ttggcaacgc tacctttgcc atgtttcaga 1860
aacaactctg gcgcatcggg cttcccatac aatcgataga ttgtcgcacc tgattgcccg 1920
acattatcgc gagcccattt atacccatat aaatcagcat ccatgttgga atttaatcgc 1980
ggcctagagc aagacgtttc ccgttgaata tggctcatac tcttcctttt tcaatattat 2040
tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg tatttagaaa 2100
aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga cgtctaagaa 2160
accattatta acatgacatt aacctataaa aataggcgta tcacgaggcc ctttcgtctc 2220
gcgcgtttcg gtgatgacgg tgaaaacctc tgacacatgc agctcccgga gacggtcaca 2280
gcttgtctgt aagcggatgc cgggagcaga caagcccgtc agggcgcgtc agcgggtgtt 2340
ggcgggtgtc ggggctggct taactatgcg gcatcagagc agattgtact gagagtgcac 2400
catatgcggt gtgaaatacc gcacagatgc gtaaggagaa aataccgcat caggcgccat 2460
tcgccattca ggctgcgcaa ctgttgggaa gggcgatcgg tgcgggcctc ttcgctatta 2520
cgccagctgg cgaaaggggg atgtgctgca aggcgattaa gttgggtaac gccagggttt 2580
tcccagtcac gacgttgtaa aacgacggcc agtgaattcg agctcggtac ccgtagccat 2640
ggaaactaga taagaaagaa atacgcagag accaaagttc aactgaaacg aattaaacgg 2700
tttattgatt aacaagcaat tacagattac gagtcaggta tctggtgcca atggggcgag 2760
gctctgaata cacgccatta gtgtccacag taaagtccac attaacagac ttgttgtagt 2820
tggaagtgta ctgaatttcg ggattccagc gtttgctgtt ttccttctgc agctcccact 2880
cgatctccac gctgacctgt cccgtggagt actgtgtgat gaaggaagca aactttgccg 2940
cactgaaggt ggtcgaagga ttcgcaggta ccggggtgtt cttgatgaga atctgtggag 3000
gagggtgttt aagtccgaat ccacccatga ggggagaggg gtgaaaatgt ccgtccgtgt 3060
gtggaatctt tgcccagatg ggcccctgaa ggtacacatc tctgtcctgc cagaccatgc 3120
ctggaagaac gccttgtgtg ttgacatctg cggtagctgc ttgtctgttg cctctctgga 3180
ggttggtaga tacagaacca tactgctccg tagccacggg attggttgtc ctgatttcct 3240
cttcgtctgt aatcatgacc ttttcaatgt ccacatttgt tttctctgag ccttgcttcc 3300
caaagatgag aaccccgctc tgaggaaaaa acttttcttc atcgtccttg tggcttgcca 3360
tggccgggcc cggattcacc agagagtctc tgccattgag gtggtacttg gtagctccag 3420
tccacgagta ttcactgttg ttgttatccg cagatgtctt tgatactcgc tgctggcggt 3480
aacagggtcc aggaagccag ttcctagact ggtcccgaat gtcactcgct ccggcctgag 3540
aaaactgaag ccttgactgc gtggtggttc cacttggagt gtttgttctg ctcaagtaat 3600
acaggtactg gtcgatgaga ggattcatga gacggtccag actctggctg tgagcgtagc 3660
tgctgtggaa aggaacgtcc tcaaaagtgt agctgaaggt aaagttgttt ccggtacgca 3720
gcatctgaga aggaaagtac tccaggcagt aaaatgaaga gcgtcctact gcctgactcc 3780
cgttgttcag ggtgaggtat ccatactgtg gcaccatgaa gacgtctgct gggaacggcg 3840
ggaggcatcc ttgatgcgcc gagccgagga cgtacgggag ctggtactcc gagtcagtaa 3900
acacctgaac cgtgctggta aggttattgg caatcgtcgt cgtaccgtca ttctgcgtga 3960
cctctttgac ttgaatgtta aagagcttga agttgagtct cttgggtcgg aatccccagt 4020
tgttgttgat gagtctttgc cagtcacgtg gtgaaaagtg gcagtggaat ctgttgaagt 4080
caaaataccc ccaaggggtg ctgtagccaa agtagtgatt gtcgttcgag gctcctgatt 4140
ggctggaaat ttgtttgtag aggtggttgt tgtaggtggg cagggcccag gttcgggtgc 4200
tggtggtgat gactctgtcg cccatccatg tggaatcgca atgccaattt cccgaggaat 4260
tacccactcc gtcggcgccc tcgttattgt ctgccattgg tgcgccactg cctgtagcca 4320
tcgtattagt tcccagacca gagggggctg ctggtggctg tccgagaggc tgggggtcag 4380
gtactgagtc tgcgtctcca gtctgaccaa aattcaatct ttttcttgca ggctgctggc 4440
ccgcctttcc ggttcccgag gaggagtctg gctccacagg agagtgctct accggcctct 4500
tttttcccgg agccgtctta acaggttcct caaccaggcc cagaggttca agaaccctct 4560
ttttcgcctg gaagactgct cgtccgaggt tgcccccaaa agacgtatct tctttaaggc 4620
gctcctgaaa ctccgcgtcg gcgtggttgt acttgaggta cgggttgtct ccgctgtcga 4680
gctgccggtc gtaggctttg tcgtgctcga gggccgcggc gtctgcctcg ttgaccggct 4740
ctcccttgtc gagtccgttg aagggtccga ggtacttgta cccaggaagc acaagacccc 4800
tgctgtcgtc cttatgccgc tctgcgggct ttggtggtgg tgggccaggt ttgagcttcc 4860
accactgtct tattccttca gagagagtgt cctcgagcca atctggaaga taaccatcgg 4920
cagccatacc tgatttaaat catttattgt tcaaagatgc agtcatccaa atccacattg 4980
accagatcgc aggcagtgca agcgtctggc acctttccca tgatatgatg aatgtagcac 5040
agtttctgat acgccttttt gacgacagaa acgggttgag attctgacac gggaaagcac 5100
tctaaacagt ctttctgtcc gtgagtgaag cagatatttg aattctgatt cattctctcg 5160
cattgtctgc agggaaacag catcagattc atgcccacgt gacgagaaca tttgttttgg 5220
tacctgtctg cgtagttgat cgaagcttcc gcgtctgacg tcgatggctg cgcaactgac 5280
tcgcgcaccc gtttgggctc acttatatct gcgtcactgg gggcgggtct tttcttggct 5340
ccaccctttt tgacgtagaa ttcatgctcc acctcaacca cgtgatcctt tgcccaccgg 5400
aaaaagtctt tgacttcctg cttggtgacc ttcccaaagt catgatccag acggcgggtg 5460
agttcaaatt tgaacatccg gtcttgcaac ggctgctggt gttcgaaggt cgttgagttc 5520
ccgtcaatca cggcgcacat gttggtgttg gaggtgacga tcacgggagt cgggtctatc 5580
tgggccgagg acttgcattt ctggtccacg cgcaccttgc ttcctccgag aatggctttg 5640
gccgactcca cgaccttggc ggtcatcttc ccctcctccc accagatcac catcttgtcg 5700
acacagtcgt tgaagggaaa gttctcattg gtccagttta cgcacccgta gaagggcaca 5760
gtgtgggcta tggcctccgc gatgttggtc ttcccggtag ttgcaggccc aaacagccag 5820
atggtgttcc tcttgccgaa ctttttcgtg gcccatccca gaaagacgga agccgcatat 5880
tggggatcgt acccgtttag ttccaaaatt ttataaatcc gattgctgga aatgtcctcc 5940
acgggctgct ggcccaccag gtagtcgggg gcggttttag tcaggctcat aatctttccc 6000
gcattgtcca aggcagcctt gatttgggac cgcgagttgg aggccgcatt gaaggagatg 6060
tatgaggcct ggtcctcctg gatccactgc ttctccgagg taatcccctt gtccacgagc 6120
cacccgacca gctccatgta cctggctgaa gtttttgatc tgatcaccgg cgcatcagaa 6180
ttgggattct gattctcttt gttctgctcc tgcgtctgcg acacgtgcgt cagatgctgc 6240
gccaccaacc gtttacgctc cgtgagattc aaacaggcgc ttaaatactg ttccatatta 6300
gtccacgccc actggagctc aggctgggtt ttggggagca agtaattggg gatgtagcac 6360
tcatccacca ccttgttccc gcctccggcg ccatttctgg tctttgtgac cgcgaaccag 6420
tttggcaaag tcggctcgat cccgcggtaa attctctgaa tcagtttttc gcgaatctga 6480
ctcaggaaac gtcccaaaac catggatttc accccggtgg tttccacgag cacgtgcatg 6540
tggaagtagc tctctccctt ctcaaattgc acaaagaaaa gggcctccgg ggccttactc 6600
acacggcgcc attccgtcag aaagtcgcgc tgcagcttct cggccacggt caggggtgcc 6660
tgctcaatca gattcagatc catgtcagaa tctggcggca actcccattc cttctcggcc 6720
acccagttca caaagctgtc agaaatgccg ggcagatgct cgtcaaggtc gctggggacc 6780
ttaatcacaa tctcgtaaaa ccccggcatg gcggctgcgc gttcaaacct cccgcttcaa 6840
aatggagacc ctgcgtgctc actcgggctt aaatacccag cgtgaccaca tggtgtcgca 6900
aaatgtcgca aaacactcac gtgacctcta atacaggacc tccctaaccc tatgacgtaa 6960
ttcacgtcac gactccacca 6980
<210> 32
<211> 2208
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 32
ttacagatta cgagtcaggt atctggtgcc aatggggcga ggctctgaat acacgccatt 60
agtgtccaca gtaaagtcca cattaacaga cttgttgtag ttggaagtgt actgaatttc 120
gggattccag cgtttgctgt tttccttctg cagctcccac tcgatctcca cgctgacctg 180
tcccgtggag tactgtgtga tgaaggaagc aaactttgcc gcactgaagg tggtcgaagg 240
attcgcaggt accggggtgt tcttgatgag aatctgtgga ggagggtgtt taagtccgaa 300
tccacccatg aggggagagg ggtgaaaatg tccgtccgtg tgtggaatct ttgcccagat 360
gggcccctga aggtacacat ctctgtcctg ccagaccatg cctggaagaa cgccttgtgt 420
gttgacatct gcggtagctg cttgtctgtt gcctctctgg aggttggtag atacagaacc 480
atactgctcc gtagccacgg gattggttgt cctgatttcc tcttcgtctg taatcatgac 540
cttttcaatg tccacatttg ttttctctga gccttgcttc ccaaagatga gaaccccgct 600
ctgaggaaaa aacttttctt catcgtcctt gtggcttgcc atggccgggc ccggattcac 660
cagagagtct ctgccattga ggtggtactt ggtagctcca gtccacgagt attcactgtt 720
gttgttatcc gcagatgtct ttgatactcg ctgctggcgg taacagggtc caggaagcca 780
gttcctagac tggtcccgaa tgtcactcgc tccggcctga gaaaactgaa gccttgactg 840
cgtggtggtt ccacttggag tgtttgttct gctcaagtaa tacaggtact ggtcgatgag 900
aggattcatg agacggtcca gactctggct gtgagcgtag ctgctgtgga aaggaacgtc 960
ctcaaaagtg tagctgaagg taaagttgtt tccggtacgc agcatctgag aaggaaagta 1020
ctccaggcag taaaatgaag agcgtcctac tgcctgactc ccgttgttca gggtgaggta 1080
tccatactgt ggcaccatga agacgtctgc tgggaacggc gggaggcatc cttgatgcgc 1140
cgagccgagg acgtacggga gctggtactc cgagtcagta aacacctgaa ccgtgctggt 1200
aaggttattg gcaatcgtcg tcgtaccgtc attctgcgtg acctctttga cttgaatgtt 1260
aaagagcttg aagttgagtc tcttgggtcg gaatccccag ttgttgttga tgagtctttg 1320
ccagtcacgt ggtgaaaagt ggcagtggaa tctgttgaag tcaaaatacc cccaaggggt 1380
gctgtagcca aagtagtgat tgtcgttcga ggctcctgat tggctggaaa tttgtttgta 1440
gaggtggttg ttgtaggtgg gcagggccca ggttcgggtg ctggtggtga tgactctgtc 1500
gcccatccat gtggaatcgc aatgccaatt tcccgaggaa ttacccactc cgtcggcgcc 1560
ctcgttattg tctgccattg gtgcgccact gcctgtagcc atcgtattag ttcccagacc 1620
agagggggct gctggtggct gtccgagagg ctgggggtca ggtactgagt ctgcgtctcc 1680
agtctgacca aaattcaatc tttttcttgc aggctgctgg cccgcctttc cggttcccga 1740
ggaggagtct ggctccacag gagagtgctc taccggcctc ttttttcccg gagccgtctt 1800
aacaggttcc tcaaccaggc ccagaggttc aagaaccctc tttttcgcct ggaagactgc 1860
tcgtccgagg ttgcccccaa aagacgtatc ttctttaagg cgctcctgaa actccgcgtc 1920
ggcgtggttg tacttgaggt acgggttgtc tccgctgtcg agctgccggt cgtaggcttt 1980
gtcgtgctcg agggccgcgg cgtctgcctc gttgaccggc tctcccttgt cgagtccgtt 2040
gaagggtccg aggtacttgt acccaggaag cacaagaccc ctgctgtcgt ccttatgccg 2100
ctctgcgggc tttggtggtg gtgggccagg tttgagcttc caccactgtc ttattccttc 2160
agagagagtg tcctcgagcc aatctggaag ataaccatcg gcagccat 2208
<210> 33
<211> 6893
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 33
ctagagtcga cctgcaggca tgcaagcttg gcgtaatcat ggtcatagct gtttcctgtg 60
tgaaattgtt atccgctcac aattccacac aacatacgag ccggaagcat aaagtgtaaa 120
gcctggggtg cctaatgagt gagctaactc acattaattg cgttgcgctc actgcccgct 180
ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa tcggccaacg cgcggggaga 240
ggcggtttgc gtattgggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc 300
gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa 360
tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt 420
aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa 480
aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt 540
ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg 600
tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg taggtatctc 660
agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc 720
gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta 780
tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct 840
acagagttct tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc 900
tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa 960
caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa 1020
aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa 1080
aactcacgtt aagggatttt ggtcatgtga ttatcaaaaa ggatcttcac ctagatcctt 1140
ttaaattaaa aatgaagttt taaatcaatc taaagtatat atgagtaaac ttggtctgac 1200
agttagaaaa actcatcgag catcaaatga aactgcaatt tattcatatc aggattatca 1260
ataccatatt tttgaaaaag ccgtttctgt aatgaaggag aaaactcacc gaggcagttc 1320
cataggatgg caagatcctg gtatcggtct gcgattccga ctcgtccaac atcaatacaa 1380
cctattaatt tcccctcgtc aaaaataagg ttatcaagtg agaaatcacc atgagtgacg 1440
actgaatccg gtgagaatgg caaaagttta tgcatttctt tccagacttg ttcaacaggc 1500
cagccattac gctcgtcatc aaaatcactc gcatcaacca aaccgttatt cattcgtgat 1560
tgcgcctgag cgagacgaaa tacgcgatcg ctgttaaaag gacaattaca aacaggaatc 1620
gaatgcaacc ggcgcaggaa cactgccagc gcatcaacaa tattttcacc tgaatcagga 1680
tattcttcta atacctggaa tgctgttttc ccagggatcg cagtggtgag taaccatgca 1740
tcatcaggag tacggataaa atgcttgatg gtcggaagag gcataaattc cgtcagccag 1800
tttagtctga ccatctcatc tgtaacatca ttggcaacgc tacctttgcc atgtttcaga 1860
aacaactctg gcgcatcggg cttcccatac aatcgataga ttgtcgcacc tgattgcccg 1920
acattatcgc gagcccattt atacccatat aaatcagcat ccatgttgga atttaatcgc 1980
ggcctagagc aagacgtttc ccgttgaata tggctcatac tcttcctttt tcaatattat 2040
tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg tatttagaaa 2100
aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga cgtctaagaa 2160
accattatta acatgacatt aacctataaa aataggcgta tcacgaggcc ctttcgtctc 2220
gcgcgtttcg gtgatgacgg tgaaaacctc tgacacatgc agctcccgga gacggtcaca 2280
gcttgtctgt aagcggatgc cgggagcaga caagcccgtc agggcgcgtc agcgggtgtt 2340
ggcgggtgtc ggggctggct taactatgcg gcatcagagc agattgtact gagagtgcac 2400
catatgcggt gtgaaatacc gcacagatgc gtaaggagaa aataccgcat caggcgccat 2460
tcgccattca ggctgcgcaa ctgttgggaa gggcgatcgg tgcgggcctc ttcgctatta 2520
cgccagctgg cgaaaggggg atgtgctgca aggcgattaa gttgggtaac gccagggttt 2580
tcccagtcac gacgttgtaa aacgacggcc agtgaattcg agctcggtac ccgtagccat 2640
ggaaactaga taagaaagaa atacgcagag accaaagttc aactgaaacg aattaaacgg 2700
tttattgatt aacaagcaat tacagattac gagtcaggta tctggtgcca atggggcgag 2760
gctctgaata cacgccatta gtgtccacag taaagtccac attaacagac ttgttgtagt 2820
tggaagtgta ctgaatttcg ggattccagc gtttgctgtt ttccttctgc agctcccact 2880
cgatctccac gctgacctgt cccgtggagt actgtgtgat gaaggaagca aactttgccg 2940
cactgaaggt ggtcgaagga ttcgcaggta ccggggtgtt cttgatgaga atctgtggag 3000
gagggtgttt aagtccgaat ccacccatga ggggagaggg gtgaaaatgt ccgtccgtgt 3060
gtggaatctt tgcccagatg ggcccctgaa ggtacacatc tctgtcctgc cagaccatgc 3120
ctggaagaac gccttgtgtg ttgacatctg cggtagctgc ttgtctgttg cctctctgga 3180
ggttggtaga tacagaacca tactgctccg tagccacggg attggttgtc ctgatttcct 3240
cttcgtctgt aatcatgacc ttttcaatgt ccacatttgt tttctctgag ccttgcttcc 3300
caaagatgag aaccccgctc tgaggaaaaa acttttcttc atcgtccttg tggcttgcca 3360
tggccgggcc cggattcacc agagagtctc tgccattgag gtggtacttg gtagctccag 3420
tccacgagta ttcactgttg ttgttatccg cagatgtctt tgatactcgc tgctggcggt 3480
aacagggtcc aggaagccag ttcctagact ggtcccgaat gtcactcgct ccggcctgag 3540
aaaactgaag ccttgactgc gtggtggttc cacttggagt gtttgttctg ctcaagtaat 3600
acaggtactg gtcgatgaga ggattcatga gacggtccag actctggctg tgagcgtagc 3660
tgctgtggaa aggaacgtcc tcaaaagtgt agctgaaggt aaagttgttt ccggtacgca 3720
gcatctgaga aggaaagtac tccaggcagt aaaatgaaga gcgtcctact gcctgactcc 3780
cgttgttcag ggtgaggtat ccatactgtg gcaccatgaa gacgtctgct gggaacggcg 3840
ggaggcatcc ttgatgcgcc gagccgagga cgtacgggag ctggtactcc gagtcagtaa 3900
acacctgaac cgtgctggta aggttattgg caatcgtcgt cgtaccgtca ttctgcgtga 3960
cctctttgac ttgaatgtta aagagcttga agttgagtct cttgggtcgg aatccccagt 4020
tgttgttgat gagtctttgc cagtcacgtg gtgaaaagtg gcagtggaat ctgttgaagt 4080
caaaataccc ccaaggggtg ctgtagccaa agtagtgatt gtcgttcgag gctcctgatt 4140
ggctggaaat ttgtttgtag aggtggttgt tgtaggtggg cagggcccag gttcgggtgc 4200
tggtggtgat gactctgtcg cccatccatg tggaatcgca atgccaattt cccgaggaat 4260
tacccactcc gtcggcgccc tcgttattgt ctgccattgg tgcgccactg cctgtagcca 4320
tcgtattagt tcccagacca gagggggctg ctggtggctg tccgagaggc tgggggtcag 4380
gtactgagtc tgcgtctcca gtctgaccaa aattcaatct ttttcttgca ggctgctggc 4440
ccgcctttcc ggttcccgag gaggagtctg gctccacagg agagtgctct accggcctct 4500
tttttcccgg agccgtctta acaggttcct caaccaggcc cagaggttca agaaccctct 4560
ttttcgcctg gaagactgct cgtccgaggt tgcccccaaa agacgtatct tctttaaggc 4620
gctcctgaaa ctccgcgtcg gcgtggttgt acttgaggta cgggttgtct ccgctgtcga 4680
gctgccggtc gtaggctttg tcgtgctcga gggccgcggc gtctgcctcg ttgaccggct 4740
ctcccttgtc gagtccgttg aagggtccga ggtacttgta cccaggaagc acaagacccc 4800
tgctgtcgtc cttatgccgc tctgcgggct ttggtggtgg tgggccaggt ttgagcttcc 4860
accactgtct tattccttca gagagagtgt cctcgagcca atctggaaga taaccatcgg 4920
cagccatacc tgatttaaat catttattgt tcaaagatgc agtcatccaa atccacattg 4980
accagatcgc aggcagtgca agcgtctggc acctttccca tgatatgatg aatgtagcac 5040
agtttctgat acgccttttt gacgacagaa acgggttgag attctgacac gggaaagcac 5100
tctaaacagt ctttctgtcc gtgagtgaag cagatatttg aattctgatt cattctctcg 5160
cattgtctgc agggaaacag catcagattc atgcccacgt gacgagaaca tttgttttgg 5220
tacctgtctg cgtagttgat cgaagcttcc gcgtctgacg tcgatggctg cgcaactgac 5280
tcgcgcaccc gtttgggctc acttatatct gcgtcactgg gggcgggtct tttcttggct 5340
ccaccctttt tgacgtagaa ttcatgctcc acctcaacca cgtgatcctt tgcccaccgg 5400
aaaaagtctt tgacttcctg cttggtgacc ttcccaaagt catgatccag acggcgggtg 5460
agttcaaatt tgaacatccg gtcttgcaac ggctgctggt gttcgaaggt cgttgagttc 5520
ccgtcaatca cggcgcacat gttggtgttg gaggtgacga tcacgggagt cgggtctatc 5580
tgggccgagg acttgcattt ctggtccacg cgcaccttgc ttcctccgag aatggctttg 5640
gccgactcca cgaccttggc ggtcatcttc ccctcctccc accagatcac catcttgtcg 5700
acacagtcgt tgaagggaaa gttctcattg gtccagttta cgcacccgta gaagggcaca 5760
gtgtgggcta tggcctccgc gatgttggtc ttcccggtag ttgcaggccc aaacagccag 5820
atggtgttcc tcttgccgaa ctttttcgtg gcccatccca gaaagacgga agccgcatat 5880
tggggatcgt acccgtttag ttccaaaatt ttataaatcc gattgctgga aatgtcctcc 5940
acgggctgct ggcccaccag gtagtcgggg gcggttttag tcaggctcat aatctttccc 6000
gcattgtcca aggcagcctt gatttgggac cgcgagttgg aggccgcatt gaaggagatg 6060
tatgaggcct ggtcctcctg gatccactgc ttctccgagg taatcccctt gtccacgagc 6120
cacccgacca gctccatgta cctggctgaa gtttttgatc tgatcaccgg cgcatcagaa 6180
ttgggattct gattctcttt gttctgctcc tgcgtctgcg acacgtgcgt cagatgctgc 6240
gccaccaacc gtttacgctc cgtgagattc aaacaggcgc ttaaatactg ttccatatta 6300
gtccacgccc actggagctc aggctgggtt ttggggagca agtaattggg gatgtagcac 6360
tcatccacca ccttgttccc gcctccggcg ccatttctgg tctttgtgac cgcgaaccag 6420
tttggcaaag tcggctcgat cccgcggtaa attctctgaa tcagtttttc gcgaatctga 6480
ctcaggaaac gtcccaaaac catggatttc accccggtgg tttccacgag cacgtgcatg 6540
tggaagtagc tctctccctt ctcaaattgc acaaagaaaa gggcctccgg ggccttactc 6600
acacggcgcc attccgtcag aaagtcgcgc tgcagcttct cggccacggt caggggtgcc 6660
tgctcaatca gattcagatc catgtcagaa tctggcggca actcccattc cttctcggcc 6720
acccagttca caaagctgtc agaaatgccg ggcagatgct cgtcaaggtc gctggggacc 6780
ttaatcacaa tctcgtaaaa ccccggcatg gcggctgcgc agatcagaag ttcctatact 6840
ttctagagaa taggaacttc ggaataggaa cttctgatct tccgggggat cca 6893
<210> 34
<211> 179
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 34
ccccggcatg gcggctgcgc gttcaaacct cccgcttcaa aatggagacc ctgcgtgctc 60
actcgggctt aaatacccag cgtgaccaca tggtgtcgca aaatgtcgca aaacactcac 120
gtgacctcta atacaggacc tccctaaccc tatgacgtaa ttcacgtcac gactccacc 179
<210> 35
<211> 6989
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 35
ctagagtcga cctgcaggca tgcaagcttg gcgtaatcat ggtcatagct gtttcctgtg 60
tgaaattgtt atccgctcac aattccacac aacatacgag ccggaagcat aaagtgtaaa 120
gcctggggtg cctaatgagt gagctaactc acattaattg cgttgcgctc actgcccgct 180
ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa tcggccaacg cgcggggaga 240
ggcggtttgc gtattgggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc 300
gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa 360
tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt 420
aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa 480
aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt 540
ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg 600
tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg taggtatctc 660
agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc 720
gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta 780
tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct 840
acagagttct tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc 900
tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa 960
caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa 1020
aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa 1080
aactcacgtt aagggatttt ggtcatgtga ttatcaaaaa ggatcttcac ctagatcctt 1140
ttaaattaaa aatgaagttt taaatcaatc taaagtatat atgagtaaac ttggtctgac 1200
agttagaaaa actcatcgag catcaaatga aactgcaatt tattcatatc aggattatca 1260
ataccatatt tttgaaaaag ccgtttctgt aatgaaggag aaaactcacc gaggcagttc 1320
cataggatgg caagatcctg gtatcggtct gcgattccga ctcgtccaac atcaatacaa 1380
cctattaatt tcccctcgtc aaaaataagg ttatcaagtg agaaatcacc atgagtgacg 1440
actgaatccg gtgagaatgg caaaagttta tgcatttctt tccagacttg ttcaacaggc 1500
cagccattac gctcgtcatc aaaatcactc gcatcaacca aaccgttatt cattcgtgat 1560
tgcgcctgag cgagacgaaa tacgcgatcg ctgttaaaag gacaattaca aacaggaatc 1620
gaatgcaacc ggcgcaggaa cactgccagc gcatcaacaa tattttcacc tgaatcagga 1680
tattcttcta atacctggaa tgctgttttc ccagggatcg cagtggtgag taaccatgca 1740
tcatcaggag tacggataaa atgcttgatg gtcggaagag gcataaattc cgtcagccag 1800
tttagtctga ccatctcatc tgtaacatca ttggcaacgc tacctttgcc atgtttcaga 1860
aacaactctg gcgcatcggg cttcccatac aatcgataga ttgtcgcacc tgattgcccg 1920
acattatcgc gagcccattt atacccatat aaatcagcat ccatgttgga atttaatcgc 1980
ggcctagagc aagacgtttc ccgttgaata tggctcatac tcttcctttt tcaatattat 2040
tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg tatttagaaa 2100
aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga cgtctaagaa 2160
accattatta acatgacatt aacctataaa aataggcgta tcacgaggcc ctttcgtctc 2220
gcgcgtttcg gtgatgacgg tgaaaacctc tgacacatgc agctcccgga gacggtcaca 2280
gcttgtctgt aagcggatgc cgggagcaga caagcccgtc agggcgcgtc agcgggtgtt 2340
ggcgggtgtc ggggctggct taactatgcg gcatcagagc agattgtact gagagtgcac 2400
catatgcggt gtgaaatacc gcacagatgc gtaaggagaa aataccgcat caggcgccat 2460
tcgccattca ggctgcgcaa ctgttgggaa gggcgatcgg tgcgggcctc ttcgctatta 2520
cgccagctgg cgaaaggggg atgtgctgca aggcgattaa gttgggtaac gccagggttt 2580
tcccagtcac gacgttgtaa aacgacggcc agtgaattcg agctcggtac ccgtagccat 2640
ggaaactaga taagaaagaa atacgcagag accaaagttc aactgaaacg aattaaacgg 2700
tttattgatt aacaagcaat tacagattac gggtgaggta acgggtgcca atggggcggg 2760
gttcagagta cacgccttct gtattaacag caaagtccac acttgtagat ttgtagtagt 2820
tggaggtgta ctggatctcg gggttccagc gcttgctgtt ttccttctgc agctcccatt 2880
caatttccac gctgacctgt ccggtgctgt attgcgtgat gaaagagttc agctttgact 2940
ggttgaaggt ggtcggagga tccgcaggta caggcgtgtt cttgatcagg atctgaggcg 3000
gaggatgttt caggccaaag ccgcccatca gcggagacgg gtggaagttg ccgtccgtgt 3060
gaggaatctt ggcccagatg ggaccctgca ggtacacgtc ccggttctgc cagaccatac 3120
cgggtaaggc cccctggctg ttgacagttc caatttgagg agccgtgttt tgctgctgca 3180
agttatctgc cacgataccg tattcctctg tagccacagg gttagtggtt ttgatttctt 3240
cctcgctggt gagcatgaca tcgctgtaat ccgcattgtc tctggcagca ttttgtttgc 3300
caaaaatcag gatcccgtta ctgggaaaaa aacgctcctc gtcgtctttg tgtgttgcca 3360
tagcgatgcc aggattagcc aatgaatttc ttccattcag atggtatttg gtcccagcag 3420
tccaggcaaa gttgctattg ttgttttgcc cggttgtcgt tgagacgcgt tgttggcggt 3480
aacagggtcc tggcagccag ttctttgcct gattggccat tgtattaggc ccaccttggc 3540
tgaagcccag agtctgcgta tttgccgtgc ctcctgttgt ttgagtccga gacaagtagt 3600
acaggtactg gtcaatcaga ggattcatca gccggtccaa gctctggctg tgggcgtagc 3660
tgctgtggaa aggcacgtcc tcgaaggtgt aagtaaactg gaagttgttg ccggttctca 3720
gcatctgcga aggaaagtat tccaggcagt agaaggagga gcgtcccacg gcctgactac 3780
cgttgttgag tgttaggtag ccgtactggg gaatcatgaa cacgtccgcc gggaacggag 3840
gcaggcagcc ctggtgggca gagccgagaa cgtacggcag ctggtactcc gagtccgtaa 3900
acacctggat ggtgctggtg aggttattgg cgatggtctt ggtgccttca ttctgcgtga 3960
cctccttgac ctggatgttg aagagcttga agctgagtct cttgggccgg aatccccagt 4020
tgttgttgat gagtcgctgc cagtcacgtg gtgaaaagtg gcagtggaat ctgttaaagt 4080
caaaataccc ccagggggtg ctgtagccga agtaggtgtt gtcgttggtg gctcctcccg 4140
atgtcccgtt ggagatttgc ttgtagaggt ggttgttgta ggtgggcagg gcccaggttc 4200
gggtgctggt ggtgatgact ctgtcgccca gccatgtgga atcgcaatgc caatttcccg 4260
aggaactacc cactccgtcg gcgccttcgt tattgtctgc cattggtgcg ccaccgcctg 4320
cagccattgt attaggtccc acaccagagg gcgctgctgg aggttctccg agaggttgag 4380
ggtctggaac tgactctgag tcgccagtct gaccaaaatt gagtcttttt ctggcgggct 4440
gttggccttt cttgccgatg cccgtagagg agtctggaga acgctggggt gatggctcta 4500
ccggtctctt ctttccagga gccgtcttag cgccttcctc aaccagaccg agaggttcga 4560
gaacccgctt cttggcctgg aagactgctc gcccgaggtt gcccccaaaa gacgtatctt 4620
cttgcagacg ctcctgaaac tcggcgtcgg cgtggttata ccgcaggtac ggattgtcac 4680
ccgcctgcag ctgctggtcg taggccttgt cgtgctcgag ggccgctgcg tccgccgcgt 4740
tgacgggctc ccccttgtcg agtccgttga agggtccgag gtacttgtag ccaggaagca 4800
ccagaccccg gccgtcgtcc tgcttttgct ggttggcttt gggcttcggg gctccaggtt 4860
tcagcgccca ccactcgcga atgccctcag agaggttgtc ctcgagccaa tctggaagat 4920
aaccatcggc agccatacct gatttaaatc atttattgtt caaagatgca gtcatccaaa 4980
tccacattga ccagatcgca ggcagtgcaa gcgtctggca cctttcccat gatatgatga 5040
atgtagcaca gtttctgata cgcctttttg acgacagaaa cgggttgaga ttctgacacg 5100
ggaaagcact ctaaacagtc tttctgtccg tgagtgaagc agatatttga attctgattc 5160
attctctcgc attgtctgca gggaaacagc atcagattca tgcccacgtg acgagaacat 5220
ttgttttggt acctgtctgc gtagttgatc gaagcttccg cgtctgacgt cgatggctgc 5280
gcaactgact cgcgcacccg tttgggctca cttatatctg cgtcactggg ggcgggtctt 5340
ttcttggctc cacccttttt gacgtagaat tcatgctcca cctcaaccac gtgatccttt 5400
gcccaccgga aaaagtcttt gacttcctgc ttggtgacct tcccaaagtc atgatccaga 5460
cggcgggtga gttcaaattt gaacatccgg tcttgcaacg gctgctggtg ttcgaaggtc 5520
gttgagttcc cgtcaatcac ggcgcacatg ttggtgttgg aggtgacgat cacgggagtc 5580
gggtctatct gggccgagga cttgcatttc tggtccacgc gcaccttgct tcctccgaga 5640
atggctttgg ccgactccac gaccttggcg gtcatcttcc cctcctccca ccagatcacc 5700
atcttgtcga cacagtcgtt gaagggaaag ttctcattgg tccagtttac gcacccgtag 5760
aagggcacag tgtgggctat ggcctccgcg atgttggtct tcccggtagt tgcaggccca 5820
aacagccaga tggtgttcct cttgccgaac tttttcgtgg cccatcccag aaagacggaa 5880
gccgcatatt ggggatcgta cccgtttagt tccaaaattt tataaatccg attgctggaa 5940
atgtcctcca cgggctgctg gcccaccagg tagtcggggg cggttttagt caggctcata 6000
atctttcccg cattgtccaa ggcagccttg atttgggacc gcgagttgga ggccgcattg 6060
aaggagatgt atgaggcctg gtcctcctgg atccactgct tctccgaggt aatccccttg 6120
tccacgagcc acccgaccag ctccatgtac ctggctgaag tttttgatct gatcaccggc 6180
gcatcagaat tgggattctg attctctttg ttctgctcct gcgtctgcga cacgtgcgtc 6240
agatgctgcg ccaccaaccg tttacgctcc gtgagattca aacaggcgct taaatactgt 6300
tccatattag tccacgccca ctggagctca ggctgggttt tggggagcaa gtaattgggg 6360
atgtagcact catccaccac cttgttcccg cctccggcgc catttctggt ctttgtgacc 6420
gcgaaccagt ttggcaaagt cggctcgatc ccgcggtaaa ttctctgaat cagtttttcg 6480
cgaatctgac tcaggaaacg tcccaaaacc atggatttca ccccggtggt ttccacgagc 6540
acgtgcatgt ggaagtagct ctctcccttc tcaaattgca caaagaaaag ggcctccggg 6600
gccttactca cacggcgcca ttccgtcaga aagtcgcgct gcagcttctc ggccacggtc 6660
aggggtgcct gctcaatcag attcagatcc atgtcagaat ctggcggcaa ctcccattcc 6720
ttctcggcca cccagttcac aaagctgtca gaaatgccgg gcagatgctc gtcaaggtcg 6780
ctggggacct taatcacaat ctcgtaaaac cccggcatgg cggctgcgcg ttcaaacctc 6840
ccgcttcaaa atggagaccc tgcgtgctca ctcgggctta aatacccagc gtgaccacat 6900
ggtgtcgcaa aatgtcgcaa aacactcacg tgacctctaa tacaggacct ccctaaccct 6960
atgacgtaat tcacgtcacg actccacca 6989
<210> 36
<211> 2217
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 36
ttacagatta cgggtgaggt aacgggtgcc aatggggcgg ggttcagagt acacgccttc 60
tgtattaaca gcaaagtcca cacttgtaga tttgtagtag ttggaggtgt actggatctc 120
ggggttccag cgcttgctgt tttccttctg cagctcccat tcaatttcca cgctgacctg 180
tccggtgctg tattgcgtga tgaaagagtt cagctttgac tggttgaagg tggtcggagg 240
atccgcaggt acaggcgtgt tcttgatcag gatctgaggc ggaggatgtt tcaggccaaa 300
gccgcccatc agcggagacg ggtggaagtt gccgtccgtg tgaggaatct tggcccagat 360
gggaccctgc aggtacacgt cccggttctg ccagaccata ccgggtaagg ccccctggct 420
gttgacagtt ccaatttgag gagccgtgtt ttgctgctgc aagttatctg ccacgatacc 480
gtattcctct gtagccacag ggttagtggt tttgatttct tcctcgctgg tgagcatgac 540
atcgctgtaa tccgcattgt ctctggcagc attttgtttg ccaaaaatca ggatcccgtt 600
actgggaaaa aaacgctcct cgtcgtcttt gtgtgttgcc atagcgatgc caggattagc 660
caatgaattt cttccattca gatggtattt ggtcccagca gtccaggcaa agttgctatt 720
gttgttttgc ccggttgtcg ttgagacgcg ttgttggcgg taacagggtc ctggcagcca 780
gttctttgcc tgattggcca ttgtattagg cccaccttgg ctgaagccca gagtctgcgt 840
atttgccgtg cctcctgttg tttgagtccg agacaagtag tacaggtact ggtcaatcag 900
aggattcatc agccggtcca agctctggct gtgggcgtag ctgctgtgga aaggcacgtc 960
ctcgaaggtg taagtaaact ggaagttgtt gccggttctc agcatctgcg aaggaaagta 1020
ttccaggcag tagaaggagg agcgtcccac ggcctgacta ccgttgttga gtgttaggta 1080
gccgtactgg ggaatcatga acacgtccgc cgggaacgga ggcaggcagc cctggtgggc 1140
agagccgaga acgtacggca gctggtactc cgagtccgta aacacctgga tggtgctggt 1200
gaggttattg gcgatggtct tggtgccttc attctgcgtg acctccttga cctggatgtt 1260
gaagagcttg aagctgagtc tcttgggccg gaatccccag ttgttgttga tgagtcgctg 1320
ccagtcacgt ggtgaaaagt ggcagtggaa tctgttaaag tcaaaatacc cccagggggt 1380
gctgtagccg aagtaggtgt tgtcgttggt ggctcctccc gatgtcccgt tggagatttg 1440
cttgtagagg tggttgttgt aggtgggcag ggcccaggtt cgggtgctgg tggtgatgac 1500
tctgtcgccc agccatgtgg aatcgcaatg ccaatttccc gaggaactac ccactccgtc 1560
ggcgccttcg ttattgtctg ccattggtgc gccaccgcct gcagccattg tattaggtcc 1620
cacaccagag ggcgctgctg gaggttctcc gagaggttga gggtctggaa ctgactctga 1680
gtcgccagtc tgaccaaaat tgagtctttt tctggcgggc tgttggcctt tcttgccgat 1740
gcccgtagag gagtctggag aacgctgggg tgatggctct accggtctct tctttccagg 1800
agccgtctta gcgccttcct caaccagacc gagaggttcg agaacccgct tcttggcctg 1860
gaagactgct cgcccgaggt tgcccccaaa agacgtatct tcttgcagac gctcctgaaa 1920
ctcggcgtcg gcgtggttat accgcaggta cggattgtca cccgcctgca gctgctggtc 1980
gtaggccttg tcgtgctcga gggccgctgc gtccgccgcg ttgacgggct cccccttgtc 2040
gagtccgttg aagggtccga ggtacttgta gccaggaagc accagacccc ggccgtcgtc 2100
ctgcttttgc tggttggctt tgggcttcgg ggctccaggt ttcagcgccc accactcgcg 2160
aatgccctca gagaggttgt cctcgagcca atctggaaga taaccatcgg cagccat 2217
<210> 37
<211> 6983
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 37
ctagagtcga cctgcaggca tgcaagcttg gcgtaatcat ggtcatagct gtttcctgtg 60
tgaaattgtt atccgctcac aattccacac aacatacgag ccggaagcat aaagtgtaaa 120
gcctggggtg cctaatgagt gagctaactc acattaattg cgttgcgctc actgcccgct 180
ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa tcggccaacg cgcggggaga 240
ggcggtttgc gtattgggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc 300
gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa 360
tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt 420
aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa 480
aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt 540
ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg 600
tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg taggtatctc 660
agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc 720
gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta 780
tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct 840
acagagttct tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc 900
tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa 960
caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa 1020
aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa 1080
aactcacgtt aagggatttt ggtcatgtga ttatcaaaaa ggatcttcac ctagatcctt 1140
ttaaattaaa aatgaagttt taaatcaatc taaagtatat atgagtaaac ttggtctgac 1200
agttagaaaa actcatcgag catcaaatga aactgcaatt tattcatatc aggattatca 1260
ataccatatt tttgaaaaag ccgtttctgt aatgaaggag aaaactcacc gaggcagttc 1320
cataggatgg caagatcctg gtatcggtct gcgattccga ctcgtccaac atcaatacaa 1380
cctattaatt tcccctcgtc aaaaataagg ttatcaagtg agaaatcacc atgagtgacg 1440
actgaatccg gtgagaatgg caaaagttta tgcatttctt tccagacttg ttcaacaggc 1500
cagccattac gctcgtcatc aaaatcactc gcatcaacca aaccgttatt cattcgtgat 1560
tgcgcctgag cgagacgaaa tacgcgatcg ctgttaaaag gacaattaca aacaggaatc 1620
gaatgcaacc ggcgcaggaa cactgccagc gcatcaacaa tattttcacc tgaatcagga 1680
tattcttcta atacctggaa tgctgttttc ccagggatcg cagtggtgag taaccatgca 1740
tcatcaggag tacggataaa atgcttgatg gtcggaagag gcataaattc cgtcagccag 1800
tttagtctga ccatctcatc tgtaacatca ttggcaacgc tacctttgcc atgtttcaga 1860
aacaactctg gcgcatcggg cttcccatac aatcgataga ttgtcgcacc tgattgcccg 1920
acattatcgc gagcccattt atacccatat aaatcagcat ccatgttgga atttaatcgc 1980
ggcctagagc aagacgtttc ccgttgaata tggctcatac tcttcctttt tcaatattat 2040
tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg tatttagaaa 2100
aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga cgtctaagaa 2160
accattatta acatgacatt aacctataaa aataggcgta tcacgaggcc ctttcgtctc 2220
gcgcgtttcg gtgatgacgg tgaaaacctc tgacacatgc agctcccgga gacggtcaca 2280
gcttgtctgt aagcggatgc cgggagcaga caagcccgtc agggcgcgtc agcgggtgtt 2340
ggcgggtgtc ggggctggct taactatgcg gcatcagagc agattgtact gagagtgcac 2400
catatgcggt gtgaaatacc gcacagatgc gtaaggagaa aataccgcat caggcgccat 2460
tcgccattca ggctgcgcaa ctgttgggaa gggcgatcgg tgcgggcctc ttcgctatta 2520
cgccagctgg cgaaaggggg atgtgctgca aggcgattaa gttgggtaac gccagggttt 2580
tcccagtcac gacgttgtaa aacgacggcc agtgaattcg agctcggtac ccgtagccat 2640
ggaaactaga taagaaagaa atacgcagag accaaagttc aactgaaacg aattaaacgg 2700
tttattgatt aacaagcaat tacagattac gagtcaggta tctggtgcca atggggcggg 2760
gttcactata tacaccttca gtattaacag caaattcaac attattagac ttgtaatagt 2820
tggaagtgta ctggatctcc gggttccagc gcttgctgtt ttccttctgc agctcccact 2880
cgatctccac gctgacttgg ccagtagaat actgggtgat gaaagagttc agcttgtcct 2940
tgttgaaggc cgttggagga tccgcaggta caggtgtgtt tttgatgagg atctgaggag 3000
gcgggtgctt cattccaaac cctcccatca gcggagaagg gtgaaagttg ccgtccgtgt 3060
gaggaatttt ggcccaaatg ggtccttgca ggtacacatc tctgtcctgc caaaccatac 3120
ccggaagtat tccttggttt tgaacccagc cggtctgcgc ctgtgcttgg gcactctggt 3180
ggtttgtggc cacttgtcca taggactccg ttgctaccgg gttagtagtt ttaatttctt 3240
cttcgttggt tatcatgact ttgtccgcat ccacgttgtc tcttccagtt ccttgtttgc 3300
caaaaattaa agatccagac aaaggaaaga aacggtcctc tccttctttg tggctggcca 3360
tagcaggtcc aggattcatc aagctattac gtccattgag agcccaagaa gaagctccag 3420
gccaagcaaa ttcgctgttg ttgttttgag tcacagtggt tgagacacgt tgttgtcggt 3480
agctgggtcc aggtatgtag tttcttccct ggacagccat gttgctgggt ccggccacac 3540
tgaattttag cgtttgttga ttctgtccag aaccgttaat agtctttgag agatagtaca 3600
agtattggtc gatgagtgga ttcattagtc ggtccaggct ttggctgtga gcgtagctgc 3660
tatggaaagg tacgttctca aactcgtagc tgaactggaa gttgttaccc gttcttagca 3720
tttgcgacgg gaaatattcc aggcagtaaa aggacgaacg acccacggcc tggcttccat 3780
cattaagcgt cagatacccg tactgaggaa tcatgaaaac gtccgctggg aacggcggga 3840
ggcagccctc gtgagccgac ccgagcacgt acgggagctg atagtctgag tccgtgaaga 3900
cctggaccgt gctggtaagg ttattggcga tggtcttgac tccattgttg tccgtaacct 3960
ctttgacctg aatgttgaag agcttgaagt tgagtcgctt aggccggaat ccccagttgt 4020
tgttgatgag tcgctgccag tcacgtggtg agaagtggca gtggaatctg ttgaagtcaa 4080
aataccccca gggggtgctg tagccgaagt aggcgttgtc atttgaagat cctccagatg 4140
tgctgttgga gatttgcttg tagaggtgat tgttgtaggt gggcagggcc caggttcggg 4200
tgctggtggt gatgactctg tcccccagcc attgggaatc gcaatgccaa tttcccgagg 4260
aactacccac tccatcggca ccttcgttat tgtctgccac tggtgcgcca ccacctgaag 4320
ccattgtaag agatcccaca cctgaggggg ctgcgggagg ttctccgatt ggttgagggt 4380
ctgggactga ctctgtgtcg ccagtctgac cgaaattgag tctcttttta gcgggctgtg 4440
cacccgattt gccaataccc gcggaggagt ccggttcctg aggagactgc tctacaggcc 4500
tcttctttcc aggagccgtc ttagccgctt cctcaaccag accaagaggt tcaagaagcc 4560
tctttttggc ctggaagact gctcgcccga ggttgccccc aaaagacgta tcttctttga 4620
gccgctcctg gaactcggcg tcggcgtggt tgtacttgag gtacgggttg tctccggcct 4680
tgagctgctg gtcgtaggcc ttgtcgtgct cgagggccgc cgcgtctgct gcgttgaccg 4740
gctccccctt gtcgagtccg ttgccgggtc caaggtattt gtaacccgga agcacaagac 4800
ctcgagcgtt gtcttgatgt tgttgatttg ccttgggttg aggggctcca ggtttcaaag 4860
cccaccactc gcgaattcct tcactaaggt tgtcctcgag ccaatctgga agataaccat 4920
cggcagccat acctgattta aatcatttat tgttcaaaga tgcagtcatc caaatccaca 4980
ttgaccagat cgcaggcagt gcaagcgtct ggcacctttc ccatgatatg atgaatgtag 5040
cacagtttct gatacgcctt tttgacgaca gaaacgggtt gagattctga cacgggaaag 5100
cactctaaac agtctttctg tccgtgagtg aagcagatat ttgaattctg attcattctc 5160
tcgcattgtc tgcagggaaa cagcatcaga ttcatgccca cgtgacgaga acatttgttt 5220
tggtacctgt ctgcgtagtt gatcgaagct tccgcgtctg acgtcgatgg ctgcgcaact 5280
gactcgcgca cccgtttggg ctcacttata tctgcgtcac tgggggcggg tcttttcttg 5340
gctccaccct ttttgacgta gaattcatgc tccacctcaa ccacgtgatc ctttgcccac 5400
cggaaaaagt ctttgacttc ctgcttggtg accttcccaa agtcatgatc cagacggcgg 5460
gtgagttcaa atttgaacat ccggtcttgc aacggctgct ggtgttcgaa ggtcgttgag 5520
ttcccgtcaa tcacggcgca catgttggtg ttggaggtga cgatcacggg agtcgggtct 5580
atctgggccg aggacttgca tttctggtcc acgcgcacct tgcttcctcc gagaatggct 5640
ttggccgact ccacgacctt ggcggtcatc ttcccctcct cccaccagat caccatcttg 5700
tcgacacagt cgttgaaggg aaagttctca ttggtccagt ttacgcaccc gtagaagggc 5760
acagtgtggg ctatggcctc cgcgatgttg gtcttcccgg tagttgcagg cccaaacagc 5820
cagatggtgt tcctcttgcc gaactttttc gtggcccatc ccagaaagac ggaagccgca 5880
tattggggat cgtacccgtt tagttccaaa attttataaa tccgattgct ggaaatgtcc 5940
tccacgggct gctggcccac caggtagtcg ggggcggttt tagtcaggct cataatcttt 6000
cccgcattgt ccaaggcagc cttgatttgg gaccgcgagt tggaggccgc attgaaggag 6060
atgtatgagg cctggtcctc ctggatccac tgcttctccg aggtaatccc cttgtccacg 6120
agccacccga ccagctccat gtacctggct gaagtttttg atctgatcac cggcgcatca 6180
gaattgggat tctgattctc tttgttctgc tcctgcgtct gcgacacgtg cgtcagatgc 6240
tgcgccacca accgtttacg ctccgtgaga ttcaaacagg cgcttaaata ctgttccata 6300
ttagtccacg cccactggag ctcaggctgg gttttgggga gcaagtaatt ggggatgtag 6360
cactcatcca ccaccttgtt cccgcctccg gcgccatttc tggtctttgt gaccgcgaac 6420
cagtttggca aagtcggctc gatcccgcgg taaattctct gaatcagttt ttcgcgaatc 6480
tgactcagga aacgtcccaa aaccatggat ttcaccccgg tggtttccac gagcacgtgc 6540
atgtggaagt agctctctcc cttctcaaat tgcacaaaga aaagggcctc cggggcctta 6600
ctcacacggc gccattccgt cagaaagtcg cgctgcagct tctcggccac ggtcaggggt 6660
gcctgctcaa tcagattcag atccatgtca gaatctggcg gcaactccca ttccttctcg 6720
gccacccagt tcacaaagct gtcagaaatg ccgggcagat gctcgtcaag gtcgctgggg 6780
accttaatca caatctcgta aaaccccggc atggcggctg cgcgttcaaa cctcccgctt 6840
caaaatggag accctgcgtg ctcactcggg cttaaatacc cagcgtgacc acatggtgtc 6900
gcaaaatgtc gcaaaacact cacgtgacct ctaatacagg acctccctaa ccctatgacg 6960
taattcacgt cacgactcca cca 6983
<210> 38
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 38
caacatacga gccggaagca taaagtgtaa a 31
<210> 39
<211> 5334
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 39
ggtacccaac tccatgctca acagtcccca ggtacagccc accctgcgtc gcaaccagga 60
acagctctac agcttcctgg agcgccactc gccctacttc cgcagccaca gtgcgcagat 120
taggagcgcc acttcttttt gtcacttgaa aaacatgtaa aaataatgta ctagagacac 180
tttcaataaa ggcaaatgct tttatttgta cactctcggg tgattattta cccccaccct 240
tgccgtctgc gccgtttaaa aatcaaaggg gttctgccgc gcatcgctat gcgccactgg 300
cagggacacg ttgcgatact ggtgtttagt gctccactta aactcaggca caaccatccg 360
cggcagctcg gtgaagtttt cactccacag gctgcgcacc atcaccaacg cgtttagcag 420
gtcgggcgcc gatatcttga agtcgcagtt ggggcctccg ccctgcgcgc gcgagttgcg 480
atacacaggg ttgcagcact ggaacactat cagcgccggg tggtgcacgc tggccagcac 540
gctcttgtcg gagatcagat ccgcgtccag gtcctccgcg ttgctcaggg cgaacggagt 600
caactttggt agctgccttc ccaaaaaggg cgcgtgccca ggctttgagt tgcactcgca 660
ccgtagtggc atcaaaaggt gaccgtgccc ggtctgggcg ttaggataca gcgcctgcat 720
aaaagccttg atctgcttaa aagccacctg agcctttgcg ccttcagaga agaacatgcc 780
gcaagacttg ccggaaaact gattggccgg acaggccgcg tcgtgcacgc agcaccttgc 840
gtcggtgttg gagatctgca ccacatttcg gccccaccgg ttcttcacga tcttggcctt 900
gctagactgc tccttcagcg cgcgctgccc gttttcgctc gtcacatcca tttcaatcac 960
gtgctcctta tttatcataa tgcttccgtg tagacactta agctcgcctt cgatctcagc 1020
gcagcggtgc agccacaacg cgcagcccgt gggctcgtga tgcttgtagg tcacctctgc 1080
aaacgactgc aggtacgcct gcaggaatcg ccccatcatc gtcacaaagg tcttgttgct 1140
ggtgaaggtc agctgcaacc cgcggtgctc ctcgttcagc caggtcttgc atacggccgc 1200
cagagcttcc acttggtcag gcagtagttt gaagttcgcc tttagatcgt tatccacgtg 1260
gtacttgtcc atcagcgcgc gcgcagcctc catgcccttc tcccacgcag acacgatcgg 1320
cacactcagc gggttcatca ccgtaatttc actttccgct tcgctgggct cttcctcttc 1380
ctcttgcgtc cgcataccac gcgccactgg gtcgtcttca ttcagccgcc gcactgtgcg 1440
cttacctcct ttgccatgct tgattagcac cggtgggttg ctgaaaccca ccatttgtag 1500
cgccacatct tctctttctt cctcgctgtc cacgattacc tctggtgatg gcgggcgctc 1560
gggcttggga gaagggcgct tctttttctt cttgggcgca atggccaaat ccgccgccga 1620
ggtcgatggc cgcgggctgg gtgtgcgcgg caccagcgcg tcttgtgatg agtcttcctc 1680
gtcctcggac tcgatacgcc gcctcatccg cttttttggg ggcgcccggg gaggcggcgg 1740
cgacggggac ggggacgaca cgtcctccat ggttggggga cgtcgcgccg caccgcgtcc 1800
gcgctcgggg gtggtttcgc gctgctcctc ttcccgactg gccatttcct tctcctatag 1860
gcagaaaaag atcatggagt cagtcgagaa gaaggacagc ctaaccgccc cctctgagtt 1920
cgccaccacc gcctccaccg atgccgccaa cgcgcctacc accttccccg tcgaggcacc 1980
cccgcttgag gaggaggaag tgattatcga gcaggaccca ggttttgtaa gcgaagacga 2040
cgaggaccgc tcagtaccaa cagaggataa aaagcaagac caggacaacg cagaggcaaa 2100
cgaggaacaa gtcgggcggg gggacgaaag gcatggcgac tacctagatg tgggagacga 2160
cgtgctgttg aagcatctgc agcgccagtg cgccattatc tgcgacgcgt tgcaagagcg 2220
cagcgatgtg cccctcgcca tagcggatgt cagccttgcc tacgaacgcc acctattctc 2280
accgcgcgta ccccccaaac gccaagaaaa cggcacatgc gagcccaacc cgcgcctcaa 2340
cttctacccc gtatttgccg tgccagaggt gcttgccacc tatcacatct ttttccaaaa 2400
ctgcaagata cccctatcct gccgtgccaa ccgcagccga gcggacaagc agctggcctt 2460
gcggcagggc gctgtcatac ctgatatcgc ctcgctcaac gaagtgccaa aaatctttga 2520
gggtcttgga cgcgacgaga agcgcgcggc aaacgctctg caacaggaaa acagcgaaaa 2580
tgaaagtcac tctggagtgt tggtggaact cgagggtgac aacgcgcgcc tagccgtact 2640
aaaacgcagc atcgaggtca cccactttgc ctacccggca cttaacctac cccccaaggt 2700
catgagcaca gtcatgagtg agctgatcgt gcgccgtgcg cagcccctgg agagggatgc 2760
aaatttgcaa gaacaaacag aggagggcct acccgcagtt ggcgacgagc agctagcgcg 2820
ctggcttcaa acgcgcgagc ctgccgactt ggaggagcga cgcaaactaa tgatggccgc 2880
agtgctcgtt accgtggagc ttgagtgcat gcagcggttc tttgctgacc cggagatgca 2940
gcgcaagcta gaggaaacat tgcactacac ctttcgacag ggctacgtac gccaggcctg 3000
caagatctcc aacgtggagc tctgcaacct ggtctcctac cttggaattt tgcacgaaaa 3060
ccgccttggg caaaacgtgc ttcattccac gctcaagggc gaggcgcgcc gcgactacgt 3120
ccgcgactgc gtttacttat ttctatgcta cacctggcag acggccatgg gcgtttggca 3180
gcagtgcttg gaggagtgca acctcaagga gctgcagaaa ctgctaaagc aaaacttgaa 3240
ggacctatgg acggccttca acgagcgctc cgtggccgcg cacctggcgg acatcatttt 3300
ccccgaacgc ctgcttaaaa ccctgcaaca gggtctgcca gacttcacca gtcaaagcat 3360
gttgcagaac tttaggaact ttatcctaga gcgctcagga atcttgcccg ccacctgctg 3420
tgcacttcct agcgactttg tgcccattaa gtaccgcgaa tgccctccgc cgctttgggg 3480
ccactgctac cttctgcagc tagccaacta ccttgcctac cactctgaca taatggaaga 3540
cgtgagcggt gacggtctac tggagtgtca ctgtcgctgc aacctatgca ccccgcaccg 3600
ctccctggtt tgcaattcgc agctgcttaa cgaaagtcaa attatcggta cctttgagct 3660
gcagggtccc tcgcctgacg aaaagtccgc ggctccgggg ttgaaactca ctccggggct 3720
gtggacgtcg gcttaccttc gcaaatttgt acctgaggac taccacgccc acgagattag 3780
gttctacgaa gaccaatccc gcccgccaaa tgcggagctt accgcctgcg tcattaccca 3840
gggccacatt cttggccaat tgcaagccat caacaaagcc cgccaagagt ttctgctacg 3900
aaagggacgg ggggtttact tggaccccca gtccggcgag gagctcaacc caatcccccc 3960
gccgccgcag ccctatcagc agcagccgcg ggcccttgct tcccaggatg gcacccaaaa 4020
agaagctgca gctgccgccg ccacccacgg acgaggagga atactgggac agtcaggcag 4080
aggaggtttt ggacgaggag gaggaggaca tgatggaaga ctgggagagc ctagacgagg 4140
aagcttccga ggtcgaagag gtgtcagacg aaacaccgtc accctcggtc gcattcccct 4200
cgccggcgcc ccagaaatcg gcaaccggtt ccagcatggc tacaacctcc gctcctcagg 4260
cgccgccggc actgcccgtt cgccgaccca accgtagatg ggacaccact ggaaccaggg 4320
ccggtaagtc caagcagccg ccgccgttag cccaagagca acaacagcgc caaggctacc 4380
gctcatggcg cgggcacaag aacgccatag ttgcttgctt gcaagactgt gggggcaaca 4440
tctccttcgc ccgccgcttt cttctctacc atcacggcgt ggccttcccc cgtaacatcc 4500
tgcattacta ccgtcatctc tacagcccat actgcaccgg cggcagcggc agcggcagca 4560
acagcagcgg ccacacagaa gcaaaggcga ccggatagca agactctgac aaagcccaag 4620
aaatccacag cggcggcagc agcaggagga ggagcgctgc gtctggcgcc caacgaaccc 4680
gtatcgaccc gcgagcttag aaacaggatt tttcccactc tgtatgctat atttcaacag 4740
agcaggggcc aagaacaaga gctgaaaata aaaaacaggt ctctgcgatc cctcacccgc 4800
agctgcctgt atcacaaaag cgaagatcag cttcggcgca cgctggaaga cgcggaggct 4860
ctcttcagta aatactgcgc gctgactctt aaggactagt ttcgcgccct ttctcaaatt 4920
taagcgcgaa aactacgtca tctccagcgg ccacacccgg cgccagcacc tgtcgtcagc 4980
gccattatga gcaaggaaat tcccacgccc tacatgtgga gttaccagcc acaaatggga 5040
cttgcggctg gagctgccca agactactca acccgaataa actacatgag cgcgggaccc 5100
cacatgatat cccgggtcaa cggaatccgc gcccaccgaa accgaattct cttggaacag 5160
gcggctatta ccaccacacc tcgtaataac cttaatcccc gtagttggcc cgctgccctg 5220
gtgtaccagg aaagtcccgc tcccaccact gtggtacttc ccagagacgc ccaggccgaa 5280
gttcagatga ctaactcagg ggcgcagctt gcgggcggct ttcgtcacag ggtg 5334
<210> 40
<211> 3201
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 40
tacactaaac ggtacacagg aaacaggaga cacaactcca agtgcatact ctatgtcatt 60
ttcatgggac tggtctggcc acaactacat taatgaaata tttgccacat cctcttacac 120
tttttcatac attgcccaag aataaagaat cgtttgtgtt atgtttcaac gtgtttattt 180
ttcaattgca gaaaatttca agtcattttt cattcagtag tatagcccca ccaccacata 240
gcttatacag atcaccgtac cttaatcaaa ctcacagaac cctagtattc aacctgccac 300
ctccctccca acacacagag tacacagtcc tttctccccg gctggcctta aaaagcatca 360
tatcatgggt aacagacata ttcttaggtg ttatattcca cacggtttcc tgtcgagcca 420
aacgctcatc agtgatatta ataaactccc cgggcagctc acttaagttc atgtcgctgt 480
ccagctgctg agccacaggc tgctgtccaa cttgcggttg cttaacgggc ggcgaaggag 540
aagtccacgc ctacatgggg gtagagtcat aatcgtgcat caggataggg cggtggtgct 600
gcagcagcgc gcgaataaac tgctgccgcc gccgctccgt cctgcaggaa tacaacatgg 660
cagtggtctc ctcagcgatg attcgcaccg cccgcagcat aaggcgcctt gtcctccggg 720
cacagcagcg caccctgatc tcacttaaat cagcacagta actgcagcac agcaccacaa 780
tattgttcaa aatcccacag tgcaaggcgc tgtatccaaa gctcatggcg gggaccacag 840
aacccacgtg gccatcatac cacaagcgca ggtagattaa gtggcgaccc ctcataaaca 900
cgctggacat aaacattacc tcttttggca tgttgtaatt caccacctcc cggtaccata 960
taaacctctg attaaacatg gcgccatcca ccaccatcct aaaccagctg gccaaaacct 1020
gcccgccggc tatacactgc agggaaccgg gactggaaca atgacagtgg agagcccagg 1080
actcgtaacc atggatcatc atgctcgtca tgatatcaat gttggcacaa cacaggcaca 1140
cgtgcataca cttcctcagg attacaagct cctcccgcgt tagaaccata tcccagggaa 1200
caacccattc ctgaatcagc gtaaatccca cactgcaggg aagacctcgc acgtaactca 1260
cgttgtgcat tgtcaaagtg ttacattcgg gcagcagcgg atgatcctcc agtatggtag 1320
cgcgggtttc tgtctcaaaa ggaggtagac gatccctact gtacggagtg cgccgagaca 1380
accgagatcg tgttggtcgt agtgtcatgc caaatggaac gccggacgta gtcatatttc 1440
ctgaagcaaa accaggtgcg ggcgtgacaa acagatctgc gtctccggtc tcgccgctta 1500
gatcgctctg tgtagtagtt gtagtatatc cactctctca aagcatccag gcgccccctg 1560
gcttcgggtt ctatgtaaac tccttcatgc gccgctgccc tgataacatc caccaccgca 1620
gaataagcca cacccagcca acctacacat tcgttctgcg agtcacacac gggaggagcg 1680
ggaagagctg gaagaaccat gttttttttt ttattccaaa agattatcca aaacctcaaa 1740
atgaagatct attaagtgaa cgcgctcccc tccggtggcg tggtcaaact ctacagccaa 1800
agaacagata atggcatttg taagatgttg cacaatggct tccaaaaggc aaacggccct 1860
cacgtccaag tggacgtaaa ggctaaaccc ttcagggtga atctcctcta taaacattcc 1920
agcaccttca accatgccca aataattctc atctcgccac cttctcaata tatctctaag 1980
caaatcccga atattaagtc cggccattgt aaaaatctgc tccagagcgc cctccacctt 2040
cagcctcaag cagcgaatca tgattgcaaa aattcaggtt cctcacagac ctgtataaga 2100
ttcaaaagcg gaacattaac aaaaataccg cgatcccgta ggtcccttcg cagggccagc 2160
tgaacataat cgtgcaggtc tgcacggacc agcgcggcca cttccccgcc aggaaccatg 2220
acaaaagaac ccacactgat tatgacacgc atactcggag ctatgctaac cagcgtagcc 2280
ccgatgtaag cttgttgcat gggcggcgat ataaaatgca aggtgctgct caaaaaatca 2340
ggcaaagcct cgcgcaaaaa agaaagcaca tcgtagtcat gctcatgcag ataaaggcag 2400
gtaagctccg gaaccaccac agaaaaagac accatttttc tctcaaacat gtctgcgggt 2460
ttctgcataa acacaaaata aaataacaaa aaaacattta aacattagaa gcctgtctta 2520
caacaggaaa aacaaccctt ataagcataa gacggactac ggccatgccg gcgtgaccgt 2580
aaaaaaactg gtcaccgtga ttaaaaagca ccaccgacag ctcctcggtc atgtccggag 2640
tcataatgta agactcggta aacacatcag gttgattcac atcggtcagt gctaaaaagc 2700
gaccgaaata gcccggggga atacataccc gcaggcgtag agacaacatt acagccccca 2760
taggaggtat aacaaaatta ataggagaga aaaacacata aacacctgaa aaaccctcct 2820
gcctaggcaa aatagcaccc tcccgctcca gaacaacata cagcgcttcc acagcggcag 2880
ccataacagt cagccttacc agtaaaaaag aaaacctatt aaaaaaacac cactcgacac 2940
ggcaccagct caatcagtca cagtgtaaaa aagggccaag tgcagagcga gtatatatag 3000
gactaaaaaa tgacgtaacg gttaaagtcc acaaaaaaca cccagaaaac cgcacgcgaa 3060
cctacgccca gaaacgaaag ccaaaaaacc cacaacttcc tcaaatcgtc acttccgttt 3120
tcccacgtta cgtaacttcc cattttaaga aaactacaat tcccaacaca tacaagttac 3180
tccgccctaa aacctacgtc a 3201
<210> 41
<211> 6896
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 41
ctagagtcga cctgcaggca tgcaagcttg gcgtaatcat ggtcatagct gtttcctgtg 60
tgaaattgtt atccgctcac aattccacac aacatacgag ccggaagcat aaagtgtaaa 120
gcctggggtg cctaatgagt gagctaactc acattaattg cgttgcgctc actgcccgct 180
ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa tcggccaacg cgcggggaga 240
ggcggtttgc gtattgggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc 300
gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa 360
tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt 420
aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa 480
aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt 540
ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg 600
tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg taggtatctc 660
agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc 720
gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta 780
tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct 840
acagagttct tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc 900
tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa 960
caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa 1020
aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa 1080
aactcacgtt aagggatttt ggtcatgtga ttatcaaaaa ggatcttcac ctagatcctt 1140
ttaaattaaa aatgaagttt taaatcaatc taaagtatat atgagtaaac ttggtctgac 1200
agttagaaaa actcatcgag catcaaatga aactgcaatt tattcatatc aggattatca 1260
ataccatatt tttgaaaaag ccgtttctgt aatgaaggag aaaactcacc gaggcagttc 1320
cataggatgg caagatcctg gtatcggtct gcgattccga ctcgtccaac atcaatacaa 1380
cctattaatt tcccctcgtc aaaaataagg ttatcaagtg agaaatcacc atgagtgacg 1440
actgaatccg gtgagaatgg caaaagttta tgcatttctt tccagacttg ttcaacaggc 1500
cagccattac gctcgtcatc aaaatcactc gcatcaacca aaccgttatt cattcgtgat 1560
tgcgcctgag cgagacgaaa tacgcgatcg ctgttaaaag gacaattaca aacaggaatc 1620
gaatgcaacc ggcgcaggaa cactgccagc gcatcaacaa tattttcacc tgaatcagga 1680
tattcttcta atacctggaa tgctgttttc ccagggatcg cagtggtgag taaccatgca 1740
tcatcaggag tacggataaa atgcttgatg gtcggaagag gcataaattc cgtcagccag 1800
tttagtctga ccatctcatc tgtaacatca ttggcaacgc tacctttgcc atgtttcaga 1860
aacaactctg gcgcatcggg cttcccatac aatcgataga ttgtcgcacc tgattgcccg 1920
acattatcgc gagcccattt atacccatat aaatcagcat ccatgttgga atttaatcgc 1980
ggcctagagc aagacgtttc ccgttgaata tggctcatac tcttcctttt tcaatattat 2040
tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg tatttagaaa 2100
aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga cgtctaagaa 2160
accattatta acatgacatt aacctataaa aataggcgta tcacgaggcc ctttcgtctc 2220
gcgcgtttcg gtgatgacgg tgaaaacctc tgacacatgc agctcccgga gacggtcaca 2280
gcttgtctgt aagcggatgc cgggagcaga caagcccgtc agggcgcgtc agcgggtgtt 2340
ggcgggtgtc ggggctggct taactatgcg gcatcagagc agattgtact gagagtgcac 2400
catatgcggt gtgaaatacc gcacagatgc gtaaggagaa aataccgcat caggcgccat 2460
tcgccattca ggctgcgcaa ctgttgggaa gggcgatcgg tgcgggcctc ttcgctatta 2520
cgccagctgg cgaaaggggg atgtgctgca aggcgattaa gttgggtaac gccagggttt 2580
tcccagtcac gacgttgtaa aacgacggcc agtgaattcg agctcggtac ccgtagccat 2640
ggaaactaga taagaaagaa atacgcagag accaaagttc aactgaaacg aattaaacgg 2700
tttattgatt aacaagcaat tacagattac gagtcaggta tctggtgcca atggggcggg 2760
gttcactata tacaccttca gtattaacag caaattcaac attattagac ttgtaatagt 2820
tggaagtgta ctggatctcc gggttccagc gcttgctgtt ttccttctgc agctcccact 2880
cgatctccac gctgacttgg ccagtagaat actgggtgat gaaagagttc agcttgtcct 2940
tgttgaaggc cgttggagga tccgcaggta caggtgtgtt tttgatgagg atctgaggag 3000
gcgggtgctt cattccaaac cctcccatca gcggagaagg gtgaaagttg ccgtccgtgt 3060
gaggaatttt ggcccaaatg ggtccttgca ggtacacatc tctgtcctgc caaaccatac 3120
ccggaagtat tccttggttt tgaacccagc cggtctgcgc ctgtgcttgg gcactctggt 3180
ggtttgtggc cacttgtcca taggactccg ttgctaccgg gttagtagtt ttaatttctt 3240
cttcgttggt tatcatgact ttgtccgcat ccacgttgtc tcttccagtt ccttgtttgc 3300
caaaaattaa agatccagac aaaggaaaga aacggtcctc tccttctttg tggctggcca 3360
tagcaggtcc aggattcatc aagctattac gtccattgag agcccaagaa gaagctccag 3420
gccaagcaaa ttcgctgttg ttgttttgag tcacagtggt tgagacacgt tgttgtcggt 3480
agctgggtcc aggtatgtag tttcttccct ggacagccat gttgctgggt ccggccacac 3540
tgaattttag cgtttgttga ttctgtccag aaccgttaat agtctttgag agatagtaca 3600
agtattggtc gatgagtgga ttcattagtc ggtccaggct ttggctgtga gcgtagctgc 3660
tatggaaagg tacgttctca aactcgtagc tgaactggaa gttgttaccc gttcttagca 3720
tttgcgacgg gaaatattcc aggcagtaaa aggacgaacg acccacggcc tggcttccat 3780
cattaagcgt cagatacccg tactgaggaa tcatgaaaac gtccgctggg aacggcggga 3840
ggcagccctc gtgagccgac ccgagcacgt acgggagctg atagtctgag tccgtgaaga 3900
cctggaccgt gctggtaagg ttattggcga tggtcttgac tccattgttg tccgtaacct 3960
ctttgacctg aatgttgaag agcttgaagt tgagtcgctt aggccggaat ccccagttgt 4020
tgttgatgag tcgctgccag tcacgtggtg agaagtggca gtggaatctg ttgaagtcaa 4080
aataccccca gggggtgctg tagccgaagt aggcgttgtc atttgaagat cctccagatg 4140
tgctgttgga gatttgcttg tagaggtgat tgttgtaggt gggcagggcc caggttcggg 4200
tgctggtggt gatgactctg tcccccagcc attgggaatc gcaatgccaa tttcccgagg 4260
aactacccac tccatcggca ccttcgttat tgtctgccac tggtgcgcca ccacctgaag 4320
ccattgtaag agatcccaca cctgaggggg ctgcgggagg ttctccgatt ggttgagggt 4380
ctgggactga ctctgtgtcg ccagtctgac cgaaattgag tctcttttta gcgggctgtg 4440
cacccgattt gccaataccc gcggaggagt ccggttcctg aggagactgc tctacaggcc 4500
tcttctttcc aggagccgtc ttagccgctt cctcaaccag accaagaggt tcaagaagcc 4560
tctttttggc ctggaagact gctcgcccga ggttgccccc aaaagacgta tcttctttga 4620
gccgctcctg gaactcggcg tcggcgtggt tgtacttgag gtacgggttg tctccggcct 4680
tgagctgctg gtcgtaggcc ttgtcgtgct cgagggccgc cgcgtctgct gcgttgaccg 4740
gctccccctt gtcgagtccg ttgccgggtc caaggtattt gtaacccgga agcacaagac 4800
ctcgagcgtt gtcttgatgt tgttgatttg ccttgggttg aggggctcca ggtttcaaag 4860
cccaccactc gcgaattcct tcactaaggt tgtcctcgag ccaatctgga agataaccat 4920
cggcagccat acctgattta aatcatttat tgttcaaaga tgcagtcatc caaatccaca 4980
ttgaccagat cgcaggcagt gcaagcgtct ggcacctttc ccatgatatg atgaatgtag 5040
cacagtttct gatacgcctt tttgacgaca gaaacgggtt gagattctga cacgggaaag 5100
cactctaaac agtctttctg tccgtgagtg aagcagatat ttgaattctg attcattctc 5160
tcgcattgtc tgcagggaaa cagcatcaga ttcatgccca cgtgacgaga acatttgttt 5220
tggtacctgt ctgcgtagtt gatcgaagct tccgcgtctg acgtcgatgg ctgcgcaact 5280
gactcgcgca cccgtttggg ctcacttata tctgcgtcac tgggggcggg tcttttcttg 5340
gctccaccct ttttgacgta gaattcatgc tccacctcaa ccacgtgatc ctttgcccac 5400
cggaaaaagt ctttgacttc ctgcttggtg accttcccaa agtcatgatc cagacggcgg 5460
gtgagttcaa atttgaacat ccggtcttgc aacggctgct ggtgttcgaa ggtcgttgag 5520
ttcccgtcaa tcacggcgca catgttggtg ttggaggtga cgatcacggg agtcgggtct 5580
atctgggccg aggacttgca tttctggtcc acgcgcacct tgcttcctcc gagaatggct 5640
ttggccgact ccacgacctt ggcggtcatc ttcccctcct cccaccagat caccatcttg 5700
tcgacacagt cgttgaaggg aaagttctca ttggtccagt ttacgcaccc gtagaagggc 5760
acagtgtggg ctatggcctc cgcgatgttg gtcttcccgg tagttgcagg cccaaacagc 5820
cagatggtgt tcctcttgcc gaactttttc gtggcccatc ccagaaagac ggaagccgca 5880
tattggggat cgtacccgtt tagttccaaa attttataaa tccgattgct ggaaatgtcc 5940
tccacgggct gctggcccac caggtagtcg ggggcggttt tagtcaggct cataatcttt 6000
cccgcattgt ccaaggcagc cttgatttgg gaccgcgagt tggaggccgc attgaaggag 6060
atgtatgagg cctggtcctc ctggatccac tgcttctccg aggtaatccc cttgtccacg 6120
agccacccga ccagctccat gtacctggct gaagtttttg atctgatcac cggcgcatca 6180
gaattgggat tctgattctc tttgttctgc tcctgcgtct gcgacacgtg cgtcagatgc 6240
tgcgccacca accgtttacg ctccgtgaga ttcaaacagg cgcttaaata ctgttccata 6300
ttagtccacg cccactggag ctcaggctgg gttttgggga gcaagtaatt ggggatgtag 6360
cactcatcca ccaccttgtt cccgcctccg gcgccatttc tggtctttgt gaccgcgaac 6420
cagtttggca aagtcggctc gatcccgcgg taaattctct gaatcagttt ttcgcgaatc 6480
tgactcagga aacgtcccaa aaccatggat ttcaccccgg tggtttccac gagcacgtgc 6540
atgtggaagt agctctctcc cttctcaaat tgcacaaaga aaagggcctc cggggcctta 6600
ctcacacggc gccattccgt cagaaagtcg cgctgcagct tctcggccac ggtcaggggt 6660
gcctgctcaa tcagattcag atccatgtca gaatctggcg gcaactccca ttccttctcg 6720
gccacccagt tcacaaagct gtcagaaatg ccgggcagat gctcgtcaag gtcgctgggg 6780
accttaatca caatctcgta aaaccccggc atggcggctg cgcagatcag aagttcctat 6840
actttctaga gaataggaac ttcggaatag gaacttctga tcttccgggg gatcca 6896
<210> 42
<211> 8469
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<221> modified_base
<222> (4155)..(4254)
<223> a, c, t, g, unknown or other
<220>
<221> misc_feature
<222> (4155)..(4254)
<223> This region may encompass 60-100 nucleotides
<400> 42
tagggaaata ggccaggttt tcaccgtaac acgccacatc ttgcgaatat atgtgtagaa 60
actgccggaa atcgtcgtgt gcactcatgg aaaacggtgt aacaagggtg aacactatcc 120
catatcacca gctcaccgtc tttcattgcc atacggaact ccggatgagc attcatcagg 180
cgggcaagaa tgtgaataaa ggccggataa aacttgtgct tatttttctt tacggtcttt 240
aaaaaggccg taatatccag ctgaacggtc tggttatagg tacattgagc aactgactga 300
aatgcctcaa aatgttcttt acgatgccat tgggatatat caacggtggt atatccagtg 360
atttttttct ccattttttt ttcctccttt agaaaaactc atcgagcatc aaatgaaact 420
gcaatttatt catatcagga ttatcaatac catatttttg aaaaagccgt ttctgtaatg 480
aaggagaaaa ctcaccgagg cagttccata ggatggcaag atcctggtat cggtctgcga 540
ttccgactcg tccaacatca atacaaccta ttaatttccc ctcgtcaaaa ataaggttat 600
caagtgagaa atcaccatga gtgacgactg aatccggtga gaatggcaaa agtttatgca 660
tttctttcca gacttgttca acaggccagc cattacgctc gtcatcaaaa tcactcgcat 720
caaccaaacc gttattcatt cgtgattgcg cctgagcgag gcgaaatacg cgatcgctgt 780
taaaaggaca attacaaaca ggaatcgagt gcaaccggcg caggaacact gccagcgcat 840
caacaatatt ttcacctgaa tcaggatatt cttctaatac ctggaacgct gtttttccgg 900
ggatcgcagt ggtgagtaac catgcatcat caggagtacg gataaaatgc ttgatggtcg 960
gaagtggcat aaattccgtc agccagttta gtctgaccat ctcatctgta acatcattgg 1020
caacgctacc tttgccatgt ttcagaaaca actctggcgc atcgggcttc ccatacaagc 1080
gatagattgt cgcacctgat tgcccgacat tatcgcgagc ccatttatac ccatataaat 1140
cagcatccat gttggaattt aatcgcggcc tcgacgtttc ccgttgaata tggctcattt 1200
ttttttcctc ctttaccaat gcttaatcag tgaggcacct atctcagcga tctgtctatt 1260
tcgttcatcc atagttgcct gactccccgt cgtgtagata actacgatac gggagggctt 1320
accatctggc cccagcgctg cgatgatacc gcgagaacca cgctcaccgg ctccggattt 1380
atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg caactttatc 1440
cgcctccatc cagtctatta attgttgccg ggaagctaga gtaagtagtt cgccagttaa 1500
tagtttgcgc aacgttgttg ccatcgctac aggcatcgtg gtgtcacgct cgtcgtttgg 1560
tatggcttca ttcagctccg gttcccaacg atcaaggcga gttacatgat cccccatgtt 1620
gtgcacgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg 1680
cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca 1740
accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata 1800
cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct 1860
tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact 1920
cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa 1980
acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc 2040
atattcttcc tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga 2100
tacatatttg aatgtattta gaaaaataaa caaatagggg tcagtgttac aaccaattaa 2160
ccaattctga acattatcgc gagcccattt atacctgaat atggctcata acaccccttg 2220
tttgcctggc ggcagtagcg cggtggtccc acctgacccc atgccgaact cagaagtgaa 2280
acgccgtagc gccgatggta gtgtggggac tccccatgcg agagtaggga actgccaggc 2340
atcaaataaa acgaaaggct cagtcgaaag actgggcctt tcgcccgggc taattgaggg 2400
gtgtcgccct tattcgactc ggggctcgag cagcagctgc gcgctcgctc gctcactgag 2460
gccgcccggg caaagcccgg gcgtcgggcg acctttggtc gcccggcctc agtgagcgag 2520
cgagcgcgca gagagggagt ggggttttaa ttaaacgcgt ttacataact tacggtaaat 2580
ggcccgcctg gctgaccgcc caacgacccc cgcccattga cgtcaataat gacgtatgtt 2640
cccatagtaa cgccaatagg gactttccat tgacgtcaat gggtggacta tttacggtaa 2700
actgcccact tggcagtaca tcaagtgtat catatgccaa gtacgccccc tattgacgtc 2760
aatgacggta aatggcccgc ctggcattat gcccagtaca tgaccttatg ggactttcct 2820
acttggcagt acatctacgt attagtcatc gctattacca tggtgatgcg gttttggcag 2880
tacatcaatg ggcgtggata gcggtttgac tcacggggat ttccaagtct ccaccccatt 2940
gacgtcaatg ggagtttgtt ttggcaccaa aatcaacggg actttccaaa atgtcgtaac 3000
aactccgccc cattgacgca aatgggcggt aggcgtgtac ggtgggaggt ctatataggc 3060
gcgccgaact gaaaaaccag aaagttaact ggtaagttta gtctttttgt cttttatttc 3120
aggtcccgga tccggtggtg gtgcaaatca aagaactgct cctcagtgga tgttgccttt 3180
acttctaggc ctgtacggaa gtgttacttc tgctctaaaa gctcctgcag ggaattcgcc 3240
accatggtga gcaagggcga ggagctgttc accggggtgg tgcccatcct ggtcgagctg 3300
gacggcgacg taaacggcca caagttcagc gtgtccggcg agggcgaggg cgatgccacc 3360
tacggcaagc tgaccctgaa gttcatctgc accaccggca agctgcccgt gccctggccc 3420
accctcgtga ccaccctgac ctacggcgtg cagtgcttca gccgctaccc cgaccacatg 3480
aagcagcacg acttcttcaa gtccgccatg cccgaaggct acgtccagga gcgcaccatc 3540
ttcttcaagg acgacggcaa ctacaagacc cgcgccgagg tgaagttcga gggcgacacc 3600
ctggtgaacc gcatcgagct gaagggcatc gacttcaagg aggacggcaa catcctgggg 3660
cacaagctgg agtacaacta caacagccac aacgtctata tcatggccga caagcagaag 3720
aacggcatca aggtgaactt caagatccgc cacaacatcg aggacggcag cgtgcagctc 3780
gccgaccact accagcagaa cacccccatc ggcgacggcc ccgtgctgct gcccgacaac 3840
cactacctga gcacccagtc cgccctgagc aaagacccca acgagaagcg cgatcacatg 3900
gtcctgctgg agttcgtgac cgccgccggg atcactctcg gcatggacga gctgtacaag 3960
taatagacta gtgtcgacag atcttttaaa aaacctccca cacaattgtt gttgttaact 4020
tgtttattgc agcttataat ggttacaaat aaagcaatag catcacaaat ttcacaaata 4080
aagcattttt ttcactgcat tctagttgtg gtttgtccaa actcatcaat gtatcttatc 4140
atgtctgttt aaacnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4200
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnatttaa 4260
ataggaaccc ctagtgatgg agttggccac tccctctctg cgcgctcgct cgctcactga 4320
ggccgggcga ccaaaggtcg cccgacgccc gggctttgcc cgggcggcct cagtgagcga 4380
gcgagcgcgc agagagtata catcgatgtg agttcgcggg tggctggggg gccctgggct 4440
gcgaccgccc ccgaaccgcg tctacgagcc ttgcgggctc cgggtctttg cagtcgtatg 4500
ggggcagggt agctgttccc cgcaaggaga gctcaaggtc agcgctcgga cctggcggag 4560
ccccgcaccc aggctgtggc gccctgtgca gctccgccct tgcggcgcca tctgcccgga 4620
gcctccttcc cctagtcccc agaaacagga ggtccctact cccgcccgag atcccgaccc 4680
ggacccctag gtgggggacg ctttctttcc tttcgcgctc tgcggggtca cgtgtcgcag 4740
aggagcccct cccccacggc ctccggcacc gcaggccccg ggatgctagt gcgcagcggg 4800
tgcatccctg tccggatgct gcgcctgcgg tagagcggcc gccatgttgc aaccgggaag 4860
gaaatgaatg ggcagccgtt aggaaagcct gccggtgact aaccctgcgc tcctgcctcg 4920
atgggtggag tcgcgtgtgg cggggaagtc aggtggagcg aggctagctg gcccgatttc 4980
tcctccgggt gatgcttttc ctagattatt ctctggtaaa tcaaagaagt gggtttatgg 5040
aggtcctctt gtgtcccctc cccgcagagg tgtggtggct gtggcatggt gccaagccgg 5100
gagaagctga gtcatgggta gttggaaaag gacatttcca ccgcaaaatg gcccctctgg 5160
tggtggcccc ttcctgcagc gccggctcac ctcacggccc cgcccttccc ctgccagcct 5220
agcgttgacc cgaccccaaa ggccaggctg taaatgtcac cgggaggatt gggtgtctgg 5280
gcgcctcggg gaacctgccc ttctccccat tccgtcttcc ggaaaccaga tctcccaccg 5340
caccctggtc tgaggttaaa tatagctgct gacctttctg tagctggggg cctgggctgg 5400
ggctctctcc catcccttct ccccacacac atgcacttac ctgtgctccc actcctgatt 5460
tctggaaaag agctaggaag gacaggcaac ttggcaaatc aaagccctgg gactaggggg 5520
ttaaaataca gcttcccctc ttcccacccg ccccagtctc tgtccctttt gtaggaggga 5580
cttagagaag gggtgggctt gccctgtcca gttaatttct gacctttact cctgcccttt 5640
gagtttgatg atgctgagtg tacaagcgtt ttctccctaa agggtgcagc tgagctaggc 5700
agcagcaagc attcctgggg tggcatagtg gggtggtgaa taccatgtac aaagcttgtg 5760
cccagactgt gggtggcagt gccccacatg gccgcttctc ctggaagggc ttcgtatgac 5820
tgggggtgtt gggcagccct ggagccttca gttgcagcca tgccttaagc caggccagcc 5880
tggcagggaa gctcaaggga gataaaattc aacctcttgg gccctcctgg gggtaaggag 5940
atgctgcatt cgccctctta atggggaggt ggcctagggc tgctcacata ttctggagga 6000
gcctcccctc ctcatgcctt cttgcctctt gtctcttagg catgcaaaag agtcgaataa 6060
gggcgacaca aaatttattc taaatgcata ataaatactg ataacatctt atagtttgta 6120
ttatattttg tattatcgtt gacatgtata attttgatat caaaaactga ttttcccttt 6180
attattttcg agatttattt tcttaattct ctttaacaaa ctagaaatat tgtatataca 6240
aaaaatcata aataatagat gaatagttta attataggtg ttcatcaatc gaaaaagcaa 6300
cgtatcttat ttaaagtgcg ttgctttttt ctcatttata aggttaaata attctcatat 6360
atcaagcaaa gtgacaggcg cccttaaata ttctgacaaa tgctctttcc ctaaactccc 6420
cccataaaaa aacccgccga agcgggtttt tacgttattt gcggattaac gattactcgt 6480
tatcagaacc gcccaggggg cccgagctta agactggccg tcgttttaca acacagaaag 6540
agtttgtaga aacgcaaaaa ggccatccgt caggggcctt ctgcttagtt tgatgcctgg 6600
cagttcccta ctctcgcctt ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg 6660
gctgcggcga gcggtatcag ctcactcaaa ggcggtaata cggttatcca cagaatcagg 6720
ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa 6780
ggccgcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg 6840
acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc 6900
tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc 6960
ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc 7020
ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg 7080
ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc 7140
actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga 7200
gttcttgaag tggtgggcta actacggcta cactagaaga acagtatttg gtatctgcgc 7260
tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac 7320
caccgctggt agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg 7380
atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga acgacgcgcg 7440
cgtaactcac gttaagggat tttggtcatg agcttgcgcc gtcccgtcaa gtcagcgtaa 7500
tgctctgctt aggtggcggt acttgggtcg atatcaaagt gcatcacttc ttcccgtatg 7560
cccaactttg tatagagagc cactgcggga tcgtcaccgt aatctgcttg cacgtagatc 7620
acataagcac caagcgcgtt ggcctcatgc ttgaggagat tgatgagcgc ggtggcaatg 7680
ccctgcctcc ggtgctcgcc ggagactgcg agatcataga tatagatctc actacgcggc 7740
tgctcaaact tgggcagaac gtaagccgcg agagcgccaa caaccgcttc ttggtcgaag 7800
gcagcaagcg cgatgaatgt cttactacgg agcaagttcc cgaggtaatc ggagtccggc 7860
tgatgttggg agtaggtggc tacgtcaccg aactcacgac cgaaaagatc aagagcagcc 7920
cgcatggatt tgacttggtc agggccgagc ctacatgtgc gaatgatgcc catacttgag 7980
ccacctaact ttgttttagg gcgactgccc tgctgcgtaa catcgttgct gctccataac 8040
atcaaacatc gacccacggc gtaacgcgct tgctgcttgg atgcccgagg catagactgt 8100
acaaaaaaac agtcataaca agccatgaaa accgccactg cgccgttacc accgctgcgt 8160
tcggtcaagg ttctggacca gttgcgtgag cgcatttttt tttcctcctc ggcgtttacg 8220
ccccgccctg ccactcatcg cagtactgtt gtaattcatt aagcattctg ccgacatgga 8280
agccatcaca gacggcatga tgaacctgaa tcgccagcgg catcagcacc ttgtcgcctt 8340
gcgtataata tttgcccata gtgaaaacgg gggcgaagaa gttgtccata ttggccacgt 8400
ttaaatcaaa actggtgaaa ctcacccagg gattggcgct gacgaaaaac atattctcaa 8460
taaaccctt 8469
<210> 43
<211> 116
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 43
cagcagctgc gcgctcgctc gctcactgag gccgcccggg caaagcccgg gcgtcgggcg 60
acctttggtc gcccggcctc agtgagcgag cgagcgcgca gagagggagt ggggtt 116
<210> 44
<211> 534
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 44
ttaggtggcg gtacttgggt cgatatcaaa gtgcatcact tcttcccgta tgcccaactt 60
tgtatagaga gccactgcgg gatcgtcacc gtaatctgct tgcacgtaga tcacataagc 120
accaagcgcg ttggcctcat gcttgaggag attgatgagc gcggtggcaa tgccctgcct 180
ccggtgctcg ccggagactg cgagatcata gatatagatc tcactacgcg gctgctcaaa 240
cttgggcaga acgtaagccg cgagagcgcc aacaaccgct tcttggtcga aggcagcaag 300
cgcgatgaat gtcttactac ggagcaagtt cccgaggtaa tcggagtccg gctgatgttg 360
ggagtaggtg gctacgtcac cgaactcacg accgaaaaga tcaagagcag cccgcatgga 420
tttgacttgg tcagggccga gcctacatgt gcgaatgatg cccatacttg agccacctaa 480
ctttgtttta gggcgactgc cctgctgcgt aacatcgttg ctgctccata acat 534
<210> 45
<211> 11635
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 45
ggtacccaac tccatgctta acagtcccca ggtacagccc accctgcgtc gcaaccagga 60
acagctctac agcttcctgg agcgccactc gccctacttc cgcagccaca gtgcgcagat 120
taggagcgcc acttcttttt gtcacttgaa aaacatgtaa aaataatgta ctaggagaca 180
ctttcaataa aggcaaatgt ttttatttgt acactctcgg gtgattattt accccccacc 240
cttgccgtct gcgccgttta aaaatcaaag gggttctgcc gcgcatcgct atgcgccact 300
ggcagggaca cgttgcgata ctggtgttta gtgctccact taaactcagg cacaaccatc 360
cgcggcagct cggtgaagtt ttcactccac aggctgcgca ccatcaccaa cgcgtttagc 420
aggtcgggcg ccgatatctt gaagtcgcag ttggggcctc cgccctgcgc gcgcgagttg 480
cgatacacag ggttgcagca ctggaacact atcagcgccg ggtggtgcac gctggccagc 540
acgctcttgt cggagatcag atccgcgtcc aggtcctccg cgttgctcag ggcgaacgga 600
gtcaactttg gtagctgcct tcccaaaaag ggtgcatgcc caggctttga gttgcactcg 660
caccgtagtg gcatcagaag gtgaccgtgc ccggtctggg cgttaggata cagcgcctgc 720
atgaaagcct tgatctgctt aaaagccacc tgagcctttg cgccttcaga gaagaacatg 780
ccgcaagact tgccggaaaa ctgattggcc ggacaggccg cgtcatgcac gcagcacctt 840
gcgtcggtgt tggagatctg caccacattt cggccccacc ggttcttcac gatcttggcc 900
ttgctagact gctccttcag cgcgcgctgc ccgttttcgc tcgtcacatc catttcaatc 960
acgtgctcct tatttatcat aatgctcccg tgtagacact taagctcgcc ttcgatctca 1020
gcgcagcggt gcagccacaa cgcgcagccc gtgggctcgt ggtgcttgta ggttacctct 1080
gcaaacgact gcaggtacgc ctgcaggaat cgccccatca tcgtcacaaa ggtcttgttg 1140
ctggtgaagg tcagctgcaa cccgcggtgc tcctcgttta gccaggtctt gcatacggcc 1200
gccagagctt ccacttggtc aggcagtagc ttgaagtttg cctttagatc gttatccacg 1260
tggtacttgt ccatcaacgc gcgcgcagcc tccatgccct tctcccacgc agacacgatc 1320
ggcaggctca gcgggtttat caccgtgctt tcactttccg cttcactgga ctcttccttt 1380
tcctcttgcg tccgcatacc ccgcgccact gggtcgtctt cattcagccg ccgcaccgtg 1440
cgcttacctc ccttgccgtg cttgattagc accggtgggt tgctgaaacc caccatttgt 1500
agcgccacat cttctctttc ttcctcgctg tccacgatca cctctgggga tggcgggcgc 1560
tcgggcttgg gagaggggcg cttctttttc tttttggacg caatggccaa atccgccgtc 1620
gaggtcgatg gccgcgggct gggtgtgcgc ggcaccagcg catcttgtga cgagtcttct 1680
tcgtcctcgg actcgagacg ccgcctcagc cgcttttttg ggggcgcgcg gggaggcggc 1740
ggcgacggcg acggggacga cacgtcctcc atggttggtg gacgtcgcgc cgcaccgcgt 1800
ccgcgctcgg gggtggtttc gcgctgctcc tcttcccgac tggccatttc cttctcctat 1860
aggcagaaaa agatcatgga gtcagtcgag aaggaggaca gcctaaccgc cccctttgag 1920
ttcgccacca ccgcctccac cgatgccgcc aacgcgccta ccaccttccc cgtcgaggca 1980
cccccgcttg aggaggagga agtgattatc gagcaggacc caggttttgt aagcgaagac 2040
gacgaggatc gctcagtacc aacagaggat aaaaagcaag accaggacga cgcagaggca 2100
aacgaggaac aagtcgggcg gggggaccaa aggcatggcg actacctaga tgtgggagac 2160
gacgtgctgt tgaagcatct gcagcgccag tgcgccatta tctgcgacgc gttgcaagag 2220
cgcagcgatg tgcccctcgc catagcggat gtcagccttg cctacgaacg ccacctgttc 2280
tcaccgcgcg taccccccaa acgccaagaa aacggcacat gcgagcccaa cccgcgcctc 2340
aacttctacc ccgtatttgc cgtgccagag gtgcttgcca cctatcacat ctttttccaa 2400
aactgcaaga tacccctatc ctgccgtgcc aaccgcagcc gagcggacaa gcagctggcc 2460
ttgcggcagg gcgctgtcat acctgatatc gcctcgctcg acgaagtgcc aaaaatcttt 2520
gagggtcttg gacgcgacga gaaacgcgcg gcaaacgctc tgcaacaaga aaacagcgaa 2580
aatgaaagtc actgtggagt gctggtggaa cttgagggtg acaacgcgcg cctagccgtg 2640
ctgaaacgca gcatcgaggt cacccacttt gcctacccgg cacttaacct accccccaag 2700
gttatgagca cagtcatgag cgagctgatc gtgcgccgtg cacgacccct ggagagggat 2760
gcaaacttgc aagaacaaac cgaggagggc ctacccgcag ttggcgatga gcagctggcg 2820
cgctggcttg agacgcgcga gcctgccgac ttggaggagc gacgcaagct aatgatggcc 2880
gcagtgcttg ttaccgtgga gcttgagtgc atgcagcggt tctttgctga cccggagatg 2940
cagcgcaagc tagaggaaac gttgcactac acctttcgcc agggctacgt gcgccaggcc 3000
tgcaaaattt ccaacgtgga gctctgcaac ctggtctcct accttggaat tttgcacgaa 3060
aaccgcctcg ggcaaaacgt gcttcattcc acgctcaagg gcgaggcgcg ccgcgactac 3120
gtccgcgact gcgtttactt atttctgtgc tacacctggc aaacggccat gggcgtgtgg 3180
cagcaatgcc tggaggagcg caacctaaag gagctgcaga agctgctaaa gcaaaacttg 3240
aaggacctat ggacggcctt caacgagcgc tccgtggccg cgcacctggc ggacattatc 3300
ttccccgaac gcctgcttaa aaccctgcaa cagggtctgc cagacttcac cagtcaaagc 3360
atgttgcaaa actttaggaa ctttatccta gagcgttcag gaattctgcc cgccacctgc 3420
tgtgcgcttc ctagcgactt tgtgcccatt aagtaccgtg aatgccctcc gccgctttgg 3480
ggtcactgct accttctgca gctagccaac taccttgcct accactccga catcatggaa 3540
gacgtgagcg gtgacggcct actggagtgt cactgtcgct gcaacctatg caccccgcac 3600
cgctccctgg tctgcaattc gcaactgctt agcgaaagtc aaattatcgg tacctttgag 3660
ctgcagggtc cctcgcctga cgaaaagtcc gcggctccgg ggttgaaact cactccgggg 3720
ctgtggacgt cggcttacct tcgcaaattt gtacctgagg actaccacgc ccacgagatt 3780
aggttctacg aagaccaatc ccgcccgcca aatgcggagc ttaccgcctg cgtcattacc 3840
cagggccaca tccttggcca attgcaagcc atcaacaaag cccgccaaga gtttctgcta 3900
cgaaagggac ggggggttta cctggacccc cagtccggcg aggagctcaa cccaatcccc 3960
ccgccgccgc agccctatca gcagccgcgg gcccttgctt cccaggatgg cacccaaaaa 4020
gaagctgcag ctgccgccgc cgccacccac ggacgaggag gaatactggg acagtcaggc 4080
agaggaggtt ttggacgagg aggaggagat gatggaagac tgggacagcc tagacgaagc 4140
ttccgaggcc gaagaggtgt cagacgaaac accgtcaccc tcggtcgcat tcccctcgcc 4200
ggcgccccag aaattggcaa ccgttcccag catcgctaca acctccgctc ctcaggcgcc 4260
gccggcactg cctgttcgcc gacccaaccg tagatgggac accactggaa ccagggccgg 4320
taagtctaag cagccgccgc cgttagccca agagcaacaa cagcgccaag gctaccgctc 4380
gtggcgcggg cacaagaacg ccatagttgc ttgcttgcaa gactgtgggg gcaacatctc 4440
cttcgcccgc cgctttcttc tctaccatca cggcgtggcc ttcccccgta acatcctgca 4500
ttactaccgt catctctaca gcccctactg caccggcggc agcggcagcg gcagcaacag 4560
cagcggtcac acagaagcaa aggcgaccgg atagcaagac tctgacaaag cccaagaaat 4620
ccacagcggc ggcagcagca ggaggaggag cgctgcgtct ggcgcccaac gaacccgtat 4680
cgacccgcga gcttagaaat aggatttttc ccactctgta tgctatattt caacaaagca 4740
ggggccaaga acaagagctg aaaataaaaa acaggtctct gcgctccctc acccgcagct 4800
gcctgtatca caaaagcgaa gatcagcttc ggcgcacgct ggaagacgcg gaggctctct 4860
tcagcaaata ctgcgcgctg actcttaagg actagtttcg cgccctttct caaatttaag 4920
cgcgaaaact acgtcatctc cagcggccac acccggcgcc agcacctgtc gtcagcgcca 4980
ttatgagcaa ggaaattccc acgccctaca tgtggagtta ccagccacaa atgggacttg 5040
cggctggagc tgcccaagac tactcaaccc gaataaacta catgagcgcg ggaccccaca 5100
tgatatcccg ggtcaacgga atccgcgccc accgaaaccg aattctcctc gaacaggcgg 5160
ctattaccac cacacctcgt aataacctta atccccgtag ttggcccgct gccctggtgt 5220
accaggaaag tcccgctccc accactgtgg tacttcccag agacgcccag gccgaagttc 5280
agatgactaa ctcaggggcg cagcttgcgg gcggctttcg tcacagggtg cggtcgcccg 5340
ggcgttttag ggcggagtaa cttgcatgta ttgggaattg tagttttttt aaaatgggaa 5400
gtgacgtatc gtgggaaaac ggaagtgaag atttgaggaa gttgtgggtt ttttggcttt 5460
cgtttctggg cgtaggttcg cgtgcggttt tctgggtgtt ttttgtggac tttaaccgtt 5520
acgtcatttt ttagtcctat atatactcgc tctgtacttg gcccttttta cactgtgact 5580
gattgagctg gtgccgtgtc gagtggtgtt ttttaatagg tttttttact ggtaaggctg 5640
actgttatgg ctgccgctgt ggaagcgctg tatgttgttc tggagcggga gggtgctatt 5700
ttgcctaggc aggagggttt ttcaggtgtt tatgtgtttt tctctcctat taattttgtt 5760
atacctccta tgggggctgt aatgttgtct ctacgcctgc gggtatgtat tcccccgggc 5820
tatttcggtc gctttttagc actgaccgat gttaaccaac ctgatgtgtt taccgagtct 5880
tacattatga ctccggacat gaccgaggaa ctgtcggtgg tgctttttaa tcacggtgac 5940
cagttttttt acggtcacgc cggcatggcc gtagtccgtc ttatgcttat aagggttgtt 6000
tttcctgttg taagacaggc ttctaatgtt taaatgtttt tttttttgtt attttatttt 6060
gtgtttaatg caggaacccg cagacatgtt tgagagaaaa atggtgtctt tttctgtggt 6120
ggttccggaa cttacctgcc tttatctgca tgagcatgac tacgatgtgc ttgctttttt 6180
gcgcgaggct ttgcctgatt ttttgagcag caccttgcat tttatatcgc cgcccatgca 6240
acaagcttac ataggggcta cgctggttag catagctccg agtatgcgtg tcataatcag 6300
tgtgggttct tttgtcatgg ttcctggcgg ggaagtggcc gcgctggtcc gtgcagacct 6360
gcacgattat gttcagctgg ccctgcgaag ggacctacgg gatcgcggta tttttgttaa 6420
tgttccgctt ttgaatctta tacaggtctg tgaggaacct gaatttttgc aatcatgatt 6480
cgctgcttga ggctgaaggt ggagggcgct ctggagcaga tttttacaat ggccggactt 6540
aatattcggg atttgcttag agacatattg ataaggtggc gagatgaaaa ttatttgggc 6600
atggttgaag gtgctggaat gtttatagag gagattcacc ctgaagggtt tagcctttac 6660
gtccacttgg acgtgagggc agtttgcctt ttggaagcca ttgtgcaaca tcttacaaat 6720
gccattatct gttctttggc tgtagagttt gaccacgcca ccggagggga gcgcgttcac 6780
ttaatagatc ttcattttga ggttttggat aatcttttgg aataaaaaaa aaaaaacatg 6840
gttcttccag ctcttcccgc tcctcccgtg tgtgactcgc agaacgaatg tgtaggttgg 6900
ctgggtgtgg cttattctgc ggtggtggat gttatcaggg cagcggcgca tgaaggagtt 6960
tacatagaac ccgaagccag ggggcgcctg gatgctttga gagagtggat atactacaac 7020
tactacacag agcgagctaa gcgacgagac cggagacgca gatctgtttg tcacgcccgc 7080
acctggtttt gcttcaggaa atatgactac gtccggcgtt ccatttggca tgacactacg 7140
accaacacga tctcggttgt ctcggcgcac tccgtacagt agggatcgcc tacctccttt 7200
tgagacagag acccgcgcta ccatactgga ggatcatccg ctgctgcccg aatgtaacac 7260
tttgacaatg cacaacgtga gttacgtgcg aggtcttccc tgcagtgtgg gatttacgct 7320
gattcaggaa tgggttgttc cctgggatat ggttctgacg cgggaggagc ttgtaatcct 7380
gaggaagtgt atgcacgtgt gcctgtgttg tgccaacatt gatatcatga cgagcatgat 7440
gatccatggt tacgagtcct gggctctcca ctgtcattgt tccagtcccg gttccctgca 7500
gtgcatagcc ggcgggcagg ttttggccag ctggtttagg atggtggtgg atggcgccat 7560
gtttaatcag aggtttatat ggtaccggga ggtggtgaat tacaacatgc caaaagaggt 7620
aatgtttatg tccagcgtgt ttatgagggg tcgccactta atctacctgc gcttgtggta 7680
tgatggccac gtgggttctg tggtccccgc catgagcttt ggatacagcg ccttgcactg 7740
tgggattttg aacaatattg tggtgctgtg ctgcagttac tgtgctgatt taagtgagat 7800
cagggtgcgc tgctgtgccc ggaggacaag gcgtctcatg ctgcgggcgg tgcgaatcat 7860
cgctgaggag accactgcca tgttgtattc ctgcaggacg gagcggcggc ggcagcagtt 7920
tattcgcgcg ctgctgcagc accaccgccc tatcctgatg cacgattatg actctacccc 7980
catgtaggcg tggacttccc cttcgccgcc cgttgagcaa ccgcaagttg gacagcagcc 8040
tgtggctcag cagctggaca gcgacatgaa cttaagcgag ctgcccgggg agtttattaa 8100
tatcactgat gagcgtttgg ctcgacagga aaccgtgtgg aatataacac ctaagaatat 8160
gtctgttacc catgatatga tgctttttaa ggccagccgg ggagaaagga ctgtgtactc 8220
tgtgtgttgg gagggaggtg gcaggttgaa tactagggtt ctgtgagttt gattaaggta 8280
cggtgatcaa tataagctat gtggtggtgg ggctatacta ctgaatgaaa aatgacttga 8340
aattttctgc aattgaaaaa taaacacgtt gaaacataac atgcaacagg ttcacgattc 8400
tttattcctg ggcaatgtag gagaaggtgt aagagttggt agcaaaagtt tcagtggtgt 8460
attttccact ttcccaggac catgtaaaag acatagagta agtgcttacc tcgctagttt 8520
ctgtggattc actagaatcg atgtaggatg ttgcccctcc tgacgcggta ggagaagggg 8580
agggtgccct gcatgtctgc cgctgctctt gctcttgccg ctgctgagga ggggggcgca 8640
tctgccgcag caccggatgc atctgggaaa agcaaaaaag gggctcgtcc ctgtttccgg 8700
aggaatttgc aagcggggtc ttgcatgacg gggaggcaaa cccccgttcg ccgcagtccg 8760
gccggcccga gactcgaacc gggggtcctg cgactcaacc cttggaaaat aaccctccgg 8820
ctacagggag cgagccactt aatgctttcg ctttccagcc taaccgctta cgccgcgcgc 8880
ggccagtggc caaaaaagct agcgcagcag ccgccgcgcc tggaaggaag ccaaaaggag 8940
cgctcccccg ttgtctgacg tcgcacacct gggttcgaca cgcgggcggt aaccgcatgg 9000
atcacggcgg acggccggat ccggggttcg aaccccggtc gtccgccatg atacccttgc 9060
gaatttatcc accagaccac ggaagagtgc ccgcttacag gctctccttt tgcacggtct 9120
agagcgtcaa cgactgcgca cgcctcaccg gccagagcgt cccgaccatg gagcactttt 9180
tgccgctgcg caacatctgg aaccgcgtcc gcgactttcc gcgcgcctcc accaccgccg 9240
ccggcatcac ctggatgtcc aggtacatct acggattacg tcgacgttta aaccatatga 9300
tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag 9360
aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg 9420
tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg 9480
tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg 9540
cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga 9600
agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc 9660
tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt 9720
aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact 9780
ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg 9840
cctaactacg gctacactag aagaacagta tttggtatct gcgctctgct gaagccagtt 9900
accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt 9960
ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct 10020
ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg 10080
gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt 10140
aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt 10200
gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtc 10260
gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg 10320
cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc 10380
gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg 10440
gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctaca 10500
ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacga 10560
tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc cttcggtcct 10620
ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg 10680
cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca 10740
accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata 10800
cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct 10860
tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact 10920
cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa 10980
acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc 11040
atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga 11100
tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccga 11160
aaagtgccac ctaaattgta agcgttaata ttttgttaaa attcgcgtta aatttttgtt 11220
aaatcagctc attttttaac caataggccg aaatcggcaa aatcccttat aaatcaaaag 11280
aatagaccga gatagggttg agtgttgttc cagtttggaa caagagtcca ctattaaaga 11340
acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc ccactacgtg 11400
aaccatcacc ctaatcaagt tttttggggt cgaggtgccg taaagcacta aatcggaacc 11460
ctaaagggag cccccgattt agagcttgac ggggaaagcc ggcgaacgtg gcgagaaagg 11520
aagggaagaa agcgaaagga gcgggcgcta gggcgctggc aagtgtagcg gtcacgctgc 11580
gcgtaaccac cacacccgcc gcgcttaatg cgccgctaca gggcgcgatg gatcc 11635
<210> 46
<211> 5336
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 46
ggtacccaac tccatgctta acagtcccca ggtacagccc accctgcgtc gcaaccagga 60
acagctctac agcttcctgg agcgccactc gccctacttc cgcagccaca gtgcgcagat 120
taggagcgcc acttcttttt gtcacttgaa aaacatgtaa aaataatgta ctaggagaca 180
ctttcaataa aggcaaatgt ttttatttgt acactctcgg gtgattattt accccccacc 240
cttgccgtct gcgccgttta aaaatcaaag gggttctgcc gcgcatcgct atgcgccact 300
ggcagggaca cgttgcgata ctggtgttta gtgctccact taaactcagg cacaaccatc 360
cgcggcagct cggtgaagtt ttcactccac aggctgcgca ccatcaccaa cgcgtttagc 420
aggtcgggcg ccgatatctt gaagtcgcag ttggggcctc cgccctgcgc gcgcgagttg 480
cgatacacag ggttgcagca ctggaacact atcagcgccg ggtggtgcac gctggccagc 540
acgctcttgt cggagatcag atccgcgtcc aggtcctccg cgttgctcag ggcgaacgga 600
gtcaactttg gtagctgcct tcccaaaaag ggtgcatgcc caggctttga gttgcactcg 660
caccgtagtg gcatcagaag gtgaccgtgc ccggtctggg cgttaggata cagcgcctgc 720
atgaaagcct tgatctgctt aaaagccacc tgagcctttg cgccttcaga gaagaacatg 780
ccgcaagact tgccggaaaa ctgattggcc ggacaggccg cgtcatgcac gcagcacctt 840
gcgtcggtgt tggagatctg caccacattt cggccccacc ggttcttcac gatcttggcc 900
ttgctagact gctccttcag cgcgcgctgc ccgttttcgc tcgtcacatc catttcaatc 960
acgtgctcct tatttatcat aatgctcccg tgtagacact taagctcgcc ttcgatctca 1020
gcgcagcggt gcagccacaa cgcgcagccc gtgggctcgt ggtgcttgta ggttacctct 1080
gcaaacgact gcaggtacgc ctgcaggaat cgccccatca tcgtcacaaa ggtcttgttg 1140
ctggtgaagg tcagctgcaa cccgcggtgc tcctcgttta gccaggtctt gcatacggcc 1200
gccagagctt ccacttggtc aggcagtagc ttgaagtttg cctttagatc gttatccacg 1260
tggtacttgt ccatcaacgc gcgcgcagcc tccatgccct tctcccacgc agacacgatc 1320
ggcaggctca gcgggtttat caccgtgctt tcactttccg cttcactgga ctcttccttt 1380
tcctcttgcg tccgcatacc ccgcgccact gggtcgtctt cattcagccg ccgcaccgtg 1440
cgcttacctc ccttgccgtg cttgattagc accggtgggt tgctgaaacc caccatttgt 1500
agcgccacat cttctctttc ttcctcgctg tccacgatca cctctgggga tggcgggcgc 1560
tcgggcttgg gagaggggcg cttctttttc tttttggacg caatggccaa atccgccgtc 1620
gaggtcgatg gccgcgggct gggtgtgcgc ggcaccagcg catcttgtga cgagtcttct 1680
tcgtcctcgg actcgagacg ccgcctcagc cgcttttttg ggggcgcgcg gggaggcggc 1740
ggcgacggcg acggggacga cacgtcctcc atggttggtg gacgtcgcgc cgcaccgcgt 1800
ccgcgctcgg gggtggtttc gcgctgctcc tcttcccgac tggccatttc cttctcctat 1860
aggcagaaaa agatcatgga gtcagtcgag aaggaggaca gcctaaccgc cccctttgag 1920
ttcgccacca ccgcctccac cgatgccgcc aacgcgccta ccaccttccc cgtcgaggca 1980
cccccgcttg aggaggagga agtgattatc gagcaggacc caggttttgt aagcgaagac 2040
gacgaggatc gctcagtacc aacagaggat aaaaagcaag accaggacga cgcagaggca 2100
aacgaggaac aagtcgggcg gggggaccaa aggcatggcg actacctaga tgtgggagac 2160
gacgtgctgt tgaagcatct gcagcgccag tgcgccatta tctgcgacgc gttgcaagag 2220
cgcagcgatg tgcccctcgc catagcggat gtcagccttg cctacgaacg ccacctgttc 2280
tcaccgcgcg taccccccaa acgccaagaa aacggcacat gcgagcccaa cccgcgcctc 2340
aacttctacc ccgtatttgc cgtgccagag gtgcttgcca cctatcacat ctttttccaa 2400
aactgcaaga tacccctatc ctgccgtgcc aaccgcagcc gagcggacaa gcagctggcc 2460
ttgcggcagg gcgctgtcat acctgatatc gcctcgctcg acgaagtgcc aaaaatcttt 2520
gagggtcttg gacgcgacga gaaacgcgcg gcaaacgctc tgcaacaaga aaacagcgaa 2580
aatgaaagtc actgtggagt gctggtggaa cttgagggtg acaacgcgcg cctagccgtg 2640
ctgaaacgca gcatcgaggt cacccacttt gcctacccgg cacttaacct accccccaag 2700
gttatgagca cagtcatgag cgagctgatc gtgcgccgtg cacgacccct ggagagggat 2760
gcaaacttgc aagaacaaac cgaggagggc ctacccgcag ttggcgatga gcagctggcg 2820
cgctggcttg agacgcgcga gcctgccgac ttggaggagc gacgcaagct aatgatggcc 2880
gcagtgcttg ttaccgtgga gcttgagtgc atgcagcggt tctttgctga cccggagatg 2940
cagcgcaagc tagaggaaac gttgcactac acctttcgcc agggctacgt gcgccaggcc 3000
tgcaaaattt ccaacgtgga gctctgcaac ctggtctcct accttggaat tttgcacgaa 3060
aaccgcctcg ggcaaaacgt gcttcattcc acgctcaagg gcgaggcgcg ccgcgactac 3120
gtccgcgact gcgtttactt atttctgtgc tacacctggc aaacggccat gggcgtgtgg 3180
cagcaatgcc tggaggagcg caacctaaag gagctgcaga agctgctaaa gcaaaacttg 3240
aaggacctat ggacggcctt caacgagcgc tccgtggccg cgcacctggc ggacattatc 3300
ttccccgaac gcctgcttaa aaccctgcaa cagggtctgc cagacttcac cagtcaaagc 3360
atgttgcaaa actttaggaa ctttatccta gagcgttcag gaattctgcc cgccacctgc 3420
tgtgcgcttc ctagcgactt tgtgcccatt aagtaccgtg aatgccctcc gccgctttgg 3480
ggtcactgct accttctgca gctagccaac taccttgcct accactccga catcatggaa 3540
gacgtgagcg gtgacggcct actggagtgt cactgtcgct gcaacctatg caccccgcac 3600
cgctccctgg tctgcaattc gcaactgctt agcgaaagtc aaattatcgg tacctttgag 3660
ctgcagggtc cctcgcctga cgaaaagtcc gcggctccgg ggttgaaact cactccgggg 3720
ctgtggacgt cggcttacct tcgcaaattt gtacctgagg actaccacgc ccacgagatt 3780
aggttctacg aagaccaatc ccgcccgcca aatgcggagc ttaccgcctg cgtcattacc 3840
cagggccaca tccttggcca attgcaagcc atcaacaaag cccgccaaga gtttctgcta 3900
cgaaagggac ggggggttta cctggacccc cagtccggcg aggagctcaa cccaatcccc 3960
ccgccgccgc agccctatca gcagccgcgg gcccttgctt cccaggatgg cacccaaaaa 4020
gaagctgcag ctgccgccgc cgccacccac ggacgaggag gaatactggg acagtcaggc 4080
agaggaggtt ttggacgagg aggaggagat gatggaagac tgggacagcc tagacgaagc 4140
ttccgaggcc gaagaggtgt cagacgaaac accgtcaccc tcggtcgcat tcccctcgcc 4200
ggcgccccag aaattggcaa ccgttcccag catcgctaca acctccgctc ctcaggcgcc 4260
gccggcactg cctgttcgcc gacccaaccg tagatgggac accactggaa ccagggccgg 4320
taagtctaag cagccgccgc cgttagccca agagcaacaa cagcgccaag gctaccgctc 4380
gtggcgcggg cacaagaacg ccatagttgc ttgcttgcaa gactgtgggg gcaacatctc 4440
cttcgcccgc cgctttcttc tctaccatca cggcgtggcc ttcccccgta acatcctgca 4500
ttactaccgt catctctaca gcccctactg caccggcggc agcggcagcg gcagcaacag 4560
cagcggtcac acagaagcaa aggcgaccgg atagcaagac tctgacaaag cccaagaaat 4620
ccacagcggc ggcagcagca ggaggaggag cgctgcgtct ggcgcccaac gaacccgtat 4680
cgacccgcga gcttagaaat aggatttttc ccactctgta tgctatattt caacaaagca 4740
ggggccaaga acaagagctg aaaataaaaa acaggtctct gcgctccctc acccgcagct 4800
gcctgtatca caaaagcgaa gatcagcttc ggcgcacgct ggaagacgcg gaggctctct 4860
tcagcaaata ctgcgcgctg actcttaagg actagtttcg cgccctttct caaatttaag 4920
cgcgaaaact acgtcatctc cagcggccac acccggcgcc agcacctgtc gtcagcgcca 4980
ttatgagcaa ggaaattccc acgccctaca tgtggagtta ccagccacaa atgggacttg 5040
cggctggagc tgcccaagac tactcaaccc gaataaacta catgagcgcg ggaccccaca 5100
tgatatcccg ggtcaacgga atccgcgccc accgaaaccg aattctcctc gaacaggcgg 5160
ctattaccac cacacctcgt aataacctta atccccgtag ttggcccgct gccctggtgt 5220
accaggaaag tcccgctccc accactgtgg tacttcccag agacgcccag gccgaagttc 5280
agatgactaa ctcaggggcg cagcttgcgg gcggctttcg tcacagggtg cggtcg 5336
<210> 47
<211> 3201
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 47
cccgggcgtt ttagggcgga gtaacttgca tgtattggga attgtagttt ttttaaaatg 60
ggaagtgacg tatcgtggga aaacggaagt gaagatttga ggaagttgtg ggttttttgg 120
ctttcgtttc tgggcgtagg ttcgcgtgcg gttttctggg tgttttttgt ggactttaac 180
cgttacgtca ttttttagtc ctatatatac tcgctctgta cttggccctt tttacactgt 240
gactgattga gctggtgccg tgtcgagtgg tgttttttaa taggtttttt tactggtaag 300
gctgactgtt atggctgccg ctgtggaagc gctgtatgtt gttctggagc gggagggtgc 360
tattttgcct aggcaggagg gtttttcagg tgtttatgtg tttttctctc ctattaattt 420
tgttatacct cctatggggg ctgtaatgtt gtctctacgc ctgcgggtat gtattccccc 480
gggctatttc ggtcgctttt tagcactgac cgatgttaac caacctgatg tgtttaccga 540
gtcttacatt atgactccgg acatgaccga ggaactgtcg gtggtgcttt ttaatcacgg 600
tgaccagttt ttttacggtc acgccggcat ggccgtagtc cgtcttatgc ttataagggt 660
tgtttttcct gttgtaagac aggcttctaa tgtttaaatg tttttttttt tgttatttta 720
ttttgtgttt aatgcaggaa cccgcagaca tgtttgagag aaaaatggtg tctttttctg 780
tggtggttcc ggaacttacc tgcctttatc tgcatgagca tgactacgat gtgcttgctt 840
ttttgcgcga ggctttgcct gattttttga gcagcacctt gcattttata tcgccgccca 900
tgcaacaagc ttacataggg gctacgctgg ttagcatagc tccgagtatg cgtgtcataa 960
tcagtgtggg ttcttttgtc atggttcctg gcggggaagt ggccgcgctg gtccgtgcag 1020
acctgcacga ttatgttcag ctggccctgc gaagggacct acgggatcgc ggtatttttg 1080
ttaatgttcc gcttttgaat cttatacagg tctgtgagga acctgaattt ttgcaatcat 1140
gattcgctgc ttgaggctga aggtggaggg cgctctggag cagattttta caatggccgg 1200
acttaatatt cgggatttgc ttagagacat attgataagg tggcgagatg aaaattattt 1260
gggcatggtt gaaggtgctg gaatgtttat agaggagatt caccctgaag ggtttagcct 1320
ttacgtccac ttggacgtga gggcagtttg ccttttggaa gccattgtgc aacatcttac 1380
aaatgccatt atctgttctt tggctgtaga gtttgaccac gccaccggag gggagcgcgt 1440
tcacttaata gatcttcatt ttgaggtttt ggataatctt ttggaataaa aaaaaaaaaa 1500
catggttctt ccagctcttc ccgctcctcc cgtgtgtgac tcgcagaacg aatgtgtagg 1560
ttggctgggt gtggcttatt ctgcggtggt ggatgttatc agggcagcgg cgcatgaagg 1620
agtttacata gaacccgaag ccagggggcg cctggatgct ttgagagagt ggatatacta 1680
caactactac acagagcgag ctaagcgacg agaccggaga cgcagatctg tttgtcacgc 1740
ccgcacctgg ttttgcttca ggaaatatga ctacgtccgg cgttccattt ggcatgacac 1800
tacgaccaac acgatctcgg ttgtctcggc gcactccgta cagtagggat cgcctacctc 1860
cttttgagac agagacccgc gctaccatac tggaggatca tccgctgctg cccgaatgta 1920
acactttgac aatgcacaac gtgagttacg tgcgaggtct tccctgcagt gtgggattta 1980
cgctgattca ggaatgggtt gttccctggg atatggttct gacgcgggag gagcttgtaa 2040
tcctgaggaa gtgtatgcac gtgtgcctgt gttgtgccaa cattgatatc atgacgagca 2100
tgatgatcca tggttacgag tcctgggctc tccactgtca ttgttccagt cccggttccc 2160
tgcagtgcat agccggcggg caggttttgg ccagctggtt taggatggtg gtggatggcg 2220
ccatgtttaa tcagaggttt atatggtacc gggaggtggt gaattacaac atgccaaaag 2280
aggtaatgtt tatgtccagc gtgtttatga ggggtcgcca cttaatctac ctgcgcttgt 2340
ggtatgatgg ccacgtgggt tctgtggtcc ccgccatgag ctttggatac agcgccttgc 2400
actgtgggat tttgaacaat attgtggtgc tgtgctgcag ttactgtgct gatttaagtg 2460
agatcagggt gcgctgctgt gcccggagga caaggcgtct catgctgcgg gcggtgcgaa 2520
tcatcgctga ggagaccact gccatgttgt attcctgcag gacggagcgg cggcggcagc 2580
agtttattcg cgcgctgctg cagcaccacc gccctatcct gatgcacgat tatgactcta 2640
cccccatgta ggcgtggact tccccttcgc cgcccgttga gcaaccgcaa gttggacagc 2700
agcctgtggc tcagcagctg gacagcgaca tgaacttaag cgagctgccc ggggagttta 2760
ttaatatcac tgatgagcgt ttggctcgac aggaaaccgt gtggaatata acacctaaga 2820
atatgtctgt tacccatgat atgatgcttt ttaaggccag ccggggagaa aggactgtgt 2880
actctgtgtg ttgggaggga ggtggcaggt tgaatactag ggttctgtga gtttgattaa 2940
ggtacggtga tcaatataag ctatgtggtg gtggggctat actactgaat gaaaaatgac 3000
ttgaaatttt ctgcaattga aaaataaaca cgttgaaaca taacatgcaa caggttcacg 3060
attctttatt cctgggcaat gtaggagaag gtgtaagagt tggtagcaaa agtttcagtg 3120
gtgtattttc cactttccca ggaccatgta aaagacatag agtaagtgct tacctcgcta 3180
gtttctgtgg attcactaga a 3201
<210> 48
<211> 743
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 48
tcgatgtagg atgttgcccc tcctgacgcg gtaggagaag gggagggtgc cctgcatgtc 60
tgccgctgct cttgctcttg ccgctgctga ggaggggggc gcatctgccg cagcaccgga 120
tgcatctggg aaaagcaaaa aaggggctcg tccctgtttc cggaggaatt tgcaagcggg 180
gtcttgcatg acggggaggc aaacccccgt tcgccgcagt ccggccggcc cgagactcga 240
accgggggtc ctgcgactca acccttggaa aataaccctc cggctacagg gagcgagcca 300
cttaatgctt tcgctttcca gcctaaccgc ttacgccgcg cgcggccagt ggccaaaaaa 360
gctagcgcag cagccgccgc gcctggaagg aagccaaaag gagcgctccc ccgttgtctg 420
acgtcgcaca cctgggttcg acacgcgggc ggtaaccgca tggatcacgg cggacggccg 480
gatccggggt tcgaaccccg gtcgtccgcc atgataccct tgcgaattta tccaccagac 540
cacggaagag tgcccgctta caggctctcc ttttgcacgg tctagagcgt caacgactgc 600
gcacgcctca ccggccagag cgtcccgacc atggagcact ttttgccgct gcgcaacatc 660
tggaaccgcg tccgcgactt tccgcgcgcc tccaccaccg ccgccggcat cacctggatg 720
tccaggtaca tctacggatt acg 743
<210> 49
<211> 160
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 49
aaggggctcg tccctgtttc cggaggaatt tgcaagcggg gtcttgcatg acggggaggc 60
aaacccccgt tcgccgcagt ccggccggcc cgagactcga accgggggtc ctgcgactca 120
acccttggaa aataaccctc cggctacagg gagcgagcca 160
<210> 50
<211> 162
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 50
aaaggagcgc tcccccgttg tctgacgtcg cacacctggg ttcgacacgc gggcggtaac 60
cgcatggatc acggcggacg gccggatccg gggttcgaac cccggtcgtc cgccatgata 120
cccttgcgaa tttatccacc agaccacgga agagtgcccg ct 162
<210> 51
<211> 1590
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 51
ttaaaaatca aaggggttct gccgcgcatc gctatgcgcc actggcaggg acacgttgcg 60
atactggtgt ttagtgctcc acttaaactc aggcacaacc atccgcggca gctcggtgaa 120
gttttcactc cacaggctgc gcaccatcac caacgcgttt agcaggtcgg gcgccgatat 180
cttgaagtcg cagttggggc ctccgccctg cgcgcgcgag ttgcgataca cagggttgca 240
gcactggaac actatcagcg ccgggtggtg cacgctggcc agcacgctct tgtcggagat 300
cagatccgcg tccaggtcct ccgcgttgct cagggcgaac ggagtcaact ttggtagctg 360
ccttcccaaa aagggtgcat gcccaggctt tgagttgcac tcgcaccgta gtggcatcag 420
aaggtgaccg tgcccggtct gggcgttagg atacagcgcc tgcatgaaag ccttgatctg 480
cttaaaagcc acctgagcct ttgcgccttc agagaagaac atgccgcaag acttgccgga 540
aaactgattg gccggacagg ccgcgtcatg cacgcagcac cttgcgtcgg tgttggagat 600
ctgcaccaca tttcggcccc accggttctt cacgatcttg gccttgctag actgctcctt 660
cagcgcgcgc tgcccgtttt cgctcgtcac atccatttca atcacgtgct ccttatttat 720
cataatgctc ccgtgtagac acttaagctc gccttcgatc tcagcgcagc ggtgcagcca 780
caacgcgcag cccgtgggct cgtggtgctt gtaggttacc tctgcaaacg actgcaggta 840
cgcctgcagg aatcgcccca tcatcgtcac aaaggtcttg ttgctggtga aggtcagctg 900
caacccgcgg tgctcctcgt ttagccaggt cttgcatacg gccgccagag cttccacttg 960
gtcaggcagt agcttgaagt ttgcctttag atcgttatcc acgtggtact tgtccatcaa 1020
cgcgcgcgca gcctccatgc ccttctccca cgcagacacg atcggcaggc tcagcgggtt 1080
tatcaccgtg ctttcacttt ccgcttcact ggactcttcc ttttcctctt gcgtccgcat 1140
accccgcgcc actgggtcgt cttcattcag ccgccgcacc gtgcgcttac ctcccttgcc 1200
gtgcttgatt agcaccggtg ggttgctgaa acccaccatt tgtagcgcca catcttctct 1260
ttcttcctcg ctgtccacga tcacctctgg ggatggcggg cgctcgggct tgggagaggg 1320
gcgcttcttt ttctttttgg acgcaatggc caaatccgcc gtcgaggtcg atggccgcgg 1380
gctgggtgtg cgcggcacca gcgcatcttg tgacgagtct tcttcgtcct cggactcgag 1440
acgccgcctc agccgctttt ttgggggcgc gcggggaggc ggcggcgacg gcgacgggga 1500
cgacacgtcc tccatggttg gtggacgtcg cgccgcaccg cgtccgcgct cgggggtggt 1560
ttcgcgctgc tcctcttccc gactggccat 1590
<210> 52
<211> 2446
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 52
ttccttctcc tataggcaga aaaagatcat ggagtcagtc gagaaggagg acagcctaac 60
cgcccccttt gagttcgcca ccaccgcctc caccgatgcc gccaacgcgc ctaccacctt 120
ccccgtcgag gcacccccgc ttgaggagga ggaagtgatt atcgagcagg acccaggttt 180
tgtaagcgaa gacgacgagg atcgctcagt accaacagag gataaaaagc aagaccagga 240
cgacgcagag gcaaacgagg aacaagtcgg gcggggggac caaaggcatg gcgactacct 300
agatgtggga gacgacgtgc tgttgaagca tctgcagcgc cagtgcgcca ttatctgcga 360
cgcgttgcaa gagcgcagcg atgtgcccct cgccatagcg gatgtcagcc ttgcctacga 420
acgccacctg ttctcaccgc gcgtaccccc caaacgccaa gaaaacggca catgcgagcc 480
caacccgcgc ctcaacttct accccgtatt tgccgtgcca gaggtgcttg ccacctatca 540
catctttttc caaaactgca agatacccct atcctgccgt gccaaccgca gccgagcgga 600
caagcagctg gccttgcggc agggcgctgt catacctgat atcgcctcgc tcgacgaagt 660
gccaaaaatc tttgagggtc ttggacgcga cgagaaacgc gcggcaaacg ctctgcaaca 720
agaaaacagc gaaaatgaaa gtcactgtgg agtgctggtg gaacttgagg gtgacaacgc 780
gcgcctagcc gtgctgaaac gcagcatcga ggtcacccac tttgcctacc cggcacttaa 840
cctacccccc aaggttatga gcacagtcat gagcgagctg atcgtgcgcc gtgcacgacc 900
cctggagagg gatgcaaact tgcaagaaca aaccgaggag ggcctacccg cagttggcga 960
tgagcagctg gcgcgctggc ttgagacgcg cgagcctgcc gacttggagg agcgacgcaa 1020
gctaatgatg gccgcagtgc ttgttaccgt ggagcttgag tgcatgcagc ggttctttgc 1080
tgacccggag atgcagcgca agctagagga aacgttgcac tacacctttc gccagggcta 1140
cgtgcgccag gcctgcaaaa tttccaacgt ggagctctgc aacctggtct cctaccttgg 1200
aattttgcac gaaaaccgcc tcgggcaaaa cgtgcttcat tccacgctca agggcgaggc 1260
gcgccgcgac tacgtccgcg actgcgttta cttatttctg tgctacacct ggcaaacggc 1320
catgggcgtg tggcagcaat gcctggagga gcgcaaccta aaggagctgc agaagctgct 1380
aaagcaaaac ttgaaggacc tatggacggc cttcaacgag cgctccgtgg ccgcgcacct 1440
ggcggacatt atcttccccg aacgcctgct taaaaccctg caacagggtc tgccagactt 1500
caccagtcaa agcatgttgc aaaactttag gaactttatc ctagagcgtt caggaattct 1560
gcccgccacc tgctgtgcgc ttcctagcga ctttgtgccc attaagtacc gtgaatgccc 1620
tccgccgctt tggggtcact gctaccttct gcagctagcc aactaccttg cctaccactc 1680
cgacatcatg gaagacgtga gcggtgacgg cctactggag tgtcactgtc gctgcaacct 1740
atgcaccccg caccgctccc tggtctgcaa ttcgcaactg cttagcgaaa gtcaaattat 1800
cggtaccttt gagctgcagg gtccctcgcc tgacgaaaag tccgcggctc cggggttgaa 1860
actcactccg gggctgtgga cgtcggctta ccttcgcaaa tttgtacctg aggactacca 1920
cgcccacgag attaggttct acgaagacca atcccgcccg ccaaatgcgg agcttaccgc 1980
ctgcgtcatt acccagggcc acatccttgg ccaattgcaa gccatcaaca aagcccgcca 2040
agagtttctg ctacgaaagg gacggggggt ttacctggac ccccagtccg gcgaggagct 2100
caacccaatc cccccgccgc cgcagcccta tcagcagccg cgggcccttg cttcccagga 2160
tggcacccaa aaagaagctg cagctgccgc cgccgccacc cacggacgag gaggaatact 2220
gggacagtca ggcagaggag gttttggacg aggaggagga gatgatggaa gactgggaca 2280
gcctagacga agcttccgag gccgaagagg tgtcagacga aacaccgtca ccctcggtcg 2340
cattcccctc gccggcgccc cagaaattgg caaccgttcc cagcatcgct acaacctccg 2400
ctcctcaggc gccgccggca ctgcctgttc gccgacccaa ccgtag 2446
<210> 53
<211> 375
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 53
gcccctactg caccggcggc agcggcagcg gcagcaacag cagcggtcac acagaagcaa 60
aggcgaccgg atagcaagac tctgacaaag cccaagaaat ccacagcggc ggcagcagca 120
ggaggaggag cgctgcgtct ggcgcccaac gaacccgtat cgacccgcga gcttagaaat 180
aggatttttc ccactctgta tgctatattt caacaaagca ggggccaaga acaagagctg 240
aaaataaaaa acaggtctct gcgctccctc acccgcagct gcctgtatca caaaagcgaa 300
gatcagcttc ggcgcacgct ggaagacgcg gaggctctct tcagcaaata ctgcgcgctg 360
actcttaagg actag 375
<210> 54
<211> 354
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 54
atgagcaagg aaattcccac gccctacatg tggagttacc agccacaaat gggacttgcg 60
gctggagctg cccaagacta ctcaacccga ataaactaca tgagcgcggg accccacatg 120
atatcccggg tcaacggaat ccgcgcccac cgaaaccgaa ttctcctcga acaggcggct 180
attaccacca cacctcgtaa taaccttaat ccccgtagtt ggcccgctgc cctggtgtac 240
caggaaagtc ccgctcccac cactgtggta cttcccagag acgcccaggc cgaagttcag 300
atgactaact caggggcgca gcttgcgggc ggctttcgtc acagggtgcg gtcg 354
<210> 55
<211> 1164
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 55
atgactacgt ccggcgttcc atttggcatg acactacgac caacacgatc tcggttgtct 60
cggcgcactc cgtacagtag ggatcgccta cctccttttg agacagagac ccgcgctacc 120
atactggagg atcatccgct gctgcccgaa tgtaacactt tgacaatgca caacgtgagt 180
tacgtgcgag gtcttccctg cagtgtggga tttacgctga ttcaggaatg ggttgttccc 240
tgggatatgg ttctgacgcg ggaggagctt gtaatcctga ggaagtgtat gcacgtgtgc 300
ctgtgttgtg ccaacattga tatcatgacg agcatgatga tccatggtta cgagtcctgg 360
gctctccact gtcattgttc cagtcccggt tccctgcagt gcatagccgg cgggcaggtt 420
ttggccagct ggtttaggat ggtggtggat ggcgccatgt ttaatcagag gtttatatgg 480
taccgggagg tggtgaatta caacatgcca aaagaggtaa tgtttatgtc cagcgtgttt 540
atgaggggtc gccacttaat ctacctgcgc ttgtggtatg atggccacgt gggttctgtg 600
gtccccgcca tgagctttgg atacagcgcc ttgcactgtg ggattttgaa caatattgtg 660
gtgctgtgct gcagttactg tgctgattta agtgagatca gggtgcgctg ctgtgcccgg 720
aggacaaggc gtctcatgct gcgggcggtg cgaatcatcg ctgaggagac cactgccatg 780
ttgtattcct gcaggacgga gcggcggcgg cagcagttta ttcgcgcgct gctgcagcac 840
caccgcccta tcctgatgca cgattatgac tctaccccca tgtaggcgtg gacttcccct 900
tcgccgcccg ttgagcaacc gcaagttgga cagcagcctg tggctcagca gctggacagc 960
gacatgaact taagcgagct gcccggggag tttattaata tcactgatga gcgtttggct 1020
cgacaggaaa ccgtgtggaa tataacacct aagaatatgt ctgttaccca tgatatgatg 1080
ctttttaagg ccagccgggg agaaaggact gtgtactctg tgtgttggga gggaggtggc 1140
aggttgaata ctagggttct gtga 1164
<210> 56
<211> 345
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 56
atggttcttc cagctcttcc cgctcctccc gtgtgtgact cgcagaacga atgtgtaggt 60
tggctgggtg tggcttattc tgcggtggtg gatgttatca gggcagcggc gcatgaagga 120
gtttacatag aacccgaagc cagggggcgc ctggatgctt tgagagagtg gatatactac 180
aactactaca cagagcgagc taagcgacga gaccggagac gcagatctgt ttgtcacgcc 240
cgcacctggt tttgcttcag gaaatatgac tacgtccggc gttccatttg gcatgacact 300
acgaccaaca cgatctcggt tgtctcggcg cactccgtac agtag 345
<210> 57
<211> 319
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 57
atgattcgct gcttgaggct gaaggtggag ggcgctctgg agcagatttt tacaatggcc 60
ggacttaata ttcgggattt gcttagagac atattgataa ggtggcgaga tgaaaattat 120
ttgggcatgg ttgaaggtgc tggaatgttt atagaggaga ttcaccctga agggtttagc 180
ctttacgtcc acttggacgt gagggcagtt tgccttttgg aagccattgt gcaacatctt 240
acaaatgcca ttatctgttc tttggctgta gagtttgacc acgccaccgg aggggagcgc 300
gttcacttaa tagatcttc 319
<210> 58
<211> 411
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 58
atgcaggaac ccgcagacat gtttgagaga aaaatggtgt ctttttctgt ggtggttccg 60
gaacttacct gcctttatct gcatgagcat gactacgatg tgcttgcttt tttgcgcgag 120
gctttgcctg attttttgag cagcaccttg cattttatat cgccgcccat gcaacaagct 180
tacatagggg ctacgctggt tagcatagct ccgagtatgc gtgtcataat cagtgtgggt 240
tcttttgtca tggttcctgg cggggaagtg gccgcgctgg tccgtgcaga cctgcacgat 300
tatgttcagc tggccctgcg aagggaccta cgggatcgcg gtatttttgt taatgttccg 360
cttttgaatc ttatacaggt ctgtgaggaa cctgaatttt tgcaatcatg a 411
<210> 59
<211> 7327
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 59
gcgcgccgat atcgttaacg ccccgcgccg gccgctctag aactagtgga tcccccggaa 60
gatcagaagt tcctattccg aagttcctat tctctagaaa gtataggaac ttctgatctg 120
cgcagccgcc atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga 180
gcatctgccc ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt 240
gccgccagat tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga 300
gaagctgcag cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct 360
tttctttgtg caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac 420
caccggggtg aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat 480
tcagagaatt taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac 540
cagaaatggc gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt 600
gctccccaaa acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag 660
cgcctgtttg aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc 720
gcagacgcag gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag 780
atcaaaaact tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac 840
ctcggagaag cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc 900
caactcgcgg tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac 960
taaaaccgcc cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg 1020
gatttataaa attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct 1080
gggatgggcc acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac 1140
taccgggaag accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt 1200
aaactggacc aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg 1260
ggaggagggg aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag 1320
caaggtgcgc gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat 1380
cgtcacctcc aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca 1440
ccagcagccg ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga 1500
ctttgggaag gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt 1560
ggttgaggtg gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc 1620
cagtgacgca gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac 1680
gtcagacgcg gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca 1740
cgtgggcatg aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc 1800
aaatatctgc ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc 1860
tcaacccgtt tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat 1920
gggaaaggtg ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg 1980
catctttgaa caataaatga tttaaatcag gtatggctgc cgatggttat cttccagatt 2040
ggctcgagga cactctctct gaaggaataa gacagtggtg gaagctcaaa cctggcccac 2100
caccaccaaa gcccgcagag cggcataagg acgacagcag gggtcttgtg cttcctgggt 2160
acaagtacct cggacccttc aacggactcg acaagggaga gccggtcaac gaggcagacg 2220
ccgcggccct cgagcacgac aaagcctacg accggcagct cgacagcgga gacaacccgt 2280
acctcaagta caaccacgcc gacgcggagt ttcaggagcg ccttaaagaa gatacgtctt 2340
ttgggggcaa cctcggacga gcagtcttcc aggcgaaaaa gagggttctt gaacctctgg 2400
gcctggttga ggaacctgtt aagacggctc cgggaaaaaa gaggccggta gagcactctc 2460
ctgtggagcc agactcctcc tcgggaaccg gaaaggcggg ccagcagcct gcaagaaaaa 2520
gattgaattt tggtcagact ggagacgcag actcagtacc tgacccccag cctctcggac 2580
agccaccagc agccccctct ggtctgggaa ctaatacgat ggctacaggc agtggcgcac 2640
caatggcaga caataacgag ggcgccgacg gagtgggtaa ttcctcggga aattggcatt 2700
gcgattccac atggatgggc gacagagtca tcaccaccag cacccgaacc tgggccctgc 2760
ccacctacaa caaccacctc tacaaacaaa tttccagcca atcaggagcc tcgaacgaca 2820
atcactactt tggctacagc accccttggg ggtattttga cttcaacaga ttccactgcc 2880
acttttcacc acgtgactgg caaagactca tcaacaacaa ctggggattc cgacccaaga 2940
gactcaactt caagctcttt aacattcaag tcaaagaggt cacgcagaat gacggtacga 3000
cgacgattgc caataacctt accagcacgg ttcaggtgtt tactgactcg gagtaccagc 3060
tcccgtacgt cctcggctcg gcgcatcaag gatgcctccc gccgttccca gcagacgtct 3120
tcatggtgcc acagtatgga tacctcaccc tgaacaacgg gagtcaggca gtaggacgct 3180
cttcatttta ctgcctggag tactttcctt ctcagatgct gcgtaccgga aacaacttta 3240
ccttcagcta cacttttgag gacgttcctt tccacagcag ctacgctcac agccagagtc 3300
tggaccgtct catgaatcct ctcatcgacc agtacctgta ttacttgagc agaacaaaca 3360
ctccaagtgg aaccaccacg cagtcaaggc ttcagttttc tcaggccgga gcgagtgaca 3420
ttcgggacca gtctaggaac tggcttcctg gaccctgtta ccgccagcag cgagtatcaa 3480
agacatctgc ggataacaac aacagtgaat actcgtggac tggagctacc aagtaccacc 3540
tcaatggcag agactctctg gtgaatccgg gcccggccat ggcaagccac aaggacgatg 3600
aagaaaagtt ttttcctcag agcggggttc tcatctttgg gaagcaaggc tcagagaaaa 3660
caaatgtgga cattgaaaag gtcatgatta cagacgaaga ggaaatcagg acaaccaatc 3720
ccgtggctac ggagcagtat ggttctgtat ctaccaacct ccagagaggc aacagacaag 3780
cagctaccgc agatgtcaac acacaaggcg ttcttccagg catggtctgg caggacagag 3840
atgtgtacct tcaggggccc atctgggcaa agattccaca cacggacgga cattttcacc 3900
cctctcccct catgggtgga ttcggactta aacaccctcc tccacagatt ctcatcaaga 3960
acaccccggt acctgcgaat ccttcgacca ccttcagtgc ggcaaagttt gcttccttca 4020
tcacacagta ctccacggga caggtcagcg tggagatcga gtgggagctg cagaaggaaa 4080
acagcaaacg ctggaatccc gaaattcagt acacttccaa ctacaacaag tctgttaatg 4140
tggactttac tgtggacact aatggcgtgt attcagagcc tcgccccatt ggcaccagat 4200
acctgactcg taatctgtaa ttgcttgtta atcaataaac cgtttaattc gtttcagttg 4260
aactttggtc tctgcgtatt tctttcttat ctagtttcca tggctacgta gataagtagc 4320
atggcgggtt aatcattaac tacagcccgg gcgtttaaac agcgggcgga ggggtggagt 4380
cgtgacgtga attacgtcat agggttaggg aggtcctgta ttagaggtca cgtgagtgtt 4440
ttgcgacatt ttgcgacacc atgtggtctc gctggggggg ggggcccgag tgagcacgca 4500
gggtctccat tttgaagcgg gaggtttgaa cgagcgctgg cgcgctcact ggccgtcgtt 4560
ttacaacgtc gtgactggga aaaccctggc gttacccaac ttaatcgcct tgcagcacat 4620
ccccctttcg ccagctggcg taatagcgaa gaggcccgca ccgatcgccc ttcccaacag 4680
ttgcgcagcc tgaatggcga atggaaattg taagcgttaa tattttgtta aaattcgcgt 4740
taaatttttg ttaaatcagc tcattttttt aaccaatagg ccgaaatcgg caaaatccct 4800
tataaatcaa aagaatagac cgagataggg ttgagtgttg ttccagtttg gaacaagagt 4860
ccactattaa gaacgtggac tccaacgtca aagggcgaaa aaccgtctat cagggcgatg 4920
gcccactacg tgaaccatca ccctaatcaa gttttttggg gtcgaggtgc cgtaaagcac 4980
taaatcggaa ccctaaaggg agcccccgat ttagagcttg acggggaaag ccggcgaacg 5040
tggcgagaaa ggaagggaag aaagcgaaag gagcgggcgc tagggcgctg gcaagtgtag 5100
cggtcacgct gcgcgtaacc accacacccg ccgcgcttaa tgcgccgcta cagggcgcgt 5160
caggtggcac ttttcgggga aatgtgcgcg gaacccctat ttgtttattt ttctaaatac 5220
attcaaatat gtatccgctc atgagacaat aaccctgata aatgcttcaa taatattgaa 5280
aaaggaagag tatgagtatt caacatttcc gtgtcgccct tattcccttt tttgcggcat 5340
tttgccttcc tgtttttgct cacccagaaa cgctggtgaa agtaaaagat gctgaagatc 5400
agttgggtgc acgagtgggt tacatcgaac tggatctcaa cagcggtaag atccttgaga 5460
gttttcgccc cgaagaacgt tttccaatga tgagcacttt taaagttctg ctatgtggcg 5520
cggtattatc ccgtattgac gccgggcaag agcaactcgg tcgccgcata cactattctc 5580
agaatgactt ggttgagtac tcaccagtca cagaaaagca tcttacggat ggcatgacag 5640
taagagaatt atgcagtgct gccataacca tgagtgataa cactgcggcc aacttacttc 5700
tgacaacgat cggaggaccg aaggagctaa ccgctttttt gcacaacatg ggggatcatg 5760
taactcgcct tgatcgttgg gaaccggagc tgaatgaagc cataccaaac gacgagcgtg 5820
acaccacgat gcctgtagca atggcaacaa cgttgcgcaa actattaact ggcgaactac 5880
ttactctagc ttcccggcaa caattaatag actggatgga ggcggataaa gttgcaggac 5940
cacttctgcg ctcggccctt ccggctggct ggtttattgc tgataaatct ggagccggtg 6000
agcgtgggtc tcgcggtatc attgcagcac tggggccaga tggtaagccc tcccgtatcg 6060
tagttatcta cacgacgggg agtcaggcaa ctatggatga acgaaataga cagatcgctg 6120
agataggtgc ctcactgatt aagcattggt aactgtcaga ccaagtttac tcatatatac 6180
tttagattga tttaaaactt catttttaat ttaaaaggat ctaggtgaag atcctttttg 6240
ataatctcat gaccaaaatc ccttaacgtg agttttcgtt ccactgagcg tcagaccccg 6300
tagaaaagat caaaggatct tcttgagatc ctttttttct gcgcgtaatc tgctgcttgc 6360
aaacaaaaaa accaccgcta ccagcggtgg tttgtttgcc ggatcaagag ctaccaactc 6420
tttttccgaa ggtaactggc ttcagcagag cgcagatacc aaatactgtt cttctagtgt 6480
agccgtagtt aggccaccac ttcaagaact ctgtagcacc gcctacatac ctcgctctgc 6540
taatcctgtt accagtggct gctgccagtg gcgataagtc gtgtcttacc gggttggact 6600
caagacgata gttaccggat aaggcgcagc ggtcgggctg aacggggggt tcgtgcacac 6660
agcccagctt ggagcgaacg acctacaccg aactgagata cctacagcgt gagctatgag 6720
aaagcgccac gcttcccgaa gggagaaagg cggacaggta tccggtaagc ggcagggtcg 6780
gaacaggaga gcgcacgagg gagcttccag ggggaaacgc ctggtatctt tatagtcctg 6840
tcgggtttcg ccacctctga cttgagcgtc gatttttgtg atgctcgtca ggggggcgga 6900
gcctatggaa aaacgccagc aacgcggcct ttttacggtt cctggccttt tgctggcctt 6960
ttgctcacat gttctttcct gcgttatccc ctgattctgt ggataaccgt attaccgcct 7020
ttgagtgagc tgataccgct cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg 7080
aggaagcgga agagcgccca atacgcaaac cgcctctccc cgcgcgttgg ccgattcatt 7140
aatgcagctg gcacgacagg tttcccgact ggaaagcggg cagtgagcgc aacgcaatta 7200
atgtgagtta gctcactcat taggcacccc aggctttaca ctttatgctt ccggctcgta 7260
tgttgtgtgg aattgtgagc ggataacaat ttcacacagg aaacagctat gaccatgatt 7320
acgccaa 7327
<210> 60
<211> 6902
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 60
ctagagtcga cctgcaggca tgcaagcttg gcgtaatcat ggtcatagct gtttcctgtg 60
tgaaattgtt atccgctcac aattccacac aacatacgag ccggaagcat aaagtgtaaa 120
gcctggggtg cctaatgagt gagctaactc acattaattg cgttgcgctc actgcccgct 180
ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa tcggccaacg cgcggggaga 240
ggcggtttgc gtattgggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc 300
gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa 360
tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt 420
aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa 480
aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt 540
ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg 600
tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg taggtatctc 660
agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc 720
gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta 780
tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct 840
acagagttct tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc 900
tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa 960
caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa 1020
aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa 1080
aactcacgtt aagggatttt ggtcatgtga ttatcaaaaa ggatcttcac ctagatcctt 1140
ttaaattaaa aatgaagttt taaatcaatc taaagtatat atgagtaaac ttggtctgac 1200
agttagaaaa actcatcgag catcaaatga aactgcaatt tattcatatc aggattatca 1260
ataccatatt tttgaaaaag ccgtttctgt aatgaaggag aaaactcacc gaggcagttc 1320
cataggatgg caagatcctg gtatcggtct gcgattccga ctcgtccaac atcaatacaa 1380
cctattaatt tcccctcgtc aaaaataagg ttatcaagtg agaaatcacc atgagtgacg 1440
actgaatccg gtgagaatgg caaaagttta tgcatttctt tccagacttg ttcaacaggc 1500
cagccattac gctcgtcatc aaaatcactc gcatcaacca aaccgttatt cattcgtgat 1560
tgcgcctgag cgagacgaaa tacgcgatcg ctgttaaaag gacaattaca aacaggaatc 1620
gaatgcaacc ggcgcaggaa cactgccagc gcatcaacaa tattttcacc tgaatcagga 1680
tattcttcta atacctggaa tgctgttttc ccagggatcg cagtggtgag taaccatgca 1740
tcatcaggag tacggataaa atgcttgatg gtcggaagag gcataaattc cgtcagccag 1800
tttagtctga ccatctcatc tgtaacatca ttggcaacgc tacctttgcc atgtttcaga 1860
aacaactctg gcgcatcggg cttcccatac aatcgataga ttgtcgcacc tgattgcccg 1920
acattatcgc gagcccattt atacccatat aaatcagcat ccatgttgga atttaatcgc 1980
ggcctagagc aagacgtttc ccgttgaata tggctcatac tcttcctttt tcaatattat 2040
tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg tatttagaaa 2100
aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga cgtctaagaa 2160
accattatta acatgacatt aacctataaa aataggcgta tcacgaggcc ctttcgtctc 2220
gcgcgtttcg gtgatgacgg tgaaaacctc tgacacatgc agctcccgga gacggtcaca 2280
gcttgtctgt aagcggatgc cgggagcaga caagcccgtc agggcgcgtc agcgggtgtt 2340
ggcgggtgtc ggggctggct taactatgcg gcatcagagc agattgtact gagagtgcac 2400
catatgcggt gtgaaatacc gcacagatgc gtaaggagaa aataccgcat caggcgccat 2460
tcgccattca ggctgcgcaa ctgttgggaa gggcgatcgg tgcgggcctc ttcgctatta 2520
cgccagctgg cgaaaggggg atgtgctgca aggcgattaa gttgggtaac gccagggttt 2580
tcccagtcac gacgttgtaa aacgacggcc agtgaattcg agctcggtac ccgtagccat 2640
ggaaactaga taagaaagaa atacgcagag accaaagttc aactgaaacg aattaaacgg 2700
tttattgatt aacaagcaat tacagattac gggtgaggta acgggtgcca atggggcggg 2760
gttcagagta cacgccttct gtattaacag caaagtccac acttgtagat ttgtagtagt 2820
tggaggtgta ctggatctcg gggttccagc gcttgctgtt ttccttctgc agctcccatt 2880
caatttccac gctgacctgt ccggtgctgt attgcgtgat gaaagagttc agctttgact 2940
ggttgaaggt ggtcggagga tccgcaggta caggcgtgtt cttgatcagg atctgaggcg 3000
gaggatgttt caggccaaag ccgcccatca gcggagacgg gtggaagttg ccgtccgtgt 3060
gaggaatctt ggcccagatg ggaccctgca ggtacacgtc ccggttctgc cagaccatac 3120
cgggtaaggc cccctggctg ttgacagttc caatttgagg agccgtgttt tgctgctgca 3180
agttatctgc cacgataccg tattcctctg tagccacagg gttagtggtt ttgatttctt 3240
cctcgctggt gagcatgaca tcgctgtaat ccgcattgtc tctggcagca ttttgtttgc 3300
caaaaatcag gatcccgtta ctgggaaaaa aacgctcctc gtcgtctttg tgtgttgcca 3360
tagcgatgcc aggattagcc aatgaatttc ttccattcag atggtatttg gtcccagcag 3420
tccaggcaaa gttgctattg ttgttttgcc cggttgtcgt tgagacgcgt tgttggcggt 3480
aacagggtcc tggcagccag ttctttgcct gattggccat tgtattaggc ccaccttggc 3540
tgaagcccag agtctgcgta tttgccgtgc ctcctgttgt ttgagtccga gacaagtagt 3600
acaggtactg gtcaatcaga ggattcatca gccggtccaa gctctggctg tgggcgtagc 3660
tgctgtggaa aggcacgtcc tcgaaggtgt aagtaaactg gaagttgttg ccggttctca 3720
gcatctgcga aggaaagtat tccaggcagt agaaggagga gcgtcccacg gcctgactac 3780
cgttgttgag tgttaggtag ccgtactggg gaatcatgaa cacgtccgcc gggaacggag 3840
gcaggcagcc ctggtgggca gagccgagaa cgtacggcag ctggtactcc gagtccgtaa 3900
acacctggat ggtgctggtg aggttattgg cgatggtctt ggtgccttca ttctgcgtga 3960
cctccttgac ctggatgttg aagagcttga agctgagtct cttgggccgg aatccccagt 4020
tgttgttgat gagtcgctgc cagtcacgtg gtgaaaagtg gcagtggaat ctgttaaagt 4080
caaaataccc ccagggggtg ctgtagccga agtaggtgtt gtcgttggtg gctcctcccg 4140
atgtcccgtt ggagatttgc ttgtagaggt ggttgttgta ggtgggcagg gcccaggttc 4200
gggtgctggt ggtgatgact ctgtcgccca gccatgtgga atcgcaatgc caatttcccg 4260
aggaactacc cactccgtcg gcgccttcgt tattgtctgc cattggtgcg ccaccgcctg 4320
cagccattgt attaggtccc acaccagagg gcgctgctgg aggttctccg agaggttgag 4380
ggtctggaac tgactctgag tcgccagtct gaccaaaatt gagtcttttt ctggcgggct 4440
gttggccttt cttgccgatg cccgtagagg agtctggaga acgctggggt gatggctcta 4500
ccggtctctt ctttccagga gccgtcttag cgccttcctc aaccagaccg agaggttcga 4560
gaacccgctt cttggcctgg aagactgctc gcccgaggtt gcccccaaaa gacgtatctt 4620
cttgcagacg ctcctgaaac tcggcgtcgg cgtggttata ccgcaggtac ggattgtcac 4680
ccgcctgcag ctgctggtcg taggccttgt cgtgctcgag ggccgctgcg tccgccgcgt 4740
tgacgggctc ccccttgtcg agtccgttga agggtccgag gtacttgtag ccaggaagca 4800
ccagaccccg gccgtcgtcc tgcttttgct ggttggcttt gggcttcggg gctccaggtt 4860
tcagcgccca ccactcgcga atgccctcag agaggttgtc ctcgagccaa tctggaagat 4920
aaccatcggc agccatacct gatttaaatc atttattgtt caaagatgca gtcatccaaa 4980
tccacattga ccagatcgca ggcagtgcaa gcgtctggca cctttcccat gatatgatga 5040
atgtagcaca gtttctgata cgcctttttg acgacagaaa cgggttgaga ttctgacacg 5100
ggaaagcact ctaaacagtc tttctgtccg tgagtgaagc agatatttga attctgattc 5160
attctctcgc attgtctgca gggaaacagc atcagattca tgcccacgtg acgagaacat 5220
ttgttttggt acctgtctgc gtagttgatc gaagcttccg cgtctgacgt cgatggctgc 5280
gcaactgact cgcgcacccg tttgggctca cttatatctg cgtcactggg ggcgggtctt 5340
ttcttggctc cacccttttt gacgtagaat tcatgctcca cctcaaccac gtgatccttt 5400
gcccaccgga aaaagtcttt gacttcctgc ttggtgacct tcccaaagtc atgatccaga 5460
cggcgggtga gttcaaattt gaacatccgg tcttgcaacg gctgctggtg ttcgaaggtc 5520
gttgagttcc cgtcaatcac ggcgcacatg ttggtgttgg aggtgacgat cacgggagtc 5580
gggtctatct gggccgagga cttgcatttc tggtccacgc gcaccttgct tcctccgaga 5640
atggctttgg ccgactccac gaccttggcg gtcatcttcc cctcctccca ccagatcacc 5700
atcttgtcga cacagtcgtt gaagggaaag ttctcattgg tccagtttac gcacccgtag 5760
aagggcacag tgtgggctat ggcctccgcg atgttggtct tcccggtagt tgcaggccca 5820
aacagccaga tggtgttcct cttgccgaac tttttcgtgg cccatcccag aaagacggaa 5880
gccgcatatt ggggatcgta cccgtttagt tccaaaattt tataaatccg attgctggaa 5940
atgtcctcca cgggctgctg gcccaccagg tagtcggggg cggttttagt caggctcata 6000
atctttcccg cattgtccaa ggcagccttg atttgggacc gcgagttgga ggccgcattg 6060
aaggagatgt atgaggcctg gtcctcctgg atccactgct tctccgaggt aatccccttg 6120
tccacgagcc acccgaccag ctccatgtac ctggctgaag tttttgatct gatcaccggc 6180
gcatcagaat tgggattctg attctctttg ttctgctcct gcgtctgcga cacgtgcgtc 6240
agatgctgcg ccaccaaccg tttacgctcc gtgagattca aacaggcgct taaatactgt 6300
tccatattag tccacgccca ctggagctca ggctgggttt tggggagcaa gtaattgggg 6360
atgtagcact catccaccac cttgttcccg cctccggcgc catttctggt ctttgtgacc 6420
gcgaaccagt ttggcaaagt cggctcgatc ccgcggtaaa ttctctgaat cagtttttcg 6480
cgaatctgac tcaggaaacg tcccaaaacc atggatttca ccccggtggt ttccacgagc 6540
acgtgcatgt ggaagtagct ctctcccttc tcaaattgca caaagaaaag ggcctccggg 6600
gccttactca cacggcgcca ttccgtcaga aagtcgcgct gcagcttctc ggccacggtc 6660
aggggtgcct gctcaatcag attcagatcc atgtcagaat ctggcggcaa ctcccattcc 6720
ttctcggcca cccagttcac aaagctgtca gaaatgccgg gcagatgctc gtcaaggtcg 6780
ctggggacct taatcacaat ctcgtaaaac cccggcatgg cggctgcgca gatcagaagt 6840
tcctatactt tctagagaat aggaacttcg gaataggaac ttctgatctt ccgggggatc 6900
ca 6902
<210> 61
<211> 100
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 61
ttagaccgtg ccatggctag ttgggtacca ggtcacccgt gctcgacttc cggtcttcat 60
ggagaactgg tgaccggtaa ccgaccgtaa gattgggaat 100
<210> 62
<211> 100
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 62
tgtcaagaat acgatcggaa aggactcgac aattgatggg cctgtagcgc caacgttgta 60
ctttatccaa ggtgagctca ggagtgttat cataaatacg 100
<210> 63
<211> 100
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 63
tctcctgttc atccgacaac cacactccct agttcaggga ggtcactcga gttagagctg 60
aaaccccact agctcacgct cgttatcaac ccgggtaagt 100
<210> 64
<211> 100
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 64
gtggctcctt taaggtctcg cctgttcgat tgttcgtcgc tgccgcggat cagcaaagtt 60
gcttccgtcc taattcggcc taaggatccg ctagtgcgcg 100
<210> 65
<211> 100
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 65
actgcgcttc tgtggctcct gaacaacgca aagcttcggt cgcctagtcc agtggatggg 60
ccaaggacaa ttgcagtgct tatctccact gctgaaaccc 100
<210> 66
<211> 100
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 66
gtgaaagatg aggagtgagt ttacgcactc acgaagccct aattacccga gtatcgtaag 60
ccaatatcgt agcccagttc ctgtacaggg tcgcgtataa 100
<210> 67
<211> 100
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 67
acgatttccg tcgttcatat gagccaccag gcttgtctct tcgcgcaatt tgacacgcaa 60
cacccgctgc cattccgagg tcgttagggc ttttggattt 100
<210> 68
<211> 100
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 68
aacctatttg attgtacagc gtgagtacga agcgaatagg ctagtaacac tgccctatgc 60
aaagacgcct tggttgattc tagagctggg attggtacga 100
<210> 69
<211> 100
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 69
tgaggtcatc tccttttcat ccgtgtccta acgcttcgat ccttctgcag gctcctctta 60
tggatgtttt atcaccctgt cgagcgtgca cgatggtgga 100
<210> 70
<211> 100
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 70
gaactccgcg tgcagcgcgg agttgacacg gaaggccagg gagccaattt ccactgtcct 60
gagctagacc ccttgatagc acttgctgtg catggttgct 100
<210> 71
<211> 10150
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<221> modified_base
<222> (5875)..(5974)
<223> a, c, t, g, unknown or other
<220>
<221> misc_feature
<222> (5875)..(5974)
<223> This region may encompass 60-100 nucleotides
<400> 71
tagggaaata ggccaggttt tcaccgtaac acgccacatc ttgcgaatat atgtgtagaa 60
actgccggaa atcgtcgtgt gcactcatgg aaaacggtgt aacaagggtg aacactatcc 120
catatcacca gctcaccgtc tttcattgcc atacggaact ccggatgagc attcatcagg 180
cgggcaagaa tgtgaataaa ggccggataa aacttgtgct tatttttctt tacggtcttt 240
aaaaaggccg taatatccag ctgaacggtc tggttatagg tacattgagc aactgactga 300
aatgcctcaa aatgttcttt acgatgccat tgggatatat caacggtggt atatccagtg 360
atttttttct ccattttttt ttcctccttt agaaaaactc atcgagcatc aaatgaaact 420
gcaatttatt catatcagga ttatcaatac catatttttg aaaaagccgt ttctgtaatg 480
aaggagaaaa ctcaccgagg cagttccata ggatggcaag atcctggtat cggtctgcga 540
ttccgactcg tccaacatca atacaaccta ttaatttccc ctcgtcaaaa ataaggttat 600
caagtgagaa atcaccatga gtgacgactg aatccggtga gaatggcaaa agtttatgca 660
tttctttcca gacttgttca acaggccagc cattacgctc gtcatcaaaa tcactcgcat 720
caaccaaacc gttattcatt cgtgattgcg cctgagcgag gcgaaatacg cgatcgctgt 780
taaaaggaca attacaaaca ggaatcgagt gcaaccggcg caggaacact gccagcgcat 840
caacaatatt ttcacctgaa tcaggatatt cttctaatac ctggaacgct gtttttccgg 900
ggatcgcagt ggtgagtaac catgcatcat caggagtacg gataaaatgc ttgatggtcg 960
gaagtggcat aaattccgtc agccagttta gtctgaccat ctcatctgta acatcattgg 1020
caacgctacc tttgccatgt ttcagaaaca actctggcgc atcgggcttc ccatacaagc 1080
gatagattgt cgcacctgat tgcccgacat tatcgcgagc ccatttatac ccatataaat 1140
cagcatccat gttggaattt aatcgcggcc tcgacgtttc ccgttgaata tggctcattt 1200
ttttttcctc ctttaccaat gcttaatcag tgaggcacct atctcagcga tctgtctatt 1260
tcgttcatcc atagttgcct gactccccgt cgtgtagata actacgatac gggagggctt 1320
accatctggc cccagcgctg cgatgatacc gcgagaacca cgctcaccgg ctccggattt 1380
atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg caactttatc 1440
cgcctccatc cagtctatta attgttgccg ggaagctaga gtaagtagtt cgccagttaa 1500
tagtttgcgc aacgttgttg ccatcgctac aggcatcgtg gtgtcacgct cgtcgtttgg 1560
tatggcttca ttcagctccg gttcccaacg atcaaggcga gattcttcct ttttcaatat 1620
tattgaagca tttatcaggg ttattgtctc atgagcggat acatatttga atgtatttag 1680
aaaaataaac aaataggggt cagtgttaca accaattaac caattctgaa cattatcgcg 1740
agcccattta tacctgaata tggctcataa caccccttgt ttgcctggcg gcagtagcgc 1800
ggtggtccca cctgacccca tgccgaactc agaagtgaaa cgccgtagcg ccgatggtag 1860
tgtggggact ccccatgcga gagtagggaa ctgccaggca tcaaataaaa cgaaaggctc 1920
agtcgaaaga ctgggccttt cgcccgggct aattgagggg tgtcgccctt attcgactcg 1980
gggctcgagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc cgggcgtcgg 2040
gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg agtggccaac 2100
tccatcacta ggggttcctt taattaaacg cgtttacata acttacggta aatggcccgc 2160
ctggctgacc gcccaacgac ccccgcccat tgacgtcaat aatgacgtat gttcccatag 2220
taacgccaat agggactttc cattgacgtc aatgggtgga ctatttacgg taaactgccc 2280
acttggcagt acatcaagtg tatcatatgc caagtacgcc ccctattgac gtcaatgacg 2340
gtaaatggcc cgcctggcat tatgcccagt acatgacctt atgggacttt cctacttggc 2400
agtacatcta cgtattagtc atcgctatta ccatggtgat gcggttttgg cagtacatca 2460
atgggcgtgg atagcggttt gactcacggg gatttccaag tctccacccc attgacgtca 2520
atgggagttt gttttggcac caaaatcaac gggactttcc aaaatgtcgt aacaactccg 2580
ccccattgac gcaaatgggc ggtaggcgtg tacggtggga ggtctatata ggcgcgccga 2640
actgaaaaac cagaaagtta actggtaagt ttagtctttt tgtcttttat ttcaggtccc 2700
ggatccggtg gtggtgcaaa tcaaagaact gctcctcagt ggatgttgcc tttacttcta 2760
ggcctgtacg gaagtgttac ttctgctcta aaagctcctg cagggaattc gccaccatgg 2820
tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat cctggtcgag ctggacggcg 2880
acgtaaacgg ccacaagttc agcgtgtccg gcgagggcga gggcgatgcc acctacggca 2940
agctgaccct gaagttcatc tgcaccaccg gcaagctgcc cgtgccctgg cccaccctcg 3000
tgaccaccct gacctacggc gtgcagtgct tcagccgcta ccccgaccac atgaagcagc 3060
acgacttctt caagtccgcc atgcccgaag gctacgtcca ggagcgcacc atcttcttca 3120
aggacgacgg caactacaag acccgcgccg aggtgaagtt cgagggcgac accctggtga 3180
accgcatcga gctgaagggc atcgacttca aggaggacgg caacatcctg gggcacaagc 3240
tggagtacaa ctacaacagc cacaacgtct atatcatggc cgacaagcag aagaacggca 3300
tcaaggtgaa cttcaagatc cgccacaaca tcgaggacgg cagcgtgcag ctcgccgacc 3360
actaccagca gaacaccccc atcggcgacg gccccgtgct gctgcccgac aaccactacc 3420
tgagcaccca gtccgccctg agcaaagacc ccaacgagaa gcgcgatcac atggtcctgc 3480
tggagttcgt gaccgccgcc gggatcactc tcggcatgga cgagctgtac aagtaataga 3540
ctagtgcccc tctccctccc ccccccctaa cgttactggc cgaagccgct tggaataagg 3600
ccggtgtgcg tttgtctata tgttattttc caccatattg ccgtcttttg gcaatgtgag 3660
ggcccggaaa cctggccctg tcttcttgac gagcattcct aggggtcttt cccctctcgc 3720
caaaggaatg caaggtctgt tgaatgtcgt gaaggaagca gttcctctgg aagcttcttg 3780
aagacaaaca acgtctgtag cgaccctttg caggcagcgg aaccccccac ctggcgacag 3840
gtgcctctgc ggccaaaagc cacgtgtata agatacacct gcaaaggcgg cacaacccca 3900
gtgccacgtt gtgagttgga tagttgtgga aagagtcaaa tggctcacct caagcgtatt 3960
caacaagggg ctgaaggatg cccagaaggt accccattgt atgggatctg atctggggcc 4020
tcggtgcaca tgctttacat gtgtttagtc gaggttaaaa aacgtctagg ccccccgaac 4080
cacggggacg tggttttcct ttgaaaaaca cgatgataat accggtgcca ccatgctgct 4140
gctgctgctg ctgctgggcc tgaggctaca gctctccctg ggcatcatcc cagttgagga 4200
ggagaacccg gacttctgga accgcgaggc agccgaggcc ctgggtgccg ccaagaagct 4260
gcagcctgca cagacagccg ccaagaacct catcatcttc ctgggcgatg ggatgggggt 4320
gtctacggtg acagctgcca ggatcctaaa agggcagaag aaggacaaac tggggcctga 4380
gatacccctg gccatggacc gcttcccata tgtggctctg tccaagacat acaatgtaga 4440
caaacatgtg ccagacagtg gagccacagc cacggcctac ctgtgcgggg tcaagggcaa 4500
cttccagacc attggcttga gtgcagccgc ccgctttaac cagtgcaaca cgacacgcgg 4560
caacgaggtc atctccgtga tgaatcgggc caagaaagca gggaagtcag tgggagtggt 4620
aaccaccaca cgagtgcagc acgcctcgcc agccggcacc tacgcccaca cggtgaaccg 4680
caactggtac tcggacgccg acgtgcctgc ctcggcccgc caggaggggt gccaggacat 4740
cgctacgcag ctcatctcca acatggacat tgacgtgatc ctaggtggag gccgaaagta 4800
catgtttcgc atgggaaccc cagaccctga gtacccagat gactacagcc aaggtgggac 4860
caggctggac gggaagaatc tggtgcagga atggctggcg aagcgccagg gtgcccggta 4920
tgtgtggaac cgcactgagc tcatgcaggc ttccctggac ccgtctgtga cccatctcat 4980
gggtctcttt gagcctggag acatgaaata cgagatccac cgagactcca cactggaccc 5040
ctccctgatg gagatgacag aggctgccct gcgcctgctg agcaggaacc cccgcggctt 5100
cttcctcttc gtggagggtg gtcgcatcga ccatggtcat catgaaagca gggcttaccg 5160
ggcactgact gagacgatca tgttcgacga cgccattgag agggcgggcc agctcaccag 5220
cgaggaggac acgctgagcc tcgtcactgc cgaccactcc cacgtcttct ccttcggagg 5280
ctaccccctg cgagggagct ccatcttcgg gctggcccct ggcaaggccc gggacaggaa 5340
ggcctacacg gtcctcctat acggaaacgg tccaggctat gtgctcaagg acggcgcccg 5400
gccggatgtt accgagagcg agagcgggag ccccgagtat cggcagcagt cagcagtgcc 5460
cctggacgaa gagacccacg caggcgagga cgtggcggtg ttcgcgcgcg gcccgcaggc 5520
gcacctggtt cacggcgtgc aggagcagac cttcatagcg cacgtcatgg ccttcgccgc 5580
ctgcctggag ccctacaccg cctgcgacct ggcgcccccc gccggcacca ccgacgccgc 5640
gcacccgggt tactctagag tcggggcggc cggccgcttc gagcagacat gagtcgacag 5700
atcttttaaa aaacctccca cacaattgtt gttgttaact tgtttattgc agcttataat 5760
ggttacaaat aaagcaatag catcacaaat ttcacaaata aagcattttt ttcactgcat 5820
tctagttgtg gtttgtccaa actcatcaat gtatcttatc atgtctgttt aaacnnnnnn 5880
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 5940
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnatttaa ataggaaccc ctagtgatgg 6000
agttggccac tccctctctg cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg 6060
cccgacgccc gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc agagagtata 6120
catcgatgtg agttcgcggg tggctggggg gccctgggct gcgaccgccc ccgaaccgcg 6180
tctacgagcc ttgcgggctc cgggtctttg cagtcgtatg ggggcagggt agctgttccc 6240
cgcaaggaga gctcaaggtc agcgctcgga cctggcggag ccccgcaccc aggctgtggc 6300
gccctgtgca gctccgccct tgcggcgcca tctgcccgga gcctccttcc cctagtcccc 6360
agaaacagga ggtccctact cccgcccgag atcccgaccc ggacccctag gtgggggacg 6420
ctttctttcc tttcgcgctc tgcggggtca cgtgtcgcag aggagcccct cccccacggc 6480
ctccggcacc gcaggccccg ggatgctagt gcgcagcggg tgcatccctg tccggatgct 6540
gcgcctgcgg tagagcggcc gccatgttgc aaccgggaag gaaatgaatg ggcagccgtt 6600
aggaaagcct gccggtgact aaccctgcgc tcctgcctcg atgggtggag tcgcgtgtgg 6660
cggggaagtc aggtggagcg aggctagctg gcccgatttc tcctccgggt gatgcttttc 6720
ctagattatt ctctggtaaa tcaaagaagt gggtttatgg aggtcctctt gtgtcccctc 6780
cccgcagagg tgtggtggct gtggcatggt gccaagccgg gagaagctga gtcatgggta 6840
gttggaaaag gacatttcca ccgcaaaatg gcccctctgg tggtggcccc ttcctgcagc 6900
gccggctcac ctcacggccc cgcccttccc ctgccagcct agcgttgacc cgaccccaaa 6960
ggccaggctg taaatgtcac cgggaggatt gggtgtctgg gcgcctcggg gaacctgccc 7020
ttctccccat tccgtcttcc ggaaaccaga tctcccaccg caccctggtc tgaggttaaa 7080
tatagctgct gacctttctg tagctggggg cctgggctgg ggctctctcc catcccttct 7140
ccccacacac atgcacttac ctgtgctccc actcctgatt tctggaaaag agctaggaag 7200
gacaggcaac ttggcaaatc aaagccctgg gactaggggg ttaaaataca gcttcccctc 7260
ttcccacccg ccccagtctc tgtccctttt gtaggaggga cttagagaag gggtgggctt 7320
gccctgtcca gttaatttct gacctttact cctgcccttt gagtttgatg atgctgagtg 7380
tacaagcgtt ttctccctaa agggtgcagc tgagctaggc agcagcaagc attcctgggg 7440
tggcatagtg gggtggtgaa taccatgtac aaagcttgtg cccagactgt gggtggcagt 7500
gccccacatg gccgcttctc ctggaagggc ttcgtatgac tgggggtgtt gggcagccct 7560
ggagccttca gttgcagcca tgccttaagc caggccagcc tggcagggaa gctcaaggga 7620
gataaaattc aacctcttgg gccctcctgg gggtaaggag atgctgcatt cgccctctta 7680
atggggaggt ggcctagggc tgctcacata ttctggagga gcctcccctc ctcatgcctt 7740
cttgcctctt gtctcttagg catgcaaaag agtcgaataa gggcgacaca aaatttattc 7800
taaatgcata ataaatactg ataacatctt atagtttgta ttatattttg tattatcgtt 7860
gacatgtata attttgatat caaaaactga ttttcccttt attattttcg agatttattt 7920
tcttaattct ctttaacaaa ctagaaatat tgtatataca aaaaatcata aataatagat 7980
gaatagttta attataggtg ttcatcaatc gaaaaagcaa cgtatcttat ttaaagtgcg 8040
ttgctttttt ctcatttata aggttaaata attctcatat atcaagcaaa gtgacaggcg 8100
cccttaaata ttctgacaaa tgctctttcc ctaaactccc cccataaaaa aacccgccga 8160
agcgggtttt tacgttattt gcggattaac gattactcgt tatcagaacc gcccaggggg 8220
cccgagctta agactggccg tcgttttaca acacagaaag agtttgtaga aacgcaaaaa 8280
ggccatccgt caggggcctt ctgcttagtt tgatgcctgg cagttcccta ctctcgcctt 8340
ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag 8400
ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca 8460
tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt 8520
tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc 8580
gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct 8640
ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg 8700
tggcgctttc tcatagctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca 8760
agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact 8820
atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta 8880
acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtgggcta 8940
actacggcta cactagaaga acagtatttg gtatctgcgc tctgctgaag ccagttacct 9000
tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt 9060
tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga 9120
tcttttctac ggggtctgac gctcagtgga acgacgcgcg cgtaactcac gttaagggat 9180
tttggtcatg agcttgcgcc gtcccgtcaa gtcagcgtaa tgctacactt cttcccgtat 9240
gcccaacttt gtatagagag ccactgcggg atcgtcaccg taatctgctt gcacgtagat 9300
ttataaagca ccaagcgcgt tggcctttag cttgaggaga ttgatgagcg cggtggcaat 9360
gccctgcctc cggtgctcgc cggagactgc gagatttaag atatagatct cactacgcgg 9420
ctgctcaaac ttgggcagaa cgtaagccgc gagagcgcca acaaccgctt cttggtcgaa 9480
ggcagcaagc gcgatgaatg tcttactacg gagcaagttc ccgaggtaat cggagtccgg 9540
ctgatgttgg gagtaggtgg ctacgtcacc gaactcacga ccgaaaagat caagagcagc 9600
ccgttaggat ttgacttggt cagggccgag cctattagtg cgaatgatgc cttaacttga 9660
gccacctaac tttgttttag ggcgactgcc ctgctgcgta attacgttgc tgctcttaaa 9720
ttacaaacat cgacccacgg cgtaacgcgc ttgctgcttg gatgcccgag gcatagactg 9780
tacaaaaaaa cagtcataac aagccatgaa aaccgccact gcgccgttac caccgctgcg 9840
ttcggtcaag gttctggacc agttgcgtga gcgcattttt ttttcctcct cggcgtttac 9900
gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct gccgacatgg 9960
aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac cttgtcgcct 10020
tgcgtataat atttgcccat agtgaaaacg ggggcgaaga agttgtccat attggccacg 10080
tttaaatcaa aactggtgaa actcacccag ggattggcgc tgacgaaaaa catattctca 10140
ataaaccctt 10150
<210> 72
<211> 498
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 72
cacttcttcc cgtatgccca actttgtata gagagccact gcgggatcgt caccgtaatc 60
tgcttgcacg tagatttata aagcaccaag cgcgttggcc tttagcttga ggagattgat 120
gagcgcggtg gcaatgccct gcctccggtg ctcgccggag actgcgagat ttaagatata 180
gatctcacta cgcggctgct caaacttggg cagaacgtaa gccgcgagag cgccaacaac 240
cgcttcttgg tcgaaggcag caagcgcgat gaatgtctta ctacggagca agttcccgag 300
gtaatcggag tccggctgat gttgggagta ggtggctacg tcaccgaact cacgaccgaa 360
aagatcaaga gcagcccgtt aggatttgac ttggtcaggg ccgagcctat tagtgcgaat 420
gatgccttaa cttgagccac ctaactttgt tttagggcga ctgccctgct gcgtaattac 480
gttgctgctc ttaaatta 498
<210> 73
<211> 7989
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<221> modified_base
<222> (3714)..(3813)
<223> a, c, t, g, unknown or other
<220>
<221> misc_feature
<222> (3714)..(3813)
<223> This region may encompass 60-100 nucleotides
<400> 73
tagggaaata ggccaggttt tcaccgtaac acgccacatc ttgcgaatat atgtgtagaa 60
actgccggaa atcgtcgtgt gcactcatgg aaaacggtgt aacaagggtg aacactatcc 120
catatcacca gctcaccgtc tttcattgcc atacggaact ccggatgagc attcatcagg 180
cgggcaagaa tgtgaataaa ggccggataa aacttgtgct tatttttctt tacggtcttt 240
aaaaaggccg taatatccag ctgaacggtc tggttatagg tacattgagc aactgactga 300
aatgcctcaa aatgttcttt acgatgccat tgggatatat caacggtggt atatccagtg 360
atttttttct ccattttttt ttcctccttt agaaaaactc atcgagcatc aaatgaaact 420
gcaatttatt catatcagga ttatcaatac catatttttg aaaaagccgt ttctgtaatg 480
aaggagaaaa ctcaccgagg cagttccata ggatggcaag atcctggtat cggtctgcga 540
ttccgactcg tccaacatca atacaaccta ttaatttccc ctcgtcaaaa ataaggttat 600
caagtgagaa atcaccatga gtgacgactg aatccggtga gaatggcaaa agtttatgca 660
tttctttcca gacttgttca acaggccagc cattacgctc gtcatcaaaa tcactcgcat 720
caaccaaacc gttattcatt cgtgattgcg cctgagcgag gcgaaatacg cgatcgctgt 780
taaaaggaca attacaaaca ggaatcgagt gcaaccggcg caggaacact gccagcgcat 840
caacaatatt ttcacctgaa tcaggatatt cttctaatac ctggaacgct gtttttccgg 900
ggatcgcagt ggtgagtaac catgcatcat caggagtacg gataaaatgc ttgatggtcg 960
gaagtggcat aaattccgtc agccagttta gtctgaccat ctcatctgta acatcattgg 1020
caacgctacc tttgccatgt ttcagaaaca actctggcgc atcgggcttc ccatacaagc 1080
gatagattgt cgcacctgat tgcccgacat tatcgcgagc ccatttatac ccatataaat 1140
cagcatccat gttggaattt aatcgcggcc tcgacgtttc ccgttgaata tggctcattt 1200
ttttttcctc ctttaccaat gcttaatcag tgaggcacct atctcagcga tctgtctatt 1260
tcgttcatcc atagttgcct gactccccgt cgtgtagata actacgatac gggagggctt 1320
accatctggc cccagcgctg cgatgatacc gcgagaacca cgctcaccgg ctccggattt 1380
atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg caactttatc 1440
cgcctccatc cagtctatta attgttgccg ggaagctaga gtaagtagtt cgccagttaa 1500
tagtttgcgc aacgttgttg ccatcgctac aggcatcgtg gtgtcacgct cgtcgtttgg 1560
tatggcttca ttcagctccg gttcccaacg atcaaggcga gattcttcct ttttcaatat 1620
tattgaagca tttatcaggg ttattgtctc atgagcggat acatatttga atgtatttag 1680
aaaaataaac aaataggggt cagtgttaca accaattaac caattctgaa cattatcgcg 1740
agcccattta tacctgaata tggctcataa caccccttgt ttgcctggcg gcagtagcgc 1800
ggtggtccca cctgacccca tgccgaactc agaagtgaaa cgccgtagcg ccgatggtag 1860
tgtggggact ccccatgcga gagtagggaa ctgccaggca tcaaataaaa cgaaaggctc 1920
agtcgaaaga ctgggccttt cgcccgggct aattgagggg tgtcgccctt attcgactcg 1980
gggctcgagc agcagctgcg cgctcgctcg ctcactgagg ccgcccgggc aaagcccggg 2040
cgtcgggcga cctttggtcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg 2100
gggttttaat taaacgcgtt tacataactt acggtaaatg gcccgcctgg ctgaccgccc 2160
aacgaccccc gcccattgac gtcaataatg acgtatgttc ccatagtaac gccaataggg 2220
actttccatt gacgtcaatg ggtggactat ttacggtaaa ctgcccactt ggcagtacat 2280
caagtgtatc atatgccaag tacgccccct attgacgtca atgacggtaa atggcccgcc 2340
tggcattatg cccagtacat gaccttatgg gactttccta cttggcagta catctacgta 2400
ttagtcatcg ctattaccat ggtgatgcgg ttttggcagt acatcaatgg gcgtggatag 2460
cggtttgact cacggggatt tccaagtctc caccccattg acgtcaatgg gagtttgttt 2520
tggcaccaaa atcaacggga ctttccaaaa tgtcgtaaca actccgcccc attgacgcaa 2580
atgggcggta ggcgtgtacg gtgggaggtc tatataggcg cgccgaactg aaaaaccaga 2640
aagttaactg gtaagtttag tctttttgtc ttttatttca ggtcccggat ccggtggtgg 2700
tgcaaatcaa agaactgctc ctcagtggat gttgccttta cttctaggcc tgtacggaag 2760
tgttacttct gctctaaaag ctcctgcagg gaattcgcca ccatggtgag caagggcgag 2820
gagctgttca ccggggtggt gcccatcctg gtcgagctgg acggcgacgt aaacggccac 2880
aagttcagcg tgtccggcga gggcgagggc gatgccacct acggcaagct gaccctgaag 2940
ttcatctgca ccaccggcaa gctgcccgtg ccctggccca ccctcgtgac caccctgacc 3000
tacggcgtgc agtgcttcag ccgctacccc gaccacatga agcagcacga cttcttcaag 3060
tccgccatgc ccgaaggcta cgtccaggag cgcaccatct tcttcaagga cgacggcaac 3120
tacaagaccc gcgccgaggt gaagttcgag ggcgacaccc tggtgaaccg catcgagctg 3180
aagggcatcg acttcaagga ggacggcaac atcctggggc acaagctgga gtacaactac 3240
aacagccaca acgtctatat catggccgac aagcagaaga acggcatcaa ggtgaacttc 3300
aagatccgcc acaacatcga ggacggcagc gtgcagctcg ccgaccacta ccagcagaac 3360
acccccatcg gcgacggccc cgtgctgctg cccgacaacc actacctgag cacccagtcc 3420
gccctgagca aagaccccaa cgagaagcgc gatcacatgg tcctgctgga gttcgtgacc 3480
gccgccggga tcactctcgg catggacgag ctgtacaagt aatagactag tgtcgacaga 3540
tcttttaaaa aacctcccac acaattgttg ttgttaactt gtttattgca gcttataatg 3600
gttacaaata aagcaatagc atcacaaatt tcacaaataa agcatttttt tcactgcatt 3660
ctagttgtgg tttgtccaaa ctcatcaatg tatcttatca tgtctgttta aacnnnnnnn 3720
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3780
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnatttaaa taggaacccc tagtgatgga 3840
gttggccact ccctctctgc gcgctcgctc gctcactgag gccgggcgac caaaggtcgc 3900
ccgacgcccg ggctttgccc gggcggcctc agtgagcgag cgagcgcgca gagagtatac 3960
atcgatgtga gttcgcgggt ggctgggggg ccctgggctg cgaccgcccc cgaaccgcgt 4020
ctacgagcct tgcgggctcc gggtctttgc agtcgtatgg gggcagggta gctgttcccc 4080
gcaaggagag ctcaaggtca gcgctcggac ctggcggagc cccgcaccca ggctgtggcg 4140
ccctgtgcag ctccgccctt gcggcgccat ctgcccggag cctccttccc ctagtcccca 4200
gaaacaggag gtccctactc ccgcccgaga tcccgacccg gacccctagg tgggggacgc 4260
tttctttcct ttcgcgctct gcggggtcac gtgtcgcaga ggagcccctc ccccacggcc 4320
tccggcaccg caggccccgg gatgctagtg cgcagcgggt gcatccctgt ccggatgctg 4380
cgcctgcggt agagcggccg ccatgttgca accgggaagg aaatgaatgg gcagccgtta 4440
ggaaagcctg ccggtgacta accctgcgct cctgcctcga tgggtggagt cgcgtgtggc 4500
ggggaagtca ggtggagcga ggctagctgg cccgatttct cctccgggtg atgcttttcc 4560
tagattattc tctggtaaat caaagaagtg ggtttatgga ggtcctcttg tgtcccctcc 4620
ccgcagaggt gtggtggctg tggcatggtg ccaagccggg agaagctgag tcatgggtag 4680
ttggaaaagg acatttccac cgcaaaatgg cccctctggt ggtggcccct tcctgcagcg 4740
ccggctcacc tcacggcccc gcccttcccc tgccagccta gcgttgaccc gaccccaaag 4800
gccaggctgt aaatgtcacc gggaggattg ggtgtctggg cgcctcgggg aacctgccct 4860
tctccccatt ccgtcttccg gaaaccagat ctcccaccgc accctggtct gaggttaaat 4920
atagctgctg acctttctgt agctgggggc ctgggctggg gctctctccc atcccttctc 4980
cccacacaca tgcacttacc tgtgctccca ctcctgattt ctggaaaaga gctaggaagg 5040
acaggcaact tggcaaatca aagccctggg actagggggt taaaatacag cttcccctct 5100
tcccacccgc cccagtctct gtcccttttg taggagggac ttagagaagg ggtgggcttg 5160
ccctgtccag ttaatttctg acctttactc ctgccctttg agtttgatga tgctgagtgt 5220
acaagcgttt tctccctaaa gggtgcagct gagctaggca gcagcaagca ttcctggggt 5280
ggcatagtgg ggtggtgaat accatgtaca aagcttgtgc ccagactgtg ggtggcagtg 5340
ccccacatgg ccgcttctcc tggaagggct tcgtatgact gggggtgttg ggcagccctg 5400
gagccttcag ttgcagccat gccttaagcc aggccagcct ggcagggaag ctcaagggag 5460
ataaaattca acctcttggg ccctcctggg ggtaaggaga tgctgcattc gccctcttaa 5520
tggggaggtg gcctagggct gctcacatat tctggaggag cctcccctcc tcatgccttc 5580
ttgcctcttg tctcttaggc atgcaaaaga gtcgaataag ggcgacacaa aatttattct 5640
aaatgcataa taaatactga taacatctta tagtttgtat tatattttgt attatcgttg 5700
acatgtataa ttttgatatc aaaaactgat tttcccttta ttattttcga gatttatttt 5760
cttaattctc tttaacaaac tagaaatatt gtatatacaa aaaatcataa ataatagatg 5820
aatagtttaa ttataggtgt tcatcaatcg aaaaagcaac gtatcttatt taaagtgcgt 5880
tgcttttttc tcatttataa ggttaaataa ttctcatata tcaagcaaag tgacaggcgc 5940
ccttaaatat tctgacaaat gctctttccc taaactcccc ccataaaaaa acccgccgaa 6000
gcgggttttt acgttatttg cggattaacg attactcgtt atcagaaccg cccagggggc 6060
ccgagcttaa gactggccgt cgttttacaa cacagaaaga gtttgtagaa acgcaaaaag 6120
gccatccgtc aggggccttc tgcttagttt gatgcctggc agttccctac tctcgccttc 6180
cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc 6240
tcactcaaag gcggtaatac ggttatccac agaatcaggg gataacgcag gaaagaacat 6300
gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt 6360
ccataggctc cgcccccctg acgagcatca caaaaatcga cgctcaagtc agaggtggcg 6420
aaacccgaca ggactataaa gataccaggc gtttccccct ggaagctccc tcgtgcgctc 6480
tcctgttccg accctgccgc ttaccggata cctgtccgcc tttctccctt cgggaagcgt 6540
ggcgctttct catagctcac gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa 6600
gctgggctgt gtgcacgaac cccccgttca gcccgaccgc tgcgccttat ccggtaacta 6660
tcgtcttgag tccaacccgg taagacacga cttatcgcca ctggcagcag ccactggtaa 6720
caggattagc agagcgaggt atgtaggcgg tgctacagag ttcttgaagt ggtgggctaa 6780
ctacggctac actagaagaa cagtatttgg tatctgcgct ctgctgaagc cagttacctt 6840
cggaaaaaga gttggtagct cttgatccgg caaacaaacc accgctggta gcggtggttt 6900
ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag atcctttgat 6960
cttttctacg gggtctgacg ctcagtggaa cgacgcgcgc gtaactcacg ttaagggatt 7020
ttggtcatga gcttgcgccg tcccgtcaag tcagcgtaat gctacacttc ttcccgtatg 7080
cccaactttg tatagagagc cactgcggga tcgtcaccgt aatctgcttg cacgtagatt 7140
tataaagcac caagcgcgtt ggcctttagc ttgaggagat tgatgagcgc ggtggcaatg 7200
ccctgcctcc ggtgctcgcc ggagactgcg agatttaaga tatagatctc actacgcggc 7260
tgctcaaact tgggcagaac gtaagccgcg agagcgccaa caaccgcttc ttggtcgaag 7320
gcagcaagcg cgatgaatgt cttactacgg agcaagttcc cgaggtaatc ggagtccggc 7380
tgatgttggg agtaggtggc tacgtcaccg aactcacgac cgaaaagatc aagagcagcc 7440
cgttaggatt tgacttggtc agggccgagc ctattagtgc gaatgatgcc ttaacttgag 7500
ccacctaact ttgttttagg gcgactgccc tgctgcgtaa ttacgttgct gctcttaaat 7560
tacaaacatc gacccacggc gtaacgcgct tgctgcttgg atgcccgagg catagactgt 7620
acaaaaaaac agtcataaca agccatgaaa accgccactg cgccgttacc accgctgcgt 7680
tcggtcaagg ttctggacca gttgcgtgag cgcatttttt tttcctcctc ggcgtttacg 7740
ccccgccctg ccactcatcg cagtactgtt gtaattcatt aagcattctg ccgacatgga 7800
agccatcaca gacggcatga tgaacctgaa tcgccagcgg catcagcacc ttgtcgcctt 7860
gcgtataata tttgcccata gtgaaaacgg gggcgaagaa gttgtccata ttggccacgt 7920
ttaaatcaaa actggtgaaa ctcacccagg gattggcgct gacgaaaaac atattctcaa 7980
taaaccctt 7989
<210> 74
<211> 21
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
Peptide
<220>
<221> MISC_FEATURE
<222> (1)..(3)
<223> This region may or may not be present
<400> 74
Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu
1 5 10 15
Glu Asn Pro Gly Pro
20
<210> 75
<211> 22
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<220>
<221> MISC_FEATURE
<222> (1)..(3)
<223> This region may or may not be present
<400> 75
Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val
1 5 10 15
Glu Glu Asn Pro Gly Pro
20
<210> 76
<211> 23
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<220>
<221> MISC_FEATURE
<222> (1)..(3)
<223> This region may or may not be present
<400> 76
Gly Ser Gly Gln Cys Thr Asn Tyr Ala Leu Leu Lys Leu Ala Gly Asp
1 5 10 15
Val Glu Ser Asn Pro Gly Pro
20
<210> 77
<211> 25
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<220>
<221> MISC_FEATURE
<222> (1)..(3)
<223> This region may or may not be present
<400> 77
Gly Ser Gly Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala
1 5 10 15
Gly Asp Val Glu Ser Asn Pro Gly Pro
20 25
Claims (51)
- 하기를 포함하는, 재조합 아데노-연관 바이러스 벡터 (rAAV) 생산을 위한 플라스미드 시스템:
(i) 5' 및 3' AAV 역위 말단 반복부 (ITR)에 의해 플랭킹된 적어도 하나의 이종 핵산 및 ITR 외부의 스터퍼 서열을 포함하는 트랜스진-함유 플라스미드;
(ii) AAV 복제 (Rep) 및 캡시드 (Cap) 유전자 서열을 포함하는 플라스미드; 및
(iii) 아데노바이러스 (Ad) 헬퍼 플라스미드. - 제1항에 있어서, 스터퍼 서열이 트랜스진-함유 플라스미드 백본의 크기를 증가시켜 트랜스진-함유 플라스미드가 rAAV 캡시드에 패키징되지 않도록 하는 것인 플라스미드 시스템.
- 제1항 또는 제2항에 있어서, 트랜스진-함유 플라스미드의 백본이 야생형 AAV 게놈보다 더 큰 것인 플라스미드 시스템.
- 제1항 내지 제3항 중 어느 한 항에 있어서, 스터퍼 서열에는 인핸서, 프로모터, 스플라이싱 조절인자, 비코딩 RNA, 안티센스 서열, 코딩 서열 또는 이들의 임의의 조합이 없는 것인 플라스미드 시스템.
- 제4항에 있어서, 스터퍼 서열에는 인핸서, 프로모터, 스플라이싱 조절인자, 비코딩 RNA, 안티센스 서열 및 코딩 서열이 없는 것인 플라스미드 시스템.
- 제1항 내지 제5항 중 어느 한 항에 있어서, 스터퍼 서열이 인간 게놈에서 발견되는 불활성 인트론 DNA 서열을 포함하는 것인 플라스미드 시스템.
- 제1항 내지 제6항 중 어느 한 항에 있어서, 스터퍼 서열이 1000 내지 5000개 뉴클레오티드 길이의 핵산 서열 또는 1000 내지 2000개 뉴클레오티드 길이의 핵산 서열을 포함하는 것인 플라스미드 시스템.
- 제1항 내지 제7항 중 어느 한 항에 있어서, 스터퍼 서열이 GAPDH 인트론 2, 단편, 또는 그의 돌연변이체를 포함하는 것인 플라스미드 시스템.
- 제1항 내지 제8항 중 어느 한 항에 있어서, 스터퍼 서열이 서열식별번호: 9와 적어도 약 40%, 약 50%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98% 또는 약 99% 동일성을 갖는 핵산을 포함하는 것인 플라스미드 시스템.
- 제1항 내지 제9항 중 어느 한 항에 있어서, 스터퍼 서열이 서열식별번호: 9와 적어도 약 40%, 약 50%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98% 또는 약 99% 동일성을 갖는 핵산으로 이루어지는 것인 플라스미드 시스템.
- 제1항 내지 제8항 중 어느 한 항에 있어서, 스터퍼 서열이 서열식별번호: 9 또는 그의 단편을 포함하는 것인 플라스미드 시스템.
- 제1항 내지 제8항 중 어느 한 항에 있어서, 스터퍼 서열이 서열식별번호: 9 또는 그의 단편으로 이루어지는 것인 플라스미드 시스템.
- 제1항 내지 제12항 중 어느 한 항에 있어서, 트랜스진-함유 플라스미드가 도 3a와 동일한 순서의 구조를 갖는 플라스미드를 포함하며, 여기서 eGFP 및 SEAP 트랜스진이 적어도 하나의 이종 핵산으로 대체될 수 있는 것인 플라스미드 시스템.
- 제1항 내지 제12항 중 어느 한 항에 있어서, 트랜스진-함유 플라스미드가 도 3b와 동일한 순서의 구조를 갖는 플라스미드를 포함하며, 여기서 eGFP 트랜스진이 적어도 하나의 이종 핵산으로 대체될 수 있는 것인 플라스미드 시스템.
- 제1항 내지 제12항 중 어느 한 항에 있어서, 트랜스진-함유 플라스미드가 5'에서 3' 방향으로 서열식별번호: 2, 4, 적어도 하나의 이종 핵산, 8, 3, 및 스터퍼 서열의 핵산 서열을 포함하며, 여기서 각 핵산 서열이 그의 상응하는 기능적 단편 또는 유도체 또는 그와 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 치환될 수 있거나 또는 그를 코딩하는 것인 플라스미드 시스템.
- 제1항 내지 제15항 중 어느 한 항에 있어서, 트랜스진-함유 플라스미드가 발현 카세트 외부에 그러나 5' ITR과 3' ITR 사이에 DNA 역가 태그를 추가로 포함하는 것인 플라스미드 시스템.
- 제1항 내지 제15항 중 어느 한 항에 있어서, 트랜스진-함유 플라스미드가 i) 3' ITR의 상류 및 폴리A 서열의 하류 또는 ii) 3' ITR의 상류 및 적어도 하나의 이종 핵산의 하류; 또는 iii) 5' ITR의 하류 및 적어도 하나의 이종 핵산 서열의 상류; 또는 iv) 5' ITR의 하류 및 적어도 하나의 이종 핵산 서열에 대한 프로모터의 상류; 또는 v) 5' ITR의 하류 및 3' ITR의 상류에 DNA 역가 태그를 추가로 포함하는 것인 플라스미드 시스템.
- 제1항 내지 제15항 중 어느 한 항에 있어서, 트랜스진-함유 플라스미드가 i) 서열식별번호: 3의 상류 및 서열식별번호: 8의 하류 또는 ii) 서열식별번호: 3의 상류 및 적어도 하나의 이종 핵산 서열의 하류; 또는 iii) 서열식별번호: 2의 하류 및 적어도 하나의 이종 핵산 서열의 상류; 또는 iv) 서열식별번호: 2의 하류 및 서열식별번호: 4의 상류; 또는 v) 서열식별번호: 2의 하류 및 서열식별번호: 3의 상류에 DNA 역가 태그를 추가로 포함하는 것인 플라스미드 시스템.
- 제1항 내지 제12항 중 어느 한 항에 있어서, 트랜스진-함유 플라스미드가 5'에서 3' 방향으로 서열식별번호: 43, 4, 적어도 하나의 이종 핵산 서열, 8, 3, 및 스터퍼 서열의 핵산 서열을 포함하며, 여기서 각 핵산 서열이 그의 상응하는 기능적 단편 또는 유도체 또는 그와 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 치환될 수 있거나 또는 그를 코딩하는 것인 플라스미드 시스템.
- 제19항에 있어서, 트랜스진-함유 플라스미드가 발현 카세트 외부에 그러나 5' ITR과 3' ITR 사이에 DNA 역가 태그를 추가로 포함하는 것인 플라스미드 시스템.
- 제19항 또는 제20항에 있어서, 트랜스진-함유 플라스미드가 i) 3' ITR의 상류 및 폴리A 서열의 하류 또는 ii) 3' ITR의 상류 및 적어도 하나의 이종 핵산 서열의 하류; 또는 iii) 5' ITR의 하류 및 적어도 하나의 이종 핵산 서열의 상류; 또는 iv) 5' ITR의 하류 및 적어도 하나의 이종 핵산 서열에 대한 프로모터의 상류; 또는 v) 5' ITR의 하류 및 3' ITR의 상류에 DNA 역가 태그를 추가로 포함하는 것인 플라스미드 시스템.
- 제19항 또는 제20항에 있어서, 트랜스진-함유 플라스미드가 i) 서열식별번호: 3의 상류 및 서열식별번호: 8의 하류 또는 ii) 서열식별번호: 3의 상류 및 적어도 하나의 이종 핵산 서열의 하류; 또는 iii) 서열식별번호: 43의 하류 및 적어도 하나의 이종 핵산 서열의 상류; 또는 iv) 서열식별번호: 43의 하류 및 서열식별번호: 4의 상류; 또는 v) 서열식별번호: 43의 하류 및 서열식별번호: 3의 상류에 DNA 역가 태그를 추가로 포함하는 것인 플라스미드 시스템.
- 제1항 내지 제22항 중 어느 한 항에 있어서, AAV Rep 유전자 서열이 AAV 혈청형 2, 5, 8, 9, 또는 이들의 하이브리드로부터 유래된 것인 플라스미드 시스템.
- 제1항 내지 제23항 중 어느 한 항에 있어서, AAV Cap 유전자 서열이 AAV 혈청형 2, 5, 8, 9, 또는 이들의 하이브리드로부터 유래된 것인 플라스미드 시스템.
- 제1항 내지 제24항 중 어느 한 항에 있어서, Rep 및 Cap 유전자 서열을 포함하는 플라스미드가 프로모터를 추가로 포함하는 것인 플라스미드 시스템.
- 제25항에 있어서, 프로모터가 AAV 프로모터인 플라스미드 시스템.
- 제26항에 있어서, 프로모터가 AAV P5 프로모터인 플라스미드 시스템.
- 제1항 내지 제27항 중 어느 한 항에 있어서, Ad 헬퍼 플라스미드가 E1a, E1b, E2a, E4orf6, 또는 VA RNA로부터 선택된 하나 이상의 아데노바이러스 유전자를 포함하는 것인 플라스미드 시스템.
- 제28항에 있어서, Ad 헬퍼 플라스미드가 5'에서 3' 방향으로 서열식별번호: 18, 17, 16 및 20의 핵산 서열을 포함하며, 여기서 각 핵산 서열이 그의 상응하는 기능적 단편 또는 유도체 또는 그와 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 치환될 수 있는 것인 플라스미드 시스템.
- 제28항에 있어서, Ad 헬퍼 플라스미드가 5'에서 3' 방향으로 서열식별번호: 21, 16, 39, 40, 22, 23 및 20의 핵산 서열을 포함하며, 여기서 각 핵산 서열이 그의 상응하는 기능적 단편 또는 유도체 또는 그와 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 치환될 수 있거나 또는 그를 코딩하는 것인 플라스미드 시스템.
- 제1항 내지 제28항 중 어느 한 항에 있어서, Ad 헬퍼 플라스미드가 도 5의 어느 하나의 구축물과 동일한 순서의 구조를 포함하는 것인 플라스미드 시스템.
- 제1항 내지 제28항 중 어느 한 항에 있어서, Ad 헬퍼 플라스미드가 서열식별번호: 14와 적어도 약 40%, 약 50%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98% 또는 약 99% 동일성을 갖는 핵산을 포함하는 것인 플라스미드 시스템.
- 제1항 내지 제28항 중 어느 한 항에 있어서, Ad 헬퍼 플라스미드가 서열식별번호: 15와 적어도 약 40%, 약 50%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98% 또는 약 99% 동일성을 갖는 핵산을 포함하는 것인 플라스미드 시스템.
- 제1항 내지 제33항 중 어느 한 항에 있어서, 이종 핵산 서열이 펩티드, 폴리펩티드 또는 단백질을 코딩하는 관심 이종 유전자인 플라스미드 시스템.
- 제34항에 있어서, 펩티드, 폴리펩티드 또는 단백질이 효소, 항체, MHC 분자, T-세포 수용체, B-세포 수용체, 압타머, 아비머, 수용체-결합 리간드, 표적화 펩티드, 치료제, 또는 유전자 편집 분자인 플라스미드 시스템.
- 제1항 내지 제35항 중 어느 한 항에 있어서, 이종 핵산이 핵산 서열, 예컨대 안티센스, siRNA, shRNA, miRNA, EGS, gRNA, sgRNA, 리보자임 또는 압타머인 플라스미드 시스템.
- 제1항 내지 제36항 중 어느 한 항의 플라스미드 시스템을 포함하는 숙주 세포.
- 제37항의 숙주 세포에 의해 생산된 재조합 아데노-연관 바이러스 벡터 (rAAV).
- 트랜스진-함유 플라스미드 내의 이종 핵산 서열의 핵산 서열로부터 상류 또는 하류에 약 60개 뉴클레오티드 내지 약 100개 뉴클레오티드 길이의 핵산 태그 서열을 포함하며, 여기서 핵산 태그 서열은 적어도 2개의 상이한 유형의 AAV 벡터 사이에서 범용 벡터 게놈 역가측정을 허용하기 위해 적어도 2개의 상이한 트랜스진-함유 플라스미드에서 사용될 수 있는 것인, 범용 벡터 역가측정을 허용하는 DNA 역가 태그.
- 제39항에 있어서, 핵산 태그 서열이 약 100개 뉴클레오티드 길이인 DNA 역가 태그.
- 제39항 또는 제40항에 있어서, 핵산 태그 서열이 트랜스진-함유 플라스미드의 3' ITR 서열로부터 상류에 있지만 트랜스진-함유 플라스미드의 발현 카세트 내에 없는 것인 DNA 역가 태그.
- 제39항 또는 제40항에 있어서, 핵산 태그 서열이 트랜스진-함유 플라스미드의 5' ITR 서열로부터 하류에 있지만 트랜스진-함유 플라스미드의 발현 카세트 내에 없는 것인 DNA 역가 태그.
- 제39항 내지 제42항 중 어느 한 항에 있어서, DNA 역가 태그가 서열식별번호: 61-70의 핵산 서열 중 어느 하나를 포함하는 것인 DNA 역가 태그.
- 재조합 아데노-연관 바이러스 벡터 (rAAV)를 생산하는 방법으로서, 제1항 내지 제36항 중 어느 한 항의 플라스미드 시스템으로 세포를 형질도입하고, rAAV를 단리하는 것을 포함하는 방법.
- 제44항의 방법에 의해 생산된 재조합 아데노-연관 바이러스 벡터 (rAAV).
- 제1항 내지 제36항 중 어느 한 항의 플라스미드 시스템을 포함하는 조성물.
- 제38항 또는 제45항의 rAAV를 포함하는 제약 조성물.
- 제38항 또는 제45항의 rAAV를 대상체에게 투여하며, 그에 의해 핵산 서열을 세포로 전달하는 것을 포함하는, 핵산 서열을 대상체의 세포로 전달하거나 또는 전이시키는 방법.
- 제48항에 있어서, 대상체의 세포가 배양 중이거나 또는 대상체에 존재하는 것인 방법.
- 제38항 또는 제45항에 따른 rAAV를 질환 또는 장애의 치료 또는 예방을 필요로 하는 대상체에게 투여하는 것을 포함하는, 대상체에서 질환 또는 장애를 치료하거나 또는 예방하는 방법.
- 제38항 또는 제45항에 따른 rAAV와 숙주 세포를 접촉시키는 것을 포함하는, 숙주 세포를 형질도입하는 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862750603P | 2018-10-25 | 2018-10-25 | |
US62/750,603 | 2018-10-25 | ||
PCT/US2019/057916 WO2020086881A1 (en) | 2018-10-25 | 2019-10-24 | Aav triple-plasmid system |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20210086645A true KR20210086645A (ko) | 2021-07-08 |
Family
ID=70331899
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020217014276A KR20210086645A (ko) | 2018-10-25 | 2019-10-24 | Aav 삼중-플라스미드 시스템 |
Country Status (10)
Country | Link |
---|---|
US (1) | US20210275614A1 (ko) |
EP (1) | EP3870148A4 (ko) |
JP (1) | JP2022511348A (ko) |
KR (1) | KR20210086645A (ko) |
CN (1) | CN112888426A (ko) |
AU (1) | AU2019363593A1 (ko) |
CA (1) | CA3112883A1 (ko) |
IL (1) | IL281909A (ko) |
TW (1) | TW202029957A (ko) |
WO (1) | WO2020086881A1 (ko) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11926842B2 (en) * | 2021-02-02 | 2024-03-12 | University Of Massachusetts | Use of inverted terminal repeats (ITRS) from adeno-associated virus serotypes 8 and RH.39 in gene therapy vectors |
CA3217226A1 (en) * | 2021-04-21 | 2022-10-27 | Asimov Inc. | Stable production systems for adeno-associated virus production |
JP2024519175A (ja) * | 2021-05-27 | 2024-05-08 | ニューラクル ジェネティクス インコーポレイテッド | 新規なデュアルヘルパープラスミド |
CN114196705A (zh) * | 2021-12-07 | 2022-03-18 | 中国科学院深圳先进技术研究院 | 一种重组腺相关病毒包装质粒、重组腺相关病毒及其应用 |
WO2023102736A1 (zh) * | 2021-12-07 | 2023-06-15 | 中国科学院深圳先进技术研究院 | 一种重组腺相关病毒包装质粒、重组腺相关病毒及其应用 |
WO2023220502A1 (en) * | 2022-05-12 | 2023-11-16 | AAVnerGene Inc. | Compositions and methods for recombinant parvovirus production |
WO2024046403A1 (zh) * | 2022-08-31 | 2024-03-07 | 江苏金斯瑞蓬勃生物科技有限公司 | 能够提高腺相关病毒滴度的腺相关病毒结构质粒 |
CN117660534B (zh) * | 2023-12-13 | 2024-05-07 | 广州派真生物技术有限公司 | 一种降低重组腺相关病毒中宿主细胞dna残留的辅助质粒及应用 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2369985A1 (en) * | 2002-01-18 | 2003-07-18 | Duke University | Generation of recombinant adeno-associated viral vectors by a complete adenovirus-mediated approach |
US9163259B2 (en) * | 2012-05-04 | 2015-10-20 | Novartis Ag | Viral vectors for the treatment of retinal dystrophy |
CA2904156C (en) * | 2013-03-15 | 2023-01-10 | The Children's Hospital Of Philadelphia | Vectors comprising stuffer/filler polynucleotide sequences and methods of use |
US11078464B2 (en) * | 2013-08-30 | 2021-08-03 | Amgen Inc. | High titer recombinant AAV vector production in adherent and suspension cells |
KR102245861B1 (ko) * | 2013-11-29 | 2021-04-28 | 다카라 바이오 가부시키가이샤 | 아데노 수반 바이러스의 정량 방법 |
WO2016074016A1 (en) * | 2014-11-10 | 2016-05-19 | Murdoch Childrens Research Institute | Vectors and methods for targeted integration in loci comprising constitutively expressed genes |
EP3265571B1 (en) * | 2015-03-03 | 2022-04-13 | Fondazione Telethon | Multiple vector system and uses thereof |
WO2016196507A1 (en) * | 2015-05-29 | 2016-12-08 | University Of Iowa Research Foundation | Methods of delivery of transgenes for treating brain diseases |
CN113056561A (zh) * | 2018-04-05 | 2021-06-29 | 牛津大学科技创新有限公司 | 用于治疗黄斑营养不良的组合物和方法 |
-
2019
- 2019-10-24 EP EP19876857.4A patent/EP3870148A4/en active Pending
- 2019-10-24 CN CN201980069110.4A patent/CN112888426A/zh active Pending
- 2019-10-24 WO PCT/US2019/057916 patent/WO2020086881A1/en unknown
- 2019-10-24 AU AU2019363593A patent/AU2019363593A1/en active Pending
- 2019-10-24 CA CA3112883A patent/CA3112883A1/en active Pending
- 2019-10-24 KR KR1020217014276A patent/KR20210086645A/ko active Search and Examination
- 2019-10-24 US US17/288,141 patent/US20210275614A1/en active Pending
- 2019-10-24 JP JP2021516750A patent/JP2022511348A/ja active Pending
- 2019-10-25 TW TW108138732A patent/TW202029957A/zh unknown
-
2021
- 2021-03-30 IL IL281909A patent/IL281909A/en unknown
Also Published As
Publication number | Publication date |
---|---|
WO2020086881A1 (en) | 2020-04-30 |
US20210275614A1 (en) | 2021-09-09 |
AU2019363593A1 (en) | 2021-04-29 |
TW202029957A (zh) | 2020-08-16 |
JP2022511348A (ja) | 2022-01-31 |
EP3870148A1 (en) | 2021-09-01 |
IL281909A (en) | 2021-05-31 |
EP3870148A4 (en) | 2022-11-09 |
CN112888426A (zh) | 2021-06-01 |
CA3112883A1 (en) | 2020-04-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2020260491B2 (en) | Gene therapies for lysosomal disorders | |
AU2020205228B2 (en) | Gene therapies for lysosomal disorders | |
KR20210086645A (ko) | Aav 삼중-플라스미드 시스템 | |
AU2020260476B2 (en) | Gene therapies for lysosomal disorders | |
US6156567A (en) | Truncated transcriptionally active cytomegalovirus promoters | |
US6090393A (en) | Recombinant canine adenoviruses, method for making and uses thereof | |
KR102446169B1 (ko) | 리소좀 저장 장애의 치료를 위한 아데노연관 바이러스 벡터 | |
KR20230091894A (ko) | 부위 특이적 표적화 요소를 통한 프로그램 가능한 첨가(paste)를 사용하는 부위 특이적 유전 공학을 위한 시스템, 방법, 및 조성물 | |
CN113005123A (zh) | 用于神经变性疾病的基因疗法 | |
KR20220006527A (ko) | 리소좀 장애에 대한 유전자 요법 | |
BRPI0708344A2 (pt) | vetores adenovirais quiméricos | |
KR20180069081A (ko) | 심장 이상 및 기타 병리 이상의 치료를 위한 복수의 생물학적으로 활성화된 폴리펩티드를 단일 벡터로부터 발현하기 위한 조성물 및 방법 | |
US20030157688A1 (en) | Adenovirus vectors, packaging cell lines, compositions, and methods for preparation and use | |
KR20210150486A (ko) | 리소좀 장애에 대한 유전자 요법 | |
CA2359795A1 (en) | Adenovirus vectors, packaging cell lines, compositions, and methods for preparation and use | |
KR20080030956A (ko) | 개선된 조절 발현 체계를 사용한 질병의 치료 | |
KR20220161297A (ko) | 신규 세포주 | |
KR20230051529A (ko) | 리소좀 장애에 대한 유전자 요법 | |
KR20230066360A (ko) | 신경퇴행성 장애를 위한 유전자 요법 | |
KR20220112283A (ko) | Hunter 질환 치료용 아데노-연합된 바이러스 벡터 | |
KR101153845B1 (ko) | Kras G12V RNA를 특이적으로 인지할 수 있는 트랜스-스플라이싱 그룹 I 리보자임 | |
KR20150021839A (ko) | 암특이적 유전자를 표적하는 트랜스-스플라이싱 라이보자임의 조절 유도체를 포함하는 재조합 아데노바이러스 및 이의 용도 | |
KR20210150487A (ko) | 리소좀 장애를 위한 유전자 요법 | |
KR20240036508A (ko) | 아데노바이러스성 헬퍼 플라스미드 | |
CN117480257A (zh) | 用于高水平rAAV生产的系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination |