KR20230066615A - 폐쇄형 dna 벡터 및 페닐알라닌 히드록실라아제(pah) 발현을 위한 이의 용도 - Google Patents
폐쇄형 dna 벡터 및 페닐알라닌 히드록실라아제(pah) 발현을 위한 이의 용도 Download PDFInfo
- Publication number
- KR20230066615A KR20230066615A KR1020237012572A KR20237012572A KR20230066615A KR 20230066615 A KR20230066615 A KR 20230066615A KR 1020237012572 A KR1020237012572 A KR 1020237012572A KR 20237012572 A KR20237012572 A KR 20237012572A KR 20230066615 A KR20230066615 A KR 20230066615A
- Authority
- KR
- South Korea
- Prior art keywords
- seq
- nucleic acid
- itr
- cedna vector
- acid sequence
- Prior art date
Links
- 239000013598 vector Substances 0.000 title claims abstract description 579
- 102100038223 Phenylalanine-4-hydroxylase Human genes 0.000 title claims abstract description 458
- 108010069013 Phenylalanine Hydroxylase Proteins 0.000 title claims description 450
- 230000014509 gene expression Effects 0.000 title abstract description 287
- 150000007523 nucleic acids Chemical group 0.000 claims abstract description 363
- 108091028043 Nucleic acid sequence Proteins 0.000 claims abstract description 241
- 238000000034 method Methods 0.000 claims abstract description 129
- 239000000203 mixture Substances 0.000 claims abstract description 97
- 201000011252 Phenylketonuria Diseases 0.000 claims abstract description 59
- 238000001727 in vivo Methods 0.000 claims abstract description 26
- 238000000338 in vitro Methods 0.000 claims abstract description 14
- 102100021244 Integral membrane protein GPR180 Human genes 0.000 claims abstract 10
- 210000004027 cell Anatomy 0.000 claims description 194
- 108090000623 proteins and genes Proteins 0.000 claims description 188
- 150000002632 lipids Chemical class 0.000 claims description 147
- 102000004169 proteins and genes Human genes 0.000 claims description 132
- 125000003729 nucleotide group Chemical group 0.000 claims description 105
- 239000002773 nucleotide Substances 0.000 claims description 102
- 108020004414 DNA Proteins 0.000 claims description 101
- 239000003623 enhancer Substances 0.000 claims description 85
- 239000002105 nanoparticle Substances 0.000 claims description 69
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 claims description 66
- 238000012217 deletion Methods 0.000 claims description 58
- 230000037430 deletion Effects 0.000 claims description 58
- 108010071690 Prealbumin Proteins 0.000 claims description 51
- 102000009190 Transthyretin Human genes 0.000 claims description 48
- 230000027455 binding Effects 0.000 claims description 44
- 101000823116 Homo sapiens Alpha-1-antitrypsin Proteins 0.000 claims description 42
- 102000051631 human SERPINA1 Human genes 0.000 claims description 42
- 210000004185 liver Anatomy 0.000 claims description 42
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 claims description 39
- 230000000694 effects Effects 0.000 claims description 35
- 230000003612 virological effect Effects 0.000 claims description 34
- 238000006467 substitution reaction Methods 0.000 claims description 33
- 238000003780 insertion Methods 0.000 claims description 31
- 230000037431 insertion Effects 0.000 claims description 31
- 241000125945 Protoparvovirus Species 0.000 claims description 24
- 238000002347 injection Methods 0.000 claims description 24
- 239000007924 injection Substances 0.000 claims description 24
- 238000003776 cleavage reaction Methods 0.000 claims description 21
- 230000007017 scission Effects 0.000 claims description 21
- 241001634120 Adeno-associated virus - 5 Species 0.000 claims description 17
- 241000972680 Adeno-associated virus - 6 Species 0.000 claims description 16
- 241000700605 Viruses Species 0.000 claims description 16
- 241001655883 Adeno-associated virus - 1 Species 0.000 claims description 15
- 241000702421 Dependoparvovirus Species 0.000 claims description 15
- 241000702623 Minute virus of mice Species 0.000 claims description 15
- 239000008194 pharmaceutical composition Substances 0.000 claims description 15
- 241000580270 Adeno-associated virus - 4 Species 0.000 claims description 13
- 241001164825 Adeno-associated virus - 8 Species 0.000 claims description 13
- 210000002966 serum Anatomy 0.000 claims description 12
- 241001164823 Adeno-associated virus - 7 Species 0.000 claims description 11
- 241000649045 Adeno-associated virus 10 Species 0.000 claims description 11
- 241000649046 Adeno-associated virus 11 Species 0.000 claims description 11
- 241000649047 Adeno-associated virus 12 Species 0.000 claims description 11
- 108020005345 3' Untranslated Regions Proteins 0.000 claims description 9
- 241000202702 Adeno-associated virus - 3 Species 0.000 claims description 9
- 108091092195 Intron Proteins 0.000 claims description 9
- 102000008847 Serpin Human genes 0.000 claims description 8
- 108050000761 Serpin Proteins 0.000 claims description 8
- 239000002299 complementary DNA Substances 0.000 claims description 8
- 239000003001 serine protease inhibitor Substances 0.000 claims description 8
- 238000007792 addition Methods 0.000 claims description 7
- QEVHRUUCFGRFIF-UHFFFAOYSA-N 6,18-dimethoxy-17-[oxo-(3,4,5-trimethoxyphenyl)methoxy]-1,3,11,12,14,15,16,17,18,19,20,21-dodecahydroyohimban-19-carboxylic acid methyl ester Chemical compound C1C2CN3CCC(C4=CC=C(OC)C=C4N4)=C4C3CC2C(C(=O)OC)C(OC)C1OC(=O)C1=CC(OC)=C(OC)C(OC)=C1 QEVHRUUCFGRFIF-UHFFFAOYSA-N 0.000 claims description 6
- 101100533283 Dictyostelium discoideum serp gene Proteins 0.000 claims description 6
- 230000009467 reduction Effects 0.000 claims description 5
- 108091036066 Three prime untranslated region Proteins 0.000 claims description 2
- 239000000790 retinal pigment Substances 0.000 claims description 2
- 241000702423 Adeno-associated virus - 2 Species 0.000 claims 2
- 210000000608 photoreceptor cell Anatomy 0.000 claims 1
- 108700019146 Transgenes Proteins 0.000 abstract description 81
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 abstract description 76
- 238000011282 treatment Methods 0.000 abstract description 47
- 201000010099 disease Diseases 0.000 abstract description 46
- 238000012384 transportation and delivery Methods 0.000 abstract description 43
- 101710125939 Phenylalanine-4-hydroxylase Proteins 0.000 abstract description 15
- 235000018102 proteins Nutrition 0.000 description 124
- 102000039446 nucleic acids Human genes 0.000 description 103
- 108020004707 nucleic acids Proteins 0.000 description 103
- 230000001225 therapeutic effect Effects 0.000 description 72
- 210000003205 muscle Anatomy 0.000 description 64
- 230000001105 regulatory effect Effects 0.000 description 63
- 230000000295 complement effect Effects 0.000 description 44
- 108090000765 processed proteins & peptides Proteins 0.000 description 41
- 238000012986 modification Methods 0.000 description 40
- 230000004048 modification Effects 0.000 description 39
- 108091030071 RNAI Proteins 0.000 description 38
- 238000009472 formulation Methods 0.000 description 38
- 230000009368 gene silencing by RNA Effects 0.000 description 38
- 239000013612 plasmid Substances 0.000 description 36
- 102000004196 processed proteins & peptides Human genes 0.000 description 36
- 210000001519 tissue Anatomy 0.000 description 35
- 229920001184 polypeptide Polymers 0.000 description 34
- 208000035475 disorder Diseases 0.000 description 30
- 239000003814 drug Substances 0.000 description 30
- 239000002502 liposome Substances 0.000 description 30
- 238000004519 manufacturing process Methods 0.000 description 30
- 241000282414 Homo sapiens Species 0.000 description 29
- 239000012634 fragment Substances 0.000 description 29
- 150000001875 compounds Chemical class 0.000 description 28
- 230000002441 reversible effect Effects 0.000 description 28
- 239000004055 small Interfering RNA Substances 0.000 description 27
- 108020004705 Codon Proteins 0.000 description 25
- 102000040430 polynucleotide Human genes 0.000 description 25
- 108091033319 polynucleotide Proteins 0.000 description 25
- 229920001223 polyethylene glycol Polymers 0.000 description 24
- 239000002157 polynucleotide Substances 0.000 description 24
- 239000003795 chemical substances by application Substances 0.000 description 23
- 239000002202 Polyethylene glycol Substances 0.000 description 22
- 238000012937 correction Methods 0.000 description 22
- 230000000875 corresponding effect Effects 0.000 description 22
- 230000035772 mutation Effects 0.000 description 22
- 108020004459 Small interfering RNA Proteins 0.000 description 21
- 230000006870 function Effects 0.000 description 21
- 241001465754 Metazoa Species 0.000 description 20
- -1 minigene Proteins 0.000 description 20
- 239000013607 AAV vector Substances 0.000 description 19
- 241000699670 Mus sp. Species 0.000 description 19
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 18
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 18
- 239000002245 particle Substances 0.000 description 18
- 238000013518 transcription Methods 0.000 description 18
- 230000035897 transcription Effects 0.000 description 18
- 230000000670 limiting effect Effects 0.000 description 17
- 108700026244 Open Reading Frames Proteins 0.000 description 16
- 230000034994 death Effects 0.000 description 16
- 238000001415 gene therapy Methods 0.000 description 16
- 210000002027 skeletal muscle Anatomy 0.000 description 16
- 238000011144 upstream manufacturing Methods 0.000 description 16
- 125000002091 cationic group Chemical group 0.000 description 15
- 230000008520 organization Effects 0.000 description 15
- 125000006850 spacer group Chemical group 0.000 description 15
- 108700011259 MicroRNAs Proteins 0.000 description 14
- 150000001413 amino acids Chemical class 0.000 description 14
- 208000024891 symptom Diseases 0.000 description 14
- 108091034117 Oligonucleotide Proteins 0.000 description 13
- 235000001014 amino acid Nutrition 0.000 description 13
- 229940079593 drug Drugs 0.000 description 13
- 230000002452 interceptive effect Effects 0.000 description 13
- 238000001990 intravenous administration Methods 0.000 description 13
- WTJKGGKOPKCXLL-RRHRGVEJSA-N phosphatidylcholine Chemical group CCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCCCCCCC=CCCCCCCCC WTJKGGKOPKCXLL-RRHRGVEJSA-N 0.000 description 13
- 230000000692 anti-sense effect Effects 0.000 description 12
- 210000000234 capsid Anatomy 0.000 description 12
- 230000008569 process Effects 0.000 description 12
- 108020003589 5' Untranslated Regions Proteins 0.000 description 11
- 241000649044 Adeno-associated virus 9 Species 0.000 description 11
- 241000238631 Hexapoda Species 0.000 description 11
- 108091027967 Small hairpin RNA Proteins 0.000 description 11
- 101150044878 US18 gene Proteins 0.000 description 11
- 230000008901 benefit Effects 0.000 description 11
- 238000005516 engineering process Methods 0.000 description 11
- 230000001124 posttranscriptional effect Effects 0.000 description 11
- 230000010076 replication Effects 0.000 description 11
- 241000701447 unidentified baculovirus Species 0.000 description 11
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 10
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 10
- 108091062157 Cis-regulatory element Proteins 0.000 description 10
- 102000040945 Transcription factor Human genes 0.000 description 10
- 108091023040 Transcription factor Proteins 0.000 description 10
- 239000008186 active pharmaceutical agent Substances 0.000 description 10
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 10
- 239000002679 microRNA Substances 0.000 description 10
- 230000002103 transcriptional effect Effects 0.000 description 10
- 230000014616 translation Effects 0.000 description 10
- 108091026890 Coding region Proteins 0.000 description 9
- 102000004190 Enzymes Human genes 0.000 description 9
- 108090000790 Enzymes Proteins 0.000 description 9
- 210000004100 adrenal gland Anatomy 0.000 description 9
- 235000012000 cholesterol Nutrition 0.000 description 9
- 239000003937 drug carrier Substances 0.000 description 9
- 210000001808 exosome Anatomy 0.000 description 9
- 239000013604 expression vector Substances 0.000 description 9
- 210000002216 heart Anatomy 0.000 description 9
- 230000001939 inductive effect Effects 0.000 description 9
- 210000003734 kidney Anatomy 0.000 description 9
- 210000000056 organ Anatomy 0.000 description 9
- 230000008488 polyadenylation Effects 0.000 description 9
- 229920000642 polymer Polymers 0.000 description 9
- 239000000047 product Substances 0.000 description 9
- 108091008146 restriction endonucleases Proteins 0.000 description 9
- 230000028327 secretion Effects 0.000 description 9
- 229940124597 therapeutic agent Drugs 0.000 description 9
- 238000012546 transfer Methods 0.000 description 9
- 241000283690 Bos taurus Species 0.000 description 8
- 108010035563 Chloramphenicol O-acetyltransferase Proteins 0.000 description 8
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 8
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 8
- 108020005004 Guide RNA Proteins 0.000 description 8
- 108020004440 Thymidine kinase Proteins 0.000 description 8
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 8
- 238000002869 basic local alignment search tool Methods 0.000 description 8
- 230000001276 controlling effect Effects 0.000 description 8
- 230000002950 deficient Effects 0.000 description 8
- 230000007613 environmental effect Effects 0.000 description 8
- 210000003414 extremity Anatomy 0.000 description 8
- 108020001507 fusion proteins Proteins 0.000 description 8
- 102000037865 fusion proteins Human genes 0.000 description 8
- 239000000499 gel Substances 0.000 description 8
- 230000002068 genetic effect Effects 0.000 description 8
- 239000005090 green fluorescent protein Substances 0.000 description 8
- 230000028993 immune response Effects 0.000 description 8
- 239000003446 ligand Substances 0.000 description 8
- 210000004072 lung Anatomy 0.000 description 8
- 239000012528 membrane Substances 0.000 description 8
- 210000004379 membrane Anatomy 0.000 description 8
- 108020004999 messenger RNA Proteins 0.000 description 8
- 239000000758 substrate Substances 0.000 description 8
- 230000004083 survival effect Effects 0.000 description 8
- 102000013918 Apolipoproteins E Human genes 0.000 description 7
- 108010025628 Apolipoproteins E Proteins 0.000 description 7
- 102000053602 DNA Human genes 0.000 description 7
- 241000283073 Equus caballus Species 0.000 description 7
- 108060001084 Luciferase Proteins 0.000 description 7
- 239000005089 Luciferase Substances 0.000 description 7
- 241000124008 Mammalia Species 0.000 description 7
- 241000701945 Parvoviridae Species 0.000 description 7
- 102000006601 Thymidine Kinase Human genes 0.000 description 7
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 7
- 210000000170 cell membrane Anatomy 0.000 description 7
- 239000003153 chemical reaction reagent Substances 0.000 description 7
- 239000012636 effector Substances 0.000 description 7
- 230000003834 intracellular effect Effects 0.000 description 7
- 230000007246 mechanism Effects 0.000 description 7
- 230000001404 mediated effect Effects 0.000 description 7
- 101150036331 pah gene Proteins 0.000 description 7
- 239000013603 viral vector Substances 0.000 description 7
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 6
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 6
- 108020000948 Antisense Oligonucleotides Proteins 0.000 description 6
- 241000271566 Aves Species 0.000 description 6
- 102100026189 Beta-galactosidase Human genes 0.000 description 6
- 241000282412 Homo Species 0.000 description 6
- 239000000232 Lipid Bilayer Substances 0.000 description 6
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 6
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 6
- 239000000074 antisense oligonucleotide Substances 0.000 description 6
- 108010005774 beta-Galactosidase Proteins 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 235000005911 diet Nutrition 0.000 description 6
- 210000000232 gallbladder Anatomy 0.000 description 6
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 6
- 239000010931 gold Substances 0.000 description 6
- 229910052737 gold Inorganic materials 0.000 description 6
- 230000003993 interaction Effects 0.000 description 6
- 210000000936 intestine Anatomy 0.000 description 6
- 238000007918 intramuscular administration Methods 0.000 description 6
- 230000007935 neutral effect Effects 0.000 description 6
- 150000003904 phospholipids Chemical class 0.000 description 6
- 210000002307 prostate Anatomy 0.000 description 6
- 210000002784 stomach Anatomy 0.000 description 6
- 239000012096 transfection reagent Substances 0.000 description 6
- BIABMEZBCHDPBV-MPQUPPDSSA-N 1,2-palmitoyl-sn-glycero-3-phospho-(1'-sn-glycerol) Chemical compound CCCCCCCCCCCCCCCC(=O)OC[C@H](COP(O)(=O)OC[C@@H](O)CO)OC(=O)CCCCCCCCCCCCCCC BIABMEZBCHDPBV-MPQUPPDSSA-N 0.000 description 5
- 241000699666 Mus <mouse, genus> Species 0.000 description 5
- 206010028980 Neoplasm Diseases 0.000 description 5
- 101710163270 Nuclease Proteins 0.000 description 5
- 241000288906 Primates Species 0.000 description 5
- 108010076504 Protein Sorting Signals Proteins 0.000 description 5
- 108091081021 Sense strand Proteins 0.000 description 5
- 229930182558 Sterol Natural products 0.000 description 5
- 108020005202 Viral DNA Proteins 0.000 description 5
- NRLNQCOGCKAESA-KWXKLSQISA-N [(6z,9z,28z,31z)-heptatriaconta-6,9,28,31-tetraen-19-yl] 4-(dimethylamino)butanoate Chemical compound CCCCC\C=C/C\C=C/CCCCCCCCC(OC(=O)CCCN(C)C)CCCCCCCC\C=C/C\C=C/CCCCC NRLNQCOGCKAESA-KWXKLSQISA-N 0.000 description 5
- 238000012230 antisense oligonucleotides Methods 0.000 description 5
- 238000003556 assay Methods 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 5
- OVBPIULPVIDEAO-LBPRGKRZSA-N folic acid Chemical compound C=1N=C2NC(N)=NC(=O)C2=NC=1CNC1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 OVBPIULPVIDEAO-LBPRGKRZSA-N 0.000 description 5
- 210000002683 foot Anatomy 0.000 description 5
- 239000003018 immunosuppressive agent Substances 0.000 description 5
- 208000015181 infectious disease Diseases 0.000 description 5
- 230000002401 inhibitory effect Effects 0.000 description 5
- 230000000977 initiatory effect Effects 0.000 description 5
- 238000001361 intraarterial administration Methods 0.000 description 5
- 210000001161 mammalian embryo Anatomy 0.000 description 5
- 239000000463 material Substances 0.000 description 5
- 125000000956 methoxy group Chemical group [H]C([H])([H])O* 0.000 description 5
- 229920000765 poly(2-oxazolines) Polymers 0.000 description 5
- 150000003384 small molecules Chemical class 0.000 description 5
- 239000000243 solution Substances 0.000 description 5
- 150000003432 sterols Chemical class 0.000 description 5
- 235000003702 sterols Nutrition 0.000 description 5
- 239000000126 substance Substances 0.000 description 5
- 230000008685 targeting Effects 0.000 description 5
- 239000003053 toxin Substances 0.000 description 5
- 231100000765 toxin Toxicity 0.000 description 5
- 108700012359 toxins Proteins 0.000 description 5
- 238000010361 transduction Methods 0.000 description 5
- 230000026683 transduction Effects 0.000 description 5
- 238000013519 translation Methods 0.000 description 5
- 210000002845 virion Anatomy 0.000 description 5
- SNKAWJBJQDLSFF-NVKMUCNASA-N 1,2-dioleoyl-sn-glycero-3-phosphocholine Chemical compound CCCCCCCC\C=C/CCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCCCCCC\C=C/CCCCCCCC SNKAWJBJQDLSFF-NVKMUCNASA-N 0.000 description 4
- NRJAVPSFFCBXDT-HUESYALOSA-N 1,2-distearoyl-sn-glycero-3-phosphocholine Chemical compound CCCCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCCCCCCCCCCCCCCCC NRJAVPSFFCBXDT-HUESYALOSA-N 0.000 description 4
- HZAXFHJVJLSVMW-UHFFFAOYSA-N 2-Aminoethan-1-ol Chemical group NCCO HZAXFHJVJLSVMW-UHFFFAOYSA-N 0.000 description 4
- 229930024421 Adenine Natural products 0.000 description 4
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 4
- 241000282465 Canis Species 0.000 description 4
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 4
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 4
- 108090000204 Dipeptidase 1 Proteins 0.000 description 4
- 108091029865 Exogenous DNA Proteins 0.000 description 4
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 4
- 101000604901 Homo sapiens Phenylalanine-4-hydroxylase Proteins 0.000 description 4
- 206010021143 Hypoxia Diseases 0.000 description 4
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 4
- 108020004566 Transfer RNA Proteins 0.000 description 4
- 230000005856 abnormality Effects 0.000 description 4
- 229960000643 adenine Drugs 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 4
- 102000006635 beta-lactamase Human genes 0.000 description 4
- 244000309466 calf Species 0.000 description 4
- 229920006317 cationic polymer Polymers 0.000 description 4
- 230000001413 cellular effect Effects 0.000 description 4
- 238000010367 cloning Methods 0.000 description 4
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 4
- 238000002716 delivery method Methods 0.000 description 4
- 210000000188 diaphragm Anatomy 0.000 description 4
- 238000004520 electroporation Methods 0.000 description 4
- 230000008030 elimination Effects 0.000 description 4
- 238000003379 elimination reaction Methods 0.000 description 4
- 210000001508 eye Anatomy 0.000 description 4
- 210000003811 finger Anatomy 0.000 description 4
- 102000034287 fluorescent proteins Human genes 0.000 description 4
- 108091006047 fluorescent proteins Proteins 0.000 description 4
- 238000010353 genetic engineering Methods 0.000 description 4
- 238000003306 harvesting Methods 0.000 description 4
- 229940125721 immunosuppressive agent Drugs 0.000 description 4
- 238000007912 intraperitoneal administration Methods 0.000 description 4
- 238000007913 intrathecal administration Methods 0.000 description 4
- 230000011987 methylation Effects 0.000 description 4
- 238000007069 methylation reaction Methods 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 238000004806 packaging method and process Methods 0.000 description 4
- 230000010412 perfusion Effects 0.000 description 4
- 230000000144 pharmacologic effect Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000000069 prophylactic effect Effects 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 210000003491 skin Anatomy 0.000 description 4
- 238000007920 subcutaneous administration Methods 0.000 description 4
- 238000002560 therapeutic procedure Methods 0.000 description 4
- 229940104230 thymidine Drugs 0.000 description 4
- 230000000699 topical effect Effects 0.000 description 4
- 238000001890 transfection Methods 0.000 description 4
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 4
- 229940035893 uracil Drugs 0.000 description 4
- 239000003981 vehicle Substances 0.000 description 4
- SDEURMLKLAEUAY-JFSPZUDSSA-N (2-{[(2r)-2,3-bis[(13z)-docos-13-enoyloxy]propyl phosphonato]oxy}ethyl)trimethylazanium Chemical compound CCCCCCCC\C=C/CCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCCCCCCCCCC\C=C/CCCCCCCC SDEURMLKLAEUAY-JFSPZUDSSA-N 0.000 description 3
- 108020005544 Antisense RNA Proteins 0.000 description 3
- 108020000946 Bacterial DNA Proteins 0.000 description 3
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 3
- 241000701922 Bovine parvovirus Species 0.000 description 3
- 101100126625 Caenorhabditis elegans itr-1 gene Proteins 0.000 description 3
- 241000701931 Canine parvovirus Species 0.000 description 3
- 241000282472 Canis lupus familiaris Species 0.000 description 3
- 108090000565 Capsid Proteins Proteins 0.000 description 3
- 102000053642 Catalytic RNA Human genes 0.000 description 3
- 108090000994 Catalytic RNA Proteins 0.000 description 3
- 102100023321 Ceruloplasmin Human genes 0.000 description 3
- 108010042407 Endonucleases Proteins 0.000 description 3
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 description 3
- 241000829100 Macaca mulatta polyomavirus 1 Species 0.000 description 3
- 108091081548 Palindromic sequence Proteins 0.000 description 3
- 108091093037 Peptide nucleic acid Proteins 0.000 description 3
- 241000702619 Porcine parvovirus Species 0.000 description 3
- 108020000999 Viral RNA Proteins 0.000 description 3
- 108091093126 WHP Posttrascriptional Response Element Proteins 0.000 description 3
- 230000009471 action Effects 0.000 description 3
- 230000003213 activating effect Effects 0.000 description 3
- 230000003321 amplification Effects 0.000 description 3
- 238000010171 animal model Methods 0.000 description 3
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 3
- 239000000872 buffer Substances 0.000 description 3
- 210000004899 c-terminal region Anatomy 0.000 description 3
- 239000000969 carrier Substances 0.000 description 3
- 230000030833 cell death Effects 0.000 description 3
- 230000004700 cellular uptake Effects 0.000 description 3
- 239000003184 complementary RNA Substances 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 238000003745 diagnosis Methods 0.000 description 3
- 230000037213 diet Effects 0.000 description 3
- 230000000378 dietary effect Effects 0.000 description 3
- 239000003085 diluting agent Substances 0.000 description 3
- 239000000539 dimer Substances 0.000 description 3
- 230000002255 enzymatic effect Effects 0.000 description 3
- 235000019152 folic acid Nutrition 0.000 description 3
- 239000011724 folic acid Substances 0.000 description 3
- 230000004927 fusion Effects 0.000 description 3
- 230000000799 fusogenic effect Effects 0.000 description 3
- 210000003128 head Anatomy 0.000 description 3
- 230000007954 hypoxia Effects 0.000 description 3
- 230000005847 immunogenicity Effects 0.000 description 3
- 230000003308 immunostimulating effect Effects 0.000 description 3
- 230000001965 increasing effect Effects 0.000 description 3
- 238000001802 infusion Methods 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 210000002414 leg Anatomy 0.000 description 3
- 238000001638 lipofection Methods 0.000 description 3
- 244000144972 livestock Species 0.000 description 3
- 230000004060 metabolic process Effects 0.000 description 3
- 238000000520 microinjection Methods 0.000 description 3
- 210000004165 myocardium Anatomy 0.000 description 3
- 239000002088 nanocapsule Substances 0.000 description 3
- 238000003199 nucleic acid amplification method Methods 0.000 description 3
- 210000004940 nucleus Anatomy 0.000 description 3
- 230000036961 partial effect Effects 0.000 description 3
- 210000002976 pectoralis muscle Anatomy 0.000 description 3
- 230000002688 persistence Effects 0.000 description 3
- 238000011170 pharmaceutical development Methods 0.000 description 3
- 108091008695 photoreceptors Proteins 0.000 description 3
- 230000002265 prevention Effects 0.000 description 3
- 102000005962 receptors Human genes 0.000 description 3
- 108020003175 receptors Proteins 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 210000001525 retina Anatomy 0.000 description 3
- 108091092562 ribozyme Proteins 0.000 description 3
- 230000003248 secreting effect Effects 0.000 description 3
- 241000894007 species Species 0.000 description 3
- 230000006641 stabilisation Effects 0.000 description 3
- 238000011105 stabilization Methods 0.000 description 3
- 230000009885 systemic effect Effects 0.000 description 3
- 231100000331 toxic Toxicity 0.000 description 3
- 230000002588 toxic effect Effects 0.000 description 3
- 108091008023 transcriptional regulators Proteins 0.000 description 3
- 238000002604 ultrasonography Methods 0.000 description 3
- 210000004291 uterus Anatomy 0.000 description 3
- WTBFLCSPLLEDEM-JIDRGYQWSA-N 1,2-dioleoyl-sn-glycero-3-phospho-L-serine Chemical compound CCCCCCCC\C=C/CCCCCCCC(=O)OC[C@H](COP(O)(=O)OC[C@H](N)C(O)=O)OC(=O)CCCCCCC\C=C/CCCCCCCC WTBFLCSPLLEDEM-JIDRGYQWSA-N 0.000 description 2
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 2
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 2
- 241000300529 Adeno-associated virus 13 Species 0.000 description 2
- 108091023037 Aptamer Proteins 0.000 description 2
- 241000282421 Canidae Species 0.000 description 2
- 241000283707 Capra Species 0.000 description 2
- 108010051109 Cell-Penetrating Peptides Proteins 0.000 description 2
- 102000020313 Cell-Penetrating Peptides Human genes 0.000 description 2
- 108091033380 Coding strand Proteins 0.000 description 2
- 206010010356 Congenital anomaly Diseases 0.000 description 2
- 230000004568 DNA-binding Effects 0.000 description 2
- 241000238557 Decapoda Species 0.000 description 2
- RTZKZFJDLAIYFH-UHFFFAOYSA-N Diethyl ether Chemical compound CCOCC RTZKZFJDLAIYFH-UHFFFAOYSA-N 0.000 description 2
- 206010013801 Duchenne Muscular Dystrophy Diseases 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 2
- 102100031780 Endonuclease Human genes 0.000 description 2
- 241000282326 Felis catus Species 0.000 description 2
- 239000004471 Glycine Substances 0.000 description 2
- 241001517118 Goose parvovirus Species 0.000 description 2
- 101000771674 Homo sapiens Apolipoprotein E Proteins 0.000 description 2
- 208000026350 Inborn Genetic disease Diseases 0.000 description 2
- 241000713666 Lentivirus Species 0.000 description 2
- 102100024640 Low-density lipoprotein receptor Human genes 0.000 description 2
- 241000489861 Maximus Species 0.000 description 2
- 229920002505 N-(Carbonyl-Methoxypolyethylene Glycol 2000)-1,2-Distearoyl-Sn-Glycero-3-Phosphoethanolamine Polymers 0.000 description 2
- OVBPIULPVIDEAO-UHFFFAOYSA-N N-Pteroyl-L-glutaminsaeure Natural products C=1N=C2NC(N)=NC(=O)C2=NC=1CNC1=CC=C(C(=O)NC(CCC(O)=O)C(O)=O)C=C1 OVBPIULPVIDEAO-UHFFFAOYSA-N 0.000 description 2
- 108091061960 Naked DNA Proteins 0.000 description 2
- 208000028389 Nerve injury Diseases 0.000 description 2
- FVJZSBGHRPJMMA-IOLBBIBUSA-N PG(18:0/18:0) Chemical compound CCCCCCCCCCCCCCCCCC(=O)OC[C@H](COP(O)(=O)OC[C@@H](O)CO)OC(=O)CCCCCCCCCCCCCCCCC FVJZSBGHRPJMMA-IOLBBIBUSA-N 0.000 description 2
- 102000007584 Prealbumin Human genes 0.000 description 2
- RJKFOVLPORLFTN-LEKSSAKUSA-N Progesterone Chemical compound C1CC2=CC(=O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H](C(=O)C)[C@@]1(C)CC2 RJKFOVLPORLFTN-LEKSSAKUSA-N 0.000 description 2
- 101710150114 Protein rep Proteins 0.000 description 2
- 241000500703 Python regius Species 0.000 description 2
- 241000700159 Rattus Species 0.000 description 2
- 101710152114 Replication protein Proteins 0.000 description 2
- 108091027981 Response element Proteins 0.000 description 2
- 108091028664 Ribonucleotide Proteins 0.000 description 2
- 108020004422 Riboswitch Proteins 0.000 description 2
- 241000283984 Rodentia Species 0.000 description 2
- 108020004682 Single-Stranded DNA Proteins 0.000 description 2
- 241001345428 Snake adeno-associated virus Species 0.000 description 2
- 241000425549 Snake parvovirus Species 0.000 description 2
- 229930006000 Sucrose Natural products 0.000 description 2
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 2
- 210000001744 T-lymphocyte Anatomy 0.000 description 2
- 108700005077 Viral Genes Proteins 0.000 description 2
- 241001492404 Woodchuck hepatitis virus Species 0.000 description 2
- 210000001015 abdomen Anatomy 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 2
- 230000002378 acidificating effect Effects 0.000 description 2
- 239000012190 activator Substances 0.000 description 2
- 239000004480 active ingredient Substances 0.000 description 2
- 239000013543 active substance Substances 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 150000001298 alcohols Chemical class 0.000 description 2
- 230000004075 alteration Effects 0.000 description 2
- 230000001668 ameliorated effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 125000000129 anionic group Chemical group 0.000 description 2
- 239000003242 anti bacterial agent Substances 0.000 description 2
- 230000001042 autoregulative effect Effects 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 230000003115 biocidal effect Effects 0.000 description 2
- 230000008827 biological function Effects 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 210000004556 brain Anatomy 0.000 description 2
- 239000001506 calcium phosphate Substances 0.000 description 2
- 229910000389 calcium phosphate Inorganic materials 0.000 description 2
- 235000011010 calcium phosphates Nutrition 0.000 description 2
- 201000011510 cancer Diseases 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 210000000038 chest Anatomy 0.000 description 2
- BHYOQNUELFTYRT-DPAQBDIFSA-N cholesterol sulfate Chemical compound C1C=C2C[C@@H](OS(O)(=O)=O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 BHYOQNUELFTYRT-DPAQBDIFSA-N 0.000 description 2
- 229940080277 cholesteryl sulfate Drugs 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 208000020832 chronic kidney disease Diseases 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 229940104302 cytosine Drugs 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 230000007812 deficiency Effects 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 210000004443 dendritic cell Anatomy 0.000 description 2
- 239000005547 deoxyribonucleotide Substances 0.000 description 2
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 2
- 235000020805 dietary restrictions Nutrition 0.000 description 2
- 239000006185 dispersion Substances 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 210000002472 endoplasmic reticulum Anatomy 0.000 description 2
- 230000009088 enzymatic function Effects 0.000 description 2
- 210000002919 epithelial cell Anatomy 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 210000003754 fetus Anatomy 0.000 description 2
- 239000006260 foam Substances 0.000 description 2
- 229960000304 folic acid Drugs 0.000 description 2
- 125000000524 functional group Chemical group 0.000 description 2
- 230000030279 gene silencing Effects 0.000 description 2
- 230000009395 genetic defect Effects 0.000 description 2
- 208000016361 genetic disease Diseases 0.000 description 2
- PEDCQBHIVMGVHV-UHFFFAOYSA-N glycerol group Chemical group OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 2
- 210000004247 hand Anatomy 0.000 description 2
- 101150062840 hcr1 gene Proteins 0.000 description 2
- 210000003630 histaminocyte Anatomy 0.000 description 2
- 102000053020 human ApoE Human genes 0.000 description 2
- 210000000987 immune system Anatomy 0.000 description 2
- 230000000899 immune system response Effects 0.000 description 2
- 230000001771 impaired effect Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000028709 inflammatory response Effects 0.000 description 2
- 239000004615 ingredient Substances 0.000 description 2
- 230000005764 inhibitory process Effects 0.000 description 2
- 229940102223 injectable solution Drugs 0.000 description 2
- 238000007917 intracranial administration Methods 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 238000004020 luminiscence type Methods 0.000 description 2
- 239000008176 lyophilized powder Substances 0.000 description 2
- 230000036210 malignancy Effects 0.000 description 2
- 210000004962 mammalian cell Anatomy 0.000 description 2
- 239000004530 micro-emulsion Substances 0.000 description 2
- 239000011859 microparticle Substances 0.000 description 2
- VKHAHZOOUSRJNA-GCNJZUOMSA-N mifepristone Chemical compound C1([C@@H]2C3=C4CCC(=O)C=C4CC[C@H]3[C@@H]3CC[C@@]([C@]3(C2)C)(O)C#CC)=CC=C(N(C)C)C=C1 VKHAHZOOUSRJNA-GCNJZUOMSA-N 0.000 description 2
- 230000005012 migration Effects 0.000 description 2
- 238000013508 migration Methods 0.000 description 2
- 239000000178 monomer Substances 0.000 description 2
- 238000010172 mouse model Methods 0.000 description 2
- 210000000663 muscle cell Anatomy 0.000 description 2
- 229940071238 n-(carbonyl-methoxypolyethylene glycol 2000)-1,2-distearoyl-sn-glycero-3-phosphoethanolamine Drugs 0.000 description 2
- 230000008764 nerve damage Effects 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 239000002858 neurotransmitter agent Substances 0.000 description 2
- QJGQUHMNIGDVPM-UHFFFAOYSA-N nitrogen group Chemical group [N] QJGQUHMNIGDVPM-UHFFFAOYSA-N 0.000 description 2
- 230000005257 nucleotidylation Effects 0.000 description 2
- 230000030648 nucleus localization Effects 0.000 description 2
- 230000001575 pathological effect Effects 0.000 description 2
- 210000004197 pelvis Anatomy 0.000 description 2
- 210000002640 perineum Anatomy 0.000 description 2
- 239000000546 pharmaceutical excipient Substances 0.000 description 2
- 229940124531 pharmaceutical excipient Drugs 0.000 description 2
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 2
- 150000004713 phosphodiesters Chemical group 0.000 description 2
- 238000003752 polymerase chain reaction Methods 0.000 description 2
- 230000001323 posttranslational effect Effects 0.000 description 2
- OXCMYAYHXIHQOA-UHFFFAOYSA-N potassium;[2-butyl-5-chloro-3-[[4-[2-(1,2,4-triaza-3-azanidacyclopenta-1,4-dien-5-yl)phenyl]phenyl]methyl]imidazol-4-yl]methanol Chemical compound [K+].CCCCC1=NC(Cl)=C(CO)N1CC1=CC=C(C=2C(=CC=CC=2)C2=N[N-]N=N2)C=C1 OXCMYAYHXIHQOA-UHFFFAOYSA-N 0.000 description 2
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 2
- 238000011321 prophylaxis Methods 0.000 description 2
- 108020001580 protein domains Proteins 0.000 description 2
- 230000012846 protein folding Effects 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 150000003212 purines Chemical class 0.000 description 2
- 150000003230 pyrimidines Chemical class 0.000 description 2
- 230000005855 radiation Effects 0.000 description 2
- 101150066583 rep gene Proteins 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000004043 responsiveness Effects 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 239000002336 ribonucleotide Substances 0.000 description 2
- 210000000453 second toe Anatomy 0.000 description 2
- 208000037921 secondary disease Diseases 0.000 description 2
- 210000002460 smooth muscle Anatomy 0.000 description 2
- 159000000000 sodium salts Chemical class 0.000 description 2
- PFNFFQXMRSDOHW-UHFFFAOYSA-N spermine Chemical compound NCCCNCCCCNCCCN PFNFFQXMRSDOHW-UHFFFAOYSA-N 0.000 description 2
- 239000005720 sucrose Substances 0.000 description 2
- 230000035488 systolic blood pressure Effects 0.000 description 2
- ZFXYFBGIUFBOJW-UHFFFAOYSA-N theophylline Chemical compound O=C1N(C)C(=O)N(C)C2=C1NC=N2 ZFXYFBGIUFBOJW-UHFFFAOYSA-N 0.000 description 2
- 210000000115 thoracic cavity Anatomy 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 210000003371 toe Anatomy 0.000 description 2
- 108091006106 transcriptional activators Proteins 0.000 description 2
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 2
- 241000701161 unidentified adenovirus Species 0.000 description 2
- 241001529453 unidentified herpesvirus Species 0.000 description 2
- 230000004143 urea cycle Effects 0.000 description 2
- 210000001835 viscera Anatomy 0.000 description 2
- HDTRYLNUVZCQOY-UHFFFAOYSA-N α-D-glucopyranosyl-α-D-glucopyranoside Natural products OC1C(O)C(O)C(CO)OC1OC1C(O)C(O)C(O)C(CO)O1 HDTRYLNUVZCQOY-UHFFFAOYSA-N 0.000 description 1
- SYPDLJYRMSBNEX-AUGURXLVSA-N (13z,16z)-n,n-dimethyl-3-nonyldocosa-13,16-dien-1-amine Chemical compound CCCCCCCCCC(CCN(C)C)CCCCCCCCC\C=C/C\C=C/CCCCC SYPDLJYRMSBNEX-AUGURXLVSA-N 0.000 description 1
- DIGQNXIGRZPYDK-WKSCXVIASA-N (2R)-6-amino-2-[[2-[[(2S)-2-[[2-[[(2R)-2-[[(2S)-2-[[(2R,3S)-2-[[2-[[(2S)-2-[[2-[[(2S)-2-[[(2S)-2-[[(2R)-2-[[(2S,3S)-2-[[(2R)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[2-[[(2S)-2-[[(2R)-2-[[2-[[2-[[2-[(2-amino-1-hydroxyethylidene)amino]-3-carboxy-1-hydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1,5-dihydroxy-5-iminopentylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]hexanoic acid Chemical compound C[C@@H]([C@@H](C(=N[C@@H](CS)C(=N[C@@H](C)C(=N[C@@H](CO)C(=NCC(=N[C@@H](CCC(=N)O)C(=NC(CS)C(=N[C@H]([C@H](C)O)C(=N[C@H](CS)C(=N[C@H](CO)C(=NCC(=N[C@H](CS)C(=NCC(=N[C@H](CCCCN)C(=O)O)O)O)O)O)O)O)O)O)O)O)O)O)O)N=C([C@H](CS)N=C([C@H](CO)N=C([C@H](CO)N=C([C@H](C)N=C(CN=C([C@H](CO)N=C([C@H](CS)N=C(CN=C(C(CS)N=C(C(CC(=O)O)N=C(CN)O)O)O)O)O)O)O)O)O)O)O)O DIGQNXIGRZPYDK-WKSCXVIASA-N 0.000 description 1
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical group OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 1
- OPCHFPHZPIURNA-MFERNQICSA-N (2s)-2,5-bis(3-aminopropylamino)-n-[2-(dioctadecylamino)acetyl]pentanamide Chemical compound CCCCCCCCCCCCCCCCCCN(CC(=O)NC(=O)[C@H](CCCNCCCN)NCCCN)CCCCCCCCCCCCCCCCCC OPCHFPHZPIURNA-MFERNQICSA-N 0.000 description 1
- WWTBZEKOSBFBEM-SPWPXUSOSA-N (2s)-2-[[2-benzyl-3-[hydroxy-[(1r)-2-phenyl-1-(phenylmethoxycarbonylamino)ethyl]phosphoryl]propanoyl]amino]-3-(1h-indol-3-yl)propanoic acid Chemical compound N([C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)O)C(=O)C(CP(O)(=O)[C@H](CC=1C=CC=CC=1)NC(=O)OCC=1C=CC=CC=1)CC1=CC=CC=C1 WWTBZEKOSBFBEM-SPWPXUSOSA-N 0.000 description 1
- CITHEXJVPOWHKC-UUWRZZSWSA-N 1,2-di-O-myristoyl-sn-glycero-3-phosphocholine Chemical compound CCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCCCCCCCCCCCC CITHEXJVPOWHKC-UUWRZZSWSA-N 0.000 description 1
- NPRYCHLHHVWLQZ-TURQNECASA-N 2-amino-9-[(2R,3S,4S,5R)-4-fluoro-3-hydroxy-5-(hydroxymethyl)oxolan-2-yl]-7-prop-2-ynylpurin-8-one Chemical compound NC1=NC=C2N(C(N(C2=N1)[C@@H]1O[C@@H]([C@H]([C@H]1O)F)CO)=O)CC#C NPRYCHLHHVWLQZ-TURQNECASA-N 0.000 description 1
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 1
- VTRBOZNMGVDGHY-UHFFFAOYSA-N 6-(4-methylanilino)naphthalene-2-sulfonic acid Chemical compound C1=CC(C)=CC=C1NC1=CC=C(C=C(C=C2)S(O)(=O)=O)C2=C1 VTRBOZNMGVDGHY-UHFFFAOYSA-N 0.000 description 1
- 241000251468 Actinopterygii Species 0.000 description 1
- 208000030090 Acute Disease Diseases 0.000 description 1
- 206010067484 Adverse reaction Diseases 0.000 description 1
- 108700028369 Alleles Proteins 0.000 description 1
- 241000272814 Anser sp. Species 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- 206010003591 Ataxia Diseases 0.000 description 1
- 241000282672 Ateles sp. Species 0.000 description 1
- 241000972773 Aulopiformes Species 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 102100022548 Beta-hexosaminidase subunit alpha Human genes 0.000 description 1
- 241000157302 Bison bison athabascae Species 0.000 description 1
- 208000005692 Bloom Syndrome Diseases 0.000 description 1
- FERIUCNNQQJTOY-UHFFFAOYSA-M Butyrate Chemical compound CCCC([O-])=O FERIUCNNQQJTOY-UHFFFAOYSA-M 0.000 description 1
- QCMYYKRYFNMIEC-UHFFFAOYSA-N COP(O)=O Chemical class COP(O)=O QCMYYKRYFNMIEC-UHFFFAOYSA-N 0.000 description 1
- 108091033409 CRISPR Proteins 0.000 description 1
- 101150044789 Cap gene Proteins 0.000 description 1
- 241000282994 Cervidae Species 0.000 description 1
- 208000003322 Coinfection Diseases 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- 206010053138 Congenital aplastic anaemia Diseases 0.000 description 1
- 108091035707 Consensus sequence Proteins 0.000 description 1
- 206010010904 Convulsion Diseases 0.000 description 1
- 241000699800 Cricetinae Species 0.000 description 1
- 102100026398 Cyclic AMP-responsive element-binding protein 3 Human genes 0.000 description 1
- 201000003883 Cystic fibrosis Diseases 0.000 description 1
- 102000000311 Cytosine Deaminase Human genes 0.000 description 1
- 108010080611 Cytosine Deaminase Proteins 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- 230000007067 DNA methylation Effects 0.000 description 1
- 230000030933 DNA methylation on cytosine Effects 0.000 description 1
- 230000004543 DNA replication Effects 0.000 description 1
- 241000450599 DNA viruses Species 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 241000121256 Densovirinae Species 0.000 description 1
- GZDFHIJNHHMENY-UHFFFAOYSA-N Dimethyl dicarbonate Chemical compound COC(=O)OC(=O)OC GZDFHIJNHHMENY-UHFFFAOYSA-N 0.000 description 1
- 241000271571 Dromaius novaehollandiae Species 0.000 description 1
- 241000255581 Drosophila <fruit fly, genus> Species 0.000 description 1
- 101100224482 Drosophila melanogaster PolE1 gene Proteins 0.000 description 1
- 238000002965 ELISA Methods 0.000 description 1
- 101150002621 EPO gene Proteins 0.000 description 1
- 102000004533 Endonucleases Human genes 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 102000003951 Erythropoietin Human genes 0.000 description 1
- 102100031939 Erythropoietin Human genes 0.000 description 1
- 108090000394 Erythropoietin Proteins 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 108010007577 Exodeoxyribonuclease I Proteins 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- 102100029075 Exonuclease 1 Human genes 0.000 description 1
- 108091092566 Extrachromosomal DNA Proteins 0.000 description 1
- 201000004939 Fanconi anemia Diseases 0.000 description 1
- 241000282324 Felis Species 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 101150106478 GPS1 gene Proteins 0.000 description 1
- 241000288991 Galago senegalensis Species 0.000 description 1
- 241000287828 Gallus gallus Species 0.000 description 1
- JZNWSCPGTDBMEW-UHFFFAOYSA-N Glycerophosphorylethanolamin Natural products NCCOP(O)(=O)OCC(O)CO JZNWSCPGTDBMEW-UHFFFAOYSA-N 0.000 description 1
- 244000068988 Glycine max Species 0.000 description 1
- 235000010469 Glycine max Nutrition 0.000 description 1
- 102100031573 Hematopoietic progenitor cell antigen CD34 Human genes 0.000 description 1
- 208000031220 Hemophilia Diseases 0.000 description 1
- 208000009292 Hemophilia A Diseases 0.000 description 1
- 206010019663 Hepatic failure Diseases 0.000 description 1
- 208000021177 Hepatic metabolic disease Diseases 0.000 description 1
- 241000700721 Hepatitis B virus Species 0.000 description 1
- 102000006754 Hepatocyte Nuclear Factor 1 Human genes 0.000 description 1
- 108010086512 Hepatocyte Nuclear Factor 1 Proteins 0.000 description 1
- 208000002972 Hepatolenticular Degeneration Diseases 0.000 description 1
- 102000009331 Homeodomain Proteins Human genes 0.000 description 1
- 108010048671 Homeodomain Proteins Proteins 0.000 description 1
- 101000928628 Homo sapiens Apolipoprotein C-I Proteins 0.000 description 1
- 101000855520 Homo sapiens Cyclic AMP-responsive element-binding protein 3 Proteins 0.000 description 1
- 101000777663 Homo sapiens Hematopoietic progenitor cell antigen CD34 Proteins 0.000 description 1
- 101000878605 Homo sapiens Low affinity immunoglobulin epsilon Fc receptor Proteins 0.000 description 1
- 101000871708 Homo sapiens Proheparin-binding EGF-like growth factor Proteins 0.000 description 1
- 241000700588 Human alphaherpesvirus 1 Species 0.000 description 1
- 241000702617 Human parvovirus B19 Species 0.000 description 1
- 208000023105 Huntington disease Diseases 0.000 description 1
- 208000000563 Hyperlipoproteinemia Type II Diseases 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- 201000006347 Intellectual Disability Diseases 0.000 description 1
- 102000014150 Interferons Human genes 0.000 description 1
- 108010050904 Interferons Proteins 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- 108010001831 LDL receptors Proteins 0.000 description 1
- JVTAAEKCZFNVCJ-UHFFFAOYSA-M Lactate Chemical compound CC(O)C([O-])=O JVTAAEKCZFNVCJ-UHFFFAOYSA-M 0.000 description 1
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 1
- 208000009625 Lesch-Nyhan syndrome Diseases 0.000 description 1
- 102100038007 Low affinity immunoglobulin epsilon Fc receptor Human genes 0.000 description 1
- 241000282553 Macaca Species 0.000 description 1
- 241000282567 Macaca fascicularis Species 0.000 description 1
- 241000283923 Marmota monax Species 0.000 description 1
- 108010052285 Membrane Proteins Proteins 0.000 description 1
- 102000003792 Metallothionein Human genes 0.000 description 1
- 108090000157 Metallothionein Proteins 0.000 description 1
- 208000014252 Mild phenylketonuria Diseases 0.000 description 1
- 108010006519 Molecular Chaperones Proteins 0.000 description 1
- 241000282339 Mustela Species 0.000 description 1
- VQAYFKKCNSOZKM-IOSLPCCCSA-N N(6)-methyladenosine Chemical compound C1=NC=2C(NC)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O VQAYFKKCNSOZKM-IOSLPCCCSA-N 0.000 description 1
- 208000012902 Nervous system disease Diseases 0.000 description 1
- 208000009869 Neu-Laxova syndrome Diseases 0.000 description 1
- 208000025966 Neurological disease Diseases 0.000 description 1
- 238000000636 Northern blotting Methods 0.000 description 1
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 1
- 102000007399 Nuclear hormone receptor Human genes 0.000 description 1
- 108020005497 Nuclear hormone receptor Proteins 0.000 description 1
- 108091005461 Nucleic proteins Proteins 0.000 description 1
- 206010030113 Oedema Diseases 0.000 description 1
- 102000015636 Oligopeptides Human genes 0.000 description 1
- 108010038807 Oligopeptides Proteins 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 206010033128 Ovarian cancer Diseases 0.000 description 1
- 206010061535 Ovarian neoplasm Diseases 0.000 description 1
- 102100034574 P protein Human genes 0.000 description 1
- 101710181008 P protein Proteins 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 241000282579 Pan Species 0.000 description 1
- 241000121250 Parvovirinae Species 0.000 description 1
- 102000035195 Peptidases Human genes 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 108030005438 Phenylalanine 4-monooxygenases Proteins 0.000 description 1
- 101710177166 Phosphoprotein Proteins 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- 239000004698 Polyethylene Substances 0.000 description 1
- 108010039918 Polylysine Proteins 0.000 description 1
- 229920000388 Polyphosphate Polymers 0.000 description 1
- 241000135309 Processus Species 0.000 description 1
- 102100033762 Proheparin-binding EGF-like growth factor Human genes 0.000 description 1
- 102000007327 Protamines Human genes 0.000 description 1
- 108010007568 Protamines Proteins 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 230000004570 RNA-binding Effects 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 102000018120 Recombinases Human genes 0.000 description 1
- 108010091086 Recombinases Proteins 0.000 description 1
- 208000001647 Renal Insufficiency Diseases 0.000 description 1
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 1
- 102000009661 Repressor Proteins Human genes 0.000 description 1
- 108010034634 Repressor Proteins Proteins 0.000 description 1
- 201000007737 Retinal degeneration Diseases 0.000 description 1
- 208000007014 Retinitis pigmentosa Diseases 0.000 description 1
- 201000000582 Retinoblastoma Diseases 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- 241000277331 Salmonidae Species 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Chemical group OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 241000270295 Serpentes Species 0.000 description 1
- 208000036623 Severe mental retardation Diseases 0.000 description 1
- 241000700584 Simplexvirus Species 0.000 description 1
- 102000007451 Steroid Receptors Human genes 0.000 description 1
- 108010085012 Steroid Receptors Proteins 0.000 description 1
- 241000272534 Struthio camelus Species 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 208000022292 Tay-Sachs disease Diseases 0.000 description 1
- 206010043189 Telangiectasia Diseases 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- 208000002903 Thalassemia Diseases 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical group OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 1
- 241001648840 Thosea asigna virus Species 0.000 description 1
- 102000002689 Toll-like receptor Human genes 0.000 description 1
- 108020000411 Toll-like receptor Proteins 0.000 description 1
- 208000035317 Total hypoxanthine-guanine phosphoribosyl transferase deficiency Diseases 0.000 description 1
- 108700009124 Transcription Initiation Site Proteins 0.000 description 1
- 108700029229 Transcriptional Regulatory Elements Proteins 0.000 description 1
- 102000004357 Transferases Human genes 0.000 description 1
- 108090000992 Transferases Proteins 0.000 description 1
- HDTRYLNUVZCQOY-WSWWMNSNSA-N Trehalose Natural products O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 HDTRYLNUVZCQOY-WSWWMNSNSA-N 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- 241001033908 Tupaia chinensis Species 0.000 description 1
- 206010045261 Type IIa hyperlipidaemia Diseases 0.000 description 1
- 101150110932 US19 gene Proteins 0.000 description 1
- 108020004417 Untranslated RNA Proteins 0.000 description 1
- 102000039634 Untranslated RNA Human genes 0.000 description 1
- 208000036142 Viral infection Diseases 0.000 description 1
- 208000018839 Wilson disease Diseases 0.000 description 1
- 206010048218 Xeroderma Diseases 0.000 description 1
- 101710185494 Zinc finger protein Proteins 0.000 description 1
- 102100023597 Zinc finger protein 816 Human genes 0.000 description 1
- JLPULHDHAOZNQI-JLOPVYAASA-N [(2r)-3-hexadecanoyloxy-2-[(9e,12e)-octadeca-9,12-dienoyl]oxypropyl] 2-(trimethylazaniumyl)ethyl phosphate Chemical class CCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCCCCCC\C=C\C\C=C\CCCCC JLPULHDHAOZNQI-JLOPVYAASA-N 0.000 description 1
- HIHOWBSBBDRPDW-PTHRTHQKSA-N [(3s,8s,9s,10r,13r,14s,17r)-10,13-dimethyl-17-[(2r)-6-methylheptan-2-yl]-2,3,4,7,8,9,11,12,14,15,16,17-dodecahydro-1h-cyclopenta[a]phenanthren-3-yl] n-[2-(dimethylamino)ethyl]carbamate Chemical compound C1C=C2C[C@@H](OC(=O)NCCN(C)C)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HIHOWBSBBDRPDW-PTHRTHQKSA-N 0.000 description 1
- RGAIHNZNCGOCLA-ZDSKVHJSSA-N [(Z)-non-2-enyl] 8-[2-(dimethylamino)ethylsulfanylcarbonyl-[8-[(Z)-non-2-enoxy]-8-oxooctyl]amino]octanoate Chemical compound CCCCCC\C=C/COC(=O)CCCCCCCN(CCCCCCCC(=O)OC\C=C/CCCCCC)C(=O)SCCN(C)C RGAIHNZNCGOCLA-ZDSKVHJSSA-N 0.000 description 1
- HMNZFMSWFCAGGW-XPWSMXQVSA-N [3-[hydroxy(2-hydroxyethoxy)phosphoryl]oxy-2-[(e)-octadec-9-enoyl]oxypropyl] (e)-octadec-9-enoate Chemical compound CCCCCCCC\C=C\CCCCCCCC(=O)OCC(COP(O)(=O)OCCO)OC(=O)CCCCCCC\C=C\CCCCCCCC HMNZFMSWFCAGGW-XPWSMXQVSA-N 0.000 description 1
- 239000003070 absorption delaying agent Substances 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- IPBVNPXQWQGGJP-UHFFFAOYSA-N acetic acid phenyl ester Natural products CC(=O)OC1=CC=CC=C1 IPBVNPXQWQGGJP-UHFFFAOYSA-N 0.000 description 1
- 208000037919 acquired disease Diseases 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 201000010275 acute porphyria Diseases 0.000 description 1
- 230000006838 adverse reaction Effects 0.000 description 1
- 239000000443 aerosol Substances 0.000 description 1
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 1
- 150000001350 alkyl halides Chemical class 0.000 description 1
- 230000000172 allergic effect Effects 0.000 description 1
- HDTRYLNUVZCQOY-LIZSDCNHSA-N alpha,alpha-trehalose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 HDTRYLNUVZCQOY-LIZSDCNHSA-N 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- 150000001412 amines Chemical class 0.000 description 1
- 125000003277 amino group Chemical group 0.000 description 1
- 150000001450 anions Chemical class 0.000 description 1
- 230000000844 anti-bacterial effect Effects 0.000 description 1
- 230000000840 anti-viral effect Effects 0.000 description 1
- 239000003429 antifungal agent Substances 0.000 description 1
- 229940121375 antifungal agent Drugs 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 239000004599 antimicrobial Substances 0.000 description 1
- 239000002246 antineoplastic agent Substances 0.000 description 1
- 238000003782 apoptosis assay Methods 0.000 description 1
- 230000006907 apoptotic process Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 208000010668 atopic eczema Diseases 0.000 description 1
- 210000003719 b-lymphocyte Anatomy 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 231100000871 behavioral problem Toxicity 0.000 description 1
- 208000013404 behavioral symptom Diseases 0.000 description 1
- 238000002306 biochemical method Methods 0.000 description 1
- 230000031018 biological processes and functions Effects 0.000 description 1
- 239000000090 biomarker Substances 0.000 description 1
- 210000000601 blood cell Anatomy 0.000 description 1
- 230000036765 blood level Effects 0.000 description 1
- 230000004641 brain development Effects 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 150000007942 carboxylates Chemical class 0.000 description 1
- 230000006652 catabolic pathway Effects 0.000 description 1
- 241001233037 catfish Species 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 210000003986 cell retinal photoreceptor Anatomy 0.000 description 1
- 230000003833 cell viability Effects 0.000 description 1
- 108091092356 cellular DNA Proteins 0.000 description 1
- 230000033077 cellular process Effects 0.000 description 1
- 230000036755 cellular response Effects 0.000 description 1
- 230000005754 cellular signaling Effects 0.000 description 1
- 229940106189 ceramide Drugs 0.000 description 1
- 210000000854 cervical rib Anatomy 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 235000013330 chicken meat Nutrition 0.000 description 1
- 229960005091 chloramphenicol Drugs 0.000 description 1
- 210000003763 chloroplast Anatomy 0.000 description 1
- 150000001841 cholesterols Chemical class 0.000 description 1
- 239000013611 chromosomal DNA Substances 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 239000000084 colloidal system Substances 0.000 description 1
- 206010010121 compartment syndrome Diseases 0.000 description 1
- 229940126208 compound 22 Drugs 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013270 controlled release Methods 0.000 description 1
- 239000007771 core particle Substances 0.000 description 1
- 239000011258 core-shell material Substances 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000000604 cryogenic transmission electron microscopy Methods 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- 238000011461 current therapy Methods 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 210000000172 cytosol Anatomy 0.000 description 1
- 229940127089 cytotoxic agent Drugs 0.000 description 1
- GVJHHUAWPYXKBD-UHFFFAOYSA-N d-alpha-tocopherol Natural products OC1=C(C)C(C)=C2OC(CCCC(C)CCCC(C)CCCC(C)C)(C)CCC2=C1C GVJHHUAWPYXKBD-UHFFFAOYSA-N 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 230000009615 deamination Effects 0.000 description 1
- 238000006481 deamination reaction Methods 0.000 description 1
- 210000000852 deltoid muscle Anatomy 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- BPHQZTVXXXJVHI-UHFFFAOYSA-N dimyristoyl phosphatidylglycerol Chemical compound CCCCCCCCCCCCCC(=O)OCC(COP(O)(=O)OCC(O)CO)OC(=O)CCCCCCCCCCCCC BPHQZTVXXXJVHI-UHFFFAOYSA-N 0.000 description 1
- 229960003724 dimyristoylphosphatidylcholine Drugs 0.000 description 1
- 229960005160 dimyristoylphosphatidylglycerol Drugs 0.000 description 1
- 238000011979 disease modifying therapy Methods 0.000 description 1
- 208000037765 diseases and disorders Diseases 0.000 description 1
- 239000002612 dispersion medium Substances 0.000 description 1
- BPHQZTVXXXJVHI-AJQTZOPKSA-N ditetradecanoyl phosphatidylglycerol Chemical compound CCCCCCCCCCCCCC(=O)OC[C@H](COP(O)(=O)OC[C@@H](O)CO)OC(=O)CCCCCCCCCCCCC BPHQZTVXXXJVHI-AJQTZOPKSA-N 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000004064 dysfunction Effects 0.000 description 1
- 108010057988 ecdysone receptor Proteins 0.000 description 1
- 150000002061 ecdysteroids Chemical class 0.000 description 1
- 230000005014 ectopic expression Effects 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 230000012202 endocytosis Effects 0.000 description 1
- 230000001159 endocytotic effect Effects 0.000 description 1
- 210000002889 endothelial cell Anatomy 0.000 description 1
- 238000001976 enzyme digestion Methods 0.000 description 1
- 210000000981 epithelium Anatomy 0.000 description 1
- 229940105423 erythropoietin Drugs 0.000 description 1
- 125000001495 ethyl group Chemical group [H]C([H])([H])C([H])([H])* 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000005713 exacerbation Effects 0.000 description 1
- 108010052305 exodeoxyribonuclease III Proteins 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000013613 expression plasmid Substances 0.000 description 1
- 238000013265 extended release Methods 0.000 description 1
- 201000001386 familial hypercholesterolemia Diseases 0.000 description 1
- 230000008175 fetal development Effects 0.000 description 1
- 235000019688 fish Nutrition 0.000 description 1
- 229940014144 folate Drugs 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 229960002963 ganciclovir Drugs 0.000 description 1
- 239000007789 gas Substances 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 238000001476 gene delivery Methods 0.000 description 1
- 102000034356 gene-regulatory proteins Human genes 0.000 description 1
- 108091006104 gene-regulatory proteins Proteins 0.000 description 1
- 231100000025 genetic toxicology Toxicity 0.000 description 1
- 230000001738 genotoxic effect Effects 0.000 description 1
- 210000004602 germ cell Anatomy 0.000 description 1
- 235000011187 glycerol Nutrition 0.000 description 1
- 210000002288 golgi apparatus Anatomy 0.000 description 1
- 239000002271 gyrase inhibitor Substances 0.000 description 1
- 210000005003 heart tissue Anatomy 0.000 description 1
- 210000003958 hematopoietic stem cell Anatomy 0.000 description 1
- 230000002440 hepatic effect Effects 0.000 description 1
- 208000033552 hepatic porphyria Diseases 0.000 description 1
- 208000006359 hepatoblastoma Diseases 0.000 description 1
- 210000003494 hepatocyte Anatomy 0.000 description 1
- 230000013632 homeostatic process Effects 0.000 description 1
- 230000003054 hormonal effect Effects 0.000 description 1
- 229940088597 hormone Drugs 0.000 description 1
- 239000005556 hormone Substances 0.000 description 1
- 230000005745 host immune response Effects 0.000 description 1
- 102000055379 human APOC1 Human genes 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 230000033444 hydroxylation Effects 0.000 description 1
- 238000005805 hydroxylation reaction Methods 0.000 description 1
- 230000001146 hypoxic effect Effects 0.000 description 1
- 206010021198 ichthyosis Diseases 0.000 description 1
- 210000002865 immune cell Anatomy 0.000 description 1
- 230000008088 immune pathway Effects 0.000 description 1
- 208000026278 immune system disease Diseases 0.000 description 1
- 230000002163 immunogen Effects 0.000 description 1
- 238000001114 immunoprecipitation Methods 0.000 description 1
- 229960001438 immunostimulant agent Drugs 0.000 description 1
- 239000003022 immunostimulating agent Substances 0.000 description 1
- 229960003444 immunosuppressant agent Drugs 0.000 description 1
- 230000001976 improved effect Effects 0.000 description 1
- 238000007901 in situ hybridization Methods 0.000 description 1
- 238000010874 in vitro model Methods 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 208000016245 inborn errors of metabolism Diseases 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 210000004263 induced pluripotent stem cell Anatomy 0.000 description 1
- 239000000411 inducer Substances 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000002458 infectious effect Effects 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 238000011221 initial treatment Methods 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 238000002743 insertional mutagenesis Methods 0.000 description 1
- 239000012212 insulator Substances 0.000 description 1
- 229940079322 interferon Drugs 0.000 description 1
- 238000010255 intramuscular injection Methods 0.000 description 1
- 239000007927 intramuscular injection Substances 0.000 description 1
- 230000002601 intratumoral effect Effects 0.000 description 1
- 208000028867 ischemia Diseases 0.000 description 1
- 230000000302 ischemic effect Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 239000007951 isotonicity adjuster Substances 0.000 description 1
- 201000006370 kidney failure Diseases 0.000 description 1
- 230000002147 killing effect Effects 0.000 description 1
- 210000000629 knee joint Anatomy 0.000 description 1
- 238000011005 laboratory method Methods 0.000 description 1
- 230000021633 leukocyte mediated immunity Effects 0.000 description 1
- 150000002634 lipophilic molecules Chemical class 0.000 description 1
- 231100000835 liver failure Toxicity 0.000 description 1
- 208000007903 liver failure Diseases 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 208000018773 low birth weight Diseases 0.000 description 1
- 231100000533 low birth weight Toxicity 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 210000001352 masseter muscle Anatomy 0.000 description 1
- 230000013011 mating Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000006371 metabolic abnormality Effects 0.000 description 1
- 239000002207 metabolite Substances 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 239000000693 micelle Substances 0.000 description 1
- 229960003248 mifepristone Drugs 0.000 description 1
- 210000003470 mitochondria Anatomy 0.000 description 1
- 230000025608 mitochondrion localization Effects 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 108091005601 modified peptides Chemical group 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 125000004573 morpholin-4-yl group Chemical group N1(CCOCC1)* 0.000 description 1
- 201000006938 muscular dystrophy Diseases 0.000 description 1
- 210000000107 myocyte Anatomy 0.000 description 1
- 229930014626 natural product Natural products 0.000 description 1
- 230000003472 neutralizing effect Effects 0.000 description 1
- 231100000252 nontoxic Toxicity 0.000 description 1
- 230000003000 nontoxic effect Effects 0.000 description 1
- 230000030147 nuclear export Effects 0.000 description 1
- 108020004017 nuclear receptors Proteins 0.000 description 1
- 230000006911 nucleation Effects 0.000 description 1
- 238000010899 nucleation Methods 0.000 description 1
- 238000001821 nucleic acid purification Methods 0.000 description 1
- 238000011275 oncology therapy Methods 0.000 description 1
- 210000003463 organelle Anatomy 0.000 description 1
- 239000003960 organic solvent Substances 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- 238000005895 oxidative decarboxylation reaction Methods 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 210000000496 pancreas Anatomy 0.000 description 1
- 210000004923 pancreatic tissue Anatomy 0.000 description 1
- 238000007911 parenteral administration Methods 0.000 description 1
- 210000000062 pectoralis major Anatomy 0.000 description 1
- 210000000989 pectoralis minor Anatomy 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- 108010043655 penetratin Proteins 0.000 description 1
- MCYTYTUNNNZWOK-LCLOTLQISA-N penetratin Chemical compound C([C@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCCNC(N)=N)[C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(N)=O)C1=CC=CC=C1 MCYTYTUNNNZWOK-LCLOTLQISA-N 0.000 description 1
- 230000000149 penetrating effect Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000002572 peristaltic effect Effects 0.000 description 1
- 238000012247 phenotypical assay Methods 0.000 description 1
- 125000001997 phenyl group Chemical group [H]C1=C([H])C([H])=C(*)C([H])=C1[H] 0.000 description 1
- 229940049953 phenylacetate Drugs 0.000 description 1
- WLJVXDMOQOGPHL-UHFFFAOYSA-N phenylacetic acid Chemical compound OC(=O)CC1=CC=CC=C1 WLJVXDMOQOGPHL-UHFFFAOYSA-N 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 150000008104 phosphatidylethanolamines Chemical class 0.000 description 1
- 150000008298 phosphoramidates Chemical class 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 238000000053 physical method Methods 0.000 description 1
- 230000004962 physiological condition Effects 0.000 description 1
- 230000001766 physiological effect Effects 0.000 description 1
- 239000000902 placebo Substances 0.000 description 1
- 229940068196 placebo Drugs 0.000 description 1
- 230000036470 plasma concentration Effects 0.000 description 1
- 210000001778 pluripotent stem cell Anatomy 0.000 description 1
- 229920000771 poly (alkylcyanoacrylate) Polymers 0.000 description 1
- 229920000729 poly(L-lysine) polymer Polymers 0.000 description 1
- 229920002647 polyamide Polymers 0.000 description 1
- 229920000768 polyamine Polymers 0.000 description 1
- 239000004417 polycarbonate Substances 0.000 description 1
- 229920000573 polyethylene Polymers 0.000 description 1
- 229920000656 polylysine Polymers 0.000 description 1
- 239000001205 polyphosphate Substances 0.000 description 1
- 235000011176 polyphosphates Nutrition 0.000 description 1
- 239000011148 porous material Substances 0.000 description 1
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000003334 potential effect Effects 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000001566 pro-viral effect Effects 0.000 description 1
- 239000000651 prodrug Substances 0.000 description 1
- 229940002612 prodrug Drugs 0.000 description 1
- 239000000186 progesterone Substances 0.000 description 1
- 229960003387 progesterone Drugs 0.000 description 1
- 102000003998 progesterone receptors Human genes 0.000 description 1
- 108090000468 progesterone receptors Proteins 0.000 description 1
- 150000003146 progesterones Chemical class 0.000 description 1
- 230000005522 programmed cell death Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 229940048914 protamine Drugs 0.000 description 1
- 230000009145 protein modification Effects 0.000 description 1
- 230000020978 protein processing Effects 0.000 description 1
- 238000001243 protein synthesis Methods 0.000 description 1
- 230000002797 proteolythic effect Effects 0.000 description 1
- 208000020016 psychiatric disease Diseases 0.000 description 1
- 210000002176 pterygoid muscle Anatomy 0.000 description 1
- 230000002685 pulmonary effect Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000007115 recruitment Effects 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 230000001718 repressive effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000004258 retinal degeneration Effects 0.000 description 1
- 230000002207 retinal effect Effects 0.000 description 1
- 230000004243 retinal function Effects 0.000 description 1
- 210000001116 retinal neuron Anatomy 0.000 description 1
- 150000004492 retinoid derivatives Chemical class 0.000 description 1
- 102000027483 retinoid hormone receptors Human genes 0.000 description 1
- 108091008679 retinoid hormone receptors Proteins 0.000 description 1
- 210000000614 rib Anatomy 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 235000019515 salmon Nutrition 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
- 239000013605 shuttle vector Substances 0.000 description 1
- 208000007056 sickle cell anemia Diseases 0.000 description 1
- JJICLMJFIKGAAU-UHFFFAOYSA-M sodium;2-amino-9-(1,3-dihydroxypropan-2-yloxymethyl)purin-6-olate Chemical compound [Na+].NC1=NC([O-])=C2N=CN(COC(CO)CO)C2=N1 JJICLMJFIKGAAU-UHFFFAOYSA-M 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 230000000392 somatic effect Effects 0.000 description 1
- 229940063675 spermine Drugs 0.000 description 1
- 239000012798 spherical particle Substances 0.000 description 1
- 210000000952 spleen Anatomy 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 210000000130 stem cell Anatomy 0.000 description 1
- 230000001954 sterilising effect Effects 0.000 description 1
- 238000004659 sterilization and disinfection Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000012916 structural analysis Methods 0.000 description 1
- 230000004960 subcellular localization Effects 0.000 description 1
- KDYFGRWQOYBRFD-UHFFFAOYSA-L succinate(2-) Chemical compound [O-]C(=O)CCC([O-])=O KDYFGRWQOYBRFD-UHFFFAOYSA-L 0.000 description 1
- WEPNHBQBLCNOBB-FZJVNAOYSA-N sucrose octasulfate Chemical compound OS(=O)(=O)O[C@@H]1[C@H](OS(O)(=O)=O)[C@H](COS(=O)(=O)O)O[C@]1(COS(O)(=O)=O)O[C@@H]1[C@H](OS(O)(=O)=O)[C@@H](OS(O)(=O)=O)[C@@H](OS(O)(=O)=O)[C@@H](COS(O)(=O)=O)O1 WEPNHBQBLCNOBB-FZJVNAOYSA-N 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 208000009056 telangiectasis Diseases 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- 229960000278 theophylline Drugs 0.000 description 1
- 150000003573 thiols Chemical class 0.000 description 1
- 210000003813 thumb Anatomy 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 210000001541 thymus gland Anatomy 0.000 description 1
- 230000005100 tissue tropism Effects 0.000 description 1
- 235000010384 tocopherol Nutrition 0.000 description 1
- 229960001295 tocopherol Drugs 0.000 description 1
- 229930003799 tocopherol Natural products 0.000 description 1
- 239000011732 tocopherol Substances 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 108091006107 transcriptional repressors Proteins 0.000 description 1
- 238000003151 transfection method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000011820 transgenic animal model Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 239000013638 trimer Substances 0.000 description 1
- IEDVJHCEMCRBQM-UHFFFAOYSA-N trimethoprim Chemical compound COC1=C(OC)C(OC)=CC(CC=2C(=NC(N)=NC=2)N)=C1 IEDVJHCEMCRBQM-UHFFFAOYSA-N 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- 210000004881 tumor cell Anatomy 0.000 description 1
- WFKWXMTUELFFGS-UHFFFAOYSA-N tungsten Chemical compound [W] WFKWXMTUELFFGS-UHFFFAOYSA-N 0.000 description 1
- 229910052721 tungsten Inorganic materials 0.000 description 1
- 239000010937 tungsten Substances 0.000 description 1
- 239000011882 ultra-fine particle Substances 0.000 description 1
- 230000009452 underexpressoin Effects 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- 210000005166 vasculature Anatomy 0.000 description 1
- 210000003462 vein Anatomy 0.000 description 1
- 230000009385 viral infection Effects 0.000 description 1
- GVJHHUAWPYXKBD-IEOSBIPESA-N α-tocopherol Chemical compound OC1=C(C)C(C)=C2O[C@@](CCC[C@H](C)CCC[C@H](C)CCCC(C)C)(C)CCC2=C1C GVJHHUAWPYXKBD-IEOSBIPESA-N 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/0008—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition
- A61K48/0016—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition wherein the nucleic acid is delivered as a 'naked' nucleic acid, i.e. not combined with an entity such as a cationic lipid
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/005—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/005—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
- A61K48/0066—Manipulation of the nucleic acid to modify its expression pattern, e.g. enhance its duration of expression, achieved by the presence of particular introns in the delivered nucleic acid
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P3/00—Drugs for disorders of the metabolism
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P43/00—Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0071—Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y114/00—Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
- C12Y114/16—Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14) with reduced pteridine as one donor, and incorporation of one atom of oxygen (1.14.16)
- C12Y114/16001—Phenylalanine 4-monooxygenase (1.14.16.1)
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2217/00—Genetically modified animals
- A01K2217/07—Animals genetically altered by homologous recombination
- A01K2217/075—Animals genetically altered by homologous recombination inducing loss of function, i.e. knock out
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2227/00—Animals characterised by species
- A01K2227/10—Mammal
- A01K2227/105—Murine
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2267/00—Animals characterised by purpose
- A01K2267/03—Animal model, e.g. for test or diseases
- A01K2267/0306—Animal model for genetic diseases
- A01K2267/0318—Animal model for neurodegenerative disease, e.g. non- Alzheimer's
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/50—Physical structure
- C12N2310/53—Physical structure partially self-complementary or closed
- C12N2310/531—Stem-loop; Hairpin
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/14011—Baculoviridae
- C12N2710/14111—Nucleopolyhedrovirus, e.g. autographa californica nucleopolyhedrovirus
- C12N2710/14141—Use of virus, viral particle or viral elements as a vector
- C12N2710/14143—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/14011—Baculoviridae
- C12N2710/14111—Nucleopolyhedrovirus, e.g. autographa californica nucleopolyhedrovirus
- C12N2710/14141—Use of virus, viral particle or viral elements as a vector
- C12N2710/14144—Chimeric viral vector comprising heterologous viral elements for production of another viral vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/10—Plasmid DNA
- C12N2800/103—Plasmid DNA for invertebrates
- C12N2800/105—Plasmid DNA for invertebrates for insects
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/22—Vectors comprising a coding region that has been codon optimised for expression in a respective host
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/008—Vector systems having a special element relevant for transcription cell type or tissue specific enhancer/promoter combination
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/50—Vector systems having a special element relevant for transcription regulating RNA stability, not being an intron, e.g. poly A signal
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- General Health & Medical Sciences (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- Medicinal Chemistry (AREA)
- Microbiology (AREA)
- Veterinary Medicine (AREA)
- Pharmacology & Pharmacy (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Epidemiology (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Hematology (AREA)
- Obesity (AREA)
- Diabetes (AREA)
- Virology (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
- Enzymes And Modification Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
Abstract
전이유전자의 전달 및 발현을 위한 선형 및 연속 구조를 갖는 ceDNA 벡터가 본원에 기재되어 있다. ceDNA 벡터는 2개의 ITR 서열이 플랭킹된 발현 카세트를 포함하며, 여기서 발현 카세트는 특정 프로모터 서열 및 시스-조절 요소와 조합된 PAH 단백질을 인코딩하는 코돈 최적화된 핵산 서열을 포함한다. ceDNA 벡터를 사용하여 시험관내, 생체외 및 생체내에서 PAH 단백질의 신뢰할 수 있는 유전자 발현을 위한 방법 및 세포주가 본원에 추가로 제공된다. 세포, 조직 또는 대상에서 PAH 단백질의 발현에 유용한 ceDNA 벡터를 포함하는 방법 및 조성물, 및 PAH 단백질을 발현하는 상기 ceDNA 벡터로 질환을 치료하는 방법이 또한 본원에 제공된다. 이러한 PAH 단백질은 질환, 예를 들어 페닐케톤뇨증(PKU)의 치료를 위해 발현될 수 있다.
Description
관련 출원
본 출원은 2020년 9월 16일자 출원된 미국 임시 출원 제63/078,954호에 대한 우선권을 주장하며, 상기 문헌의 전체 내용은 그 전문이 본원에 참조로 인용된다.
서열목록
본 출원은 ASCII 형식으로 전자문서로 제출된 서열목록을 포함하며, 이러한 서열목록은 그 전체가 본원에 참조로서 인용된다. 2021년 9월 16일자 생성된 상기 ASCII 사본의 명칭은 131698-08120_SL.txt이고, 크기는 633,329바이트이다.
기술분야
본 개시내용은 대상 또는 세포에서 전이유전자(transgene) 또는 단리된 폴리뉴클레오타이드를 발현시키기 위한 비(non)바이러스성 벡터를 포함하는 유전자 치료 분야에 관한 것이다. 본 개시내용은 또한 상기 폴리뉴클레오타이드를 포함하는 핵산 작제물, 프로모터, 벡터 및 숙주세포뿐 아니라, 표적 세포, 조직, 기관 또는 유기체로 외인성 DNA 서열을 전달하는 방법에 관한 것이다. 예를 들어, 본 개시내용은 질환의 치료를 필요로 하는 대상의 세포 또는 조직에서 페닐알라닌 히드록실라아제(PAH: phenylalanine hydroxylase)를 발현시키는 방식으로 질환의 치료를 위해 PAH를 발현시키기 위해 비바이러스성 폐쇄형 DNA(ceDNA) 벡터를 사용하는 방법을 제공한다.
유전자 치료는 유전자 발현 프로파일의 이상으로 인한 유전자 돌연변이 또는 후천성 질환을 앓고 있는 환자의 임상 결과를 개선시키는 것을 목표로 한다. 유전자 치료는 장애, 질환, 악성종양 등을 초래할 수 있는, 결함이 있는 유전자, 또는 비정상적인 조절 또는 발현, 예를 들어 과소발현(underexpression) 또는 과발현으로 인한 의학적 병태의 치료 또는 예방을 포함한다. 예를 들어, 결함이 있는 유전자로 인한 질환 또는 장애는 교정(corrective) 유전 물질을 환자에게 전달하여 환자 내에서 유전 물질의 치료적 발현을 유도하거나, 또는 예를 들어 교정 유전 물질을 이용하여 결함 유전자를 변경하거나 침묵시켜 환자 내에서 유전 물질의 치료적 발현을 유도하는 방식으로 치료, 예방 또는 개선될 수 있다.
유전자 치료의 기초는, 예를 들어 긍정적인 기능획득 효과, 부정적인 기능손실 효과 또는 또 다른 결과를 유도할 수 있는 활성 유전자 산물(때때로 전이유전자로 지칭됨)을 전사 카세트에 공급하는 것이다. 이러한 결과는 항체, 기능성 효소 또는 융합 단백질과 같은 치료용 단백질의 발현에 기인한 것일 수 있다. 유전자 치료는 또한 다른 인자로 인한 질환 또는 악성종양을 치료하는 데 사용될 수 있다. 인간 단일유전 장애는 정상 유전자를 표적세포에 전달하여 발현시키는 방식으로 치료될 수 있다. 교정 유전자를 환자의 표적세포에 전달하여 발현시키는 것은 조작된 바이러스 및 바이러스성 유전자 전달 벡터의 사용을 포함하는 다양한 방법을 통해 수행될 수 있다. 다수의 이용 가능한 바이러스 유래 벡터(예를 들어, 재조합 레트로바이러스, 재조합 렌티바이러스, 재조합 아데노바이러스 등) 중에서, 재조합 아데노연관바이러스(rAAV: recombinant adeno-associated virus)는 유전자 치료에서 다목적 벡터로서 인기를 얻고 있다.
아데노연관바이러스(AAV: adeno-associated virus)는 파르보바이러스과에 속하며, 더욱 구체적으로는 데펜도파르보바이러스(dependoparvovirus) 속을 구성한다. AAV 유래 벡터(즉, 재조합 AAV(rAVV) 또는 AAV 벡터)는 다음과 같은 이유로 유전 물질의 전달에 매력적이다: (i) 이는 근세포와 뉴런을 포함하는 다양한 비(non)분열 및 분열 세포 유형을 감염(형질도입)시킬 수 있는 능력이 있음; (ii) 이는 바이러스 구조 유전자가 없기 때문에, 바이러스 감염에 대한 숙주세포 반응, 예를 들어 인터페론 매개 반응을 감소시킬 수 있음; (iii) 야생형 바이러스는 인간에서 비(non)병적으로 간주됨; (iv) 숙주세포 게놈에 통합될 수 있는 야생형 AAV와 대조적으로, 복제불능 AAV 벡터에는 rep 유전자가 결여되어 있고 일반적으로 에피솜으로 지속되기 때문에, 삽입 돌연변이유발 또는 유전독성의 위험을 제한할 수 있음; 및 (v) 다른 벡터 시스템과 비교하여, AAV 벡터는 일반적으로 상대적으로 불량한 면역원인 것으로 여겨져 중요한 면역 반응((ii) 참조)을 촉발시키지 않기 때문에, 벡터 DNA의 지속, 및 잠재적으로 치료용 전이유전자의 장기 발현을 얻을 수 있음.
하지만, 유전자 전달 벡터로서 AAV 입자를 사용하는 데에는 몇 가지 주요 결함이 있다. rAAV와 관련된 하나의 주요 단점은 약 4.5 kb로 제한된 이종 DNA 바이러스 패키징 용량으로(Dong 등의 문헌(1996); Athanasopoulos 등의 문헌(2004); Lai 등의 문헌(2010)), 그 결과, AAV 벡터의 사용은 150,000 Da 단백질 코딩 용량 미만으로 제한되어 있다. 두 번째 단점은, 집단에서 야생형 AAV 감염의 유병률로 인해, rAAV 유전자 치료 후보가 환자에서 벡터를 제거하는 중화 항체의 존재에 대해 스크리닝되어야 한다는 점이다. 세 번째 단점은, 초기 치료에서 제외되지 않았던 환자에게의 재투여를 막는 캡시드 면역원성과 관련이 있다. 환자의 면역계는 향후 치료를 방해하는 높은 역가의 항-AAV 항체를 생성하는 면역계를 자극하기 위해 "부스터(booster)" 주사로서 효과적으로 작용하는 벡터에 반응할 수 있다. 일부 최근 보고서는, 고용량 조건에서 면역원성에 대한 우려를 나타낸다. 또 다른 주목할 만한 단점은, 단일가닥 AAV DNA가 이종 유전자 발현 전 이중가닥 DNA로 전환되어야 한다는 점을 고려할 때, AAV 매개 유전자 발현의 개시가 상대적으로 느리다는 점이다.
또한, 캡시드를 갖는 통상적인 AAV 비리온은 AAV 게놈, rep 유전자 및 cap 유전자를 함유하는 플라스미드 또는 플라스미드들의 도입을 통해 생성된다(Grimm 등의 문헌(1998)). 하지만, 이러한 캡시드화된 AAV 바이러스 벡터는 특정 세포 및 조직 유형을 비효율적으로 형질도입하는 것으로 확인되었으며, 캡시드 또한 면역반응을 유도한다.
따라서, 유전자 치료를 위한 아데노연관바이러스(AAV) 벡터의 사용은 (환자 면역 반응으로 인해) 환자에게의 단회 투여, 최소 바이러스 패키징 용량(약 4.5 kb)으로 인한 AAV 벡터에서 전달에 적합한 전이유전자 유전 물질의 제한된 범위, 및 느린 AAV 매개 유전자 발현으로 인해 제한된다.
페닐케톤뇨증(PKU: phenylketonuria)은 PAH 유전자의 돌연변이에 의해 유발되는 희귀한 선천성 대사 이상이다. 페닐케톤뇨증(PKU)은 아미노산 페닐알라닌의 대사를 감소시킨다. 치료되지 않은 PKU는 지적 장애, 발작, 행동 문제 및 정신 장애로 이어질 수 있다. 이는 또한 퀴퀴한 냄새와 보다 옅은 색의 피부를 생성할 수 있다. PKU가 제대로 치료되지 않은 산모에서 태어난 아기는 심장 문제, 작은 머리 및 출생 시 저체중이 있을 수 있다. PKU는 효소 페닐알라닌 히드록실라아제(PAH)의 수준을 낮추는 PAH 유전자의 돌연변이로 인해 발생하며, 즉, PKU를 앓고 있는 대상은 이의 효소 활성 결핍을 유도하는 PAH의 돌연변이를 갖는다. PKU는 상염색체 열성으로, 이는 병태가 발생하기 위해서는 유전자의 두 개의 카피가 모두 돌연변이되어야 함을 의미한다. 효소 기능이 남아있는 지 여부에 따라, 전형적 PKU와 변이형 PKU의 2가지 주요 유형이 존재한다. 돌연변이된 PAH 유전자 카피가 1개 있는 사람들은 전형적으로 증상이 없다.
PAH는 통상적으로 간에서 발현되며, 식이(dietary) 페닐알라닌(phe)을 신경전달물질의 생성을 담당하는 아미노산인 티로신으로 대사시키는 데 필요한 효소이다. PAH는 페닐알라닌의 티로신으로의 히드록실화를 촉진시킨다. 결함이 있는 PAH 효소는 식이 페닐알라닌을 잠재적 독성 수준까지 축적시킨다.
PKU는 혈청 phe 수준을 상승시키는 효소 페닐알라닌 히드록실라아제(PAH)의 단일 유전자 결함에 의해 유발될 수 있다. PAH는 척추동물에서 phe을 티로신으로 전환시킨다. PAH의 부재 하에서, Phe을 제거하는 유일한 다른 메커니즘은 단백질 합성과, 알라닌 측쇄의 탈아미노화 및 산화적 탈카르복실화를 포함하는 부수적인 분해 경로이며, 이는 PKU 환자의 소변에서 확인되는 특징적인 페닐락테이트와 페닐아세테이트를 생성한다. 불행하게도, 전형적인 식이는 PAH의 부재 하에서 제거될 수 있는 것보다 더 많은 Phe를 함유한다. 결과적으로 PKU 환자에서 Phe가 축적되면, 비정상적인 뇌 발달 및 중증 정신지체를 포함하는 다수의 증상이 나타난다. (문헌[Kaufman, Proc Nat'l Acad Sci USA 96: 3160-3164, 1999]).
현재 표준 치료는 고도로 제한된 식이(페닐알라닌 (Phe)의 제한)이지만, 이러한 식이 제한은 유지하기가 어렵고 근본적인 결함을 교정하지 못하기 때문에 항상 효과적인 것이 아니다. 현재 PKU 치료법은 페닐알라닌을 함유한 식품을 적게 섭취하고 특수 보충제를 이용하는 것이다. 엄격한 식이요법은 출생 후 가능한 빨리 시작해야 하며, 평생은 아니더라도 적어도 10년 동안 계속되어야 한다. 치료되지 않은 채로 방치되면, PKU는 진행성 및 중증 신경계 장애를 초래할 수 있다. 미국에는 PKU를 앓고 있는 사람이 대략 16,500명 정도 살고 있으며, 현재까지 PKU의 유전적 결함을 해결할 수 있는 치료는 없다.
PKU의 생화학, 분자생물학 및 유전학을 이해하는 데 있어서의 엄청난 발전에도 불구하고, 이러한 장애에 대한 새로운 치료법을 개발하는 데에는 거의 진전이 없었다. PKU의 질환 변형(disease-modifying) 치료법에 대한 상당한 충족되지 않은 요구가 존재한다. 첫 번째로, 현재 치료법은 질환 변형이 아니며 일부 환자에서만 효과적이고, 여전히 엄격한 식이 제한을 필요로 하며, 순응하지 않으면 신경 손상을 유발할 수 있다. 두 번째로, PKU에 대해 승인된 유전자 치료법이 존재하지 않으며, 기존 항체로 인해 환자의 25% 내지 40%는 AAV 기반 치료를 사용할 수 없다. 나아가, AAV는 한 번만 투여될 수 있으며, 결과적인 PAH 수준은 효과적일 만큼 충분히 높지 않거나, 정상보다 높을 수 있으며, 용량 수준은 적정이 불가하다.
따라서, PKU의 치료를 위해 세포, 조직 또는 대상에서 치료용 PAH 단백질의 발현을 가능하게 하는 기술이 해당 분야에 필요하다.
본원에 기재된 기술은 공유결합으로 폐쇄된 말단을 갖는 캡시드 미함유(capsid-free)(예를 들어, 비바이러스성) DNA 벡터(본원에서 "폐쇄형 DNA 벡터" 또는 "ceDNA 벡터"로 지칭됨)(여기서 ceDNA 벡터는 코돈 최적화되고, PKU의 마우스 모델에서 페닐알라닌 수준(예를 들어, 발현 및 지속기간)의 최적 교정에 대해 시험된 특정 시스-요소(예를 들어, 특정 프로모터, 특정 인핸서, 및 특정 프로모터와 인핸서 조합)와 조합된 PAH 핵산 서열을 포함함)로부터 효소 페닐알라닌 히드록실라아제(PAH)를 발현시키는 방식으로 페닐케톤뇨증(PKU)을 치료하기 위한 방법 및 조성물에 관한 것이다. 일부 구현예에 따르면, 특정 코돈 최적화된 PAH 핵산 서열은 특정 프로모터 서열 및/또는 특정 인핸서 서열과 조합된 경우, 또 다른 프로모터 서열 및/또는 특정 인핸서 서열과 조합된 동일한 코돈 최적화된 PAH 핵산 서열에 비해 더 양호한 성능을 나타낸다. 본 개시내용에 기재된 바와 같이, 코돈 최적화된 서열을 포함하는 작제물은 본래 hPAH cDNA 서열보다 상당히 더 우수한 성능을 나타내었고, 코돈 최적화된 서열과 특정 시스-작용 요소를 포함하는 특정 작제물은 28일 연구 기간에 걸쳐 연장된 교정을 나타내어 발현과 효능의 지속성을 입증하였다. 놀랍게도, 특정 프로모터(예를 들어, hAAT CpG 최소화된 프로모터)를 포함하는 작제물이 PAHenu2 마우스 모델에서 생체내에서 특정 오픈리딩프레임(ORF)(ceDNA412 codop 2 ORF)을 이용한 경우 더 우수한 성능을 나타내는 것으로 확인되었지만, hAAT 프로모터는 일반적으로 시험관내에서 VD 프로모터(VD) 또는 3X VD보다, 또는 다른 ORF(예를 들어, 루시퍼라아제)를 이용한 경우보다 우위를 나타냈다.
이러한 ceDNA 벡터는 치료, 모니터링 및 진단을 위한 PAH 단백질의 생산에 사용될 수 있다. PKU의 치료를 위해 PAH를 발현하는 ceDNA 벡터를 대상에게 적용하는 것은, 다음과 같은 측면에서 유용하다: (i) 질환 변형 수준의 PAH 효소를 제공함, (ii) 최소 침습성으로 전달이 이루어짐, (iii) 반복 가능하고 용량 반응성임, (iv) 치료 효과의 개시가 신속함, (v) 간에서 교정 PAH 효소의 발현을 지속시킴, (vi) 페닐알라닌 대사가 기능하도록 요소 회로 기능을 회복시킴, 및/또는 (vii) 결함 효소의 적절한 약리학적 수준이 달성되도록 적정할 수 있음.
따라서, 본원에 기재된 개시내용은 세포에서 PAH 치료 단백질의 발현을 가능하게 하기 위해, 코돈 최적화되고 특정 시스-작용 요소(예를 들어, 특정 프로모터, 특정 인핸서, 및 특정 프로모터와 인핸서 조합)와 조합된 PAH 핵산 서열을 포함하는 공유결합으로 폐쇄된 말단을 갖는 캡시드 미함유(예를 들어, 비바이러스성) DNA 벡터(본원에서 "폐쇄형 DNA 벡터" 또는 "ceDNA 벡터"로 지칭됨)에 관한 것이다.
하나의 양태에서, 적어도 하나의 PAH 단백질을 인코딩하는 적어도 하나의 핵산 서열(여기서 적어도 하나의 핵산 서열은 표 1A에 열거된 서열 중 임의의 것과 적어도 90% 동일성을 갖는 서열에서 선택되고, 적어도 하나의 핵산 서열은 코돈 최적화되며, 적어도 하나의 핵산 서열은 플랭킹 역말단반복서열(ITR) 사이에 위치함)과, 적어도 하나의 PAH 단백질을 인코딩하는 적어도 하나의 핵산 서열에 작동적으로 연결된 프로모터(여기서 프로모터는 VD 프로모터, 인간 알파 1-항트립신(hAAT) 프로모터(hAAT(979) 프로모터와 적어도 96%, 97%, 98%, 99% 또는 100% 동일성을 갖는 서열(hAAT_core_C10), 또는 다른 CpG 최소화(CpGmin)_hAAT 프로모터, 예컨대 hAAT_core_C06; hAAT_core_C07; hAAT_core_C08 및 hAAT_core_C09 포함) 및 트랜스티레틴(TTR: transthyretin) 간(liver) 특이적 프로모터로 이루어지는 군에서 선택됨)를 포함하는 폐쇄형 DNA(ceDNA) 벡터가 본원에 개시되어 있다.
하나의 구현예에서, 적어도 하나의 PAH 단백질을 인코딩하는 적어도 하나의 핵산 서열은 표 1A에 제시된 서열 중 어느 하나와 적어도 95% 동일성을 갖는 서열에서 선택된다. 하나의 구현예에서, 적어도 하나의 PAH 단백질을 인코딩하는 적어도 하나의 핵산 서열은 표 1A에 제시된 서열 중 어느 하나와 적어도 96% 동일성을 갖는 서열에서 선택된다. 하나의 구현예에서, 적어도 하나의 PAH 단백질을 인코딩하는 적어도 하나의 핵산 서열은 표 1A에 제시된 서열 중 어느 하나와 적어도 97% 동일성을 갖는 서열에서 선택된다. 하나의 구현예에서, 적어도 하나의 PAH 단백질을 인코딩하는 적어도 하나의 핵산 서열은 표 1A에 제시된 서열 중 어느 하나와 적어도 98% 동일성을 갖는 서열에서 선택된다. 하나의 구현예에서, 적어도 하나의 PAH 단백질을 인코딩하는 적어도 하나의 핵산 서열은 표 1A에 제시된 서열 중 어느 하나와 적어도 99% 동일성을 갖는 서열에서 선택된다. 하나의 구현예에서, 적어도 하나의 PAH 단백질을 인코딩하는 적어도 하나의 핵산 서열은 표 1A에 제시된 서열 중 어느 하나를 포함하는 서열에서 선택된다.
또 다른 양태에 따르면, 본 개시내용은 적어도 하나의 PAH 단백질을 인코딩하는 핵산 서열(여기서 핵산 서열은 표 1A에 열거된 서열 중 임의의 것과 적어도 95% 동일성을 갖는 서열에서 선택되고, 적어도 하나의 핵산 서열은 플랭킹 역말단반복서열(ITR) 사이에 위치함)과, 적어도 하나의 PAH 단백질을 인코딩하는 핵산 서열에 작동적으로 연결된 프로모터(여기서 프로모터는 VD 프로모터, 인간 알파 1-항트립신(hAAT) 프로모터 및 트랜스티레틴(TTR) 간 특이적 프로모터로 이루어지는 군에서 선택됨)를 포함하는 폐쇄형 DNA(ceDNA) 벡터를 제공한다.
또 다른 양태에 따르면, 본 개시내용은 적어도 하나의 PAH 단백질을 인코딩하는 핵산 서열(여기서 핵산 서열은 표 1A에 열거된 서열 중 임의의 것과 적어도 96% 동일성을 갖는 서열에서 선택되고, 적어도 하나의 핵산 서열은 플랭킹 역말단반복서열(ITR) 사이에 위치함)과, 적어도 하나의 PAH 단백질을 인코딩하는 핵산 서열에 작동적으로 연결된 프로모터(여기서 프로모터는 VD 프로모터, 인간 알파 1-항트립신(hAAT) 프로모터 및 트랜스티레틴(TTR) 간 특이적 프로모터로 이루어지는 군에서 선택됨)를 포함하는 폐쇄형 DNA(ceDNA) 벡터를 제공한다.
또 다른 양태에 따르면, 본 개시내용은 적어도 하나의 PAH 단백질을 인코딩하는 핵산 서열(여기서 핵산 서열은 표 1A에 열거된 서열 중 임의의 것과 적어도 97% 동일성을 갖는 서열에서 선택되고, 적어도 하나의 핵산 서열은 플랭킹 역말단반복서열(ITR) 사이에 위치함)과, 적어도 하나의 PAH 단백질을 인코딩하는 핵산 서열에 작동적으로 연결된 프로모터(여기서 프로모터는 VD 프로모터, 인간 알파 1-항트립신(hAAT) 프로모터 및 트랜스티레틴(TTR) 간 특이적 프로모터로 이루어지는 군에서 선택됨)를 포함하는 폐쇄형 DNA(ceDNA) 벡터를 제공한다.
또 다른 양태에 따르면, 본 개시내용은 적어도 하나의 PAH 단백질을 인코딩하는 핵산 서열(여기서 핵산 서열은 표 1A에 열거된 서열 중 임의의 것과 적어도 98% 동일성을 갖는 서열에서 선택되고, 적어도 하나의 핵산 서열은 플랭킹 역말단반복서열(ITR) 사이에 위치함)과, 적어도 하나의 PAH 단백질을 인코딩하는 핵산 서열에 작동적으로 연결된 프로모터(여기서 프로모터는 VD 프로모터, 인간 알파 1-항트립신(hAAT) 프로모터 및 트랜스티레틴(TTR) 간 특이적 프로모터로 이루어지는 군에서 선택됨)를 포함하는 폐쇄형 DNA(ceDNA) 벡터를 제공한다.
또 다른 양태에 따르면, 본 개시내용은 적어도 하나의 PAH 단백질을 인코딩하는 핵산 서열(여기서 핵산 서열은 표 1A에 열거된 서열 중 임의의 것과 적어도 99% 동일성을 갖는 서열에서 선택되고, 적어도 하나의 핵산 서열은 플랭킹 역말단반복서열(ITR) 사이에 위치함)과, 적어도 하나의 PAH 단백질을 인코딩하는 핵산 서열에 작동적으로 연결된 프로모터(여기서 프로모터는 VD 프로모터, 인간 알파 1-항트립신(hAAT) 프로모터 및 트랜스티레틴(TTR) 간 특이적 프로모터로 이루어지는 군에서 선택됨)를 포함하는 폐쇄형 DNA(ceDNA) 벡터를 제공한다.
하나의 구현예에서, 적어도 하나의 PAH 단백질을 인코딩하는 적어도 하나의 핵산 서열은 서열번호 382로 제시된 서열과 적어도 98% 동일성을 갖는 서열이다. 하나의 구현예에서, 적어도 하나의 PAH 단백질을 인코딩하는 적어도 하나의 핵산 서열은 서열번호 382로 제시된 서열과 적어도 99% 동일성을 갖는 서열이다. 하나의 구현예에서, 적어도 하나의 PAH 단백질을 인코딩하는 적어도 하나의 핵산 서열은 서열번호 382를 포함하거나 서열번호 382로 이루어진다.
하나의 구현예에서, 적어도 하나의 PAH 단백질을 인코딩하는 적어도 하나의 핵산 서열은 서열번호 425로 제시된 서열과 적어도 99% 동일성을 갖는 서열이다. 하나의 구현예에서, 적어도 하나의 PAH 단백질을 인코딩하는 적어도 하나의 핵산 서열은 서열번호 425로 제시된 서열이다. 하나의 구현예에서, 적어도 하나의 PAH 단백질을 인코딩하는 적어도 하나의 핵산 서열은 서열번호 431로 제시된 서열과 적어도 99% 동일성을 갖는 서열이다. 하나의 구현예에서, 적어도 하나의 PAH 단백질을 인코딩하는 적어도 하나의 핵산 서열은 서열번호 431로 제시된 서열이다. 하나의 구현예에서, 적어도 하나의 PAH 단백질을 인코딩하는 적어도 하나의 핵산 서열은 서열번호 435로 제시된 서열과 적어도 99% 동일성을 갖는 서열이다. 하나의 구현예에서, 적어도 하나의 PAH 단백질을 인코딩하는 적어도 하나의 핵산 서열은 서열번호 435로 제시된 서열이다.
하나의 구현예에서, 프로모터는 서열번호 441 내지 448 중 어느 하나와 적어도 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일하거나, 서열번호 441 내지 448 중 어느 하나를 포함하거나, 또는 서열번호 441 내지 448 중 어느 하나로 이루어진 서열, 및/또는 표 7A에 제시된 서열을 포함한다.
하나의 구현예에서, 프로모터는 서열번호 191과 적어도 85% 동일성, 적어도 90% 동일성, 적어도 95% 동일성, 적어도 96% 동일성, 적어도 97% 동일성, 적어도 98% 동일성, 적어도 99% 동일성을 갖는 핵산 서열을 포함하거나, 서열번호 191을 포함한다.
본원의 양태 및 구현예의 하나의 구현예에서, 프로모터는 서열번호 443과 적어도 98% 동일성을 갖는 핵산 서열을 포함한다. 본원의 양태 및 구현예의 하나의 구현예에서, 프로모터는 서열번호 444와 적어도 99% 동일성을 갖는 핵산 서열을 포함한다. 본원의 양태 및 구현예의 하나의 구현예에서, 프로모터는 서열번호 445와 적어도 99% 동일성을 갖는 핵산 서열을 포함한다. 본원의 양태 및 구현예의 하나의 구현예에서, 프로모터는 서열번호 446과 적어도 99% 동일성을 갖는 핵산 서열을 포함한다. 본원의 양태 및 구현예의 하나의 구현예에서, 프로모터는 서열번호 447과 적어도 96% 동일성을 갖는 핵산 서열을 포함한다. 본원의 양태 및 구현예의 하나의 구현예에서, 프로모터는 서열번호 462와 적어도 85% 동일성을 갖는 핵산 서열을 포함하는 프로모터 세트이다. 본원의 양태 및 구현예의 하나의 구현예에서, 프로모터는 서열번호 467과 적어도 85% 동일성을 갖는 핵산 서열을 포함하는 프로모터 세트이다. 본원의 양태 및 구현예의 하나의 구현예에서, 프로모터는 서열번호 470과 적어도 85% 동일성을 갖는 핵산 서열을 포함하는 프로모터 세트이다. 본원의 양태 및 구현예의 하나의 구현예에서, 프로모터는 서열번호 470과 적어도 90% 동일성을 갖는 핵산 서열을 포함하는 프로모터 세트이다. 본원의 양태 및 구현예의 하나의 구현예에서, 프로모터는 서열번호 470과 적어도 95% 동일성을 갖는 핵산 서열을 포함하는 프로모터 세트이다.
하나의 구현예에서, ceDNA 벡터는 인핸서를 추가로 포함한다. 하나의 구현예에서, 인핸서는 서열번호 449 내지 461 중 어느 하나와 적어도 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일하거나, 서열번호 449 내지 461 중 어느 하나를 포함하거나, 또는 서열번호 449 내지 461 중 어느 하나로 이루어진 서열, 및/또는 표 8A에 제시된 서열을 포함한다. 하나의 구현예에서, 인핸서는 세르핀 인핸서, 3xHNF1-4_ProEnh_10mer 및 5xHNF1_ProEnh_10mer로 이루어지는 군에서 선택된다. 하나의 구현예에서, 인핸서는 서열번호 450과 적어도 85% 동일성을 갖는 핵산 서열을 포함한다. 하나의 구현예에서, 인핸서는 서열번호 586과 적어도 85% 동일성을 갖는 핵산 서열을 포함한다. 하나의 구현예에서, 인핸서는 서열번호 587과 적어도 85% 동일성을 갖는 핵산 서열을 포함한다.
하나의 구현예에서, ceDNA 벡터는 하나 이상의 인트론을 추가로 포함한다. 하나의 구현예에서, 하나 이상의 인트론은 서열번호 509 내지 516 및 1000 중 어느 하나와 적어도 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일하거나, 서열번호 509 내지 516 및 1000 중 어느 하나를 포함하거나, 또는 서열번호 509 내지 516 및 1000 중 어느 하나로 이루어진 서열, 및/또는 표 11A에 제시된 서열을 포함한다. 하나의 구현예에서, 하나 이상의 인트론은 미세생쥐바이러스(MVM:minute virus of mice)이다.
하나의 구현예에서, ceDNA 벡터는 3' 미번역 영역(3' UTR)을 포함한다. 하나의 구현예에서, 3' UTR은 서열번호 517 내지 525 중 어느 하나와 적어도 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일하거나, 서열번호 517 내지 525 중 어느 하나를 포함하거나, 또는 서열번호 517 내지 525 중 어느 하나로 이루어진 서열, 및/또는 표 12에 제시된 서열을 포함한다.
하나의 구현예에서, ceDNA 벡터는 5' 미번역 영역(5' UTR)을 포함한다. 하나의 구현예에서, 5' UTR은 서열번호 482 내지 508 중 어느 하나와 적어도 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일하거나, 서열번호 482 내지 508 중 어느 하나를 포함하거나, 또는 서열번호 482 내지 508 중 어느 하나로 이루어진 서열, 및/또는 표 10에 제시된 서열을 포함한다.
하나의 구현예에서, ceDNA 벡터는 적어도 하나의 polyA 서열을 포함한다.
하나의 구현예에서, VD 프로모터는 SERP 인핸서를 포함한다. 하나의 구현예에서, VD 프로모터는 3xSERP 인핸서를 포함한다.
하나의 구현예에서, 프로모터는 TTR 간 프로모터이고, ceDNA는 MVM 인트론을 추가로 포함한다.
하나의 구현예에서, ceDNA 벡터는 서열번호 194, 서열번호 195, 서열번호 196, 서열번호 197, 서열번호 198, 서열번호 199, 서열번호 200, 서열번호 201, 서열번호 202, 서열번호 203, 서열번호 204, 서열번호 205, 서열번호 206, 서열번호 207, 서열번호 208, 서열번호 209, 서열번호 210, 서열번호 211, 서열번호 212, 서열번호 213, 서열번호 541, 서열번호 542, 서열번호 543, 서열번호 544, 서열번호 545, 서열번호 546, 서열번호 547, 서열번호 548, 서열번호 549, 서열번호 550, 서열번호 551, 서열번호 552, 서열번호 553, 서열번호 554, 서열번호 555, 서열번호 556, 서열번호 557, 서열번호 558, 서열번호 559, 서열번호 560, 서열번호 561, 서열번호 562, 서열번호 563, 서열번호 564, 서열번호 565, 서열번호 566, 서열번호 567, 서열번호 570, 서열번호 571, 서열번호 572, 서열번호 573, 서열번호 574, 서열번호 575, 서열번호 576, 서열번호 577, 서열번호 578, 서열번호 579, 서열번호 580, 서열번호 581, 서열번호 582, 서열번호 583 및 서열번호 584로 이루어지는 군에서 선택되는 핵산 서열과 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 동일하거나, 이러한 서열을 포함하거나, 또는 이러한 서열로 이루어진 핵산 서열을 포함한다.
하나의 구현예에서, 적어도 하나의 핵산 서열은 PAH에 대한 cDNA이다.
하나의 구현예에서, 적어도 하나의 ITR은 기능성 말단 분해 부위(TRS)와 Rep 결합 부위를 포함한다. 하나의 구현예에서, ITR 중 하나 또는 둘 모두는 파르보바이러스, 데펜도바이러스 및 아데노연관바이러스(AAV)에서 선택되는 바이러스이다. 하나의 구현예에서, 플랭킹 ITR은 대칭 또는 비대칭이다. 하나의 구현예에서, 플랭킹 ITR은 대칭 또는 실질적으로 대칭이다. 하나의 구현예에서, 플랭킹 ITR은 비대칭이다. 하나의 구현예에서, ITR 중 하나 또는 둘 모두는 야생형이거나, 두 개의 ITR이 모두 야생형이다. 하나의 구현예에서, 플랭킹 ITR은 상이한 바이러스 혈청형에서 유래한 것이다. 하나의 구현예에서, 플랭킹 ITR은 표 2에 제시된 한 쌍의 바이러스 혈청형에서 유래한 것이다. 하나의 구현예에서, ITR 중 하나 또는 둘 모두는 표 3, 표 5A, 표 5B 또는 표 6의 서열에서 선택되는 서열을 포함한다.
하나의 구현예에서, ITR 중 적어도 하나는 ITR의 전반적인 3차원 입체형태에 영향을 미치는 결실, 부가 또는 치환에 의해 야생형 AAV ITR 서열로부터 변경된다. 하나의 구현예에서, ITR 중 하나 또는 둘 모두는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11 및 AAV12에서 선택되는 AAV 혈청형에서 유도된다.
하나의 구현예에서, ITR 중 하나 또는 둘 모두는 합성이다. 하나의 구현예에서, ITR 중 하나 또는 둘 모두는 야생형 ITR이 아니거나, 두 개의 ITR이 모두 야생형이 아니다.
하나의 구현예에서, ITR 중 하나 또는 둘 모두는 A, A', B, B', C, C', D 및 D'에서 선택되는 ITR 영역 중 적어도 하나에서 결실, 삽입 및/또는 치환에 의해 변형된다. 하나의 구현예에서, 상기 결실, 삽입 및/또는 치환은 통상적으로 A, A', B, B' C, 또는 C' 영역으로 형성된 스템-루프 구조의 전부 또는 일부를 결실시킨다.
하나의 구현예에서, ITR 중 하나 또는 둘 모두는 통상적으로 B 및 B' 영역으로 형성된 스템-루프 구조의 전부 또는 일부의 결실을 초래하는 결실, 삽입 및/또는 치환에 의해 변형된다. 하나의 구현예에서, ITR 중 하나 또는 둘 모두는 통상적으로 C 및 C' 영역으로 형성된 스템-루프 구조의 전부 또는 일부의 결실을 초래하는 결실, 삽입 및/또는 치환에 의해 변형된다. 하나의 구현예에서, ITR 중 하나 또는 둘 모두는 통상적으로 B 및 B' 영역으로 형성된 스템-루프 구조의 일부 및/또는 통상적으로 C 및 C' 영역으로 형성된 스템-루프 구조의 일부의 결실을 초래하는 결실, 삽입 및/또는 치환에 의해 변형된다. 하나의 구현예에서, ITR 중 하나 또는 둘 모두는 통상적으로 B 및 B' 영역으로 형성된 제1 스템-루프 구조와 C 및 C' 영역으로 형성된 제2 스템-루프 구조를 포함하는 영역에 단일 스템-루프 구조를 포함한다. 하나의 구현예에서, ITR 중 하나 또는 둘 모두는 통상적으로 B 및 B' 영역으로 형성된 제1 스템-루프 구조와 C 및 C' 영역으로 형성된 제2 스템-루프 구조를 포함하는 영역에 단일 스템과 2개의 루프를 포함한다.
하나의 구현예에서, ITR 중 하나 또는 둘 모두는 통상적으로 B 및 B' 영역으로 형성된 제1 스템-루프 구조와 C 및 C' 영역으로 형성된 제2 스템-루프 구조를 포함하는 영역에 단일 스템과 단일 루프를 포함한다.
하나의 구현예에서, ITR이 서로에 대해 역전될 때, 두 개의 ITR은 모두 전반적인 3차원 대칭을 이루는 방식으로 변경된다.
하나의 구현예에서, ceDNA 벡터는 서열번호 382 내지 440 또는 서열번호 1011 내지 1015와 적어도 90% 동일한 핵산 서열을 포함한다. 하나의 구현예에서, ceDNA 벡터는 서열번호 382 내지 440 또는 서열번호 1011 내지 1015와 적어도 95% 동일한 핵산 서열을 포함한다. 하나의 구현예에서, ceDNA 벡터는 서열번호 382 내지 440 또는 서열번호 1011 내지 1015와 적어도 96% 동일한 핵산 서열을 포함한다. 하나의 구현예에서, ceDNA 벡터는 서열번호 382 내지 440 또는 서열번호 1011 내지 1015와 적어도 97% 동일한 핵산 서열을 포함한다. 하나의 구현예에서, ceDNA 벡터는 서열번호 382 내지 440 또는 서열번호 1011 내지 1015와 적어도 98% 동일한 핵산 서열을 포함한다. 하나의 구현예에서, ceDNA 벡터는 서열번호 382 내지 440 또는 서열번호 1011 내지 1015와 적어도 99% 동일한 핵산 서열을 포함한다.
또 다른 양태에서, 세포에서 PAH 단백질을 발현시키는 방법으로서, 세포를 본원에 개시된 ceDNA 벡터와 접촉시키는 단계를 포함하는 방법이 본원에 개시되어 있다. 하나의 구현예에서, 세포는 광수용체 또는 RPE 세포이다. 하나의 구현예에서, 세포는 시험관내 또는 생체내에서 접촉된다.
또 다른 양태에서, 페닐케톤뇨증(PKU)을 앓고 있는 대상을 치료하는 방법으로서, 본원에 개시된 ceDNA 벡터를 상기 대상에게 투여하는 단계를 포함하는 방법이 본원에 개시되어 있다. 하나의 구현예에서, 적어도 하나의 PAH 단백질을 인코딩하는 적어도 하나의 핵산 서열은 표 1A에 제시된 서열 중 임의의 것과 적어도 90% 동일성을 갖는 서열에서 선택된다. 하나의 구현예에서, 대상은 투여 전 대상의 혈청 페닐알라닌 수준과 비교하여 혈청 페닐알라닌 수준의 적어도 약 50% 감소를 나타낸다. 하나의 구현예에서, 대상은 투여 전 PAH 활성 수준과 비교하여 투여 후 PAH 활성의 적어도 약 10%의 증가를 나타낸다.
하나의 구현예에서, ceDNA 벡터는 지질 나노입자로 제형화된다. 하나의 구현예에서, ceDNA 벡터는 정맥내로 투여된다. 하나의 구현예에서, ceDNA 벡터는 근육내로 투여된다. 하나의 구현예에서, ceDNA 벡터는 주입을 통해 투여된다.
또 다른 양태에서, ceDNA 벡터를 포함하는 약학적 조성물이 본원에 개시되어 있다.
또 다른 양태에서, ceDNA 벡터와 지질을 포함하는 조성물이 본원에 개시되어 있다. 하나의 구현예에서, 지질은 지질 나노입자(LNP)이다.
또 다른 양태에서, 본원에 개시된 ceDNA 벡터, 본원에 개시된 약학적 조성물 또는 본원에 개시된 조성물을 포함하는 키트가 본원에 개시되어 있다. 하나의 구현예에서, 키트는 사용 설명서를 포함한다.
본 개시내용의 이러한 및 다른 양태는 하기에 보다 상세하게 기재되어 있다.
본 특허 또는 출원 파일은 컬러로 작성된 적어도 하나의 도면을 포함한다. 컬러 도면(들)을 포함하는 본 특허 또는 특허 출원 공개의 카피는 요청 및 필요한 수수료 지불 시 해당 관청에서 제공받을 수 있다.
상기 간략하게 개략되어 있고 하기 보다 상세하게 논의되는 본 개시내용의 구현예는, 첨부된 도면에 도시된 본 개시내용의 예시적인 구현예를 참조로 이해될 수 있다. 하지만, 첨부된 도면은 본 개시내용의 단지 전형적인 구현예를 예시하는 것으로, 본 개시내용의 범위를 제한하는 것으로 간주되어서는 안 되며, 본 개시내용은 다른 동등하게 효과적인 구현예를 허용할 수 있다.
도 1a는, A-A' 아암, B-B' 아암, C-C' 아암, 2개의 Rep 결합 부위(RBE 및 RBE')가 확인되는 AAV2의 야생형 좌측 ITR(서열번호 52)의 T-형 스템-루프 구조를 제공하고, 또한 말단 분해 부위(TRS)를 보여준다. RBE는 Rep 78 또는 Rep 68과 상호작용하는 것으로 여겨지는 일련의 4개의 이중체 사량체를 함유한다. 나아가, RBE'는 또한 작제물 내 야생형 ITR 또는 돌연변이된 ITR 상에 어셈블링된 Rep 복합체와 상호작용하는 것으로 여겨진다. D 및 D' 영역은 전사인자 결합 부위와 다른 보존된 구조를 함유한다. 도 1b는, A-A' 아암, B-B' 아암, C-C' 아암, 2개의 Rep 결합 부위(RBE 및 RBE')가 확인되는 AAV2의 야생형 좌측 ITR의 T-형 스템-루프 구조를 포함하는 야생형 좌측 ITR(서열번호 53)에서의 제안된 Rep 촉매화된 닉킹 및 결찰 활성을 보여주고, 또한 말단 분해 부위(TRS), 및 몇몇 전사인자 결합 부위와 다른 보존된 구조를 포함하는 D 및 D' 영역을 보여준다.
도 2a는, 야생형 좌측 AAV2 ITR(서열번호 54)의 A-A' 아암의 RBE 함유 부분과 C-C' 및 B-B' 아암의 1차 구조(폴리핵산 서열)(좌측)와 2차 구조(우측)를 보여준다. 도 2b는, 좌측 ITR에 대한 예시적인 돌연변이된 ITR(변형된 ITR로도 지칭됨) 서열을 보여준다. 예시적인 돌연변이된 좌측 ITR(ITR-1, 좌측)(서열번호 113)의 A-A' 아암의 RBE 부분과 C 아암 및 B-B' 아암의 1차 구조(좌측)와 예측된 2차 구조(우측)가 제시되어 있다. 도 2c는, 야생형 우측 AAV2 ITR(서열번호 55)의 A-A' 루프의 RBE 함유 부분과 B-B' 및 C-C' 아암의 1차 구조(좌측)와 2차 구조(우측)를 보여준다. 도 2d는, 예시적인 우측 변형된 ITR을 보여준다. 예시적인 돌연변이 우측 ITR(ITR-1, 우측)(서열번호 114)의 A-A' 아암의 RBE 함유 부분과 B-B' 및 C 아암의 1차 구조(좌측)와 예측된 2차 구조(우측)가 제시되어 있다. 좌측 및 우측 ITR(예를 들어, AAV2 ITR, 또는 다른 바이러스 혈청형 또는 합성 ITR)의 임의의 조합이 본원에 교시된 바와 같이 사용될 수 있다. 도 2a 내지 도 2d 각각에서, 폴리뉴클레오타이드 서열은 본원에 기재된 바와 같은 ceDNA를 생산하는 데 사용되는 플라스미드 또는 박미드/바큘로바이러스 게놈에 사용된 서열을 나타낸다. 또한, 도 2a 내지 도 2d 각각에는, 플라스미드 또는 박미드/바큘로바이러스 게놈의 ceDNA 벡터 구성 및 예측된 깁스 자유 에너지 값에서 추론된 상응하는 ceDNA 2차 구조가 포함되어 있다.
도 3a는, 도 3b의 개략도에 기재된 공정에서 본원에 개시된 바와 같은 PAH의 발현을 위한 ceDNA 벡터의 생산에 유용한 바큘로바이러스 감염된 곤충 세포(BIIC)를 제조하는 업스트림 공정을 예시하는 개략도이다. 도 3b는 예시적인 ceDNA 생산 방법의 개략도이고, 도 3c는 ceDNA 벡터 생산을 확인하기 위한 생화학적 방법 및 공정을 예시한다. 도 3d 및 도 3e는, 도 3b의 ceDNA 생산 공정 동안 수득된 세포 펠릿에서 수거된 DNA에서 ceDNA의 존재를 식별하는 공정을 설명하는 개략도이다. 도 3d는, 절단되지 않은 채로 유지되거나 제한 엔도뉴클레아제로 소화된 후, 미변성 겔 또는 변성 겔 상에서 전기영동에 적용된 예시적인 ceDNA에 대한 개략적인 예상 밴드를 보여준다. 가장 좌측의 개략도는 미변성 겔이며, 이는 이중체 및 절단되지 않은 형태에서 ceDNA가, 더 빠르게 이동하는 더 작은 단량체와 단량체 크기의 2배인 더 느리게 이동하는 이량체로 보이는, 적어도 단량체와 이량체 상태로 존재함을 시사한다. 좌측에서 두 번째 개략도는, ceDNA가 제한 엔도뉴클레아제로 절단되는 경우, 본래 밴드가 사라지고, 절단 후 남아있는 예상 단편 크기에 상응하는 더 빠르게 이동하는(예를 들어, 더 작은) 밴드가 나타남을 보여준다. 변성 조건 하에서, 본래 이중체 DNA는 단일가닥이며, 이는 상보적 가닥이 공유결합으로 연결되어 있기 때문에, 미변성 겔 상에서 관찰된 것 보다 2배 더 큰 종으로 이동한다. 따라서, 우측에서 두 번째 개략도에서, 소화된 ceDNA는 미변성 겔에서 관찰된 것과 유사한 밴딩 분포를 보여주지만, 밴드는 미변성 겔 대응물의 2배 크기의 단편으로 이동한다. 가장 우측의 개략도는, 변성 조건 하에서 절단되지 않은 ceDNA가 단일가닥 개방형 고리로 이동하기 때문에, 관찰된 밴드는 고리가 개방되지 않은 미변성 조건에서 관찰된 것의 2배 크기임을 보여준다. 이러한 도면에서, "kb"는, 문맥에 따라, 뉴클레오타이드 사슬 길이(예를 들어, 변성 조건에서 관찰된 단일가닥 분자의 경우) 또는 염기쌍의 수(예를 들어, 미변성 조건에서 관찰된 이중가닥 분자의 경우)를 기반으로 뉴클레오타이드 분자의 상대적인 크기를 나타내는 데 사용된다. 도 3e는, 비연속 구조를 갖는 DNA를 보여준다. ceDNA는 ceDNA 벡터 상에 단일 인식 부위를 갖는 제한 엔도뉴클레아제에 의해 절단되어, 중성 및 변성 조건 모두에서 상이한 크기(1 kb 및 2 kb)를 갖는 2개의 DNA 단편을 생성할 수 있다. 도 3e는, 선형 및 연속 구조를 갖는 ceDNA를 또한 보여준다. ceDNA 벡터는 제한 엔도뉴클레아제에 의해 절단되어, 중성 조건에서는 1 kb 및 2 kb로 이동하는 2개의 DNA 단편을 생성할 수 있지만, 변성 조건에서는 가닥이 연결된 채로 유지되어 2 kb 및 4 kb로 이동하는 단일 가닥을 생성할 수 있다.
도 4는, 엔도뉴클레아제로 소화되거나(+) 소화되지 않은(-) ceDNA 벡터의 변성 겔 전개 예들의 예시적인 도면이다(ceDNA 작제물 1 및 2의 경우 EcoRI; ceDNA 작제물 3 및 4의 경우 BamH1; ceDNA 작제물 5 및 6의 경우 SpeI; 및 ceDNA 작제물 7 및 8의 경우 XhoI). 작제물 1 내지 8은 국제 특허 출원 PCT/US18/49996(이는 그 전문이 본원에 참조로 인용됨)의 실시예 1에 기재되어 있다. 별표로 강조된 밴드의 크기를 결정하고 도면의 하단에 제공하였다.
도 5a 내지 도 5e는, 실시예 6에 기재된 실험 결과를 도시한 그래프이다. 페닐알라닌 농도("PHE μM") 교정에 대한 코돈 최적화된 PAH 핵산 서열을 포함하는 ceDNA 벡터(ceDNA412; hPAH_codop_ORF_v2), 또는 3xHS-CRM8_SERP_Enhancer, TTR-promoter-d5pUTR 및 MVM_intron을 갖는 코돈 최적화된 PAH 핵산 서열을 포함하는 ceDNA 벡터(ceDNA1530; hPAH-r5-s29)의 영향을 0.5 ㎍ 및 5 ㎍ 유체역학적 용량으로 21일에 걸쳐 개별 마우스에서 평가하였다.
도 6a 및 도 6b는, 실시예 7에 기재된 실험 결과를 도시한 그래프이다. 페닐알라닌 농도("PHE μM") 교정에 대한 코돈 최적화된 PAH 핵산 서열을 포함하는ceDNA 벡터(ceDNA412, ceDNA1132, ceDNA1274 및 ceDNA1527)의 영향을 0.5 ㎍ 및 5 ㎍ 유체역학적 용량으로 개별 마우스에서 평가하였고, 각 군의 모든 5마리 마우스에 대한 평균 교정을 도 6a 및 도 6b의 그래프에 제시하였다. PHE 농도는 대조군 동물(PAHenu2: 비히클)에서 감소하지 않았다.
도 7a 내지 도 7g는, 개별 마우스에 대한 실시예 7에 기재된 실험 결과를 도시한 그래프이다.
도 8a 및 도 8b는, 실시예 8에 기재된 실험 결과를 도시한 그래프이다. 페닐알라닌 농도("PHE μM") 교정에 대한 코돈 최적화된 PAH 핵산 서열을 포함하는ceDNA 벡터(ceDNA1416, ceDNA1428, ceDNA1528 및 ceDNA1414)의 영향을 0.5 ㎍ 및 5 ㎍ 유체역학적 용량으로 7일 후 개별 마우스에서 평가하였고, 각 군의 모든 5마리 마우스에 대한 평균 교정을 도 8a 및 도 8b의 그래프에 제시하였다. PHE 농도는 대조군 동물(PAHenu2: 비히클)에서 감소하지 않았다.
도 9a 내지 도 9e는, 실시예 8에 기재된 실험 결과를 도시한 그래프이다. 페닐알라닌 농도("PHE μM") 교정에 대한 코돈 최적화된 PAH 핵산 서열을 포함하는ceDNA 벡터(ceDNA1416, ceDNA1428, ceDNA1414 및 ceDNA1528)의 영향을 0.5 ㎍ 유체역학적 용량으로 7일 후 개별 마우스에서 평가하였다.
도 10a 내지 도 10e는, 실시예 8에 기재된 실험 결과를 도시한 그래프이다. 페닐알라닌 농도("PHE μM") 교정에 대한 코돈 최적화된 PAH 핵산 서열을 포함하는ceDNA 벡터(ceDNA1416, ceDNA1428, ceDNA1414 및 ceDNA1528)의 영향을 5 ㎍ 유체역학적 용량으로 7일 후 개별 마우스에서 평가하였다.
도 11a 및 도 11b는, 실시예 8에 기재된 실험 결과를 도시한 그래프이다. 페닐알라닌 농도("PHE μM") 교정에 대한 코돈 최적화된 PAH 핵산 서열을 포함하는ceDNA 벡터(ceDNA1416, ceDNA1428, ceDNA1414 및 ceDNA1528)의 영향을 0.5 ㎍ 및 5 ㎍ 유체역학적 용량으로 28일 후 개별 마우스에서 평가하였고, 각 군의 모든 5마리 마우스에 대한 평균 교정을 도 11a 및 도 11b의 그래프에 제시하였다. PHE 농도는 대조군 동물(PAHenu2: 비히클)에서 감소하지 않았다.
도 12a 내지 도 12e는, 실시예 8에 기재된 실험 결과를 도시한 그래프이다. 페닐알라닌 농도("PHE μM") 교정에 대한 코돈 최적화된 PAH 핵산 서열을 포함하는ceDNA 벡터(ceDNA1416, ceDNA1428, ceDNA1414 및 ceDNA1528)의 영향을 0.5 ㎍ 유체역학적 용량으로 28일 후 개별 마우스에서 평가하였다.
도 13a 내지 도 13e는, 실시예 8에 기재된 실험 결과를 도시한 그래프이다. 페닐알라닌 농도("PHE μM") 교정에 대한 코돈 최적화된 PAH 핵산 서열을 포함하는ceDNA 벡터(ceDNA1416, ceDNA1428, ceDNA1414 및 ceDNA1528)의 영향을 5 ㎍ 유체역학적 용량으로 28일 후 개별 마우스에서 평가하였다.
도 14a 내지 도 14i는, 실시예 8에 기재된 실험 결과를 도시한 그래프이다. 페닐알라닌 농도("PHE μM") 교정에 대한 코돈 최적화된 PAH 핵산 서열을 포함하는ceDNA 벡터(ceDNA412, ceDNA1430, ceDNA1432, ceDNA1473, ceDNA1474, ceDNA1436, ceDNA1471, ceDNA1472)의 영향을 5 ㎍ 유체역학적 용량으로 7일 후 개별 마우스에서 평가하였다.
도 15a 내지 도 15i는, 실시예 9에 기재된 실험 결과를 도시한 그래프이다. 혈청 페닐알라닌 수준("PHE μM") 교정에 대한 코돈 최적화된 PAH 핵산 서열을 포함하는ceDNA 벡터(ceDNA412, ceDNA1476, ceDNA1479, ceDNA1939, ceDNA1940, ceDNA1941, ceDNA1942, ceDNA1943, ceDNA1944)의 영향을 0.5 ㎍ 유체역학적 용량으로 28일 후 개별 마우스에서 평가하였다.
도 16a 내지 도 16d는, 실시예 10에 기재된 실험 결과를 도시한 그래프이다. 혈청 페닐알라닌 수준("PHE μM") 교정에 대한 코돈 최적화된 PAH 핵산 서열을 포함하는ceDNA 벡터(ceDNA412, ceDNA1939, ceDNA1955, ceDNA62)의 영향을 0.5 ㎍ 유체역학적 용량으로 28일 후 개별 마우스에서 평가하였다.
도 17a 내지 도 17h는, 실시예 11에 기재된 실험 결과를 도시한 그래프이다. 혈청 페닐알라닌 수준("PHE μM") 교정에 대한 코돈 최적화된 PAH 핵산 서열을 포함하는ceDNA 벡터(ceDNA412, ceDNA2409, ceDNA2410, ceDNA2415, ceDNA2418, ceDNA2416, ceDNA2419, ceDNA2420)의 영향을 0.5 ㎍ 유체역학적 용량으로 28일 후 개별 마우스에서 평가하였다.
도 18a 내지 도 18d는, 실시예 11에 기재된 실험 결과를 도시한 그래프이다. 혈청 페닐알라닌 수준("PHE μM") 교정에 대한 코돈 최적화된 PAH 핵산 서열을 포함하는ceDNA 벡터(ceDNA2415, ceDNA2418)의 영향을 0.1 ㎍ 유체역학적 용량으로 28일 후 개별 마우스에서 평가하였다.
도 19a 내지 도 19f는, 실시예 12에 기재된 실험 결과를 도시한 그래프이다. 혈청 페닐알라닌 수준("PHE μM") 교정에 대한 코돈 최적화된 PAH 핵산 서열을 포함하는ceDNA 벡터(ceDNA412, ceDNA34, ceDNA36, ceDNA41, ceDNA42, ceDNA43)의 영향을 0.5 ㎍ 유체역학적 용량으로 28일 후 개별 마우스에서 평가하였다.
도 20a 및 도 20b는, PAH CDS로의 인트론의 예시적인 삽입에 대한 개략도이다. 기능성 스플라이스 공여 및 수용 부위를 갖는 키메라 PAH 인트론을 PAH CDS의 인트론 1의 본래 위치에 삽입하였다. PAH CDS에서 코돈 최적화된 서열이 PAH cDNA 서열에서 유도된 인트론 플랭킹 영역(33 bp)으로 치환되었다. 도면은 서열번호 1022를 개시한다.
도 21은, PAH CDS로의 인트론의 예시적인 삽입에 대한 개략도이다. 기능성 스플라이스 공여 및 수용 부위를 갖는 키메라 PAH 인트론을 PAH CDS의 인트론 1의 본래 위치에 삽입하였다. 인트론 스플라이스 부위를 플랭킹하는 영역의 서열이 공통 서열과 더 잘 일치하도록 변경되었다. 도면은, 제시된 순서대로, 각각, 서열번호 1023과 서열번호 1024를 개시한다.
상기 간략하게 개략되어 있고 하기 보다 상세하게 논의되는 본 개시내용의 구현예는, 첨부된 도면에 도시된 본 개시내용의 예시적인 구현예를 참조로 이해될 수 있다. 하지만, 첨부된 도면은 본 개시내용의 단지 전형적인 구현예를 예시하는 것으로, 본 개시내용의 범위를 제한하는 것으로 간주되어서는 안 되며, 본 개시내용은 다른 동등하게 효과적인 구현예를 허용할 수 있다.
도 1a는, A-A' 아암, B-B' 아암, C-C' 아암, 2개의 Rep 결합 부위(RBE 및 RBE')가 확인되는 AAV2의 야생형 좌측 ITR(서열번호 52)의 T-형 스템-루프 구조를 제공하고, 또한 말단 분해 부위(TRS)를 보여준다. RBE는 Rep 78 또는 Rep 68과 상호작용하는 것으로 여겨지는 일련의 4개의 이중체 사량체를 함유한다. 나아가, RBE'는 또한 작제물 내 야생형 ITR 또는 돌연변이된 ITR 상에 어셈블링된 Rep 복합체와 상호작용하는 것으로 여겨진다. D 및 D' 영역은 전사인자 결합 부위와 다른 보존된 구조를 함유한다. 도 1b는, A-A' 아암, B-B' 아암, C-C' 아암, 2개의 Rep 결합 부위(RBE 및 RBE')가 확인되는 AAV2의 야생형 좌측 ITR의 T-형 스템-루프 구조를 포함하는 야생형 좌측 ITR(서열번호 53)에서의 제안된 Rep 촉매화된 닉킹 및 결찰 활성을 보여주고, 또한 말단 분해 부위(TRS), 및 몇몇 전사인자 결합 부위와 다른 보존된 구조를 포함하는 D 및 D' 영역을 보여준다.
도 2a는, 야생형 좌측 AAV2 ITR(서열번호 54)의 A-A' 아암의 RBE 함유 부분과 C-C' 및 B-B' 아암의 1차 구조(폴리핵산 서열)(좌측)와 2차 구조(우측)를 보여준다. 도 2b는, 좌측 ITR에 대한 예시적인 돌연변이된 ITR(변형된 ITR로도 지칭됨) 서열을 보여준다. 예시적인 돌연변이된 좌측 ITR(ITR-1, 좌측)(서열번호 113)의 A-A' 아암의 RBE 부분과 C 아암 및 B-B' 아암의 1차 구조(좌측)와 예측된 2차 구조(우측)가 제시되어 있다. 도 2c는, 야생형 우측 AAV2 ITR(서열번호 55)의 A-A' 루프의 RBE 함유 부분과 B-B' 및 C-C' 아암의 1차 구조(좌측)와 2차 구조(우측)를 보여준다. 도 2d는, 예시적인 우측 변형된 ITR을 보여준다. 예시적인 돌연변이 우측 ITR(ITR-1, 우측)(서열번호 114)의 A-A' 아암의 RBE 함유 부분과 B-B' 및 C 아암의 1차 구조(좌측)와 예측된 2차 구조(우측)가 제시되어 있다. 좌측 및 우측 ITR(예를 들어, AAV2 ITR, 또는 다른 바이러스 혈청형 또는 합성 ITR)의 임의의 조합이 본원에 교시된 바와 같이 사용될 수 있다. 도 2a 내지 도 2d 각각에서, 폴리뉴클레오타이드 서열은 본원에 기재된 바와 같은 ceDNA를 생산하는 데 사용되는 플라스미드 또는 박미드/바큘로바이러스 게놈에 사용된 서열을 나타낸다. 또한, 도 2a 내지 도 2d 각각에는, 플라스미드 또는 박미드/바큘로바이러스 게놈의 ceDNA 벡터 구성 및 예측된 깁스 자유 에너지 값에서 추론된 상응하는 ceDNA 2차 구조가 포함되어 있다.
도 3a는, 도 3b의 개략도에 기재된 공정에서 본원에 개시된 바와 같은 PAH의 발현을 위한 ceDNA 벡터의 생산에 유용한 바큘로바이러스 감염된 곤충 세포(BIIC)를 제조하는 업스트림 공정을 예시하는 개략도이다. 도 3b는 예시적인 ceDNA 생산 방법의 개략도이고, 도 3c는 ceDNA 벡터 생산을 확인하기 위한 생화학적 방법 및 공정을 예시한다. 도 3d 및 도 3e는, 도 3b의 ceDNA 생산 공정 동안 수득된 세포 펠릿에서 수거된 DNA에서 ceDNA의 존재를 식별하는 공정을 설명하는 개략도이다. 도 3d는, 절단되지 않은 채로 유지되거나 제한 엔도뉴클레아제로 소화된 후, 미변성 겔 또는 변성 겔 상에서 전기영동에 적용된 예시적인 ceDNA에 대한 개략적인 예상 밴드를 보여준다. 가장 좌측의 개략도는 미변성 겔이며, 이는 이중체 및 절단되지 않은 형태에서 ceDNA가, 더 빠르게 이동하는 더 작은 단량체와 단량체 크기의 2배인 더 느리게 이동하는 이량체로 보이는, 적어도 단량체와 이량체 상태로 존재함을 시사한다. 좌측에서 두 번째 개략도는, ceDNA가 제한 엔도뉴클레아제로 절단되는 경우, 본래 밴드가 사라지고, 절단 후 남아있는 예상 단편 크기에 상응하는 더 빠르게 이동하는(예를 들어, 더 작은) 밴드가 나타남을 보여준다. 변성 조건 하에서, 본래 이중체 DNA는 단일가닥이며, 이는 상보적 가닥이 공유결합으로 연결되어 있기 때문에, 미변성 겔 상에서 관찰된 것 보다 2배 더 큰 종으로 이동한다. 따라서, 우측에서 두 번째 개략도에서, 소화된 ceDNA는 미변성 겔에서 관찰된 것과 유사한 밴딩 분포를 보여주지만, 밴드는 미변성 겔 대응물의 2배 크기의 단편으로 이동한다. 가장 우측의 개략도는, 변성 조건 하에서 절단되지 않은 ceDNA가 단일가닥 개방형 고리로 이동하기 때문에, 관찰된 밴드는 고리가 개방되지 않은 미변성 조건에서 관찰된 것의 2배 크기임을 보여준다. 이러한 도면에서, "kb"는, 문맥에 따라, 뉴클레오타이드 사슬 길이(예를 들어, 변성 조건에서 관찰된 단일가닥 분자의 경우) 또는 염기쌍의 수(예를 들어, 미변성 조건에서 관찰된 이중가닥 분자의 경우)를 기반으로 뉴클레오타이드 분자의 상대적인 크기를 나타내는 데 사용된다. 도 3e는, 비연속 구조를 갖는 DNA를 보여준다. ceDNA는 ceDNA 벡터 상에 단일 인식 부위를 갖는 제한 엔도뉴클레아제에 의해 절단되어, 중성 및 변성 조건 모두에서 상이한 크기(1 kb 및 2 kb)를 갖는 2개의 DNA 단편을 생성할 수 있다. 도 3e는, 선형 및 연속 구조를 갖는 ceDNA를 또한 보여준다. ceDNA 벡터는 제한 엔도뉴클레아제에 의해 절단되어, 중성 조건에서는 1 kb 및 2 kb로 이동하는 2개의 DNA 단편을 생성할 수 있지만, 변성 조건에서는 가닥이 연결된 채로 유지되어 2 kb 및 4 kb로 이동하는 단일 가닥을 생성할 수 있다.
도 4는, 엔도뉴클레아제로 소화되거나(+) 소화되지 않은(-) ceDNA 벡터의 변성 겔 전개 예들의 예시적인 도면이다(ceDNA 작제물 1 및 2의 경우 EcoRI; ceDNA 작제물 3 및 4의 경우 BamH1; ceDNA 작제물 5 및 6의 경우 SpeI; 및 ceDNA 작제물 7 및 8의 경우 XhoI). 작제물 1 내지 8은 국제 특허 출원 PCT/US18/49996(이는 그 전문이 본원에 참조로 인용됨)의 실시예 1에 기재되어 있다. 별표로 강조된 밴드의 크기를 결정하고 도면의 하단에 제공하였다.
도 5a 내지 도 5e는, 실시예 6에 기재된 실험 결과를 도시한 그래프이다. 페닐알라닌 농도("PHE μM") 교정에 대한 코돈 최적화된 PAH 핵산 서열을 포함하는 ceDNA 벡터(ceDNA412; hPAH_codop_ORF_v2), 또는 3xHS-CRM8_SERP_Enhancer, TTR-promoter-d5pUTR 및 MVM_intron을 갖는 코돈 최적화된 PAH 핵산 서열을 포함하는 ceDNA 벡터(ceDNA1530; hPAH-r5-s29)의 영향을 0.5 ㎍ 및 5 ㎍ 유체역학적 용량으로 21일에 걸쳐 개별 마우스에서 평가하였다.
도 6a 및 도 6b는, 실시예 7에 기재된 실험 결과를 도시한 그래프이다. 페닐알라닌 농도("PHE μM") 교정에 대한 코돈 최적화된 PAH 핵산 서열을 포함하는ceDNA 벡터(ceDNA412, ceDNA1132, ceDNA1274 및 ceDNA1527)의 영향을 0.5 ㎍ 및 5 ㎍ 유체역학적 용량으로 개별 마우스에서 평가하였고, 각 군의 모든 5마리 마우스에 대한 평균 교정을 도 6a 및 도 6b의 그래프에 제시하였다. PHE 농도는 대조군 동물(PAHenu2: 비히클)에서 감소하지 않았다.
도 7a 내지 도 7g는, 개별 마우스에 대한 실시예 7에 기재된 실험 결과를 도시한 그래프이다.
도 8a 및 도 8b는, 실시예 8에 기재된 실험 결과를 도시한 그래프이다. 페닐알라닌 농도("PHE μM") 교정에 대한 코돈 최적화된 PAH 핵산 서열을 포함하는ceDNA 벡터(ceDNA1416, ceDNA1428, ceDNA1528 및 ceDNA1414)의 영향을 0.5 ㎍ 및 5 ㎍ 유체역학적 용량으로 7일 후 개별 마우스에서 평가하였고, 각 군의 모든 5마리 마우스에 대한 평균 교정을 도 8a 및 도 8b의 그래프에 제시하였다. PHE 농도는 대조군 동물(PAHenu2: 비히클)에서 감소하지 않았다.
도 9a 내지 도 9e는, 실시예 8에 기재된 실험 결과를 도시한 그래프이다. 페닐알라닌 농도("PHE μM") 교정에 대한 코돈 최적화된 PAH 핵산 서열을 포함하는ceDNA 벡터(ceDNA1416, ceDNA1428, ceDNA1414 및 ceDNA1528)의 영향을 0.5 ㎍ 유체역학적 용량으로 7일 후 개별 마우스에서 평가하였다.
도 10a 내지 도 10e는, 실시예 8에 기재된 실험 결과를 도시한 그래프이다. 페닐알라닌 농도("PHE μM") 교정에 대한 코돈 최적화된 PAH 핵산 서열을 포함하는ceDNA 벡터(ceDNA1416, ceDNA1428, ceDNA1414 및 ceDNA1528)의 영향을 5 ㎍ 유체역학적 용량으로 7일 후 개별 마우스에서 평가하였다.
도 11a 및 도 11b는, 실시예 8에 기재된 실험 결과를 도시한 그래프이다. 페닐알라닌 농도("PHE μM") 교정에 대한 코돈 최적화된 PAH 핵산 서열을 포함하는ceDNA 벡터(ceDNA1416, ceDNA1428, ceDNA1414 및 ceDNA1528)의 영향을 0.5 ㎍ 및 5 ㎍ 유체역학적 용량으로 28일 후 개별 마우스에서 평가하였고, 각 군의 모든 5마리 마우스에 대한 평균 교정을 도 11a 및 도 11b의 그래프에 제시하였다. PHE 농도는 대조군 동물(PAHenu2: 비히클)에서 감소하지 않았다.
도 12a 내지 도 12e는, 실시예 8에 기재된 실험 결과를 도시한 그래프이다. 페닐알라닌 농도("PHE μM") 교정에 대한 코돈 최적화된 PAH 핵산 서열을 포함하는ceDNA 벡터(ceDNA1416, ceDNA1428, ceDNA1414 및 ceDNA1528)의 영향을 0.5 ㎍ 유체역학적 용량으로 28일 후 개별 마우스에서 평가하였다.
도 13a 내지 도 13e는, 실시예 8에 기재된 실험 결과를 도시한 그래프이다. 페닐알라닌 농도("PHE μM") 교정에 대한 코돈 최적화된 PAH 핵산 서열을 포함하는ceDNA 벡터(ceDNA1416, ceDNA1428, ceDNA1414 및 ceDNA1528)의 영향을 5 ㎍ 유체역학적 용량으로 28일 후 개별 마우스에서 평가하였다.
도 14a 내지 도 14i는, 실시예 8에 기재된 실험 결과를 도시한 그래프이다. 페닐알라닌 농도("PHE μM") 교정에 대한 코돈 최적화된 PAH 핵산 서열을 포함하는ceDNA 벡터(ceDNA412, ceDNA1430, ceDNA1432, ceDNA1473, ceDNA1474, ceDNA1436, ceDNA1471, ceDNA1472)의 영향을 5 ㎍ 유체역학적 용량으로 7일 후 개별 마우스에서 평가하였다.
도 15a 내지 도 15i는, 실시예 9에 기재된 실험 결과를 도시한 그래프이다. 혈청 페닐알라닌 수준("PHE μM") 교정에 대한 코돈 최적화된 PAH 핵산 서열을 포함하는ceDNA 벡터(ceDNA412, ceDNA1476, ceDNA1479, ceDNA1939, ceDNA1940, ceDNA1941, ceDNA1942, ceDNA1943, ceDNA1944)의 영향을 0.5 ㎍ 유체역학적 용량으로 28일 후 개별 마우스에서 평가하였다.
도 16a 내지 도 16d는, 실시예 10에 기재된 실험 결과를 도시한 그래프이다. 혈청 페닐알라닌 수준("PHE μM") 교정에 대한 코돈 최적화된 PAH 핵산 서열을 포함하는ceDNA 벡터(ceDNA412, ceDNA1939, ceDNA1955, ceDNA62)의 영향을 0.5 ㎍ 유체역학적 용량으로 28일 후 개별 마우스에서 평가하였다.
도 17a 내지 도 17h는, 실시예 11에 기재된 실험 결과를 도시한 그래프이다. 혈청 페닐알라닌 수준("PHE μM") 교정에 대한 코돈 최적화된 PAH 핵산 서열을 포함하는ceDNA 벡터(ceDNA412, ceDNA2409, ceDNA2410, ceDNA2415, ceDNA2418, ceDNA2416, ceDNA2419, ceDNA2420)의 영향을 0.5 ㎍ 유체역학적 용량으로 28일 후 개별 마우스에서 평가하였다.
도 18a 내지 도 18d는, 실시예 11에 기재된 실험 결과를 도시한 그래프이다. 혈청 페닐알라닌 수준("PHE μM") 교정에 대한 코돈 최적화된 PAH 핵산 서열을 포함하는ceDNA 벡터(ceDNA2415, ceDNA2418)의 영향을 0.1 ㎍ 유체역학적 용량으로 28일 후 개별 마우스에서 평가하였다.
도 19a 내지 도 19f는, 실시예 12에 기재된 실험 결과를 도시한 그래프이다. 혈청 페닐알라닌 수준("PHE μM") 교정에 대한 코돈 최적화된 PAH 핵산 서열을 포함하는ceDNA 벡터(ceDNA412, ceDNA34, ceDNA36, ceDNA41, ceDNA42, ceDNA43)의 영향을 0.5 ㎍ 유체역학적 용량으로 28일 후 개별 마우스에서 평가하였다.
도 20a 및 도 20b는, PAH CDS로의 인트론의 예시적인 삽입에 대한 개략도이다. 기능성 스플라이스 공여 및 수용 부위를 갖는 키메라 PAH 인트론을 PAH CDS의 인트론 1의 본래 위치에 삽입하였다. PAH CDS에서 코돈 최적화된 서열이 PAH cDNA 서열에서 유도된 인트론 플랭킹 영역(33 bp)으로 치환되었다. 도면은 서열번호 1022를 개시한다.
도 21은, PAH CDS로의 인트론의 예시적인 삽입에 대한 개략도이다. 기능성 스플라이스 공여 및 수용 부위를 갖는 키메라 PAH 인트론을 PAH CDS의 인트론 1의 본래 위치에 삽입하였다. 인트론 스플라이스 부위를 플랭킹하는 영역의 서열이 공통 서열과 더 잘 일치하도록 변경되었다. 도면은, 제시된 순서대로, 각각, 서열번호 1023과 서열번호 1024를 개시한다.
PAH 치료 단백질 또는 이의 단편을 인코딩하는 하나 이상의 코돈 최적화된 핵산을 포함하는 ceDNA 벡터를 사용하여 페닐케톤뇨증(PKU)을 치료하는 방법이 본원에 제공된다. 또한, PAH 단백질 또는 이의 단편을 인코딩하는 하나 이상의 코돈 최적화된 핵산을 포함하는, 본원에 기재된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터가 본원에 제공된다. PAH 치료 단백질 또는 이의 단편을 인코딩하는 코돈 최적화된 핵산이, 특정 시스-작용 요소(예들 들어, 특정 프로모터 및/또는 조절 요소)와 조합될 때, 대상에서 페닐알라닌 수준(예를 들어, 발현 및 지속기간)의 최적 교정을 제공한다는 것은 본 개시내용의 놀라운 발견이다.
일부 구현예에 따르면, 페닐알라닌 수준의 최적 교정은 페닐알라닌 히드록실라아제(PAH)의 결핍으로 인한 질환 또는 장애를 치료하는 데 치료적으로 유효한 수준이다. 본 개시내용에 기재된 바와 같이, 코돈 최적화된 서열을 포함하는 작제물은 본래 hPAH cDNA 서열보다 상당히 더 우수한 성능을 나타내었고, 코돈 최적화된 서열과 특정 시스-작용 요소를 포함하는 특정 작제물은 연장된 발현과 페닐알라닌 수준의 교정을 나타냈다. 일부 구현예에서, PAH 단백질의 발현은 치료용 단백질이 이것이 발현되는 세포 외부로 분비되는 것을 포함할 수 있거나, 대안적으로는, 일부 구현예에서, 발현된 PAH 단백질은 이것이 발현되는 세포 내에서 작용하거나 기능할 수 있다(예를 들어, 이의 효과를 발휘함). 일부 구현예에서, ceDNA 벡터는 대상의 간, 근육(예를 들어, 골격근), 또는 PAH 치료 단백질 생산 및 다수의 전신 구획으로의 분비를 위한 데포로서 작용할 수 있는 다른 신체 부위에서 PAH 단백질을 발현시킨다.
I.
정의
본원에서 달리 정의되지 않는 한, 본 출원과 관련하여 사용된 과학 및 기술 용어는 본 개시내용이 속하는 당업자가 통상적으로 이해하는 의미를 가질 것이다. 본 개시내용이 본원에 기재된 특정 방법론, 프로토콜 및 시약 등에 제한되지 않고, 달라질 수 있다는 것을 이해해야 한다. 본원에 사용된 용어는 단지 특정 구현예를 설명하기 위한 목적이며, 청구범위에 의해서만 한정되는 본 개시내용의 범위를 제한하고자 하는 것이 아니다. 면역학 및 분자생물학에서의 상용 용어 정의는, 하기 문헌에서 확인할 수 있다: 문헌[The Merck Manual of Diagnosis and Therapy, 19th Edition, Merck Sharp & Dohme Corp., 2011 (ISBN 978-0-911910-19-3)]; 문헌[Robert S. Porter et al. (eds.), Fields Virology, 6th Edition, Lippincott Williams & Wilkins, Philadelphia, PA, USA (2013)]; 문헌[Knipe, D.M. and Howley, P.M. (ed.), The Encyclopedia of Molecular Cell Biology and Molecular Medicine, Blackwell Science Ltd., 1999-2012 (ISBN 9783527600908)]; 문헌[Robert A. Meyers (ed.), Molecular Biology and Biotechnology: a Comprehensive Desk Reference, VCH Publishers, Inc., 1995 (ISBN 1-56081-569-8)]; 문헌[Immunology by Werner Luttmann, Elsevier, 2006]; 문헌[Janeway's Immunobiology, Kenneth Murphy, Allan Mowat, Casey Weaver (eds.), Taylor & Francis Limited, 2014 (ISBN 0815345305, 9780815345305)]; 문헌[Lewin's Genes XI, Jones & Bartlett Publishers, 2014 (ISBN-1449659055)]; 문헌[Michael Richard Green and Joseph Sambrook, Molecular Cloning: A Laboratory Manual, 4th ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., USA (2012) (ISBN 1936113414)]; 문헌[Davis et al., Basic Methods in Molecular Biology, Elsevier Science Publishing, Inc., New York, USA (2012) (ISBN 044460149X)]; 문헌[Laboratory Methods in Enzymology: DNA, Jon Lorsch (ed.) Elsevier, 2013 (ISBN 0124199542)]; 문헌[Current Protocols in Molecular Biology (CPMB), Frederick M. Ausubel (ed.), John Wiley and Sons, 2014 (ISBN 047150338X, 9780471503385)]; 문헌[Current Protocols in Protein Science (CPPS), John E. Coligan (ed.), John Wiley and Sons, Inc., 2005]; 및 문헌[Current Protocols in Immunology (CPI), John E. Coligan, ADA M Kruisbeek, David H Margulies, Ethan M Shevach, Warren Strobe, (eds.) John Wiley and Sons, Inc., 2003 (ISBN 0471142735, 9780471142737)](상기 문헌들의 내용은 모두 그 전문이 본원에 참조로서 인용됨).
본원에 사용된 "투여", "투여하는"이라는 용어 및 이의 변형은, 대상에게 조성물 또는 작용제(예를 들어, 본원에 기재된 바와 같은 치료 핵산 또는 면역억제제)를 도입하는 것을 나타내며, 하나 이상의 조성물 또는 작용제의 동시 및 순차적 도입을 포함한다. "투여"는, 예를 들어 치료, 약동학, 진단, 연구, 위약 및 실험 방법을 나타낼 수 있다. "투여"는 또한 시험관내 및 생체외 처리를 포함한다. 대상으로의 조성물 또는 작용제의 도입은, 경구, 폐, 비강, 비경구(정맥내, 근육내, 복강내 또는 피하), 직장, 림프내, 종양내 또는 국소를 포함하는 임의의 적합한 경로로 이루어진다. 대상으로의 조성물 또는 작용제의 도입은 전기천공을 통해 이루어진다. 투여는 자가 투여와 다른 이에 의한 투여를 포함한다. 투여는 임의의 적합한 경로로 수행될 수 있다. 적합한 투여 경로는 조성물 또는 작용제가 이의 의도된 기능을 수행하는 것을 가능하게 한다. 예를 들어, 적합한 경로가 정맥내인 경우, 조성물은 조성물 또는 작용제를 대상의 정맥에 도입하는 방식으로 투여된다.
본원에 사용된 "핵산 치료제", "치료용 핵산" 및 "TNA"라는 구절은 상호교환적으로 사용되며, 질환 또는 장애를 치료하기 위한 치료제의 활성 성분으로서 핵산을 사용하는 임의의 치료 양식을 나타낸다. 본원에 사용된 이러한 구절은 RNA 기반 치료제와 DNA 기반 치료제를 나타낸다. RNA 기반 치료제의 비제한적인 예에는, mRNA, 안티센스 RNA 및 올리고뉴클레오타이드, 리보자임, 압타머, 간섭 RNA(RNAi), 다이서-기질 dsRNA, 소형 헤어핀 RNA(shRNA), 비대칭 간섭 RNA(aiRNA), 가이드 RNA(gRNA) 및 마이크로RNA(miRNA)가 포함된다. DNA 기반 치료제의 비제한적인 예에는, 미니서클 DNA, 미니유전자, 바이러스성 DNA(예를 들어, 렌티바이러스 또는 AAV 게놈) 또는 비바이러스성 합성 DNA 벡터, 폐쇄형 선형 이중체 DNA(ceDNA/CELiD), 플라스미드, 박미드, 개뼈형(dbDNA™) DNA 벡터, 최소한으로 면역학적으로 정의된 유전자 발현(MIDGE) 벡터, 비바이러스성 미니스트링 DNA 벡터(선형의 공유결합으로 폐쇄된 DNA 벡터) 또는 덤벨형 DNA 최소 벡터("덤벨 DNA")가 포함된다.
본원에 사용된 PAH 치료 단백질 또는 이의 단편과 같은 치료제의 "유효량" 또는 "치료적 유효량"이란, 목적하는 효과를 생성하는 데, 예를 들어 질환 변형 수준의 PAH 효소를 제공하고/하거나, 간에서 교정 PAH 효소의 발현 지속시키고/시키거나, 요소 회로 기능과 페닐알라닌 대사를 회복시키고/시키거나, 결함 효소의 적절한 약리학적 수준을 달성하는 데 충분한 양이다. 표적 유전자 또는 표적 서열의 발현을 측정하는 데 적합한 검정에는, 예를 들어 도트 블롯(dot blot), 노던 블롯(northern blot), 제자리 혼성화, ELISA, 면역침강, 효소 기능과 같은 당업자에게 알려진 기술뿐 아니라, 당업자에게 알려진 표현형 검정을 사용하는 단백질 또는 RNA 수준의 검사가 포함된다. 하지만, 투여량 수준은 질환의 유형, 환자의 연령, 체중, 성별 및 의학적 상태, 병태의 중증도, 투여 경로, 및 이용되는 특정 활성제를 포함하는 다양한 인자를 기반으로 한다. 따라서, 투여 요법은 광범위하게 달라질 수 있으나, 의사가 표준 방법을 사용하여 통상적으로 결정할 수 있다. 또한, "치료량", "치료적 유효량" 및 "약학적 유효량"이라는 용어는, 상기 기재된 개시내용의 조성물의 예방적 또는 예방용 양을 포함한다. 상기 기재된 개시내용의 예방적 또는 예방용 적용에서, 약학적 조성물 또는 약제는 질환, 장애 또는 병태에 걸리기 쉽거나 다르게는 이의 위험이 있는 환자에게, 질환, 장애 또는 병태, 이의 합병증, 및 질환, 장애 또는 병태의 발달 동안 나타나는 중간 병리학적 표현형의 생화학적, 조직학적 및/또는 거동적 증상을 포함하는, 질환, 장애 또는 병태의 위험을 제거 또는 감소시키거나, 이의 중증도를 감소시키거나, 또는 이의 발병을 지연시키는 데 충분한 양으로 투여된다. 최대 용량, 즉, 일부 의학적 판단에 따라 가장 안전한 용량이 사용되는 것이 일반적으로 바람직하다. 일부 구현예에 따르면, 질환, 장애 또는 병태는 PKU이다. "용량" 및 "투여량"이라는 용어는 본원에서 상호교환적으로 사용된다.
본원에 사용된 "치료 효과"라는 용어는, 바람직하고 유익한 것으로 판단되는 치료 결과를 나타낸다. 치료 효과는, 직접적으로 또는 간접적으로, 질환 발현의 억제, 감소 또는 제거를 포함할 수 있다. 치료 효과는 또한, 직접적으로 또는 간접적으로, 질환 발현 진행의 억제, 감소 또는 제거를 포함할 수 있다.
본원에 기재된 임의의 치료제의 경우, 치료적 유효량은 초기에 예비 시험관내 연구 및/또는 동물 모델에서 결정될 수 있다. 치료적 유효 용량은 또한 인간 데이터로부터 결정될 수 있다. 적용되는 용량은 투여된 화합물의 상대적인 생체이용률 및 효능을 기반으로 조정될 수 있다. 상기 기재된 방법 및 다른 널리 알려진 방법을 기반으로 최대 효능을 달성하기 위해 용량을 조정하는 것은, 당업자의 능력에 속한다. 문헌[Goodman and Gilman's The Pharmacological Basis of Therapeutics, 10th Edition, McGraw-Hill (New York) (2001)](이는 본원에 참조로서 인용됨)의 챕터 1에서 확인할 수 있는 치료 효과를 결정하는 일반 원리가 하기에 요약되어 있다.
약동학적 원리는, 허용 가능하지 않은 부작용을 최소화하면서 목적하는 정도의 치료 효능을 얻기 위해 투여 요법을 변경하는 기반을 제공한다. 약물의 혈장 농도가 측정될 수 있고 이것이 치료 범위와 관련이 있는 상황에서, 투여량 변경을 위한 추가 지침을 얻을 수 있다.
본원에 사용된 "이종 뉴클레오타이드 서열" 및 "전이유전자"라는 용어는 상호교환적으로 사용되며, 본원에 개시된 바와 같은 ceDNA 벡터에 혼입되고, 이에 의해 전달 및 발현될 수 있는 (캡시드 폴리펩타이드를 인코딩하는 핵산 이외의) 관심 핵산을 나타낸다. 하나의 구현예에서, 적어도 하나의 PAH 단백질을 인코딩하는 적어도 하나의 핵산 서열은 이종 핵산 서열이다.
본원에 사용된 "발현 카세트" 및 "전사 카세트"라는 용어는 상호교환적으로 사용되며, 하나 이상의 프로모터, 또는 전이유전자의 전사를 지시하는 데 충분한 다른 조절 서열에 작동 가능하게 연결되어 있는 전이유전자를 포함하지만, 캡시드 인코딩 서열, 다른 벡터 서열 또는 역말단반복 영역을 포함하지 않는 핵산의 선형 스트레치를 나타낸다. 발현 카세트는 하나 이상의 시스-작용 서열(예를 들어, 프로모터, 인핸서 또는 억제제), 하나 이상의 인트론 및 하나 이상의 전사 후 조절 요소를 추가로 포함할 수 있다.
본원에서 상호교환적으로 사용되는 "폴리뉴클레오타이드" 및 "핵산"이라는 용어는, 임의의 길이의 뉴클레오타이드, 리보뉴클레오타이드 또는 데옥시리보뉴클레오타이드의 중합체 형태를 나타낸다. 따라서, 이러한 용어에는, 단일가닥, 이중가닥 또는 다중가닥 DNA 또는 RNA, 게놈 DNA, cDNA, DNA-RNA 혼성체, 또는 퓨린 및 피리미딘 염기, 또는 다른 천연, 화학적 또는 생화학적으로 변형된, 비천연 또는 유도체화된 뉴클레오타이드 염기를 포함하는 중합체가 포함된다. "올리고뉴클레오타이드"는 일반적으로 단일가닥 또는 이중가닥 DNA의 약 5개 내지 약 100개 뉴클레오타이드의 폴리뉴클레오타이드를 나타낸다. 하지만, 본 개시내용을 목적을 위해, 올리고뉴클레오타이드의 길이에는 상한이 없다. 올리고뉴클레오타이드는 "올리고머" 또는 "올리고"로도 알려져 있으며, 유전자에서 단리되거나, 당업계에 알려진 방법에 따라 화학적으로 합성될 수 있다. "폴리뉴클레오타이드" 및 "핵산"이라는 용어는, 기재되는 구현예에 적용되는 바에 따라, 단일가닥(예컨대 센스 및 안티센스) 및 이중가닥 폴리뉴클레오타이드를 포함한다는 것을 이해해야 한다. DNA는, 예를 들어 안티센스 분자, 플라스미드 DNA, DNA-DNA 이중체, 사전 축합된 DNA, PCR 산물, 벡터(P1, PAC, BAC, YAC, 인공 염색체), 발현 카세트, 키메라 서열, 염색체 DNA, 또는 이러한 그룹의 유도체 및 조합의 형태일 수 있다. DNA는 미니서클, 플라스미드, 박미드, 미니유전자, 미니스트링 DNA(선형의 공유결합으로 폐쇄된 DNA 벡터), 폐쇄형 선형 이중체 DNA(CELiD 또는 ceDNA), 개뼈형(dbDNA™) DNA, 덤벨형 DNA, 최소한으로 면역학적으로 정의된 유전자 발현(MIDGE) 벡터, 바이러스성 벡터 또는 비바이러스성 벡터의 형태일 수 있다. RNA는 소형 간섭 RNA(siRNA), 다이서-기질 dsRNA, 소형 헤어핀 RNA(shRNA), 비대칭 간섭 RNA(aiRNA), 마이크로RNA(miRNA), mRNA, gRNA, rRNA, tRNA, 바이러스성 RNA(vRNA) 및 이들의 조합의 형태일 수 있다. 핵산에는, 합성, 자연 발생 및 비자연 발생이고, 참조 핵산과 유사한 결합 특성을 갖는, 알려진 뉴클레오타이드 유사체, 또는 변형된 백본 잔기 또는 연결을 함유하는 핵산이 포함된다. 이러한 유사체 및/또는 변형된 잔기의 예에는, 비제한적으로, 포스포로티오에이트, 포스포로디아미데이트 모르폴리노 올리고머(모르폴리노), 포스포르아미데이트, 메틸 포스포네이트, 키랄-메틸 포스포네이트, 2'-O-메틸 리보뉴클레오타이드, 잠금 핵산(LNA™) 및 펩타이드 핵산(PNA)이 포함된다. 구체적으로 제한되지 않는 한, 상기 용어는 참조 핵산과 유사한 결합 특성을 갖는 천연 뉴클레오타이드의 알려진 유사체를 함유하는 핵산을 포함한다. 달리 지시되지 않는 한, 특정 핵산 서열은 또한 이의 보존적으로 변형된 변이체(예를 들어, 퇴화 코돈 치환), 대립유전자, 동원체(ortholog), SNP 및 상보적 서열뿐 아니라, 명백하게 제시된 서열을 암시적으로 포함한다.
"뉴클레오타이드"는, 당 옥시리보오스(DNA) 또는 리보오스(RNA), 염기 및 포스페이트기를 함유한다. 뉴클레오타이드는 포스페이트기를 통해 함께 연결된다.
"염기"에는, 퓨린 및 피리미딘(이에는 천연 화합물인 아데닌, 티민, 구아닌, 시토신, 우라실, 이노신, 및 천연 유사체가 추가로 포함됨) 및 퓨린 및 피리미딘의 합성 유도체(이에는, 비제한적으로, 아민, 알코올, 티올, 카르복실레이트 및 알킬할라이드와 같은 새로운 반응성기가 대체된 변형이 포함됨)가 포함된다.
본원에 사용된 "간섭 RNA" 또는 "RNAi" 또는 "간섭 RNA 서열"이라는 용어는, 간섭 RNA가 표적 유전자 또는 서열과 동일한 세포에 존재하는 경우 (예를 들어, 간섭 RNA 서열에 상보적인 mRNA의 번역을 저해하거나 분해를 매개하는 방식으로) 표적 유전자 또는 서열의 발현을 감소시키거나 저해할 수 있는, 단일가닥 RNA(예를 들어, 성숙 miRNA, ssRNAi 올리고뉴클레오타이드, ssDNAi 올리고뉴클레오타이드), 이중가닥 RNA(즉, 듀플렉스 RNA, 예컨대 siRNA, 다이서-기질 dsRNA, shRNA, aiRNA 또는 pre-miRNA), DNA-RNA 혼성체(예를 들어, 국제 특허 출원 공개 WO 2004/078941 참조) 또는 DNA-DNA 혼성체(예를 들어, PCT 공개 WO 2004/104199 참조)를 포함한다. 따라서, 간섭 RNA는 표적 mRNA 서열에 상보적인 단일가닥 RNA, 또는 2개의 상보적 가닥 또는 단일의 자가 상보적 가닥으로 형성된 이중가닥 RNA를 나타낸다. 간섭 RNA는 표적 유전자 또는 서열과 실질적으로 또는 완전히 동일할 수 있거나, 미스매치(mismatch) 영역(즉, 미스매치 모티프)를 포함할 수 있다. 간섭 RNA의 서열은 전장 표적 유전자, 또는 이의 하위서열에 상응할 수 있다. 바람직하게는, 간섭 RNA 분자는 화학적으로 합성된다. 상기 특허 문헌 각각의 개시내용은 모든 목적을 위해 그 전문이 본원에 참조로서 인용된다.
간섭 RNA에는, "작은 간섭 RNA" 또는 "siRNA", 예를 들어 약 15개 내지 60개, 15개 내지 50개 또는 15개 내지 40개(이중체) 뉴클레오타이드 길이, 보다 전형적으로 약 15개 내지 30개, 15개 내지 25개 또는 19개 내지 25개(이중체) 뉴클레오타이드 길이, 바람직하게는 약 20개 내지 24개, 21개 내지 22개 또는 21개 내지 23개(이중체) 뉴클레오타이드 길이의 간섭 RNA가 포함된다(예를 들어, 이중가닥 siRNA의 각각의 상보적 서열은 15개 내지 60개, 15개 내지 50개, 15개 내지 40개, 15개 내지 30개, 15개 내지 25개 또는 19개 내지 25개 뉴클레오타이드 길이, 바람직하게는 약 20개 내지 24개, 21개 내지 22개 또는 21개 내지 23개 뉴클레오타이드 길이이고, 이중가닥 siRNA는 약 15개 내지 60개, 15개 내지 50개, 15개 내지 40개, 15개 내지 30개, 15개 내지 25개 또는 19개 내지 25개 염기쌍 길이, 바람직하게는 약 18개 내지 22개, 19개 내지 20개 또는 19개 내지 21개 염기쌍 길이임). siRNA 이중체는 약 1개 내지 약 4개 뉴클레오타이드 또는 약 2개 내지 약 3개 뉴클레오타이드의 3' 돌출부와, 5' 포스페이트 말단을 포함할 수 있다. siRNA의 예에는, 비제한적으로, 2개의 별개의 가닥 분자에서 어셈블링된 이중가닥 폴리뉴클레오타이드 분자(여기서 하나의 가닥은 센스 가닥이고, 다른 하나는 상보적 안티센스 가닥임); 단일가닥 분자에서 어셈블링된 이중가닥 폴리뉴클레오타이드 분자(여기서 센스 및 안티센스 영역은 핵산 기반 또는 비핵산 기반 링커로 연결되어 있음); 자가 상보적 센스 및 안티센스 영역을 갖는 헤어핀 2차 구조를 갖는 이중가닥 폴리뉴클레오타이드 분자; 및 2개 이상의 루프 구조와 자가 상보적 센스 및 안티센스 영역을 갖는 스템을 갖는 원형 단일가닥 폴리뉴클레오타이드 분자(여기서 원형 폴리뉴클레오타이드는 생체내 또는 시험관내에서 처리되어 활성 이중가닥 siRNA 분자를 생성할 수 있음)가 포함된다. 본원에 사용된 "siRNA"라는 용어는, RNA-RNA 이중체뿐 아니라, DNA-RNA 혼성체를 포함한다(예를 들어, PCT 공개 WO 2004/078941(이는 그 전문이 본원에 참조로서 인용됨)).
본원에 사용된 "핵산 작제물"이라는 용어는, 자연 발생 유전자에서 단리되거나, 자연에 달리 존재하지 않을 수 있는 방식으로 핵산의 분절을 함유하도록 변형되거나 또는 합성된, 단일가닥 또는 이중가닥의 핵산 분자를 나타낸다. 핵산 작제물이라는 용어는, 핵산 작제물이 본 개시내용의 코딩 서열의 발현에 필요한 제어 서열을 함유하는 경우, "발현 카세트"라는 용어와 동의어이다. "발현 카세트"는 프로모터에 작동 가능하게 연결된 DNA 코딩 서열을 포함한다.
"혼성화 가능한" 또는 "상보적인" 또는 "실질적으로 상보적인"이란, 핵산(예를 들어, RNA)이 이에 대한 비공유결합을 가능하게 하는, 즉, 왓슨-크릭(Watson-Crick) 염기 쌍 및/또는 G/U 염기 쌍을 형성하거나, 온도 및 용액 이온 강도의 적절한 시험관내 및/또는 생체내 조건 하에서 서열 특이적인 역평행 방식으로 또 다른 핵산(즉, 상보적인 핵산에 특이적으로 결합하는 핵산)에 "어닐링", 또는 "혼성화"하는 뉴클레오타이드의 서열을 포함한다는 것을 의미한다. 당업계에 알려진 바와 같이, 표준 왓슨-크릭 염기 짝짓기에는, 아데닌(A)과 티미딘(T)의 짝짓기, 아데닌(A)과 우라실(U)의 짝짓기, 및 구아닌(G)과 시토신(C)의 짝짓기가 포함된다. 또한, 당업계에는 2개의 RNA 분자(예를 들어, dsRNA) 사이의 혼성화, 구아닌(G)과 우라실(U)의 염기 쌍에 대해서도 알려져 있다. 예를 들어, G/U 염기 짝짓기는 tRNA 안티코돈과 mRNA 코돈의 염기 짝짓기의 맥락에서 유전자 코드의 축퇴(즉, 중복)에 부분적으로 관여한다. 본 개시내용의 맥락에서, 대상 DNA 표적화 RNA 분자의 단백질-결합 분절(dsRNA 이중체)의 구아닌(G)은 우라실(U)에 상보적인 것으로 간주되며, 그 반대도 마찬가지이다. 이와 같이, G/U 염기쌍이 소정의 뉴클레오타이드 위치에서 대상 DNA 표적화 RNA 분자의 단백질-결합 분절(dsRNA 이중체)로 만들어질 수 있는 경우, 해당 위치는 비상보적인 것으로 간주되지 않고, 대신 상보적인 것으로 간주된다.
"펩타이드", "폴리펩타이드" 및 "단백질"은 본원에서 상호교환적으로 사용되며, 코딩된 및 비코딩된 아미노산, 화학적으로 또는 생화학적으로 변형된 또는 유도체화된 아미노산, 및 변형된 펩타이드 백본을 갖는 폴리펩타이드를 포함할 수 있는 임의의 길이의 아미노산의 중합체 형태를 나타낸다.
특정 PAH 단백질을 "인코딩하는" DNA 서열은 특정 RNA 및/또는 단백질로 전사되는 DNA 핵산 서열이다. DNA 폴리뉴클레오타이드는 단백질로 번역되는 RNA(mRNA)를 인코딩할 수 있거나, DNA 폴리뉴클레오타이드는 단백질로 번역되지 않는 RNA(예를 들어, tRNA, rRNA 또는 DNA 표적화 RNA; "비코딩" RNA 또는 "ncRNA"로도 불림)를 인코딩할 수 있다.
본원에 사용된 "융합 단백질"이라는 용어는, 적어도 2개의 상이한 단백질로부터의 단백질 도메인을 포함하는 폴리펩타이드를 나타낸다. 예를 들어, 융합 단백질은 (i) PAH 또는 이의 단편과, (ii) 적어도 하나의 비(non)GOI 단백질을 포함할 수 있다. 본원에 포함되는 융합 단백질에는, 비제한적으로, 항체, 또는 PAH 단백질에 융합된 항체의 Fc 또는 항원 결합 단편, 예를 들어 수용체, 리간드, 효소 또는 펩타이드의 세포외 도메인이 포함된다. 융합 단백질의 일부인 PAH 단백질 또는 이의 단편은 단일특이적 항체, 또는 이중특이적 또는 다중특이적 항체일 수 있다.
본원에 사용된 "게놈 세이프 하버(safe harbor) 유전자" 또는 "세이프 하버 유전자"라는 용어는, 암의 촉진 또는 내인성 유전자 활성에 대한 유의한 부정적인 결과 없이, 서열이 예측 가능한 방식으로 통합 및 기능할 수 있도록(예를 들어, 관심 단백질을 발현시킴) 핵산 서열이 삽입될 수 있는 유전자 또는 유전좌위를 나타낸다. 일부 구현예에서, 세이프 하버 유전자는 또한 삽입된 핵산 서열이 비(non)세이프 하버 부위보다 더 높은 수준으로 효율적으로 발현될 수 있는 유전좌위 또는 유전자이다.
본원에 사용된 "유전자 전달"이라는 용어는, 유전자 치료의 적용을 위해 외래 DNA가 숙주세포에 전달되는 과정을 의미한다.
본원에 사용된 "말단반복서열" 또는 "TR"이라는 용어는, 적어도 하나의 최소 필수 복제 기점과 회문 헤어핀 구조를 포함하는 영역을 포함하는, 임의의 바이러스 말단반복 또는 합성 서열을 포함한다. Rep-결합 서열("RBS")(RBE(Rep-결합 요소)로도 지칭됨)과 말단 분해 부위("TRS")는 함께 "최소 필수 복제 기점"을 구성하기 때문에, TR은 적어도 하나의 RBS와 적어도 하나의 TRS를 포함한다. 폴리뉴클레오타이드 서열의 소정의 스트레치 내에서 서로 역 보체인 TR은, 전형적으로 "역말단반복" 또는 "ITR"로 지칭된다. 바이러스의 맥락에서, ITR은 복제, 바이러스 패키징, 통합 및 프로바이러스 회수를 매개한다. 본원의 개시내용에서 예상치 못하게 발견된 바와 같이, 전체 길이에 걸쳐 역 보체가 아닌 TR은 여전히 야생형 ITR의 전형적인 기능을 수행할 수 있기 때문에, 본원에 사용된 ITR이라는 용어는 ceDNA 벡터의 복제를 매개할 수 있는 ceDNA 게놈 또는 ceDNA 벡터 내 TR을 나타낸다. 당업자는, 복잡한 ceDNA 벡터 구성에서, 2개 초과의 ITR 또는 비대칭 ITR 쌍이 존재할 수 있다는 것을 이해할 것이다. ITR은 AAV ITR 또는 비(non)AAV ITR일 수 있거나, AAV ITR 또는 비AAV ITR에서 유도될 수 있다. 예를 들어, ITR은 파르보바이러스 및 데펜도바이러스(예를 들어, 개 파르보바이러스, 소 파르보바이러스, 마우스 파르보바이러스, 돼지 파르보바이러스, 인간 파르보바이러스 B-19)를 포함하는 파르보바이러스과에서 유도될 수 있거나, 또는 SV40 복제 기점으로 작용하는 SV40 헤어핀(이는 절단, 치환, 결실, 삽입 및/또는 부가에 의해 추가로 변형될 수 있음)이 ITR로서 사용될 수 있다. 파르보바이러스과 바이러스는 척추동물을 감염시키는 파르보바이러스아과(Parvovirinae)와 무척추동물을 감염시키는 덴소바이러스아과(Densovirinae)의 2개의 아과로 이루어진다. 데펜도파르보바이러스에는, 비제한적으로, 인간, 영장류, 소, 개, 말 및 양 종을 포함하는 척추동물 숙주에서 복제 가능한 아데노연관바이러스(AAV)의 바이러스과가 포함된다. 본원에서 편의를 위해, ceDNA 벡터 내 발현 카세트(의 업스트림) 5'에 위치한 ITR은 "5' ITR" 또는 "좌측 ITR"로 지칭되고, ceDNA 벡터 내 발현 카세트(의 다운스트림) 3'에 위치한 ITR은 "3' ITR" 또는 "우측 ITR"로 지칭된다.
"야생형 ITR" 또는 "WT-ITR"은, 예를 들어 Rep 결합 활성 및 Rep 닉킹 능력을 보유하는, AAV 또는 다른 데펜도바이러스 내 자연 발생 ITR 서열의 서열을 나타낸다. 임의의 AAV 혈청형의 WT-ITR의 뉴클레오타이드 서열은 유전자 코드 또는 드리프트의 축퇴로 인해 기본형 자연 발생 서열에서 약간 달라질 수 있기 때문에, 본원에의 사용을 위해 포함된 WT-ITR 서열은 생산 과정 동안 일어나는 자연적으로 발생하는 변화(예를 들어, 복제 오류)의 결과로서의 WT-ITR 서열을 포함한다.
본원에 사용된 "실질적으로 대칭인 WT-ITR" 또는 "실질적으로 대칭인 WT-ITR 쌍"이라는 용어는, 둘 모두 이의 전체 길이에 걸쳐 역 보체 서열을 갖는 야생형 ITR인, 단일 ceDNA 게놈 또는 ceDNA 벡터 내 WT-ITR의 쌍을 나타낸다. 예를 들어, ITR은, 기본형 자연 발생 서열에서 벗어난 하나 이상의 뉴클레오타이드를 갖더라도, 변화가 서열의 특성 및 전체 3차원 구조에 영향을 미치지 않는 한, 야생형 서열인 것으로 간주될 수 있다. 일부 양태에서, 벗어난 뉴클레오타이드는 보존적 서열 변화를 나타낸다. 하나의 비제한적인 예로서, 기본형 서열과 적어도 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖고(기본 설정으로 예를 들어, BLAST를 사용하여 측정 시), 또한 기하학적 공간에서의 3D 구조가 동일한 형상이 되도록 다른 WT-ITR에 대칭인 3차원 공간 구성을 갖는 서열. 실질적으로 대칭인 WT-ITR은 3D 공간에 동일한 A, C-C' 및 B-B' 루프를 갖는다. 실질적으로 대칭인 WT-ITR은, 이것이 적절한 Rep 단백질과 쌍을 이루는 작동 가능한 Rep 결합 부위(RBE 또는 RBE')와 말단 분해 부위(TRS)를 가지고 있음을 결정하는 방식으로 WT로서 기능적으로 확인될 수 있다. 선택적으로, 허용 조건 하에서의 전이유전자 발현을 포함하는 다른 기능을 시험할 수 있다.
본원에 사용된 "변형된 ITR" 또는 "mod-ITR" 또는 "돌연변이 ITR"이라는 구절은 본원에서 상호교환적으로 사용되며, 동일한 혈청형의 WT-ITR과 비교하여 적어도 하나 또는 그 이상의 뉴클레오타이드에 돌연변이를 갖는 ITR을 나타낸다. 돌연변이는 ITR 내 A 영역, C 영역, C' 영역, B 영역, B' 영역 중 하나 이상을 변경시킬 수 있으며, 동일한 혈청형의 WT-ITR의 3D 공간 구성과 비교하여 3차원 공간 구성(즉, 기하학적 공간에서의 3D 구조)을 변경시킬 수 있다.
본원에 사용된 "비대칭인 ITR"이라는 용어(이는 "비대칭인 ITR 쌍"으로도 지칭됨)는, 전체 길이에 걸쳐 역 보체가 아닌 단일 ceDNA 게놈 또는 ceDNA 벡터 내 ITR의 쌍을 나타낸다. 하나의 비제한적인 예로서, 비대칭인 ITR 쌍은 3D 구조가 기하학적 공간에서 상이한 형상이 되도록 이의 동족 ITR과 대칭인 3차원 공간 구성을 갖지 않는다. 달리 말하면, 비대칭인 ITR 쌍은 전체적인 기하 구조가 상이하며, 즉, 이들은 3D 공간에서 A, C-C' 및 B-B' 루프의 구성이 상이하다(예를 들어, 하나의 ITR은 동족 ITR과 비교하여 짧은 C-C' 아암 및/또는 짧은 B-B' 아암을 가질 수 있음). 2개의 ITR 사이의 서열 차이는 뉴클레오타이드 부가, 결실, 절단 또는 점 돌연변이 중 하나 이상으로 인한 것일 수 있다. 하나의 구현예에서, 비대칭인 ITR 쌍 중 하나의 ITR은 야생형 AAV ITR 서열일 수 있고, 다른 하나의 ITR은 본원에 정의된 바와 같이 변형된 ITR(예를 들어, 비야생형 또는 합성 ITR 서열)일 수 있다. 또 다른 구현예에서, 비대칭인 ITR 쌍 중 어느 ITR도 야생형 AAV 서열이 아니며, 2개의 ITR은 기하학적 공간에서 상이한 형상을 갖는(즉, 전체 기하 구조가 상이한) 변형된 ITR이다. 일부 구현예에서, 비대칭인 ITR 쌍 중 하나의 mod-ITR은 짧은 C-C' 아암을 가질 수 있고, 다른 하나의 ITR은 동족 비대칭인 mod-ITR과 비교하여 상이한 3차원 공간 구성을 갖도록 상이한 변형(예를 들어, 단일 또는 짧은 B-B' 아암 등)을 가질 수 있다.
본원에 사용된 "대칭인 ITR"이라는 용어는, 야생형 또는 돌연변이된(예를 들어, 야생형에 비해 변형된) 데펜도바이러스 ITR 서열이고 전체 길이에 걸쳐 역 보체인, 단일 ceDNA 게놈 또는 ceDNA 벡터 내 ITR의 쌍을 나타낸다. 하나의 비제한적인 예에서, 두 개의 ITR은 모두 AAV2 유래의 야생형 ITR 서열이다. 또 다른 예에서, ITR 중 어느 것도 야생형 ITR AAV2 서열이 아니며(즉, 이는 변형된 ITR이며, 돌연변이 ITR로도 지칭됨), 뉴클레오타이드 부가, 결실, 치환, 절단 또는 점 돌연변이로 인해 야생형 ITR의 서열과 차이가 있을 수 있다. 본원에서 편의를 위해, ceDNA 벡터 내 발현 카세트(의 업스트림) 5'에 위치한 ITR은 "5' ITR" 또는 "좌측 ITR"로 지칭되고, ceDNA 벡터 내 발현 카세트(의 다운스트림) 3'에 위치한 ITR은 "3' ITR" 또는 "우측 ITR"로 지칭된다.
본원에 사용된 "실질적으로 대칭인 변형된 ITR" 또는 "실질적으로 대칭인 mod-ITR 쌍"이라는 용어는, 둘 모두 이의 전체 길이에 걸쳐 역 보체 서열을 갖는 단일 ceDNA 게놈 또는 ceDNA 벡터 내 변형된 ITR의 쌍을 나타낸다. 예를 들어, 변형된 ITR은, 역 보체 서열에서 벗어난 일부 뉴클레오타이드 서열을 갖더라도, 변화가 특성 및 전체 형상에 영향을 미치지 않는 한, 실질적으로 대칭인 것으로 간주될 수 있다. 하나의 비제한적인 예로서, 기본형 서열과 적어도 85%, 90%, 95%, 96%, 97%, 98% 또는 99%의 서열 동일성을 갖고(기본 설정으로 BLAST를 사용하여 측정 시), 또한 기하학적 공간에서의 3D 구조가 동일한 형상이 되도록 동족 변형된 ITR에 대칭인 3차원 공간 구성을 갖는 서열. 달리 말하면, 실질적으로 대칭인 변형된 ITR 쌍은 3D 공간에 구성된 동일한 A, C-C' 및 B-B' 루프를 갖는다. 일부 구현예에서, mod-ITR 쌍으로부터의 ITR은 상이한 역 보체 뉴클레오타이드 서열을 갖지만, 여전히 동일한 대칭인 3차원 공간 구성을 가질 수 있으며, 즉, 두 개의 ITR은 동일한 전체 3D 형상을 생성하는 돌연변이를 갖는다. 예를 들어, mod-ITR 쌍에서 하나의 ITR(예를 들어, 5' ITR)은 하나의 혈청형에서 유래할 수 있고, 다른 하나의 ITR(예를 들어, 3' ITR)은 상이한 혈청형에서 유래할 수 있지만, 두 가지 모두 동일한 상응하는 돌연변이를 가질 수 있으므로(예를 들어, 5' ITR이 C 영역에 결실을 갖는 경우, 상이한 혈청형으로부터의 동족의 변형된 3' ITR은 C' 영역의 상응하는 위치에 결실을 가짐), 변형된 ITR 쌍은 동일한 대칭인 3차원 공간 구성을 갖는다. 이러한 구현예에서, 변형된 ITR 쌍의 각각의 ITR은 상이한 혈청형(예를 들어, AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11 및 AAV12), 예컨대 AAV2와 AAV6의 조합에서 유래할 수 있으며, 여기서 하나의 ITR에서의 변형은 상이한 혈청형의 동족 ITR 내 상응하는 위치에 반영된다. 하나의 구현예에서, 실질적으로 대칭인 변형된 ITR 쌍은, ITR 사이의 뉴클레오타이드 서열 차이가 특성 또는 전체 형상에 영향을 미치지 않고 이들이 3D 공간에서 실질적으로 동일한 형상을 갖는 한, 변형된 ITR(mod-ITR)의 쌍을 나타낸다. 비제한적인 예로서, mod-ITR은 BLAST(Basic Local Alignment Search Tool) 또는 기본 설정의 BLASTN과 같은 당업계에 널리 알려진 표준 수단에 의해 측정 시 기본형 mod-ITR과 적어도 95%, 96%, 97%, 98% 또는 99%의 서열 동일성을 갖고, 또한 기하학적 공간에서의 3D 구조가 동일한 형상이 되도록 대칭인 3차원 공간 구성을 갖는다. 실질적으로 대칭인 mod-ITR 쌍은 3D 공간에서 동일한 A, C-C' 및 B-B' 루프를 가지며, 예를 들어 실질적으로 대칭인 mod-ITR 쌍에서 변형된 ITR이 C-C' 아암의 결실을 갖는 경우, 동족 mod-ITR은 C-C' 루프의 상응하는 결실을 갖고, 또한 이의 동족 mod-ITR의 기하학적 공간에서 동일한 형상으로 나머지 A 및 B-B' 루프의 유사한 3D 구조를 갖는다.
"플랭킹"이라는 용어는, 또 다른 핵산 서열에 대한 하나의 핵산 서열의 상대적인 위치를 나타낸다. 일반적으로, 서열 ABC에서, B에는 A와 C가 플랭킹되어 있다. 이는 배열 AxBxC에 대해서도 동일하게 적용된다. 따라서, 플랭킹 서열은 플랭킹된 서열의 앞에 있거나 뒤에 있지만, 플랭킹된 서열에 인접하거나 바로 근접할 필요는 없다. 하나의 구현예에서, 플랭킹이라는 용어는, 선형 이중체 ceDNA 벡터의 각 말단에 있는 말단반복을 나타낸다.
본원에 사용된 "치료하다", "치료하는" 및/또는 "치료"라는 용어는, 병태의 진행을 중단시키거나, 실질적으로 저해하거나, 느리게 하거나 또는 역전시키는 것; 병태의 임상 증상을 실질적으로 개선하는 것; 또는 병태의 임상 증상의 출현을 실질적으로 예방하는 것을 통해 유익하거나 목적하는 임상 결과를 수득하는 것을 포함한다. 일부 구현예에 따르면, 병태는 PKU이다. 치료는 나아가 다음 중 하나 이상을 달성하는 것을 나타낸다: (a) 장애의 중증도를 감소시키는 것; (b) 치료하고자 하는 장애(들)의 특징적인 증상의 발달을 제한하는 것; (c) 치료하고자 하는 장애(들)의 특징적인 증상의 악화를 제한하는 것; (d) 이전에 장애(들)를 앓았던 환자에서 장애(들)의 재발을 제한하는 것; 및 (e) 장애(들)에 대해 이전에 증상이 없었던 환자에서 증상의 재발을 제한하는 것. 약리학적 및/또는 생리학적 효과와 같은 유익하거나 목적하는 임상 결과에는, 비제한적으로, 질환, 장애 또는 병태에 걸리기 쉬울 수 있지만, 질환의 증상을 아직 경험하지 않았거나 나타내지 않은 대상에서 질환, 장애 또는 병태의 발생을 예방하는 것(예방적 치료), 질환, 장애 또는 병태의 증상 경감, 질환, 장애 또는 병태의 정도 감소, 질환, 장애 또는 병태의 안정화(즉, 악화시키지 않음), 질환, 장애 또는 병태의 확산 예방, 질환, 장애 또는 병태 진행의 지연 또는 늦추기, 질환, 장애 또는 병태의 개선 또는 완화, 및 이들의 조합뿐 아니라, 치료를 받지 않은 경우 예상되는 생존기간에 비해 생존기간을 연장시키는 것.
본원에 사용된 "증가시키다", "증강시키다", "상승시키다"(및 유사 용어)라는 용어는, 일반적으로, 본래 값, 예측 값 또는 평균 값에 비해, 또는 대조군 조건에 비해, 농도, 수준, 기능, 활성 또는 거동을, 직접적으로 또는 간접적으로, 증가시키는 작용을 나타낸다.
본원에 사용된 "최소화시키다", "저하시키다", "감소시키다" 및/또는 "저해하다"(및 유사 용어)라는 용어는, 일반적으로, 본래 값, 예측 값 또는 평균 값에 비해, 또는 대조군 조건에 비해, 농도, 수준, 기능, 활성 또는 거동을, 직접적으로 또는 간접적으로, 감소시키는 작용을 나타낸다.
본원에 사용된 "ceDNA 게놈"이라는 용어는, 적어도 하나의 역말단반복 영역을 추가로 포함하는 발현 카세트를 나타낸다. ceDNA 게놈은 하나 이상의 스페이서 영역을 추가로 포함할 수 있다. 일부 구현예에서, ceDNA 게놈은 DNA의 분자간 이중체 폴리뉴클레오타이드로서 플라스미드 또는 바이러스 게놈에 혼입된다.
본원에 사용된 "ceDNA 스페이서 영역"이라는 용어는, ceDNA 벡터 또는 ceDNA 게놈에서 기능성 요소를 분리하는 개재 서열을 나타낸다. 일부 구현예에서, ceDNA 스페이서 영역은 최적의 기능을 위해 2개의 기능성 요소를 목적하는 거리로 유지시킨다. 일부 구현예에서, ceDNA 스페이서 영역은, 예를 들어 플라스미드 또는 바큘로바이러스 내에 ceDNA 게놈의 유전적 안정성을 제공하거나 부가한다. 일부 구현예에서, ceDNA 스페이서 영역은, 클로닝 부위 등에 대한 편리한 위치를 제공하는 방식으로, ceDNA 게놈의 준비된 유전자 조작을 용이하게 한다. 예를 들어, 특정 양태에서, 몇몇 제한 엔도뉴클레아제 부위를 함유하는 올리고뉴클레오타이드 "폴리링커", 또는 알려진 단백질(예를 들어, 전사인자) 결합 부위를 갖지 않도록 설계된 비(non)오픈리딩프레임 서열은, 시스-작용 인자를 분리하기 위해, 예를 들어 말단 분해 부위와 업스트림 전사 조절 요소 사이에 2량체, 3량체, 5량체, 6량체, 10량체, 11량체, 12량체, 18량체, 24량체, 30량체, 48량체, 86량체, 176량체 등을 삽입하는 방식으로, ceDNA 게놈에 배치될 수 있다. 유사하게, 스페이서는 폴리아데닐화 신호 서열과 3'-말단 분해 부위 사이에 혼입될 수 있다.
본원에 사용된 "Rep 결합 부위", "Rep 결합 요소", "RBE" 및 "RBS"라는 용어는 상호교환적으로 사용되며, Rep 단백질에 의해 결합될 때, Rep 단백질이 RBS를 포함하는 서열에서 이의 부위 특이적 엔도뉴클레아제 활성을 수행할 수 있게 하는 Rep 단백질(예를 들어, AAV Rep 78 또는 AAV Rep 68)에 대한 결합 부위를 나타낸다. RBS 서열과 이의 역 보체는 함께 단일 RBS를 형성한다. RBS 서열은 당업계에 알려져 있으며, 예를 들어 AAV2에서 식별된 RBS 서열인 5'-GCGCGCTCGCTCGCTC-3'(서열번호 60)를 포함한다. 다른 알려진 AAV RBS 서열, 및 다른 자연적으로 알려진 또는 합성 RBS 서열을 포함하는, 임의의 알려진 RBS 서열이 본 개시내용의 구현예에서 사용될 수 있다. 이론에 구애됨 없이, Rep 단백질의 뉴클레아제 도메인은 이중체 뉴클레오타이드 서열 GCTC에 결합하기 때문에, 2개의 알려진 AAV Rep 단백질이 이중체 올리고뉴클레오타이드인 5'-(GCGC)(GCTC)(GCTC)(GCTC)-3'(서열번호 60) 상에 직접 결합하여 안정적으로 어셈블링된다고 여겨진다. 또한, 가용성 응집된 이형태체(conformer)(즉, 정의되지 않은 수의 상호연관된 Rep 단백질)는 해리되어, Rep 결합 부위를 함유하는 올리고뉴클레오타이드에 결합한다. 각각의 Rep 단백질은 각 가닥에서 질소성 염기 및 포스포디에스테르 백본과 상호작용한다. 질소성 염기와의 상호작용은 서열 특이성을 제공하지만, 포스포디에스테르 백본과의 상호작용은 비(non)서열 특이적 또는 덜 서열 특이적이며, 단백질-DNA 복합체를 안정화시킨다.
본원에 사용된 "말단 분해 부위" 및 "TRS"는 본원에서 상호교환적으로 사용되며, Rep가 5' 티미딘과 티로신-포스포디에스테르 결합을 형성하여, 세포 DNA 폴리머라아제, 예를 들어 DNA pol 델타 또는 DNA pol 엡실론을 통해 DNA 연장을 위한 기질로서 작용하는 3' OH를 생성하는 영역을 나타낸다. 대안적으로, Rep-티미딘 복합체는 조정된 결찰 반응에 참여할 수 있다. 일부 구현예에서, TRS는 염기쌍을 이루지 않은 티미딘을 최소한으로 포함한다. 일부 구현예에서, TRS의 닉킹 효율은 RBS로부터의 동일한 분자 내 거리에 의해 적어도 부분적으로 제어될 수 있다. 수용체 기질이 상보적 ITR인 경우, 생성되는 산물은 분자내 이중체이다. TRS 서열은 당업계에 알려져 있으며, 예를 들어 AAV2로 식별된 헥사뉴클레오타이드 서열인 5'-GGTTGA-3'(서열번호 61)을 포함한다. 다른 알려진 AAV TRS 서열 및 다른 자연적으로 알려진 또는 합성 TRS 서열, 예컨대 AGTT(서열번호 62), GGTTGG(서열번호 63), AGTTGG(서열번호 64), AGTTGA(서열번호 65), 및 RRTTRR(서열번호 66)과 같은 다른 모티프를 포함하는, 임의의 알려진 TRS 서열이 본 개시내용의 구현예에서 사용될 수 있다.
본원에 사용된 "ceDNA-플라스미드"라는 용어는, 분자간 이중체로서 ceDNA 게놈을 포함하는 플라스미드를 나타내다.
본원에 사용된 "ceDNA-박미드"라는 용어는, 플라스미드로서 대장균에서 증식할 수 있고, 따라서 바큘로바이러스에 대한 셔틀 벡터로서 작용할 수 있는 분자간 이중체로서 ceDNA 게놈을 포함하는 감염성 바큘로바이러스 게놈을 나타낸다.
본원에 사용된 "ceDNA-바큘로바이러스"라는 용어는, 바큘로바이러스 게놈 내에 분자간 이중체로서 ceDNA 게놈을 포함하는 바큘로바이러스를 나타낸다.
본원에 사용된 "ceDNA-바큘로바이러스 감염된 곤충 세포" 및 "ceDNA-BIIC"라는 용어는 상호교환적으로 사용되며, ceDNA-바큘로바이러스로 감염된 무척추동물 숙주세포(비제한적으로, 곤충 세포(예를 들어, Sf9 세포) 포함)를 나타낸다.
본원에 사용된 "ceDNA"라는 용어는, 합성 또는 그 이외의 다른 비바이러스성 유전자 전달을 위한 캡시드 미함유 폐쇄형 선형 이중가닥(ds) 이중체 DNA를 나타낸다. ceDNA에 대한 상세한 설명은, 2017년 3월 3일자 출원된 국제 특허 출원 PCT/US2017/020828에 기재되어 있으며, 상기 문헌의 전체 내용은 명백하게 본원에 참조로 인용된다. 세포 기반 방법을 사용하여 다양한 역말단반복(ITR) 서열 및 구성을 포함하는 ceDNA의 생산을 위한 특정 방법은, 2018년 9월 7일자 출원된 국제 특허 출원 PCT/US18/49996 및 2018년 12월 6일자 출원된 PCT/US2018/064242의 실시예 1에 기재되어 있으며, 상기 문헌들은 각각 그 전문이 본원에 참조로 인용된다. 다양한 ITR 서열 및 구성을 포함하는 합성 ceDNA 벡터의 생산을 위한 특정 방법은, 예를 들어 2019년 1월 18일자 출원된 국제 특허 출원 PCT/US2019/14122에 기재되어 있으며, 상기 문헌의 전체 내용은 본원에 참조로 인용된다.
본원에 사용된 "폐쇄형 DNA 벡터"라는 용어는, 적어도 하나의 공유결합으로 폐쇄된 말단을 갖고 벡터의 적어도 일부가 분자내 이중체 구조를 갖는 캡시드 미함유 DNA 벡터를 나타낸다.
본원에 사용된 "ceDNA 벡터" 및 "ceDNA"라는 용어는 상호교환적으로 사용되며, 적어도 하나의 말단 회문구조를 포함하는 폐쇄형 DNA 벡터를 나타낸다. 일부 구현예에서, ceDNA는 2개의 공유결합으로 폐쇄된 말단을 포함한다.
본원에 사용된 "neDNA" 또는 "닉킹된(nicked) ceDNA"라는 용어는, 오픈리딩프레임(예를 들어, 발현시키고자 하는 프로모터와 전이유전자)의 스템 영역 또는 스페이서 영역 5' 업스트림에 1개 내지 100개 염기쌍의 닉 또는 갭을 갖는 폐쇄형 DNA를 나타낸다.
본원에 사용된 "갭(gap)" 및 "닉(nick)"이라는 용어는 상호교환적으로 사용되며, 본 개시내용의 합성 DNA 벡터의 중단된 부분으로, 다르게는 이중가닥 ceDNA에서 단일가닥 DNA 부분의 스트레치를 형성하는 중단된 부분을 나타낸다. 갭은 이중체 DNA의 하나의 가닥에서 1개 염기쌍 내지 100개 염기쌍 길이일 수 있다. 본원에 기재된 방법에 의해 설계되고 형성된 전형적인 갭, 및 이러한 방법에 의해 생성된 합성 벡터는, 예를 들어 길이가 1 bp, 2 bp, 3 bp, 4 bp, 5 bp, 6 bp, 7 bp, 8 bp, 9 bp, 10 bp, 11 bp, 12 bp, 13 bp, 14 bp, 15 bp, 16 bp, 17 bp, 18 bp, 19 bp, 20 bp, 21 bp, 22 bp, 23 bp, 24 bp, 25 bp, 26 bp, 27 bp, 28 bp, 29 bp, 30 bp, 31 bp, 32 bp, 33 bp, 34 bp, 35 bp, 36 bp, 37 bp, 38 bp, 39 bp, 40 bp, 41 bp, 42 bp, 43 bp, 44 bp, 45 bp, 46 bp, 47 bp, 48 bp, 49 bp, 50 bp, 51 bp, 52 bp, 53 bp, 54 bp, 55 bp, 56 bp, 57 bp, 58 bp, 59 bp 또는 60 bp일 수 있다. 본 개시내용에 예시된 갭은 길이가 1 bp 내지 10 bp, 1 bp 내지 20 bp, 1 bp 내지 30 bp일 수 있다.
본원에 정의된 "리포터"란, 검출 가능한 판독물을 제공하는 데 사용될 수 있는 단백질을 나타낸다. 리포터는 일반적으로 형광, 색상 또는 발광과 같은 측정 가능한 신호를 생성한다. 리포터 단백질 코딩 서열은 세포 또는 유기체에서의 존재가 용이하게 관찰되는 단백질을 인코딩한다. 예를 들어, 형광 단백질은 특정 파장의 빛으로 여기될 때 세포가 형광을 나타내게 하고, 루시퍼라아제는 세포가 빛을 생성하는 반응을 촉진시키게 하며, β-갈락토시다아제와 같은 효소는 기질을 착색된 산물로 전환시킨다. 실험 또는 진단 목적에 유용한 예시적인 리포터 폴리펩타이드에는, 비제한적으로 β-락타마아제, β -갈락토시다아제(LacZ), 알칼리성 포스파타아제(AP), 티미딘 키나아제(TK), 녹색 형광 단백질(GFP) 및 다른 형광 단백질, 클로람페니콜 아세틸트랜스퍼라아제(CAT), 루시퍼라아제, 및 당업계에 널리 알려진 다른 것들이 포함된다.
본원에 사용된 "센스" 및 "안티센스"라는 용어는, 폴리뉴클레오타이드에서의 구조 요소의 배향을 나타낸다. 요소의 센스 및 안티센스 버전은 서로 역 보체이다.
본원에 사용된 "합성 AAV 벡터" 및 "AAV 벡터의 합성 생산"이라는 용어는, 완전한 무세포 환경에서의 AAV 벡터 및 이의 합성 생산 방법을 나타낸다.
본원에 사용된 "리포터"란, 검출 가능한 판독물을 제공하는 데 사용될 수 있는 단백질을 나타낸다. 리포터는 일반적으로 형광, 색상 또는 발광과 같은 측정 가능한 신호를 생성한다. 리포터 단백질 코딩 서열은 세포 또는 유기체에서의 존재가 용이하게 관찰되는 단백질을 인코딩한다. 예를 들어, 형광 단백질은 특정 파장의 빛으로 여기될 때 세포가 형광을 나타내게 하고, 루시퍼라아제는 세포가 빛을 생성하는 반응을 촉진시키게 하며, β-갈락토시다아제와 같은 효소는 기질을 착색된 산물로 전환시킨다. 실험 또는 진단 목적에 유용한 예시적인 리포터 폴리펩타이드에는, 비제한적으로 β-락타마아제, β -갈락토시다아제(LacZ), 알칼리성 포스파타아제(AP), 티미딘 키나아제(TK), 녹색 형광 단백질(GFP) 및 다른 형광 단백질, 클로람페니콜 아세틸트랜스퍼라아제(CAT), 루시퍼라아제, 및 당업계에 널리 알려진 다른 것들이 포함된다.
본원에 사용된 "이펙터(effector) 단백질"이라는 용어는, 예를 들어 리포터 폴리펩타이드, 또는 보다 적절하게는, 세포를 사멸시키는 폴리펩타이드, 예를 들어 독소, 또는 세포가 선택된 작용제 또는 이의 결여로 인해 사멸하기 쉽게 만드는 작용제로서 검출 가능한 판독물을 제공하는 폴리펩타이드를 나타낸다. 이펙터 단백질에는, 숙주세포의 DNA 및/또는 RNA를 직접 표적으로 하거나 이를 손상시키는 임의의 단백질 또는 펩타이드가 포함된다. 예를 들어, 이펙터 단백질은, 비제한적으로, 숙주세포 DNA 서열(게놈 요소인지 또는 염색체외 요소인지에 관계없이)을 표적으로 하는 제한 엔도뉴클레아제, 세포 생존에 필요한 폴리펩타이드 표적을 분해하는 프로테아제, DNA 자이라아제(gyrase) 저해제 및 리보뉴클레아제 유형 독소를 포함할 수 있다. 일부 구현예에서, 본원에 기재된 바와 같은 합성 생물학적 회로에 의해 제어되는 이펙터 단백질의 발현은, 또 다른 합성 생물학적 회로에 인자로 참여하여, 생물학적 회로 시스템의 반응성의 범위 및 복잡성을 확장시킬 수 있다.
전사 조절인자는 PAH와 같은 관심 유전자의 전사를 활성화시키거나 억제하는 전사 활성화제 및 억제인자를 나타낸다. 프로모터는 특정 유전자의 전사를 개시하는 핵산의 영역이다. 전사 활성화제는 전형적으로 전사 프로모터 근처에 결합하고 RNA 폴리머라아제를 동원하여, 직접 전사를 개시한다. 억제제는 전사 프로모터에 결합하여, RNA 폴리머라아제에 의한 전사 개시를 입체적으로 방해한다. 다른 전사 조절인자는 이들의 결합하는 위치, 및 세포 및 환경 조건에 따라 활성화제 또는 억제제로 작용할 수 있다. 전사 조절인자 부류의 비제한적인 예에는, 비제한적으로, 호메오도메인(homeodomain) 단백질, 아연-핑거 단백질, 날개있는 나선형(winged-helix)(포크헤드(forkhead)) 단백질 및 류신-지퍼 단백질이 포함된다.
본원에 사용된 "억제 단백질" 또는 "유도 단백질"은, 조절 서열 요소에 결합하여, 조절 서열 요소에 작동적으로 연결된 서열의 전사를, 각각, 억제 또는 활성화시키는 단백질이다. 본원에 기재된 바와 같은 바람직한 억제 및 유도 단백질은 적어도 하나의 입력물질 또는 환경 입력의 존재 또는 부재에 민감하다. 본원에 기재된 바와 같은 바람직한 단백질은, 예를 들어 분리 가능한 DNA-결합 및 입력물질-결합, 또는 반응성 요소 또는 도메인을 포함하는 형태의 모듈이다.
본원에 사용된 "담체"에는, 임의의 및 모든 용매, 분산 매질, 비히클, 코팅제, 희석제, 항균제 및 항진균제, 등장화제 및 흡수지연제, 완충제, 담체 용액, 현탁액, 콜로이드 등이 포함된다. 약학적 활성 물질에 대한 이러한 매질 및 작용제의 사용은 당업계에 알려져 있다. 보충 활성 성분이 또한 조성물에 혼입될 수 있다. "약학적으로 허용 가능한"이라는 구절은, 숙주에게 투여될 때 독성, 알레르기 또는 유사한 유해 반응을 생성하지 않는 분자 엔티티 및 조성물을 나타낸다.
본원에 사용된 "입력물질 반응성 도메인"은, 연결된 DNA 결합 융합 도메인을 해당 조건 또는 입력의 존재에 대해 반응성으로 만드는 방식으로 조건 또는 입력물질에 결합하거나 다르게는 이에 반응하는 전사인자의 도메인이다. 하나의 구현예에서, 조건 또는 입력의 존재는 입력물질 반응성 도메인 또는 이와 융합되는 단백질에서 입체형태 변화를 유도하여, 전사인자의 전사 조절 활성을 변형시킨다.
"생체내"라는 용어는, 다세포 동물과 같은 유기체에서 또는 유기체 내에서 일어나는 검정 또는 과정을 나타낸다. 본원에 기재된 일부 양태에서, 방법 또는 용도는, 박테리아와 같은 단세포 유기체가 사용될 때, "생체내"에서 일어난다고 할 수 있다. "생체외"라는 용어는, 다세포 동물 또는 식물의 체외, 예를 들어 특히 외식편, 배양된 세포(1차 세포 및 세포주 포함), 형질전환된 세포주 및 추출된 조직 또는 세포(혈액 세포 포함)에 있는 온전한 막을 갖는 살아있는 세포를 사용하여 수행되는 방법 및 용도를 나타낸다. "시험관내"라는 용어는, 세포 추출물과 같은 온전한 막을 갖는 세포의 존재를 필요로 하지 않는 검정 및 방법을 나타내며, 세포를 포함하지 않는 배지와 같은 비(non)세포 시스템, 또는 세포 추출물과 같은 세포 시스템에 프로그래밍 가능한 합성 생물학적 회로를 도입하는 것을 나타낼 수 있다.
본원에 사용된 "프로모터"라는 용어는, 단백질 또는 RNA를 인코딩하는 표적 유전자, 예를 들어 이종 표적 유전자일 수 있는 핵산 서열의 전사를 유도하는 방식으로 또 다른 핵산 서열의 발현을 조절하는 임의의 핵산 서열을 나타낸다. 프로모터는 구성적, 유도성, 억제성, 조직 특이적 또는 이들의 임의의 조합일 수 있다. 프로모터는 핵산 서열의 나머지 부분의 전사 개시 및 속도가 제어되는 핵산 서열의 제어 영역이다. 프로모터는 또한 RNA 폴리머라아제 및 다른 전사인자와 같은, 조절 단백질 및 분자에 결합할 수 있는 유전 요소를 함유할 수 있다. 본원에 기재된 양태의 일부 구현예에서, 프로모터는 프로모터 자체의 발현을 조절하는 전사인자의 발현을 유도할 수 있다. 프로모터 서열 내에는 전사 개시 부위뿐 아니라, RNA 폴리머라아제의 결합을 담당하는 단백질 결합 도메인이 발견될 것이다. 진핵생물 프로모터는 종종, 항상은 아니지만, "TATA" 박스와 "CAT" 박스를 함유할 것이다. 유도성 프로모터를 비롯한 다양한 프로모터는, 본원에 개시된 ceDNA 벡터의 전이유전자의 발현을 유도하는 데 사용될 수 있다. 프로모터 서열은 이의 3' 말단에서 전사 개시 부위에 의해 결합될 수 있으며, 배경 위에서 검출 가능한 수준으로 전사를 개시하는 데 필요한 최소한의 염기 또는 요소의 수를 포함하도록 업스트림(5' 방향)으로 연장된다. 일부 구현예에 따르면, 프로모터는 VD 프로모터, 인간 알파 1-항트립신(hAAT) 프로모터(hAAT(979) 프로모터 및 CpGmin_hAAT 프로모터, 예컨대 hAAT_core_C06; hAAT_core_C07; hAAT_core_C08; hAAT_core_C09; hAAT_core_C10 또는 hAAT_core truncated 포함) 및 트랜스티레틴(TTR) 간 특이적 프로모터(최소 TTR(TTRm) 포함)로 이루어지는 군에서 선택된다.
본원에 사용된 "인핸서"라는 용어는, 핵산 서열의 전사 활성화를 증가시키기 위해 하나 이상의 단백질(예를 들어, 활성화 단백질 또는 전사인자)과 결합하는 시스-작용 조절 서열(예를 들어, 50개 내지 1,500개 염기쌍)을 나타낸다. 인핸서는 이들이 조절하는 유전자 시작 부위의 업스트림 또는 유전자 시작 부위의 다운스트림에 최대 1,000,000개 염기쌍으로 배치될 수 있다. 인핸서는 인트론 영역 내, 또는 관련없는 유전자의 엑손 영역에 배치될 수 있다. 일부 구현예에 따르면, 인핸서는 인간 기원, 또는 부시베이비(bushbaby) 또는 중국 나무 두더지(Chinese tree shrew)와 같은 다른 포유류 기원의 세르핀 인핸서(SerpEnh), TTR 인핸서(TTRe), 간 핵인자 1 결합 부위(HNF1), 간 핵인자 4 결합 부위(HNF4), 인간 아포지질단백질 E/C-I 간 특이적 인핸서(ApoE Enh), 프로알부민 유전자의 인핸서 영역(ProEnh), CpG 최소화된 ApoE 인핸서(예를 들어, 본원에 기재된 바와 같은 ApoE 인핸서 C03, ApoE 인핸서 C04, ApoE 인핸서 C09 또는 ApoE 인핸서 C10), HCR1 footprint123(Embedded HCR1 footprint123), 간 핵인자 인핸서 어레이(Embedded enhancer HNF array), 및 인간 아포지질단백질 E/C-I 간 특이적 인핸서의 유도체(예를 들어, ApoE Enh v2)로 이루어지는 군에서 선택된다. 일부 구현예에 따르면, 인핸서는 다수(예를 들어, 탠덤 반복)의 단일 인핸서 요소, 또는 3xHNF1-4_Pro-Albumin Enhancer(인핸서가 TTR 프로모터에 연결된 ceDNA1471에서와 같이) 또는 5xHNF1_Pro-Albumin Enhancer(인핸서가 TTR 프로모터에 연결된 ceDNA1473에서와 같이)와 같은 상이한 유형의 인핸서일 수 있다. 일부 구현예에 따르면, HNF1 및/또는 HNF4와 같은 다수의 인핸서는 2개 인핸서 요소마다 스페이서 영역, 예를 들어 1개 내지 20개 뉴클레오타이드, 또는 약 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개 또는 20개 뉴클레오타이드를 함유할 수 있다.
프로모터는 이것이 조절하는 핵산 서열의 발현을 유도하거나 전사를 유도한다고 할 수 있다. "작동 가능하게 연결된", "작동적으로 배치된", "작동적으로 연결된", "제어 하에 있는" 및 "전사 제어 하에 있는"이라는 구절은, 프로모터가 해당 서열의 전사 개시 및/또는 발현을 제어하기 위해 조절하는 핵산 서열에 대해 정확한 기능적 위치 및/또는 배향으로 존재한다는 것을 나타낸다. 본원에 사용된 "역 프로모터"는, 코딩 가닥이 비코딩 가닥이 되고, 그 반대로도 되도록, 핵산 서열이 역 배향으로 존재하는 프로모터를 나타낸다. 역 프로모터 서열은 다양한 구현예에서 스위치의 상태를 조절하는 데 사용될 수 있다. 또한, 다양한 구현예에서, 프로모터는 인핸서와 함께 사용될 수 있다.
프로모터는 소정의 유전자 또는 서열의 코딩 분절 및/또는 엑손의 업스트림에 위치한 5' 비코딩 서열을 단리하여 얻을 수 있는 바와 같이 유전자 또는 서열과 자연적으로 연관된 것일 수 있다. 이러한 프로모터는 "내인성"으로 지칭될 수 있다. 유사하게, 일부 구현예에서, 인핸서는 해당 서열의 다운스트림 또는 업스트림에 위치한, 핵산 서열과 자연적으로 연관된 것일 수 있다.
일부 구현예에서, 코딩 핵산 분절은 "재조합 프로모터" 또는 "이종 프로모터"의 제어 하에 배치되며, 여기서 두 가지 프로모터는 모두 자연 환경에서 작동 가능하게 연결된 인코딩된 핵산 서열과 통상적으로 연관되지 않은 프로모터를 나타낸다. 재조합 또는 이종 인핸서는, 자연 환경에서 소정의 핵산 서열과 통상적으로 연관되지 않은 인핸서를 나타낸다. 이러한 프로모터 또는 인핸서는, 다른 유전자의 프로모터 또는 인핸서; 임의의 다른 원핵생물, 바이러스 또는 진핵생물 세포에서 단리된 프로모터 또는 인핸서; 및 "자연 발생"이 아닌, 즉, 상이한 전사조절 영역의 상이한 요소, 및/또는 당업계에 알려진 유전자 조작 방법을 통해 발현을 변경시키는 돌연변이를 포함하는 합성 프로모터 또는 인핸서를 포함할 수 있다. 프로모터와 인핸서의 핵산 서열을 합성적으로 생성하는 것에 더하여, 프로모터 서열은 본원에 개시된 합성 생물학적 회로 및 모듈과 관련하여, 재조합 클로닝 및/또는 핵산 증폭 기술(PCR 포함)을 사용하여 생성될 수 있다(예를 들어, 미국 특허 제4,683,202호, 미국 특허 제5,928,906호(이들은 각각 본원에 참조로서 인용됨) 참조). 나아가, 미토콘드리아, 엽록체 등과 같은 비(non)핵 세포소기관 내 서열의 전사 및/또는 발현을 지시하는 제어 서열이 또한 이용될 수 있다고 고려된다. 이러한 재조합 또는 이종 프로모터/인핸서의 비제한적인 예에는, TTR 프로모터를 갖는 세르핀 인핸서("Vandendriessche 프로모터"(VD) 또는 Vandendriesche(VD) 프로모터 세트로 지칭됨(예를 들어, 미국 특허 제10,149,914호(이는 본원에 참조로 인용됨) 참조)) 또는 TTR 프로모터를 갖는 3X 세르핀 인핸서("3X VD" 프로모터 세트로 지칭됨; 예를 들어, 미국 특허 출원 공개 US 2018/0071406A1(이는 본원에 참조로 인용됨) 참조)가 포함된다.
일부 구현예에서, 프로모터는 프로모터 세트일 수 있다. 본원에 사용된 "프로모터 세트"라는 용어는, 본원에 정의된 바와 같은 하나 이상의 프로모터(또는 프로모터 서열)와 본원에 정의된 바와 같은 하나 이상의 인핸서(또는 인핸서 서열)를 포함하는 시스템을 나타낸다. 본원에 사용된 "프로모터 세트"라는 용어는, 프로모터 및 인핸서 요소 또는 서열이 길이가 약 1개 내지 50개 뉴클레오타이드, 예를 들어 약 2개, 5개, 7개, 8개, 10개, 11개, 12개, 13개, 15개, 17개, 18개, 20개, 22개, 23개, 25개, 27개, 28개, 30개, 32개, 33개, 35개, 37개, 38개, 40개, 42개, 43개, 45개, 47개, 48개 또는 50개 뉴클레오타이드인 스페이서 영역 또는 서열에 의해 분리되어 있는 서열을 포함한다.
본원에서 교환가능하게 사용되는 "DNA 조절 서열", "제어 요소" 및 "조절 요소"라는 용어는, 비코딩 서열(예를 들어, DNA 표적화 RNA) 또는 코딩 서열(예를 들어, 부위 지정 변형 폴리펩타이드 또는 Cas9/Csn1 폴리펩타이드)을 제공하고/하거나 이의 전사를 조절하고/하거나, 인코딩된 폴리펩타이드의 전사를 조절하는, 프로모터, 인핸서, 폴리아데닐화 신호, 종결인자, 단백질 분해 신호 등과 같은 전사 및 번역 제어 서열을 나타낸다.
"작동 가능하게 연결된"이란, 기재된 바와 같은 구성요소가 의도된 방식으로 기능할 수 있도록 하는 관계에 있는 근접부위(juxtaposition)를 나타낸다. 예를 들어, 프로모터가 전사 또는 발현에 영향을 미치는 경우 프로모터는 코딩 서열에 작동 가능하게 연결되어 있다. "발현 카세트"는, ceDNA 벡터에서 전이유전자의 전사를 지시하는 데 충분한 프로모터 또는 다른 조절 서열에 작동 가능하게 연결된 DNA 서열, 예를 들어 이종 DNA 서열을 포함한다. 적합한 프로모터에는, 예를 들어 조직 특이적 프로모터가 포함된다. 프로모터는 또한 AAV 기원일 수 있다.
본원에 사용된 "대상"이라는 용어는, 본 개시내용에 따른 ceDNA 벡터로 치료(예방적 치료 포함)가 제공되는 인간 또는 동물을 나타낸다. 통상적으로, 동물은, 비제한적으로, 영장류, 설치류, 가축 또는 사냥감 동물과 같은 척추동물이다. 영장류에는, 비제한적으로, 침팬지, 시노몰구스 원숭이, 스파이더 원숭이 및 마카크(macaque), 예를 들어 레서스(Rhesus)가 포함된다. 설치류에는, 마우스, 래트, 마멋(woodchuck), 페럿(ferret), 토끼 및 햄스터가 포함된다. 가축 및 사냥감 동물에는, 비제한적으로, 소, 말, 돼지, 사슴, 들소, 버팔로, 고양이과 종류(예를 들어, 집고양이), 갯과 종류(예를 들어, 개, 여우, 늑대), 조류(예를 들어, 닭, 에뮤, 타조) 및 어류(송어, 메기 및 연어)가 포함된다. 본원에 기재된 양태의 특정 구현예에서, 대상은 포유류, 예를 들어 영장류 또는 인간이다. 대상은 남성 또는 여성일 수 있다. 또한, 대상은 유아 또는 어린이일 수 있다. 일부 구현예에서, 대상은 신생아 또는 태어나지 않은 대상, 예를 들어 자궁에 있는 대상일 수 있다. 바람직하게는, 대상은 포유류이다. 포유류는 인간, 비인간 영장류, 마우스, 래트, 개, 고양이, 말 또는 소일 수 있지만, 이러한 예에 제한되지 않는다. 인간 이외의 포유류는 질환 및 장애의 동물 모델을 나타내는 대상으로 유리하게 사용될 수 있다. 또한, 본원에 기재된 방법 및 조성물은 가축 및/또는 애완동물에 대해 사용될 수 있다. 인간 대상은 임의의 연령, 성별, 인종 또는 민족, 예를 들어 코카시안(백인), 아시아인, 아프리카인, 흑인, 아프리카계 미국인, 아프리카계 유럽인, 히스패닉계, 중동인 등일 수 있다. 일부 구현예에서, 대상은 임상 설정에서의 환자 또는 다른 대상일 수 있다. 일부 구현예에서, 대상은 이미 치료를 받고 있다. 일부 구현예에서, 대상은 배아, 태아, 신생아, 유아, 아동, 청소년 또는 성인이다. 일부 구현예에서, 대상은 인간 태아, 인간 신생아, 인간 유아, 인간 아동, 인간 청소년 또는 인간 성인이다. 일부 구현예에서, 대상은 동물 배아, 또는 비인간 배아 또는 비인간 영장류 배아이다. 일부 구현예에서, 대상은 인간 배아이다.
본원에 사용된 "숙주세포"라는 용어는, 본 개시내용의 핵산 작제물 또는 ceDNA 발현 벡터를 이용한 형질전환, 트랜스펙션, 형질도입 등에 민감한 임의의 세포 유형을 나타낸다. 비제한적인 예로서, 숙주세포는 단리된 1차 세포, 다능성줄기세포, CD34+ 세포), 유도된 다능성줄기세포, 또는 다수의 불멸화된 세포주 중 임의의 것(예를 들어, HepG2 세포)일 수 있다. 대안적으로, 숙주세포는 조직, 기관 또는 유기체의 제자리 또는 생체내 세포일 수 있다.
"외인성"라는 용어는, 천연 공급원 이외의 세포에 존재하는 물질을 나타낸다. 본원에 사용된 "외인성"이라는 용어는, 인간의 손이 관여하는 과정에 의해 세포 또는 유기체와 같은 생물학적 시스템에 도입된 핵산(예를 들어, 폴리펩타이드를 인코딩하는 핵산) 또는 폴리펩타이드로서, 통상적으로 발견되지 않으며 인간이 이러한 세포 또는 유기체에 도입하고자 하는 핵산 또는 폴리펩타이드를 나타낼 수 있다. 대안적으로, "외인성"은, 인간의 손이 관여하는 과정에 의해 세포 또는 유기체와 같은 생물학적 시스템에 도입된 핵산 또는 폴리펩타이드로서, 비교적 낮은 수준으로 발견되며, 인간이, 예를 들어 이소성(ectopic) 발현 또는 수준을 생성하도록 이러한 세포 또는 유기체 내 핵산 또는 폴리펩타이드의 양을 증가시키기 위해 도입하고자 하는 핵산 또는 폴리펩타이드를 나타낼 수 있다. 대조적으로, "내인성"이라는 용어는, 생물학적 시스템 또는 세포에 고유한 물질을 나타낸다.
"서열 동일성"이라는 용어는, 2개의 핵산 서열 사이의 관련성을 나타낸다. 본 개시내용의 목적을 위해, 2개의 데옥시리보뉴클레오타이드 서열 사이의 서열 동일성 정도는 EMBOSS 패키지(EMBOSS: The European Molecular Biology Open Software Suite, 상기 Rice 등의 문헌(2000) 참조)의 니들(Needle) 프로그램(바람직하게는 버전 3.0.0 이상)에서 구현된 바와 같이 니들만 브니쉬(Needleman-Wunsch) 알고리즘(상기 Needleman 및 Wunsch의 문헌(1970) 참조)을 사용하여 결정된다. 사용되는 선택적 매개변수는 갭 오픈 페널티 10, 갭 연장 페널티 0.5 및 EDNAFULL(NCBI NUC4.4의 EMBOSS 버전) 치환 매트릭스이다. 니들 표지된 "최장 동일성"의 출력(-nobrief 옵션을 사용하여 수득됨)은 동일성%로 사용되며, 이는 다음과 같이 계산된다: (동일한 데옥시뉴클레오타이드 x 100)/(정렬 길이 - 정렬의 총 갭 수). 정렬의 길이는 바람직하게는 적어도 10개 뉴클레오타이드, 바람직하게는 적어도 25개 뉴클레오타이드, 더욱 바람직하게는 적어도 50개 뉴클레오타이드 및 가장 바람직하게는 적어도 100개 뉴클레오타이드이다.
본원에 사용된 "상동성" 또는 "상동"이라는 용어는, 최대 서열 동일성%를 달성하기 위해, 필요한 경우, 서열을 정렬하고 갭을 도입한 후, 표적 염색체 상의 상응하는 서열의 뉴클레오타이드 잔기와 동일한 뉴클레오타이드 잔기의 백분율로 정의된다. 뉴클레오타이드 서열 상동성%를 결정하기 위한 정렬은, 예를 들어 BLAST, BLAST-2, ALIGN, ClustalW2 또는 Megalign(DNASTAR) 소프트웨어와 같은 공개적으로 이용 가능한 컴퓨터 소프트웨어를 사용하여, 당업계의 기술 내에서 다양한 방법으로 달성될 수 있다. 당업자는 비교되는 서열의 전체 길이에 걸쳐 최대 정렬을 달성하는 데 필요한 임의의 알고리즘을 포함하여, 서열 정렬을 위한 적절한 매개변수를 결정할 수 있다. 일부 구현예에서, 예를 들어 상동성 아암의 핵산 서열(예를 들어, DNA 서열)은, 서열이 숙주세포의 상응하는 천연 또는 미편집된 핵산 서열(예를 들어, 게놈 서열)과 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 이상 동일한 경우, "상동"인 것으로 간주된다.
본원에 사용된 "이종"이라는 용어는, 각각, 천연 핵산 또는 단백질에서 발견되지 않는 핵산 또는 폴리펩타이드 서열을 의미한다. 이종 핵산 서열은 (예를 들어, 유전자 조작에 의해) 자연 발생 핵산 서열(또는 이의 변이체)에 연결되어, 키메라 폴리펩타이드를 인코딩하는 키메라 핵산 서열을 생성할 수 있다. 이종 핵산 서열은 (예를 들어, 유전자 조작에 의해) 변이형 폴리펩타이드에 연결되어, 융합 변이형 폴리펩타이드를 인코딩하는 핵산 서열을 생성할 수 있다.
본원에 사용된 "벡터" 또는 "발현 벡터"는, 세포 내 부착된 분절의 복제를 야기하도록, 또 다른 DNA 분절, 즉, "삽입물"에 부착될 수 있는, 플라스미드, 박미드, 파지, 바이러스, 비리온 또는 코스미드(cosmid)와 같은 레플리콘이다. 벡터는 숙주세포로의 전달, 또는 상이한 숙주세포 사이에서의 전달을 위해 설계된 핵산 작제물일 수 있다. 본원에 사용된 벡터는 본래 및/또는 최종 형태가 바이러스성 또는 비바이러스성일 수 있지만, 본 개시내용의 목적을 위해, "벡터"는 일반적으로 본원에 사용된 바와 같은 용어로서의 ceDNA 벡터를 나타낸다. "벡터"라는 용어는, 적절한 제어 요소와 결합될 때 복제 가능하고, 유전자 서열을 세포로 전달할 수 있는 임의의 유전 요소를 포함한다. 일부 구현예에서, 벡터는 발현 벡터 또는 재조합 벡터일 수 있다.
본원에 사용된 "발현 벡터"라는 용어는, 벡터 상의 전사 조절 서열에 연결된 서열로부터 RNA 또는 폴리펩타이드의 발현을 지시하는 벡터를 나타낸다. 발현된 서열은 종종, 반드시는 아니지만, 세포에 대해 이종성일 수 있다. 발현 벡터는 추가 요소를 포함할 수 있으며, 예를 들어 발현 벡터는 2개의 복제 시스템을 가질 수 있기 때문에, 2가지 유기체에서, 예를 들어 인간 세포에서 발현을 위해, 원핵 숙주에서 클로닝 및 증폭을 위해 유지될 수 있다. "발현"이라는 용어는, 적용 가능한 경우, 비제한적으로, 예를 들어 전사, 전사체 처리, 번역 및 단백질 폴딩, 변형 및 처리를 포함하는, RNA 및 단백질의 생산, 및 적절한 경우, 단백질 분비에 관여하는 세포 과정을 나타낸다. "발현 산물"에는, 유전자에서 전사된 RNA, 및 유전자에서 전사된 mRNA의 번역에 의해 수득된 폴리펩타이드가 포함된다. "유전자"라는 용어는, 적절한 조절 서열에 작동 가능하게 연결될 때 시험관내 또는 생체내에서 RNA에 전사되는 핵산 서열(DNA)을 의미한다. 유전자는 코딩 영역의 앞뒤 영역, 예를 들어 5' 미번역(5' UTR) 또는 "리더(leader)" 서열과 3' UTR 또는 "트레일러(trailer)" 서열뿐 아니라, 개별 코딩 분절(엑손) 사이의 개재 서열(인트론)을 포함할 수도 포함하지 않을 수도 있다.
"재조합 벡터"란, 핵산 서열, 예를 들어 이종 핵산, 또는 생체내에서 발현 가능한 "전이유전자"를 포함하는 벡터를 의미한다. 본원에 기재된 벡터가, 일부 구현예에서, 다른 적합한 조성물 및 요법과 조합될 수 있다는 것을 이해해야 한다. 일부 구현예에서, 벡터는 에피솜 상태이다. 적합한 에피솜 벡터의 사용은 대상에서 관심 뉴클레오타이드를 염색체외 DNA에 높은 카피수로 유지하여, 염색체 통합의 잠재적인 영향을 제거하는 수단을 제공한다.
본원에 사용된 "유전 질환"이라는 구절은, 부분적으로 또는 완전히, 직접적으로 또는 간접적으로, 게놈 내 하나 이상의 비정상에 의해 유발된 질환, 특히 출생 시부터 존재한 병태를 나타낸다. 비정상은 돌연변이, 삽입 또는 결실일 수 있다. 비정상은 유전자의 코딩 서열 또는 이의 조절 서열에 영향을 미칠 수 있다. 유전 질환은, 비제한적으로, PKU, DMD, 혈우병, 낭성섬유증, 헌팅턴 무도병(Huntington's chorea), 가족성 고콜레스테롤혈증(LDL 수용체 결함), 간모세포종, 윌슨병(Wilson's disease), 선천성 간 포르피린증, 유전성 간 대사장애, 레쉬 니한 증후군(Lesch Nyhan syndrome), 낫적혈구빈혈, 지중해빈혈, 색소성 건피증, 판코니 빈혈(Fanconi's anemia), 색소성망막염, 모세혈관확장성 운동실조증, 블룸 증후군(Bloom's syndrome), 망막모세포종 및 테이-삭스병(Tay-Sachs disease)일 수 있다.
본원에 사용된 "포함하는" 또는 "포함하다"라는 용어는, 방법 또는 조성물에 필수적이지만, 필수적인지 여부에 관계없이 명시되지 않은 요소를 포함할 수도 있는, 조성물, 방법, 및 이의 각 구성요소(들)에 관하여 사용된다.
본원에 사용된 "~로 본질적으로 이루어진"이라는 용어는, 소정의 구현예에 필요한 요소를 나타낸다. 상기 용어는, 해당 구현예의 기본적인 및 신규한 또는 기능적인 특징(들)에 실질적으로 영향을 미치지 않는 요소의 존재를 허용한다. "포함하는"이라는 용어의 사용은 제한이 아닌 포함을 나타낸다.
"~로 이루어진"이라는 용어는, 구현예의 설명에 언급되지 않은 임의의 요소를 배제하는, 본원에 기재된 바와 같은 조성물, 방법 및 이의 각 구성요소를 나타낸다.
본원에 사용된 "~로 본질적으로 이루어진"이라는 용어는, 소정의 구현예에 필요한 요소를 나타낸다. 상기 용어는, 본 개시내용의 구현예의 기본적인 및 신규한 또는 기능적 특징(들)에 실질적으로 영향을 미치지 않는 추가 요소의 존재를 허용한다.
본 명세서 및 첨부된 청구범위에 사용된 바와 같이, 단수 형태의 표현은, 문맥에서 달리 명백하게 지시하지 않는 한, 복수의 언급 대상을 포함한다. 따라서, 예를 들어, "방법"에 대한 언급은 본원에 기재된 및/또는 본 개시내용 등을 읽을 때 당업자에게 명백해 질 수 있는 유형의 하나 이상의 방법 및/또는 단계를 포함한다. 유사하게, "또는"이라는 단어는, 문맥에서 달리 명백하게 지시되지 않는 한, "및"을 포함한다. 본원에 기재된 바와 유사하거나 동등한 방법 및 재료가 본 개시내용의 실시 또는 시험에 사용될 수 있지만, 적합한 방법 및 재료가 하기에 기재된다. "e.g."라는 약어는, 라틴어 예를 들어(exempli gratia)에서 유도된 것이며, 이는 본원에서 비제한적인 예를 나타내기 위해 사용된다. 따라서, "e.g."라는 약어는, "예를 들어"라는 용어와 동의어이다.
본원에 개시된 본 개시내용의 대안적인 요소 또는 구현예의 그룹화는 제한으로 해석되어서는 안 된다. 각각의 그룹 구성원은 개별적으로, 또는 그룹의 다른 구성원 또는 본원에서 확인되는 다른 요소와 조합으로 참조되고 청구될 수 있다. 그룹의 하나 이상의 구성원은 편의성 및/또는 특허성의 이유로 그룹에 포함되거나, 그룹에서 결실될 수 있다. 임의의 이러한 포함 또는 결실이 발생하는 경우, 본 명세서는 본원에 변형된 그룹을 포함하는 것으로 간주되어 첨부된 청구범위에 사용된 모든 마쿠쉬(Markush) 그룹에 대한 서면 기재를 충족시킨다.
임의의 양태의 일부 구현예에서, 본원에 기재된 개시내용은 인간을 클로닝하는 방법, 인간의 생식계열 유전자 정체성을 변형시키는 방법, 산업적 또는 상업적 목적을 위한 인간 배아의 사용, 또는 인간 또는 동물에게의 임의의 실질적인 의학적 유익 없이 고통을 야기할 수 있는 동물의 유전적 정체성을 변형시키는 방법, 및 또한 이러한 방법의 결과로서의 동물에 관한 것이 아니다.
다른 용어는 본 개시내용의 다양한 양태의 설명 내에서 본원에 정의된 바와 같다.
본 출원 전반에 걸쳐 인용된 모든 특허 및 다른 간행물(문헌 참조, 등록된 특허, 공개된 특허 출원 및 동시 계류중인 특허 출원 포함)은, 예를 들어 본원에 기재된 기술과 관련하여 사용될 수 있는 이러한 간행물에 기재된 방법론을 설명 및 개시하기 위한 목적으로 명백하게 본원에 참조로서 인용된다. 이러한 간행물은 본 출원의 출원일 이전의 개시내용에 대해서만 제공된다. 이와 관련하여, 선행 개시내용으로 인해 또는 임의의 다른 이유로, 본 발명자가 그러한 개시내용보다 선행할 자격이 없다는 것을 인정하는 것으로 해석되어서는 안 된다. 이러한 문서의 내용에 대한 날짜 또는 표현에 대한 모든 진술은 출원인이 이용 가능한 정보를 기반으로 하며, 이러한 문헌의 날짜 또는 내용의 정확성에 대한 승인을 구성하는 것으로 여겨지지 않는다.
본 개시내용의 구현예의 설명은 개시된 정확한 형태로 본 개시내용을 제한하거나, 완전한 것으로서 의도되지 않는다. 본 개시내용의 특정 구현예 및 이에 대한 예는 예시의 목적으로 본원에 기재되었으며, 당업자가 이해하는 바와 같이 본 개시내용의 범위 내에서 다양한 등가의 변형이 이루어질 수 있다. 예를 들어, 방법 단계 또는 기능이 소정의 순서로 제시되어 있지만, 대안적인 구현예는 상이한 순서로 기능을 수행할 수 있거나, 기능들이 실질적으로 동시에 수행될 수 있다. 본원에 제공된 개시내용의 교시는 적절하게 다른 절차 또는 방법에 적용될 수 있다. 본원에 기재된 다양한 구현예는 조합되어 추가 구현예를 제공할 수 있다. 본 개시내용의 양태는, 필요한 경우, 본 개시내용의 추가의 구현예를 제공하기 위해 상기 참고문헌 및 적용의 조성물, 기능 및 개념을 이용하도록 변형될 수 있다. 나아가, 생물학적 기능 동등성을 고려할 때, 생물학적 또는 화학적 작용의 종류 또는 양에 영향을 미치지 않는 한 단백질 구조에 약간의 변경이 이루어질 수 있다. 이러한 및 다른 변경은 상세한 설명을 고려하여 이루어질 수 있다. 모든 이러한 변형은 첨부된 청구범위의 범위 내에 포함되는 것으로 의도된다.
전술한 구현예 중 임의의 것의 특정 요소는 조합되거나, 다른 구현예의 요소로 치환될 수 있다. 나아가, 본 개시내용의 특정 구현예와 관련된 이점이 이러한 구현예의 맥락에서 기재되어 있지만, 다른 구현예 또한 이러한 이점을 나타낼 수 있으며, 모든 구현예가 본 개시내용의 범위 내에 속하기 위해 반드시 이러한 이점을 나타낼 필요가 있는 것은 아니다.
본원에 기재된 기술은 하기 예에 의해 추가로 예시되며, 이러한 예는 어떠한 방식으로든 추가적인 제한으로 해석되어서는 안 된다. 본 개시내용이 본원에 기재된 특정 방법론, 프로토콜 및 시약 등에 제한되지 않고, 달라질 수 있다는 것을 이해해야 한다. 본원에 사용된 용어는 단지 특정 구현예를 설명하기 위한 목적이며, 청구범위에 의해서만 한정되는 본 개시내용의 범위를 제한하고자 하는 것이 아니다.
II.
폐쇄형 DNA(ceDNA) 벡터로부터 PAH 단백질의 발현
본원에 기재된 기술은 일반적으로 비바이러스성 DNA 벡터, 예를 들어 본원에 기재된 바와 같은 ceDNA 벡터로부터의 세포 내 PAH 단백질의 발현 및/또는 생산에 관한 것이다. PAH 단백질의 발현을 위한 ceDNA 벡터는 본원의 "ceDNA 벡터 전반"이라는 제목의 섹션에 기재되어 있다. 특히, PAH 단백질의 발현을 위한 ceDNA 벡터는 (예를 들어, 본원에 기재된 바와 같은 대칭 또는 비대칭인) ITR 쌍과, ITR 쌍 사이에, 프로모터 또는 조절 서열에 작동적으로 연결된 본원에 기재된 바와 같은 PAH 단백질을 인코딩하는 핵산(여기서 핵산은 코돈 최적화됨)을 포함한다. 전형적인 AAV 벡터, 및 심지어 렌티바이러스 벡터에 비해 PAH 단백질의 발현을 위한 ceDNA 벡터의 뚜렷한 이점은, 목적하는 단백질을 인코딩하는 핵산 서열에 크기 제한이 없다는 점이다. 따라서, 심지어 전장 6.8 kb PAH 단백질도 단일 ceDNA 벡터로부터 발현될 수 있다. 따라서, 본원에 기재된 ceDNA 벡터는 이를 필요로 하는 대상, 예를 들어 PKU를 앓고 있는 대상에서 치료용 PAH 단백질을 발현시키는 데 사용될 수 있다.
당업자가 이해하는 바와 같이, 본원에 기재된 ceDNA 벡터 기술은 임의의 복잡성 수준에 맞게 조정될 수 있거나, PAH 단백질의 상이한 구성요소의 발현이 독립적인 방식으로 제어될 수 있는 모듈 방식으로 사용될 수 있다. 예를 들어, 구체적으로, 본원에 설계된 ceDNA 벡터 기술은 단일 유전자 서열(예를 들어, PAH 단백질)을 발현시키기 위해 단일 ceDNA 벡터를 사용하는 바와 같이 간단할 수 있거나, 다중 ceDNA 벡터를 사용(여기서 각각의 벡터는 상이한 프로모터에 의해 각각 독립적으로 제어되는 다수의 PAH 단백질, 또는 관련 보조인자 또는 부속 단백질을 발현시킴)하는 바와 같이 복잡할 수 있다고 고려된다. 하기 구현예는 본원에서 구체적으로 고려되며, 목적하는 바대로 당업자에 의해 조정될 수 있다.
하나의 구현예에서, 단일 ceDNA 벡터를 사용하여 PAH 단백질의 단일 구성요소를 발현시킬 수 있다. 대안적으로, 단일 ceDNA 벡터를 사용하여 단일 프로모터(예를 들어, 강력한 프로모터)의 제어 하에서 PAH 단백질의 다수의 구성요소(예를 들어, 적어도 2개)를 발현시킬 수 있으며, 선택적으로 IRES 서열(들)을 사용하여, 구성요소, 예를 들어 보조인자 또는 부속 단백질 각각의 적합한 발현을 보장할 수 있다.
본 개시내용에 따르면, 인간 PAH 단백질을 인코딩하는 핵산은 코돈 최적화된다.
당업자에 의해 ceDNA 벡터 기술의 추가적인 변형이 구상될 수 있거나, 통상적인 벡터를 사용하는 단백질 생산 방법이 조정될 수 있다.
A. 핵산
가능성 있는 치료용 핵산 분자의 특징분석 및 개발이 본원에 제공된다. 본원에 사용된 치료용 핵산은 PAH 단백질을 인코딩하며, 여기서 핵산은 코돈 최적화된다. 일부 구현예에서, 생체내 특성(전달, 안정성, 수명, 폴딩, 표적 특이성)의 변경 및 개선을 위한 올리고뉴클레오타이드의 화학적 변형뿐 아니라, 적절한 경우, 치료적 적용과 직접적인 상관관계가 있는 이의 생물학적 기능 및 메커니즘이 본원에 기재되어 있다.
면역자극성이며 본원에 개시된 면역억제제의 사용을 필요로 할 수 있는 본 개시내용의 예시적인 치료용 핵산은, 비제한적으로, 미니유전자, 플라스미드, 미니서클, 소형 간섭 RNA(siRNA), 마이크로RNA(miRNA), 안티센스 올리고뉴클레오타이드(ASO), 리보자임, 폐쇄형 이중가닥 DNA(예를 들어, ceDNA, CELiD, 선형의 공유결합으로 폐쇄된 DNA("미니스트링"), 개뼈형(dbDNA™), 프로텔로미어 폐쇄형 DNA 또는 덤벨 선형 DNA), 다이서-기질 dsRNA, 소형 헤어핀 RNA(shRNA), 비대칭 간섭 RNA(aiRNA), 가이드 RNA(gRNA), 마이크로RNA(miRNA), mRNA, tRNA, rRNA, 및 DNA 바이러스성 벡터, 바이러스성 RNA 벡터, 및 이들의 임의의 조합을 포함할 수 있다.
일부 구현예에 따르면, 치료용 핵산은 폐쇄형 이중가닥 DNA, 예를 들어 ceDNA이다. 일부 구현예에 따르면, 세포 내 치료용 단백질의 발현 및/또는 생산은 비바이러스성 DNA 벡터, 예를 들어 ceDNA 벡터에서 유래한 것이다. 전형적인 AAV 벡터, 및 심지어 렌티바이러스 벡터에 비해 치료용 단백질의 발현을 위한 ceDNA 벡터의 뚜렷한 이점은, 목적하는 단백질을 인코딩하는 핵산 서열, 예를 들어 이종 핵산 서열에 크기 제한이 없다는 점이다. 따라서, 심지어 거대한 치료용 단백질도 단일 ceDNA 벡터로부터 발현될 수 있다. 따라서, ceDNA 벡터는 이를 필요로 하는 대상에서 치료용 단백질을 발현시키는 데 사용될 수 있다.
일반적으로, 본원에 개시된 바와 같은 치료용 단백질의 발현을 위한 ceDNA 벡터는, 5'→3' 방향으로, 제1 아데노연관바이러스(AAV) 역말단반복서열(ITR), 관심 핵산 서열(예를 들어, 본원에 기재된 바와 같은 발현 카세트) 및 제2 AAV ITR을 포함한다. ITR 서열은, (i) 적어도 하나의 WT ITR과 적어도 하나의 변형된 AAV 역말단반복서열(mod-ITR)(예를 들어, 비대칭인 변형된 ITR); (ii) 2개의 변형된 ITR(여기서 mod-ITR 쌍은 서로에 대해 상이한 3차원 공간 구성을 가짐)(예를 들어, 비대칭인 변형된 ITR), 또는 (iii) 대칭 또는 실질적으로 대칭인 WT-WT ITR 쌍(여기서 각각의 WT-ITR은 동일한 3차원 공간 구성을 가짐), 또는 (iv) 대칭 또는 실질적으로 대칭인 변형된 ITR 쌍(여기서 각각의 mod-ITR은 동일한 3차원 공간 구성을 가짐) 중 임의의 것에서 선택된다.
일부 구현예에서, PAH 단백질을 인코딩하는 전이유전자는 또한 PAH 단백질이 골지체 및 소포체로 향하도록 분비 서열을 인코딩할 수 있으며, 여기서 PAH 단백질은 ER을 통과하여 세포 밖으로 나올 때 샤페론 분자에 의해 정확한 형태로 폴딩된다. 예시적인 분비 서열에는, 비제한적으로, VH-02(서열번호 88) 및 VK-A26(서열번호 89) 및 Igĸ 신호 서열(서열번호 126)뿐 아니라, 태그된 단백질이 시토졸 외부로 분비되게 하는 Gluc 분비 신호(서열번호 188), 태그된 단백질이 골지로 향하게 하는 TMD-ST 분비 서열(서열번호 189)이 포함된다.
조절 스위치는 또한, PAH 단백질이 목적하는 대로 발현되도록(비제한적으로, 목적하는 발현 수준 또는 양으로PAH 단백질이 발현되는 것을 포함함), 또는 대안적으로, 세포 신호전달 사건을 포함하는 특정 신호의 존재 또는 부재 하에 있을 때, PAH 단백질의 발현을 미세 조정하는 데 사용될 수 있다. 예를 들어, 본원에 기재된 바와 같이, ceDNA 벡터로부터 PAH 단백질의 발현은 조절 스위치라는 제목의 섹션에 본원에 기재된 바와 같이, 특정 조건이 발생하는 경우, 켜지거나 꺼질 수 있다.
예를 들어, 단지 예시의 목적으로, PAH 단백질은 PAH 단백질의 너무 높은 생산 수준과 같은 바람직하지 않은 반응을 차단하는 데 사용될 수 있다. PAH 유전자는 PAH 단백질을 목적하는 세포로 가져오기 위한 신호 펩타이드 마커를 함유할 수 있다. 하지만, 어느 상황에서도, PAH 단백질의 발현을 조절하는 것이 바람직할 수 있다. ceDNA 벡터는 조절 스위치의 사용을 용이하게 수용한다.
전형적인 AAV 벡터, 및 심지어 렌티바이러스 벡터에 비해 ceDNA 벡터의 뚜렷한 이점은, PAH 단백질을 인코딩하는 핵산 서열, 예를 들어 이종 핵산 서열에 대한 크기 제한이 없다는 점이다. 따라서, 심지어 전장 PAH뿐 아니라, 선택적으로 임의의 보조인자 또는 부속 단백질도 단일 ceDNA 벡터로부터 발현될 수 있다. 또한, 필요한 화학량론에 따라, 동일한 PAH 단백질의 다수의 분절을 발현시킬 수 있고, 동일하거나 상이한 프로모터를 사용할 수 있고, 각각의 영역의 발현을 미세 조정하기 위해 조절 스위치를 사용할 수도 있다. 예를 들어, 실시예에 제시된 바와 같이, PAH 단백질의 각각의 도메인에 대해 상이한 프로모터가 사용되는, 이중 프로모터 시스템을 포함하는 ceDNA 벡터가 사용될 수 있다. PAH 단백질의 생산을 위한 ceDNA 플라스미드의 사용은, 기능성 PAH 단백질의 형성을 위한 각각의 도메인의 적절한 비를 유도하는, PAH 단백질의 도메인의 발현을 위한 프로모터의 고유한 조합을 포함할 수 있다. 따라서, 일부 구현예에서, ceDNA 벡터는 (예를 들어, 상이한 프로모터의 제어 하에서) PAH 단백질의 상이한 영역을 개별적으로 발현시키는 데 사용될 수 있다.
또 다른 구현예에서, ceDNA 벡터로부터 발현된 PAH 단백질은 형광, 효소 활성, 분비 신호 또는 면역세포 활성화제와 같은 추가 기능을 추가로 포함한다.
일부 구현예에서, PAH 단백질을 인코딩하는 ceDNA는, 예를 들어 링커 도메인을 추가로 포함할 수 있다. 본원에 사용된 "링커 도메인"이란, 본원에 기재된 바와 같은 PAH 단백질의 임의의 도메인/영역을 함께 연결하는, 약 2개 내지 100개 아미노산 길이의 올리고- 또는 폴리펩타이드 영역을 나타낸다. 일부 구현예에서, 링커는 인접한 단백질 도메인이 서로 자유롭게 이동할 수 있도록, 글리세린 및 세린과 같은 가요성(flexible) 잔기를 포함하거나 이로 구성될 수 있다. 2개의 인접한 도메인이 서로 입체적으로 간섭하지 않도록 보장하는 것이 바람직한 경우, 보다 긴 링커가 사용될 수 있다. 링커는 절단 가능하거나 절단 가능하지 않을 수 있다. 절단 가능한 링커의 예에는, 2A 링커(예를 들어, T2A), 2A 유사 링커 또는 이들의 기능성 등가물, 및 이들의 조합이 포함된다. 링커는 토세아 아시그나(Thosea asigna) 바이러스에서 유도된 T2A 링커 영역일 수 있다.
예를 들어 PAH 등의 알려지고/알려지거나 공개적으로 이용 가능한 단백질 서열을 취하고, 이러한 단백질을 인코딩하기 위해 cDNA 서열을 역으로 조작하는 것은 당업자의 능력 범위 내에 있다. 따라서, cDNA는 의도된 숙주세포와 매칭되도록 코돈 최적화되고 본원에 기재된 바와 같은 ceDNA 벡터에 삽입될 수 있다.
B.
PAH 단백질을 발현하는 ceDNA 벡터
목적하는 PAH를 인코딩하는 하나 이상의 서열을 갖는 PAH 단백질의 발현을 위한 ceDNA 벡터는, 프로모터, 분비 신호, polyA 영역 및 인핸서와 같은 조절 서열을 포함할 수 있다. 최소한, ceDNA 벡터는 PAH 단백질을 인코딩하는 하나 이상의 핵산 서열, 예를 들어 이종 핵산 서열을 포함하며, 여기서 핵산 서열은 코돈 최적화된다. 일부 구현예에 따르면, 코돈 최적화된 핵산은 최적 전이유전자 발현 및 지속기간을 달성하기 위해 특정 시스-작용 요소(예를 들어, 특정 프로모터 및/또는 특정 인핸서)와 조합된다.
일부 구현예에 따르면, PAH 단백질은 이를 단백질 폴딩이 일어나는 ER로 향하게 하는 소포체 ER 리더 서열을 포함한다. 예를 들어, 폴딩을 위해 발현된 단백질(들)을 ER로 향하게 하는 서열.
일부 구현예에서, ceDNA 벡터에는, PAH 단백질이 세포내 표적(들)(예를 들어, 인트라바디) 또는 세포외 표적(들)에 결합될 수 있도록 PAH의 분비 또는 목적하는 세포하 국소화를 지시하는, 세포 또는 세포외 국소화 신호(예를 들어, 분비 신호, 핵 국소화 신호, 미토콘드리아 국소화 신호 등)가 포함되어 있다.
일부 구현예에서, 본원에 기재된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는, 모듈 방식으로 임의의 목적하는 PAH 단백질의 어셈블리 및 발현을 가능하게 한다. 본원에 사용된 "모듈(형)"이라는 용어는, 작제물로부터 쉽게 제거될 수 있는 ceDNA 발현 플라스미드의 요소를 나타낸다.
일부 구현예에서, PAH 발현을 위한 ceDNA 벡터는 전장 PAH 단백질을 인코딩하는 서열을 가질 수 있다. 일부 다른 구현예에서, PAH 발현을 위한 ceDNA 벡터는 절단된 PAH 단백질을 인코딩하는 서열을 가질 수 있다. 예를 들어, 절단된 PAH는 PAH의 자가조절 영역(예를 들어, 전장 PAH의 아미노산 1번 내지 19번)을 제거하기 위해 N-말단에 결실을 가질 수 있다. 하나의 구현예에서, PAH 발현을 위한 ceDNA 벡터는 아미노산 1번 내지 19번의 N-말단 절단을 갖는다.
일부 구현예에서, ceDNA 벡터는 기능성 PAH의 오픈리딩프레임 내부에 인트론이 있는 PAH 서열을 가질 수 있다. 일부 다른 구현예에서, ceDNA는 이종 신호 서열(SS)을 갖는 PAH 서열을 가질 수 있다. 또 다른 일부 구현예에서, ceDNA는 DNA 핵 표적화 서열을 갖는 PAH 서열을 가질 수 있다. 또 다른 일부 구현예에서, 코돈 최적화된 PAH의 ceDNA 벡터는 5' UTR 서열을 가질 수 있다. 또 다른 일부 구현예에서, 코돈 최적화된 PAH의 ceDNA 벡터는 인트론 서열을 가질 수 있다. 또 다른 일부 구현예에서, 코돈 최적화된 PAH의 ceDNA 벡터는 3' UTR 서열을 가질 수 있다. 또 다른 일부 구현예에서, 코돈 최적화된 PAH의 ceDNA 벡터는 하나 이상의 인핸서 서열을 가질 수 있다. 또 다른 일부 구현예에서, 코돈 최적화된 PAH의 ceDNA 벡터는 프로모터 서열을 가질 수 있다. 또 다른 일부 구현예에서, 코돈 최적화된 PAH의 ceDNA 벡터는 Kozak 서열을 가질 수 있다. 또 다른 일부 구현예에서, 코돈 최적화된 PAH의 ceDNA 벡터는 2개의 시스-작용 요소(예를 들어, 인핸서 요소) 사이 또는 시스-작용 요소와 오픈리딩프레임(ORF) 사이에 링커/스페이서 서열을 가질 수 있다.
C.
ceDNA 벡터에 의해 발현되는 예시적인 PAH 단백질
특히, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 페닐케톤뇨증(PKU)의 하나 이상의 증상의 치료, 예방 및/또는 개선에 사용되는, 예를 들어 PAH 단백질뿐 아니라, 이의 변이체 및/또는 활성 단편을 인코딩할 수 있다. 하나의 양태에서, 페닐케톤뇨증(PKU)은 인간 페닐케톤뇨증(PKU)이다.
(i)
PAH 치료 단백질 및 이의 단편
본 개시내용은 코돈 최적화된 핵산에 의해 인코딩되고, 본원에 기재된 바와 같은 ceDNA 벡터에서 및 이로부터 발현되는 PAH 치료 단백질 또는 이의 단편(예를 들어, 기능성 단편)을 제공한다. 당업자는, PAH 치료 단백질이 PAH 단백질의 모든 스플라이스 변이체 및 이종상동체(ortholog)를 포함한다는 것을 이해할 것이다. PAH 치료 단백질에는, 온전한 분자뿐 아니라, 이의 절단된 단편(예를 들어, 기능성 단편)이 포함된다.
전형적인 AAV 벡터, 및 심지어 렌티바이러스 벡터에 비해 ceDNA 벡터의 뚜렷한 이점은, 목적하는 단백질을 인코딩하는 핵산 서열, 예를 들어 이종 핵산 서열에 대한 크기 제한이 없다는 점이다. 따라서, 다수의 전장 PAH 치료 단백질도 단일 ceDNA 벡터로부터 발현될 수 있다.
PAH 단백질 및 유전자: PAH 유전자는 12q22-q24.2 밴드에서 12번 염색체 상에 위치한다. 2000년 현재, 대략 400가지 질환 유발 돌연변이가 PAH 유전자에서 확인되었다. 페닐알라닌 히드록실라아제(PAH)는 페닐알라닌 4-모노옥시게나아제, 페닐알라닌-4-히드록실라아제, Phe-4-모노옥시게나아제, EC 1.14.16.1, EC 1.14.16, PKU1, PKU 또는 PH로도 지칭될 수 있다.
PAH의 단백질 서열은 다음과 같다: 호모 사피엔스 PAH 효소 번역(450개 아미노산), 수탁번호 NM_000277.3.
MSTAVLENPGLGRKLSDFGQETSYIEDNCNQNGAISLIFSLKEEVGALAKVLRLFEENDVNLTHIESRPSRLKKDEYEFFTHLDKRSLPALTNIIKILRHDIGATVHELSRDKKKDTVPWFPRTIQELDRFANQILSYGAELDADHPGFKDPVYRARRKQFADIAYNYRHGQPIPRVEYMEEEKKTWGTVFKTLKSLYKTHACYEYNHIFPLLEKYCGFHEDNIPQLEDVSQFLQTCTGFRLRPVAGLLSSRDFLGGLAFRVFHCTQYIRHGSKPMYTPEPDICHELLGHVPLFSDRSFAQFSQEIGLASLGAPDEYIEKLATIYWFTVEFGLCKQGDSIKAYGAGLLSSFGELQYCLSEKPKLLPLELEKTAIQNYTVTEFQPLYYVAESFNDAKEKVRNFAATIPRPFSVRYDPYTQRIEVLDNTQQLKILADSINSEIGILCSALQK (서열번호 1025)
PAH는 간에서 우세하게 발현되며, 신장 및 담낭에서는 중간 정도로 발현된다. 낮은 수준의 PAH 발현은 또한 전립선, 부신에서도 검출될 수 있다. 태아 발달 동안, PAH는 부신, 심장, 장, 폐 및 위에서 발현될 수 있다. 따라서, PAH를 발현하는 ceDNA 벡터는 간, 신장, 담낭, 전립선, 부신에서 선택되는 임의의 하나 이상의 조직에 투여될 수 있다. 일부 구현예에서, PAH를 발현하는 ceDNA 벡터가 유아에게 투여되거나 대상의 자궁에 투여되는 경우, PAH를 발현하는 ceDNA 벡터는 간, 부신, 심장, 장, 폐 및 위에서 선택되는 임의의 하나 이상의 조직에 투여될 수 있다.
ceDNA 벡터로부터의 PAH 치료 단백질 또는 이의 단편의 발현은 본원에 기재된 바와 같은 하나 이상의 프로모터를 사용하여 공간적으로 및 시간적으로 달성될 수 있다. 일부 구현예에서, 프로모터는 VD 프로모터, 인간 알파 1-항트립신(hAAT) 프로모터(hAAT(979) 프로모터 및 CpGmin_hAAT 프로모터 포함) 및 트랜스티레틴(TTR) 간 특이적 프로모터로 이루어지는 군에서 선택된다.
일부 구현예에 따르면, PAH 단백질을 인코딩하는 핵산은 코돈 최적화되고, 본원에 기재된 바와 같은 ceDNA 벡터에 삽입된다.
본원에 사용된 "코돈 최적화된" 또는 "코돈 최적화"라는 용어는, 관심 척추동물, 예를 들어 마우스 또는 인간의 세포에서 발현 증강을 위해 핵산 서열을 변경하는 과정으로서, 천연 서열(예를 들어, 원핵생물 서열) 중 적어도 하나, 하나 초과 또는 유의한 수의 코돈을, 해당 척추동물의 유전자에서 보다 빈번하게 또는 가장 빈번하게 사용되는 코돈으로 대체하는 과정을 나타낸다. 다양한 종은 특정 아미노산의 특정 코돈에 대해 특정 편향을 나타낸다. 전형적으로, 코돈 최적화는 원래 번역된 단백질의 아미노산 서열을 변경시키지 않는다. 최적화된 코돈은, 예를 들어 Aptagen's GENE FORGE® 코돈 최적화 및 맞춤형 유전자 합성 플랫폼(Aptagen, Inc., 2190 Fox Mill Rd. Suite 300, Herndon, Va. 20171), 또는 또 다른 공개적으로 이용 가능한 데이터베이스를 사용하여 결정될 수 있다. 일부 구현예에서 PAH 단백질을 인코딩하는 핵산은 인간 발현을 위해 최적화된 것이고/것이거나, 인간 PAH 또는 이의 기능성 단편이다. 다양한 시스-작용 요소와 함께 ceDNA 발현을 위해 변경된 예시적인 PAH 서열이 본원에 개시되어 있다.
(ii)
ceDNA 벡터를 발현하는 PAH 치료 단백질
본원에 기재된 바와 같은 ceDNA 벡터는 PAH 치료 단백질 또는 이의 기능성 단편을 인코딩하는 하나 이상의 코돈 최적화된 핵산 서열, 예를 들어 이종 핵산 서열을 포함한다. 하나의 구현예에서, ceDNA 벡터는 본원의 표 1A에 열거된 것들에서 선택되는 PAH 서열을 인코딩하는 코돈 최적화된 핵산 서열을 포함한다.
[표 1A]
[표 1B]
하나의 구현예에서, ceDNA 벡터는 본원의 표 1A에 열거된 코돈 최적화된 인간 PAH 서열을 포함한다. 하나의 구현예에서, ceDNA 벡터는 표 1A에 열거된 서열과 적어도 90% 동일성을 갖는 코돈 최적화된 PAH 서열을 포함한다. 하나의 구현예에서, ceDNA 벡터는 표 1A에 열거된 서열과 적어도 91% 동일성을 갖는 코돈 최적화된 PAH 서열을 포함한다. 하나의 구현예에서, ceDNA 벡터는 표 1A에 열거된 PAH 서열과 적어도 92% 동일성을 갖는 코돈 최적화된 PAH 서열을 포함한다. 하나의 구현예에서, ceDNA 벡터는 표 1A에 열거된 서열과 적어도 93% 동일성을 갖는 코돈 최적화된 PAH 서열을 포함한다. 하나의 구현예에서, ceDNA 벡터는 표 1A에 열거된 서열과 적어도 94% 동일성을 갖는 코돈 최적화된 PAH 서열을 포함한다. 하나의 구현예에서, ceDNA 벡터는 표 1A에 열거된 서열과 적어도 95% 동일성을 갖는 코돈 최적화된 PAH 서열을 포함한다. 하나의 구현예에서, ceDNA 벡터는 표 1A에 열거된 서열과 적어도 96% 동일성을 갖는 코돈 최적화된 PAH 서열을 포함한다. 하나의 구현예에서, ceDNA 벡터는 표 1A에 열거된 서열과 적어도 97% 동일성을 갖는 코돈 최적화된 PAH 서열을 포함한다. 하나의 구현예에서, ceDNA 벡터는 표 1A에 열거된 서열과 적어도 98% 동일성을 갖는 코돈 최적화된 PAH 서열을 포함한다. 하나의 구현예에서, ceDNA 벡터는 표 1A에 열거된 서열과 적어도 99% 동일성을 갖는 코돈 최적화된 PAH 서열을 포함한다.
하나의 구현예에서, PAH 서열은 서열번호 382, 서열번호 383, 서열번호 384, 서열번호 385, 서열번호 386, 서열번호 387, 서열번호 389, 서열번호 390, 서열번호 391, 서열번호 392, 서열번호 393, 서열번호 394, 서열번호 395, 서열번호 396, 서열번호 397, 서열번호 398, 서열번호 399, 서열번호 400, 서열번호 401, 서열번호 402, 서열번호 403, 서열번호 404, 서열번호 405, 서열번호 406, 서열번호 407, 서열번호 408, 서열번호 409, 서열번호 410, 서열번호 411, 서열번호 412, 서열번호 413, 서열번호 414, 서열번호 415, 서열번호 416, 서열번호 417, 서열번호 418, 서열번호 419, 서열번호 420, 서열번호 421, 서열번호 422, 서열번호 423, 서열번호 424, 서열번호 425, 서열번호 426, 서열번호 427, 서열번호 428, 서열번호 429, 서열번호 430, 서열번호 431, 서열번호 432, 서열번호 433, 서열번호 434, 서열번호 435, 서열번호 436, 서열번호 437, 서열번호 438, 서열번호 439, 서열번호 440, 서열번호 1011, 서열번호 1012, 서열번호 1013, 서열번호 1014 또는 서열번호 1015와 적어도 90% 동일성을 갖는다. 하나의 구현예에서, PAH 서열은 서열번호 382 내지 440 또는 서열번호 1011 내지 1015 중 어느 하나와 적어도 91% 동일성을 갖는다. 하나의 구현예에서, PAH 서열은 서열번호 382 내지 440 또는 서열번호 1011 내지 1015 중 어느 하나와 적어도 92% 동일성을 갖는다. 하나의 구현예에서, PAH 서열은 서열번호 382 내지 440 또는 서열번호 1011 내지 1015 중 어느 하나와 적어도 93% 동일성을 갖는다. 하나의 구현예에서, PAH 서열은 서열번호 382 내지 440 또는 서열번호 1011 내지 1015 중 어느 하나와 적어도 94% 동일성을 갖는다. 하나의 구현예에서, PAH 서열은 서열번호 382 내지 440 또는 서열번호 1011 내지 1015 중 어느 하나와 적어도 95% 동일성을 갖는다. 하나의 구현예에서, PAH 서열은 서열번호 382 내지 440 또는 서열번호 1011 내지 1015 중 어느 하나와 적어도 96% 동일성을 갖는다. 하나의 구현예에서, PAH 서열은 서열번호 382 내지 440 또는 서열번호 1011 내지 1015 중 어느 하나와 적어도 97% 동일성을 갖는다. 하나의 구현예에서, PAH 서열은 서열번호 382 내지 440 또는 서열번호 1011 내지 1015 중 어느 하나와 적어도 98% 동일성을 갖는다. 하나의 구현예에서, PAH 서열은 서열번호 382 내지 440 또는 서열번호 1011 내지 1015 중 어느 하나와 적어도 99% 동일성을 갖는다. 하나의 구현예에서, PAH 서열은 서열번호 382, 서열번호 383, 서열번호 384, 서열번호 385, 서열번호 386, 서열번호 387, 서열번호 389, 서열번호 390, 서열번호 391, 서열번호 392, 서열번호 393, 서열번호 394, 서열번호 395, 서열번호 396, 서열번호 397, 서열번호 398, 서열번호 399, 서열번호 400, 서열번호 401, 서열번호 402, 서열번호 403, 서열번호 404, 서열번호 405, 서열번호 406, 서열번호 407, 서열번호 408, 서열번호 409, 서열번호 410, 서열번호 411, 서열번호 412, 서열번호 413, 서열번호 414, 서열번호 415, 서열번호 416, 서열번호 417, 서열번호 418, 서열번호 419, 서열번호 420, 서열번호 421, 서열번호 422, 서열번호 423, 서열번호 424, 서열번호 425, 서열번호 426, 서열번호 427, 서열번호 428, 서열번호 429, 서열번호 430, 서열번호 431, 서열번호 432, 서열번호 433, 서열번호 434, 서열번호 435, 서열번호 436, 서열번호 437, 서열번호 438, 서열번호 439, 서열번호 440, 서열번호 1011, 서열번호 1012, 서열번호 1013, 서열번호 1014 및 서열번호 1015로 이루어지는 군에서 선택되는 서열을 포함한다. 하나의 구현예에서, PAH 서열은 서열번호 382, 서열번호 383, 서열번호 384, 서열번호 385, 서열번호 386, 서열번호 387, 서열번호 389, 서열번호 390, 서열번호 391, 서열번호 392, 서열번호 393, 서열번호 394, 서열번호 395, 서열번호 396, 서열번호 397, 서열번호 398, 서열번호 399, 서열번호 400, 서열번호 401, 서열번호 402, 서열번호 403, 서열번호 404, 서열번호 405, 서열번호 406, 서열번호 407, 서열번호 408, 서열번호 409, 서열번호 410, 서열번호 411, 서열번호 412, 서열번호 413, 서열번호 414, 서열번호 415, 서열번호 416, 서열번호 417, 서열번호 418, 서열번호 419, 서열번호 420, 서열번호 421, 서열번호 422, 서열번호 423, 서열번호 424, 서열번호 425, 서열번호 426, 서열번호 427, 서열번호 428, 서열번호 429, 서열번호 430, 서열번호 431, 서열번호 432, 서열번호 433, 서열번호 434, 서열번호 435, 서열번호 436, 서열번호 437, 서열번호 438, 서열번호 439, 서열번호 440, 서열번호 1011, 서열번호 1012, 서열번호 1013, 서열번호 1014 또는 서열번호 1015로 이루어진다.
(iii) PAH 치료 단백질 및 PKU의 치료를 위한 이의 용도
본원에 기재된 ceDNA 벡터는 PAH 단백질의 부적절한 발현 및/또는 PAH 단백질 내 돌연변이와 관련된 PKU의 치료를 위한 치료용 PAH 단백질을 전달하는 데 사용될 수 있다.
본원에 기재된 바와 같은 ceDNA 벡터는 임의의 목적하는 PAH 치료 단백질을 발현시키는 데 사용될 수 있다. 예시적인 치료용 PAH 치료 단백질에는, 비제한적으로, 본원의 표 1A에 제시된 서열에 의해 발현되는 임의의 PAH 단백질이 포함된다.
하나의 구현예에서, 발현된 PAH 치료 단백질은 페닐케톤뇨증(PKU)의 치료에 기능성이 있다. 일부 구현예에서, PAH 치료 단백질은 면역계 반응을 야기하기 않는다.
일부 구현예에서, ceDNA 벡터는 절단된 PAH(단편)를 인코딩하는 코돈 최적화된 서열을 포함한다. 하나의 구현예에서, ceDNA 벡터는 N-말단 자가조절 영역, 예를 들어 전장 PAH 단백질의 아미노산 1번 내지 29번의 결실을 갖는 절단된 PAH를 인코딩하는 코돈 최적화된 서열을 포함한다. 하나의 구현예에서, ceDNA 벡터는 서열번호 394를 포함한다.
또 다른 구현예에서, PAH 치료 단백질 또는 이의 단편(예를 들어, 기능성 단편)을 인코딩하는 ceDNA 벡터는 키메라 단백질을 생성하는 데 사용될 수 있다. 따라서, 구체적으로는, 키메라 단백질을 발현하는 ceDNA 벡터가, 예를 들어 간, 신장, 담낭, 전립선, 부신에서 선택되는 임의의 하나 이상의 조직에 투여될 수 있다고 본원에서 고려된다. 일부 구현예에서, PAH를 발현하는 ceDNA 벡터가 유아에게 투여되거나 대상의 자궁에 투여되는 경우, PAH를 발현하는 ceDNA 벡터는 페닐케톤뇨증(PKU)의 생체내 또는 생체외 치료를 위해, 간, 부신, 심장, 장, 폐 및 위에서 선택되는 임의의 하나 이상의 조직, 또는 이의 간 줄기세포 전구체에 투여될 수 있다.
PKU: PKU는 PAH 유전자의 돌연변이에 의해 유발되는 희귀한 선천성 대사 이상이다. PAH는 통상적으로 간에서 발현되며, 식이(dietary) 페닐알라닌을 신경전달물질의 생성을 담당하는 아미노산인 티로신으로 대사시키는 데 필요한 효소이다. PKU는 PAH의 효소 활성이 결핍되게 하는 PAH의 돌연변이로 인해 발생한다. 따라서, PAH 단백질을 발현하는 ceDNA 벡터는 간에서 PAH를 발현시킬 수 있다. 일부 구현예에서, ceDNA 벡터는 간세포에서 적어도 하나의 PAH 단백질을 발현시킨다.
PAH는 통상적으로 PR 및 RPE 세포 유형 둘 모두에서 내인성으로 발현된다. 또한, RPE에서 낮은 수준의 PAH 발현은 정상적인 망막 기능에도 필요할 수 있다고 보고되어 있다. 따라서, PR 및 또한, 선택적으로 RPE 세포에서 ceDNA 벡터에 의한 PAH 단백질의 낮은 수준 또는 높은 수준의 발현은, 때때로 망막 변성을 예방하기 위해 필요할 수 있다. 이러한 발현 수준은 본원에 기재된 바와 같은 프로모터 및/또는 조절 스위치에 의해 미세 조정될 수 있다.
따라서, 일부 구현예에서, ceDNA 벡터는 광수용체와 RPE 둘 모두에서 정상적인 레티노이드 처리를 회복시키기 위해, 내인성 프로모터(약 1 kb)로부터 6.8 kb 단백질인 PAH 단백질의 발현에 사용된다. 일부 구현예에서, PAH 단백질을 발현하는 ceDNA 벡터는 망막의 더 넓은 영역을 치료하기 위해 맥락막상 또는 유리체내 투여 경로를 통해 투여된다. 일부 구현예에서, ceDNA 벡터는 망막하 주사, 맥락막상 주사 또는 유리체내 주사 중 임의의 하나 이상을 통해 투여된다.
상기 방법은 본원에 기재된 바와 같은 PAH 치료 단백질 또는 이의 단편(예를 들어, 기능성 단편)을 인코딩하는 ceDNA 벡터를 포함하는 조성물의 유효량을 대상에게 투여하는 단계를 포함한다. 당업자가 이해하는 바와 같이, "유효량"이라는 용어는, 질환 또는 장애의 치료를 위한 "치료적 유효량"으로 단백질의 발현을 유도하는, 투여되는 ceDNA 조성물의 양을 나타낸다.
PAH 치료 단백질 또는 이의 단편(예를 들어, 기능성 단편)을 인코딩하는 ceDNA 벡터를 포함하는 조성물의 투여량 범위는, 역가(예를 들어, 프로모터의 효율)에 따라 달라지며, 페닐케톤뇨증(PKU)의 치료를 위해 목적하는 효과, 예를 들어 목적하는 PAH 치료 단백질의 발현을 생성하는 데 충분히 큰 양을 포함한다. 투여량은 허용 가능하지 않은 부작용을 야기할 정도로 커서는 안 된다. 일반적으로, 투여량은 ceDNA 벡터의 특정한 특징, 발현 효율, 및 환자의 연령, 병태 및 성별에 따라 달라진다. 투여량은 당업자에 의해 결정될 수 있으며, 전형적인 AAV 벡터와 달리, ceDNA 벡터가 반복 투여를 방해하는 면역 활성화 캡시드 단백질을 포함하지 않기 때문에, 임의의 합병증 사례에서 개별 의사에 의해 조정될 수도 있다.
본원에 기재된 ceDNA 조성물의 투여는 제한된 기간 동안 반복될 수 있다. 일부 구현예에서, 용량은 주기적으로 또는 간헐적 투여로 제공된다. 바람직한 구현예에서, 상기 언급된 용량은 수개월에 걸쳐 투여된다. 치료 지속기간은 대상의 임상 진행과 치료에 대한 반응성에 따라 달라진다. 시간 경과에 따른 부스터 치료도 고려된다. 나아가, 발현 수준은 대상이 성장함에 따라 적정될 수 있다.
PAH 치료 단백질은 적어도 1주, 적어도 2주, 적어도 1개월, 적어도 2개월, 적어도 6개월, 적어도 12개월/1년, 적어도 2년, 적어도 5년, 적어도 10년, 적어도 15년, 적어도 20년, 적어도 30년, 적어도 40년, 적어도 50년 또는 그 이상 동안 대상에서 발현될 수 있다. 장기 발현은 선결된 또는 목적하는 간격으로 본원에 기재된 ceDNA 벡터를 반복 투여하는 방식으로 달성될 수 있다.
본원에 사용된 "치료적 유효량"이라는 용어는, 질환 바이오마커 발현의 통계적으로 유의하고 측정 가능한 변화, 또는 소정의 질환 증상의 감소를 생성하는 데 충분한(하기 "효능 측정" 섹션 참조), 발현된 PAH 치료 단백질 또는 이의 기능성 단편의 양이다. 이러한 유효량은 소정의 ceDNA 조성물에 대한 임상 시험 및 동물 연구에서 추정될 수 있다.
투여에 필요한 ceDNA 벡터의 정확한 양은 의사의 판단에 따라 달라지며, 각 개체마다 특정하다. 적합한 투여 방식 또한 가변적이지만, 초기 투여 후, 후속 주사 또는 다른 투여가 하나 이상의 간격으로 반복 투여되는 것이 전형적이다. 대안적으로, 특히 급성 질환/장애 치료의 경우, 생체내 치료법에 대해 명시된 범위로 혈중 농도를 유지하는 데 충분한 연속 정맥내 주입이 고려된다.
본원에 기재된 방법 및 조성물에 유용한 작용제는 국소적으로, 정맥내로(볼루스 또는 연속 주입으로), 세포내 주사로, 조직내 주사로, 경구로, 흡입으로, 복강내로, 근육내로, 피하로, 공동내로 투여될 수 있으며, 목적하는 경우, 연동 수단을 통해, 또는 당업자에게 알려진 다른 수단을 통해 전달될 수 있다. 작용제는, 목적하는 경우, 전신으로 투여될 수 있다. 이는 또한 자궁에 투여될 수 있다.
페닐케톤뇨증(PKU)에 대한 소정의 치료의 효능은 숙련된 임상의에 의해 결정될 수 있다. 하지만, 질환 또는 장애의 징후 또는 증상 중 어느 하나 또는 전부가 유익한 방식으로 변경되거나, 다른 임상적으로 허용되는 질환의 증상 또는 마커가, 예를 들어 PAH 또는 이의 기능성 단편을 인코딩하는 ceDNA 벡터로의 치료 후 적어도 10% 정도 호전되거나 개선되는 경우, 치료는 본원에 사용된 용어로 "유효한 치료"로 간주된다. 효능은 또한 질환의 안정화 또는 의학적 개입의 필요성에 의해 평가되는 바와 같이 개체의 악화 실패로 측정될 수 있다(즉, 질환의 진행이 중단되거나 적어도 느려짐). 이러한 지표의 측정 방법은 당업자에게 알려져 있고/있거나 본원에 기재되어 있다. 치료는 개체 또는 동물(일부 비제한적인 예에는, 인간 또는 포유류가 포함됨)에서의 질환의 임의의 치료를 포함하며, 이에는 (1) 질환을 저해하는 것, 예를 들어 질환 또는 장애의 진행을 중단시키거나 느리게 하는 것; 또는 (2) 질환을 완화시키는 것, 예를 들어 증상의 퇴행을 유발하는 것; 및 (3) 질환의 발달 가능성을 예방하거나 감소시키는 것, 또는 간부전 또는 신부전과 같은 질환과 관련된 2차 질환/장애를 예방하는 것을 포함한다. 질환의 치료를 위한 유효량은, 이를 필요로 하는 포유류에 투여되는 경우, 해당 질환에 대한 유효한 치료(이러한 용어는 본원에 정의된 바와 같음)를 유도하는 데 충분한 양을 의미한다.
작용제의 효능은 페닐케톤뇨증(PKU)에 대해 특정한 물리적 지표를 평가하는 방식으로 결정될 수 있다. PKU 지표의 표준 분석 방법은 당업계에 알려져 있다.
일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 또한, ceDNA로부터 발현된 PAH 단백질과 함께 사용될 수 있는, 보조인자 또는 다른 폴리펩타이드, 센스 또는 안티센스 올리고뉴클레오타이드, 또는 RNA(코딩 또는 비코딩; 예를 들어, siRNA, shRNA, gRNA, 마이크로RNA, 및 이들의 안티센스 대응물(예를 들어, antagoMiR))를 인코딩할 수 있다. 또한, PAH 단백질을 인코딩하는 서열을 포함하는 발현 카세트는 또한, β-락타마아제, β-갈락토시다아제(LacZ), 알칼리성 포스파타아제, 티미딘 키나아제, 녹색 형광 단백질(GFP), 클로람페니콜 아세틸트랜스퍼라아제(CAT), 루시퍼라아제 및 당업계에 널리 알려진 다른 것들과 같은, 실험 또는 진단 목적으로 사용되는 리포터 단백질을 인코딩하는 외인성 서열을 포함할 수 있다.
하나의 구현예에서, ceDNA 벡터는 PKU의 치료에 기능성이 있는 PAH 단백질을 발현시키는 핵산 서열을 포함한다. 바람직한 구현예에서, 치료용 PAH 단백질은, 목적하지 않는 경우, 면역계 반응을 야기하지 않는다.
III.
PAH 치료 단백질의 생산에 사용되는 ceDNA 벡터 전반
본 개시내용의 구현예는 PAH 전이유전자를 발현시킬 수 있는 폐쇄형 선형 이중체화된(ceDNA) 벡터를 포함하는 방법 및 조성물을 기반으로 한다. 일부 구현예에서, 전이유전자는 PAH 단백질을 인코딩하는 코돈 최적화된 서열이다(예를 들어, 서열번호 382 내지 440 또는 서열번호 1011 내지 1015 참조). 본원에 기재된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 크기 제한이 없기 때문에, 예를 들어 단일 벡터로부터 전이유전자의 발현에 필요한 모든 구성요소의 발현을 가능하게 한다. PAH 단백질의 발현을 위한 ceDNA 벡터는 바람직하게는 이중체이며, 예를 들어 발현 카세트와 같은 분자의 적어도 일부에 걸쳐 자가 상보적이다(예를 들어, ceDNA는 이중가닥 원형 분자가 아님). ceDNA 벡터는 공유결합으로 폐쇄된 말단을 갖기 때문에, 예를 들어 37℃에서 1시간 초과 동안 엑소뉴클레아제 소화(예를 들어, 엑소뉴클레아제 I 또는 엑소뉴클레아제 III)에 대한 내성이 있다.
일반적으로, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는, 5'→3' 방향으로, 제1 아데노연관바이러스(AAV) 역말단반복서열(ITR), 관심 핵산 서열(예를 들어, 본원에 기재된 바와 같은 발현 카세트) 및 제2 AAV ITR을 포함한다. ITR 서열은, (i) 적어도 하나의 WT ITR과 적어도 하나의 변형된 AAV 역말단반복서열(mod-ITR)(예를 들어, 비대칭인 변형된 ITR); (ii) 2개의 변형된 ITR(여기서 mod-ITR 쌍은 서로에 대해 상이한 3차원 공간 구성을 가짐)(예를 들어, 비대칭인 변형된 ITR), 또는 (iii) 대칭 또는 실질적으로 대칭인 WT-WT ITR 쌍(여기서 각각의 WT-ITR은 동일한 3차원 공간 구성을 가짐), 또는 (iv) 대칭 또는 실질적으로 대칭인 변형된 ITR 쌍(여기서 각각의 mod-ITR은 동일한 3차원 공간 구성을 가짐) 중 임의의 것에서 선택된다. PAH 단백질의 발현을 위한 ceDNA 벡터는 세포 기반(예를 들어, Sf9 또는 HEK293) 생산을 통해 또는 무세포 환경에서 복수의 올리고뉴클레오타이드를 사용하여 합성적으로 제작될 수 있다.
리포좀 나노입자 전달 시스템과 같은 전달 시스템을 추가로 포함할 수 있는, PAH 단백질 생산을 위한 ceDNA 벡터를 포함하는 방법 및 조성물이 본원에 포함된다. 비제한적인 예시적인 리포좀 나노입자 시스템이 본원에 개시되어 있다. 일부 양태에서, 본 개시내용은 ceDNA와 이온화 가능한 지질을 포함하는 지질 나노입자를 제공한다. 예를 들어, 2018년 9월 7일자 출원된 국제 출원 PCT/US2018/050042와 2020년 9월 3일자 출원된 국제 출원 PCT/US2020/049266(이들은 각각 그 전문이 본원에 참조로서 인용됨)에 기재된 바와 같은 방법으로 수득된 ceDNA 벡터로 제조되고 로딩되는 지질 나노입자 제형.
본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 바이러스 캡시드 내 제한적인 공간에 의해 부과되는 패키징 제약이 없다. ceDNA 벡터는, 캡슐화된 AAV 게놈과 대조적으로, 원핵생물에서 생산된 플라스미드 DNA 벡터에 대한 실행 가능한 진핵생물에서 생산된 대안을 나타낸다. 이는, 제어 요소, 예를 들어 본원에 개시된 바와 같은 조절 스위치, 대형 전이유전자, 다중 전이유전자 등의 삽입을 허용한다.
PAH 단백질의 발현을 위한 ceDNA 벡터는 캡시드를 함유하지 않으며, 제1 ITR, 전이유전자를 포함하는 발현 카세트 및 제2 ITR을 이러한 순서로 인코딩하는 플라스미드에서 수득될 수 있다. 발현 카세트는 전이유전자의 발현을 가능하게 하고/하거나 제어하는 하나 이상의 조절 서열을 포함할 수 있으며, 예를 들어 여기서 발현 카세트는 인핸서/프로모터, ORF(PAH를 인코딩하는 전이유전자), 전사 후 조절 요소(예를 들어, WPRE), 및 폴리아데닐화 및 종결 신호(예를 들어, BGH polyA) 중 하나 이상을 이러한 순서로 포함할 수 있다.
발현 카세트는 또한 내부 리보솜 진입 부위(IRES) 및/또는 2A 요소를 포함할 수 있다. 시스-조절 요소에는, 비제한적으로, 프로모터, 리보스위치, 절연인자, mir-조절 요소, 전사 후 조절 요소, 조직 및 세포 유형 특이적 프로모터, 및 인핸서가 포함된다. 일부 구현예에서, ITR은 전이유전자, 예를 들어 PAH 단백질을 위한 프로모터로서 작용할 수 있다. 일부 구현예에서, ceDNA 벡터는 PAH 단백질의 발현을 조절하기 위한 추가의 구성요소, 예를 들어 PAH 단백질의 발현을 제어하고 조절하기 위한 "조절 스위치"라는 제목의 섹션에 본원에 기재된 조절 스위치를 포함하며, 목적하는 경우, ceDNA 벡터를 포함하는 세포의 제어된 세포 사멸을 가능하게 하는 사멸 스위치인 조절 스위치를 포함할 수 있다.
발현 카세트는 4000개 초과의 뉴클레오타이드, 5000개 뉴클레오타이드, 10,000개 뉴클레오타이드 또는 20,000개 뉴클레오타이드, 또는 30,000 뉴클레오타이드, 또는 40,000개 뉴클레오타이드 또는 50,000개 뉴클레오타이드, 또는 약 4000개 내지 10,000개 뉴클레오타이드, 또는 10,000개 내지 50,000개 뉴클레오타이드 사이의 임의의 범위, 또는 50,000개 초과의 뉴클레오타이드를 포함할 수 있다. 일부 구현예에서, 발현 카세트는 길이가 500개 내지 50,000개 뉴클레오타이드 범위인 전이유전자를 포함할 수 있다. 일부 구현예에서, 발현 카세트는 길이가 500개 내지 75,000개 뉴클레오타이드 범위인 전이유전자를 포함할 수 있다. 일부 구현예에서, 발현 카세트는 길이가 500개 내지 10,000개 뉴클레오타이드 범위인 전이유전자를 포함할 수 있다. 일부 구현예에서, 발현 카세트는 길이가 1000개 내지 10,000개 뉴클레오타이드 범위인 전이유전자를 포함할 수 있다. 일부 구현예에서, 발현 카세트는 길이가 500개 내지 5,000개 뉴클레오타이드 범위인 전이유전자를 포함할 수 있다. ceDNA 벡터는 캡시드화된 AAV 벡터의 크기 제한이 없기 때문에, 대형 발현 카세트를 전달하여 효율적인 전이유전자 발현을 제공할 수 있다. 일부 구현예에서, ceDNA 벡터에는 원핵생물 특이적 메틸화가 없다.
ceDNA 발현 카세트는, 예를 들어 수용 대상에 존재하지 않거나, 이에서 불활성이거나 불충분한 활성을 갖는 단백질을 인코딩하는 발현 가능한 외인성 서열(예를 들어, 오픈리딩프레임) 또는 전이유전자, 또는 목적하는 생물학적 또는 치료 효과를 갖는 단백질을 인코딩하는 유전자를 포함할 수 있다. 전이유전자는 결함 유전자 또는 전사체의 발현을 교정하는 기능을 할 수 있는 유전자 산물을 인코딩할 수 있다. 원칙적으로, 발현 카세트는 돌연변이로 인해 존재하지 않거나 감소된 단백질, 폴리펩타이드 또는 RNA를 인코딩하거나, 과발현될 때 치료적 유익을 전달하는 것이 본 개시내용의 범위에 속하는 것으로 간주되는 임의의 유전자를 포함할 수 있다.
발현 카세트는 임의의 전이유전자(예를 들어, PAH 단백질을 인코딩함), 예를 들어 대상에서 PKU의 치료에 유용한 PAH 단백질, 즉, 치료용 PAH 단백질을 포함할 수 있다. 본원에 기재된 개시내용의 양태에 따르면, 발현 카세트는 코돈 최적화된 전이유전자를 포함한다. 추가 구현예에 따르면, 코돈 최적화된 전이유전자는 표 1A에 제시된 핵산 서열에서 선택된다.
ceDNA 벡터는 단독으로, 또는 폴리펩타이드를 인코딩하는 핵산 또는 비코딩 핵산(예를 들어, RNAi, miR 등)뿐 아니라, 대상의 게놈에 있는 바이러스 서열, 예를 들어 HIV 바이러스 서열 등을 포함하는 핵산 서열 및 외인성 유전자와 조합으로, 대상에서 임의의 관심 PAH 단백질을 전달하고 발현시키는 데 사용될 수 있다. 바람직하게는, 본원에 개시된 ceDNA 벡터는 치료 목적을 위해(예를 들어, 의학적, 진단적 또는 수의학적 용도로) 또는 면역원성 폴리펩타이드를 위해 사용된다. 특정 구현예에서, ceDNA 벡터는 하나 이상의 폴리펩타이드, 펩타이드, 리보자임, 펩타이드 핵산, siRNA, RNAi, 안티센스 올리고뉴클레오타이드, 안티센스 폴리뉴클레오타이드, 또는 RNA(코딩 또는 비코딩; 예를 들어 siRNA, shRNA, gRNA, 마이크로RNA, 및 이들의 안티센스 대응물(예를 들어, antagoMiR)), 항체, 융합 단백질, 또는 이들의 임의의 조합을 포함하는, 대상의 임의의 관심 유전자를 발현시키는 데 유용하다.
발현 카세트는 또한 폴리펩타이드, 센스 또는 안티센스 올리고뉴클레오타이드, 또는 RNA(코딩 또는 비코딩; 예를 들어, siRNA, shRNA, gRNA, 마이크로RNA, 및 이들의 안티센스 대응물(예를 들어, antagoMiR))를 인코딩할 수 있다. 발현 카세트는 또한, β-락타마아제, β-갈락토시다아제(LacZ), 알칼리성 포스파타아제, 티미딘 키나아제, 녹색 형광 단백질(GFP), 클로람페니콜 아세틸트랜스퍼라아제(CAT), 루시퍼라아제 및 당업계에 널리 알려진 다른 것들과 같은, 실험 또는 진단 목적으로 사용되는 리포터 단백질을 인코딩하는 외인성 서열을 포함할 수 있다.
본원에 제공된 방법에 의해 생산된 PAH 단백질의 발현을 위한 ceDNA 벡터는 바람직하게는 제한 효소 소화 검정으로 측정 시, 비연속 구조라기보다는 선형 및 연속 구조이다(도 3d). 선형 및 연속 구조는 세포 엔도뉴클레아제에 의한 공격으로부터 보다 안정적일 뿐 아니라, 재조합되어 돌연변이를 유발할 가능성이 적은 것으로 여겨진다. 따라서, 선형 및 연속 구조의 ceDNA 벡터가 바람직한 구현예이다. 연속, 선형, 단일가닥 분자내 이중체 ceDNA 벡터는, AAV 캡시드 단백질을 인코딩하는 서열 없이, 공유결합으로 결합된 말단을 가질 수 있다. 이러한 ceDNA 벡터는 박테리아 기원의 원형 이중체 핵산 분자인 플라스미드(본원에 기재된 ceDNA 플라스미드 포함)와 구조적으로 구별된다. 플라스미드의 상보적 가닥은 변성 후 분리되어 2개의 핵산 분자를 생성하지만, 대조적으로, 상보적 가닥을 갖는 ceDNA 벡터는, 단일 DNA 분자이기 때문에, 변성되더라도 단일 분자로 남아있다. 일부 구현예에서, 본원에 기재된 바와 같은 ceDNA 벡터는, 플라스미드와 달리, 원핵생물 유형의 DNA 염기 메틸화 없이 생산될 수 있다. 따라서, ceDNA 벡터와 ceDNA-플라스미드는 구조(특히, 선형 대 원형)의 측면에서, 또한 이러한 상이한 목적물을 생산하고 정제하는 데 사용되는 방법(하기 참조)의 측면에서, 또한 ceDNA-플라스미드의 경우 원핵생물 유형이고 ceDNA 벡터의 경우 진핵생물 유형인 이의 DNA 메틸화의 측면에서 모두 상이하다.
플라스미드 기반 발현 벡터에 비해 본원에 기재된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터를 사용하는 데에는 몇 가지 이점이 존재하며, 이러한 이점에는, 비제한적으로, 하기가 포함된다: 1) 플라스미드는 박테리아 DNA 서열을 함유하고 원핵생물 특이적 메틸화, 예를 들어 6-메틸 아데노신 및 5-메틸 시토신 메틸화에 적용되지만, 캡시드 미함유 AAV 벡터 서열은 진핵생물 기원으로 원핵생물 특이적 메틸화를 거치지 않으며; 그 결과, 캡시드 미함유 AAV 벡터는 플라스미드에 비해 염증 및 면역 반응을 유도할 가능성이 적음; 2) 플라스미드는 생산 과정 동안 내성 유전자의 존재를 필요로 하지만, ceDNA 벡터는 그렇지 않음; 3) 원형 플라스미드는 세포에의 도입 시 핵으로 전달되지 않고 세포 뉴클레아제에 의한 분해를 우회하기 위해서는 과부하가 필요하지만, ceDNA 벡터는 뉴클레아제에 대한 내성을 부여하는 바이러스성 시스-요소, 즉, ITR을 함유하고, 핵을 표적으로 하여 이에 전달되도록 설계될 수 있음. ITR 기능에 없어서는 안 될 최소 정의 요소를, Rep-결합 부위(RBS; AAV2의 경우 5'-GCGCGCTCGCTCGCTC-3'(서열번호 60))와 말단 분해 부위(TRS; AAV2의 경우 5'-AGTTGG-3'(서열번호 64)), 그리고 헤어핀 형성을 가능하게 하는 가변 회문구조 서열; 및 4) ceDNA 벡터가 T세포 매개 면역반응을 유발하는 톨유사(Toll-like) 수용체 패밀리의 멤버와 결합하는 것으로 보고된 원핵생물 유래 플라스미드에서 종종 발견되는 CpG 디뉴클레오타이드의 과대표현(over-representation)을 갖지 않는 것이라고 가정하였다. 대조적으로, 본원에 개시된 캡시드 미함유 AAV 벡터로의 형질도입은, 다양한 전달 시약을 사용하여 통상적인 AAV 비리온으로 형질도입하기 곤란한 세포 및 조직 유형을 효율적으로 표적화할 수 있다.
IV.
역말단반복서열(ITR)
본원에 개시된 바와 같은, PAH 단백질의 발현을 위한 ceDNA 벡터는 2개의 역말단반복서열(ITR) 사이에 배치된 핵산, 예를 들어 전이유전자 또는 이종 핵산 서열(예를 들어, 코돈 최적화된 이종 핵산 서열)을 함유하며, 여기서 ITR 서열은 비대칭인 ITR 쌍, 또는 대칭 또는 실질적으로 대칭인 ITR 쌍(이러한 용어는 본원에 정의된 바와 같음)일 수 있는 ceDNA 벡터가 본원에 정의된다. 본원에 개시된 바와 같은 ceDNA 벡터는, (i) 적어도 하나의 WT ITR과 적어도 하나의 변형된 AAV 역말단반복서열(mod-ITR)(예를 들어, 비대칭인 변형된 ITR); (ii) 2개의 변형된 ITR(여기서 mod-ITR 쌍은 서로에 대해 상이한 3차원 공간 구성을 가짐)(예를 들어, 비대칭인 변형된 ITR), 또는 (iii) 대칭 또는 실질적으로 대칭인 WT-WT ITR 쌍(여기서 각각의 WT-ITR은 동일한 3차원 공간 구성을 가짐), 또는 (iv) 대칭 또는 실질적으로 대칭인 변형된 ITR 쌍(여기서 각각의 mod-ITR은 동일한 3차원 공간 구성을 가짐) 중 임의의 것에서 선택되는 ITR 서열을 포함할 수 있으며, 여기서 본 개시내용의 방법은, 비제한적으로, 리포좀 나노입자 전달 시스템과 같은 전달 시스템을 추가로 포함할 수 있다.
일부 구현예에서, ITR 서열은 척추동물을 감염시키는 파르보바이러스아과와 곤충을 감염시키는 덴소바이러스아과의 2개의 아과를 포함하는 파르보바이러스과의 바이러스에서 유래할 수 있다. 파르보바이러스아과(파르보바이러스로 지칭됨)에는, 대부분의 조건 하에서, 생산적인 감염을 위해 아데노바이러스 또는 헤르페스바이러스와 같은 헬퍼 바이러스로의 동시감염을 필요로 하는 구성원인 데펜도바이러스속이 포함된다. 데펜도바이러스속에는, 통상적으로 인간(예를 들어, 혈청형 2, 3A, 3B, 5 및 6) 또는 영장류(예를 들어, 혈청형 1 및 4)를 감염시키는 아데노연관바이러스(AAV), 및 다른 온혈동물을 감염시키는 관련 바이러스(예를 들어, 소, 개, 말 및 양 아데노연관바이러스)가 포함된다. 파르보바이러스 및 파르보바이러스과의 다른 구성원은 일반적으로 문헌[Kenneth I. Berns, "Parvoviridae: The Viruses and Their Replication", Chapter 69 in FIELDS VIROLOGY (3d Ed. 1996)]에 기재되어 있다.
본원의 명세서 및 실시예에 예시된 ITR이 AAV2 WT-ITR이지만, 당업자는 상기 언급된 바와 같이 임의의 알려진 파르보바이러스, 예를 들어 AAV(예를 들어, AAV1, AAV2, AAV3, AAV4, AAV5, AAV 5, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAVrh8, AAVrh10, AAV-DJ 및 AAV-DJ8 게놈; 예를 들어 NCBI: NC 002077; NC 001401; NC001729; NC001829; NC006152; NC 006260; NC 006261)와 같은 데펜도바이러스 유래의 ITR, 키메라 ITR, 또는 임의의 합성 AAV 유래의 ITR을 사용할 수 있다는 것을 알고 있다. 일부 구현예에서, AAV는 온혈동물, 예를 들어 조류(AAAV), 소(BAAV), 개, 말 및 양 아데노연관바이러스를 감염시킬 수 있다. 일부 구현예에서, ITR은 B19 파르보바이러스(GenBank 수탁번호: NC 000883), 마우스 유래 미세생쥐바이러스(MVM)(GenBank 수탁번호 NC 001510); 거위 파르보바이러스(GenBank 수탁번호: NC 001701); 뱀 파르보바이러스 1(GenBank 수탁번호 NC 006148)에서 유래한 것이다. 일부 구현예에서, 본원에 논의된 바와 같이, 5' WT-ITR은 하나의 혈청형에서 유래할 수 있고, 3' WT-ITR은 상이한 혈청형에서 유래할 수 있다.
당업자는, ITR 서열이 전형적으로 T-형 또는 Y-형 헤어핀 구조인 이중가닥 홀리데이 접합의 공통 구조를 갖고, 여기서 각각의 WT-ITR은 보다 큰 회문구조 아암(A-A')에 삽입된 2개의 회문구조 아암 또는 루프(B-B' 및 C-C'), 및 단일가닥 D 서열로 형성된다(여기서, 이러한 회문구조 서열의 순서는 ITR의 플립 또는 플랍 배향을 정의함)는 것을 알고 있다. 예를 들어, 상이한 AAV 혈청형(AAV1 내지 AAV6) 유래의 ITR의 구조 분석 및 서열 비교는 문헌[Grimm et al., J. Virology, 2006; 80(1); 426-439]; 문헌[Yan et al., J. Virology, 2005; 364-379]; 문헌[Duan et al., Virology 1999; 261; 8-14]에 기재된 것을 참조한다. 당업자는, 본원에 제공된 예시적인 AAV2 ITR 서열에 기반하여 ceDNA 벡터 또는 ceDNA-플라스미드에 사용되는 임의의 AAV 혈청형 유래의 WT-ITR 서열을 용이하게 결정할 수 있다. 예를 들어, 다른 혈청형 유래의 좌측 ITR에 대한 AAV2의 좌측 ITR의 동일성%: AAV-1(84%), AAV-3(86%), AAV-4(79%), AAV-5(58%), AAV-6(좌측 ITR)(100%) 및 AAV-6(우측 ITR)(82%)을 보여주는, 문헌[Grimm et al., J. Virology, 2006; 80(1); 426-439]에 기재된 상이한 AAV 혈청형 유래 ITR의 서열 비교(AAV1 내지 AAV6, 및 조류 AAV(AAAV) 및 소 AAV(BAAV)) 참조.
A. 대칭인
ITR
쌍
일부 구현예에서, 본원에 기재된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는, 5'→3' 방향으로, 제1 아데노연관바이러스(AAV) 역말단반복서열(ITR), 관심 핵산 서열(예를 들어, 본원에 기재된 바와 같은 발현 카세트) 및 제2 AAV ITR을 포함하고, 여기서 제1 ITR(5' ITR)과 제2 ITR(3' ITR)은 서로에 대해 대칭이거나 실질적으로 대칭이며, 즉, ceDNA 벡터는, 이의 구조가 기하학적 공간에서 동일한 형상이거나, 3D 공간에서 동일한 A, C-C' 및 B-B' 루프를 갖도록, 대칭인 3차원 공간 구성을 갖는 ITR 서열을 포함할 수 있다. 이러한 구현예에서, 대칭인 ITR 쌍 또는 실질적으로 대칭인 ITR 쌍은, 야생형 ITR이 아닌 변형된 ITR(예를 들어, mod-ITR)일 수 있다. mod-ITR 쌍은 야생형 ITR로부터 하나 이상의 변형을 갖고, 서로 역 보체(역상)인 동일한 서열을 가질 수 있다. 대안적인 구현예에서, 변형된 ITR 쌍은 본원에 정의된 바와 같이 실질적으로 대칭이며, 즉, 변형된 ITR 쌍은 상이한 서열을 갖지만, 상응하거나 동일한 대칭인 3차원 형상을 가질 수 있다.
(i) 야생형 ITR
일부 구현예에서, 대칭인 ITR 또는 실질적으로 대칭인 ITR은 본원에 기재된 바와 같은 야생형(WT-ITR)이다. 즉, 2개의 ITR은 야생형 서열을 갖지만, 반드시 동일한 AAV 혈청형의 WT-ITR일 필요는 없다. 즉, 일부 구현예에서, 하나의 WT-ITR은 하나의 AAV 혈청형에서 유래할 수 있고, 다른 하나는 WT-ITR은 상이한 AAV 혈청형에서 유래할 수 있다. 이러한 구현예에서, WT-ITR 쌍은 본원에 정의된 바와 같이 실질적으로 대칭이며, 즉, 이들은 대칭인 3차원 공간 구성을 여전히 유지하면서, 하나 이상의 보존적 뉴클레오타이드 변형을 가질 수 있다.
따라서, 본원에 개시된 바와 같이, ceDNA 벡터는 서로 역 보체(역상)이거나, 또는 대안적으로, 서로에 대해 실질적으로 대칭이며, 즉, WT-ITR 쌍이 대칭인 3차원 공간 구성을 갖는, 2개의 플랭킹 야생형 역말단반복서열(WT-ITR) 사이에 배치된 핵산 서열, 예를 들어 전이유전자 또는 이종 핵산 서열을 함유한다. 일부 구현예에서, 야생형 ITR 서열(예를 들어, AAV WT-ITR)은 기능성 Rep 결합 부위(RBS; 예를 들어 AAV2의 경우 5'-GCGCGCTCGCTCGCTC-3', 서열번호 60)와 기능성 말단 분해 부위(TRS; 예를 들어 5'-AGTT-3', 서열번호 62)를 포함한다.
하나의 양태에서, PAH 단백질의 발현을 위한 ceDNA 벡터는 2개의 WT 역말단반복서열(WT-ITR)(예를 들어, AAV WT-ITR) 사이에 작동적으로 배치된 핵산, 예를 들어 이종 핵산을 인코딩하는 벡터 폴리뉴클레오타이드에서 수득될 수 있다. 즉, 2개의 ITR은 야생형 서열을 갖지만, 반드시 동일한 AAV 혈청형의 WT-ITR일 필요는 없다. 즉, 일부 구현예에서, 하나의 WT-ITR은 하나의 AAV 혈청형에서 유래할 수 있고, 다른 하나는 WT-ITR은 상이한 AAV 혈청형에서 유래할 수 있다. 이러한 구현예에서, WT-ITR 쌍은 본원에 정의된 바와 같이 실질적으로 대칭이며, 즉, 이들은 대칭인 3차원 공간 구성을 여전히 유지하면서, 하나 이상의 보존적 뉴클레오타이드 변형을 가질 수 있다. 일부 구현예에서, 5' WT-ITR은 하나의 AAV 혈청형에서 유래한 것이고, 3' WT-ITR은 동일하거나 상이한 AAV 혈청형에서 유래한 것이다. 일부 구현예에서, 5' WT-ITR과 3' WT-ITR은 서로 거울상이며, 즉, 이들은 대칭이다. 일부 구현예에서, 5' WT-ITR과 3' WT-ITR은 동일한 AAV 혈청형에서 유래한 것이다.
WT ITR은 널리 알려져 있다. 하나의 구현예에서, 2개의 ITR은 동일한 AAV2 혈청형에서 유래한 것이다. 특정 구현예에서, 다른 혈청형에서 유래한 WT를 사용할 수 있다. 다수의 상동인 혈청형, 예를 들어 AAV2, AAV4, AAV6, AAV8이 존재한다. 하나의 구현예에서, 거의 상동인 ITR(예를 들어, 유사한 루프 구조를 갖는 ITR)이 사용될 수 있다. 또 다른 구현예에서, 보다 다양한 AAV WT ITR, 예를 들어 AAV2와 AAV5가 사용될 수 있으며, 또 다른 구현예에서는, 실질적으로 WT인, 즉, WT의 기본 루프 구조를 갖지만, 특성을 변경시키거나 이에 영향을 미치지 않는 일부 보존적 뉴클레오타이드 변경을 갖는 ITR이 사용될 수도 있다. 동일한 바이러스 혈청형 유래의 WT-ITR이 사용되는 경우, 하나 이상의 조절 서열이 추가로 사용될 수 있다. 특정 구현예에서, 조절 서열은 ceDNA의 활성, 예를 들어 인코딩된 PAH 단백질의 발현을 조절할 수 있는 조절 스위치이다.
일부 구현예에서, 본원에 기재된 기술의 하나의 양태는 PAH 단백질의 발현을 위한 ceDNA 벡터에 관한 것으로, 여기서 ceDNA 벡터는 2개의 야생형 역말단반복서열(WT-ITR) 사이에 작동 가능하게 배치된 PAH 단백질을 인코딩하는 적어도 하나의 뉴클레오타이드 서열, 예를 들어 이종 핵산 서열을 포함하고, 여기서 WT-ITR은 동일한 혈청형, 상이한 혈청형에서 유래하거나, 또는 서로에 대해 실질적으로 대칭일 수 있다(즉, 기하학적 공간에서의 구조가 동일한 형상이 되도록 대칭인 3차원 공간 구성을 갖거나, 3D 공간에서 동일한 A, C-C' 및 B-B' 루프를 가짐). 일부 구현예에서, 대칭인 WT-ITR은 기능성 말단 분해 부위와 Rep 결합 부위를 포함한다. 일부 구현예에서, 핵산, 예를 들어 이종 핵산 서열은 전이유전자를 인코딩하고, 여기서 벡터는 바이러스 캡시드 내에 존재하지 않는다.
일부 구현예에서, WT-ITR은 동일하지만, 서로 역 보체이다. 예를 들어, 5' ITR에서 서열 AACG은 상응하는 부위의 3' ITR에서 CGTT(즉, 역 보체)일 수 있다. 하나의 예에서, 5' WT-ITR 센스 가닥은 ATCGATCG(서열번호 605)의 서열을 포함하고, 상응하는 3' WT-ITR 센스 가닥은 CGATCGAT(서열번호 606)(즉, ATCGATCG의 역 보체(서열번호 607))의 서열을 포함한다. 일부 구현예에서, WT-ITR ceDNA는 말단 분해 부위와 복제 단백질 결합 부위(RPS)(때때로 복제성 단백질 결합 부위로 지칭됨), 예를 들어 Rep 결합 부위를 추가로 포함한다.
WT-ITR을 포함하는 PAH 단백질의 발현을 위한 ceDNA 벡터에 사용되는 예시적인 WT-ITR 서열은 본원의 표 3에 제시되어 있으며, 이는 WT-ITR의 쌍(5' WT-ITR과 3' WT-ITR)으로 나타나 있다.
일부 구현예에서, 플랭킹 WT-ITR은 동일하고 서로에 대해 대칭이다. 일부 다른 구현예에서, 플랭킹 WT-ITR은 서로에 대해 실질적으로 대칭이다. 이러한 구현예에서, 5' WT-ITR은 AAV의 하나의 혈청형에서 유래할 수 있고, 3' WT-ITR은 AAV의 상이한 혈청형에서 유래할 수 있기 때문에, WT-ITR은 동일한 역 보체가 아니다. 예를 들어, 5' WT-ITR은 AAV2에서 유래할 수 있고, 3' WT-ITR은 상이한 혈청형(예를 들어, AAV1, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11 및 AAV12)에서 유래할 수 있다. 일부 구현예에서, WT-ITR은 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAV13, 뱀 파르보바이러스(예를 들어, 공비단뱀 파르보바이러스), 소 파르보바이러스, 염소 파르보바이러스, 조류 파르보바이러스, 개 파르보바이러스, 말 파르보바이러스, 새우 파르보바이러스, 돼지 파르보바이러스 또는 곤충 AAV 중 임의의 것에서 선택되는 2개의 상이한 파르보바이러스에서 선택될 수 있다. 일부 구현예에서, WT ITR의 이러한 조합은 AAV2와 AAV6에서 유래한 WT-ITR의 조합이다. 하나의 구현예에서, 실질적으로 대칭인 WT-ITR은, 하나가 다른 하나의 ITR에 대해 역상인 경우, 적어도 90% 동일, 적어도 95% 동일, 적어도 96%...97%... 98%... 99%....99.5%(및 이러한 동일성% 사이의 모든 지점 포함) 동일하며, 동일한 대칭인 3차원 공간 구성을 갖는다. 일부 구현예에서, WT-ITR 쌍은 대칭인 3차원 공간 구성, 예를 들어 A, C-C', B-B' 및 D 아암의 동일한 3D 구성을 갖기 때문에 실질적으로 대칭이다. 하나의 구현예에서, 실질적으로 대칭인 WT-ITR 쌍은 다른 하나에 대해 역상이며, 서로 적어도 95% 동일, 적어도 96%...97%... 98%... 99%....99.5% 동일(이러한 동일성% 사이의 모든 지점 포함)하고, 하나의 WT-ITR은 5'-GCGCGCTCGCTCGCTC-3'(서열번호 60)의 Rep-결합 부위(RBS)와 말단 분해 부위(trs)를 보유한다. 일부 구현예에서, 실질적으로 대칭인 WT-ITR 쌍은 서로에 대해 역상이며, 서로 적어도 95% 동일, 적어도 96%...97%... 98%... 99%....99.5% 동일(이러한 동일성% 사이의 모든 지점 포함)하고, 하나의 WT-ITR은 5'-GCGCGCTCGCTCGCTC-3' (서열번호 60)의 Rep-결합 부위(RBS)와 말단 분해 부위(trs), 및 헤어핀 2차 구조 형성을 가능하게 하는 가변 회문구조 서열을 보유한다. 상동성은 기본 설정의 BLAST(Basic Local Alignment Search Tool)(BLASTN)와 같은 당업계에 널리 알려진 표준 수단에 의해 결정될 수 있다.
일부 구현예에서, ITR의 구조 요소는 ITR과 큰 Rep 단백질(예를 들어, Rep 78 또는 Rep 68)의 기능적 상호작용에 관여하는 임의의 구조 요소일 수 있다. 특정 구현예에서, 구조 요소는 ITR과 큰 Rep 단백질의 상호작용에 대한 선택성을 제공하며, 즉, 적어도 부분적으로 어느 Rep 단백질이 ITR과 기능적으로 상호작용하는 지를 결정한다. 다른 구현예에서, 구조 요소는, Rep 단백질이 ITR에 결합될 때, 큰 Rep 단백질과 물리적으로 상호작용한다. 각각의 구조 요소는, 예를 들어 ITR의 2차 구조, ITR의 핵산 서열, 둘 이상의 요소 사이의 간격, 또는 상기 중 임의의 것의 조합일 수 있다. 하나의 구현예에서, 구조 요소는 A 및 A' 아암, B 및 B' 아암, C 및 C' 아암, D 아암, Rep 결합 부위(RBE) 및 RBE'(즉, 상보적 RBE 서열), 및 말단 분해 부위(trs)로 이루어지는 군에서 선택된다.
단지 예로서, 표 2는 WT-ITR의 예시적인 조합을 나타낸다.
[표 2] 동일한 혈청형 또는 상이한 혈청형, 또는 상이한 파르보바이러스 유래의 WT-ITR의 예시적인 조합. 표시된 순서는 ITR 위치의 위치를 나타내지 않으며, 예를 들어 "AAV1, AAV2"는, ceDNA가 5' 위치에 WT-AAV1 ITR을 3' 위치에 WT-AAV2 ITR을 포함할 수 있거나, 그 반대로, 5' 위치에 WT-AAV2 ITR을 3' 위치WT-AAV1 ITR을 포함할 수 있음을 나타낸다. 약어: AAV 혈청형 1(AAV1), AAV 혈청형 2(AAV2), AAV 혈청형 3(AAV3), AAV 혈청형 4(AAV4), AAV 혈청형 5(AAV5), AAV 혈청형 6(AAV6), AAV 혈청형 7(AAV7), AAV 혈청형 8(AAV8), AAV 혈청형 9(AAV9), AAV 혈청형 10(AAV10), AAV 혈청형 11(AAV11) 또는 AAV 혈청형 12(AAV12); AAVrh8, AAVrh10, AAV-DJ 및 AAV-DJ8 게놈(예를 들어, NCBI: NC 002077; NC 001401; NC001729; NC001829; NC006152; NC 006260; NC 006261), 온혈동물 유래의 ITR(조류 AAV(AAAV), 소 AAV(BAAV), 개, 말 및 양 AAV), B19 파르보바이러스 유래의 ITR(GenBank 수탁번호: NC 000883), 마우스 유래 미세생쥐바이러스(MVM)(GenBank 수탁번호: NC 001510); 거위: 거위 파르보바이러스(GenBank 수탁번호: NC 001701); 뱀: 뱀 파르보바이러스 1(GenBank 수탁번호: NC 006148).
[표 2]
단지 예로서, 표 3은 일부 상이한 AAV 혈청형 유래의 예시적인 WT-ITR의 서열을 보여준다.
[표 3]
일부 구현예에서, WT-ITR 서열의 핵산 서열은 변형될 수 있으며(예를 들어, 1개, 2개, 3개, 4개 또는 5개, 또는 그 이상의 뉴클레오타이드, 또는 그 안의 임의의 범위의 뉴클레오타이드 변형), 여기서 변형은 상보적 뉴클레오타이드로, 예를 들어 C의 경우 G, 및 그 반대로, 및 A의 경우 T, 및 그 반대로의 치환이다.
본 개시내용의 특정 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터는 서열번호 1, 서열번호 2, 서열번호 5 내지 서열번호 14 중 어느 하나에서 선택되는 핵산 서열로 이루어진 WT-ITR을 갖지 않는다. 본 개시내용의 대안적인 구현예에서, ceDNA 벡터가 서열번호 1, 서열번호 2, 서열번호 5 내지 서열번호 14 중 어느 하나에서 선택되는 핵산 서열을 포함하는 WT-ITR을 갖는 경우, 플랭킹 ITR은 또한 WT이고, ceDNA 벡터는, 예를 들어 본원 및 국제 특허 출원 PCT/US18/49996(예를 들어, PCT/US18/49996(이는 그 전문이 본원에 참조로 인용됨)의 표 11 참조)에 개시된 바와 같은 조절 스위치를 포함한다. 일부 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터는 본원에 개시된 바와 같은 조절 스위치와, 서열번호 1, 2, 5 내지 14 중 어느 하나에서 선택되는 핵산 서열을 갖는 선택된 WT-ITR을 포함한다.
본원에 기재된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 작동 가능한 RBE, trs 및 RBE´ 부분을 보유하는 WT-ITR 구조를 포함할 수 있다. 도 1a 및 도 1b는, 예시 목적으로 야생형 ITR을 사용하여, ceDNA 벡터의 야생형 ITR 구조 부분 내에서 trs 부위의 작동을 위한 하나의 가능한 메커니즘을 보여준다. 일부 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터는 Rep-결합 부위(예를 들어, RBS; AAV2의 경우 5'-GCGCGCTCGCTCGCTC-3'(서열번호 60))와 말단 분해 부위(TRS; 예를 들어, 5'-AGTT(서열번호 62))를 포함하는 하나 이상의 기능성 WT-ITR 폴리뉴클레오타이드 서열을 함유한다. 일부 구현예에서, 적어도 하나의 WT-ITR은 기능성이다. 대안적인 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터가 서로 실질적으로 대칭인 2개의 WT-ITR을 포함하는 경우, 적어도 하나의 WT-ITR은 기능성이고, 적어도 하나의 WT-ITR은 비기능성이다.
B.
비대칭인 ITR 쌍 또는 대칭인 ITR 쌍을 포함하는 ceDNA 벡터에 대한 변형된 ITR(mod-ITR) 전반
본원에 논의된 바와 같이, PAH 단백질의 발현을 위한 ceDNA 벡터는 대칭인 ITR 쌍 또는 비대칭인 ITR 쌍을 포함할 수 있다. 두 경우 모두, ITR 중 하나 또는 둘 모두는 변형된 ITR일 수 있으며, 여기서 차이점은, 첫 번째 경우(즉, 대칭인 mod-ITR), mod-ITR은 동일한 3차원 공간 구성을 갖지만(즉, 동일한 A-A', C-C' 및 B-B' 아암 구성을 가짐), 두 번째 경우(즉, 비대칭인 mod-ITR), mod-ITR은 상이한 3차원 공간 구성을 갖는다(즉, 상이한 A-A', C-C' 및 B-B' 아암 구성을 가짐)는 점이다.
일부 구현예에서, 변형된 ITR은 야생형 ITR 서열(예를 들어, AAV ITR)과 비교하여 결실, 삽입 및/또는 치환에 의해 변형된 ITR이다. 일부 구현예에서, ceDNA 벡터에서 ITR 중 적어도 하나는 기능성 Rep 결합 부위(RBS; 예를 들어 AAV2의 경우 5'-GCGCGCTCGCTCGCTC-3', 서열번호 60)와 기능성 말단 분해 부위(TRS; 예를 들어 5'-AGTT-3', 서열번호 62)를 포함한다. 하나의 구현예에서, ITR 중 적어도 하나는 비기능성 ITR이다. 하나의 구현예에서, 상이한 또는 변형된 ITR은 각각 상이한 혈청형 유래의 야생형 ITR이 아니다.
ITR의 특정 변경 및 돌연변이가 본원에 상세하게 설명되어 있지만, ITR의 맥락에서, "변경된" 또는 "돌연변이된" 또는 "변형된"은 뉴클레오타이드가 야생형, 참조 또는 본래 ITR 서열에 비해 삽입, 결실 및/또는 치환된 것을 나타낸다. 변경된 또는 돌연변이된 ITR은 조작된 ITR일 수 있다. 본원에 사용된 "조작된"은, 인간의 손에 의해 조작된 양태를 나타낸다. 예를 들어, 폴리펩타이드는, 폴리펩타이드의 적어도 하나의 양태, 예를 들어 이의 서열이, 자연에 존재하는 양태와 상이하도록 인간의 손에 의해 조작된 경우, "조작된" 것으로 간주된다.
일부 구현예에서, mod-ITR은 합성일 수 있다. 하나의 구현예에서, 합성 ITR은 하나 초과의 AAV 혈청형에서 유래한 ITR 서열을 기반으로 한다. 또 다른 구현예에서, 합성 ITR은 AAV 기반 서열을 포함하지 않는다. 또 다른 구현예에서, 합성 ITR은 AAV 유래 서열을 갖지 않거나 일부만 갖지만, 상기 기재된 ITR 구조를 보존한다. 일부 양태에서, 합성 ITR은 야생형 Rep 또는 특정 혈청형의 Rep와 우선적으로 상호작용할 수 있거나, 또는 일부 경우에, 야생형 Rep에 의해 인식되지 않고 돌연변이된 Rep에 의해서만 인식될 수 있다.
당업자는 알려진 수단을 통해 다른 혈청형에서 상응하는 서열을 결정할 수 있다. 예를 들어, A, A', B, B', C, C' 또는 D 영역에 변경이 존재하는 지 여부를 결정하고, 또 다른 혈청형에서 상응하는 영역을 결정한다. 기본 설정의 BLAST®(Basic Local Alignment Search Tool) 또는 다른 상동성 정렬 프로그램을 사용하여 상응하는 서열을 결정할 수 있다. 본 개시내용은 나아가 상이한 AAV 혈청형의 조합인 mod-ITR, 즉, 하나의 mod-ITR은 하나의 AAV 혈청형에서 유래할 수 있고 다른 하나의 mod-ITR은 상이한 혈청형에서 유래할 수 있는 mod-ITR을 포함하는 ceDNA 벡터의 집단 및 복수의 ceDNA 벡터를 제공한다. 이론에 구애됨 없이, 하나의 구현예에서, ceDNA 벡터의 하나의 ITR은 AAV2 ITR 서열에서 유래하거나 이를 기반으로 할 수 있고, 다른 하나의 ITR은 AAV 혈청형1(AAV1), AAV 혈청형 4(AAV4), AAV 혈청형 5(AAV5), AAV 혈청형 6(AAV6), AAV 혈청형 7(AAV7), AAV 혈청형 8(AAV8), AAV 혈청형 9(AAV9), AAV 혈청형 10(AAV10), AAV 혈청형 11(AAV11) 또는 AAV 혈청형 12(AAV12) 중 임의의 하나 이상의 ITR 서열에서 유래하거나 이를 기반으로 할 수 있다.
임의의 파르보바이러스 ITR이 ITR로서 또는 변형을 위한 기본 ITR로서 사용될 수 있다. 바람직하게는, 파르보바이러스는 데펜도바이러스이다. 더욱 바람직하게는, AAV이다. 선택된 혈청형은 혈청형의 조직 친화성을 기반으로 할 수 있다. AAV2는 폭넓은 조직 친화성을 갖고, AAV1은 뉴런 및 골격근을 우선적으로 표적화하고, AAV5는 뉴런, 망막색소 상피세포 및 광수용체를 우선적으로 표적화한다. AAV6은 골격근 및 폐를 우선적으로 표적화한다. AAV8은 간, 골격근, 심장 및 췌장 조직을 우선적으로 표적화한다. AAV9는 간, 골격 및 폐 조직을 우선적으로 표적화한다. 하나의 구현예에서, 변형된 ITR은 AAV2 ITR을 기반으로 한다.
보다 구체적으로, 특정 대형 Rep 단백질과 기능적으로 상호작용하는 구조 요소의 능력은 구조 요소의 변형을 통해 변경될 수 있다. 예를 들어, 구조 요소의 핵산 서열은 ITR의 야생형 서열과의 비교를 통해 변형시킬 수 있다. 하나의 구현예에서, ITR의 구조 요소(예를 들어, A 아암, A' 아암, B 아암, B' 아암, C 아암, C' 아암, D 아암, RBE, RBE' 및 trs)는 제거되어, 상이한 파르보바이러스의 야생형 구조 요소로 대체될 수 있다. 예를 들어, 대체 구조는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAV13, 뱀 파르보바이러스(예를 들어, 공비단뱀 파르보바이러스), 소 파르보바이러스, 염소 파르보바이러스, 조류 파르보바이러스, 개 파르보바이러스, 말 파르보바이러스, 새우 파르보바이러스, 돼지 파르보바이러스 또는 곤충 AAV에서 유래할 수 있다. 예를 들어, ITR은 AAV2 ITR일 수 있고, A 또는 A' 아암, 또는 RBE는 AAV5의 구조 요소로 대체될 수 있다. 또 다른 예에서, ITR은 AAV5 ITR일 수 있고, C 또는 C' 아암, RBE, 및 trs는 AAV2의 구조 요소로 대체될 수 있다. 또 다른 예에서, AAV ITR은 B 및 B' 아암이 AAV2 ITR B 및 B' 아암으로 대체된 AAV5 ITR일 수 있다.
단지 예로서, 표 4는 변형된 ITR 영역 내 적어도 하나의 뉴클레오타이드의 예시적인 변형(예를 들어, 결실, 삽입 및/또는 치환)을 나타내며, 여기서 X는 상응하는 야생형 ITR에 대한 해당 섹션에서의 적어도 하나의 핵산의 변형(예를 들어, 결실, 삽입 및/또는 치환)을 나타낸다. 일부 구현예에서, C 및/또는 C' 및/또는 B 및/또는 B'의 임의의 영역 내 적어도 하나의 뉴클레오타이드의 임의의 변형(예를 들어, 결실, 삽입 및/또는 치환)은, 적어도 하나의 말단 루프에 3개의 순차적 T 뉴클레오타이드(즉, TTT)를 보유한다. 예를 들어, 변형이 단일 아암 ITR(예를 들어, 단일 C-C' 아암 또는 단일 B-B' 아암), 또는 변형된 C-B' 아암 또는 C'-B 아암, 또는 적어도 하나의 절단된 아암(예를 들어, 절단된 C-C' 아암 및/또는 절단된 B-B' 아암)을 갖는 2개의 아암 ITR 중 임의의 것을 생성하는 경우, 적어도 단일 아암, 또는 2개의 아암 ITR 중 적어도 하나의 아암(여기서 하나의 아암은 절단될 수 있음)은 적어도 하나의 말단 루프에 3개의 순차적 T 뉴클레오타이드(즉, TTT)를 보유한다. 일부 구현예에서, 절단된 C-C' 아암 및/또는 절단된 B-B' 아암은 말단 루프에 3개의 순차적 T 뉴클레오타이드(즉, TTT)를 갖는다.
[표 4]
일부 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터에 사용되는 mod-ITR은 본원에 개시된 바와 같은 비대칭인 ITR 쌍 또는 대칭인 mod-ITR 쌍을 포함하며, 표 4에 제시된 변형의 조합 중 어느 하나, 및 또한 A'와 C 사이, C와 C' 사이, C'와 B 사이, B와 B' 사이, 및 B'와 A 사이에서 선택되는 영역 중 임의의 하나 이상에서의 적어도 하나의 뉴클레오타이드의 변형을 포함할 수 있다. 일부 구현예에서, C 또는 C' 또는 B 또는 B' 영역 내 적어도 하나의 뉴클레오타이드의 임의의 변형(예를 들어, 결실, 삽입 및/또는 치환)은, 여전히 스템-루프의 말단 루프를 보존한다. 일부 구현예에서, C 및 C' 및/또는 B 및 B' 영역 내 적어도 하나의 뉴클레오타이드의 임의의 변형(예를 들어, 결실, 삽입 및/또는 치환)은, 적어도 하나의 말단 루프에 3개의 순차적 T 뉴클레오타이드(즉, TTT)를 보유한다. 대안적인 구현예에서, C와 C' 사이 및/또는 B와 B' 사이의 적어도 하나의 뉴클레오타이드의 임의의 변형(예를 들어, 결실, 삽입 및/또는 치환)은, 적어도 하나의 말단 루프에 3개의 순차적 A 뉴클레오타이드(즉, AAA)를 보유한다. 일부 구현예에서, 본원에 사용하기 위한 변형된 ITR은 표 4에 제시된 변형의 조합 중 어느 하나, 및 또한 A', A 및/또는 D에서 선택되는 영역 중 임의의 하나 이상에서의 적어도 하나의 뉴클레오타이드 변형(예를 들어, 결실, 삽입 및/또는 치환)을 포함할 수 있다. 예를 들어, 일부 구현예에서, 본원에 사용되는 변형된 ITR은 표 4에 제시된 변형의 조합 중 어느 하나, 및 또한 A 영역 내 적어도 하나의 뉴클레오타이드 변형(예를 들어, 결실, 삽입 및/또는 치환)을 포함할 수 있다. 예를 들어, 일부 구현예에서, 본원에 사용하기 위한 변형된 ITR은 표 4에 제시된 변형의 조합 중 어느 하나, 및 또한 A' 영역 내 적어도 하나의 뉴클레오타이드 변형(예를 들어, 결실, 삽입 및/또는 치환)을 포함할 수 있다. 예를 들어, 일부 구현예에서, 본원에 사용되는 변형된 ITR은 표 4에 제시된 변형의 조합 중 어느 하나, 및 또한 A 및/또는 A' 영역 내 적어도 하나의 뉴클레오타이드 변형(예를 들어, 결실, 삽입 및/또는 치환)을 포함할 수 있다. 예를 들어, 일부 구현예에서, 본원에 사용되는 변형된 ITR은 표 4에 제시된 변형의 조합 중 어느 하나, 및 또한 D 영역 내 적어도 하나의 뉴클레오타이드 변형(예를 들어, 결실, 삽입 및/또는 치환)을 포함할 수 있다.
하나의 구현예에서, 구조 요소의 뉴클레오타이드 서열을 변형시켜(예를 들어, 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개 또는 20개 이상(또는 상기 제시된 개수 내 임의의 범위)의 뉴클레오타이드를 변형시켜) 변형된 구조 요소를 생성할 수 있다. 하나의 구현예에서, ITR에 대한 특정 변형은 본원에 예시된 것(예를 들어, 서열번호 3, 4, 15 내지 47, 101 내지 116 또는 165 내지 187), 또는 2018년 12월 6일자 출원된 PCT/US2018/064242의 도 7a 및 도 7b에 제시된 것이다(예를 들어, PCT/US2018/064242의 서열번호 97 및 98, 101 내지 103, 105 내지 108, 111 및 112, 117 내지 134, 545 내지 54). 일부 구현예에서, ITR을 변형시킬 수 있다(예를 들어, 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개 또는 20개 이상(또는 상기 제시된 개수 내 임의의 범위)의 뉴클레오타이드를 변형시킴). 다른 구현예에서, ITR은 서열번호 3, 서열번호 4, 서열번호 15 내지 서열번호 47, 서열번호 101 내지 서열번호 116 또는 서열번호 165 내지 서열번호 187의 변형된 ITR 중 하나, 또는 서열번호 3, 서열번호 4, 서열번호 15 내지 서열번호 47, 서열번호 101 내지 서열번호 116 또는 서열번호 165 내지 서열번호 187의 A-A' 아암의 RBE 함유 섹션, 및 C-C' 및 B-B' 아암, 또는 국제 특허 출원 PCT/US18/49996(이는 그 전문이 본원에 참조로서 인용됨)의 표 2 내지 표 9(즉, 서열번호 110 내지 서열번호 112, 서열번호 115 내지 서열번호 190, 서열번호 200 내지 서열번호 468)에 제시된 바와 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 이상의 서열 동일성을 가질 수 있다.
일부 구현예에서, 변형된 ITR은, 예를 들어 특정 아암의 전부, 예를 들어 A-A' 아암의 전부 또는 일부, 또는 B-B' 아암의 전부 또는 일부, 또는 C-C' 아암의 전부 또는 일부의 제거 또는 결실, 또는 대안적으로, 스템(예를 들어, 단일 아암)을 캡핑하는 최종 루프가 여전히 존재하는 한, 루프의 스템을 형성하는 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 그 이상의 염기쌍의 제거를 포함할 수 있다(예를 들어, 2018년 12월 6일자 출원된 국제 특허 출원 PCT/US2018/064242(이는 그 전문이 본원에 참조로서 인용됨)의 도 7a의 ITR-21 참조). 일부 구현예에서, 변형된 ITR은 B-B' 아암으로부터 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 그 이상의 염기쌍의 제거를 포함할 수 있다. 일부 구현예에서, 변형된 ITR은 C-C' 아암으로부터 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 그 이상의 염기쌍의 제거를 포함할 수 있다(예를 들어, 2018년 12월 6일자 출원된 국제 특허 출원 PCT/US2018/064242(이는 그 전문이 본원에 참조로서 인용됨)의 도 3b의 ITR-1 또는 도 7a의 ITR-45 참조). 일부 구현예에서, 변형된 ITR은 C-C' 아암으로부터 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 그 이상의 염기쌍의 제거, 및 B-B' 아암으로부터 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 그 이상의 염기쌍의 제거를 포함할 수 있다. 염기쌍의 제거의 임의의 조합이 고려되며, 예를 들어 C-C' 아암에서 6개의 염기쌍이 제거되고 B-B' 아암에서 2개의 염기쌍이 제거될 수 있다. 예시적인 예로서, 도 3b는, C 부분과 C' 부분 각각에서 적어도 7개의 염기쌍 결실, C 영역과 C' 영역 사이의 루프에서 뉴클레오타이드의 치환, 및 변형된 ITR이 2개의 아암을 포함하며 이 중 적어도 하나의 아암(예를 들어, C-C')이 절단되도록 B 영역과 B' 영역 각각에서의 적어도 하나의 염기쌍 결실을 갖는 예시적인 변형된 ITR을 보여준다. 일부 구현예에서, 변형된 ITR은 또한 B-B' 아암이 또한 WT ITR에 비해 절단되도록 B 영역과 B' 영역 각각에서의 적어도 하나의 염기쌍 결실을 포함한다.
일부 구현예에서, 변형된 ITR은 전장 야생형 ITR 서열에 비해 1개 내지 50개(예를 들어, 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개, 26개, 27개, 28개, 29개, 30개, 31개, 32개, 33개, 34개, 35개, 36개, 37개, 38개, 39개, 40개, 41개, 42개, 43개, 44개, 45개, 46개, 47개, 48개, 49개 또는 50개)의 뉴클레오타이드 결실을 가질 수 있다. 일부 구현예에서, 변형된 ITR은 전장 WT ITR 서열에 비해 1개 내지 30개의 뉴클레오타이드 결실을 가질 수 있다. 일부 구현예에서, 변형된 ITR은 전장 야생형 ITR 서열에 비해 2개 내지 20개의 뉴클레오타이드 결실을 갖는다.
일부 구현예에서, 변형된 ITR은, DNA 복제(예를 들어, Rep 단백질에 의한 RBE에의 결합, 또는 말단 분해 부위에서의 닉킹)를 방해하지 않도록, A 또는 A' 영역의 RBE 함유 부분에서 임의의 뉴클레오타이드 결실을 함유하지 않는다. 일부 구현예에서, 본원에의 사용을 위해 포함된 변형된 ITR은 본원에 기재된 바와 같은 B, B', C, 및/또는 C 영역에 하나 이상의 결실을 갖는다.
일부 구현예에서, 대칭인 ITR 쌍 또는 비대칭인 ITR 쌍을 포함하는 PAH 단백질의 발현을 위한 ceDNA 벡터는, 본원에 개시된 바와 같은 조절 스위치와, 서열번호 3, 4, 15 내지 47, 101 내지 116 또는 165 내지 187로 이루어지는 군 중 어느 하나에서 선택되는 뉴클레오타이드 서열을 갖는 선택된 적어도 하나의 변형된 ITR을 포함한다.
또 다른 구현예에서, 구조 요소의 구조는 변형될 수 있다. 예를 들어, 구조 요소는 스템의 높이 및/또는 루프 내 뉴클레오타이드 수가 변경된다. 예를 들어, 스템의 높이는 약 2개, 3개, 4개, 5개, 6개, 7개, 8개 또는 9개 뉴클레오타이드 또는 그 이상, 또는 상기 개수 내 임의의 범위의 뉴클레오타이드일 수 있다. 하나의 구현예에서, 스템의 높이는 약 5개 뉴클레오타이드 내지 약 9개 뉴클레오타이드일 수 있으며, Rep와 기능적으로 상호작용한다. 또 다른 구현예에서, 스템의 높이는 약 7개 뉴클레오타이드일 수 있으며, Rep와 기능적으로 상호작용한다. 또 다른 예에서, 루프는 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 10개 뉴클레오타이드 또는 그 이상, 또는 상기 개수 내 임의의 범위의 뉴클레오타이드를 가질 수 있다.
또 다른 구현예에서, RBE 또는 연장된 RBE 내 GAGY 결합 부위 또는 GAGY 관련 결합 부위의 수가 증가 또는 감소할 수 있다. 하나의 예에서, RBE 또는 연장된 RBE는, 1개, 2개, 3개, 4개, 5개 또는 6개, 또는 그 이상의 GAGY 결합 부위, 또는 상기 개수 내 임의의 범위의 GAGY 결합 부위를 포함할 수 있다. 각각의 GAGY 결합 부위는, 서열이 Rep 단백질에 결합하는 데 충분하다면, 독립적으로 정확한 GAGY 서열 또는 GAGY에 유사한 서열일 수 있다.
또 다른 구현예에서, 2개의 요소(예컨대, 비제한적으로, RBE와 헤어핀) 사이의 간격을 변경시켜(예를 들어, 증가 또는 감소시켜), 큰 Rep 단백질과의 기능적 상호작용을 변경시킬 수 있다. 예를 들어, 상기 간격은 약 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개 또는 21개 뉴클레오타이드 또는 그 이상, 또는 상기 개수 내 임의의 범위의 뉴클레오타이드일 수 있다.
본원에 기재된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 본원에 개시된 야생형 AAV2 ITR 구조에 대해 변형된 ITR 구조를 포함할 수 있지만, 작동 가능한 RBE, trs 및 RBE' 부분은 여전히 보유한다. 일부 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터는 Rep-결합 부위(예를 들어, RBS; AAV2의 경우 5'-GCGCGCTCGCTCGCTC-3'(서열번호 60))와 말단 분해 부위(TRS; 예를 들어, 5'-AGTT(서열번호 62))를 포함하는 하나 이상의 기능성 ITR 폴리뉴클레오타이드 서열을 함유한다. 일부 구현예에서, 적어도 하나의 ITR(wt 또는 변형된 ITR)은 기능성이다. 대안적인 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터가 서로 상이하거나 비대칭인 2개의 변형된 ITR을 포함하는 경우, 적어도 하나의 변형된 ITR은 기능성이고, 적어도 하나의 변형된 ITR은 비기능성이다.
일부 구현예에서, 본원에 기재된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터의 변형된 ITR(예를 들어, 좌측 또는 우측 ITR)은, 루프 아암, 절단된 아암 또는 스페이서 내에 변형을 갖는다. 루프 아암, 절단된 아암 또는 스페이서 내에 변형을 갖는 ITR의 예시적인 서열은 국제 출원 PCT/US18/49996(이는 그 전문이 본원에 참조로서 인용됨)의 표 2(즉, 서열번호 135 내지 190, 200 내지 233); 표 3(예를 들어, 서열번호 234 내지 263); 표 4(예를 들어, 서열번호 264 내지 293); 표 5(예를 들어, 본원의 서열번호 294 내지 318); 표 6(예를 들어, 서열번호 319 내지 468; 및 표 7 내지 표 9(예를 들어, 서열번호 101 내지 110, 111 및 112, 115 내지 134) 또는 표 10A 또는 표 10B(예를 들어, 서열번호 9, 100, 469 내지 483, 484 내지 499)에 열거되어 있다.
일부 구현예에서, 비대칭인 ITR 쌍 또는 대칭인 mod-ITR 쌍을 포함하는 PAH 단백질의 발현을 위한 ceDNA 벡터에 사용되는 변형된 ITR은, 국제 출원 PCT/US18/49996(이는 그 전문이 본원에 참조로서 인용됨)의 표 2, 표 3, 표 4, 표 5, 표 6, 표 7, 표 8, 표 9, 및 표 10A 및 표 10B에 제시된 것들 중 임의의 것 또는 이들의 조합에서 선택된다.
비대칭인 ITR 쌍 또는 대칭인 mod-ITR 쌍을 포함하는 PAH 단백질의 발현을 위한 ceDNA 벡터에 사용되는 상기 각 부류의 추가의 예시적인 변형된 ITR은 표 5A 및 표 5B에 제공되어 있다. 표 5A의 우측 변형된 ITR의 예측된 2차 구조는 2018년 12월 6일자 출원된 국제 출원 PCT/US2018/064242의 도 7a에 제시되어 있고, 표 5B의 좌측 변형된 ITR의 예측된 2차 구조는 2018년 12월 6일자 출원된 국제 출원 PCT/US2018/064242의 도 7b에 제시되어 있으며, 상기 문헌은 그 전문이 본원에 참조로서 인용된다.
표 5A 및 표 5B는 예시적인 우측 및 좌측 변형된 ITR을 보여준다.
[표 5A]
[표 5B]
하나의 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터는, 5'→3' 방향으로, 제1 아데노연관바이러스(AAV) 역말단반복서열(ITR), 관심 핵산 서열(예를 들어, 본원에 기재된 바와 같은 코돈 변형된 핵산을 포함하는 발현 카세트) 및 제2 AAV ITR을 포함하고, 여기서 제1 ITR(5' ITR)과 제2 ITR(3' ITR)은 서로에 대해 비대칭이며, 즉, 이들은 서로 상이한 3D 공간 구성을 갖는다. 예시적인 구현예로서, 제1 ITR은 야생형 ITR이고, 제2 ITR은 돌연변이되거나 변형된 ITR일 수 있거나, 또는 그 반대로 제1 ITR은 돌연변이되거나 변형된 ITR이고, 제2 ITR은 야생형 ITR일 수 있다. 일부 구현예에서, 제1 ITR과 제2 ITR은 모두 mod-ITR이지만, 상이한 서열을 갖거나 상이한 변형을 갖기 때문에, 동일한 변형된 ITR이 아니고, 상이한 3D 공간 구성을 갖는다. 달리 말하면, 비대칭인 ITR을 갖는 ceDNA 벡터는, WT-ITR과 비교하여 하나의 ITR에서의 임의의 변화가 다른 하나의 ITR에 반영되지 않거나; 또는 대안적으로, 비대칭인 ITR이 변형된 비대칭인 ITR 쌍을 갖고 서로에 대해 상이한 서열과 상이한 3차원 형상을 가질 수 있는 ITR을 포함한다. PAH 단백질의 발현 및 ceDNA-플라스미드를 생성에 사용하기 위한 ceDNA 벡터의 예시적인 비대칭인 ITR은 표 5A 및 표 5B에 제시되어 있다.
대안적인 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터는 2개의 대칭인 mod-ITR을 포함하며, 즉, 두 개의 ITR은 동일한 서열을 갖지만, 서로 역 보체(역상)이다. 일부 구현예에서, 대칭인 mod-ITR 쌍은 동일한 AAV 혈청형의 야생형 ITR 서열에 대한 결실, 삽입 또는 치환 중 적어도 하나 또는 이들의 임의의 조합을 포함한다. 대칭인 ITR에서 부가, 결실 또는 치환은 동일하지만, 서로 역 보체이다. 예를 들어, 5' ITR의 C 영역에의 3개의 뉴클레오타이드의 삽입은 3' ITR의 C' 영역 내 상응하는 섹션에의 3개의 역 보체 뉴클레오타이드의 삽입으로 반영될 것이다. 단지 예시의 목적으로, 부가가 5' ITR에의 AACG인 경우, 이러한 부가는 상응하는 부위의 3' ITR에의 CGTT이다. 예를 들어, 5' ITR 센스 가닥이 ATCGATCG(서열번호 608)인 경우, G와 A 사이에 AACG가 부가되면 ATCG AACG ATCG(서열번호 51)의 서열이 생성된다. 상응하는 3' ITR 센스 가닥은 CGATCGAT(서열번호 606)(ATCGATCG의 역 보체(서열번호 607))이고, T와 C 사이에 CGTT(즉, AACG의 역 보체)가 부가되어, CGAT CGTT CGAT(서열번호 49)(ATCG AACG ATCG의 역 보체)(서열번호 51) 서열이 생성된다.
대안적인 구현예에서, 변형된 ITR 쌍은 본원에 정의된 바와 같이 실질적으로 대칭이며, 즉, 변형된 ITR 쌍은 상이한 서열을 갖지만, 상응하거나 동일한 대칭인 3차원 형상을 가질 수 있다. 예를 들어, 하나의 변형된 ITR은 하나의 혈청형에서 유래할 수 있고, 다른 하나의 변형된 ITR은 상이한 혈청형에서 유래할 수 있지만, 동일한 영역에 동일한 돌연변이(예를 들어, 뉴클레오타이드 삽입, 결실 또는 치환)를 가질 수 있다. 달리 말하면, 단지 예시의 목적으로, 5' mod-ITR은 AAV2에 유래할 수 있고 C 영역에 결실을 가질 수 있으며, 3' mod-ITR은 AAV5에서 유래할 수 있고 C' 영역에 상응하는 결실을 가질 수 있으며, 단, 5' mod-ITR과 3' mod-ITR은 동일하거나 대칭인 3차원 공간 구성을 갖고, 이들은 변형된 ITR 쌍으로서 본원에의 사용을 위해 포함된다.
일부 구현예에서, 실질적으로 대칭인 mod-ITR 쌍은 3D 공간에서 동일한 A, C-C' 및 B-B' 루프를 가지며, 예를 들어 실질적으로 대칭인 mod-ITR 쌍에서 변형된 ITR이 C-C' 아암의 결실을 갖는 경우, 동족 mod-ITR은 C-C' 루프의 상응하는 결실을 갖고, 또한 이의 동족 mod-ITR의 기하학적 공간에서 동일한 형상으로 나머지 A 및 B-B' 루프의 유사한 3D 구조를 갖는다. 단지 예로서, 실질적으로 대칭인 ITR은 기하학적 공간에서 동일한 형상이 되도록 대칭인 공간 구성을 가질 수 있다. 이는, G-C 쌍이, 예를 들어 C-G 쌍으로, 또는 그 반대로 변형되거나, A-T 쌍이 T-A 쌍으로, 또는 그 반대로 변형되는 경우에 일어날 수 있다. 따라서, ATCG AACG ATCG(서열번호 51)로서의 변형된 5' ITR과 CGAT CGTT CGAT(서열번호 49)로서의 변형된 3' ITR(즉, ATCG AACG ATCG(서열번호 51)의 역 보체)의 상기 예시적인 예를 사용하면, 이러한 변형된 ITR은, 예를 들어 5' ITR이 ATCG AAC C ATCG(서열번호 50)의 서열(여기서, 추가의 G가 C로 변형됨)을 갖고, 실질적으로 대칭인 3' ITR이 A에 더하여 T의 상응하는 변형 없이 CGAT CGTT CGAT(서열번호 49)의 서열을 갖는 경우, 여전히 대칭일 수 있다. 일부 구현예에서, 이러한 변형된 ITR 쌍은 대칭인 입체화학을 갖기 때문에 실질적으로 대칭이다.
표 6은, PAH 단백질의 발현을 위한 ceDNA 벡터에 사용되는 예시적인 대칭인 변형된 ITR 쌍(즉, 좌측 변형된 ITR과 대칭인 우측 변형된 ITR)을 보여준다. 서열의 볼드체 부분은 부분 ITR 서열(즉, A-A', C-C' 및 B-B' 루프의 서열)을 식별한다. 이러한 예시적인 변형된 ITR은 GCGCGCTCGCTCGCTC-3'(서열번호 60)의 RBE, ACTGAGGC(서열번호 69)의 스페이서, 스페이서 보체 GCCTCAGT(서열번호 70) 및 GAGCGAGCGAGCGCGC(서열번호 71)의 RBE'(즉, RBE에 대한 보체)를 포함할 수 있다.
[표 6]
일부 구현예에서, 비대칭인 ITR 쌍을 포함하는 PAH 단백질의 발현을 위한 ceDNA 벡터는 본원의 표 5A 및 표 5B 중 임의의 하나 이상에 제시된 ITR 서열 또는 ITR 부분 서열, 또는 2018년 12월 6일자 출원된 국제 출원 PCT/US2018/064242(이는 그 전문이 본원에 참조로서 인용됨)의 도 7a 및 도 7b에 제시된, 또는 2018년 9월 7일자 출원된 국제 출원 PCT/US18/49996(이는 그 전문이 본원에 참조로서 인용됨)의 표 2, 표 3, 표 4, 표 5, 표 6, 표 7, 표 8, 표 9, 또는 표 10A 및 표 10B에 개시된 서열에서의 임의의 변형에 상응하는 변형을 갖는 ITR을 포함할 수 있다.
V.
예시적인 ceDNA 벡터
상기 기재된 바와 같이, 본 개시내용은 본원에 기재된 바와 같은 비대칭인 ITR 쌍, 대칭인 ITR 쌍 또는 실질적으로 대칭인 ITR 쌍 중 어느 하나를 포함하는, 재조합 ceDNA 발현 벡터 및 PAH 단백질을 인코딩하는 코돈 변형된 핵산을 포함하는 ceDNA 벡터에 관한 것이다. 특정 구현예에서, 본 개시내용은 플랭킹 ITR 서열과 전이유전자를 갖는 PAH 단백질의 발현을 위한 재조합 ceDNA 벡터로서, 여기서 ITR 서열은 본원에 정의된 바와 같이 서로에 대해 비대칭, 대칭 또는 실질적으로 대칭이고, ceDNA는 플랭킹 ITR 사이에 위치한 관심 핵산 서열(예를 들어, 전이유전자의 핵산을 포함하는 발현 카세트)을 추가로 포함하며, 여기서 상기 핵산 분자에는 바이러스 캡시드 단백질 코딩 서열이 없는 재조합 ceDNA 벡터에 관한 것이다.
PAH 단백질의 발현을 위한 ceDNA 발현 벡터는, 적어도 하나의 ITR이 변경된 본원에 기재된 바와 같은 핵산 서열(들)을 포함하는 재조합 DNA 절차에 편리하게 적용될 수 있는 임의의 ceDNA 벡터일 수 있다. 본 개시내용의 PAH 단백질의 발현을 위한 ceDNA 벡터는 ceDNA 벡터가 도입되는 숙주세포와 양립 가능하다. 특정 구현예에서, ceDNA 벡터는 선형일 수 있다. 특정 구현예에서, ceDNA 벡터는 염색체외 엔티티로서 존재할 수 있다. 특정 구현예에서, 본 개시내용의 ceDNA 벡터는 숙주세포의 게놈으로의 공여체 서열의 통합을 가능하게 하는 요소(들)을 함유할 수 있다. 본원에 사용된 "전이유전자"와 "이종 핵산 서열"은 동의어이며, 본원에 기재된 바와 같이 PAH 단백질을 인코딩할 수 있다.
A. 조절 요소.
본원에 정의된 바와 같은 비대칭인 ITR 쌍 또는 대칭인 ITR 쌍을 포함하는 본원에 기재된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는, 시스-조절 요소의 특정 조합을 추가로 포함할 수 있다.
코돈 최적화되고, 페닐알라닌 수준(예를 들어, 발현 및 지속기간)의 최적 교정에 대해 시험된 특정 시스-작용 요소(예를 들어, 특정 프로모터, 특정 인핸서, 및 특정 프로모터와 인핸서 조합)와 조합된 PAH 핵산 서열을 포함하는 ceDNA 벡터가 본원에 기재되어 있다. 일부 구현예에 따르면, 특정 코돈 최적화된 PAH 핵산 서열은 특정 프로모터 서열 및/또는 특정 인핸서 서열과 조합된 경우, 예를 들어 또 다른 프로모터 서열 및/또는 특정 인핸서 서열과 조합된 동일한 코돈 최적화된 PAH 핵산 서열에 비해 더 양호한 성능을 나타낸다.
특정 구현예에서, 프로모터의 효능을 증가시키기 위해 인핸서 서열이 프로모터의 업스트림에 제공된다.
특정 구현예에서, 인트론 서열이 코돈 최적화된 핵산 서열의 업스트림에 제공된다.
(i) 프로모터:
당업자는, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터에 사용되는 프로모터가 이들이 촉진시키는 조직 또는 세포의 유형 및 특정 서열에 적절하게 조정되어야 한다는 것을 이해할 것이다.
PAH 단백질의 발현을 위한 ceDNA 벡터의 발현 카세트는 전체 발현 수준 및 세포 특이성에 영향을 미칠 수 있는 프로모터를 포함한다. 전이유전자 발현, 예를 들어 PAH 단백질의 발현을 위해, 이는 고도로 활성인 바이러스 유래의 극초기 프로모터를 포함할 수 있다. 발현 카세트는 특정 세포 유형에 대한 전이유전자 발현을 제한하고, 조절되지 않은 이소성 발현으로 인한 독성 효과 및 면역 반응을 감소시키기 위해 조직 특이적 진핵생물 프로모터를 함유할 수 있다. 표 7A 및 표 7B에는 ceDNA PAH 치료제에서 구현될 수 있는 코어 프로모터 서열이 열거되어 있다.
[표 7A]
[표 7B]
특정 구현예에 따르면, 프로모터는 하기로 이루어지는 군에서 선택된다: VD("VanD"로도 지칭됨) 프로모터, 인간 알파 1-항트립신(hAAT) 프로모터(CpG 최소화된 hAAT(979) 프로모터(CpGmin hAAT_core_C10), 및 hAAT_core_C06; hAAT_core_C07; hAAT_core_C08 및 hAAT_core_C09와 같은 다른 CpGmin_hAAT 프로모터 포함) 및 트랜스티레틴(TTR) 간 특이적 프로모터.
일부 구현예에서, VD 프로모터는 미세생쥐바이러스(MVM) 인트론, 최소 트랜스티레틴 프로모터(TTRm), 세르핀 인핸서(72 bp) 및 TTRm 5' UTR을 포함한다.
일부 구현예에 따르면, TTRm은 하기 제시되는 바와 같은 서열번호 442를 포함한다:
GTCTGTCTGCACATTTCGTAGAGCGAGTGTTCCGATACTCTAATCTCCCTAGGCAAGGTTCATATTTGTGTAGGTTACTTATTCTCCTTTTGTTGACTAAGTCAATAATCAGAATCAGCAGGTTTGGAGTCAGCTTGGCAGGGATCAGCAGCCTGGGTTGGAAGGAGGGGGTATAAAAGCCCCTTCACCAGGAGAAGCCGTC (서열번호 442).
일부 구현예에 따르면, 세르핀 인핸서는 하기 제시되는 바와 같은 서열번호 449를 포함한다:
GGGGGAGGCTGCTGGTGAATATTAACCAAGGTCACCCCAGTTATCGGAGGAGCAAACAGGGGCTAAGTCCAC (서열번호 449).
일부 구현예에 따르면, TTRm 5' UTR은 하기 제시되는 바와 같은 서열번호 498을 포함한다:
ACACAGATCCACAAGCTCCTG (서열번호 498).
추가 구현예에 따르면, VD 프로모터는 하기 제시되는 바와 같은 서열번호 191을 포함한다:
CCGTCTGTCTGCACATTTCGTAGAGCGAGTGTTCCGATACTCTAATCTCCCTAGGCAAGGTTCATATTTGTGTAGGTTACTTATTCTCCTTTTGTTGACTAAGTCAATAATCAGAATCAGCAGGTTTGGAGTCAGCTTGGCAGGGATCAGCAGCCTGGGTTGGAAGGAGGGGGTATAAAAGCCCCTTCACCAGGAGAAGCCGTCACACAGATCCACAAGCTCCTG (서열번호 191)
일부 구현예에 따르면, hAAT(979) 프로모터는 서열번호 447을 포함한다. hAAT(979) 함유 프로모터 세트는 서열번호 479에 예시되어 있다.
일부 구현예에 따르면, CpGmin_hAAT 프로모터는 서열번호 443 내지 447에서 선택되는 서열을 포함한다. 일부 구현예에 따르면, CpGmin_hAAT 프로모터 세트는 서열번호 475이다. 일부 구현예에 따르면, CpGmin_hAAT 프로모터 세트는 서열번호 479이다. 일부 구현예에 따르면, 트랜스티레틴(TTR) 간 특이적 프로모터는 표 7A에 제시된 서열(서열번호 442)을 포함한다.
일부 구현예에 따르면, 프로모터는 서열번호 191과 적어도 95% 동일성을 갖는 핵산 서열을 포함한다.
일부 구현예에 따르면, 프로모터는 서열번호 443과 적어도 95% 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에 따르면, 프로모터는 서열번호 444와 적어도 95% 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에 따르면, 프로모터는 서열번호 445와 적어도 95% 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에 따르면, 프로모터는 서열번호 446과 적어도 95% 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에 따르면, 프로모터는 서열번호 447과 적어도 95% 동일성을 갖는 핵산 서열을 포함한다.
일부 구현예에 따르면, 프로모터는 서열번호 443과 적어도 96% 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에 따르면, 프로모터는 서열번호 444와 적어도 96% 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에 따르면, 프로모터는 서열번호 445와 적어도 96% 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에 따르면, 프로모터는 서열번호 446과 적어도 96% 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에 따르면, 프로모터는 서열번호 447과 적어도 96% 동일성을 갖는 핵산 서열을 포함한다.
일부 구현예에 따르면, 프로모터는 서열번호 443과 적어도 97% 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에 따르면, 프로모터는 서열번호 444와 적어도 97% 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에 따르면, 프로모터는 서열번호 445와 적어도 97% 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에 따르면, 프로모터는 서열번호 446과 적어도 97% 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에 따르면, 프로모터는 서열번호 447과 적어도 97% 동일성을 갖는 핵산 서열을 포함한다.
일부 구현예에 따르면, 프로모터는 서열번호 443과 적어도 98% 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에 따르면, 프로모터는 서열번호 444와 적어도 98% 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에 따르면, 프로모터는 서열번호 445와 적어도 98% 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에 따르면, 프로모터는 서열번호 446과 적어도 98% 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에 따르면, 프로모터는 서열번호 447과 적어도 98% 동일성을 갖는 핵산 서열을 포함한다.
일부 구현예에 따르면, 프로모터는 서열번호 443과 적어도 99% 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에 따르면, 프로모터는 서열번호 444와 적어도 99% 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에 따르면, 프로모터는 서열번호 445와 적어도 99% 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에 따르면, 프로모터는 서열번호 446과 적어도 99% 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에 따르면, 프로모터는 서열번호 447과 적어도 99% 동일성을 갖는 핵산 서열을 포함한다.
일부 구현예에서, 본원에 기재된 프로모터 서열과 인핸서 서열을 포함하는 프로모터 세트. 일부 구현예에 따르면, 프로모터 세트는 서열번호 475와 적어도 95% 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에 따르면, 프로모터는 서열번호 475와 적어도 96% 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에 따르면, 프로모터는 서열번호 475와 적어도 97% 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에 따르면, 프로모터는 서열번호 475와 적어도 98% 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에 따르면, 프로모터는 서열번호 475와 적어도 99% 동일성을 갖는 핵산 서열을 포함한다.
일부 구현예에서, 본원에 기재된 프로모터 서열과 인핸서 서열을 포함하는 프로모터 세트. 일부 구현예에 따르면, 프로모터는 서열번호 479와 적어도 95% 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에 따르면, 프로모터는 서열번호 479와 적어도 96% 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에 따르면, 프로모터는 서열번호 479와 적어도 97% 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에 따르면, 프로모터는 서열번호 479와 적어도 98% 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에 따르면, 프로모터는 서열번호 479와 적어도 99% 동일성을 갖는 핵산 서열을 포함한다.
(ii) 인핸서
일부 구현예에서, 코돈 최적화된 PAH를 발현하는 ceDNA는 하나 이상의 인핸서를 포함한다. 일부 구현예에서, 인핸서 서열은 프로모터 서열의 5'에 위치한다. 일부 구현예에서, 인핸서 서열은 프로모터 서열의 3'에 위치한다. 일부 구현예에 따르면, 인핸서는 세르핀 인핸서, 3xHNF1-4_ProEnh_10mer 및 5xHNF1_ProEnh_10mer로 이루어지는 군에서 선택된다.
[표 8A]
[표 8B]
일부 구현예에 따르면, TTR 프로모터에 융합된 3xHNF1-4_ProEnh(프로알부민 인핸서) 인핸서는 서열번호 462에 제시된 서열을 포함한다. 일부 구현예에 따르면, 3x VanD-TTRe 및 TTR 프로모터에 융합된 3xHNF1-4_ProEnh(프로알부민 인핸서) 인핸서는 서열번호 463에 제시된 서열을 포함한다.
일부 구현예에 따르면, TTR 프로모터에 융합된 5xHNF1_ProEnh_enhancer는 서열번호 464에 제시된 서열을 포함한다. 일부 구현예에 따르면, 3xVanD-TTRe 및 TTR 프로모터에 융합된 5xHNF1_ProEnh_enhancer는 서열번호 465에 제시된 서열을 포함한다.
일부 구현예에 따르면, 세르핀 인핸서(SerpEnh)는 하기에 제시된 서열을 포함한다:
GGGGGAGGCTGCTGGTGAATATTAACCAAGGTCACCCCAGTTATCGGAGGAGCAAACAGGGGCTAAGTCCAC (서열번호 449).
일부 다른 구현예에서, 인핸서는 다수의 탠덤 또는 반복 서열에 사용될 수 있다. 비제한적인 예에는, 서열번호 587 내지 601에 기재된 인핸서 서열이 포함된다.
[표 9A]
[표 9B]
[표 9C]
(iii) 5' UTR 서열 및 인트론 서열
일부 구현예에서, ceDNA 벡터는 5' UTR 서열 및/또는 5' ITR 서열의 3'에 위치한 인트론 서열을 포함한다. 일부 구현예에서, 5' UTR은 전이유전자, 예를 들어 PAH 단백질을 인코딩하는 서열의 5'에 위치한다. 예시적인 5' UTR 서열은 하기 표 10 또는 국제 특허 출원 PCT/US2020/021328(이는 그 전문이 본원에 참조로서 인용됨), 예를 들어 표 9A에 열거되어 있다.
[표 10]
[표 10B]
일부 구현예에서, ceDNA 벡터는 ORF의 5'에 위치한 인트론을 포함한다. 일부 다른 구현예에서, ceDNA 벡터는 ORF 서열 내에 있는 인트론을 포함한다. 사용될 수 있는 적합한 인트론 서열은 하기 표 11A에 열거되어 있다.
[표 11A]
[표 11B]
일부 구현예에 따르면, MVM 인트론은 또한 (예를 들어, 5' UTR의 일부로서) PAH 오픈리딩프레임의 5'에서 구현될 수 있다. MVM 인트론은 하기 제시되는 바와 같은 서열번호 1026을 포함한다:
AAGAGGTAAGGGTTTAAGGGATGGTTGGTTGGTGGGGTATTAATGTTTAATTACCTGGAGCACCTGCCTGAAATCACTTTTTTTCAGGTTG (서열번호 1026)
(iv) 3' UTR 서열
일부 구현예에서, ceDNA 벡터는 3' ITR 서열 5'에 위치한 3' UTR 서열을 포함한다. 일부 구현예에서, 3' UTR은 전이유전자, 예를 들어 PAH 단백질을 인코딩하는 서열의 3'에 위치한다. 예시적인 3' UTR 서열은 하기 표 12 또는 국제 출원 PCT/US2020/021328(이는 그 전문이 본원에 참조로서 인용됨), 예를 들어 표 9B에 열거되어 있다.
[표 12]
PAH 단백질의 발현을 위한 ceDNA 벡터는 전사 후 조절 요소(WPRE)와 BGH polyA를 추가로 포함할 수 있다.
(v) 폴리아데닐화 서열
ceDNA 벡터로부터 발현되는 mRNA를 안정화시키고, 핵 방출 및 번역을 돕기 위해, PAH 단백질의 발현을 위한 ceDNA 벡터에 폴리아데닐화 서열을 인코딩하는 서열을 포함시킬 수 있다. 하나의 구현예에서, ceDNA 벡터는 폴리아데닐화 서열을 포함하지 않는다. 다른 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터는 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 10개, 적어도 15개, 적어도 20개, 적어도 25개, 적어도 30개, 적어도 40개, 적어도 45개, 적어도 50개 또는 그 이상의 아데닌 디뉴클레오타이드를 포함한다. 일부 구현예에서, 폴리아데닐화 서열은 약 43개의 뉴클레오타이드, 약 40 내지 50개의 뉴클레오타이드, 약 40개 내지 55개의 뉴클레오타이드, 약 45개 내지 50개의 뉴클레오타이드, 약 35개 내지 50개의 뉴클레오타이드, 또는 상기 개시된 범위 사이의 임의의 범위의 뉴클레오타이드를 포함한다.
발현 카세트는 당업계에 알려진 임의의 폴리아데닐화 서열 또는 이의 변형을 포함할 수 있다. 일부 구현예에서, 폴리아데닐화(polyA) 서열은 국제 특허 출원 PCT/US2020/021328(이는 그 전문이 본원에 참조로서 인용됨), 예를 들어 표 10에 열거된 것 중 임의의 것에서 선택된다. 예를 들어, 비제한적으로, 소 BGHpA(예를 들어, 서열번호 68) 또는 바이러스 SV40pA(예를 들어, 서열번호 86)에서 단리된 자연 발생 서열, 또는 합성 서열(예를 들어, 서열번호 87)을 포함하는, 당업계에 일반적으로 알려진 다른 polyA 서열이 또한 사용될 수 있다. 일부 발현 카세트는 또한 SV40 후기 polyA 신호 업스트림 인핸서(USE) 서열을 포함할 수 있다. 일부 구현예에서, USE 서열은 SV40pA 또는 이종 polyA 신호와 조합으로 사용될 수 있다. PolyA 서열은 PAH 단백질을 인코딩하는 전이유전자의 3'에 위치한다.
발현 카세트는 또한 전이유전자의 발현을 증가시키기 위해 전사 후 요소를 포함할 수 있다. 일부 구현예에서, 우드척 간염바이러스(WHP) 전사 후 조절 요소(WPRE)(예를 들어, 서열번호 67)가 전이유전자의 발현을 증가시키기 위해 사용된다. 단순헤르페스바이러스의 티미딘 키나아제 유전자, 또는 B형 간염 바이러스(HBV)로부터의 전사 후 요소와 같은 다른 전사 후 처리 요소가 사용될 수 있다. 분비 서열은 전이유전자, 예를 들어 VH-02 및 VK-A26 서열, 예를 들어 서열번호 88 및 서열번호 89에 연결될 수 있다.
(vi) 핵 국소화 서열 및 DNA 핵 표적화 서열
일부 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터는 하나 이상의 핵 국소화 서열(NLS), 예를 들어 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개 또는 그 이상의 NLS를 포함한다. 일부 구현예에서, 하나 이상의 NLS는 아미노 말단에 또는 그 근처에, 카르복시 말단에 또는 그 근처에, 또는 이들의 조합에 위치한다(예를 들어, 아미노 말단에 있는 하나 이상의 NLS 및/또는 카르복시 말단에 있는 하나 이상의 NLS). 하나 초과의 NLS가 존재하는 경우, 각각은 서로 독립적으로, 단일 NLS가 하나 초과의 카피에 존재하고/하거나 하나 이상의 카피에 존재하는 하나 이상의 다른 NLS와 조합으로 존재하도록 선택될 수 있다. NLS의 비제한적인 예는 표 13A에 제시되어 있다.
일부 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터는 ceDNA가 표적 세포의 핵으로 들어가는 것을 촉진시키기 위해 하나 이상의 DNA 핵 표적화 서열(DTS)을 포함한다. 표 13B에는, PAH 단백질을 발현하는 ceDNA 벡터에서 구현될 수 있는 DTS의 비제한적인 예가 열거되어 있다.
[표 13A]
[표 13B]
[표 13C]
B.
ceDNA 벡터의 추가 구성요소
본 개시내용의 PAH 단백질의 발현을 위한 ceDNA 벡터는, 비제한적으로, Kozak 서열(표 14A), 미세생쥐바이러스(MVM) 인트론, 스페이서, CpG 모티프와 같은 다른 구성요소를 함유할 수 있다. 일부 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터는 면역 반응 또는 간 항상성에 관여하는 하나 이상의 마이크로RNA(MIR) 서열(표 14B)을 포함할 수 있다.
[표 14A]
[표 14B]
C. 요소들과 ORF의 조합
일부 구현예에 따르면, 특정 코돈 최적화된 핵산 서열은 특정 프로모터, 인핸서 또는 다른 시스-요소의 하나 이상의 조합과 쌍을 이룬다.
일부 구현예에 따르면, 코돈 최적화된 서열은 hPAH_codop_ORF_v2를 포함하고, 본원에 기재된 바와 같은 VD_PromoterSet를 인코딩하는 핵산 서열과 쌍을 이룬다. 일부 구현예에 따르면, 코돈 최적화된 서열은 hPAH_codop_ORF_v2를 포함하고, 본원에 기재된 바와 같은 VD_PromoterSet를 인코딩하는 핵산 서열과 쌍을 이루며, 여기서 VD 프로모터(예를 들어, TTRm)는 SERP 인핸서를 추가로 포함한다. 일부 구현예에 따르면, 코돈 최적화된 서열은 hPAH_codop_ORF_v2를 포함하고, 본원에 기재된 바와 같은 VD_PromoterSet를 인코딩하는 핵산 서열과 쌍을 이루며, 여기서 VD 프로모터(예를 들어, TTRm)는 3x SERP 인핸서를 포함한다. 일부 구현예에 따르면, 코돈 최적화된 서열은 hPAH_codop_ORF_v2를 포함하고, 본원에 기재된 바와 같은 VD_PromoterSet를 인코딩하는 핵산 서열과 쌍을 이루며, 여기서 VD 프로모터는 3x SERP 인핸서를 포함하고 MVM 인트론을 추가로 포함한다.
일부 구현예에 따르면, 코돈 최적화된 서열은 hPAH_codop_ORF_v2를 포함하고, 본원에 기재된 바와 같은 hAAT(979)_PromoterSet를 인코딩하는 핵산 서열과 쌍을 이룬다. 일부 구현예에 따르면, 코돈 최적화된 서열은 hPAH_codop_ORF_v2를 포함하고, 본원에 기재된 바와 같은 TTR 간 특이적 프로모터를 인코딩하는 핵산 서열과 쌍을 이루며, ProEnh_10mer와 MVM 인트론을 추가로 포함한다.
일부 구현예에 따르면, 코돈 최적화된 서열은 hPAH_codop_ORF_v2를 포함하고, 본원에 기재된 바와 같은 트랜스티레틴(TTR) 간 특이적 프로모터를 인코딩하는 핵산 서열과 쌍을 이룬다. 일부 구현예에 따르면, 코돈 최적화된 서열은 hPAH_codop_ORF_v2를 포함하고, 본원에 기재된 바와 같은 트랜스티레틴(TTR) 간 특이적 프로모터를 인코딩하는 핵산 서열과 쌍을 이루며, MVM 인트론을 추가로 포함한다. 일부 구현예에 따르면, 코돈 최적화된 서열은 hPAH_codop_ORF_v2를 포함하고, 본원에 기재된 바와 같은 최소 트랜스티레틴(TTRm) 간 특이적 프로모터를 인코딩하는 핵산 서열과 쌍을 이룬다.
일부 구현예에 따르면, 코돈 최적화된 서열은 hPAH_codop_ORF_v2 delta1-29aa를 포함하고, 본원에 기재된 바와 같은 VD_PromoterSet 또는 CpG 최소화된 hAAT를 인코딩하는 핵산 서열과 쌍을 이룬다.
일부 구현예에 따르면, 코돈 최적화된 서열은 hPAH-r5-s29를 포함하고, 본원에 기재된 바와 같은 VD_PromoterSet를 인코딩하는 핵산 서열과 쌍을 이루며, 여기서 VD 프로모터는 3x SERP 인핸서를 포함한다.
일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, VD_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1을 포함한다. 일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, VD_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1로 이루어진다.
일부 구현예에 따르면, ceDNA 작제물은 Left-ITR_v1 : spacer_left-ITR_v1 : VD_Promoter Set : PmeI_site : Consensus_Kozak : hPAH_cDNA_ORF_v3 : PacI_site : WPRE_3pUTR : bGH : spacer_right-ITR_v1 : right-ITR_v1을 포함한다. 일부 구현예에 따르면, ceDNA 작제물은 Left-ITR_v1 : spacer_left-ITR_v1 : VD_Promoter Set : PmeI_site : Consensus_Kozak : hPAH_cDNA_ORF_v3 : PacI_site : WPRE_3pUTR : bGH : spacer_right-ITR_v1 : right-ITR_v1로 이루어진다.
일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, 3xSerpEnh-TTRe-TTRm, MVM_intron, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1을 포함한다. 일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, 3xSerpEnh-TTRe-TTRm, MVM_intron, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1로 이루어진다.
일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, VD_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2_delta1-29aa, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1을 포함한다. 일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, VD_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2_delta1-29aa, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1로 이루어진다.
일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, 3xVanD_TTRe_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH-r5-s29::hIVS1B, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1을 포함한다. 일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, 3xVanD_TTRe_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH-r5-s29::hIVS1B, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1로 이루어진다.
일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, 3xVanD_TTRe_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH-r5-s29::hIVS1B_33bpFlanks, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1을 포함한다. 일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, 3xVanD_TTRe_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH-r5-s29::hIVS1B_33bpFlanks, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1로 이루어진다.
일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, 3xVanD_TTRe_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH-r5-s29::mod-Intron_oIVS-v2_33bpFlanks, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1을 포함한다.일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, 3xVanD_TTRe_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH-r5-s29::mod-Intron_oIVS-v2_33bpFlanks, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1로 이루어진다.
일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, 3xVanD_TTRe_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2_mIVS-intron1B_33bpFlanks, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1을 포함한다. 일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, 3xVanD_TTRe_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2_mIVS-intron1B_33bpFlanks, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1로 이루어진다.
일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, 3xVanD_TTRe_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2_modified_Intron1_33bpFlanks, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1을 포함한다. 일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, 3xVanD_TTRe_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2_modified_Intron1_33bpFlanks, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1로 이루어진다.
일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, hAAT(979)_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1을 포함한다. 일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, hAAT(979)_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1로 이루어진다.
일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, VD_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, HBBv2_3pUTR, SV40_polyA, spacer_right-ITR_v1, right-ITR_v1을 포함한다. 일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, VD_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, HBBv2_3pUTR, SV40_polyA, spacer_right-ITR_v1, right-ITR_v1로 이루어진다.
일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, VD_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, HBBv3_3pUTR, SV40_polyA, spacer_right-ITR_v1, right-ITR_v1을 포함한다. 일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, VD_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, HBBv3_3pUTR, SV40_polyA, spacer_right-ITR_v1, right-ITR_v1로 이루어진다.
일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, VD_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, SV40_polyA, spacer_right-ITR_v1, right-ITR_v1을 포함한다. 일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, VD_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, SV40_polyA, spacer_right-ITR_v1, right-ITR_v1로 이루어진다.
일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, VD_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, HBBv2_3pUTR, spacer_right-ITR_v1, right-ITR_v1을 포함한다. 일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, VD_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, HBBv2_3pUTR, spacer_right-ITR_v1, right-ITR_v1로 이루어진다.
일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, 3xHNF1-4_ProEnh_10mer, BamHI_site, TTR_liver_specific_Promoter, MVM_intron, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1을 포함한다. 일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, 3xHNF1-4_ProEnh_10mer, BamHI_site, TTR_liver_specific_Promoter, MVM_intron, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1로 이루어진다.
일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, 3xHNF1-4_ProEnh_10mer, HS-CRM8_SERP_Enhancer_nospacer, HS-CRM8_SERP_Enhancer_nospacer, BamHI_site, TTR_liver_specific_Promoter, MVM_intron, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1을 포함한다. 일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, 3xHNF1-4_ProEnh_10mer, HS-CRM8_SERP_Enhancer_nospacer, HS-CRM8_SERP_Enhancer_nospacer, BamHI_site, TTR_liver_specific_Promoter, MVM_intron, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1로 이루어진다.
일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, CpGfree20mer_1, 5xHNF1_ProEnh_10mer, BamHI_site, TTR_liver_specific_Promoter, MVM_intron, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1을 포함한다. 일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, CpGfree20mer_1, 5xHNF1_ProEnh_10mer, BamHI_site, TTR_liver_specific_Promoter, MVM_intron, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1로 이루어진다.
일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, CpGfree20mer_1, 5xHNF1_ProEnh_10mer, 3xVanD_TTRe_PromoterSet_v2, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1을 포함한다. 일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, CpGfree20mer_1, 5xHNF1_ProEnh_10mer, 3xVanD_TTRe_PromoterSet_v2, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1로 이루어진다.
일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, 3xVanD_TTRe_PromoterSet_v2, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1을 포함한다. 일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, 3xVanD_TTRe_PromoterSet_v2, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1로 이루어진다.
일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, CpGmin_hAAT_Promoter_Set, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1을 포함한다. 일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, CpGmin_hAAT_Promoter_Set, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1로 이루어진다.
일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2, HS-CRM8_SERP_Enhancer_nospacer, HS-CRM8_SERP_Enhancer_nospacer, HS-CRM8_SERP_Enhancer_nospacer, BamHI_site, TTR-promoter-d5pUTR, MVM_intron, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH-r3-s34, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1을 포함한다. 일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2, HS-CRM8_SERP_Enhancer_nospacer, HS-CRM8_SERP_Enhancer_nospacer, HS-CRM8_SERP_Enhancer_nospacer, BamHI_site, TTR-promoter-d5pUTR, MVM_intron, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH-r3-s34, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1로 이루어진다.
일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2, HS-CRM8_SERP_Enhancer_nospacer, HS-CRM8_SERP_Enhancer_nospacer, HS-CRM8_SERP_Enhancer_nospacer, BamHI_site, TTR-promoter-d5pUTR, MVM_intron, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH-r5-s29, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1을 포함한다. 일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2, HS-CRM8_SERP_Enhancer_nospacer, HS-CRM8_SERP_Enhancer_nospacer, HS-CRM8_SERP_Enhancer_nospacer, BamHI_site, TTR-promoter-d5pUTR, MVM_intron, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH-r5-s29, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1로 이루어진다.
일부 구현예에 따르면, ceDNA 작제물은 서열번호 194, 서열번호 195, 서열번호 196, 서열번호 197, 서열번호 198, 서열번호 199, 서열번호 200, 서열번호 201, 서열번호 202, 서열번호 203, 서열번호 204, 서열번호 205, 서열번호 206, 서열번호 207, 서열번호 208, 서열번호 209, 서열번호 210, 서열번호 211, 서열번호 212 및 서열번호 213으로 이루어지는 군에서 선택되는 서열과 적어도 90% 동일한 핵산 서열을 포함한다.
D.
조절 스위치
분자 조절 스위치는 신호에 반응하여 측정 가능한 상태 변화를 생성하는 스위치이다. 이러한 조절 스위치는 ceDNA 벡터로부터 PAH 단백질 발현의 출력을 제어하기 위해 본원에 기재된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터와 유용하게 조합될 수 있다. 일부 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터는 PAH 단백질의 발현을 미세조정하는 역할을 하는 조절 스위치를 포함한다. 예를 들어, 이는 ceDNA 벡터의 생물학적 봉쇄(biocontainment) 기능으로 작용할 수 있다. 일부 구현예에서, 상기 스위치는 제어 가능하고 조절 가능한 방식으로 ceDNA 벡터에서 PAH 단백질의 발현을 개시 또는 중단(즉, 셧다운)하도록 설계된 "ON/OFF" 스위치이다. 일부 구현예에서, 상기 스위치는 스위치가 활성화되면 ceDNA 벡터를 포함하는 세포가 세포의 프로그래밍된 사멸을 거치도록 지시할 수 있는 "사멸 스위치"를 포함할 수 있다. PAH 단백질의 발현을 위한 ceDNA 벡터에 사용하기 위해 포함된 예시적인 조절 스위치는, 전이유전자의 발현을 조절하는 데 사용될 수 있으며, 이는 국제 출원 PCT/US18/49996(이는 그 전문이 본원에 참조로서 인용됨)에 보다 충분히 논의되어 있다.
(i) 이원 조절 스위치
일부 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터는 PAH 단백질의 발현을 제어 가능하게 조절하는 역할을 할 수 있는 조절 스위치를 포함한다. 예를 들어, ceDNA 벡터의 ITR 사이에 위치한 발현 카세트는 PAH 단백질을 인코딩하는 핵산 서열에 작동적으로 연결된 조절 영역, 예를 들어 프로모터, 시스-요소, 억제인자, 인핸서 등을 추가로 포함할 수 있으며, 여기서 조절 영역은 하나 이상의 보조인자 또는 외인성 작용제에 의해 조절된다. 단지 예로서, 조절 영역은 소분자 스위치, 또는 유도성 또는 억제성 프로모터에 의해 조절될 수 있다. 유도성 프로모터 비제한적인 예는, 호르몬 유도성 또는 금속 유도성 프로모터이다. 다른 예시적인 유도성 프로모터/인핸서 요소에는, 비제한적으로, RU486-유도성 프로모터, 엑디손-유도성 프로모터, 라파마이신-유도성 프로모터 및 메탈로티오네인 프로모터가 포함된다.
(ii) 소분자 조절 스위치
다양한 업계 공지의 소분자 기반 조절 스위치가 당업계에 알려져 있으며, 이는 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터와 조합되어 조절 스위치 제어된 ceDNA 벡터를 형성할 수 있다. 일부 구현예에서, 조절 스위치는, 문헌[Taylor, et al. BMC Biotechnology 10 (2010): 15]에 개시된 바와 같은 작동적으로 연결된 전이유전자의 발현을 제어하는 인공 프로모터와 함께인, 직교 리간드/핵 수용체 쌍, 예를 들어 레티노이드 수용체 변이체/LG335 및 GRQCIMFI; 조작된 스테로이드 수용체, 예를 들어 프로게스테론에 결합할 수 없지만 RU486(미페프리스톤(mifepristone))에 결합하는 C-말단 절단을 갖는 변형된 프로게스테론 수용체(미국 특허 제5,364,791호); 초파리의 엑디손 수용체 및 이의 엑디스테로이드 리간드(문헌[Saez, et al., PNAS, 97(26)(2000), 14512-14517]); 또는 문헌[Sando R 3rd; Nat Methods. 2013, 10(11):1085-8]에 개시된 바와 같은 항생제 트리메토프림(TMP: trimethoprim)에 의해 제어되는 스위치 중 어느 하나 또는 이들의 조합에서 선택될 수 있다. 일부 구현예에서, 전이유전자를 제어하거나 ceDNA 벡터에 의해 발현되는 조절 스위치는, 미국 특허 제8,771,679호 및 제6,339,070호(이들은 그 전문이 본원에 참조로서 인용됨)에 개시된 것들과 같은 전구약물 활성화 스위치이다.
(iii) "패스코드" 조절 스위치
일부 구현예에서, 조절 스위치는 "패스코드 스위치" 또는 "패스코드 회로"일 수 있다. 패스코드 스위치는, 특정 조건이 발생하는 경우에 ceDNA 벡터로부터의 전이유전자 발현 제어를 미세 조정하는 것을 가능하게 하며, 즉, 전이유전자 발현 및/또는 억제가 일어나기 위해서는 조건의 조합이 존재해야 한다. 예를 들어, 전이유전자의 발현이 일어나기 위해서는, 적어도 조건 A 및 B가 발생해야 한다. 패스코드 조절 스위치는, 전이유전자의 발현이 일어나기 위해 존재하는 임의의 수의 조건, 예를 들어 적어도 2개, 또는 적어도 3개, 또는 적어도 4개, 또는 적어도 5개, 또는 적어도 6개, 또는 적어도 7개, 또는 그 이상의 조건일 수 있다. 일부 구현예에서는, 적어도 2개의 조건(예를 들어, 조건 A, B)이 발생해야 하고, 일부 구현예에서는, 적어도 3개의 조건(예를 들어, A, B 및 C, 또는 A, B 및 D)이 발생해야 한다. 단지 예로서, 패스코드 "ABC" 조절 스위치를 갖는 ceDNA에서 유전자 발현이 일어나기 위해서는, 조건 A, B 및 C가 존재해야 한다. 조건 A, B 및 C는 다음과 같을 수 있다: 조건 A는 병태 또는 질환의 존재이고, 조건 B는 호르몬 반응이고, 조건 C는 전이유전자 발현에 대한 반응이다. 예를 들어, 전이유전자가 결함이 있는 EPO 유전자를 편집하는 경우, 조건 A는 만성신장질환(CKD)의 존재이고, 조건 B는 대상의 신장이 저산소 상태인 경우에 발생하고, 조건 C는 신장에서 에리트로포이에틴 생산 세포(EPC) 동원이 손상되거나; 또는 대안적으로, HIF-2 활성화가 손상되는 경우이다. 산소 수준이 증가하거나 목적하는 EPO 수준에 도달하는 경우, 전이유전자는 다시 3가지 조건이 발생할 때까지 꺼지고, 다시 켜지게 된다.
일부 구현예에서, ceDNA 벡터에의 사용을 위해 포함된 패스코드 조절 스위치 또는 "패스코드 회로"는, 생물학적 봉쇄 조건을 정의하는 데 사용되는 환경 신호의 범위 및 복잡성을 확장시키기 위해 하이브리드 전사인자(TF)를 포함한다. 선결된 조건의 존재 하에서 세포 사멸을 촉발시키는 데드맨 스위치와 반대로, "패스코드 회로"는 특정 "패스코드"의 존재 하에서 세포 생존 또는 전이유전자 발현을 가능하게 하며, 선결된 환경 조건 또는 패스코드가 존재하는 경우에만 전이유전자 발현 및/또는 세포 생존을 가능하게 하도록 용이하게 재프로그래밍될 수 있다.
본원에 개시된 조절 스위치의 임의의 및 모든 조합, 예를 들어 소분자 스위치, 핵산 기반 스위치, 소분자-핵산 하이브리드 스위치, 전사 후 전이유전자 조절 스위치, 번역 후 조절, 방사선 제어 스위치, 저산소증 매개 스위치, 및 본원에 개시된 바와 같은 당업자에게 알려진 다른 조절 스위치가, 본원에 개시된 바와 같은 패스코드 조절 스위치에 사용될 수 있다. 사용을 위해 포함된 조절 스위치는 또한 리뷰 논문인 문헌[Kis et al., J R Soc Interface. 12: 20141000 (2015)]에 논의되어 있고, Kis의 표 1에 요약되어 있다. 일부 구현예에서, 패스코드 시스템에 사용되는 조절 스위치는 국제 특허 출원 PCT/US18/49996(이는 그 전문이 본원에 참조로서 인용됨)의 표 11에 개시된 스위치 중 임의의 것 또는 스위치의 조합에서 선택될 수 있다.
(iv) 전이유전자 발현을 제어하는 핵산 기반 조절 스위치
일부 구현예에서, ceDNA에 의한 PAH 단백질의 발현을 제어하는 조절 스위치는 핵산 기반 제어 메커니즘을 기반으로 한다. 예시적인 핵산 제어 메커니즘은 당업계에 알려져 있으며, 사용을 위해 고려된다. 예를 들어, 이러한 메커니즘은, 예를 들어 US2009/0305253, US2008/0269258, US2017/0204477, WO2018026762A1, 미국 특허 제9,222,093호 및 EP 출원 EP288071에 개시된 것들, 및 문헌[Villa JK et al., Microbiol Spectr. 2018 May;6(3)]에 개시된 것과 같은 리보스위치를 포함한다. WO2018/075486 및 WO2017/147585에 개시된 것들과 같은 대사산물 반응성 전사 바이오센서가 또한 포함된다. 사용을 위해 고려되는 다른 업계 공지의 메커니즘에는, siRNA 또는 RNAi 분자(예를 들어, miR, shRNA)를 이용한 전이유전자의 침묵(silencing)이 포함된다. 예를 들어, ceDNA 벡터는 ceDNA 벡터에 의해 발현되는 전이유전자의 부분에 상보적인 RNAi 분자를 인코딩하는 조절 스위치를 포함할 수 있다. 전이유전자(예를 들어, PAH 단백질)가 ceDNA 벡터에 의해 발현되는 경우라도 이러한 RNAi가 발현되면, 상보적 RNAi 분자에 의해 침묵하게 되고, 전이유전자가 ceDNA 벡터에 의해 발현될 때 RNAi가 발현되지 않으면, 전이유전자(예를 들어, PAH 단백질)는 RNAi에 의해 침묵하게 되지 않는다.
일부 구현예에서, 조절 스위치는, 예를 들어 US2002/0022018에 개시된 바와 같은 조직 특이적 자가 불활성화 조절 스위치이며, 이에 의해 조절 스위치는 전이유전자 발현이 달리 불리할 수 있는 부위에서 전이유전자(예를 들어, PAH 단백질)를 의도적으로 차단한다. 일부 구현예에서, 조절 스위치는, 예를 들어 US2014/0127162 및 미국 특허 제8,324,436호에 개시된 바와 같은 재조합효소 가역적 유전자 발현 시스템이다.
(v) 전사 후 및 번역 후 조절 스위치.
일부 구현예에서, ceDNA 벡터에 의한 PAH 단백질의 발현을 제어하는 조절 스위치는 전사 후 변형 시스템이다. 예를 들어, 이러한 조절 스위치는 US2018/0119156, GB201107768, WO2001/064956A3, EP 특허 제2707487호 및 문헌[Beilstein et al., ACS Synth. Biol., 2015, 4 (5), pp 526-534]; 문헌[Zhong et al., Elife. 2016 Nov 2;5. pii: e18858]에 개시된 바와 같은, 테트라시클린 또는 테오필린에 민감한 압타자임(aptazyme) 리보스위치일 수 있다. 일부 구현예에서, 당업자는 리간드 민감성(OFF-스위치) 압타머를 함유하는 저해성 siRNA와 전이유전자를 모두 인코딩할 수 있으며, 최종 결과는 리간드 민감성 ON-스위치가 되는 것으로 예상된다.
(vi) 다른 예시적인 조절 스위치
환경 변화에 의해 촉발되는 것들을 포함하는 임의의 알려진 조절 스위치가, ceDNA 벡터에 의한 PAH 단백질의 발현을 제어하기 위해 ceDNA 벡터에 사용될 수 있다. 추가의 예에는, 비제한적으로, 문헌[Suzuki et al., Scientific Reports 8; 10051 (2018)]의 BOC 방법; 유전 코드 확장 및 비(non)생리학적 아미노산; 방사선 제어 또는 초음파 제어 온/오프 스위치(예를 들어, 문헌[Scott S et al., Gene Ther. 2000 Jul;7(13):1121-5]; 미국 특허 제5,612,318호; 제5,571,797호; 제5,770,581호; 제5,817,636호; 및 WO1999/025385A1 참조)가 포함된다. 일부 구현예에서, 조절 스위치는, 예를 들어 미국 특허 제7,840,263호; US2007/0190028A1에 개시된 바와 같은 이식 가능한 시스템에 의해 제어되며, 여기서 유전자 발현은 ceDNA 벡터 내 전이유전자에 작동적으로 연결된 프로모터를 활성화시키는 전자기 에너지를 포함하는 하나 이상의 에너지 형태에 의해 제어된다.
일부 구현예에서, ceDNA 벡터에의 사용을 위해 고려되는 조절 스위치는, 저산소증 매개 또는 스트레스 활성화 스위치, 예를 들어 WO1999060142A2, 미국 특허 제5,834,306호; 제6,218,179호; 제6,709,858호; US2015/0322410; 문헌[Greco et al., (2004) Targeted Cancer Therapies 9, S368](이들은 그 전문이 본원에 참조로서 인용됨)에 개시된 바와 같은 것들뿐 아니라, 예를 들어 미국 특허 제9,394,526호(이는 그 전문이 본원에 참조로서 인용됨)에 개시된 바와 같은, FROG, TOAD 및 NRSE 요소, 및 조건부 유도성 침묵 요소(저산소증 반응 요소(HRE), 염증 반응 요소(IRE) 및 전단 응력 활성화 요소(SSAE) 포함)이다. 이러한 구현예는, 허혈 후, 허혈 조직 및/또는 종양에서 ceDNA 벡터로부터의 전이유전자의 발현을 조정하는 데 유용하다.
(vii) 사멸 스위치
본원에 기재된 다른 구현예는 사멸 스위치를 포함하는 본원에 기재된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터에 관한 것이다. 본원에 개시된 바와 같은 사멸 스위치는, 대상의 시스템으로부터 도입된 ceDNA 벡터를 영구적으로 제거하는 수단으로서, ceDNA 벡터를 포함하는 세포를 사멸시키거나 프로그래밍된 세포 사멸에 거치게 할 수 있다. 당업자는, PAH 단백질의 발현을 위한 ceDNA 벡터에서의 사멸 스위치의 사용이, 전형적으로 대상이 수용 가능하게 손실할 수 있는 제한된 수의 세포, 또는 세포자멸사가 바람직한 세포 유형(예를 들어, 암 세포)에 대한 ceDNA 벡터의 표적화와 결합될 수 있다는 것을 이해할 것이다. 모든 양태에서, 본원에 개시된 바와 같은 "사멸 스위치"는, 입력 생존 신호 또는 다른 명시된 조건의 부재 하에서 ceDNA 벡터를 포함하는 세포의 신속하고 강력한 세포 사멸을 제공하도록 설계된다. 달리 말하면, 본원에 기재된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터에 의해 인코딩된 사멸 스위치는 ceDNA 벡터를 포함하는 세포의 세포 생존을 특정한 입력 신호에 의해 정의된 환경으로 제한할 수 있다. 이러한 사멸 스위치는, 대상에서 PAH 단백질의 발현을 위한 ceDNA 벡터를 제거하거나, 인코딩된 PAH 단백질을 발현하지 않도록 보장하는 것이 바람직한 경우에 생물학적 생물봉쇄(biocontainment) 기능으로 작용한다.
당업자에게 알려진 다른 사멸 스위치, 예를 들어 US2010/0175141; US2013/0009799; US2011/0172826; US2013/0109568에 개시된 것뿐 아니라, 문헌[Jusiak et al, Reviews in Cell Biology and molecular Medicine; 2014; 1-56]; 문헌[Kobayashi et al., PNAS, 2004; 101; 8419-9]; 문헌[Marchisio et al., Int. Journal of Biochem and Cell Biol., 2011; 43; 310-319]; 및 문헌[Reinshagen et al., Science Translational Medicine, 2018, 11]에 개시된 사멸 스위치가, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터에의 사용을 위해 포함되며, 상기 모든 문헌들의 내용은 그 전문이 본원에 참조로서 인용된다.
따라서, 일부 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터는 이펙터 독소 또는 리포터 단백질을 인코딩하는 핵산을 포함하는 사멸 스위치 핵산 작제물을 포함할 수 있으며, 여기서 이펙터 독소(예를 들어, 사멸 단백질) 또는 리포터 단백질의 발현은 선결된 조건에 의해 제어된다. 예를 들어, 선결된 조건은 환경 작용제, 예를 들어 외인성 작용제의 존재일 수 있으며, 그렇지 않으면 세포는 이펙터 독소(예를 들어, 사멸 단백질)의 발현이 기본 설정이 되어 사멸되게 된다. 대안적인 구현예에서, 선결된 조건은 2개 이상의 환경 작용제의 존재이며, 예를 들어 세포는 2개 이상의 필요한 외인성 작용제가 공급되는 경우에만 생존할 것이고, 둘 중 어느 하나가 없는 경우에, ceDNA를 포함하는 세포는 사멸된다.
일부 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터는 ceDNA 벡터에 의해 발현되는 전이유전자의 생체내 발현(예를 들어, PAH 단백질의 발현)을 효과적으로 종결시키는 ceDNA 벡터를 포함하는 세포를 파괴하기 위해 사멸 스위치를 혼입하도록 변형된다. 구체적으로, ceDNA 벡터는 정상적인 생리학적 조건 하의 포유류 세포에서 기능성이 아닌 스위치-단백질을 발현하도록 추가로 유전자 조작된다. 이러한 스위치-단백질을 특이적으로 표적화하는 환경 조건 또는 약물의 투여 시에만, 스위치-단백질을 발현하는 세포가 파괴되어 치료용 단백질 또는 펩타이드의 발현이 종결될 것이다. 예를 들어, HSV-티미딘 키나아제를 발현하는 세포는 간시클로버(ganciclovir) 및 시토신 데아미나아제와 같은 약물의 투여 시 사멸될 수 있다고 보고되었다. 예를 들어 문헌[Dey and Evans, Suicide Gene Therapy by Herpes Simplex Virus-1 Thymidine Kinase (HSV-TK), in Targets in Gene Therapy, edited by You (2011)]; 및 문헌[Beltinger et al., Proc. Natl. Acad. Sci. USA 96(15):8699-8704 (1999)] 참조. 일부 구현예에서 ceDNA 벡터는 DISE(생존 유전자 제거로 인해 유도된 사멸(Death Induced by Survival gene Elimination))로 지칭되는 siRNA 사멸 스위치를 포함할 수 있다(문헌[Murmann et al., Oncotarget. 2017; 8:84643-84658, Induction of DISE in ovarian cancer cells in vivo]).
VI.
ceDNA 벡터의 생산 방법
일반적인 생산 방법
본원에 정의된 바와 같은 비대칭인 ITR 쌍 또는 대칭인 ITR 쌍을 포함하는 PAH 단백질의 발현을 위한 ceDNA 벡터의 생산을 위한 특정 방법은, 2018년 9월 7일자 출원된 국제 출원 PCT/US18/49996(이는 그 전문이 본원에 참조로서 인용됨)의 섹션 IV에 기재되어 있다. 일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 본원에 기재된 바와 같이 곤충 세포를 사용하여 생산될 수 있다. 대안적인 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 합성적으로, 일부 구현예에서 2019년 1월 18일자 출원된 국제 출원 PCT/US19/14122(이는 그 전문이 본원에 참조로서 인용됨)에 개시된 바와 같은 무세포 방법으로 생산될 수 있다.
본원에 기재된 바와 같이, 하나의 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터는, 예를 들어 하기 단계를 포함하는 공정에 따라 수득될 수 있다: a) 바이러스 캡시드 코딩 서열이 없는 폴리뉴클레오타이드 발현 작제물 주형(예를 들어, ceDNA-플라스미드, ceDNA-박미드 및/또는 ceDNA-바큘로바이러스)을 보유하는 숙주세포(예를 들어, 곤충 세포) 집단을, Rep 단백질의 존재 하에서, 숙주세포 내에서 ceDNA 벡터의 생산을 유도하는 데 효과적인 조건 하에서 충분한 시간 동안 인큐베이션하는 단계로서, 여기서 숙주세포는 바이러스 캡시드 코딩 서열을 포함하지 않는 단계; 및 b) 숙주세포에서 ceDNA 벡터를 수거하고 단리하는 단계. Rep 단백질의 존재는 변형된 ITR을 갖는 벡터 폴리뉴클레오타이드의 복제를 유도하여, 숙주세포에서 ceDNA 벡터를 생산한다. 하지만, 바이러스 입자(예를 들어, AAV 비리온)는 발현되지 않는다. 따라서, AAV 또는 다른 바이러스 기반 벡터에 자연적으로 부과되는 것과 같은 크기 제한이 없다.
숙주세포에서 단리된 ceDNA 벡터의 존재는, 숙주세포에서 단리된 DNA를 ceDNA 벡터 상에 단일 인식 부위를 갖는 제한 효소로 소화시키고, 소화된 DNA 물질을 미변성 겔 상에서 분석하여, 선형 및 비연속 DNA와 비교하여 선형 및 연속 DNA의 특징적인 밴드의 존재를 확인하는 방식으로 확인될 수 있다.
또 다른 양태에서, 본 개시내용은, 예를 들어 문헌[Lee, L. et al. (2013) Plos One 8(8): e69879]에 기재된 바와 같이, 비바이러스성 DNA 벡터의 생산에서 DNA 벡터 폴리뉴클레오타이드 발현 주형(ceDNA 주형)을 이의 자체 게놈에 안정적으로 통합시킨 숙주 세포주의 용도를 제공한다. 바람직하게는, Rep는 약 3의 MOI에서 숙주 세포에 첨가된다. 숙주 세포주가 포유류 세포주, 예를 들어 HEK293 세포인 경우, 상기 세포주는 안정적으로 통합된 폴리뉴클레오타이드 벡터 주형을 가질 수 있고, 헤르페스바이러스와 같은 제2 벡터를 사용하여 Rep 단백질을 세포에 도입하여, Rep 및 헬퍼 바이러스의 존재 하에서 ceDNA의 절제 및 증폭을 가능하게 할 수 있다.
하나의 구현예에서, 본원에 기재된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터를 제조하는 데 사용되는 숙주세포는 곤충 세포이고, 바큘로바이러스는 Rep 단백질을 인코딩하는 폴리뉴클레오타이드, 및 예를 들어 도 3a 내지 도 3c 및 실시예 1에 기재된 바와 같은 ceDNA에 대한 비바이러스성 DNA 벡터 폴리뉴클레오타이드 발현 작제물 주형을 전달하는 데 사용된다. 일부 구현예에서, 숙주세포는 Rep 단백질을 발현하도록 조작된다.
이어서, 숙주세포에서 ceDNA 벡터를 수거하고 단리한다. 상기 세포에서 본원에 기재된 ceDNA 벡터를 수거하고 수집하는 시간은, ceDNA 벡터의 고수율 생산을 달성하기 위해 선택 및 최적화될 수 있다. 예를 들어, 수거 시간은 세포 생존율, 세포 형태, 세포 성장 등의 관점에서 선택될 수 있다. 하나의 구현예에서, 세포를 충분한 조건 하에서 성장시키고, ceDNA 벡터를 생산하기 위한 바큘로바이러스 감염 후, 하지만 바큘로바이러스 독성으로 인해 세포의 대부분이 사멸되기 시작하기 전에 충분한 시간 동안 수거한다. DNA 벡터는 Qiagen Endo-Free Plasmid 키트와 같은 플라스미드 정제 키트를 사용하여 단리될 수 있다. 플라스미드 단리를 위해 개발된 다른 방법이 또한 DNA 벡터에 적용될 수 있다. 일반적으로, 임의의 핵산 정제 방법이 채택될 수 있다.
DNA 벡터는 DNA의 정제에 대해 당업자에게 알려진 임의의 수단을 통해 정제될 수 있다. 하나의 구현예에서, ceDNA 벡터는 DNA 분자로 정제된다. 또 다른 구현예에서, ceDNA 벡터는 엑소좀 또는 미세입자로 정제된다.
PAH 단백질의 발현을 위한 ceDNA 벡터의 존재는, 세포에서 단리된 벡터 DNA를 DNA 벡터 상에 단일 인식 부위를 갖는 제한 효소로 소화시키고, 소화 및 미소화된 DNA 물질을 겔 전기영동을 사용하여 분석하여, 선형 및 비연속 DNA와 비교하여 선형 및 연속 DNA의 특징적인 밴드의 존재를 확인하는 방식으로 확인될 수 있다. 도 3c 및 도 3d는, 본원의 공정에 의해 생산된 폐쇄형 ceDNA 벡터의 존재를 확인하는 하나의 구현예를 예시한다.
VII.
약학적 조성물
또 다른 양태에서, 약학적 조성물이 제공된다. 약학적 조성물은 본원에 기재된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터와, 약학적으로 허용 가능한 담체 또는 희석제를 포함한다.
본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 대상의 세포, 조직 또는 기관으로의 생체내 전달을 위해 대상에게의 투여에 적합한 약학적 조성물에 혼입될 수 있다. 전형적으로, 약학적 조성물은 본원에 개시된 바와 같은 ceDNA 벡터와 약학적으로 허용 가능한 담체를 포함한다. 예를 들어, 본원에 기재된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 치료용 투여(예를 들어, 비경구 투여)의 목적하는 경로에 적합한 약학적 조성물에 혼입될 수 있다. 고압 정맥내 또는 동맥내 주입뿐 아니라, 핵내 미세주사 또는 세포질내 주사와 같은 세포내 주사를 통한 수동적 조직 전달이 또한 고려된다. 치료 목적의 약학적 조성물은 용액, 마이크로에멀젼, 분산액, 리포좀, 또는 높은 ceDNA 벡터 농도에 적합한 다른 정렬된 구조로 제형화될 수 있다. 멸균 주사액은, 필요한 경우 상기 열거된 성분 중 하나 또는 이들의 조합을 갖는 적절한 완충액 중에 필요한 양의 ceDNA 벡터 화합물을 혼입시켜 제조할 수 있고, 이어서 ceDNA 벡터를 포함하는 여과 멸균된 것을 제형화하여 핵산의 전이유전자를 수용자의 세포에 전달함으로써, 그 안의 전이유전자 또는 공여체 서열의 치료적 발현을 유도할 수 있다. 상기 조성물은 또한 약학적으로 허용 가능한 담체를 포함할 수 있다.
PAH 단백질의 발현을 위한 ceDNA 벡터를 포함하는 약학적 활성 조성물은 다양한 목적을 위한 전이유전자를 세포, 예를 들어 대상의 세포에 전달하도록 제형화될 수 있다.
치료 목적을 위한 약학적 조성물은 전형적으로 제조 및 저장 조건 하에서 멸균되고 안정해야 한다. 상기 조성물은 용액, 마이크로에멀젼, 분산액, 리포좀, 또는 높은 ceDNA 벡터 농도에 적합한 다른 정렬된 구조로 제형화될 수 있다. 멸균 주사액은, 필요한 경우 상기 열거된 성분 중 하나 또는 이들의 조합을 갖는 적절한 완충액 중에 필요한 양의 ceDNA 벡터 화합물을 혼입시킨 후, 여과 멸균하는 방식으로 제조될 수 있다.
본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 국소, 전신, 양막내, 경막내, 두개내, 동맥내, 정맥내, 림프내, 복강내, 피하, 기관, 조직내(예를 들어, 근육내, 심장내, 간내, 신장내, 뇌내), 경막내, 방광내, 결막(예를 들어, 안와외, 안와내, 안와후방, 망막내, 망막하, 맥락막, 맥락막하, 간질내, 전방내 및 유리체내), 달팽이관내 및 점막(예를 들어, 구강, 설하, 비강) 투여에 적합한 약학적 조성물에 혼입될 수 있다. 고압 정맥내 또는 동맥내 주입뿐 아니라, 핵내 미세주사 또는 세포질내 주사와 같은 세포내 주사를 통한 수동적 조직 전달이 또한 고려된다.
일부 양태에서, 본원에 제공된 방법은 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 하나 이상의 ceDNA 벡터를 숙주세포에 전달하는 것을 포함한다. 또한, 이러한 방법에 의해 생산된 세포, 및 이러한 세포로부터 생산되거나 이러한 세포를 포함하는 유기체(예컨대, 동물, 식물 또는 진균)가 본원에 제공된다.핵산의 전달 방법은 리포펙션, 뉴클레오펙션, 미세주사, 유전자총, 리포좀, 면역리포좀(immunoliposome), 다가양이온 또는 지질:핵산 접합체, 네이키드 DNA, 및 DNA의 작용제 증강된 흡수를 포함할 수 있다. 리포펙션은, 예를 들어 미국 특허 제5,049,386호, 제4,946,787호 및 제4,897,355호(이들은 그 전문이 본원에 참조로서 인용됨)에 기재되어 있으며, 리포펙션 시약은 상업적으로 시판되고 있다(예를 들어, Transfectam™ 및 Lipofectin™). 전달은 세포(예를 들어, 시험관내 또는 생체외 투여) 또는 표적 조직(예를 들어, 생체내 투여)으로 이루어질 수 있다.
핵산을 세포에 전달하는 다양한 기술 및 방법이 당업계에 알려져 있다. 예를 들어, PAH 단백질의 발현을 위한 ceDNA와 같은 핵산은 지질 나노입자(LNP), 리피도이드, 리포좀, 지질 나노입자, 리포플렉스 또는 코어-쉘 나노입자로 제형화될 수 있다. 전형적으로, LNP는 핵산(예를 들어, ceDNA) 분자, 하나 이상의 이온화 가능하거나 양이온성인 지질(또는 이의 염), 하나 이상의 비이온성 또는 중성 지질(예를 들어, 인지질), 응집을 방지하는 분자(예를 들어, PEG 또는 PEG-지질 접합체), 및 선택적으로 스테롤(예를 들어, 콜레스테롤)로 구성된다.
PAH 단백질의 발현을 위한 ceDNA와 같은 핵산을 세포에 전달하는 또 다른 방법은, 핵산을 세포에 의해 내재화된 리간드와 접합시키는 것이다. 예를 들어, 리간드는 세포 표면 상의 수용체에 결합하여 세포내이입을 통해 내재화될 수 있다. 리간드는 핵산의 뉴클레오타이드에 공유결합으로 연결될 수 있다. 핵산을 세포에 전달하기 위한 예시적인 접합체는, 예를 들어 국제 특허 출원 공개 WO2015/006740, WO2014/025805, WO2012/037254, WO2009/082606, WO2009/073809, WO2009/018332, WO2006/112872, WO2004/090108, WO2004/091515 및 WO2017/177326에 기재되어 있으며, 상기 모든 문헌들의 내용은 그 전문이 본원에 참조로서 인용된다.
PAH 단백질의 발현을 위한 ceDNA 벡터와 같은 핵산은 또한 트랜스펙션에 의해 세포에 전달될 수 있다. 유용한 트랜스펙션 방법에는, 비제한적으로, 지질 매개 트랜스펙션, 양이온성 중합체 매개 트랜스펙션 또는 인산칼슘 침전이 포함된다. 트랜스펙션 시약은 당업계에 널리 알려져 있으며, 이에는, 비제한적으로, TurboFect 트랜스펙션 시약(Thermo Fisher Scientific), Pro-Ject 시약(Thermo Fisher Scientific), TRANSPASS™ P 단백질 트랜스펙션 시약(New England Biolabs), CHARIOT™ 단백질 전달 시약(Active Motif), PROTEOJUICE™ 단백질 트랜스펙션 시약(EMD Millipore), 293fectin, LIPOFECTAMINE™ 2000, LIPOFECTAMINE™ 3000(Thermo Fisher Scientific), LIPOFECTAMINE™(Thermo Fisher Scientific), LIPOFECTIN™(Thermo Fisher Scientific), DMRIE-C, CELLFECTIN™(Thermo Fisher Scientific), OLIGOFECTAMINE™(Thermo Fisher Scientific), LIPOFECTACE™, FUGENE™(Roche, Basel, Switzerland), FUGENE™ HD(Roche), TRANSFECTAM™(Transfectam, Promega, Madison, Wis.), TFX-10™(Promega), TFX-20™(Promega), TFX-50™(Promega), TRANSFECTIN™(BioRad, Hercules, Calif.), SILENTFECT™(Bio-Rad), Effectene™(Qiagen, Valencia, Calif.), DC-chol(Avanti Polar Lipids), GENEPORTER™(Gene Therapy Systems, San Diego, Calif.), DHARMAFECT 1™(Dharmacon, Lafayette, Colo.), DHARMAFECT 2™(Dharmacon), DHARMAFECT 3™(Dharmacon), DHARMAFECT 4™(Dharmacon), ESCORT™ III(Sigma, St. Louis, Mo.) 및 ESCORT™ IV(Sigma Chemical Co.)가 포함된다. ceDNA와 같은 핵산은, 또한 당업자에게 알려진 미세유체 방법을 통해 세포에 전달될 수 있다.
본원에 기재된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 또한 생체내 세포의 형질도입을 위해 유기체에 직접 투여될 수 있다. 투여는, 비제한적으로, 주사, 주입, 국소 적용 및 전기천공을 포함하는, 분자를 혈액 또는 조직 세포와의 궁극적 접촉에 도입하는 데 통상적으로 사용되는 경로 중 임의의 것에 의해 이루어져 있다. 이러한 핵산을 투여하는 적합한 방법이 이용 가능하고 당업자에 널리 알려져 있으며, 하나 초과의 경로가 특정 조성물을 투여하는 데 사용될 수 있지만, 특정 경로가 종종 또 다른 경로보다 더 즉각적이고 더 효과적인 반응을 제공할 수 있다.
핵산 벡터의 도입 방법에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는, 예를 들어 미국 특허 제5,928,638호(이는 그 전문이 본원에 참조로서 인용됨)에 기재된 방법에 따라 조혈줄기세포에 전달될 수 있다.
본 개시내용에 따른 PAH 단백질의 발현을 위한 ceDNA 벡터는 대상의 세포 또는 표적 기관으로의 전달을 위해 리포좀에 첨가될 수 있다. 리포좀은 적어도 하나의 지질 이중층을 보유하는 소포이다. 리포좀은 의약품 개발의 맥락에서 약물/치료제 전달을 위한 담체로서 전형적으로 사용된다. 이는, 세포막과 융합하고 지질 구조를 재배치하여 약물 또는 활성 약학 성분(API)을 전달하는 방식으로 작동한다. 이러한 전달을 위한 리포좀 조성물은 인지질, 특히 포스파티딜콜린기를 갖는 화합물로 구성되지만, 이러한 조성물은 다른 지질을 또한 포함할 수 있다. 예시적인 리포좀 및 리포좀 제형(비제한적으로, 폴리에틸렌 글리콜(PEG) 관능기 함유 화합물을 포함함)은, 2018년 9월 7일자 출원된 국제 출원 PCT/US2018/050042 및 2018년 12월 6일자 출원된 국제 출원 PCT/US2018/064242(예를 들어, "약학적 제형"이라는 제목의 섹션 참조)에 개시되어 있으며, 상기 문헌 각각의 내용은 그 전문이 본원에 참조로서 인용된다.
당업계에 알려진 다양한 전달 방법 또는 이의 변형을 사용하여 시험관내 또는 생체내에서 ceDNA 벡터를 전달할 수 있다. 예를 들어, 일부 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터는, 표적화된 세포로의 DNA 유입이 용이하도록 기계적, 전기적, 초음파, 유체역학적 또는 레이저 기반 에너지에 의해 세포막에 일시적으로 침투하는 방식으로 전달된다. 예를 들어, ceDNA 벡터는 세포막을 일시적으로 파괴하거나, 크기 제한 채널을 통해 세포를 밀어넣거나, 또는 당업계에 알려진 다른 수단에 의해 전달될 수 있다. 일부 경우에, ceDNA 벡터만 네이키드 DNA로서 간, 신장, 담낭, 전립선, 부신, 심장, 장, 폐 및 위, 피부, 흉선, 심장근 또는 골격근에서 선택되는 임의의 하나 이상의 조직에 직접 주사된다. 일부 경우에, ceDNA 벡터는 유전자 총에 의해 전달된다. 캡시드 미함유 AAV 벡터로 코팅된 금 또는 텅스텐 구형 입자(직경 1 μm 내지 3 μm)는 가압 가스에 의해 고속으로 가속화되어 표적 조직세포에 침투할 수 있다.
PAH 단백질의 발현을 위한 ceDNA 벡터와 약학적으로 허용 가능한 담체를 포함하는 조성물이 구체적으로 본원에서 고려된다. 일부 구현예에서, ceDNA 벡터는 지질 전달 시스템, 예를 들어 본원에 기재된 바와 같은 리포좀을 이용하여 제형화된다. 일부 구현예에서, 이러한 조성물은 숙련된 의사에 의해 임의의 목적하는 경로로 투여된다. 상기 조성물은 경구, 비경구, 설하, 경피, 직장, 경점막, 국소, 흡입, 협측 투여, 흉막내, 정맥내, 동맥내, 복강내, 피하, 근육내, 비강내, 경막내 및 관절내, 또는 이들의 조합을 포함하는 상이한 경로로 대상에게 투여될 수 있다. 수의학적 사용을 위해, 상기 조성물은 통상의 수의학적 관행에 따라 적합하게 허용 가능한 제형으로 투여될 수 있다. 수의사는 특정 동물에 가장 적절한 투여 방식 및 투여 경로를 용이하게 결정할 수 있다. 상기 조성물은 전형적인 시린지, 무바늘 주사 장치, "미세사출법(microprojectile bombardment) 유전자 총", 또는 전기천공("EP"), 유체역학적 방법 또는 초음파와 같은 다른 물리적 방법에 의해 투여될 수 있다.
일부 경우에, PAH 단백질의 발현을 위한 ceDNA 벡터는 유체역학적 주사에 의해 전달되는데, 이는 임의의 수용성 화합물 및 입자를 사지 전체의 내부 기관 및 골격근에 직접 세포내 전달하기 위한 간단하고 매우 효율적인 방법이다.
일부 경우에, PAH 단백질의 발현을 위한 ceDNA 벡터는 DNA 입자의 내부 기관 또는 종양 세포로의 세포내 전달을 용이하게 하기 위해 막 내에 나노범위 공극을 만들어 초음파를 통해 전달되므로, 플라스미드 DNA의 크기 및 농도는 상기 시스템의 효율에 큰 역할을 한다. 일부 경우에, ceDNA 벡터는 핵산을 함유하는 입자를 표적세포 내로 농축시키기 위해 자기장을 사용하는 자기주입법(magnetofection)을 통해 전달된다.
일부 경우에, 양이온성 리포좀/미셀 또는 양이온성 중합체에 속하는 다가양이온성 나노머 입자에 의한 음으로 하전된 핵산의 압축을 포함하는, 예를 들어 나노머 복합체를 사용하는 화학적 전달 시스템이 사용될 수 있다. 전달 방법에 사용되는 양이온성 지질에는, 비제한적으로, 1가 양이온성 지질, 다가 양이온성 지질, 구아닌 함유 화합물, 콜레스테롤 유도체 화합물, 양이온성 중합체(예를 들어, 폴리(에틸렌이민), 폴리-L-리신, 프로타민, 다른 양이온성 중합체) 및 지질-중합체 하이브리드가 포함된다.
A. 엑소좀:
일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 엑소좀에 패키징되는 방식으로 전달된다. 엑소좀은 다소포체와 원형질막의 융합 후 세포외 환경으로 방출되는 세포내이입 기원의 작은 막 소포이다. 이의 표면은 공여체 세포의 세포막 유래의 지질 이중층으로 이루어져 있으며, 엑소좀을 생산한 세포의 세포질을 함유하고, 표면에 모세포(parental cell)의 막 단백질을 나타낸다. 엑소좀은 상피세포, B 및 T 림프구, 비만세포(MC)뿐 아니라, 수지상세포(DC)를 포함하는 다양한 세포 유형에 의해 생성된다. 일부 구현예에서, 직경이 10 nm 내지 1 μm, 20 nm 내지 500 nm, 30 nm 내지 250 nm, 50 nm 내지 100 nm인 엑소좀이 사용을 위해 고려된다. 엑소좀은 이의 공여체 세포를 사용하거나 특정 핵산을 도입하는 방식으로 표적세포로의 전달을 위해 단리될 수 있다. 당업계에 알려진 다양한 접근법을 사용하여 본 개시내용의 캡시드 미함유 AAV 벡터를 함유하는 엑소좀을 생성할 수 있다.
A. 미세입자/나노입자
일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 지질 나노입자에 의해 전달된다. 일반적으로, 지질 나노입자는, 예를 들어 문헌[Tam et al. (2013). Advances in Lipid Nanoparticles for siRNA delivery. Pharmaceuticals 5(3): 498-507]에 개시된 바와 같은, 이온화 가능한 아미노 지질(예를 들어, 헵타트리아콘타-6,9,28,31-테트라엔-19-일 4-(디메틸아미노)부타노에이트, DLin-MC3-DMA, 포스파티딜콜린(1,2-디스테아로일-sn-글리세로-3-포스포콜린, DSPC), 콜레스테롤 및 코트 지질(폴리에틸렌 글리콜-디미리스톨글리세롤, PEG-DMG)을 포함한다.
일부 구현예에서, 지질 나노입자의 평균 직경은 약 10 nm 내지 약 1000 nm이다. 일부 구현예에서, 지질 나노입자의 평균 직경은 300 nm 미만이다. 일부 구현예에서, 지질 나노입자의 평균 직경은 약 10 nm 내지 약 300 nm이다. 일부 구현예에서, 지질 나노입자의 평균 직경은 200 nm 미만이다. 일부 구현예에서, 지질 나노입자의 평균 직경은 약 25 nm 내지 약 200 nm이다. 일부 구현예에서, 지질 나노입자 제제(예를 들어, 복수의 지질 나노입자를 포함하는 조성물)는, 평균 크기(예를 들어, 직경)가 약 70 nm 내지 약 200 nm이고, 전형적으로 평균 크기가 약 100 nm 이하인 크기 분포를 갖는다.
당업계에 알려진 다양한 지질 나노입자를 사용하여 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터를 전달할 수 있다. 예를 들어, 지질 나노입자를 사용하는 다양한 전달 방법은 미국 특허 제9,404,127호, 제9,006,417호 및 제9,518,272호에 기재되어 있다.
일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 금 나노입자에 의해 전달된다. 일반적으로, 핵산은, 예를 들어 문헌[Ding et al. (2014). Gold Nanoparticles for Nucleic Acid Delivery. Mol. Ther. 22(6); 1075-1083]에 기재된 바와 같이, 금 나노입자에 공유결합으로 결합되거나, 금 나노입자에 비공유결합으로 결합될 수 있다(예를 들어, 전하-전하 상호작용에 의해 결합됨). 일부 구현예에서, 금 나노입자-핵산 접합체는, 예를 들어 미국 특허 제6,812,334호에 기재된 방법을 사용하여 생성된다.
B. 접합체
일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 세포 흡수를 증가시키는 작용제에 접합된다(예를 들어, 공유결합으로 결합됨). "세포 흡수를 증가시키는 작용제"는 지질 막을 통한 핵산의 수송을 용이하게 하는 분자이다. 예를 들어, 핵산은 친유성 화합물(예를 들어, 콜레스테롤, 토코페롤 등), 세포 침투 펩타이드(CPP)(예를 들어, 페네트라틴(penetratin), TAT, Syn1B, 등) 및 폴리아민(예를 들어, 스페르민(spermine))에 접합될 수 있다. 세포 흡수를 증가시키는 작용제의 추가 예는, 예를 들어 문헌[Winkler (2013). Oligonucleotide conjugates for therapeutic applications. Ther. Deliv. 4(7); 791-809]에 개시되어 있다.
일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 중합체(예를 들어, 중합체 분자) 또는 폴레이트 분자(예를 들어, 엽산 분자)에 접합된다. 일반적으로, 중합체에 접합된 핵산의 전달은 당업계에 알려져 있으며, 예를 들어 WO2000/34343 및 WO2008/022309에 기재되어 있다. 일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 미국 특허 제8,987,377호에 기재된 바와 같이 폴리(아미드) 중합체에 접합된다. 일부 구현예에서, 본 개시내용에 기재된 핵산은 미국 특허 제8,507,455호에 기재된 바와 같이 엽산 분자에 접합된다.
일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는, 예를 들어 미국 특허 제8,450,467호 기재된 바와 같이 탄수화물에 접합된다.
C. 나노캡슐
대안적으로, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터의 나노캡슐 제형이 사용될 수 있다. 나노캡슐은 일반적으로 안정적이고 재현 가능한 방식으로 물질을 포획할 수 있다. 세포내 중합체 과부하로 인한 부작용을 회피하기 위해, 이러한 초미세 입자(크기 약 0.1 μm)는 생체내에서 분해될 수 있는 중합체를 사용하여 설계되어야 한다. 이러한 요건을 충족시키는 생분해성 폴리알킬-시아노아크릴레이트 나노입자가 사용을 위해 고려된다.
D. 리포좀
본 개시내용에 따른 PAH 단백질의 발현을 위한 ceDNA 벡터는 대상의 세포 또는 표적 기관으로의 전달을 위해 리포좀에 첨가될 수 있다. 리포좀은 적어도 하나의 지질 이중층을 보유하는 소포이다. 리포좀은 의약품 개발의 맥락에서 약물/치료제 전달을 위한 담체로서 전형적으로 사용된다. 이는, 세포막과 융합하고 지질 구조를 재배치하여 약물 또는 활성 약학 성분(API)을 전달하는 방식으로 작동한다. 이러한 전달을 위한 리포좀 조성물은 인지질, 특히 포스파티딜콜린기를 갖는 화합물로 구성되지만, 이러한 조성물은 다른 지질을 또한 포함할 수 있다.
리포좀의 형성 및 사용은 일반적으로 당업자에게 알려져 있다. 리포좀은 개선된 혈청 안정성 및 순환 반감기를 갖도록 개발되었다(미국 특허 제5,741,516호). 나아가, 잠재적인 약물 담체로서의 리포좀 및 리포좀 유사 제제의 다양한 방법이 기재되어 있다(미국 특허 제5,567,434호; 제5,552,157호; 제5,565,213호; 제5,738,868호 및 제5,795,587호(이들은 그 전문이 본원에 참조로서 인용됨)).
E. 예시적인 리포좀 및 지질 나노입자(LNP) 조성물
본 개시내용에 따른 PAH 단백질의 발현을 위한 ceDNA 벡터는 세포, 예를 들어 전이유전자의 발현을 필요로 하는 세포로의 전달을 위해 리포좀에 첨가될 수 있다. 리포좀은 적어도 하나의 지질 이중층을 보유하는 소포이다. 리포좀은 의약품 개발의 맥락에서 약물/치료제 전달을 위한 담체로서 전형적으로 사용된다. 이는, 세포막과 융합하고 지질 구조를 재배치하여 약물 또는 활성 약학 성분(API)을 전달하는 방식으로 작동한다. 이러한 전달을 위한 리포좀 조성물은 인지질, 특히 포스파티딜콜린기를 갖는 화합물로 구성되지만, 이러한 조성물은 다른 지질을 또한 포함할 수 있다.
ceDNA를 포함하는 지질 나노입자(LNP)는 2018년 9월 7일자 출원된 국제 출원 PCT/US2018/050042 및 2018년 12월 6일자 출원된 국제 출원 PCT/US2018/064242(이들은 그 전문이 본원에 참조로서 인용됨)에 개시되어 있으며, 이는 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터를 위한 방법 및 조성물에의 사용을 위해 고려된다.
일부 양태에서, 본 개시내용은 면역원성/항원성을 감소시키고, 화합물(들)에 친수성 및 소수성을 제공하고, 투여 빈도를 감소시킬 수 있는 폴리에틸렌 글리콜(PEG) 관능기(소위 "PEG화 화합물")를 갖는 하나 이상의 화합물을 포함하는 리포좀 제형을 제공한다. 또는, 리포좀 제형은 단순히 추가 구성요소로서 폴리에틸렌 글리콜(PEG) 중합체를 포함한다. 이러한 양태에서, PEG 또는 PEG 관능기의 분자량은 62 Da 내지 약 5,000 Da일 수 있다.
일부 양태에서, 본 개시내용은 수시간 내지 수주의 기간에 걸쳐 연장 방출 또는 제어 방출 프로파일로 API를 전달하는 리포좀 제형을 제공한다. 일부 관련 양태에서, 리포좀 제형은 지질 이중층에 의해 결합된 수성 챔버를 포함할 수 있다. 다른 관련 양태에서, 리포좀 제형은 수시간 내지 수주의 기간에 걸쳐 API를 방출하는 승온에서 물리적 전이를 거치는 구성요소로 API를 캡슐화한다.
일부 양태에서, 리포좀 제형은 스핑고미엘린과, 본원에 개시된 하나 이상의 지질을 포함한다. 일부 양태에서, 리포좀 제형은 옵티좀을 포함한다.
일부 양태에서, 본 개시내용은 N-(카르보닐-메톡시폴리에틸렌 글리콜 2000)-1,2-디스테아로일-sn-글리세로-3-포스포에탄올아민 소듐 염, (디스테아로일-sn-글리세로-포스포에탄올아민), MPEG(메톡시 폴리에틸렌 글리콜)-접합된 지질, HSPC(수소첨가된 대두 포스파티딜콜린); PEG(폴리에틸렌 글리콜); DSPE(디스테아로일-sn-글리세로-포스포에탄올아민); DSPC(디스테아로일포스파티딜콜린); DOPC(디올레오일포스파티딜콜린); DPPG(디팔미토일포스파티딜글리세롤); EPC(달걀 포스파티딜콜린); DOPS(디올레오일포스파티딜세린); POPC(팔미토일올레오일포스파티딜콜린); SM(스핑고미엘린); MPEG(메톡시 폴리에틸렌 글리콜); DMPC(디미리스토일 포스파티딜콜린); DMPG(디미리스토일 포스파티딜글리세롤); DSPG(디스테아로일포스파티딜글리세롤); DEPC(디에루코일포스파티딜콜린); DOPE(디올레오일-sn-글리세로-포스포에탄올아민), 콜레스테릴 설페이트(CS), 디팔미토일포스파티딜글리세롤(DPPG), DOPC(디올레오일-sn-글리세로-포스파티딜콜린) 또는 이들의 임의의 조합에서 선택되는 하나 이상의 지질을 포함하는 리포좀 제형을 제공한다.
일부 양태에서, 본 개시내용은 인지질, 콜레스테롤 및 PEG화 지질을 56:38:5의 몰비로 포함하는 리포좀 제형을 제공한다. 일부 양태에서, 리포좀 제형의 전체 지질 함량은 2 mg/mL 내지 16 mg/mL이다. 일부 양태에서, 본 개시내용은 포스파티딜콜린 관능기를 함유하는 지질, 에탄올아민 관능기를 함유하는 지질 및 PEG화 지질을 포함하는 리포좀 제형을 제공한다. 일부 양태에서, 본 개시내용은 포스파티딜콜린 관능기를 함유하는 지질, 에탄올아민 관능기를 함유하는 지질 및 PEG화 지질을, 각각, 3:0.015:2의 몰비로 포함하는 리포좀 제형을 제공한다. 일부 양태에서, 본 개시내용은 포스파티딜콜린 관능기를 함유하는 지질, 콜레스테롤 및 PEG화 지질을 포함하는 리포좀 제형을 제공한다. 일부 양태에서, 본 개시내용은 포스파티딜콜린 관능기를 함유하는 지질과 콜레스테롤을 포함하는 리포좀 제형을 제공한다. 일부 양태에서, PEG화 지질은 PEG-2000-DSPE이다. 일부 양태에서, 본 개시내용은 DPPG, 대두 PC, MPEG-DSPE 지질 접합체 및 콜레스테롤을 포함하는 리포좀 제형을 제공한다.
일부 양태에서, 본 개시내용은 포스파티딜콜린 관능기를 함유하는 하나 이상의 지질과 에탄올아민 관능기를 함유하는 하나 이상의 지질을 포함하는 리포좀 제형을 제공한다. 일부 양태에서, 본 개시내용은 포스파티딜콜린 관능기를 함유하는 지질, 에탄올아민 관능기를 함유하는 지질, 및 스테롤, 예를 들어 콜레스테롤 중 하나 이상을 포함하는 리포좀 제형을 제공한다. 일부 양태에서, 리포좀 제형은 DOPC/ DEPC; 및 DOPE를 포함한다.
일부 양태에서, 본 개시내용은 하나 이상의 약학적 부형제, 예를 들어 수크로오스 및/또는 글리신을 추가로 포함하는 리포좀 제형을 제공한다.
일부 양태에서, 본 개시내용은 단일라멜라 또는 다중라멜라 구조의 리포좀 제형을 제공한다. 일부 양태에서, 본 개시내용은 다소포성 입자 및/또는 발포체 기반 입자를 포함하는 리포좀 제형을 제공한다. 일부 양태에서, 본 개시내용은 통상의 나노입자에 비해 크기가 크고, 크기가 약 150 nm 내지 250 nm인 리포좀 제형을 제공한다. 일부 양태에서, 리포좀 제형은 동결건조된 분말이다.
일부 양태에서, 본 개시내용은 리포좀 외부에 단리된 ceDNA를 갖는 혼합물에 약염기를 첨가하여, 본원에 개시 또는 기재된 ceDNA 벡터로 제조되고 로딩되는 리포좀 제형을 제공한다. 이러한 첨가는 리포좀 외부의 pH를 대략 7.3으로 증가시키고, API를 리포좀으로 유도한다. 일부 양태에서, 본 개시내용은 리포좀 내부에서 산성인 pH를 갖는 리포좀 제형을 제공한다. 이러한 경우에, 리포좀의 내부는 pH 4 내지 6.9, 더욱 바람직하게는 pH 6.5일 수 있다. 다른 양태에서, 본 개시내용은 리포좀내 약물 안정화 기술을 사용하여 제조된 리포좀 제형을 제공한다. 이러한 경우에, 중합체성 또는 비중합체성의 고도로 하전된 음이온과, 리포좀내 포획제, 예를 들어 폴리포스페이트 또는 수크로오스 옥타설페이트가 이용된다.
일부 양태에서, 본 개시내용은 ceDNA와 이온화 가능한 지질을 포함하는 지질 나노입자를 제공한다. 예를 들어, 2018년 9월 7일자 출원된 국제 특허 PCT/US2018/050042(이는 본원에 참조로서 인용됨)에 기재된 바와 같은 방법으로 수득된 ceDNA로 제조되고 로딩되는 지질 나노입자 제형. 이는, 이온화 가능한 지질을 양성자화하고 ceDNA/지질 회합 및 입자의 핵형성에 유용한 에너지를 제공하는, 낮은 pH에서의 에탄올성 지질과 수성 ceDNA의 고에너지 혼합에 의해 달성될 수 있다. 상기 입자는 수성 희석 및 유기 용매의 제거를 통해 추가로 안정화될 수 있다. 상기 입자는 목적하는 수준으로 농축될 수 있다.
일반적으로, 지질 입자는 약 10:1 내지 30:1의 총 지질 대 ceDNA의 (질량 또는 중량)비로 제조된다. 일부 구현예에서, 지질 대 ceDNA 비(질량/질량 비; w/w 비)는 약 1:1 내지 약 25:1, 약 10:1 내지 약 14:1, 약 3:1 내지 약 15:1, 약 4:1 내지 약 10:1, 약 5:1 내지 약 9:1, 또는 약 6:1 내지 약 9:1의 범위일 수 있다. 지질과 ceDNA의 양은 목적하는 N/P 비, 예를 들어 3, 4, 5, 6, 7, 8, 9, 10 또는 그 이상의 N/P 비를 제공하도록 조정될 수 있다. 일반적으로, 지질 입자 제형의 전체 지질 함량은 약 5 mg/ml 내지 약 30 mg/mL 범위일 수 있다.
이온화 가능한 지질은 전형적으로 낮은 pH에서 핵산 카고, 예를 들어 ceDNA를 응축시키고, 막 회합과 융합원성(fusogenicity)을 유도하는 데 이용된다. 일반적으로, 이온화 가능한 지질은 산성 조건 하에서, 예를 들어 6.5 이하의 pH에서 양으로 하전되거나 양성자화되는 적어도 하나의 아미노기를 포함하는 지질이다. 이온화 가능한 지질은 또한 본원에서 양이온성 지질로 지칭된다.
예시적인 이온화 가능한 지질은 국제 특허 공개 WO2015/095340, WO2015/199952, WO2018/011633, WO2017/049245, WO2015/061467, WO2012/040184, WO2012/000104, WO2015/074085, WO2016/081029, WO2017/004143, WO2017/075531, WO2017/117528, WO2011/022460, WO2013/148541, WO2013/116126, WO2011/153120, WO2012/044638, WO2012/054365, WO2011/090965, WO2013/016058, WO2012/162210, WO2008/042973, WO2010/129709, WO2010/144740, WO2012/099755, WO2013/049328, WO2013/086322, WO2013/086373, WO2011/071860, WO2009/132131, WO2010/048536, WO2010/088537, WO2010/054401, WO2010/054406, WO2010/054405, WO2010/054384, WO2012/016184, WO2009/086558, WO2010/042877, WO2011/000106, WO2011/000107, WO2005/120152, WO2011/141705, WO2013/126803, WO2006/007712, WO2011/038160, WO2005/121348, WO2011/066651, WO2009/127060, WO2011/141704, WO2006/069782, WO2012/031043, WO2013/006825, WO2013/033563, WO2013/089151, WO2017/099823, WO2015/095346 및 WO2013/086354, 및 미국 특허 공개 US2016/0311759, US2015/0376115, US2016/0151284, US2017/0210697, US2015/0140070, US2013/0178541, US2013/0303587, US2015/0141678, US2015/0239926, US2016/0376224, US2017/0119904, US2012/0149894, US2015/0057373, US2013/0090372, US2013/0274523, US2013/0274504, US2013/0274504, US2009/0023673, US2012/0128760, US2010/0324120, US2014/0200257, US2015/0203446, US2018/0005363, US2014/0308304, US2013/0338210, US2012/0101148, US2012/0027796, US2012/0058144, US2013/0323269, US2011/0117125, US2011/0256175, US2012/0202871, US2011/0076335, US2006/0083780, US2013/0123338, US2015/0064242, US2006/0051405, US2013/0065939, US2006/0008910, US2003/0022649, US2010/0130588, US2013/0116307, US2010/0062967, US2013/0202684, US2014/0141070, US2014/0255472, US2014/0039032, US2018/0028664, US2016/0317458 및 US2013/0195920에 기재되어 있으며, 모든 상기 문헌들의 내용은 그 전문이 본원에 참조로서 인용된다.
일부 구현예에서, 이온화 가능한 지질은 하기 구조를 갖는 MC3 (6Z,9Z,28Z,31Z)-헵타트리아콘타-6,9,28,31-테트라엔-19-일-4-(디메틸아미노)부타노에이트(DLin-MC3-DMA 또는 MC3)이다:
지질 DLin-MC3-DMA는 문헌[Jayaraman et al., Angew. Chem. Int. Ed Engl. (2012), 51(34): 8529-8533]에 기재되어 있으며, 상기 문헌의 내용은 그 전문이 본원에 참조로서 인용된다.
일부 구현예에서, 이온화 가능한 지질은 WO2015/074085에 기재된 바와 같은 지질 ATX-002이며, 상기 문헌의 내용은 그 전문이 본원에 참조로서 인용된다.
일부 구현예에서, 이온화 가능한 지질은 국제 특허 출원 공개 WO2012/040184에 기재된 바와 같은 (13Z,16Z)-N,N-디메틸-3-노닐도코사-13,16-디엔-1-아민(화합물 32)이며, 상기 문헌의 내용은 그 전문이 본원에 참조로 인용된다.
일부 구현예에서, 이온화 가능한 지질은 국제 특허 출원 공개 WO2015/199952에 기재된 바와 같은 화합물 6 또는 화합물 22이며, 상기 문헌의 내용은 그 전문이 본원에 참조로 인용된다.
비제한적으로, 이온화 가능한 지질은 지질 나노입자에 존재하는 총 지질의 20% 내지 90%(몰)를 차지할 수 있다. 예를 들어, 이온화 가능한 지질 몰 함량은 지질 나노입자에 존재하는 총 지질의 20% 내지 70%(몰), 30% 내지 60%(몰) 또는 40% 내지 50%(몰)일 수 있다. 일부 구현예에서, 이온화 가능한 지질은 지질 나노입자에 존재하는 총 지질의 약 50 mol% 내지 약 90 mol%를 차지한다.
일부 양태에서, 지질 나노입자는 비양이온성 지질을 추가로 포함할 수 있다. 비이온성 지질에는, 양친매성 지질, 중성 지질 및 음이온성 지질이 포함된다. 따라서, 비양이온성 지질은 중성의 하전되지 않은 지질, 쯔비터이온성(zwitterionic) 지질 또는 음이온성 지질일 수 있다. 비양이온성 지질은 전형적으로 융합원성을 증강시키는 데 이용된다.
본원에 개시된 바와 같은 방법 및 조성물에 사용하기 위해 고려되는 예시적인 비양이온성 지질은 2018년 9월 7일자 출원된 국제 특허 출원 PCT/US2018/050042 및 2018년 12월 6일자 출원된 PCT/US2018/064242에 기재되어 있으며, 상기 문헌들은 각각 그 전문이 본원에 참조로서 인용된다. 예시적인 비양이온성 지질은 국제 출원 공개 WO2017/099823 및 미국 특허 공개 US2018/0028664에 기재되어 있으며, 상기 문헌의 내용은 모두 그 전문이 본원에 참조로서 인용된다.
비양이온성 지질은 지질 나노입자에 존재하는 총 지질의 0 내지 30%(몰)를 차지할 수 있다. 예를 들어, 비양이온성 지질 함량은 지질 나노입자에 존재하는 총 지질의 5% 내지 20%(몰) 또는 10% 내지 15%(몰)이다. 다양한 구현예에서, 이온화 가능한 지질 대 중성 지질의 몰비는 약 2:1 내지 약 8:1 범위이다.
일부 구현예에서, 지질 나노입자는 임의의 인지질을 포함하지 않는다. 일부 양태에서, 지질 나노입자는 막 온전성을 제공하기 위해 스테롤과 같은 구성요소를 추가로 포함할 수 있다.
지질 나노입자에 사용될 수 있는 하나의 예시적인 스테롤은 콜레스테롤 및 이의 유도체이다. 예시적인 콜레스테롤 유도체는 국제 특허 출원 공개 WO2009/127060 및 미국 특허 출원 공개 US2010/0130588에 기재되어 있으며, 상기 문헌들의 내용은 그 전문이 본원에 참조로 인용된다.
스테롤과 같은 막 온전성을 제공하는 구성요소는, 지질 나노입자에 존재하는 총 지질의 0 내지 50%(몰)를 차지할 수 있다. 일부 구현예에서, 이러한 구성요소는 지질 나노입자의 총 지질 함량의 20% 내지 50%(몰) 또는 30% 내지 40%(몰)이다.
일부 양태에서, 지질 나노입자는 폴리에틸렌 글리콜(PEG) 또는 접합된 지질 분자를 추가로 포함할 수 있다. 일반적으로, 이들은 지질 나노입자의 응집을 저해하고/하거나 입체 안정화를 제공하기 위해 사용된다. 예시적인 접합된 지질에는, 비제한적으로, PEG-지질 접합체, 폴리옥사졸린(POZ)-지질 접합체, 폴리아미드-지질 접합체(예컨대, ATTA-지질 접합체), 양이온성 중합체-지질(CPL) 접합체, 및 이들의 혼합물이 포함된다. 일부 구현예에서, 접합된 지질 분자는 PEG-지질 접합체, 예를 들어 (메톡시 폴리에틸렌 글리콜)-접합된 지질이다. 예시적인 PEG-지질 접합체에는, 비제한적으로, PEG-디아실글리세롤(DAG)(예컨대, 1-(모노메톡시-폴리에틸렌글리콜)-2,3-디미리스토일글리세롤(PEG-DMG)), PEG-디알킬옥시프로필(DAA), PEG-인지질, PEG-세라미드(Cer), peg화 포스파티딜에탄올아민(PEG-PE), PEG 숙시네이트 디아실글리세롤(PEGS-DAG)(예컨대, 4-O-(2',3'-디(테트라데카노일옥시)프로필-1-O-(w-메톡시(폴리에톡시)에틸) 부탄디오에이트(PEG-S-DMG)), PEG 디알콕시프로필카르밤, N-(카르보닐-메톡시폴리에틸렌 글리콜 2000)-1,2-디스테아로일-sn-글리세로-3-포스포에탄올아민 소듐 염, 또는 이들의 혼합물이 포함된다. 추가의 예시적인 PEG-지질 접합체는, 예를 들어 미국 특허 또는 특허 출원 공개 US5,885,613, US6,287,591, US2003/0077829, US2003/0077829, US2005/0175682, US2008/0020058, US2011/0117125, US2010/0130588, US2016/0376224 및 US2017/0119904에 기재되어 있으며, 모든 상기 문헌들의 내용은 그 전문이 본원에 참조로 인용된다.
일부 구현예에서, PEG-지질은 특허 출원 공개 US2018/0028664에 정의된 바와 같은 화합물이며, 상기 문헌의 내용은 그 전문이 본원에 참조로 인용된다. 일부 구현예에서, PEG-지질은 특허 출원 공개 US2015/0376115 또는 US2016/0376224에 개시되어 있으며, 상기 문헌들의 내용은 그 전문이 본원에 참조로서 인용된다.
PEG-DAA 접합체는, 예를 들어 PEG-디라우릴옥시프로필, PEG-디미리스틸옥시프로필, PEG-디팔미틸옥시프로필 또는 PEG-디스테아릴옥시프로필일 수 있다. PEG-지질은 PEG-DMG, PEG-디라우릴글리세롤, PEG-디팔미토일글리세롤, PEG-디스테릴글리세롤, PEG-디라우릴글리카미드, PEG-디미리스틸글리카미드, PEG-디팔미토일글리카미드, PEG-디스테릴글리카미드, PEG-콜레스테롤(1-[8'-(콜레스트-5-엔-3[베타]-옥시)카르복사미도-3',6'-디옥사옥타닐]카르바모일-[오메가]-메틸-폴리(에틸렌 글리콜), PEG-DMB(3,4-디테트라데콕실벤질-[오메가]-메틸-폴리(에틸렌 글리콜)에테르) 및 1,2-디미리스토일-sn-글리세로-3-포스포에탄올아민-N-[메톡시(폴리에틸렌 글리콜)-2000] 중 하나 이상일 수 있다. 일부 예에서, PEG-지질은 PEG-DMG, 1,2-디미리스토일-sn-글리세로-3-포스포에탄올아민-N-[메톡시(폴리에틸렌 글리콜)-2000]으로 이루어진 군으로부터 선택될 수 있다.
PEG 이외의 분자와 접합된 지질이 또한 PEG-지질 대신 사용될 수 있다. 예를 들어, 폴리옥사졸린(POZ)-지질 접합체, 폴리아미드-지질 접합체(예컨대, ATTA-지질 접합체) 및 양이온성 중합체-지질(CPL) 접합체가 PEG-지질 대신 또는 이에 더하여 사용될 수 있다. 예시적인 접합된 지질, 즉, PEG-지질, (POZ)-지질 접합체, ATTA-지질 접합체 및 양이온성 중합체-지질은, 국제 특허 출원 공개 WO1996/010392, WO1998/051278, WO2002/087541, WO2005/026372, WO2008/147438, WO2009/086558, WO2012/000104, WO2017/117528, WO2017/099823, WO2015/199952, WO2017/004143, WO2015/095346, WO2012/000104, WO2012/000104 및 WO2010/006282; 미국 특허 출원 공개 US2003/0077829, US2005/0175682, US2008/0020058, US2011/0117125, US2013/0303587, US2018/0028664, US2015/0376115, US2016/0376224, US2016/0317458, US2013/0303587, US2013/0303587 및 US20110123453; 및 US 특허 US5,885,613, US6,287,591, US6,320,017 및 US6,586,559에 기재되어 있으며, 상기 모든 문헌들의 내용은 그 전문이 본원에 참조로서 인용된다.
일부 구현예에서, 하나 이상의 추가 화합물은 치료제일 수 있다. 치료제는 치료 목적에 적합한 임의의 부류에서 선택될 수 있다. 다시 말해서, 치료제는 치료 목적에 적합한 임의의 부류에서 선택될 수 있다. 다시 말해서, 치료제는 치료 목적 및 목적하는 생물학적 작용에 따라 선택될 수 있다. 예를 들어, LNP 내 ceDNA가 PKU 치료에 유용한 경우, 추가 화합물은 항-PKU 작용제(예를 들어, 화학요법제 또는 다른 PKU 치료제(비제한적으로, 소분자 또는 항체를 포함함)일 수 있다. 또 다른 예에서, ceDNA를 함유하는 LNP이 감염의 치료에 유용한 경우, 추가 화합물은 항미생물제(예를 들어, 항생제 또는 항바이러스 화합물)일 수 있다. 또 다른 예에서, ceDNA를 함유하는 LNP이 면역 질환 또는 장애의 치료에 유용한 경우, 추가 화합물은 면역 반응을 조절하는 화합물(예를 들어, 면역억제제, 면역자극 화합물 또는 하나 이상의 특정 면역 경로를 조절하는 화합물)일 수 있다. 일부 구현예에서, 상이한 단백질 또는 상이한 화합물, 예컨대 치료제를 인코딩하는 ceDNA와 같은 상이한 화합물을 함유하는 상이한 지질 나노입자의 상이한 칵테일이, 본 개시내용의 조성물 및 방법에 사용될 수 있다.
일부 구현예에서, 추가 화합물은 면역 조절제이다. 예를 들어, 추가 화합물은 면역억제제이다. 일부 구현예에서, 추가 화합물은 면역자극제이다. 또한, 지질 나노입자 캡슐화된 곤충 세포에서 생산된 또는 합성적으로 생산된 본원에 기재된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터와, 약학적으로 허용 가능한 담체 또는 희석제를 포함하는 약학적 조성물이 본원에 제공된다.
일부 양태에서, 본 개시내용은 하나 이상의 약학적 부형제를 추가로 포함하는 지질 나노입자 제형을 제공한다. 일부 구현예에서, 지질 나노입자 제형은 수크로오스, 트리스, 트레할로오스 및/또는 글리신을 추가로 포함한다.
ceDNA 벡터는 입자의 지질 부분과 복합체화되거나, 지질 나노입자의 지질 위치에서 캡슐화될 수 있다. 일부 구현예에서, ceDNA는 지질 나노입자의 지질 위치에서 완전히 캡슐화되어, 예를 들어 수용액에서 뉴클레아제에 의한 분해로부터 보호될 수 있다. 일부 구현예에서, 지질 나노입자 내 ceDNA는 지질 나노입자를 37℃에서 적어도 약 20분, 30분, 45분 또는 60분 동안 뉴클레아제에 노출시킨 후 실질적으로 분해되지 않는다. 일부 구현예에서, 지질 나노입자 내 ceDNA는 상기 입자를 혈청에서 37℃에서 적어도 약 30분, 45분 또는 60분, 또는 적어도 약 2시간, 3시간, 4시간, 5시간, 6시간, 7시간, 8시간, 9시간, 10시간, 12시간, 14시간, 16시간, 18시간, 20시간, 22시간, 24시간, 26시간, 28시간, 30시간, 32시간, 34시간 또는 36시간 동안 인큐베이션한 후 실질적으로 분해되지 않는다.
특정 구현예에서, 지질 나노입자는 대상, 예를 들어 인간과 같은 포유류에 실질적으로 비독성이다. 일부 양태에서, 지질 나노입자 제형은 동결건조된 분말이다.
일부 구현예에서, 지질 나노입자는 적어도 하나의 지질 이중층을 보유하는 고체 코어 입자이다. 다른 구현예에서, 지질 나노입자는 비(non)이중층 구조, 즉, 비(non)라멜라(즉, 비이중층) 형태를 갖는다. 비제한적으로, 비이중층 형태는, 예를 들어 3차원 튜브, 막대, 입방 대칭 등을 포함할 수 있다. 예를 들어, 지질 나노입자의 형태(라멜라 대 비라멜라)는, 예를 들어 US2010/0130588에 기재된 바와 같은 Cryo-TEM 분석을 사용하여 용이하게 평가 및 특징분석될 수 있으며, 상기 문헌의 내용은 그 전문이 본원에 참조로서 인용된다.
일부 추가의 구현예에서, 비라멜라 형태를 갖는 지질 나노입자는 전자 밀도가 높다. 일부 양태에서, 본 개시내용은 단일라멜라 또는 다중라멜라 구조의 지질 나노입자를 제공한다. 일부 양태에서, 본 개시내용은 다소포성 입자 및/또는 발포체 기반 입자를 포함하는 지질 나노입자 제형을 제공한다.
지질 구성요소의 조성 및 농도를 제어하는 방식으로, 지질 접합체가 지질 입자로부터 교환되는 속도, 및 결국, 지질 나노입자가 융합원성이 되는 속도를 제어할 수 있다. 또한, 예를 들어 pH, 온도 또는 이온 강도를 포함하는 다른 변수를 사용하여, 지질 나노입자가 융합원성이 되는 속도를 변화시키고/시키거나 제어할 수 있다. 지질 나노입자가 융합원성이 되는 속도를 제어하는 데 사용될 수 있는 다른 방법이, 본 개시내용을 기반으로 당업자에게 명백할 것이다. 지질 접합체의 조성 및 농도를 제어하여 지질 입자 크기를 제어할 수 있다는 것이 또한 명백할 것이다.
제형화된 양이온성 지질의 pKa는 핵산의 전달을 위한 LNP의 효과와 상관관계가 있을 수 있다(문헌[Jayaraman et al, Angewandte Chemie, International Edition (2012), 51(34), 8529-8533]; 문헌[Semple et al, Nature Biotechnology 28, 172-176 (2010)] 참조, 상기 문헌들은 모두 그 전문이 본원에 참조로서 인용됨). pKa의 바람직한 범위는 약 5 내지 약 7이다. 양이온성 지질의 pKa는 2-(p-톨루이디노)-6-나프탈렌 설폰산(TNS)의 형광을 기반으로 하는 검정을 사용하여 지질 나노입자에서 결정될 수 있다.
VIII.
사용 방법
본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 또한 관심 핵산 서열(예를 들어, PAH 단백질을 인코딩함)을 표적세포(예를 들어, 숙주 세포)로 전달하는 방법에 사용될 수 있다. 상기 방법은 특히 PAH 단백질을 이를 필요로 하는 대상의 세포에 전달하여 PKU를 치료하는 방법일 수 있다. 본 개시내용은 PAH 단백질 발현의 치료 효과가 발생하도록, 대상의 세포에서 ceDNA 벡터에 인코딩된 PAH 단백질의 생체내 발현을 가능하게 한다. 이러한 결과는 ceDNA 벡터 전달의 생체내 및 시험관내 모델 모두에서 확인되었다.
또한, 본 개시내용은 PAH 단백질을 이를 필요로 하는 대상의 세포에 전달하는 방법으로서, 상기 PAH 단백질을 인코딩하는 본 개시내용의 ceDNA 벡터의 다회 투여를 포함하는 방법을 제공한다. 본 개시내용의 ceDNA 벡터는 캡시드화된 바이러스 벡터에 대해 통상적으로 관찰되는 바와 같은 면역반응을 유도하지 않기 때문에, 이러한 다회 투여 전략은 ceDNA 기반 시스템에서 큰 성공을 거둘 가능성이 높다. ceDNA 벡터는 목적하는 조직의 세포를 트랜스펙션시키고, 과도한 부작용 없이 충분한 수준의 유전자 전달 및 PAH 단백질의 발현을 제공하는 데 충분한 양으로 투여된다. 전형적인 및 약학적으로 허용 가능한 투여 경로에는, 비제한적으로, 망막 투여(예를 들어, 망막하 주사, 맥락막상 주사 또는 유리체내 주사), 정맥내(예를 들어, 리포좀 제형), 선택된 기관(예를 들어, 간, 신장, 담낭, 전립선, 부신, 심장, 장, 폐 및 위에서 선택되는 임의의 하나 이상의 조직)으로의 직접 전달, 근육내 및 다른 비경구 투여 경로가 포함된다. 투여 경로는, 목적하는 경우, 조합될 수 있다.
본원에 기재된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터의 전달은 발현된 PAH 단백질의 전달에 제한되지 않는다. 예를 들어, 본원에 기재된 바와 같이 통상적으로 생산된(예를 들어, 세포 기반 생산 방법(예를 들어, 곤충세포 생산 방법)을 사용하여) 또는 합성적으로 생산된 ceDNA 벡터는, 유전자 치료의 일부를 제공하기 위해 제공된 다른 전달 시스템과 함께 사용될 수 있다. 본 개시내용에 따른 ceDNA 벡터와 조합될 수 있는 시스템의 하나의 비제한적인 예에는, PAH 단백질을 발현하는 ceDNA 벡터의 효과적인 유전자 발현을 위한 하나 이상의 보조인자 또는 면역억제제를 별도로 전달하는 시스템이 포함된다.
본 개시내용은 또한 대상에서 PKU를 치료하는 방법으로서, 선택적으로 약학적으로 허용 가능한 담체를 포함하는 치료적 유효량의 ceDNA 벡터를, 대상의 이를 필요로 하는 표적세포(특히, 근육 세포 또는 조직)에 도입하는 단계를 포함하는 방법을 제공한다. ceDNA 벡터는 담체의 존재 하에서 도입될 수 있지만, 이러한 담체는 필요하지 않다. 선택된 ceDNA 벡터는 PKU의 치료에 유용한 PAH 단백질을 인코딩하는 핵산 서열을 포함한다. 특히, ceDNA 벡터는, 대상에게 도입될 때, 외인성 DNA 서열에 의해 인코딩된 목적하는 PAH 단백질의 전사를 지시할 수 있는 제어 요소에 작동 가능하게 연결된 목적하는 PAH 단백질 서열을 포함할 수 있다. ceDNA 벡터는 상기 및 본원의 다른 곳에 제공된 임의의 적합한 경로를 통해 투여될 수 있다.
본원에 제공된 조성물 및 벡터는 다양한 목적을 위해 PAH 단백질을 전달하는 데 사용될 수 있다. 일부 구현예에서, 전이유전자는, 예를 들어 PAH 단백질 산물의 기능을 연구하기 위해, 예를 들어 전이유전자를 보유하는 체세포 유전자도입 동물 모델을 생성하기 위해, 연구 목적으로 사용되는 PAH 단백질을 인코딩한다. 또 다른 예에서, 전이유전자는 PKU의 동물 모델을 생성하는 데 사용되는 PAH 단백질을 인코딩한다. 일부 구현예에서, 인코딩된 PAH 단백질은 포유류 대상에서 PKU 상태의 치료 또는 예방에 유용하다. PAH 단백질은 유전자의 발현 감소, 발현 결여 또는 기능장애와 연관된 PKU를 치료하는 데 충분한 양으로 환자에게 전달(예를 들어, 환자에서 발현)될 수 있다.
원칙적으로, 발현 카세트는 돌연변이로 인해 존재하지 않거나 감소된 PAH 단백질을 인코딩하거나, 과발현될 때 치료적 유익을 전달하는 것이 본 개시내용의 범위에 속하는 것으로 간주되는 핵산 또는 임의의 전이유전자를 포함할 수 있다. 바람직하게는, 삽입되지 않은 박테리아 DNA는 존재하지 않으며, 바람직하게는 본원에 제공된 ceDNA 조성물에는 박테리아 DNA가 존재하지 않는다.
ceDNA 벡터는 한 종의 ceDNA 벡터에 제한되지 않는다. 이와 같이, 또 다른 양태에서, 상이한 단백질 또는 동일한 PAH 단백질을 발현하지만, 상이한 프로모터 또는 시스-조절 요소에 작동적으로 연결된 다수의 ceDNA 벡터는, 표적 세포, 조직, 기관 또는 대상에게 동시에 또는 순차적으로 전달될 수 있다. 따라서, 이러한 전략은 동시에 다수의 단백질의 유전자 치료 또는 유전자 전달을 가능하게 할 수 있다. PAH 단백질의 상이한 부분을, 동시에 또는 상이한 시간에 투여될 수 있으며 별도로 조절될 수 있는 별개의 ceDNA 벡터(예를 들어, PAH 단백질의 기능에 필요한 상이한 도메인 및/또는 보조인자)로 분리하는 것이 가능할 수 있으며, 이를 통해 PAH 단백질의 발현 제어에 추가적인 수준을 부가할 수 있다. 바이러스 캡시드의 부재로 인한 항캡시드 숙주 면역 반응의 결여를 고려할 때, 전달은 또한 중요하게는, 임상 설정에서 유전자 치료를 위해, 후속으로 용량을 증가시키거나 감소시키면서 다회 수행될 수 있다. 캡시드가 존재하지 않기 때문에 항-캡시드 반응이 일어나지 않을 것으로 예상된다.
본 개시내용은 또한 대상에서 PKU를 치료하는 방법으로서, 선택적으로 약학적으로 허용 가능한 담체를 포함하는 치료적 유효량의 본원에 개시된 바와 같은 ceDNA 벡터를, 대상의 이를 필요로 하는 표적세포(특히, 근육 세포 또는 조직)에 도입하는 단계를 포함하는 방법을 제공한다. ceDNA 벡터는 담체의 존재 하에서 도입될 수 있지만, 이러한 담체는 필요하지 않다. 구현된 ceDNA 벡터는 PKU를 치료하는 데 유용한 관심 핵산 서열을 포함한다. 특히, ceDNA 벡터는, 대상에게 도입될 때 외인성 DNA 서열에 의해 인코딩된 목적하는 폴리펩타이드, 단백질 또는 올리고뉴클레오타이드의 전사를 지시할 수 있는 제어 요소에 작동 가능하게 연결된 목적하는 외인성 DNA 서열을 포함할 수 있다. ceDNA 벡터는 상기 및 본원의 다른 곳에 제공된 임의의 적합한 경로를 통해 투여될 수 있다.
IX. PAH 단백질 생산을 위한 ceDNA 벡터의 전달 방법
일부 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터는 다양한 적합한 방법에 의해 시험관내 또는 생체내 표적세포에 전달될 수 있다. ceDNA 벡터만 적용되거나 주사될 수 있다. ceDNA 벡터는 트랜스펙션 시약 또는 다른 물리적 수단의 도움 없이 세포에 전달될 수 있다. 대안적으로, PAH 단백질의 발현을 위한 ceDNA 벡터는 DNA의 세포에의 진입을 용이하게 하는 임의의 업계 공지의 트랜스펙션 시약 또는 다른 업계 공지의 물리적 수단, 예를 들어 리포좀, 알코올, 폴리리신 풍부 화합물, 아르기닌 풍부 화합물, 인산칼슘, 미세소포, 미세주사, 전기천공 등을 사용하여 전달될 수 있다.
본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는, 통상적으로 다양한 전달 시약을 사용하여 통상적인 AAV 비리온으로 형질도입하기 곤란한 세포 및 조직 유형을 효율적으로 표적화할 수 있다.
본원에 기재된 기술의 하나의 양태는, PAH 단백질을 세포에 전달하는 방법에 관한 것이다. 전형적으로, 생체내 및 시험관내 방법의 경우, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 본원에 개시된 바와 같은 방법뿐 아니라, 당업계에 알려진 다른 방법을 사용하여 세포에 도입될 수 있다. 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 바람직하게는 생물학적 유효량으로 세포에 투여된다. ceDNA 벡터가 생체내 세포(예를 들어, 대상)에 투여되는 경우, ceDNA 벡터의 생물학적 유효량은 표적세포에서 PAH 단백질의 형질도입 및 발현을 유도하는 데 충분한 양이다.
본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터의 예시적인 투여 방식에는, 경구, 직장, 경점막, 비강내, 흡입(예를 들어, 에어로졸을 통해), 협측(예를 들어, 설하), 질, 경막내, 안구내, 경피, 내피내, 자궁내(또는 알내(in ovo)), 비경구(예를 들어, 정맥내, 피하, 피내, 두개내, 근육내[골격근, 횡격막근 및/또는 심장근에의 투여 포함], 흉막내, 뇌내 및 관절내)가 포함된다. 투여는 전신적으로 이루어지거나, 간 또는 다른 곳(예를 들어, 임의의 신장, 담낭, 전립선, 부신, 심장, 장, 폐 및 위)으로 직접 전달될 수 있다.
투여는 국소(예를 들어, 기도 표면을 포함한 피부 및 점막 표면, 및 경피 투여), 림프내 등뿐 아니라, 직접적인 조직 또는 기관 주사(예를 들어, 비제한적으로, 간뿐 아니라, 눈, 골격근, 심장근, 횡격막근을 포함하는 근육, 또는 뇌)로 이루어질 수 있다.
ceDNA 벡터의 투여는, 비제한적으로, 간 및/또는 또한 눈, 뇌, 골격근, 평활근, 심장, 횡격막, 기도 상피, 신장, 비장, 췌장, 피부로 이루어지는 군에서 선택되는 부위를 포함하는 대상의 임의의 부위에 이루어질 수 있다.
임의의 소정의 경우에서 가장 적합한 경로는 치료, 개선 및/또는 예방하고자 하는 병태의 특성 및 중증도에 따라, 및 사용되는 특정 ceDNA 벡터의 특성에 따라 달라질 것이다. 또한, ceDNA는 하나 초과의 PAH 단백질을 단일 벡터 또는 다수의 ceDNA 벡터(예를 들어, ceDNA 칵테일)로 투여하는 것을 가능하게 한다.
A. ceDNA 벡터의 근육내 투여
일부 구현예에서, 대상에서 질환을 치료하는 방법은, 치료적 유효량의 PAH 단백질을 인코딩하는 ceDNA 벡터를 선택적으로 약학적으로 허용 가능한 담체와 함께, 대상의 이를 필요로 하는 표적세포(특히, 근육 세포 또는 조직)에 도입하는 것을 포함한다. 일부 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터는 대상의 근육 조직에 투여된다.
일부 구현예에서, ceDNA 벡터의 투여는, 비제한적으로, 골격근, 평활근, 심장, 횡격막 또는 눈의 근육으로 이루어지는 군에서 선택되는 부위를 포함하는 대상의 임의의 부위에 이루어질 수 있다.
본 개시내용에 따른 골격근에의 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터의 투여는, 비제한적으로, 사지(예를 들어, 상완(upper arm), 하완(lower arm), 상각(upper leg) 및/또는 하각(lower leg)), 등, 목, 머리(예를 들어, 혀), 흉곽, 복부, 골반/회음 및/또는 손(발)가락의 골격근에의 투여를 포함한다. 본원에 개시된 바와 같은 ceDNA 벡터는 정맥내 투여, 동맥내 투여, 복강내 투여, 사지 관류(선택적으로, 다리 및/또는 팔의 격리된 사지 관류; 예를 들어[Arruda et al., (2005) Blood 105: 3458-3464] 참조), 및/또는 직접 근육내 주사에 의해 골격근에 전달될 수 있다. 특정 구현예에서, 본원에 개시된 바와 같은 ceDNA 벡터는 사지 관류, 선택적으로 격리된 사지 관류에 의해(예를 들어, 정맥내 또는 관절내 투여에 의해), 대상(예를 들어, DMD와 같은 근디스트로피를 앓고 있는 대상)의 간, 눈, 사지(팔 및/또는 다리)에 투여된다. 구현예에서, 본원에 개시된 바와 같은 ceDNA 벡터는 "유체역학적" 기술을 이용하지 않고 투여될 수 있다.
예를 들어, 통상적인 바이러스 벡터의 (예를 들어, 망막으로의) 조직 전달은 종종 혈관구조의 압력을 증가시키고, 내피세포 장벽을 가로지르는 바이러스 벡터의 능력을 촉진시키는 유체역학적 기술(예를 들어, 대량의 정맥내/정맥내 투여)에 의해 증강된다. 특정 구현예에서, 본원에 기재된 ceDNA 벡터는 고용량 주입 및/또는 상승된 혈관내압(예를 들어, 정상 수축기압 초과, 예를 들어 정상 수축기압보다 혈관내압의 5%, 10%, 15%, 20%, 25% 이하의 증가)과 같은 유체역학적 기술의 부재 하에서 투여될 수 있다. 이러한 방법은 부종, 신경 손상 및/또는 구획 증후군과 같은 유체역학적 기술과 관련된 부작용을 감소시키거나 회피할 수 있다.
나아가, 골격근에 투여되는 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터를 포함하는 조성물은, 사지(예를 들어, 상완, 하완, 상각 및/또는 하각), 등, 목, 머리(예를 들어, 혀), 흉곽, 복부, 골반/회음 및/또는 손(발)가락의 골격근에 투여될 수 있다. 적합한 골격근에는, 비제한적으로, 새끼벌림근(손), 새끼벌림근(발), 엄지벌림근, 새끼중족골벌림근(abductor ossis metatarsi quinti), 짧은엄지벌림근, 긴엄지벌림근, 짧은모음근, 엄지모음근(adductor hallucis), 긴모음근, 큰모음근, 엄지모음근(adductor pollicis), 팔꿈치근, 목갈비근, 무릎관절근, 위팔두갈래근, 넙다리두갈래근, 상완근, 상완요골근, 협근, 부리위팔근, 눈썹주름근, 삼각근, 입꼬리내림근, 아래입술내림근, 이복근, 배측골간근(손), 배측골간근(발), 짧은노쪽손목폄근, 긴노쪽손목폄근, 자쪽손목폄근, 새끼폄근, 손가락폄근, 짧은발가락폄근, 긴발가락폄근, 짧은엄지폄근(extensor hallucis brevis), 긴엄지폄근(extensor hallucis longus), 집게폄근, 짧은엄지폄근(extensor pollicis brevis), 긴엄지폄근(extensor pollicis longus), 노쪽손목굽힘근, 자쪽손목굽힘근, 짧은새끼굽힘근(손), 짧은새끼굽힘근(발), 짧은발가락굽힘근, 긴발가락굽힘근, 깊은손가락굽힘근, 얕은손가락굽힘근, 짧은엄지굽힘근(flexor hallucis brevis), 긴엄지굽힘근(flexor hallucis longus), 짧은엄지굽힘근(flexor pollicis brevis), 긴엄지굽힘근(flexor pollicis longus), 전두근, 장딴지근, 턱끝목뿔근, 큰볼기근, 중간볼기근, 작은볼기근, 두덩정강근, 엉덩갈비근, 허리엉덩갈비근, 등엉덩갈비근, 엉덩근, 아래쌍동이근, 하사근, 하직근, 가시아래근, 가시사이근, 가시돌기사이근, 가쪽날개근, 가쪽곧은근, 넓은등근, 입꼬리올림근, 위입술올림근, 위입술콧방울올림근, 눈꺼풀올림근, 어깨올림근, 긴회전근, 머리가장긴근, 목가장긴근, 등가장긴근, 긴머리근, 긴목근, 충양근(손), 충양근(손), 깨물근, 안쪽날개근, 안쪽곧은근, 중사각근, 뭇갈래근, 턱목뿔근, 아래머리빗근, 위머리빗근, 바깥폐쇄근, 속폐쇄근, 후두근, 어깨목뿔근, 새끼맞섬근, 엄지맞섬근, 눈둘레근, 입둘레근, 배측골간근, 짧은손바닥근, 긴손바닥근, 두덩근, 큰가슴근, 작은가슴근, 짧은종아리근, 긴종아리근, 셋째종아리근, 궁둥구멍근, 척측골간근, 장딴지빗근, 넓은목근, 오금근, 뒤경추늑골근, 네모엎침근, 원엎침근, 큰허리근, 넙다리네모근, 발바닥네모근, 앞머리곧은근, 가쪽머리곧은근, 큰뒤머리곧은근, 작은뒤머리곧은근, 넙다리곧은근, 큰마름근, 작은마름근, 입꼬리당김근, 넙다리빗근, 최소목갈비근, 반막모양근, 반가시근, 목반가시근, 등반가시근, 반힘줄모양근, 앞톱니근, 짧은회전근, 가자미근, 머리가시근, 목가시근, 등가시근, 머리널판근, 목널판근, 흉쇄유돌근, 복장목뿔근, 복장방패근, 붓목뿔근, 빗장밑근, 어깨밑근, 위쌍동이근, 상사근, 상직근, 손뒤침근, 가시위근, 관자근, 넙다리근막긴장근, 큰원근, 작은원근, 흉부근, 갑상선골근, 앞정강근, 뒤정강근, 승모근, 위팔세갈래근, 중간넓은근, 가쪽넓은근, 안쪽넓은근, 큰광대근 및 작은광대근, 및 당업계에 알려진 임의의 다른 적합한 골격근이 포함된다.
횡격막근에의 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터의 투여는, 정맥내 투여, 동맥내 투여 및/또는 복강내 투여를 포함하는 임의의 적합한 방법에 의해 이루어질 수 있다. 일부 구현예에서, ceDNA 벡터로부터 발현된 전이유전자의 표적조직으로의 전달은 또한 ceDNA 벡터를 포함하는 합성 데포를 전달하는 방식(여기서 ceDNA 벡터를 포함하는 데포가 골격근, 평활근, 심장근 및/또는 횡격막근 조직에 이식됨)으로 달성될 수 있거나, 또는 근육조직을 본원에 기재된 바와 같은 ceDNA 벡터를 포함하는 필름 또는 다른 매트릭스와 접촉시킬 수 있다. 이러한 이식 가능한 매트릭스 또는 기재는 미국 특허 제7,201,898호(이는 그 전문이 본원에 참조로서 인용됨)에 기재되어 있다.
심장근에의 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터의 투여는, 좌심방, 우심방, 좌심실, 우심실 및/또는 격막에의 투여를 포함한다. 본원에 기재된 바와 같은 ceDNA 벡터는 정맥내 투여, 대동맥내 투여와 같은 동맥내 투여, 직접 심장 주사(예를 들어, 좌심방, 우심방, 좌심실, 우심실에) 및/또는 관상동맥 관류에 의해 심장근에 전달될 수 있다.
평활근에의 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터의 투여는, 정맥내 투여, 동맥내 투여 및/또는 복강내 투여를 포함하는 임의의 적합한 방법에 의해 이루어질 수 있다. 하나의 구현예에서, 투여는 평활근에, 근처에 및/또는 위에 존재하는 내피세포에 이루어질 수 있다. 평활근의 비제한적인 예에는, 눈의 홍채, 폐의 세기관지, 후두근(성대), 위의 근육층, 식도, 위장관의 소장 및 대장, 요관, 요도의 배뇨근, 자궁근층, 음경 또는 전립선이 포함된다.
일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 골격근, 횡격막근 및/또는 심장근에 투여된다. 대표적인 구현예에서, 본 개시내용에 따른 ceDNA 벡터는 골격근, 심장근 및/또는 횡격막근의 장애를 치료 및/또는 예방하는 데 사용된다.
구체적으로, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터를 포함하는 조성물은, 눈근육(예를 들어, 외직근, 내직근, 상직근, 하직근, 상사근, 하사근), 얼굴근육(예를 들어, 뒤통수이마근, 관자마루근, 눈살근, 코근, 비중격내림근, 눈둘레근, 눈썹주름근, 눈썹내림근, 귓바퀴근, 입둘레근, 입꼬리내림근, 입꼬리당김근, 큰광대근, 작은광대근, 위입술올림근, 위입술콧방울올림근, 아래입술내림근, 입꼬리올림근, 협근, 턱끝근) 또는 혀근육(예를 들어, 이설근, 설골설근, 연골설근, 경상설근, 구개설근, 상종설근, 하종설근, 설수직근 및 설횡근) 중 하나 이상의 근육에 전달될 수 있다고 고려된다.
(i) 근육내 주사:
일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터를 포함하는 조성물은, 바늘을 사용하여 대상의 소정의 근육, 예를 들어 골격근(예를 들어, 삼각근, 가쪽넓은근, 둔부의 복면근, 둔부의 배면근 또는 유아의 앞가쪽 허벅지)의 하나 이상의 부위에 주사될 수 있다. ceDNA를 포함하는 조성물은 다른 근육세포 아형에 도입될 수 있다. 근육세포 아형의 비제한적인 예에는, 골격근세포, 심장근세포, 평활근세포 및/또는 횡격막근세포가 포함된다.
근육내 주사 방법은 당업자에게 알려져 있기 때문에 본원에 상세하게 기재되어 있지 않다.
일부 구현예에서, 근육내 주사는 ceDNA 벡터의 세포 흡수를 증강시키기 위해 전기천공, 전달 압력(delivery pressure) 또는 트랜스펙션 시약의 사용과 조합될 수 있다.
(ii) 트랜스펙션 시약
일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 근관 또는 근육조직으로의 벡터의 흡수를 촉진시키기 위해 하나 이상의 트랜스펙션 시약을 포함하는 조성물로 제형화된다. 따라서, 하나의 구현예에서, 본원에 기재된 핵산은 본원의 다른 곳에 기재된 방법을 사용한 트랜스펙션을 통해 근육세포, 근관 또는 근육조직에 투여된다.
(iii) 전기천공
특정 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 ceDNA의 세포로의 진입을 촉진시키는 담체의 부재 하에서, 또는 생리학적으로 불활성인 약학적으로 허용 가능한 담체(즉, 캡시드 미함유 비바이러스성 벡터의 근관으로의 흡수를 개선시키거나 증강시키지 않는 임의의 담체)의 존재 하에서 투여된다. 이러한 구현예에서, 캡시드 미함유 비바이러스성 벡터의 흡수는 세포 또는 조직의 전기천공에 의해 촉진될 수 있다.
세포막은 자연적으로 세포질로의 세포외 통과에 저항한다. 이러한 저항을 일시적으로 감소시키는 하나의 방법은, 전기장을 사용하여 세포에 영구적인 손상을 야기하지 않으면서 세포에 공극을 형성하는 "전기천공"이다. 이러한 공극은 DNA 벡터, 약학적 약물, DNA 및 다른 극성 화합물이 세포의 내부에 접근할 수 있을 만큼 충분히 크다. 시간이 경과함에 따라, 세포막의 공극이 닫혀, 세포는 다시 불투과성이 된다.
전기천공은, 예를 들어 외인성 DNA를 살아있는 세포에 도입하기 위한 시험관내 및 생체내 적용에 모두 사용될 수 있다. 시험관내 적용은 전형적으로 살아있는 세포의 샘플을, 예를 들어 DNA를 포함하는 조성물과 혼합한다. 이어서, 세포를 평행판과 같은 전극 사이에 배치하고, 세포/조성물 혼합물에 전기장을 인가한다.
다수의 생체내 전기천공 방법이 존재하며; 전극은, 예를 들어 처리하고자 하는 세포 영역 위에 놓인 표피를 잡는 캘리퍼와 같은 다양한 구성으로 제공될 수 있다. 대안적으로, 보다 깊은 곳에 위치한 세포에 접근하기 위해 바늘 모양 전극을 조직에 삽입할 수 있다. 어느 경우든, 예를 들어 핵산을 포함하는 조성물이 처리 영역에 주사되고, 전극이 해당 영역에 전기장을 인가한다. 일부 전기천공 적용에서, 이러한 전기장은 약 10 ms 내지 60 ms 지속기간 동안 100 V/cm 내지 500 V/cm 정도의 단일 구형파 펄스를 포함한다. 이러한 펄스는, 예를 들어 BTX Division of Genetronics, Inc에서 제조한 Electro Square Porator T820의 알려진 어플리케이션에서 생성될 수 있다.
전형적으로, 예를 들어 핵산의 성공적인 흡수는 근육이 즉시 전기적으로 자극되거나, 예를 들어 근육으로의 주사에 의해 조성물이 투여된 직후에만 일어난다.
특정 구현예에서, 전기천공은 전기장의 펄스를 사용하거나, 저전압/장펄스 치료 요법을 사용하여(예를 들어, 구형파 펄스 전기천공 시스템을 사용하여) 달성된다. 펄스 전기장을 생성할 수 있는 예시적인 펄스 생성기에는, 예를 들어 지수 파형을 생성할 수 있는 ECM600과 구형파 형태를 생성할 수 있는 ElectroSquarePorator(T820)(둘 모두 Genetronics, Inc(San Diego, Calif.)의 사업부인 BTX에서 입수 가능함)이 포함된다. 구형파 전기천공 시스템은 설정된 전압까지 빠르게 상승하고, 설정된 시간(펄스 길이) 동안 해당 수준을 유지한 후, 빠르게 0으로 떨어지는 제어된 전기 펄스를 전달한다.
일부 구현예에서, 본원에 기재된 바와 같은 캡시드 미함유 비바이러스성 벡터를 포함하는 조성물의 존재 하에서 조직의 전기천공과 관련이 있을 수 있는 통증을 감소시키기 위해, 예를 들어 국소 마취제가 치료 부위에 주사로 투여된다. 또한, 당업자는 근육의 섬유증, 괴사 또는 염증을 유발하는 과도한 조직 손상을 최소화 및/또는 방지하는 조성물의 용량을 선택해야 한다는 것을 이해할 것이다.
(iv) 전달 압력
일부 구현예에서, 근육 조직으로의 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터의 전달은, 대용량과 사지로 공급하는 동맥(예를 들어, 장골동맥)으로의 신속한 주사의 조합을 사용하는 전달 압력에 의해 촉진된다. 이러한 투여 방식은, 전형적으로 혈관 클램프의 지혈대를 사용하여 근육이 전신 순환으로부터 분리되는 동안, ceDNA 벡터를 포함하는 조성물을 사지 혈관계에 주입하는 것을 포함하는 다양한 방법을 통해 달성될 수 있다. 하나의 방법에서, 상기 조성물은 사지 혈관계를 통해 순환하여 세포로의 혈관외유출을 가능하게 한다. 또 다른 방법에서, 혈관내 유체역학적 압력을 증가시켜, 혈관층을 확장시키고, 근육 세포 또는 조직으로의 ceDNA 벡터의 흡수를 증가시킨다. 하나의 구현예에서, ceDNA 조성물은 동맥 내로 투여된다.
(v) 지질 나노입자 조성물
일부 구현예에서, 근육내 전달을 위한 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는, 본원의 다른 곳에 기재된 바와 같은 리포좀을 포함하는 조성물로 제형화된다.
(vi) 근육 조직을 표적으로 하는 ceDNA 벡터의 전신 투여
일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 간접 전달 투여를 통해 근육을 표적화하도록 제형화되며, 여기서 ceDNA는 간이 아니라 근육으로 수송된다. 따라서, 본원에 기재된 기술은, 예를 들어 전신 투여에 의한, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터를 포함하는 조성물의 근육 조직으로의 간접 투여를 포함한다. 이러한 조성물은 국소적으로, 정맥내로(볼루스 또는 연속 주입으로), 세포내 주사로, 조직내 주사로, 경구로, 흡입으로, 복강내로, 피하로, 공동내로 투여될 수 있으며, 목적하는 경우, 연동 수단을 통해, 또는 당업자에게 알려진 다른 수단을 통해 전달될 수 있다. 작용제는, 목적하는 경우, 예를 들어 정맥내 주입에 의해 전신으로 투여될 수 있다.
일부 구현예에서, 근육 세포/조직으로의 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터의 흡수는, 벡터를 근육 조직으로 우선적으로 지시하는 표적화 작용제 또는 모이어티를 사용하여 증가된다. 따라서, 일부 구현예에서, 캡시드 미함유 ceDNA 벡터는 신체의 다른 세포 또는 조직에 존재하는 캡시드 미함유 ceDNA 벡터의 양과 비교하여 근육 조직에 농축될 수 있다.
일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터를 포함하는 조성물은 근육 세포에 대한 표적화 모이어티를 추가로 포함한다. 다른 구현예에서, 발현된 유전자 산물은 작용하고자 의도된 조직에 특이적인 표적화 모이어티를 포함한다. 표적화 모이어티는 세포 또는 조직의 세포내, 세포 표면 또는 세포외 바이오마커를 표적화하고, 이와 상호작용하고, 이와 커플링하고/하거나 이와 결합할 수 있는 임의의 분자 또는 분자의 복합체를 포함할 수 있다. 바이오마커는, 예를 들어 세포 프로테아제, 키나아제, 단백질, 세포 표면 수용체, 지질 및/또는 지방산을 포함할 수 있다. 표적화 모이어티가 표적화, 상호작용, 커플링 및/또는 결합할 수 있는 바이오마커의 다른 예에는, 특정 질환과 관련된 분자가 포함된다. 예를 들어, 바이오마커는 표피 성장 인자 수용체 및 트랜스페린 수용체와 같은 암 발달과 관련이 있는 세포 표면 수용체를 포함할 수 있다. 표적화 모이어티는, 비제한적으로, 표적 근육 조직에서 발현되는 분자에 결합하는, 합성 화합물, 천연 화합물 또는 산물, 거대분자 엔티티, 생명공학적으로 조작된 분자(예를 들어, 폴리펩타이드, 지질, 폴리뉴클레오타이드, 항체, 항체 단편) 및 작은 엔티티(예를 들어, 소분자, 신경전달물질, 기질, 리간드, 호르몬 및 원소 화합물)를 포함할 수 있다.
특정 구현예에서, 표적화 모이어티는, 예를 들어 표적세포의 특정 목적하는 분자를 자연적으로 인식하는 수용체를 포함하는 수용체 분자를 추가로 포함할 수 있다. 이러한 수용체 모이어티에는, 표적 분자와의 상호작용 특이성을 증가시키도록 변형된 수용체, 해당 수용체에 의해 자연적으로 인식되지 않는 목적하는 표적 분자와 상호작용하도록 변형된 수용체, 및 이러한 수용체의 단편이 포함된다(예를 들어, 문헌[Skerra, 2000, J. Molecular Recognition, 13:167-187] 참조). 바람직한 수용체는 케모카인 수용체이다. 예시적인 케모카인 수용체는, 예를 들어 문헌[Lapidot et al, 2002, Exp Hematol, 30:973-81] 및 문헌[Onuffer et al, 2002, Trends Pharmacol Sci, 23:459-67]에 기재되어 있다.
다른 구현예에서, 추가의 표적화 모이어티는, 예를 들어 트랜스페린(Tf) 리간드와 같은, 표적세포의 특정 목적하는 수용체를 자연적으로 인식하는 리간드를 포함하는 리간드 분자를 포함할 수 있다. 이러한 리간드 분자에는, 표적 수용체와의 상호작용 특이성을 증가시키도록 변형된 리간드, 해당 리간드에 의해 자연적으로 인식되지 않는 목적하는 수용체와 상호작용하도록 변형된 리간드, 및 이러한 리간드의 단편이 포함된다.
또 다른 구현예에서, 표적화 모이어티는 압타머를 포함할 수 있다. 압타머는 표적세포의 목적하는 분자 구조에 특이적으로 결합하도록 선택된 올리고뉴클레오타이드이다. 압타머는 전형적으로 파지 디스플레이의 친화성 선별과 유사한 친화성 선별 과정(시험관내 분자 진화로도 알려짐)의 산물이다. 이러한 과정은, 예를 들어 질환이 있는 면역원에 결합하는 고체 지지체를 사용한 후, 폴리머라아제 연쇄 반응(PCR)을 사용하여 면역원이 결합된 핵산을 증폭시키는 친화성 분리의 여러 차례 탠덤 반복을 수행하는 것을 포함한다. 따라서, 각 회차의 친화성 분리는 목적하는 면역원에 성공적으로 결합하는 분자의 핵산 집단을 풍부하게 한다. 이러한 방식으로, 핵산의 랜덤 풀은 표적 분자에 특이적으로 결합하는 압타머를 생성하도록 "교육"될 수 있다. 압타머는 전형적으로 RNA이지만, 비제한적으로, 펩타이드 핵산(PNA) 및 포스포로티오에이트 핵산과 같은 DNA 또는 이의 유사체 또는 유도체일 수 있다.
일부 구현예에서, 표적화 모이어티는, 예를 들어 캡시드 미함유 비바이러스성 벡터 또는 유전자 산물이 특정 조직을 표적화하도록 집속된 광선의 빔으로부터 방출되는 광분해성 리간드(즉, '케이징된(caged)' 리간드)를 포함할 수 있다.
상기 조성물이 대상의 하나 이상의 근육 내 여러 부위로 전달되는 것이 또한 고려된다. 즉, 주사는 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 적어도 15개, 적어도 20개, 적어도 25개, 적어도 30개, 적어도 35개, 적어도 40개, 적어도 45개, 적어도 50개, 적어도 55개, 적어도 60개, 적어도 65개, 적어도 70개, 적어도 75개, 적어도 80개, 적어도 85개, 적어도 90개, 적어도 95개, 적어도 100개의 주사 부위에 이루어질 수 있다. 이러한 부위는 단일 근육 영역에 퍼져 있을 수 있거나, 여러 근육에 분포되어 있을 수 있다.
B. 비근육 위치에의 PAH 단백질의 발현을 위한 ceDNA 벡터의 투여
또 다른 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터는 간에 투여된다. ceDNA 벡터는 또한 각막 및/또는 시신경과 같은 눈의 상이한 영역에 투여될 수 있다. ceDNA 벡터는 또한 척수, 뇌간(연수, 교뇌), 중뇌(시상하부, 시상, 시상상부, 뇌하수체, 흑색질, 송과체), 소뇌, 종뇌(선조체, 후두엽, 측두엽, 두정엽 및 전두엽을 포함하는 대뇌, 피질, 기저핵, 해마 및 편도체), 변연계, 신피질, 선조체, 대뇌 및 하구에 도입될 수 있다. ceDNA 벡터는 (예를 들어, 요추천자에 의해) 뇌척수액에 전달될 수 있다. PAH 단백질의 발현을 위한 ceDNA 벡터는 나아가 혈액-뇌 장벽이 교란된 상황(예를 들어, 뇌종양 또는 뇌경색)에서 CNS에 혈관내 투여될 수 있다.
일부 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터는, 비제한적으로, 경막내, 안구내, 뇌내, 심실내, 정맥내(예를 들어, 만니톨과 같은 당의 존재 하에서), 비강내, 이내, 안구내(예를 들어, 유리체내, 망막하, 전방) 및 안구주위(예를 들어, 테논낭하(sub-Tenon's region)) 전달뿐 아니라, 운동 뉴런으로의 역행 전달을 통한 근육내 전달을 포함하는, 당업계에 알려진 임의의 경로를 통해 눈의 목적하는 영역(들)에 투여될 수 있다.
일부 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터는 직접 주사(예를 들어, 정위주사)를 통해 액체 제형으로 CNS 내 목적하는 영역 또는 구획에 투여된다. 다른 구현예에서, ceDNA 벡터는 목적하는 영역에의 국소 적용 또는 에어로졸 제형의 비강내 투여를 통해 제공될 수 있다. 눈에의 투여는 액체 방울의 국소 적용을 통해 이루어질 수 있다. 추가의 대안으로서, ceDNA 벡터는 고체 서방형 제형으로 투여될 수 있다(예를 들어, 미국 특허 제7,201,898호 참조). 추가의 구현예에서, ceDNA 벡터는 운동 뉴런과 관련된 질환 및 장애(예를 들어, 근위축성 측삭경화증(ALS); 척수성근위축(SMA) 등)를 치료, 개선 및/또는 예방하기 위한 역행 수송에 사용될 수 있다. 예를 들어, ceDNA 벡터는 뉴런으로 이동할 수 있는 근육 조직에 전달될 수 있다.
C.
생체외
치료
일부 구현예에서, 대상에서 세포가 제거되고, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터가 그 안에 도입된 후, 세포가 다시 대상에 배치된다. 생체외 치료를 위해 대상에서 세포를 제거한 후, 다시 대상에게 도입하는 방법은 당업계에 알려져 있다(예를 들어, 미국 특허 제5,399,346호; 상기 문헌의 개시내용은 그 전문이 본원에 참조로서 인용됨). 대안적으로, ceDNA 벡터는 또 다른 대상의 세포, 배양된 세포 또는 임의의 다른 적합한 공급원의 세포에 도입되며, 세포는 이를 필요로 하는 대상에게 투여된다.
본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터로 형질도입된 세포는 바람직하게는 약학적 담체와 조합으로 "치료적 유효량"으로 대상에게 투여된다. 당업자는, 일부 유익이 대상에게 제공되는 한, 치료 효과가 완전하거나 치유적일 필요가 없다는 것을 이해할 것이다.
일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 시험관내, 생체외 또는 생체내 세포에서 생산되는 본원에 기재된 바와 같은 PAH 단백질(때때로 전이유전자 또는 이종 뉴클레오타이드 서열로 지칭됨)을 인코딩할 수 있다. 예를 들어, 본원에 논의된 바와 같은 치료 방법에서의 본원에 기재된 ceDNA 벡터의 사용과 대조적으로, 일부 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터는, 예를 들어 항체 및 융합 단백질의 생산을 위해 배양된 세포 및 이러한 세포로부터 단리된 발현된 PAH 단백질에 도입될 수 있다. 일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터를 포함하는 배양된 세포는, 예를 들어 항체 또는 융합 단백질의 소규모 또는 대규모 생물제조(biomanufacturing)를 위한 세포 공급원으로서 작용하여, 항체 또는 융합 단백질의 상업적 생산을 위해 사용될 수 있다. 대안적인 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 소규모 생산뿐 아니라 상업적 대규모 PAH 단백질 생산을 포함하는 항체 또는 융합 단백질의 생체내 생산을 위해, 숙주 비인간 대상의 세포에 도입된다.
본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 수의학적 및 의학적 적용 모두에 사용될 수 있다. 상기 기재된 바와 같은 생체외 유전자 전달 방법에 적합한 대상에는, 조류(예를 들어, 닭, 오리, 거위, 메추라기, 칠면조 및 꿩) 및 포유류(예를 들어, 인간, 소, 양, 염소, 말, 고양이, 개 및 토끼)가 모두 포함되며, 이 중 포유류가 바람직하다. 인간 대상이 가장 바람직하다. 인간 대상에는, 신생아, 유아, 청소년 및 성인이 포함된다.
D. 용량 범위
본원에 기재된 바와 같은 PAH 단백질을 인코딩하는 ceDNA 벡터를 포함하는 조성물의 유효량을 대상에게 투여하는 단계를 포함하는 치료 방법이 본원에 제공된다. 당업자가 이해하는 바와 같이, "유효량"이라는 용어는, PKU의 치료를 위한 "치료적 유효량"으로 PAH 단백질의 발현을 유도하는, 투여된 ceDNA 조성물의 양을 나타낸다.
생체내 및/또는 시험관내 검정은 선택적으로 사용을 위한 최적 투여량 범위를 확인하는 것을 돕기 위해 이용될 수 있다. 제형에 이용되는 정확한 용량은 또한 투여 경로, 및 병태의 중증도에 따라 달라질 것이며, 당업자의 판단 및 각 대상의 상황에 따라 결정되어야 한다. 유효 용량은, 예를 들어 시험관내 또는 동물 모델 시험 시스템에서 유도된 용량 반응 곡선에서 추론될 수 있다.
본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 목적하는 조직의 세포를 트랜스펙션시키고, 과도한 부작용 없이 충분한 수준의 유전자 전달 및 발현을 제공하는 데 충분한 양으로 투여된다. 통상적이고 약학적으로 허용 가능한 투여 경로에는, 비제한적으로, 선택된 기관에의 직접 전달(예를 들어, 간에의 문맥내 전달), 경구, 흡입(비강내 및 기관내 전달 포함), 안구내, 정맥내, 근육내, 피하, 피내, 종양내 및 다른 비경구 투여 경로와 같은 "투여" 섹션에 상기 기재된 것들이 포함된다. 투여 경로는, 목적하는 경우, 조합될 수 있다.
특정 "치료 효과"를 달성하는 데 필요한 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터의 양의 용량은, 비제한적으로, 핵산 투여 경로, 치료 효과를 달성하는 데 필요한 유전자 또는 RNA 발현 수준, 치료하고자 하는 특정 질환 또는 장애, 및 유전자(들), RNA 산물(들) 또는 생성되는 발현된 단백질(들)의 안정성을 포함하는 몇 가지 인자에 기반하여 달라질 것이다. 당업자는, 상기 언급된 인자뿐 아니라, 당업계에 널리 알려진 다른 인자를 기반으로, 특정 질환 또는 장애를 앓고 있는 환자를 치료하기 위한 ceDNA 벡터 용량 범위를 용이하게 결정할 수 있다.
투여 요법은 최적 치료 반응을 제공하도록 조정될 수 있다. 예를 들어, 올리고뉴클레오타이드는 반복적으로 투여될 수 있으며, 예를 들어 수회 용량이 매일 투여될 수 있거나, 용량이 치료 상황의 긴급성에 따라 지시된 바와 같이 비례적으로 감소될 수 있다. 당업자는 올리고뉴클레오타이드가 세포에 투여되는지 대상에 투여되는지에 관계없이, 대상 올리고뉴클레오타이드의 적절한 용량 및 투여 스케줄을 용이하게 결정할 수 있을 것이다.
"치료적 유효 용량"은 임상 시험을 통해 결정될 수 있는 비교적 넓은 범위에 속할 것이며, 특정 적용에 따라 달라질 것이다(신경세포는 매우 소량을 필요로 하지만, 전신 주사는 많은 양을 필요로 할 수 있음). 예를 들어, 인간 대상의 골격 또는 심장 근육에의 직접 생체내 주사의 경우, 치료적 유효 용량은 약 1 ㎍ 내지 100 g의 ceDNA 벡터 정도일 것이다. 엑소좀 또는 미세입자가 ceDNA 벡터를 전달하는 데 사용되는 경우, 치료적 유효 용량은 실험적으로 결정될 수 있지만, 1 ㎍ 내지 약 100 g의 벡터를 전달할 것으로 예측된다. 나아가, 치료적 유효 용량은 질환의 하나 이상의 증상의 감소를 유도하지만, 유의한 표적외 또는 유의한 부작용을 초래하지 않는, 대상에게 영향을 미치는 데 충분한 양의 전이유전자를 발현시키는 ceDNA 벡터의 양이다. 하나의 구현예에서, "치료적 유효 용량"은 PKU 바이오마커의 발현의 통계적으로 유의하고 측정 가능한 변화 또는 소정의 질환 증상의 감소를 생성하는 데 충분한 발현된 PAH 단백질의 양이다. 이러한 유효량은 소정의 ceDNA 벡터 조성물에 대한 임상 시험 및 동물 연구에서 측정될 수 있다.
약학적으로 허용 가능한 부형제와 담체 용액의 제형은, 다양한 치료 요법에서 본원에 기재된 특정 조성물을 사용하는 적합한 투여 및 치료 요법의 개발과 마찬가지로, 당업자에게 널리 알려져 있다.
시험관내 트랜스펙션의 경우, 세포(1x106개의 세포)에 전달되는 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터의 유효량은, 0.1 ㎍ 내지 100 ㎍, 바람직하게는 1 ㎍ 내지 20 ㎍, 더욱 바람직하게는 1 ㎍ 내지 15 ㎍ 또는 8 ㎍ 내지 10 ㎍ 정도의 ceDNA 벡터일 것이다. ceDNA 벡터가 클수록 더 높은 용량이 필요할 것이다. 엑소좀 또는 미세입자가 사용되는 경우, 효과적인 시험관내 용량은 실험적으로 결정될 수 있지만, 일반적으로 동일한 양의 ceDNA 벡터를 전달하도록 의도될 것이다.
PKU의 치료를 위해, 본원에 개시된 바와 같은 PAH 단백질을 발현시키는 ceDNA 벡터의 적절한 투여량은, 치료하고자 하는 질환의 특정 유형, PAH 단백질의 유형, PKU 질환의 중증도 및 경과, 이전 치료, 환자의 임상 이력 및 항체에 대한 반응, 및 주치의의 재량에 따라 달라질 것이다. PAH 단백질을 인코딩하는 ceDNA 벡터는 한 번에 또는 일련의 치료에 걸쳐 적합하게 투여된다. 비제한적으로, 다양한 시점에 걸친 단회 또는 다회 투여, 볼루스 투여, 및 펄스 주입을 포함하는 다양한 투약 스케쥴이 본원에서 고려된다.
질환의 유형 및 중증도에 따라, ceDNA 벡터는, 인코딩된 PAH 단백질이 약 0.3 mg/㎏ 내지 100 mg/㎏(예를 들어, 15 mg/㎏ 내지 100 mg/㎏, 또는 상기 범위 내 임의의 투여량)으로 발현되는 양으로, 1회 이상의 개별 투여 또는 연속 주입으로 투여된다. ceDNA 벡터의 하나의 전형적인 1일 투여량은, 상기 언급된 인자에 따라, 인코딩된 PAH 단백질을 약 15 mg/㎏ 내지 100 mg/㎏ 또는 그 이상의 범위로 발현시키는 데 충분한 양이다. ceDNA 벡터의 하나의 예시적인 용량은, 본원에 개시된 바와 같은 인코딩된 PAH 단백질을 약 10 mg/㎏ 내지 약 50 mg/㎏의 범위로 발현시키는 데 충분한 양이다. 따라서, 인코딩된 PAH 단백질을 약 0.5 mg/㎏, 1 mg/㎏, 1.5 mg/㎏, 2.0 mg/㎏, 3 mg/㎏, 4.0 mg/㎏, 5 mg/㎏, 10 mg/㎏, 15 mg/㎏, 20 mg/㎏, 25 mg/㎏, 30 mg/㎏, 35 mg/㎏, 40 mg/㎏, 50 mg/㎏, 60 mg/㎏, 70 mg/㎏, 80 mg/㎏, 90 mg/㎏ 또는 100 mg/㎏(또는 이들의 임의의 조합)으로 발현시키는 데 충분한 양으로의 ceDNA 벡터의 1회 이상의 용량이 환자에게 투여될 수 있다. 일부 구현예에서, ceDNA 벡터는 인코딩된 PAH 단백질을 50 mg 내지 2500 mg 범위의 총 용량으로 발현시키는 데 충분한 양이다. ceDNA 벡터의 예시적인 용량은, 인코딩된 PAH 단백질을 총 약 50 mg, 약 100 mg, 200 mg, 300 mg, 400 mg, 약 500 mg, 약 600 mg, 약 700 mg, 약 720 mg, 약 1000 mg, 약 1050 mg, 약 1100 mg, 약 1200 mg, 약 1300 mg, 약 1400 mg, 약 1500 mg, 약 1600 mg, 약 1700 mg, 약 1800 mg, 약 1900 mg, 약 2000 mg, 약 2050 mg, 약 2100 mg, 약 2200 mg, 약 2300 mg, 약 2400 mg 또는 약 2500 mg(또는 이들의 임의의 조합)으로 발현시키는 데 충분한 양이다. ceDNA 벡터로부터 PAH 단백질의 발현이 본원의 조절 스위치, 또는 대안적으로 대상에게 투여된 ceDNA 벡터의 다회 용량에 의해 조심스럽게 제어될 수 있기 때문에, ceDNA 벡터로부터 PAH 단백질의 발현은, 발현된 PAH 단백질의 용량이 간헐적으로, 예를 들어 ceDNA 벡터로부터 매주, 2주마다, 3주마다, 4주마다, 매월, 2개월마다, 3개월마다 또는 6개월마다 투여될 수 있는 방식으로 제어될 수 있다. 이러한 요법의 진행은 통상적인 기술 및 검정으로 모니터링될 수 있다.
특정 구현예에서, ceDNA 벡터는 인코딩된 PAH 단백질을 15 mg/㎏, 30 mg/㎏, 40 mg/㎏, 45 mg/㎏, 50 mg/㎏, 60 mg/㎏의 용량, 또는 고정 용량, 예를 들어 300 mg, 500 mg, 700 mg, 800 mg 또는 그 이상으로 발현시키는 데 충분한 양으로 투여된다. 일부 구현예에서, ceDNA 벡터로부터 PAH 단백질의 발현은, PAH 단백질이 일정 기간 동안 매일, 2일마다, 매주, 2주마다 또는 4주마다 발현되도록 제어된다. 일부 구현예에서, ceDNA 벡터로부터 PAH 단백질의 발현은, PAH 단백질이 일정 기간 동안 2주마다 또는 4주마다 발현되도록 제어된다. 특정 구현예에서, 일정 기간은 6개월, 1년, 18개월, 2년, 5년, 10년, 15년, 20년 또는 환자의 일생이다.
치료는 단회 투여 또는 다회 투여를 포함할 수 있다. 일부 구현예에서, 1회 초과의 용량이 대상에게 투여될 수 있으며; ceDNA 벡터는 바이러스 캡시드의 부재로 인해 항캡시드 숙주 면역 반응을 일으키지 않기 때문에, 사실 필요한 경우 다회 용량이 투여될 수 있다. 이와 같이, 당업자는 적절한 용량의 횟수를 용이하게 결정할 수 있다. 투여되는 용량의 횟수는, 예를 들어 1회 내지 100회, 바람직하게는 2회 내지 20회 용량 정도일 수 있다.
임의의 특정 이론에 구애됨 없이, 본 개시내용에 기재된 바와 같은 ceDNA 벡터의 투여에 의해 유발된 전형적인 항바이러스 면역 반응의 결여는(즉, 캡시드 구성요소의 부재)는, PAH 단백질의 발현을 위한 ceDNA 벡터가 숙주에 여러 차례 투여되는 것을 가능하게 한다. 일부 구현예에서, 핵산, 예를 들어 이종 핵산이 대상에게 전달되는 경우의 횟수는, 2회 내지 10회 범위(예를 들어, 2회, 3회, 4회, 5회, 6회, 7회, 8회, 9회 또는 10회)이다. 일부 구현예에서, ceDNA 벡터는 대상에게 10회 초과로 전달된다.
일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터의 용량은 대상에게 달력일(calendar day)(예를 들어, 24시간 기간)당 1회 이하로 투여된다. 일부 구현예에서, ceDNA 벡터의 용량은 대상에게 2달력일, 3달력일, 4달력일, 5달력일, 6달력일 또는 7달력일당 1회 이하로 투여된다. 일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터의 용량은 대상에게 달력주(calendar week)(예를 들어, 7달력일)당 1회 이하로 투여된다. 일부 구현예에서, ceDNA 벡터의 용량은 대상에게 2주에 1회(예를 들어, 2달력주 기간 중 1회) 이하로 투여된다. 일부 구현예에서, ceDNA 벡터의 용량은 대상에게 달력달(calendar month)당 1회(예를 들어, 30달력일 중 1회) 이하로 투여된다. 일부 구현예에서, ceDNA 벡터의 용량은 대상에게 6달력달당 1회 이하로 투여된다. 일부 구현예에서, ceDNA 벡터의 용량은 대상에게 달력년(예를 들어, 365일 또는 윤년의 경우 366일)당 1회 이하로 투여된다.
특정 구현예에서, 다양한 간격의 기간, 예를 들어 매일, 매주, 매월, 매년 등에 걸쳐 목적하는 수준의 유전자 발현을 달성하기 위해, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터의 1회 초과의 투여(예를 들어, 2회, 3회, 4회 또는 그 이상의 투여)가 이용될 수 있다.
일부 구현예에서, 본원에 개시된 바와 같은 ceDNA 벡터에 의해 인코딩된 치료용 PAH 단백질은, 이것이 대상에서 적어도 1시간, 적어도 2시간, 적어도 5시간, 적어도 10시간, 적어도 12시간, 적어도 18시간, 적어도 24시간, 적어도 36시간, 적어도 48시간, 적어도 72시간, 적어도 1주, 적어도 2주, 적어도 1개월, 적어도 2개월, 적어도 6개월, 적어도 12개월/1년, 적어도 2년, 적어도 5년, 적어도 10년, 적어도 15년, 적어도 20년, 적어도 30년, 적어도 40년, 적어도 50년 또는 그 이상 동안 대상에서 발현되도록, 조절 스위치, 유도성 또는 억제성 프로모터에 의해 제어될 수 있다. 하나의 구현예에서, 발현은 선결된 또는 목적하는 간격으로 본원에 기재된 ceDNA 벡터를 반복 투여하는 방식으로 달성될 수 있다. 대안적으로, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는, 질환의 실질적으로 영구적인 치료 또는 "치유"를 위해, PAH 단백질을 인코딩하는 하나 이상의 핵산 서열의 삽입을 가능하게 하는 유전자 편집 시스템의 구성요소(예를 들어, CRISPR/Cas, TALEN, 아연 핑거 엔도뉴클레아제 등)를 추가로 포함할 수 있다. 유전자 편집 구성요소를 포함하는 이러한 ceDNA 벡터는 국제 출원 PCT/US18/64242에 개시되어 있으며, PAH 단백질을 인코딩하는 핵산을 알부민 유전자 또는 CCR5 유전자를 포함하지 않는 세이프 하버 영역에 삽입하기 위해, 5' 및 3' 상동성 아암(예를 들어, 서열번호 151 내지 154, 또는 이와 적어도 40%, 50%, 60%, 70% 또는 80%의 상동성을 갖는 서열)을 포함할 수 있다. 예로서, PAH 단백질을 발현하는 ceDNA 벡터는, 2019년 3월 1일자 출원된 국제 특허 출원 PCT/US2019/020225(이는 그 전문이 본원에 참조로서 인용됨)에 개시되어 있는, PAH 전이유전자의 게놈 세이프 하버에의 삽입을 위한 적어도 하나의 게놈 세이프 하버(GSH) 특이적 상동성 아암을 포함할 수 있다.
치료 지속기간은 대상의 임상 진행과 치료에 대한 반응성에 따라 달라진다. 초기의 높은 치료 용량 후, 지속적이고 상대적으로 낮은 유지 용량이 고려된다.
E. 단위 투여 형태
일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터를 포함하는 약학적 조성물은 편리하게 단위 투여 형태로 존재할 수 있다. 단위 투여 형태는 전형적으로 약학적 조성물의 하나 이상의 특정 투여 경로에 맞게 조정될 수 있다. 일부 구현예에서, 단위 투여 형태는 눈에 직접 투여되는 점적액으로 조정된다. 일부 구현예에서, 단위 투여 형태는 흡입에 의한 투여에 맞게 조정된다. 일부 구현예에서, 단위 투여 형태는 기화기에 의한 투여에 맞게 조정된다. 일부 구현예에서, 단위 투여 형태는 분무기에 의한 투여에 맞게 조정된다. 일부 구현예에서, 단위 투여 형태는 에어로졸 생성기에 의한 투여에 맞게 조정된다. 일부 구현예에서, 단위 투여 형태는 경구 투여, 협측 투여 또는 설하 투여에 맞게 조정된다. 일부 구현예에서, 단위 투여 형태는 정맥내, 근육내 또는 피하 투여에 맞게 조정된다. 일부 구현예에서, 단위 투여 형태는 망막하 주사, 맥락막상 주사 또는 유리체내 주사에 맞게 조정된다.
일부 구현예에서, 단위 투여 형태는 경막내 또는 뇌실내 투여에 맞게 조정된다. 일부 구현예에서, 약학적 조성물은 국소 투여용으로 제형화된다. 단일 투여 형태를 생성하기 위해 담체 물질과 조합될 수 있는 활성 성분의 양은, 일반적으로 치료 효과를 생성하는 화합물의 양일 수 있다.
X.
치료 방법
본원에 기재된 기술은 또한 상기 개시된 PAH 단백질의 발현을 위한 ceDNA 벡터를 제조하는 방법뿐 아니라, 예를 들어 생체외, 현장외, 시험관내 및 생체내 적용, 방법론, 진단 절차 및/또는 유전자 치료 요법을 포함하는 다양한 방식으로 사용하는 방법을 나타낸다.
하나의 구현예에서, 본원에 개시된 바와 같은 ceDNA 벡터로부터 발현된 치료용 PAH 단백질은 질환의 치료에 기능성이 있다. 바람직한 구현예에서, 치료용 PAH 단백질은, 목적하지 않는 경우, 면역계 반응을 야기하지 않는다.
대상에서 PKU를 치료하는 방법으로서, 치료적 유효량의 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터를, 선택적으로 약학적으로 허용 가능한 담체와 함께, 대상의 이를 필요로 하는 표적세포(예를 들어, 근육 세포 또는 조직, 또는 다른 병든 세포 유형)에 도입하는 단계를 포함하는 방법이 본원에 제공된다. ceDNA 벡터는 담체의 존재 하에서 도입될 수 있지만, 이러한 담체는 필요하지 않다. 구현된 ceDNA 벡터는 질환을 치료하는 데 유용한 본원에 기재된 바와 같은 PAH 단백질을 인코딩하는 핵산 서열을 포함한다. 특히, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는, 대상에게 도입될 때, 외인성 DNA 서열에 의해 인코딩된 목적하는 PAH 단백질의 전사를 지시할 수 있는 제어 요소에 작동 가능하게 연결된 목적하는 PAH 단백질 DNA 서열을 포함할 수 있다. 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 상기 및 본원의 다른 곳에 제공된 임의의 적합한 경로를 통해 투여될 수 있다.
하나 이상의 본 개시내용의 ceDNA 벡터를, 하나 이상의 약학적으로 허용 가능한 완충제, 희석제 또는 부형제와 함께 포함하는, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터 조성물 및 제형이 본원에 개시된다. 이러한 조성물은 PKU의 하나 이상의 증상을 진단, 예방, 치료 또는 개선시키기 위한, 하나 이상의 진단용 또는 치료용 키트에 포함될 수 있다. 하나의 양태에서, 질환, 손상, 장애, 외상 또는 기능장애는 인간의 질환, 손상, 장애, 외상 또는 기능장애이다.
본원에 기재된 기술의 또 다른 양태는, 진단적 또는 치료적 유효량의 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터를 이를 필요로 하는 대상에게 제공하는 방법으로서, 본원에 개시된 바와 같은 ceDNA 벡터의 양을 이를 필요로 하는 대상의 세포, 조직 또는 기관에; ceDNA 벡터로부터 PAH 단백질의 발현을 가능하게 하는 데 효과적인 시간 동안 제공하여, 대상에게 ceDNA 벡터에 의해 발현되는 진단적 또는 치료적 유효량의 PAH 단백질을 제공하는 단계를 포함하는 방법을 제공한다. 추가의 양태에서, 대상은 인간이다.
본원에 기재된 기술의 또 다른 양태는, 대상에서 PKU, 장애, 기능장애, 손상, 비정상적인 병태 또는 외상의 적어도 하나 이상의 증상을 진단, 예방, 치료 또는 개선하는 방법을 제공한다. 전반적이고 일반적인 의미에서, 상기 방법은 적어도, 하나 이상의 상기 개시된 PAH 단백질 생산을 위한 ceDNA 벡터를, 이를 필요로 하는 대상에게, 대상에서 질환, 장애, 기능장애, 손상, 비정상적인 병태 또는 외상의 하나 이상의 증상을 진단, 예방, 치료 또는 개선하는 데 충분한 양으로 충분한 시간 동안 투여하는 단계를 적어도 포함한다. 이러한 구현예에서, 대상은 PAH 단백질의 효능, 또는 대안적으로, 대상 내 PAH 단백질 또는 PAH 단백질의 조직 위치(세포 및 세포하 위치 포함) 검출을 위해 평가될 수 있다. 이와 같이, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는, 예를 들어 암 또는 다른 적응증의 검출을 위한 생체내 진단 도구로서 사용될 수 있다. 추가의 양태에서, 대상은 인간이다.
또 다른 양태는, PKU 또는 질환 상태의 하나 이상의 증상을 치료하거나 감소시키는 도구로서의 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터의 용도이다. 결함이 있는 유전자가 알려진 다수의 유전 질환이 존재하며, 이는 전형적으로 2개의 부류로 분류된다: 일반적으로 열성 방식으로 유전되는 효소의 결핍 상태, 및 조절 또는 구조 단백질이 관여할 수 있으며, 전형적으로 우성 방식으로 유전되지만, 항상 우성 방식으로 유전되는 것은 아닌 불균형 상태. 불균형 질환 상태의 경우, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 모델 시스템에서 PKU 상태를 생성하기 위해 사용될 수 있으며, 이는 질환 상태에 대응하기 위한 노력으로 사용될 수 있다. 따라서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 유전 질환의 치료를 가능하게 한다. 본원에 사용된 PKU 상태는, 질환을 유발하거나 이를 더 중증으로 만드는 결핍 또는 불균형을 부분적으로 또는 전체적으로 개선하는 방식으로 치료된다.
A. 숙주세포
일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 PAH 단백질 전이유전자를 대상 숙주세포로 전달한다. 일부 구현예에서, 상기 세포는 광수용체 세포이다. 일부 구현예에서, 상기 세포는 RPE 세포이다. 일부 구현예에서, 대상 숙주세포는, 예를 들어 혈액세포, 줄기세포, 조혈세포, CD34+ 세포, 간세포, 암세포, 혈관세포, 근육세포, 췌장세포, 신경세포, 안구 또는 망막 세포, 상피 또는 내피 세포, 수지상세포, 섬유아세포를 포함하는 인간 숙주세포, 또는 비제한적으로, 간의(hepatic)(즉, 간) 세포, 폐세포, 심장세포, 췌장세포, 장세포, 횡격막세포, 신장의(renal)(즉, 신장) 세포, 신경세포, 혈액세포, 골수세포, 또는 유전자 치료가 고려되는 대상의 임의의 하나 이상의 선택된 조직세포를 포함하는 포유류 기원의 임의의 다른 세포이다. 하나의 양태에서, 대상 숙주세포는 인간 숙주세포이다.
본 개시내용은 또한 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터를 포함하는, 상기 언급된 바와 같은 재조합 숙주세포에 관한 것이다. 따라서, 당업자에게 자명한 바와 같이 목적에 따라 다양한 숙주세포를 사용할 수 있다. 공여체 서열을 포함하는 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 작제물 또는 ceDNA 벡터는, 공여체 서열이 이전에 기재된 바와 같이 염색체 통합체로 유지되도록 숙주세포에 도입된다. 숙주세포라는 용어는, 복제 동안 발생하는 돌연변이로 인해 모세포와 동일하지 않은 모세포의 임의의 자손을 포함한다. 숙주세포의 선택은 공여체 서열 및 이의 공급원에 따라 크게 달라질 수 있다.
숙주세포는 또한 포유류, 곤충, 식물 또는 진균 세포와 같은 진핵생물일 수 있다. 하나의 구현예에서, 숙주세포는 인간 세포(예를 들어, 1차세포, 줄기세포 또는 불멸화된 세포주)이다. 일부 구현예에서, 숙주세포에 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터가 생체외로 투여되고, 숙주세포가 유전자 치료 후 대상에게 전달될 수 있다. 숙주세포는 임의의 세포 유형, 예를 들어 체세포 또는 줄기세포, 유도된 다능성 줄기세포 또는 혈액세포, 예를 들어 T세포 또는 B세포, 또는 골수세포일 수 있다. 특정 구현예에서, 숙주세포는 동종이계 세포이다. 예를 들어, T세포 게놈 조작은 암 면역요법, HIV 요법(예를 들어, CXCR4 및 CCR5와 같은 수용체 녹아웃)과 같은 질환 조절 및 면역결핍 치료에 유용하다. B세포의 MHC 수용체는 면역요법의 표적이 될 수 있다. 일부 구현예에서, 유전자 변형된 숙주세포, 예를 들어 골수 줄기세포, 예를 들어 CD34+ 세포 또는 유도된 다능성 줄기세포는, 치료용 단백질의 발현을 위해 환자에게 다시 이식될 수 있다.
B. 유전자 치료를 위한 추가의 질환
일반적으로, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 대상에서의 이상 단백질 발현 또는 유전자 발현과 관련된 PKU와 연관된 증상을 치료, 예방 또는 개선시키기 위해 상기 설명에 따른 임의의 PAH 단백질을 전달하는 데 사용될 수 있다.
일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는, PKU를 치료, 개선 및/또는 예방하기 위해, 혈액 내 분비 및 순환, 또는 다른 조직으로의 전신 전달을 위한 PAH 단백질의 생산을 위해, PAH 단백질을 골격근, 심장근 또는 횡격막근으로 전달하는 데 사용될 수 있다.
본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 임의의 적합한 수단에 의해, 선택적으로 대상이 흡입하는 ceDNA 벡터를 포함하는 호흡 가능한 입자의 에어로졸 현탁액을 투여하는 방식으로 대상의 폐에 투여될 수 있다. 호흡 가능한 입자는 액체 또는 고체일 수 있다. ceDNA 벡터를 포함하는 액체 입자의 에어로졸은 당업자에게 알려진 바와 같은 압력 구동 에어로졸 분무기 또는 초음파 분무기와 같은 임의의 적합한 수단에 의해 생성될 수 있다. 예를 들어, 미국 특허 제4,501,729호 참조. ceDNA 벡터를 포함하는 고체 입자의 에어로졸은 마찬가지로 약학 분야에 알려진 기술에 의해 임의의 고체 미립자 약제 에어로졸 생성기를 이용하여 생성될 수 있다.
일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 CNS의 조직(예를 들어, 뇌, 눈)에 투여될 수 있다.
본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터로 치료, 개선 또는 예방될 수 있는 안구 장애에는, 망막, 후방로 및/또는 시신경과 관련된 안과적 장애(예를 들어, 색소성망막염, 당뇨망막병증 및 다른 망막변성질환, 포도막염, 연령관련 황반변성, 녹내장)가 포함된다. 다수의 안과적 질환 및 장애는 (1) 혈관형성, (2) 염증, 및 (3) 변성의 3가지 유형의 적응증 중 하나 이상과 연관이 있다. 일부 구현예에서, 본원에 개시된 바와 같은 ceDNA 벡터는 항혈관형성 인자; 항염증 인자; 세포 변성을 지연시키거나, 세포 감축을 촉진시키거나, 세포 성장을 촉진시키는 인자, 및 이들의 조합을 전달하는 데 이용될 수 있다. 예를 들어, 당뇨망막병증은 혈관형성을 특징으로 한다. 당뇨망막병증은 하나 이상의 항혈관형성 항체 또는 융합 단백질을 안구내로(예를 들어, 유리체에) 또는 안구주위로(예를 들어, 테논낭하에) 전달하는 방식으로 치료될 수 있다. 본 개시내용의 ceDNA 벡터로 치료, 개선 또는 예방될 수 있는 추가의 안구 질환에는, 지도형위축, 혈관 또는 "습윤형" 황반변성, PKU, 레베르 선천성 흑암시(LCA), 어셔증후군, 탄성섬유가황색종(PXE), x연관 색소성망막염(XLRP), x연관 망막층간분리(XLRS), 범맥락막위축, 레베르 유전성 시신경병증(LHON), 완전색맹, 추체-간체 디스트로피, 푹스각막내피이상증, 당뇨병성 황반부종, 및 안구의 암 및 종양이 포함된다.
일부 구현예에서, 염증성 안구 질환 또는 장애(예를 들어, 포도막염)가 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터에 의해 치료, 개선 또는 예방될 수 있다. 하나 이상의 항염증 항체 또는 융합 단백질은 본원에 개시된 바와 같은 ceDNA 벡터의 안구내(예를 들어, 유리체 또는 전방) 투여에 의해 발현될 수 있다.
일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 리포터 폴리펩타이드(예를 들어, 녹색 형광 단백질 또는 알칼리성 포스파타아제와 같은 효소)를 인코딩하는 전이유전자와 관련이 있는 PAH 단백질을 인코딩할 수 있다. 일부 구현예에서, 실험 또는 진단 목적에 유용한 리포터 단백질을 인코딩하는 전이유전자는, β-락타마아제, β-갈락토시다아제(LacZ), 알칼리성 포스파타아제, 티미딘 키나아제, 녹색 형광 단백질(GFP), 클로람페니콜 아세틸트랜스퍼라아제(CAT), 루시퍼라아제 및 당업계에 널리 알려진 다른 것들 중 임의의 것에서 선택된다. 일부 양태에서, 리포터 폴리펩타이드에 연결된 PAH 단백질을 발현하는 ceDNA 벡터는 진단 목적으로 사용될 수 있을 뿐 아니라, 효율을 측정하기 위해, 또는 이것이 투여되는 대상에서 ceDNA 벡터 활성의 마커로서 사용될 수 있다.
C. ceDNA 벡터를 사용한 성공적인 유전자 발현 시험
ceDNA 벡터에 의한 PAH 단백질의 유전자 전달 효율을 시험하는 데 당업계에 널리 알려진 검정이 사용될 수 있으며, 이는 시험관내 및 생체내 모델로 수행될 수 있다. ceDNA에 의한 PAH 단백질의 발현 수준은 PAH 단백질의 mRNA 및 단백질 수준을 측정하는 방식(예를 들어, 역전사 PCR, 웨스턴 블롯 분석 및 효소 결합 면역흡착 검정(ELISA))으로 당업자에 의해 평가될 수 있다. 하나의 구현예에서, ceDNA는, 예를 들어 형광 현미경 또는 발광 플레이트 판독기로 리포터 단백질의 발현을 평가하는 방식으로 PAH 단백질의 발현을 평가하는 데 사용될 수 있는 리포터 단백질을 포함한다. 생체내 적용의 경우, 유전자 발현이 성공적으로 일어나는 지 여부를 결정하기 위해 소정의 PAH 단백질의 기능을 시험하는 단백질 기능 검정이 사용될 수 있다. 당업자는 시험관내 또는 생체내에서 ceDNA 벡터에 의해 발현되는 PAH 단백질의 기능을 측정하는 최상의 시험을 결정할 수 있다.
세포 또는 대상에서 ceDNA 벡터로부터의 PAH 단백질의 유전자 발현 효과는 적어도 1개월, 적어도 2개월, 적어도 3개월, 적어도 4개월, 적어도 5개월, 적어도 6개월, 적어도 10개월, 적어도 12개월, 적어도 18개월, 적어도 2년, 적어도 5년, 적어도 10년, 적어도 20년 동안 지속될 수 있거나, 영구적일 수 있다고 본원에서 고려된다.
일부 구현예에서, 본원에 기재된 발현 카세트, 발현 작제물 또는 ceDNA 벡터 내 PAH 단백질은 숙주세포에 대해 코돈 최적화될 수 있다. 본원에 사용된 "코돈 최적화된" 또는 "코돈 최적화"라는 용어는, 관심 척추동물, 예를 들어 마우스 또는 인간(예를 들어, 인간화)의 세포에서 발현 증강을 위해 핵산 서열을 변경하는 과정으로서, 천연 서열(예를 들어, 원핵생물 서열) 중 적어도 하나, 하나 초과 또는 유의한 수의 코돈을, 해당 척추동물의 유전자에서 보다 빈번하게 또는 가장 빈번하게 사용되는 코돈으로 대체하는 과정을 나타낸다. 다양한 종은 특정 아미노산의 특정 코돈에 대해 특정 편향을 나타낸다. 전형적으로, 코돈 최적화는 원래 번역된 단백질의 아미노산 서열을 변경시키지 않는다. 최적화된 코돈은, 예를 들어 Aptagen's Gene Forge® 코돈 최적화 및 맞춤형 유전자 합성 플랫폼(Aptagen, Inc.), 또는 또 다른 공개적으로 이용 가능한 데이터베이스를 사용하여 결정될 수 있다.
D. ceDNA 벡터로부터의 PAH 단백질 발현 평가를 통한 효능 결정
본질적으로, 단백질 발현을 결정하는 당업계에 알려진 임의의 방법이 ceDNA 벡터로부터 PAH 단백질의 발현을 분석하는 데 사용될 수 있다. 이러한 방법/검정의 비제한적인 예에는, 효소 결합 면역검정(ELISA), 친화성 ELISA, ELISPOT, 연속 희석, 유세포분석, 표면 플라즈몬 공명 분석, 역학적 배제 검정, 질량분석, 웨스턴 블롯, 면역침강 및 PCR이 포함된다.
생체내에서 PAH 단백질 발현을 평가하는 경우, 분석을 위해 대상에서 생물학적 샘플을 얻을 수 있다. 예시적인 생물학적 샘플에는, 생체유체 샘플, 체액 샘플, 혈액(전혈 포함), 혈청, 혈장, 소변, 타액, 생검 및/또는 조직 샘플 등이 포함된다. 생물학적 샘플 또는 조직 샘플은 또한, 비제한적으로, 종양 생검, 대변, 척수액, 흉막액, 유두 흡인물, 림프액, 피부, 호흡기, 장 및 비뇨생식기의 외부 부분, 눈물, 타액, 모유, 세포(비제한적으로, 혈액 세포 포함), 종양, 기관을 포함하는 개체로부터 단리된 조직 또는 체액의 샘플, 및 또한 시험관내 세포 배양 구성성분의 샘플을 나타낼 수 있다. 상기 용어는 또한 상기 언급된 샘플의 혼합물을 포함한다. "샘플"이라는 용어는 또한 미처리된 또는 전처리된(또는 사전 가공된) 생물학적 샘플을 포함한다. 일부 구현예에서, 본원에 기재된 검정 및 방법에 사용되는 샘플은 시험하고자 하는 대상에서 채취된 혈청 샘플을 포함한다.
E. 임상 매개변수에 의한 발현된 PAH 단백질의 효능 결정
PKU에 대한 ceDNA 벡터에 의해 발현되는 소정의 PAH 단백질의 효능(즉, 기능적 발현)은 숙련된 임상의에 의해 결정될 수 있다. 하지만, PKU의 징후 또는 증상 중 어느 하나 또는 전부가 유익한 방식으로 변경되거나, 다른 임상적으로 허용되는 질환의 증상 또는 마커가, 예를 들어 본원에 기재된 바와 같은 치료용 PAH 단백질을 인코딩하는 ceDNA 벡터로의 치료 후 적어도 10% 정도 호전되거나 개선되는 경우, 치료는 본원에 사용된 용어로 "유효한 치료"로 간주된다. 효능은 또한 PKU의 안정화 또는 의학적 개입의 필요성에 의해 평가되는 바와 같이 개체의 악화 실패로 측정될 수 있다(즉, 질환의 진행이 중단되거나 적어도 느려짐). 이러한 지표의 측정 방법은 당업자에게 알려져 있고/있거나 본원에 기재되어 있다. 치료는 개체 또는 동물(일부 비제한적인 예에는, 인간 또는 포유류가 포함됨)에서의 질환의 임의의 치료를 포함하며, 이에는 (1) PKU를 저해하는 것, 예를 들어 PKU의 진행을 중단시키거나 느리게 하는 것; 또는 (2) PKU를 완화시키는 것, 예를 들어 PKU 증상의 퇴행을 유발하는 것; 및 (3) PKU 질환의 발달 가능성을 예방하거나 감소시키는 것, 또는 PKU와 관련된 2차 질환/장애를 예방하는 것을 포함한다. 질환의 치료를 위한 유효량은, 이를 필요로 하는 포유류에 투여되는 경우, 해당 질환에 대한 유효한 치료(이러한 용어는 본원에 정의된 바와 같음)를 유도하는 데 충분한 양을 의미한다. 작용제의 효능은 PKU 질환에 대해 특정한 물리적 지표를 평가하는 방식으로 결정될 수 있다. 의사는, PKU의 임상 증상 중 임의의 하나 이상을 평가할 수 있다: **(i) 일반 식단에서 감소된 혈청 페닐알라닌(Phe) 수준. Phe의 감소는 PKU의 치료제 개발에서 핵심 바이오마커이다; (ii) 일반 식단에서 회복된 Phe 대 티로신 대사 비율. 이러한 경로는 신경전달물질의 생산을 담당한다; 및/또는 (iii) 감소된 혈청 Phe 수준의 평가.
실시예
하기 실시예는 제한이 아닌 예시로서 제공된다. 당업자는, ceDNA 벡터가 본원에 기재된 야생형 또는 변형된 ITR 중 임의의 것으로부터 작제될 수 있으며, 하기 예시적인 방법을 사용하여 이러한 ceDNA 벡터를 작제하고 이의 활성을 평가할 수 있다는 것을 이해할 것이다. 방법이 특정 ceDNA 벡터를 이용하는 것으로 예시되어 있지만, 설명에 따라 임의의 ceDNA 벡터에 적용할 수 있다.
실시예 1: 곤충 세포 기반 방법을 사용한 ceDNA 벡터의 작제
폴리뉴클레오타이드 작제물 주형을 사용한 ceDNA 벡터의 생산은 PCT/US18/49996(이는 그 전문이 본원에 참조로서 인용됨)의 실시예 1에 기재되어 있다. 예를 들어, 본 개시내용의 ceDNA 벡터를 생성하는 데 사용되는 폴리뉴클레오타이드 작제물 주형은 ceDNA-플라스미드, ceDNA-박미드 및/또는 ceDNA-바큘로바이러스일 수 있다. 이론에 제한됨 없이, 허용 숙주세포에서, 예를 들어 Rep의 존재 하에서, 2개의 대칭인 ITR과 발현 작제물을 갖는 폴리뉴클레오타이드 작제물 주형(여기서, ITR 중 적어도 하나는 야생형 ITR 서열에 대해 변형됨)을 복제하여 ceDNA 벡터를 생산한다. ceDNA 벡터 생산은 다음과 같은 2단계를 거친다: 첫 번째로, Rep 단백질을 통한 주형 백본(예를 들어, ceDNA-플라스미드, ceDNA-박미드, ceDNA-바큘로바이러스 게놈 등)으로부터의 주형의 절제("회수") 단계, 및 두 번째로, 절제된 ceDNA 벡터의 Rep 매개 복제 단계.
ceDNA-박미드의 생산:
DH10Bac 적격세포(MAX EFFICIENCY® DH10Bac™ Competent Cells, Thermo Fisher)를 제조업체의 설명서에 따른 프로토콜에 따라 시험 또는 대조군 플라스미드로 형질전환시켰다. DH10Bac 세포에서 플라스미드와 바큘로바이러스 셔틀 벡터 사이의 재조합을 유도하여, 재조합 ceDNA-박미드를 생성하였다. 박미드와 트랜스포사아제 플라스미드의 형질전환체 및 유지를 위해 선택한 항생제와 함께 X-gal 및 IPTG를 함유하는 박테리아 한천 플레이트 상에서, 대장균(E. coli)에서의 청백색 스크리닝을 기반으로 하는 양성 선별을 스크리닝하여 재조합 박미드를 선별하였다(Φ80dlacZΔM15 마커는 박미드 벡터로부터의 β-갈락토시다아제 유전자의 α-상보성을 제공함). β-갈락토시드 지표 유전자를 파괴하는 전위에 의해 야기된 백색 집락을 선별하고, 10 ml 배지에서 배양하였다.
재조합 ceDNA-박미드를 대장균에서 단리하고, FugeneHD를 사용하여 Sf9 또는 Sf21 곤충 세포에 트랜스펙션시켜, 감염성 바큘로바이러스를 생산하였다. 부착성 Sf9 또는 Sf21 곤충 세포를 25℃에서 T25 플라스크 내 50 ml 배지에서 배양하였다. 4일 후, 배양 배지(P0 바이러스 함유)에서 세포를 꺼내고, 0.45 μm 필터를 통해 여과하여, 세포 또는 세포 잔해물로부터 감염성 바큘로바이러스 입자를 분리하였다.
선택적으로, 50 ml 내지 500 ml 배지에서 나이브(nave) Sf9 또는 Sf21 곤충 세포를 감염시켜 제1세대 바큘로바이러스(P0)를 증폭시켰다. 세포의 직경이 18 nm 내지 19 nm(본래 직경 14 nm 내지 15 nm), 밀도가 약 4.0E+6개의 세포/mL에 도달할 때까지, 세포 직경 및 생존율을 모니터링하면서, 25℃에서 130 rpm으로 오비탈 진탕기 인큐베이터에서 현탁 배양으로 세포를 유지시켰다. 감염 후 3일 내지 8일 사이에, 원심분리한 후 배지 중 P1 바큘로바이러스 입자를 수집하여 세포와 잔해물을 제거하고, 0.45 μm 필터를 통해 여과하였다.
시험 작제물을 포함하는 ceDNA-바큘로바이러스를 수집하고, 바큘로바이러스의 감염 활성 또는 역가를 측정하였다. 구체적으로, 4개 x 20 ml Sf9 세포 배양물(2.5E+6개의 세포/ml)을 1/1000, 1/10,000, 1/50,000, 1/100,000로 희석된 P1 바큘로바이러스로 처리하고, 25℃ 내지 27℃에서 인큐베이션하였다. 4일 내지 5일 동안 매일 세포 직경 증가율과 세포주기 정지율, 및 세포 생존율의 변화로 감염성을 측정하였다.
PCT/US18/49996(이는 그 전문이 본원에 참조로서 인용됨)의 도 8a에 개시된 바와 같은 "Rep-플라스미드"를, Rep78(서열번호 131 또는 133)과 Rep52(서열번호 132) 또는 Rep68(서열번호 130)과 Rep40(서열번호 129)을 포함하는 pFASTBACTM-이중 발현 벡터(ThermoFisher)에서 생산하였다. Rep-플라스미드를 제조업체가 제공한 프로토콜에 따라 DH10Bac 적격세포(MAX EFFICIENCY® DH10Bac™ Competent Cells)(Thermo Fisher)로 형질전환시켰다. DH10Bac 세포에서 Rep-플라스미드와 바큘로바이러스 셔틀 벡터 사이의 재조합을 유도하여, 재조합 박미드("Rep-박미드")를 생성하였다. X-gal 및 IPTG를 함유하는 박테리아 한천 플레이트 상에서 대장균에서의 청백색 스크리닝을 포함하는 양성 선별을 통해 재조합 박미드를 선별하였다(Φ80dlacZΔM15 마커는 박미드 벡터로부터의 β-갈락토시다아제 유전자의 α-상보성을 제공함). 단리된 백색 집락을 선별하고, 10 ml의 선택된 배지(LB 브로쓰 중의 카나마이신, 겐타마이신, 테트라시클린)에 접종하였다. 재조합 박미드(Rep-박미드)를 대장균에서 단리하고, Rep-박미드를 Sf9 또는 Sf21 곤충 세포에 트랜스펙션시켜, 감염성 바큘로바이러스를 생산하였다.
Sf9 또는 Sf21 곤충 세포를 50 ml 배지에서 4일 동안 배양하고, 감염성 재조합 바큘로바이러스("Rep-바큘로바이러스")를 배양물에서 단리하였다. 선택적으로, 나이브 Sf9 또는 Sf21 곤충 세포를 감염시켜 제1세대 바큘로바이러스(P0)를 증폭시키고, 50 ml 내지 500 ml 배지에서 배양하였다. 감염 후 3일 내지 8일 사이에, 원심분리 또는 여과 또는 또 다른 분별 과정을 통해 세포를 분리하여, 배지 내 P1 바큘로바이러스 입자를 수집하였다. Rep-바큘로바이러스를 수집하고, 바큘로바이러스의 감염 활성을 측정하였다. 구체적으로, 4개 x 20 mL Sf9 세포 배양물(2.5x106개의 세포/mL)을 1/1000, 1/10,000, 1/50,000, 1/100,000로 희석된 P1 바큘로바이러스로 처리하고, 인큐베이션하였다. 4일 내지 5일 동안 매일 세포 직경 증가율과 세포주기 정지율, 및 세포 생존율의 변화로 감염성을 측정하였다.
ceDNA 벡터 생성 및 특징분석
도 3b를 참조하여, (1) ceDNA-박미드 또는 ceDNA-바큘로바이러스를 함유하는 샘플, 및 (2) 상기 기재된 Rep-바큘로바이러스를 함유하는 Sf9 곤충 세포 배양 배지를, 각각, 1:1000 및 1:10,000의 비로, Sf9 세포의 새로운 배양물(2.5E+6개의 세포/ml, 20 ml)에 첨가하였다. 이어서, 세포를 25℃에서 130 rpm으로 배양하였다. 공동 감염 4일 내지 5일 후, 세포 직경과 생존율을 검출하였다. 세포 직경이 18 nm 내지 20 nm에 도달하고, 생존율이 약 70% 내지 80%에 도달하면, 세포 배양물을 원심분리하고, 배지를 제거하고, 세포 펠릿을 수집하였다. 세포 펠릿을 먼저 적절한 부피의 물 또는 완충액인 수성 배지에 재현탁시켰다. Qiagen MIDI PLUS™ 정제 프로토콜(Qiagen, 컬럼당 처리되는 세포 펠릿 질량 0.2 mg)을 사용하여, 세포에서 ceDNA 벡터를 단리하고 정제하였다.
Sf9 곤충 세포에서 생산되고 정제된 ceDNA 벡터의 수율을 초기에 260 nm에서의 UV 흡광도를 기반으로 측정하였다.
ceDNA 벡터는 도 3d에 예시된 미변성 또는 변성 조건 하에서 아가로오스 겔 전기영동으로 확인하여 평가할 수 있으며, 여기서 (a) 제한 엔도뉴클레아제 절단 및 겔 전기영동 분석 후 미변성 겔에 비해 변성 겔에서 2배 크기로 이동하는 특징적인 밴드의 존재, 및 (b) 절단되지 않은 물질의 경우 미변성 겔에서 단량체 및 이량체(2x) 밴드의 존재가, ceDNA 벡터 존재의 특징이다.
공동 감염된 Sf9 세포(본원에 기재된 바와 같음)에서 수득된 DNA를, a) ceDNA 벡터 내 오로지 단일 절단 부위만 존재, 및 b) 0.8% 변성 아가로오스 겔 상에서 분별 시 명확하게 확인할 수 있을 만큼 충분히 큰 생성된 단편(>800 bp)에 대해 선별된 제한 엔도뉴클레아제로 소화시켜, 단리된 ceDNA 벡터의 구조를 추가로 분석하였다. 도 3d 및 도 3e에 예시된 바와 같이, 비연속 구조를 갖는 선형 DNA 벡터와 선형 및 연속 구조를 갖는 ceDNA 벡터를 이의 반응 생성물의 크기로 구별할 수 있다: 예를 들어 비연속 구조를 갖는 DNA 벡터는 1 kb 및 2 kb 단편을 생성할 것으로 예상되고, 연속 구조를 갖는 비캡시드화된 벡터는 2 kb 및 4 kb 단편을 생성할 것으로 예상된다.
따라서, 단리된 ceDNA 벡터가 정의에 따라 공유결합으로 폐쇄되어 있다는 것을 정성적으로 입증하기 위해, 샘플을 단일 제한 부위를 갖는 특정 DNA 벡터 서열의 맥락에서 확인된 제한 엔도뉴클레아제로 소화시켜, 바람직하게는 동일하지 않은 크기의 2개의 절단 산물(예를 들어, 1000 bp 및 2000 bp)을 수득하였다. 소화 및 변성 겔 상에서의 전기영동(이는 2개의 상보적 DNA 가닥을 분리함) 후, 선형의 비공유결합으로 폐쇄된 DNA는 1000 bp 및 2000 bp의 크기로 분리될 것이지만, 공유결합으로 폐쇄된 DNA(즉, ceDNA 벡터)는 2개의 DNA 가닥이 연결되고 언폴딩되어 (단일가닥이지만) 길이가 2배가 됨으로써, 2배 크기(2000 bp 및 4000 bp)로 분리될 것이다. 나아가, 단량체, 이량체 및 n량체 형태의 DNA 벡터의 소화는 모두 다량체 DNA 벡터의 말단 대 말단 연결로 인해 동일한 크기의 단편으로 분리될 것이다(도 3d 참조). 도 4는, 엔도뉴클레아제로 소화되거나(+) 소화되지 않은(-) ceDNA 벡터의 변성 겔 전개의 예시적인 도면이다(ceDNA 작제물 1 및 2의 경우 EcoRI; ceDNA 작제물 3 및 4의 경우 BamH1; ceDNA 작제물 5 및 6의 경우 SpeI; 및 ceDNA 작제물 7 및 8의 경우 XhoI). 작제물 1 내지 8은 국제 출원 PCT/US18/49996(이는 그 전문이 본원에 참조로 인용됨)의 실시예 1에 기재되어 있다. 별표로 강조된 밴드의 크기를 결정하고 도면의 하단에 제공하였다.
본원에 사용된 "미변성 겔 및 변성 조건 하에서 아가로오스 겔 전기영동에 의한 DNA 벡터의 식별을 위한 검정"이라는 구절은, 제한 엔도뉴클레아제 소화, 이어서 소화 산물의 전기영동을 수행하는 방식으로 ceDNA의 폐쇄형 말단을 평가하는 검정을 나타낸다. 하나의 이러한 예시적인 검정이 하기에 이어지지만, 당업자는 이러한 예에 대한 다수의 업계 공지의 변형이 가능하다는 것을 이해할 것이다. 제한 엔도뉴클레아제는 DNA 벡터 길이의 대략 1/3x 및 2/3x인 산물을 생성하게 되는 관심 ceDNA 벡터에 대한 단일 절단 효소인 것으로 선택된다. 이는, 미변성 및 변성 겔 모두에 대한 밴드를 분리한다. 변성 전, 샘플에서 완충액을 제거하는 것이 중요하다. Qiagen PCR 클린업 키트(clean-up kit) 또는 탈염 "스핀 컬럼", 예를 들어 GE HEALTHCARE ILUSTRA™ MICROSPIN™ G-25 컬럼이 엔도뉴클레아제 소화에 대한 일부 업계 공지의 옵션이다. 상기 검정은, 예를 들어 i) 적절한 제한 엔도뉴클레아제(들)를 이용하여 DNA를 소화시키는 단계, ii) 예를 들어 Qiagen PCR 클린업 키트에 적용하고, 증류수로 용리하는 단계, iii) 10x 변성 용액(10x = 0.5 M NaOH, 10 mM EDTA)을 첨가하고, 완충되지 않은 10X 염료를 첨가하고, NaOH 농도가 겔과 겔 박스에서 균일하도록 보장하기 위해 1 mM EDTA 및 200 mM NaOH와 함께 이전에 인큐베이션한 0.8% 내지 1.0% 겔 상에 10X 변성 용액을 4배로 첨가하여 제조된 DNA ladder와 함께 분석하고, 1x 변성 용액(50 mM NaOH, 1 mM EDTA)의 존재 하에서 겔에서 전개시키는 단계를 포함한다. 당업자는, 크기 및 목적하는 결과 타이밍을 기반으로 전기영동을 수행하는 데 어떤 전압을 사용해야 하는 지를 이해할 것이다. 전기영동 후, 겔을 배수하고, 1x TBE 또는 TAE에서 중화시키고, 1x SYBR Gold을 함유한 1x TBE/TAE 또는 증류수로 옮겼다. 이어서, 밴드를, 예를 들어 Thermo Fisher, SYBR® Gold Nucleic Acid Gel Stain(DMSO 중 10,000X 농축물) 및 에피형광(epifluorescent light)(청색) 또는 UV(312 nm)를 이용하여 가시화할 수 있다.
생성된 ceDNA 벡터의 순도는 임의의 업계 공지의 방법을 사용하여 평가할 수 있다. 하나의 예시적이고 비제한적인 방법으로서, ceDNA 벡터의 형광 강도를 표준과 비교하여 샘플의 전체 UV 흡광도에 대한 ceDNA-플라스미드의 기여를 추정할 수 있다. 예를 들어, UV 흡광도에 기반하여, 4 ㎍의 ceDNA 벡터가 겔 상에 로딩되고, ceDNA 벡터 형광 강도가 1 ㎍인 것으로 알려진 2 kb 밴드와 동등한 경우, 1 ㎍의 ceDNA 벡터가 존재하며, ceDNA 벡터는 총 UV 흡수 물질의 25%이다. 이어서, 겔 상의 밴드 강도를 밴드가 나타내는 계산된 입력에 대해 플롯팅한다: 예를 들어 총 ceDNA 벡터가 8 kb이고, 절제된 비교용 밴드가 2 kb인 경우, 밴드 강도는 총 입력의 25%로서 플롯팅될 것이며, 이러한 경우 1.0 ㎍ 입력에 대한 값은 0.25 ㎍일 것이다. ceDNA 벡터 플라스미드 적정을 사용하여 표준 곡선을 플롯팅한 후, 회귀선 방정식을 사용하여 ceDNA 벡터 밴드의 양을 계산한 다음, 이를 사용하여 ceDNA 벡터로 표시되는 총 입력의 % 또는 순도%를 결정할 수 있다.
비교 목적으로, 실시예 1에는 곤충 세포 기반 방법 및 폴리뉴클레오타이드 작제물 주형을 사용한 ceDNA 벡터의 생산 방법이 기재되어 있으며, 이는 또한 국제 특허 출원 PCT/US18/49996(이는 그 전문이 본원에 참조로서 인용됨)의 실시예 1에 기재되어 있다. 예를 들어, 실시예 1에 따른 본 개시내용의 ceDNA 벡터를 생성하는 데 사용되는 폴리뉴클레오타이드 작제물 주형은 ceDNA-플라스미드, ceDNA-박미드 및/또는 ceDNA-바큘로바이러스일 수 있다. 이론에 제한됨 없이, 허용 숙주세포에서, 예를 들어 Rep의 존재 하에서, 2개의 대칭인 ITR과 발현 작제물을 갖는 폴리뉴클레오타이드 작제물 주형(여기서, ITR 중 적어도 하나는 야생형 ITR 서열에 대해 변형됨)을 복제하여 ceDNA 벡터를 생산한다. ceDNA 벡터 생산은 다음과 같은 2단계를 거친다: 첫 번째로, Rep 단백질을 통한 주형 백본(예를 들어, ceDNA-플라스미드, ceDNA-박미드, ceDNA-바큘로바이러스 게놈 등)으로부터의 주형의 절제("회수") 단계, 및 두 번째로, 절제된 ceDNA 벡터의 Rep 매개 복제 단계.
실시예 2: 이중가닥 DNA 분자로부터의 절제를 통한 합성 ceDNA 생산
ceDNA 벡터의 합성 생산은 2019년 1월 18일자 출원된 국제 특허 출원 PCT/US19/14122의 실시예 2 내지 실시예 6에 기재되어 있으며, 상기 문헌은 그 전문이 본원에 참조로서 인용된다. 이중가닥 DNA 분자의 절제를 포함하는 합성 방법을 사용하여 ceDNA 벡터를 생산하는 하나의 예시적인 방법. 간략하게, ceDNA 벡터는 이중가닥 DNA 작제물을 사용하여 생성할 수 있다(예를 들어, PCT/US19/14122의 도 7a 내지 도 8e 참조). 일부 구현예에서, 이중가닥 DNA 작제물은 ceDNA 플라스미드이다(예를 들어, 2018년 12월 6일자 출원된 국제 특허 출원 PCT/US2018/064242의 도 6 참조).
일부 구현예에서, ceDNA 벡터 제조용 작제물은 본원에 기재된 바와 같은 조절 스위치를 포함한다.
예시 목적으로, 실시예 2는 이러한 방법을 사용하여 생성된 예시적인 폐쇄형 DNA 벡터로서의 ceDNA 벡터의 생산을 설명한다. ITR과 발현 카세트(예를 들어, 핵산 서열, 예를 들어 이종 핵산 서열)를 포함하는 이중가닥 폴리뉴클레오타이드의 절제, 이어서 본원에 기재된 바와 같은 유리된 3' 및 5' 말단의 결찰에 의해 폐쇄형 DNA 벡터를 생성하는 시험관내 합성 생산 방법을 설명하는 상기 실시예에 ceDNA 벡터가 예시되어 있지만, 당업자는, 상기 예시된 바와 같이, 비제한적으로, 개뼈형 DNA, 덤벨형 DNA 등을 포함하는 임의의 목적하는 폐쇄형 DNA 벡터가 생성되도록, 이중가닥 DNA 폴리뉴클레오타이드 분자를 변형시킬 수 있다는 것을 알고 있다. 실시예 2에 기재된 합성 생산 방법에 따라 생산될 수 있는 항체 또는 융합 단백질의 생산을 위한 예시적인 ceDNA 벡터는, "III ceDNA 벡터 전반"라는 제목의 섹션에 논의되어 있다. ceDNA 벡터에 의해 발현되는 예시적인 항체 및 융합 단백질은, "IIC ceDNA 벡터에 의해 발현되는 예시적인 항체 및 융합 단백질"이라는 제목의 섹션에 논의되어 있다.
상기 방법은 (i) 이중가닥 DNA 작제물로부터 발현 카세트를 인코딩하는 서열을 절제하는 단계, (ii) ITR 중 하나 이상에서 헤어핀 구조를 형성하는 단계, 및 (iii) 유리된 5' 및 3' 말단을 결찰, 예를 들어 T4 DNA 리가아제에 의해 결합하는 단계를 포함한다.
이중가닥 DNA 작제물은, 5'→3' 순서로, 제1 제한 엔도뉴클레아제 부위; 업스트림 ITR; 발현 카세트; 다운스트림 ITR; 및 제2 제한 엔도뉴클레아제 부위를 포함한다. 이어서, 이중가닥 DNA 작제물을 하나 이상의 제한 엔도뉴클레아제와 접촉시켜, 양쪽 제한 엔도뉴클레아제 부위에 이중가닥 절단물을 생성한다. 하나의 엔도뉴클레아제는 2개의 부위를 모두 표적화할 수 있거나, 제한 부위가 ceDNA 벡터 주형에 존재하지 않는 한 각각의 부위는 상이한 엔도뉴클레아제에 의해 표적화될 수 있다. 이는 나머지 이중가닥 DNA 작제물로부터 제한 엔도뉴클레아제 부위 사이의 서열을 절제한다(PCT/US19/14122의 도 9 참조). 결찰시켜, 폐쇄형 DNA 벡터를 형성한다.
상기 방법에 사용되는 ITR 중 하나 또는 둘 모두는 야생형 ITR일 수 있다. 변형된 ITR을 또한 사용할 수 있으며, 여기서 변형은 B 및 B' 아암 및/또는 C 및 C' 아암을 형성하는 서열에서 야생형 ITR로부터 하나 이상의 뉴클레오타이드의 결실, 삽입 또는 치환을 포함하거나(예를 들어, PCT/US19/14122의 도 6 내지 도 8, 도 10 및 도 11b 참조), 2개 이상의 헤어핀 루프(예를 들어, PCT/US19/14122의 도 6 내지 도 8 및 도 11b 참조) 또는 단일 헤어핀 루프(예를 들어, PCT/US19/14122의 도 10a, 도 10b 및 도 11b 참조)를 가질 수 있다. 헤어핀 루프 변형된 ITR은 기존 올리고의 유전적 변형 또는 새로운(de novo) 생물학적 및/또는 화학적 합성으로 생성할 수 있다. 제한적인 예에서, 좌측 및 우측 ITR-6(서열번호 111 및 서열번호 112)은 AAV2의 야생형 ITR로부터 B-B' 및 C-C' 아암의 40개 뉴클레오타이드 결실을 포함한다. 변형된 ITR에 남아있는 뉴클레오타이드는 단일 헤어핀 구조를 형성할 것으로 예측된다. 상기 구조의 언폴딩 깁스 자유 에너지는 약 -54.4 kcal/mol이다. 기능성 Rep 결합 부위 또는 Trs 부위의 선택적 결실을 비롯한 ITR에 대한 다른 변형이 또한 이루어질 수 있다.
실시예 3:
올리고뉴클레오타이드 작제를 통한 ceDNA 생산
다양한 올리고뉴클레오타이드의 어셈블리를 포함하는 합성 방법을 사용하여 ceDNA 벡터를 생산하는 또 다른 예시적인 방법이, PCT/US19/14122(이는 그 전문이 본원에 참조로서 인용됨)의 실시예 3에 제공되어 있으며, 여기서 ceDNA 벡터는 5' 올리고뉴클레오타이드와 3' ITR 올리고뉴클레오타이드를 합성하는 단계, 및 ITR 올리고뉴클레오타이드를 발현 카세트를 포함하는 이중가닥 폴리뉴클레오타이드에 결찰시키는 단계를 통해 생산된다. PCT/US19/14122의 도 11b는, 5' ITR 올리고뉴클레오타이드와 3' ITR 올리고뉴클레오타이드를 발현 카세트를 포함하는 이중가닥 폴리뉴클레오타이드에 결찰시키는 예시적인 방법을 보여준다.
ITR 올리고뉴클레오타이드는 WT-ITR(예를 들어, 도 2a, 도 2c 참조) 또는 변형된 ITR(예를 들어, 도 2b 및 도 2d 참조)을 포함할 수 있다. (PCT/US19/14122(이는 그 전문이 본원에 참조로서 인용됨)의 도 6a, 도 6b, 도 7a 및 도 7b 참조). 예시적인 ITR 올리고뉴클레오타이드에는, 비제한적으로, 서열번호 134 내지 145가 포함된다(예를 들어, PCT/US19/14122의 표 7 참조). 변형된 ITR은 B 및 B' 아암 및/또는 C 및 C' 아암을 형성하는 서열에서 야생형 ITR로부터 하나 이상의 뉴클레오타이드의 결실, 삽입 또는 치환을 포함할 수 있다. 무세포 합성에 사용되는 본원에 기재된 바와 같은 WT-ITR 또는 mod-ITR을 포함하는 ITR 올리고뉴클레오타이드는, 유전적 변형, 또는 생물학적 및/또는 화학적 합성으로 생성할 수 있다. ITR 올리고뉴클레오타이드는 WT-ITR, 또는 본원에 논의된 바와 같은 대칭 또는 비대칭 구성의 변형된 ITR(mod-ITR)을 포함할 수 있다.
실시예 4: 단일가닥 DNA 분자를 통한 ceDNA 생산
합성 방법을 사용하여 ceDNA 벡터를 생산하는 또 다른 예시적인 방법이 PCT/US19/14122(이는 그 전문이 본원에 참조로서 인용됨)의 실시예 4에 제공되어 있으며, 이는 센스 발현 카세트 서열을 플랭킹하고, 안티센스 발현 카세트를 플랭킹하는 2개의 안티센스 ITR에 공유결합으로 부착된 2개의 센스 ITR을 포함하는 단일가닥 선형 DNA를 사용하며, 이러한 단일가닥 선형 DNA의 말단을 결찰시켜 폐쇄형 단일가닥 분자를 형성한다. 하나의 비제한적인 예는, 단일가닥 DNA 분자를 합성 및/또는 생산하는 단계, 분자의 일부를 어닐링하여 하나 이상의 2차 구조 염기쌍 영역을 갖는 단일 선형 DNA 분자를 형성하는 단계, 및 유리된 5' 및 3' 말단을 서로 결찰시켜 폐쇄형 단일가닥 분자를 형성하는 단계를 포함한다.
ceDNA 벡터 생산을 위한 예시적인 단일가닥 DNA 분자는, 5'→3' 방향으로, 센스 제1 ITR; 센스 발현 카세트 서열; 센스 제2 ITR; 안티센스 제2 ITR; 안티센스 발현 카세트 서열; 및 안티센스 제1 ITR을 포함한다.
실시예 4의 예시적인 방법에 사용되는 단일가닥 DNA 분자는 본원에 기재된 임의의 DNA 합성 방법, 예를 들어 시험관내 DNA 합성으로 형성하거나, 뉴클레아제를 이용하여 DNA 작제물(예를 들어, 플라스미드)을 절단하고 생성된 dsDNA 단편을 용융시켜 ssDNA 단편을 제공하는 방식으로 제공할 수 있다.
센스 및 안티센스 서열 쌍의 계산된 용융 온도 미만으로 온도를 저하시켜 어닐링을 달성할 수 있다. 용융 온도는 특정 뉴클레오타이드 염기 함량과, 사용되는 용액의 특징, 예를 들어 염 농도에 따라 달라진다. 당업자는 임의의 소정의 서열 및 용액 조합에 대한 용융 온도를 쉽게 계산할 수 있다.
어닐링된 분자의 유리된 5' 및 3' 말단을 서로 결찰시키거나 헤어핀 분자에 결찰시켜, ceDNA 벡터를 형성할 수 있다. 적합한 예시적인 결찰 방법 및 헤어핀 분자는 실시예 2 및 실시예 3에 기재되어 있다.
실시예 5: ceDNA의 정제 및/또는 생산 확인
예를 들어 실시예 1에 기재된 곤충 세포 기반 생산 방법, 또는 실시예 2 내지 4에 기재된 합성 생산 방법을 포함하는 본원에 기재된 방법에 의해 생산된 임의의 DNA 벡터 산물을, 당업자에게 일반적으로 알려진 방법을 사용하여 불순물, 미사용 구성요소 또는 부산물을 제거하기 위해 정제할 수 있고/있거나; 생산된 DNA 벡터(이러한 경우, ceDNA 벡터)가 목적하는 분자인지를 확인하기 위해 분석할 수 있다. DNA 벡터, 예를 들어 ceDNA의 예시적인 정제 방법은, Qiagen Midi Plus 정제 프로토콜(Qiagen) 및/또는 겔 정제를 사용하는 것이다.
ceDNA 벡터의 정체를 확인하는 예시적인 방법은 다음과 같다.
ceDNA 벡터는 도 3d에 예시된 미변성 또는 변성 조건 하에서 아가로오스 겔 전기영동으로 확인하여 평가할 수 있으며, 여기서 (a) 제한 엔도뉴클레아제 절단 및 겔 전기영동 분석 후 미변성 겔에 비해 변성 겔에서 2배 크기로 이동하는 특징적인 밴드의 존재, 및 (b) 절단되지 않은 물질의 경우 미변성 겔에서 단량체 및 이량체(2x) 밴드의 존재가, ceDNA 벡터 존재의 특징이다.
정제된 DNA를, a) ceDNA 벡터 내 오로지 단일 절단 부위만 존재, 및 b) 0.8% 변성 아가로오스 겔 상에서 분별 시 명확하게 확인할 수 있을 만큼 충분히 큰 생성된 단편(>800 bp)에 대해 선별된 제한 엔도뉴클레아제로 소화시켜, 단리된 ceDNA 벡터의 구조를 추가로 분석하였다. 도 3c 및 도 3d에 예시된 바와 같이, 비연속 구조를 갖는 선형 DNA 벡터와 선형 및 연속 구조를 갖는 ceDNA 벡터를 이의 반응 생성물의 크기로 구별할 수 있다: 예를 들어 비연속 구조를 갖는 DNA 벡터는 1 kb 및 2 kb 단편을 생성할 것으로 예상되고, 연속 구조를 갖는 ceDNA 벡터는 2 kb 및 4 kb 단편을 생성할 것으로 예상된다.
따라서, 단리된 ceDNA 벡터가 정의에 따라 공유결합으로 폐쇄되어 있다는 것을 정성적으로 입증하기 위해, 샘플을 단일 제한 부위를 갖는 특정 DNA 벡터 서열의 맥락에서 확인된 제한 엔도뉴클레아제로 소화시켜, 바람직하게는 동일하지 않은 크기의 2개의 절단 산물(예를 들어, 1000 bp 및 2000 bp)을 수득하였다. 소화 및 변성 겔 상에서의 전기영동(이는 2개의 상보적 DNA 가닥을 분리함) 후, 선형의 비공유결합으로 폐쇄된 DNA는 1000 bp 및 2000 bp의 크기로 분리될 것이지만, 공유결합으로 폐쇄된 DNA(즉, ceDNA 벡터)는 2개의 DNA 가닥이 연결되고 언폴딩되어 (단일가닥이지만) 길이가 2배가 됨으로써, 2배 크기(2000 bp 및 4000 bp)로 분리될 것이다. 나아가, 단량체, 이량체 및 n량체 형태의 DNA 벡터의 소화는 모두 다량체 DNA 벡터의 말단 대 말단 연결로 인해 동일한 크기의 단편으로 분리될 것이다(도 3e 참조).
본원에 사용된 "미변성 겔 및 변성 조건 하에서 아가로오스 겔 전기영동에 의한 DNA 벡터의 식별을 위한 검정"이라는 구절은, 제한 엔도뉴클레아제 소화, 이어서 소화 산물의 전기영동을 수행하는 방식으로 ceDNA의 폐쇄형 말단을 평가하는 검정을 나타낸다. 하나의 이러한 예시적인 검정이 하기에 이어지지만, 당업자는 이러한 예에 대한 다수의 업계 공지의 변형이 가능하다는 것을 이해할 것이다. 제한 엔도뉴클레아제는 DNA 벡터 길이의 대략 1/3x 및 2/3x인 산물을 생성하게 되는 관심 ceDNA 벡터에 대한 단일 절단 효소인 것으로 선택된다. 이는, 미변성 및 변성 겔 모두에 대한 밴드를 분리한다. 변성 전, 샘플에서 완충액을 제거하는 것이 중요하다. Qiagen PCR 클린업 키트(clean-up kit) 또는 탈염 "스핀 컬럼", 예를 들어 GE HEALTHCARE ILUSTRA™ MICROSPIN™ G-25 컬럼이 엔도뉴클레아제 소화에 대한 일부 업계 공지의 옵션이다. 상기 검정은, 예를 들어 i) 적절한 제한 엔도뉴클레아제(들)를 이용하여 DNA를 소화시키는 단계, ii) 예를 들어 Qiagen PCR 클린업 키트에 적용하고, 증류수로 용리하는 단계, iii) 10x 변성 용액(10x = 0.5 M NaOH, 10 mM EDTA)을 첨가하고, 완충되지 않은 10X 염료를 첨가하고, NaOH 농도가 겔과 겔 박스에서 균일하도록 보장하기 위해 1 mM EDTA 및 200 mM NaOH와 함께 이전에 인큐베이션한 0.8% 내지 1.0% 겔 상에 10X 변성 용액을 4배로 첨가하여 제조된 DNA ladder와 함께 분석하고, 1x 변성 용액(50 mM NaOH, 1 mM EDTA)의 존재 하에서 겔에서 전개시키는 단계를 포함한다. 당업자는, 크기 및 목적하는 결과 타이밍을 기반으로 전기영동을 수행하는 데 어떤 전압을 사용해야 하는 지를 이해할 것이다. 전기영동 후, 겔을 배수하고, 1x TBE 또는 TAE에서 중화시키고, 1x SYBR Gold을 함유한 1x TBE/TAE 또는 증류수로 옮겼다. 이어서, 밴드를, 예를 들어 Thermo Fisher, SYBR® Gold Nucleic Acid Gel Stain(DMSO 중 10,000X 농축물) 및 에피형광(청색) 또는 UV(312 nm)를 이용하여 가시화할 수 있다. 겔 밴드에서 ceDNA 벡터를 분리하고 이를 재생시키는 방식으로 전술한 겔 기반 방법을 정제 목적에 맞게 조정할 수 있다. 생성된 ceDNA 벡터의 순도는 임의의 업계 공지의 방법을 사용하여 평가할 수 있다. 하나의 예시적이고 비제한적인 방법으로서, ceDNA 벡터의 형광 강도를 표준과 비교하여 샘플의 전체 UV 흡광도에 대한 ceDNA-플라스미드의 기여를 추정할 수 있다. 예를 들어, UV 흡광도에 기반하여, 4 ㎍의 ceDNA 벡터가 겔 상에 로딩되고, ceDNA 벡터 형광 강도가 1 ㎍인 것으로 알려진 2 kb 밴드와 동등한 경우, 1 ㎍의 ceDNA 벡터가 존재하며, ceDNA 벡터는 총 UV 흡수 물질의 25%이다. 이어서, 겔 상의 밴드 강도를 밴드가 나타내는 계산된 입력에 대해 플롯팅한다: 예를 들어 총 ceDNA 벡터가 8 kb이고, 절제된 비교용 밴드가 2 kb인 경우, 밴드 강도는 총 입력의 25%로서 플롯팅될 것이며, 이러한 경우 1.0 ㎍ 입력에 대한 값은 0.25 ㎍일 것이다. ceDNA 벡터 플라스미드 적정을 사용하여 표준 곡선을 플롯팅한 후, 회귀선 방정식을 사용하여 ceDNA 벡터 밴드의 양을 계산한 다음, 이를 사용하여 ceDNA 벡터로 표시되는 총 입력의 % 또는 순도%를 결정할 수 있다.
실시예 6: ceDNA의 IV 및 유체역학적 투여에 의한 PAH
enu2
마우스 내 페닐알라닌 수준의 생화학적 교정을 평가하기 위한 약리학적 연구
PAH 결핍의 쥣과 모델인 PAHenu2 마우스를 사용한 국제 출원 PCT/US2020/022595(이는 그 전문이 본원에 참조로 인용됨)에 이전에 제시된 바와 같이, 2개의 상이한 ceDNA 벡터(이들은 각각 야생형 좌측 ITR과 절단된 돌연변이 우측 ITR을 갖고, 인간 PAH를 인코딩하는 전이유전자 영역을 가짐)는, 유체역학적 주사로 투여될 때, 활성 PAH를 발현했으며, 이는 페닐알라닌 수준을 전신적으로 감소시킬 수 있었다. 나아가, 국제 특허 PCT/US2020/022595에서 입증된 바와 같이, 인간 PAH 코돈 최적화된 버전 2("Codop2")에 연결된 VD 프로모터를 함유하는 ceDNA의 투여는 혈청 PHE 수준을 감소시켰으며, 이는 빠르면 3일차에 쥣과 PKU에서 혈중 페닐알라닌 수준을 교정하는 데 충분한 PAH 활성을 나타냈다.
ceDNA 벡터를 상기 실시예 1과 실시예 5에 기재된 바와 같이 제조하고 정제하였다.
코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH Codop2")의 핵산 서열은 본원에 서열번호 192로 제시되어 있으며, 이는 하기 요소를 포함한다: left-ITR_v1 : spacer_left-ITR_v2.1 : VD_Promoter Set (VD) : PmeI_site : Modified_Minimum_Consensus_Kozak : hPAH_codop_ORF_v2 : PacI_site : WPRE_3pUTR : bGH/spacer : spacer_right-ITR_v1 : right-ITR_v1 (ceDNA412).
인간 PAH cDNA를 함유하는 ceDNA(코돈 최적화되지 않은 hPAH cDNA에 연결된 ceDNA VD 프로모터)의 핵산 서열은 본원에 서열번호 193으로 제시되어 있으며, 이는 하기 요소를 포함한다: Left-ITR_v1 : spacer_left-ITR_v1 : VD_Promoter Set (VD) : PmeI_site : Consensus_Kozak : hPAH_cDNA_ORF_v3 : PacI_site : WPRE_3pUTR : bGH : spacer_right-ITR_v1 : right-ITR_v1 (ceDNA802).
특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 본원에 서열번호 213으로 제시되어 있으며, 이는 하기 요소를 포함한다: left-ITR_v1, spacer_left-ITR_v2, HS-CRM8_SERP_Enhancer_nospacer, HS-CRM8_SERP_Enhancer_nospacer, HS-CRM8_SERP_Enhancer_nospacer, BamHI_site, TTR-promoter-d5pUTR, MVM_intron, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH-r5-s29, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1 (ceDNA1530).
ceDNA PAH 벡터(임의의 LNP 캡슐화 없이 단독으로)와 대조군을 각각 대략 약 4주령 내지 6주령의 혼성 연령 일치 PAHenu2 마우스에 투여하였다. 네이키드 ceDNA 벡터를, 0일차에 90 ml/㎏ 내지 100 ml/㎏의 용량 부피로 측면 꼬리 정맥을 통해 유체역학적 정맥내 주사로, ceDNA412 및 ceDNA802의 경우 동물당(군당 5마리 동물) 0.5 ㎍ 또는 5 ㎍으로 투여하였고, ceDNA1530의 경우 동물당(군당 5마리 동물) 0.5 ㎍ 또는 1 ㎍으로 투여하였다. 21일차는 종결 시점이었다.
설치류의 간에 핵산을 도입하는 널리 알려진 방법은 유체역학적 꼬리 정맥 주사에 의한 것이다. 이러한 시스템에서, 다량의 비캡슐화된 핵산을 가압 주사하면, 세포 투과성이 일시적으로 증가하여 조직 및 세포로의 직접 전달이 이루어진다. 이는, 대식세포 전달과 같은 다수의 숙주 면역계를 우회하는 실험적 메커니즘을 제공하여, 이러한 활성의 부재 하에서 전달 및 발현을 관찰할 수 있는 기회를 제공한다.
연구 설계는 하기 표 15에 제시되어 있다.
[표 15]
시험 물품은 농축 스톡으로 공급하였고, 사용 시까지 약 4℃에서 보관하였다. 제형을 볼텍싱하거나 원심분리하지 않았다. 군을 처치실 내 환기 랙과 접촉된 침구가 있는 투명 폴리카보네이트 케이지에 수용하였다. 먹이 및 1 N HCl을 이용하여 2.5 내지 3.0의 목표 pH로 산성화시킨 여과된 수돗물을 임의로 동물에게 제공하였다.
각각, 표 16A 및 표 16B에 따라, 중간 및 종료 시점에서 혈액을 채취하였다.
[표 16A]
[표 16B]
연구 세부사항은 하기와 같이 제공된다:
종(수, 성별, 연령): 40마리 + 예비용 2마리 PAHenu2 돌연변이(MUT) 마우스(혼성, 약 5주령 내지 10주령, 도착 시 연령 일치); 5마리 야생형(WT); 혼성, 한배새끼; 연령 일치. 동물은 투여 개시 시 약 10주령 내지 14주령이었다.
케이지 사이드 관찰: 케이지 사이드 관찰은 매일 수행하였다.
화합물 부류: 재조합 DNA 벡터, ceDNA
체중: 모든 동물의 체중을, 해당되는 경우, -3일차, 0일차, 1일차, 2일차, 4일차, 7일차, 14일차 및 21일차(안락사 전)에 기록하였다. 필요에 따라 추가 체중을 기록하였다.
투여 제형: 시험 물품은 농축 스톡으로 공급하였다. 사용 직전 스톡을 PBS로 희석시켰다. 투여가 즉시 수행되지 않는 경우, 준비된 재료를 약 4℃(또는 습윤한 얼음 위)에서 보관하였다.
용량 투여: 0일차에, 군 1 내지 군 7에 대해 시험 물질을 측면 꼬리 정맥을 통해 동물당 설정된 부피, 90 내지 100 ml/㎏(군 내 가장 가벼운 동물에 따라 달라짐)로 유체역학적 IV 투여로 투여하였다. 0일차에, 군 8 및 군 9에는 동물당 설정된 부피인 5 ml/㎏을 유체역학적 IV 투여로 투여하였다.
채혈 및 검시(혈청 및 조직용) 전 금식: 모든 동물(모든 군)을 -3일차, 4일차, 7일차, 14일차 및 21일차에, 모든 채혈 및 검시 전 최소 4시간 동안 금식시켰다. 0일차에는 동물을 금식시키지 않았다.
중간 채혈: 군 1, 2, 8 및 9의 모든 동물만 0일차에 시험 물질 투여 6시간(±5%) 후에 중간 채혈을 수행하였다.
군 1 내지 군 9의 모든 동물에서 -3일차, -4일차, 0일차, 1일차, 2일차, 4 3일차, 7일차, 14일차 및 21일차에 채혈하였다. 동물은 공복 시 혈청 수집을 위한 전혈을 가지고 있다.
안락사 및 종료 시 채혈: 21일차에, 최소 4시간 공복 후, CO2 질식, 개흉술 및 방혈을 통해 동물을 안락사시켰다.
페닐알라닌(PHE) 수준: Pure Honey에서 PHE 수준에 대해 혈청 샘플을 분석하였다.
활성 수준: Pure Honey에서 활성 수준에 대해 2개의 동결된 간 샘플을 분석하였다.
결과
도 5a 내지 도 5c에 제시된 바와 같이, 코돈 최적화된 PAH 핵산 서열을 포함하는 ceDNA 벡터(ceDNA412; hPAH_codop_ORF_v2)는 0.5 ㎍ 및 5 ㎍ 유체역학적 용량 둘 모두에서 ceDNA802(hPAH 천연 cDNA 서열)보다 더 빠른 속도로 페닐알라닌 수준("PHE μM")을 목표 농도 미만 아래로 교정하였으나, ceDNA802는 PHE 농도를 교정하지 못했다. 결과는 21일에 걸쳐 개별 마우스에 대해 제시되어 있다. ceDNA1530은 3xHS-CRM8_SERP_Enhancer, TTR-promoter-d5pUTR 및 MVM_intron을 갖는 코돈 최적화된 PAH 핵산 서열을 포함하는 ceDNA 벡터(ceDNA1530; hPAH-r5-s29)이다. 도 5d 및 도 5e에 제시된 바와 같이, ceDNA1530은 0.5 ㎍ 용량에서는 PHE 농도를 교정하는 데 효과적이지 않았지만, 1 ㎍ 용량에서는 목표 PHE 수준에 도달하였다.
실시예 7: ceDNA의 유체역학적 투여에 의한 PAH
enu2
마우스 내 페닐알라닌 수준의 생화학적 교정을 평가하기 위한 약리학적 연구 - 자가조절 돌연변이 ceDNA1274의 시험
ceDNA 벡터를 상기 실시예 1과 실시예 5에 기재된 바와 같이 제조하고 정제하였다.
코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH Codop2")의 핵산 서열은 본원에 서열번호 192로 제시되어 있으며, 이는 하기 요소를 포함한다: left-ITR_v1 : spacer_left-ITR_v2.1 : VD_Promoter Set (VD) : PmeI_site : Modified_Minimum_Consensus_Kozak : hPAH_codop_ORF_v2 : PacI_site : WPRE_3pUTR : bGH/spacer : spacer_right-ITR_v1 : right-ITR_v1 (ceDNA412).
특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH Codop2")의 핵산 서열은 본원에 서열번호 194로 제시되어 있으며, 이는 하기 요소를 포함한다: left-ITR_v1, spacer_left-ITR_v2.1, 3xSerpEnh-TTRe-TTRm, MVM_intron, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1 (ceDNA1132).
특정 시스-조절 요소를 갖고 29번 아미노산이 결실된 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH Codop2")의 핵산 서열은 본원에 서열번호 195로 제시되어 있으며, 이는 하기 요소를 포함한다: left-ITR_v1, spacer_left-ITR_v2.1, VD_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2_delta1-29aa, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1 (ceDNA1274).
특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 본원에 서열번호 210으로 제시되어 있으며, 이는 하기 요소를 포함한다: left-ITR_v1, spacer_left-ITR_v2.1, 3xVanD_TTRe_PromoterSet_v2, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1 (ceDNA1527).
ceDNA PAH 벡터(임의의 LNP 캡슐화 없이 단독으로)와 대조군을 각각 대략 약 4주령 내지 6주령의 혼성 연령 일치 PAHenu2 마우스에 투여하였다. 네이키드 ceDNA 벡터를, 0일차에 90 ml/㎏ 내지 100 ml/㎏의 용량 부피로 측면 꼬리 정맥을 통해 유체역학적 정맥내 주사로, ceDNA412, ceDNA1132 및 ceDNA1527의 경우 동물당(군당 5마리 동물) 0.5 ㎍ 또는 5 ㎍으로 투여하였고, ceDNA1527의 경우 동물당(군당 5마리 동물) 5 ㎍으로 투여하였다. 28일차는 종결 시점이었다. 연구 설계는 하기 표 17에 제시되어 있다.
[표 17]
시험 물품은 농축 스톡으로 공급하였고, 사용 시까지 약 4℃에서 보관하였다. 제형을 볼텍싱하거나 원심분리하지 않았다. 군을 처치실 내 환기 랙과 접촉된 침구가 있는 투명 폴리카보네이트 케이지에 수용하였다. 동물에게 임의로 마우스 먹이 5058과, 1 N HCl을 이용하여 2.5 내지 3.0의 목표 pH로 산성화시킨 여과된 수돗물을 제공하였다.
각각, 표 18A 및 표 18B에 따라, 중간 및 종료 시점에서 혈액을 채취하였다.
[표 18A]
[표 18B]
연구 세부사항은 하기와 같이 제공된다:
종(수, 성별, 연령): 40마리 + 예비용 2마리 PAHenu2 돌연변이(MUT) 마우스(혼성, 약 5주령 내지 10주령, 도착 시 연령 일치); 5마리 야생형(WT); 혼성, 한배새끼; 연령 일치. 동물은 투여 개시 시 약 10주령 내지 14주령이었다.
케이지 사이드 관찰: 케이지 사이드 관찰은 매일 수행하였다.
임상 관찰: 0일차에 시험 물질을 투여하고 약 1시간, 약 5시간 내지 약 6시간, 및 약 24시간 후에 임상 관찰을 수행하였으며, 이는 나머지 그룹에도 적용할 수 있다.
화합물 부류: 재조합 DNA 벡터: ceDNA
체중: 모든 동물의 체중을 -5일차, 0일차, 1일차, 2일차, 3일차, 7일차, 14일차, 21일차 및 28일차(안락사 전)에 기록하였다. 필요에 따라 추가 체중을 기록할 수 있다.
투여 제형: 시험 물품은 농축 스톡으로 공급하였다. 스톡을 실온까지 가온시키고, 사용 직전 제공된 PBS를 이용하여 희석하였다. 투여가 즉시 수행되지 않는 경우, 준비된 물질을 약 4℃에서 보관할 수 있다.
용량 투여: 0일차에, 군 1 내지 군 9에 대해 시험 물질을 측면 꼬리 정맥을 통해 동물당 설정된 부피, 90 내지 100 ml/㎏(군 내 가장 가벼운 동물에 따라 달라짐)로 유체역학적 IV 투여로 투여하였다.
채혈 전 금식: 모든 동물(모든 군)을 -5일차, 3일차, 7일차, 14일차, 21일차 및 28일차에, 모든 중간 및 종료 시 채혈 전 최소 4시간 동안 금식시켰다.
먹이를 제거하고, 침구를 교체하였다. 8시간 이하의 금식 기간 동안 각각의 중간 채혈 종결 시 먹이를 다시 제공하였다.
중간 채혈: -5일차, 3일차, 7일차, 14일차 및 21일차에, 군 1 내지 군 9의 모든 동물에서 중간 채혈을 수행하였다. 동물은 공복 시 혈청 수집을 위한 전혈을 가지고 있었다. 채취 후, 동물에게 젖산 링거액 0.5 mL 내지 1.0 mL를 피하 투여하였다.
채혈: 혈청용 전혈은 복재 정맥에서 채취하였다. 전혈을 혈전 활성화제가 포함된 혈청 분리기 튜브에 채취하고, 시설 SOP에 따라 1개의 혈청 분취량으로 처리하였다. 모든 샘플을 드라이 아이스 상에서 배송될 때까지 공칭 -70℃에서 보관하였다.
예정되지 않은 안락사: 예정된 시점 이전에 안락사시킨 빈사 상태의 동물에서 말단 조직을 채취하였다. 가능한 경우, 죽은 채로 발견된 동물에서 조직을 채취하여 보관하였다.
안락사: 28일차에, 최소 4시간 공복 후, CO2 질식, 개흉술 및 방혈을 통해 동물을 안락사시켰다.
종료 시 혈액: 채혈로부터의 전혈을 혈전 활성화제가 포함된 혈청 분리기 튜브에 채취하고, 시설 SOP에 따라 2개의 혈청 분취량으로 처리하였다. 모든 샘플을 드라이 아이스 상에서 배송될 때까지 공칭 -70℃에서 보관하였다.
페닐알라닌(PHE) 수준: Pure Honey에서 PHE 수준에 대해 혈청 샘플을 분석하였다.
활성 수준: Pure Honey에서 활성 수준에 대해 2개의 동결된 간 샘플을 분석하였다.
결과
도 6의 우측 패널에 제시된 바와 같이, 5 ㎍으로 유체역학적으로 투여될 때, 본 연구에서 시험된 모든 작제물(ceDNA412, ceDNA1132, ceDNA1274 및 ceDNA1527)은 7일의 연구 기간에 걸쳐 평균 PHE 수준(PHE μM)을 목표 농도(350 μM 미만) 아래로 교정하였다. PHE 수준은 연구 14일차경에 다시 상승하기 시작했다. 도 6a는, 예상대로 정상 PHE 수준(목표 농도 미만)을 갖는 야생형 마우스 대조군과 역시 예상대로 비히클이 투여된 PAHenu2 마우스가 높은 수준의 PHE를 나타냈음을 보여준다. 코돈 최적화된 인간 PAH 버전 2를 갖는 ceDNA 벡터는 0.5 ㎍의 용량에서 PHE 수준을 목표 교정 수준에 근접하게 교정하였으나, 교정 수준은 목표 수준 아래에 도달하지 못했다.
ceDNA1132는 이전에 생체내 연구에서 검사되었으며, 여기서 n=2/3 동물에서 PHE가 교정되었다(데이터는 제시되지 않음). ceDNA1132는 시험관내에서 잘 발현하였기 때문에, n을 증가시키기 위해 이를 생체내에서 다시 시험하였다. 도 7d 및 도 7e에 제시된 바와 같이, 5 ㎍ 용량에서, ceDNA1132 및 ceDNA1274 군의 모든 5마리 동물은 7일차에 PHE 수준(PHE μM)의 목표 농도(350 μM 미만) 아래로의 교정을 나타냈다. ceDNA412 및 ceDNA1527 군에서 단 1마리 동물만 반응하지 않았다. 또한 도 7a, 도 7c 및 도 7f에 제시된 바와 같이, 0.5 ㎍ 용량에서, 시험된 작제물 사이에서 PHE 교정의 구별 가능한 차이는 없었으나; ceDNA1527이, 단일 미반응 동물을 제외한 경우, 더 강력할 수 있는 것으로 간주된다. 종합하면, 데이터는 본 연구에서 시험된 모든 작제물이 유체역학적으로 5 ㎍으로 투여될 때 적어도 7일에 걸쳐 평균 PHE 수준을 목표 농도 아래로 교정하였음을 보여준다. 일부 군에서, 유체역학적으로 5 ㎍으로 투여될 때, 목표 수준 아래로의 교정이 개별 마우스에서 20일 이상의 긴 기간 동안 유지되었다.
실시예 8: ceDNA의 유체역학적 투여에 의한 PAH
enu2
마우스 내 페닐알라닌 수준의 생화학적 교정을 평가하기 위한 약리학적 연구 - PHE 교정에 대한 상이한 프로모터의 영향
ceDNA 벡터를 상기 실시예 1과 실시예 5에 기재된 바와 같이 제조하고 정제하였다.
코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH Codop2")의 핵산 서열은 본원에 서열번호 192로 제시되어 있으며, 이는 하기 요소를 포함한다: left-ITR_v1 : spacer_left-ITR_v2.1 : VD_Promoter Set (VD) : PmeI_site : Modified_Minimum_Consensus_Kozak : hPAH_codop_ORF_v2 : PacI_site : WPRE_3pUTR : bGH/spacer : spacer_right-ITR_v1 : right-ITR_v1 (ceDNA412).
특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 본원에 서열번호 196으로 제시되어 있으며, 이는 하기 요소를 포함한다: left-ITR_v1, spacer_left-ITR_v2.1, 3xVanD_TTRe_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH-r5-s29::hIVS1B, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1 (ceDNA1414).
특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 본원에 서열번호 197로 제시되어 있으며, 이는 하기 요소를 포함한다: left-ITR_v1, spacer_left-ITR_v2.1, 3xVanD_TTRe_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH-r5-s29::hIVS1B_33bpFlanks, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1 (ceDNA1416).
특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 본원에 서열번호 198로 제시되어 있으며, 이는 하기 요소를 포함한다: left-ITR_v1, spacer_left-ITR_v2.1, 3xVanD_TTRe_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH-r5-s29::mod-Intron_oIVS-v2_33bpFlanks, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1 (ceDNA1428).
특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 본원에 서열번호 211로 제시되어 있으며, 이는 하기 요소를 포함한다: left-ITR_v1, spacer_left-ITR_v2.1, CpGmin_hAAT_Promoter_Set, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1 1 (ceDNA1528).
ceDNA PAH 벡터(임의의 LNP 캡슐화 없이 단독으로)와 대조군을 각각 대략 약 4주령 내지 6주령의 혼성 연령 일치 PAHenu2 마우스에 투여하였다. 네이키드 ceDNA 벡터를, 0일차에 90 ml/㎏ 내지 100 ml/㎏의 용량 부피로 측면 꼬리 정맥을 통해 유체역학적 정맥내 주사로, 동물당(군당 5마리 동물) 0.5 ㎍ 또는 5 ㎍으로 투여하였다. 28일차는 종결 시점이었다. 연구 설계는 하기 표 19에 제시되어 있다.
[표 19]
각각, 표 20A 및 표 20B에 따라, 중간 및 종료 시점에서 혈액을 채취하였다.
[표 20A]
[표 20B]
연구 세부사항은 하기와 같이 제공된다:
종(수, 성별, 연령): 55마리 + 예비용 2마리 PAHenu2 돌연변이(MUT) 마우스(혼성, 약 5주령 내지 10주령, 도착 시 연령 일치); 5마리 야생형(WT); 혼성, 한배새끼; 연령 일치. 동물은 투여 개시 시 약 10주령 내지 14주령이었다.
케이지 사이드 관찰: 케이지 사이드 관찰은 매일 수행하였다.
임상 관찰: 0일차에 시험 물질을 투여하고 약 1시간, 약 5시간 내지 약 6시간, 및 약 24시간 후에 임상 관찰을 수행하였으며, 이는 나머지 그룹에도 적용할 수 있다.
화합물 부류: 재조합 DNA 벡터, ceDNA.
체중: 모든 동물의 체중을 -5일차, 0일차, 1일차, 2일차, 3일차, 7일차, 14일차, 21일차 및 29일차(안락사 전)에 기록하였다. 필요에 따라 추가 체중을 기록할 수 있다.
투여 제형: 시험 물품은 농축 스톡으로 공급하였다. 스톡을 실온까지 가온시키고, 사용 직전 제공된 PBS를 이용하여 희석하였다. 투여가 즉시 수행되지 않는 경우, 준비된 물질을 약 4℃에서 보관할 수 있다.
용량 투여: 0일차에, 군 1 내지 군 12에 대해 시험 물질을 측면 꼬리 정맥을 통해 동물당 설정된 부피, 90 내지 100 ml/㎏(군 내 가장 가벼운 동물에 따라 달라짐)로 유체역학적 IV 투여로 투여하였다.
채혈 전 금식: 모든 동물(모든 군)을 -5일차, 3일차, 7일차, 14일차, 21일차 및 29일차에, 모든 중간 및 종료 시 채혈 전 최소 4시간 동안 금식시켰다.
먹이를 제거하고, 침구를 교체하였다. 8시간 이하의 금식 기간 동안 각각의 중간 채혈 종결 시 먹이를 다시 제공하였다.
중간 채혈: -5일차, 3일차, 7일차, 14일차 및 21일차에, 군 1 내지 군 12의 모든 동물에서 중간 채혈을 수행하였다. 동물은 공복 시 혈청 수집을 위한 전혈을 가지고 있다. 채취 후, 동물에게 젖산 링거액 0.5 mL 내지 1.0 mL를 피하 투여하였다.
채혈: 혈청용 전혈은 복재 정맥에서 채취하였다. 전혈을 혈전 활성화제가 포함된 혈청 분리기 튜브에 채취하고, 시설 SOP에 따라 1개의 혈청 분취량으로 처리하였다. 모든 샘플을 드라이 아이스 상에서 배송될 때까지 공칭 -70℃에서 보관하였다.
예정되지 않은 안락사: 예정된 시점 이전에 안락사시킨 빈사 상태의 동물에서 말단 조직을 채취하였다. 가능한 경우, 죽은 채로 발견된 동물에서 조직을 채취하여 보관하였다.
안락사: 29일차에, 최소 4시간 공복 후, CO2 질식, 개흉술 및 방혈을 통해 동물을 안락사시켰다.
종료 시 혈액: 채혈로부터의 전혈을 혈전 활성화제가 포함된 혈청 분리기 튜브에 채취하고, 시설 SOP에 따라 2개의 혈청 분취량으로 처리하였다. 모든 샘플을 드라이 아이스 상에서 배송될 때까지 공칭 -70℃에서 보관하였다.
페닐알라닌(PHE) 수준: Pure Honey에서 PHE 수준에 대해 혈청 샘플을 분석하였다.
활성 수준: Pure Honey에서 활성 수준에 대해 2개의 동결된 간 샘플을 분석하였다.
결과
본 연구에서는 2개의 코돈 최적화된 인간 PAH 서열(코돈 최적화된 인간 PAH 버전 2 및 코돈 최적화된 인간 PAH 버전 2 r5-s29)을 상이한 프로모터 또는 시스-조절 요소들의 조합과 조합으로 시험하였다. 구체적으로, 각각 프로모터, 코돈 최적화된 서열, CpG 함량(예를 들어, CpGmin), 인트론 등의 상이한 조합을 갖는 하기 작제물을 시험하였다.
[표 21]
도 8a 및 도 8b, 도 9a 내지 도 9e, 도 10a 내지 도 10e, 도 11a 및 도 11b, 도 12a 내지 도 12e, 도 13a 내지 도 13e, 및 도 14a 내지 도 14e에 제시된 바와 같이, 5 ㎍ 용량에서, ceDNA1416, ceDNA1428 및 ceDNA1528(ceDNA1414 군은 아님)은 7일 이내에 5/5 마우스에서 PHE 수준(PHE μM)의 목표 농도(350 μM 미만) 아래로의 신속한 교정을 나타냈다. 도 8a 및 도 8b 및 도 9a 내지 도 9e에 제시된 바와 같이, 0.5 ㎍ 용량에서의 데이터는, ceDNA1416과 ceDNA1528이 ceDNA412보다 더 강력할 수 있음을 시사하였다(7일 후 ceDNA412의 경우 2/5 마우스와 비교하여, 4/5 마우스가 PHE 수준(PHE μM)의 목표 농도(350 μM 미만) 아래로의 교정을 나타냄). 이러한 데이터에 기반하여, CpGmin_hAAT_Promoter_Set가 표준VD 프로모터에 비해 개선을 나타낼 수 있다는 결론을 내릴 수 있다. 3xVanD_TTRe 또한 강력한 프로모터이지만, 본 데이터 세트에서 VanD(VD) 프로모터와 비교하기 위해서는 추가의 실험이 필요하다.
도 11a 및 도 11b, 도 12a 내지 도 12e, 및 도 13a 내지 도 13e에 제시된 바와 같이, ceDNA412 군(5 ㎍ 용량)의 모든 마우스(5/5)는 연구의 전체 28일 지속기간 동안 PHE 수준(PHE μM)의 목표 농도(350 μM 미만) 아래로의 교정을 나타냈다. 이러한 결과는 이전에는 확인할 수 없었으며, 유전자 발현과 효능의 놀라운 지속성을 시사한다. 시험된 다른 코돈 최적화된 작제물은 14일차 이후에 예상되는 Phe 증가를 나타냈다(5 ㎍ 용량에서).
최종적으로, 코돈 최적화된 인간 PAH 서열을 상이한 프로모터 또는 시스-조절 요소들의 조합과 조합으로 시험하는 추가 연구를 수행하였다. 구체적으로, 각각 프로모터, 코돈 최적화된 서열, CpG 함량(예를 들어, CpGmin), 인트론 등의 상이한 조합을 갖는 하기 작제물을 시험하였다.
[표 22]
모든 동물에 유체역학적으로 5 ㎍ 용량으로 투여하였다. 놀랍게도, 도 14a 내지 도 14i에 제시된 바와 같이, 시스-조절 요소와 코돈 최적화된 서열의 특정 조합은 PHE 수준(PHE μM)의 목표 농도(350 μM 미만) 아래로의 교정을 나타냈다. 특히, 3xHNF1-4 || Pro-Albumin Enh || TTR promoter 조합의 프로모터를 갖는 ceDNA1471은 5 ㎍ 용량에서 PHE 농도를 목표 값 아래로 낮추었으며, 이는 본 연구에서 ceDNA412(VD_PromoterSet || hPAH_codop_ORF_v2)보다 더 큰 효능을 나타낸다.
실시예 9: ceDNA의 유체역학적 투여에 의한 PAH
enu2
마우스 내 페닐알라닌 수준의 생화학적 교정을 평가하기 위한 약리학적 연구 - PHE 교정에 대한 상이한 프로모터 또는 프로모터 세트와 상이한 ORF의 영향
ceDNA 작제물
본 연구에서는 상이한 프로모터 또는 프로모터 세트(즉, hAAT 프로모터 및 VD 프로모터 세트)와 코돈 최적화된 PAH 서열 또는 ORF(즉, CpG 최소화되거나 최소화되지 않은 인간 PAH cDNA 및 인간 PAH 버전 2)를 갖는 ceDNA 벡터를 시험하였다. ceDNA 벡터를 상기 실시예 1과 실시예 5에 기재된 바와 같이 제조하고 정제하였다.
코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH Codop2")의 핵산 서열은 본원에 서열번호 192로 제시되어 있으며, 이는 하기 요소를 포함한다: left-ITR_v1 : spacer_left-ITR_v2.1 : VD_Promoter Set : PmeI_site : Modified_Minimum_Consensus_Kozak : hPAH_codop_ORF_v2 : PacI_site : WPRE_3pUTR : bGH/spacer : spacer_right-ITR_v1 : right-ITR_v1 (ceDNA412). ceDNA412는 실시예 9에 기재된 본 연구에서 대조군으로 작용하였다.
특정 키메라 인트론(mIVS-intron1B)과 인트론 플랭킹 영역(33bpFlanks)을 갖는 코돈 최적화된 인간 PAH 버전 2 ORF(hPAH_codop_ORF_v2)를 함유하는 ceDNA의 핵산 서열은 본원에 서열번호 546으로 제시되어 있으며, 이는 프로알부민 인핸서 및 간 핵인자 1 및 4 결합 부위의 6개의 카피(3xHNF1-4)와 조합된 hAAT 프로모터를 포함한다(ceDNA1476).
특정 키메라 인트론(mIVS-intron1B)과 인트론 플랭킹 영역(33bpFlanks)을 갖는 코돈 최적화된 인간 PAH 버전 2 ORF(hPAH_codop_ORF_v2)를 함유하는 ceDNA의 핵산 서열은 본원에 서열번호 549로 제시되어 있으며, 이는 프로알부민 인핸서 및 간 핵인자 1 결합 부위 HNF1의 5개의 카피(5xHNF1)와 조합된 hAAT 프로모터를 포함한다(ceDNA1479).
코돈 최적화된 인간 PAH CpG 최소화 cDNA 버전 1 ORF(hPAH-cDNA_0CpG1_ORF)를 함유하는 ceDNA의 핵산 서열은 본원에 서열번호 562로 제시되어 있으며, 이는 VD_Promoter Set를 포함한다(ceDNA1939).
코돈 최적화된 인간 PAH CpG 최소화 cDNA 버전 2 ORF(hPAH-cDNA_0CpG2_ORF)를 함유하는 ceDNA의 핵산 서열은 본원에 서열번호 563으로 제시되어 있으며, 이는 VD_Promoter Set를 포함한다(ceDNA1940).
코돈 최적화된 인간 PAH CpG 최소화 cDNA 버전 3 ORF(hPAH-cDNA_0CpG3_ORF)를 함유하는 ceDNA의 핵산 서열은 본원에 서열번호 564로 제시되어 있으며, 이는 VD_Promoter Set를 포함한다(ceDNA1941).
코돈 최적화된 인간 PAH CpG 최소화 cDNA 버전 4 ORF(hPAH-cDNA_0CpG4_ORF)를 함유하는 ceDNA의 핵산 서열은 본원에 서열번호 565로 제시되어 있으며, 이는 VD_Promoter Set를 포함한다(ceDNA1942).
CpG 최소화되지 않은 코돈 최적화된 인간 PAH cDNA 버전 1 ORF(hPAH-cDNA_1_ORF)를 함유하는 ceDNA의 핵산 서열은 본원에 서열번호 566으로 제시되어 있으며, 이는 VD_Promoter Set를 포함한다(ceDNA1943).
CpG 최소화되지 않은(CpG = 99) 코돈 최적화된 인간 PAH cDNA 버전 2 ORF(hPAH-cDNA_2_ORF)를 함유하는 ceDNA의 핵산 서열은 본원에 서열번호 567로 제시되어 있으며, 이는 VD_Promoter Set를 포함한다(ceDNA1944).
본 연구에 사용되고 상기 기재된 바와 같은 ceDNA 벡터의 특징은 하기 표 23에 개략되어 있다.
[표 23]
연구 설계
ceDNA PAH 벡터(임의의 LNP 캡슐화 없이 단독으로)와 대조군을 각각 대략 약 4주령 내지 6주령의 혼성 연령 일치 PAHenu2 마우스에 투여하였다. 네이키드 ceDNA 벡터를, 0일차에 90 ml/㎏ 내지 100 ml/㎏의 용량 부피로 측면 꼬리 정맥을 통해 유체역학적 정맥내 주사로, 동물당(군당 5마리 동물) 0.5 ㎍으로 투여하였다. 28일차는 종결 시점이었다. 연구 설계는 하기 표 24에 제시되어 있다.
[표 24]
각각, 표 25A 및 표 25B에 따라, 중간 및 종료 시점에서 혈액을 채취하였다.
[표 25A]
[표 25B]
연구 세부사항
종(수, 성별, 연령): 55마리 + 예비용 4마리 PAHenu2 돌연변이(MUT) 마우스(혼성, 약 6주령 내지 8주령, 도착 시 연령 일치); 5마리 야생형(WT); 혼성, 한배새끼; 연령 일치. 동물은 투여 개시 시 약 7주령 내지 9주령이었다.
케이지 사이드 관찰: 케이지 사이드 관찰은 매일 수행하였다.
임상 관찰: 0일차에 시험 물질을 투여하고 약 1시간, 약 5시간 내지 약 6시간, 및 약 24시간 후에 임상 관찰을 수행하였으며, 이는 나머지 그룹에도 적용할 수 있다.
화합물 부류: 재조합 DNA 벡터, ceDNA.
체중: 모든 동물의 체중을 -4일차, 0일차, 1일차, 2일차, 3일차, 7일차, 14일차, 21일차 및 28일차(안락사 전)에 기록하였다.
투여 제형: 시험 물품은 농축 스톡으로 공급하였다. 스톡을 실온까지 가온시키고, 사용 직전 제공된 PBS를 이용하여 희석하였다. 투여가 즉시 수행되지 않는 경우, 준비된 물질을 약 4℃에서 보관할 수 있다.
용량 투여: 0일차에, 군 1 내지 군 12에 대해 시험 물질을 측면 꼬리 정맥을 통해 동물당 설정된 부피, 90 내지 100 ml/㎏(군 내 가장 가벼운 동물에 따라 달라짐)로 유체역학적 IV 투여로 투여하였다.
채혈 전 금식: 모든 동물(모든 군)을 -4일차, 3일차, 7일차, 14일차, 21일차 및 28일차에, 모든 중간 및 종료 시 채혈 전 최소 4시간 동안 금식시켰다.
먹이를 제거하고, 침구를 교체하였다. 8시간 이하의 금식 기간 동안 각각의 중간 채혈 종결 시 먹이를 다시 제공하였다.
중간 채혈: -4일차, 3일차, 7일차, 14일차 및 21일차에, 군 1 내지 군 11의 모든 동물에서 중간 채혈을 수행하였다. 동물은 공복 시 혈청 수집을 위한 전혈을 가지고 있었다. 채취 후, 동물에게 젖산 링거액 0.5 mL 내지 1.0 mL를 피하 투여하였다.
채혈: 혈청용 전혈은 복재 정맥에서 채취하였다. 전혈을 혈전 활성화제가 포함된 혈청 분리기 튜브에 채취하고, 시설 SOP에 따라 1개의 혈청 분취량으로 처리하였다. 모든 샘플을 드라이 아이스 상에서 배송될 때까지 공칭 -70℃에서 보관하였다.
예정되지 않은 안락사: 예정된 시점 이전에 안락사시킨 빈사 상태의 동물에서 말단 조직을 채취하였다. 가능한 경우, 죽은 채로 발견된 동물에서 조직을 채취하여 보관하였다.
안락사: 28일차에, 최소 4시간 공복 후, CO2 질식, 개흉술 및 방혈을 통해 동물을 안락사시켰다.
종료 시 혈액: 채혈로부터의 전혈을 혈전 활성화제가 포함된 혈청 분리기 튜브에 채취하고, 시설 SOP에 따라 2개의 혈청 분취량으로 처리하였다. 모든 샘플을 드라이 아이스 상에서 배송될 때까지 공칭 -70℃에서 보관하였다.
페닐알라닌(PHE) 수준: Pure Honey에서 PHE 수준에 대해 혈청 샘플을 분석하였다.
활성 수준: Pure Honey에서 활성 수준에 대해 2개의 동결된 간 샘플을 분석하였다.
결과
본 연구에서는 2개의 코돈 최적화된 인간 PAH 서열(코돈 최적화된 인간 PAH 버전 2 및 코돈 최적화된 인간 PAH cDNA(CpG 최소화되거나 최소화되지 않음))을 상이한 프로모터 또는 시스-조절 요소들의 조합과 조합으로 시험하였다. 각각의 시험된 ceDNA 작제물에 함유된 특정 요소는 표 23에 개략되어 있다.
도 15a 내지 도 15i에 제시된 바와 같이, 0.5 ㎍ 용량에서, 본 연구에서 시험된 모든 ceDNA 벡터, 즉, ceDNA1476, ceDNA1939 및 ceDNA1941(나머지는 아님)은 7일 이내에 전체 5마리 마우스 중 적어도 한 마리에서 PHE 수준(PHE μM)의 목표 농도(350 μM 미만) 아래로의 신속한 교정을 나타냈다. 주목할 점은, ceDNA1476과 ceDNA1939에서, 각각 5마리 마우스 중 4마리가 PHE 수준의 목표 농도 아래로의 신속한 교정을 나타냈다는 점이다. ceDNA1479, ceDNA1940 및 ceDNA1942는 각각 350 μM 임계값(단, 그 아래는 아님)이었던 단일 마우스와 관련된 단일 시점이 있었으며, ceDNA1479, ceDNA1942, ceDNA1943 및 ceDNA1944는 350 μM 임계값에 근접한 시점이 없었다.
ceDNA1476과 ceDNA1479 사이의 유일한 구조적 차이는, 후자는 HNF1 결합 부위의 5개의 카피를 함유하지만(HNF1 카피 2개마다 10량체 스페이서가 있음), ceDNA1476은 HNF1과 HNF4의 조합(여기서 HNF1과 HNF4는 서로 번갈아 나타남)의 6개의 카피만 함유한다는 점이다. 본 발명자들은, HNF1과 HNF4의 조합이 개선된 PHE 수준 교정을 나타냈음을 발견하였다(도 15c를 도 15b와 비교함).
ceDNA1943, ceDNA1944, ceDNA1939, ceDNA1940, ceDNA1941 및 ceDNA1942 사이의 차이는, ceDNA1943과 ceDNA1944의 오픈리딩프레임이 CpG 최소화되지 않았다는 점이다. ceDNA1943 및 ceDNA1944(도 15h 및 도 15i)와 비교하여 ceDNA1939, ceDNA1940, ceDNA1941 및ceDNA1942(도 15d 내지 도 15g)에서 개선된 PHE 수준 교정은, PAH 발현, 결과적으로 PHE 수준 교정에 대한 CpG 최소화의 중요성을 보여준다.
ceDNA1471을 이용한 실시예 8에 언급된 관찰과 유사하게, 실시예 9에서, 3xHNF1-4 || Pro-Albumin Enh || TTR promoter 조합의 프로모터를 갖는 ceDNA1476은 0.5 ㎍ 용량에서 PHE 농도를 목표 값 아래로 낮추었으며, 이는 본 연구에서 대조군 ceDNA412(1x VD_PromoterSet || hPAH_codop_ORF_v2)보다 더 큰 효능을 나타낸다.
실시예 10: ceDNA의 유체역학적 투여에 의한 PAH
enu2
마우스 내 페닐알라닌 수준의 생화학적 교정을 평가하기 위한 약리학적 연구 - PHE 교정에 대한 상이한 프로모터 또는 프로모터 세트와 마우스 또는 인간 유래 PAH의 영향
ceDNA 작제물
본 연구에서는 상이한 프로모터 또는 프로모터 세트(즉, hAAT 프로모터 및 VD 프로모터 세트)와 마우스 또는 인간 유래의 코돈 최적화된 PAH 서열 또는 ORF(즉, mousePAH_codop_ORF_v2 또는 hPAH_codop_ORF_v2)를 갖는 ceDNA 벡터를 시험하였다. ceDNA 벡터를 상기 실시예 1과 실시예 5에 기재된 바와 같이 제조하고 정제하였다.
코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH Codop2")의 핵산 서열은 본원에 서열번호 192로 제시되어 있으며, 이는 하기 요소를 포함한다: left-ITR_v1 : spacer_left-ITR_v2.1 : VD_Promoter Set : PmeI_site : Modified_Minimum_Consensus_Kozak : hPAH_codop_ORF_v2 : PacI_site : WPRE_3pUTR : bGH/spacer : spacer_right-ITR_v1 : right-ITR_v1 (ceDNA412). ceDNA412는 실시예 10에 기재된 본 연구에서 대조군으로 작용하였다.
코돈 최적화된 인간 PAH CpG 최소화 cDNA 버전 1 ORF(hPAH-cDNA_0CpG1_ORF)를 함유하는 ceDNA의 핵산 서열은 본원에 서열번호 562로 제시되어 있으며, 이는 VD_Promoter Set를 포함한다(ceDNA1939). 실시예 9에서 이전에 연구된 ceDNA1939는 또한 실시예 10에 기재된 본 연구에서 대조군으로 작용하였다.
코돈 최적화된 마우스 PAH 버전 2 ORF(mousePAH_codop_ORF_v2)를 함유하는 ceDNA의 핵산 서열은 본원에 서열번호 568로 제시되어 있으며, 이는 VD_Promoter Set를 포함한다(ceDNA1955).
코돈 최적화된 인간 PAH 버전 2 ORF(hPAH_codop_ORF_v2)를 함유하는 ceDNA의 핵산 서열은 본원에 서열번호 569로 제시되어 있으며, 이는 ceDNA1476과 ceDNA1479에 존재하는 인핸서를 갖는 인간 AAT 프로모터를 포함한다(ceDNA62).
본 연구에 사용되고 상기 기재된 바와 같은 ceDNA 벡터의 특징은 하기 표 26에 개략되어 있다.
[표 26]
연구 설계
ceDNA PAH 벡터(임의의 LNP 캡슐화 없이 단독으로)와 대조군을 각각 대략 약 7주령 내지 9주령의 혼성 연령 일치 PAHenu2 마우스에 투여하였다. 네이키드 ceDNA 벡터를, 0일차에 90 ml/㎏ 내지 100 ml/㎏의 용량 부피로 측면 꼬리 정맥을 통해 유체역학적 정맥내 주사로, 동물당(군당 5마리 동물) 0.5 ㎍으로 투여하였다. 28일차는 종결 시점이었다. 연구 설계는 하기 표 27에 제시되어 있다.
[표 27]
각각, 표 28A 및 표 28B에 따라, 중간 및 종료 시점에서 혈액을 채취하였다.
[표 28A]
[표 28B]
연구 세부사항
종(수, 성별, 연령): 30마리 + 예비용 3마리 PAHenu2 돌연변이(MUT) 마우스(혼성, 약 6주령 내지 8주령, 도착 시 연령 일치); 5마리 야생형(WT); 혼성, 한배새끼; 연령 일치. 동물은 투여 개시 시 약 7주령 내지 9주령이었다.
케이지 사이드 관찰: 케이지 사이드 관찰은 매일 수행하였다.
임상 관찰: 0일차에 시험 물질을 투여하고 약 1시간, 약 5시간 내지 약 6시간, 및 약 24시간 후에 임상 관찰을 수행하였으며, 이는 나머지 그룹에도 적용할 수 있다.
화합물 부류: 재조합 DNA 벡터, ceDNA.
체중: 모든 동물의 체중을 -1일차, 0일차, 1일차, 2일차, 3일차, 7일차, 14일차, 21일차 및 28일차(안락사 전)에 기록하였다.
투여 제형: 시험 물품은 농축 스톡으로 공급하였다. 스톡을 실온까지 가온시키고, 사용 직전 제공된 PBS를 이용하여 희석하였다. 투여가 즉시 수행되지 않는 경우, 준비된 물질을 약 4℃에서 보관할 수 있다.
용량 투여: 0일차에, 군 1 내지 군 5에 대해 시험 물질을 측면 꼬리 정맥을 통해 동물당 설정된 부피, 90 내지 100 ml/㎏(군 내 가장 가벼운 동물에 따라 달라짐)로 유체역학적 IV 투여로 투여하였다.
채혈 전 금식: 모든 동물(모든 군)을 -4일차, 3일차, 7일차, 14일차, 21일차 및 28일차에, 모든 중간 및 종료 시 채혈 전 최소 4시간 동안 금식시켰다.
먹이를 제거하고, 침구를 교체하였다. 8시간 이하의 금식 기간 동안 각각의 중간 채혈 종결 시 먹이를 다시 제공하였다.
중간 채혈: -1일차, 3일차, 7일차, 14일차 및 21일차에, 군 1 내지 군 6의 모든 동물에서 중간 채혈을 수행하였다. 동물은 공복 시 혈청 수집을 위한 전혈을 가지고 있었다. 채취 후, 동물에게 젖산 링거액 0.5 mL 내지 1.0 mL를 피하 투여하였다.
채혈: 혈청용 전혈은 복재 정맥에서 채취하였다. 전혈을 혈전 활성화제가 포함된 혈청 분리기 튜브에 채취하고, 시설 SOP에 따라 1개의 혈청 분취량으로 처리하였다. 모든 샘플을 드라이 아이스 상에서 배송될 때까지 공칭 -70℃에서 보관하였다.
예정되지 않은 안락사: 예정된 시점 이전에 안락사시킨 빈사 상태의 동물에서 말단 조직을 채취하였다. 가능한 경우, 죽은 채로 발견된 동물에서 조직을 채취하여 보관하였다.
안락사: 28일차에, 최소 4시간 공복 후, CO2 질식, 개흉술 및 방혈을 통해 동물을 안락사시켰다.
종료 시 혈액: 채혈로부터의 전혈을 혈전 활성화제가 포함된 혈청 분리기 튜브에 채취하고, 시설 SOP에 따라 2개의 혈청 분취량으로 처리하였다. 모든 샘플을 드라이 아이스 상에서 배송될 때까지 공칭 -70℃에서 보관하였다.
페닐알라닌(PHE) 수준: Pure Honey에서 PHE 수준에 대해 혈청 샘플을 분석하였다.
활성 수준: Pure Honey에서 활성 수준에 대해 2개의 동결된 간 샘플을 분석하였다.
결과
본 연구는 2개의 코돈 최적화된 PAH 서열(즉, 마우스 또는 인간 코돈 최적화된 PAH 버전 2)을 상이한 프로모터(즉, VD 프로모터 세트 또는 인간 AAT 프로모터)와 조합으로 시험하였다. 각각의 시험된 ceDNA 작제물에 함유된 특정 요소는 표 26에 개략되어 있다.
도 16a 내지 도 16d에 제시된 바와 같이, 0.5 ㎍ 용량에서, 적어도 실시예 9에서 입증된 바와 같이, 코돈 최적화된 인간 PAH ORF 버전 2를 발현하는 ceDNA412와 ceDNA1939는 모두 7일 이내에 전체 5마리 마우스 중 적어도 한 마리에서 PHE 수준(PHE μM)의 목표 농도(350 μM 미만) 아래로의 신속한 교정을 나타냈다. 실시예 9에서 관찰된 바와 같이, ceDNA1939는 다시 7일 이내에 전체 5마리 마우스 중 4마리 마우스에서 신속한 PHE 교정을 나타냈다.
놀랍게도, 코돈 최적화된 마우스 PAH ORF 버전 2를 발현하는 ceDNA1955와 ceDNA62는 모두 ceDNA412와 ceDNA1939보다 우수했던 마우스에서 PHE 교정을 나타내지 않았다. ceDNA1955는 기껏해야, ceDNA1939 교정과 동등하거나 이보다 약간 더 열등한 PHE 교정을 나타낸다고 할 수 있다. ceDNA62는 PHE 교정을 전혀 나타내지 않았다. ceDNA62는 hAAT 프로모터를 갖지만, ceDNA1476 및 ceDNA1479와 같은 인핸서는 갖지 않으며(실시예 8에서 연구됨) ceDNA1528과 같은 CpG 최소화가 없다(실시예 7에서 연구됨). ceDNA62에서 PHE 교정의 결여는, hAAT 프로모터의 개선에 있어서 인핸서와 CpG 최소화의 중요성을 보여준다.
실시예 11: ceDNA의 유체역학적 투여에 의한 PAH
enu2
마우스 내 페닐알라닌 수준의 생화학적 교정을 평가하기 위한 약리학적 연구 - PHE 교정에 대한 상이한 프로모터와 이의 시스-조절 요소, 인트론 및 UTR의 영향
ceDNA 작제물
본 연구에서는 상이한 프로모터 세트(즉, hAAT 프로모터 세트 및 TTR 프로모터 세트)와 이의 각각의 시스-조절 요소, 전사 후 조절 요소, 인트론 및 UTR과, 코돈 최적화된 인간 PAH 서열 또는 ORF(즉, hPAH-r5-s29, hPAH-r5-s29::hIVS1B_33bpFlanks 또는 hPAH-r5-s29::mod-Intron_oIVS-v2_33bpFlanks)를 갖는 ceDNA 벡터를 시험하였다. ceDNA 벡터를 상기 실시예 1과 실시예 5에 기재된 바와 같이 제조하고 정제하였다.
코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH Codop2")의 핵산 서열은 본원에 서열번호 192로 제시되어 있으며, 이는 하기 요소를 포함한다: left-ITR_v1 : spacer_left-ITR_v2.1 : VD_Promoter Set (VD) : PmeI_site : Modified_Minimum_Consensus_Kozak : hPAH_codop_ORF_v2 : PacI_site : WPRE_3pUTR : bGH/spacer : spacer_right-ITR_v1 : right-ITR_v1 (ceDNA412). ceDNA412는 실시예 11에 기재된 본 연구에서 대조군으로 작용하였다.
인트론과 인트론 플랭킹 영역을 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29(hPAH-r5-s29::oIVS1B_33bpFlanks)를 함유하는 ceDNA의 핵산 서열은 본원에 서열번호 570으로 제시되어 있으며, 이는 TTR 프로모터와, 다른 인핸서(즉, PromoterSet-1471), 인트론, UTR, 제한 엔도뉴클레아제 부위, 시스 및 전사 후 조절 요소를 포함한다(ceDNA2409).
인트론과 인트론 플랭킹 영역을 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29(hPAH-r5-s29::mod-Intron_oIVS-v2_33bpFlanks)를 함유하는 ceDNA의 핵산 서열은 본원에 서열번호 571로 제시되어 있으며, 이는 TTR 프로모터와, ceDNA2409에서와 동일한 인핸서(즉, PromoterSet-1471), 인트론, UTR, 제한 엔도뉴클레아제 부위, 시스 및 전사 후 조절 요소를 포함한다(ceDNA2410).
인트론과 인트론 플랭킹 영역을 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29(hPAH-r5-s29::oIVS1B_33bpFlanks)를 함유하는 ceDNA의 핵산 서열은 본원에 서열번호 572로 제시되어 있으며, 이는 hAAT 프로모터와, 다른 인핸서(즉, PromoterSet-1476), 인트론, UTR, 제한 엔도뉴클레아제 부위, 시스 및 전사 후 조절 요소를 포함한다(ceDNA2415).
인트론과 인트론 플랭킹 영역을 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29(hPAH-r5-s29::oIVS1B_33bpFlanks)를 함유하는 ceDNA의 핵산 서열은 본원에 서열번호 573으로 제시되어 있으며, 이는 hAAT 프로모터와, 다른 인핸서(즉, PromoterSet-1479), 인트론, UTR, 제한 엔도뉴클레아제 부위, 시스 및 전사 후 조절 요소를 포함한다(ceDNA2418). ceDNA2418은 HNF 결합 부위의 카피 수와 유형의 관점에서 ceDNA2415와 상이하다.
인트론과 인트론 플랭킹 영역을 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29(hPAH-r5-s29::mod-Intron_oIVS-v2_33bpFlanks)를 함유하는 ceDNA의 핵산 서열은 본원에 서열번호 574로 제시되어 있으며, 이는 hAAT 프로모터와, ceDNA2415에서와 동일한 인핸서(즉, PromoterSet-1476), 인트론, UTR, 제한 엔도뉴클레아제 부위, 시스 및 전사 후 조절 요소를 포함한다(ceDNA2416).
인트론과 인트론 플랭킹 영역을 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29(hPAH-r5-s29::mod-Intron_oIVS-v2_33bpFlanks)를 함유하는 ceDNA의 핵산 서열은 본원에 서열번호 575로 제시되어 있으며, 이는 hAAT 프로모터와, ceDNA2418에서와 동일한 인핸서(PromoterSet-1479), 인트론, UTR, 제한 엔도뉴클레아제 부위, 시스 및 전사 후 조절 요소를 포함한다(ceDNA2419). ceDNA2419는 HNF 결합 부위의 카피 수와 유형의 관점에서 ceDNA2416과 상이하다.
인트론과 인트론 플랭킹 영역이 없는 코돈 최적화된 인간 PAH 버전 2 r5-s29(hPAH-r5-s29)를 함유하는 ceDNA의 핵산 서열은 본원에 서열번호 576으로 제시되어 있으며, 이는 TTR 프로모터와, ceDNA2409에서와 동일한 인핸서(즉, PromoterSet-1471), 인트론, UTR, 제한 엔도뉴클레아제 부위, 시스 및 전사 후 조절 요소를 포함한다(ceDNA2420).
본 연구에 사용되고 상기 기재된 바와 같은 ceDNA 벡터의 특징은 하기 표 29에 개략되어 있다.
[표 29]
연구 설계
ceDNA PAH 벡터(임의의 LNP 캡슐화 없이 단독으로)와 대조군을 각각 대략 약 6주령 내지 11주령의 혼성 연령 일치 PAHenu2 마우스에 투여하였다. 네이키드 ceDNA 벡터를, 0일차에 90 ml/㎏ 내지 100 ml/㎏의 용량 부피로 측면 꼬리 정맥을 통해 유체역학적 정맥내 주사로, 동물당(군당 5마리 동물) 0.1 ㎍(선택된 동물만) 또는 0.5 ㎍으로 투여하였다. 28일차는 종결 시점이었다. 연구 설계는 하기 표 30에 제시되어 있다.
[표 30]
각각, 표 31A 및 표 31B에 따라, 중간 및 종료 시점에서 혈액을 채취하였다.
[표 31A]
[표 31B]
연구 세부사항
종(수, 성별, 연령): 70마리 + 예비용 3마리 PAHenu2 돌연변이(MUT) 마우스(혼성, 약 6주령 내지 8주령, 도착 시 연령 일치); 5마리 야생형(WT); 혼성, 한배새끼; 연령 일치. 동물은 투여 개시 시 약 6주령 내지 11주령이었다.
케이지 사이드 관찰: 케이지 사이드 관찰은 매일 수행하였다.
임상 관찰: 0일차에 시험 물질을 투여하고 약 1시간, 약 5시간 내지 약 6시간, 및 약 24시간 후에 임상 관찰을 수행하였으며, 이는 나머지 그룹에도 적용할 수 있다.
화합물 부류: 재조합 DNA 벡터, ceDNA.
체중: 모든 동물의 체중을 -6일차, 0일차, 1일차, 2일차, 3일차, 7일차, 14일차, 21일차 및 28일차(안락사 전)에 기록하였다.
투여 제형: 시험 물품은 농축 스톡으로 공급하였다. 스톡을 실온까지 가온시키고, 사용 직전 제공된 PBS를 이용하여 희석하였다. 투여가 즉시 수행되지 않는 경우, 준비된 물질을 약 4℃에서 보관할 수 있다.
용량 투여: 0일차에, 군 1 내지 군 14에 대해 시험 물질을 측면 꼬리 정맥을 통해 동물당 설정된 부피, 90 내지 100 ml/㎏(군 내 가장 가벼운 동물에 따라 달라짐)로 유체역학적 IV 투여로 투여하였다.
채혈 전 금식: 모든 동물(모든 군)을 -6일차, 3일차, 7일차, 14일차, 21일차 및 28일차에, 모든 중간 및 종료 시 채혈 전 최소 4시간 동안 금식시켰다.
먹이를 제거하고, 침구를 교체하였다. 8시간 이하의 금식 기간 동안 각각의 중간 채혈 종결 시 먹이를 다시 제공하였다.
중간 채혈: -6일차, 3일차, 7일차, 14일차 및 21일차에, 군 1 내지 군 10의 모든 동물에서 중간 채혈을 수행하였다. 동물은 공복 시 혈청 수집을 위한 전혈을 가지고 있었다. 채취 후, 동물에게 젖산 링거액 0.5 mL 내지 1.0 mL를 피하 투여하였다.
채혈: 혈청용 전혈은 복재 정맥에서 채취하였다. 전혈을 혈전 활성화제가 포함된 혈청 분리기 튜브에 채취하고, 시설 SOP에 따라 1개의 혈청 분취량으로 처리하였다. 모든 샘플을 드라이 아이스 상에서 배송될 때까지 공칭 -70℃에서 보관하였다.
예정되지 않은 안락사: 예정된 시점 이전에 안락사시킨 빈사 상태의 동물에서 말단 조직을 채취하였다. 가능한 경우, 죽은 채로 발견된 동물에서 조직을 채취하여 보관하였다.
안락사: 28일차에, 최소 4시간 공복 후, CO2 질식, 개흉술 및 방혈을 통해 동물을 안락사시켰다.
종료 시 혈액: 채혈로부터의 전혈을 혈전 활성화제가 포함된 혈청 분리기 튜브에 채취하고, 시설 SOP에 따라 2개의 혈청 분취량으로 처리하였다. 모든 샘플을 드라이 아이스 상에서 배송될 때까지 공칭 -70℃에서 보관하였다.
페닐알라닌(PHE) 수준: Pure Honey에서 PHE 수준에 대해 혈청 샘플을 분석하였다.
활성 수준: Pure Honey에서 활성 수준에 대해 2개의 동결된 간 샘플을 분석하였다.
결과
본 연구는 2개의 코돈 최적화된 PAH 서열(즉, 마우스 또는 인간 코돈 최적화된 PAH 버전 2)을 상이한 프로모터(즉, VD 프로모터 세트 또는 인간 AAT 프로모터)와 조합으로 시험하였다. 각각의 시험된 ceDNA 작제물에 함유된 특정 요소는 표 26에 개략되어 있다.
도 17a 내지 도 17i는 본 연구의 결과를 보여준다. 도 17a에 제시된 바와 같이, 0.5 ㎍ 용량에서, ceDNA412는 7일 이내에 전체 5마리 마우스 중 5 마리 모두에서 PHE 수준(PHE μM)의 목표 농도(350 μM 미만) 아래로의 신속한 교정을 나타냈다. 특히, 마우스 중 한 마리에서, PHE 교정이 28일에 걸쳐 지속되었다. 비교하여, 실시예 8 및 실시예 9에서, ceDNA412의 경우 전체 5마리 마우스 중 4마리 마우스에서 PHE 교정이 관찰되었다.
ceDNA2409, ceDNA2410, ceDNA2415, ceDNA2418, ceDNA2416 및 ceDNA2420은 각각 7일 이내에 전체 5마리 마우스 중 적어도 1 마리에서 PHE 수준(PHE μM)의 목표 농도(350 μM 미만) 아래로의 신속한 교정을 나타냈다. 주목할 점은, ceDNA2409, ceDNA2410 및 ceDNA2415가 각각 7일 이내에 전체 5마리 마우스 중 4 마리에서, 및 3일 이내에 전체 5마리 마우스 중 적어도 1마리에서 PHE 수준(PHE μM)의 목표 농도(350 μM 미만) 아래로의 신속한 교정을 나타냈다는 점이다. 놀랍게도, ceDNA2415가 투여된 마우스 중 한 마리에서, 28일차까지 PHE 교정이 지속되었다.즉, 본 연구는, 적어도 hPAH-r5-s29::mod-Intron_oIVS-v2_33bpFlanks ORF를 발현하고, 인핸서, 인트론, UTR, 제한 엔도뉴클레아제 부위, 시스 및 전사 후 조절 요소와 함께 TTR 프로모터를 갖는 ceDNA2415가, VD 프로모터 세트와 코돈 최적화된 인간 PAH 버전 2 ORF를 보유하는 ceDNA412에 비해 우수하지는 않더라도 동등함을 보여준다. 본 연구를 도 18a 내지 도 18e에 제시된 바와 같이 0.1 ㎍의 저용량으로 반복한 경우, ceDNA2415는 현저하게 14일 이내에 전체 5마리 마우스 중 2마리에서, 및 7일 이내에 전체 5마리 마우스 중 1마리에서 PHE 수준(PHE μM)의 목표 농도(350 μM 미만) 아래로의 신속한 교정을 나타냈다.
HNF 결합 부위의 수와 유형은 달라지지만, 프로모터 자체를 포함한 모든 다른 구조 요소가 동일하게 유지되는 경우, ceDNA2418(5xHNF1)과 ceDNA2415(3xHNF1-4)의 비교, 및 ceDNA2419(5xHNF1)와 ceDNA2416(3xHNF1-4)의 비교에서와 같이, PHE 수준 교정은 절충되는 것으로 나타났다. 마우스에 0.1 ㎍의 ceDNA2418을(도 18d)을 투여한 경우와 0.1 ㎍의 ceDNA2415(도 18c)를 투여한 경우 유사한 관찰이 기록되었다. 실시예 11에서의 이러한 관찰은 ceDNA1476 및 ceDNA1479에 대한 실시예 8에서의 관찰과 일치한다.
ceDNA2409, ceDNA2410, ceDNA2415 및 ceDNA2416과 비교하여, ceDNA2420 PHE 교정 수준은 어느 시점에서도 목표 수준에 도달하지 못한 3마리 마우스로 열등하였다. ceDNA2409, ceDNA2410, ceDNA2415 및 ceDNA2416과 비교하여, ceDNA2420은 hPAH-r5-s29 ORF를 발현하지만, 임의의 인트론과 인트론 플랭킹 영역이 없다. 이러한 관찰은 hPAH-r5-s29 ORF를 개선시키는 데 있어서 인트론과 인트론 플랭킹 영역의 중요성을 강조한다.
실시예 12: ceDNA의 유체역학적 투여에 의한 PAH
enu2
마우스 내 페닐알라닌 수준의 생화학적 교정을 평가하기 위한 약리학적 연구 - PHE 교정에 대한 상이한 프로모터와 ceDNA 생산 방법의 영향
ceDNA 작제물
본 연구에서는 상이한 프로모터 세트와 이의 각각의 시스-조절 요소, 전사 후 조절 요소, 인트론 및 UTR과, 코돈 최적화된 인간 PAH 서열 또는 ORF를 갖는 ceDNA 벡터를 시험하였다. 대조군으로 사용한 ceDNA412를 제외하고, 본 연구에서의 ceDNA 벡터는 국제 특허 출원 PCT/US2019/14122에 상기 기재된 바와 같이 제조하고 정제하였다.
코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH Codop2")의 핵산 서열은 본원에 서열번호 192로 제시되어 있으며, 이는 하기 요소를 포함한다: left-ITR_v1 : spacer_left-ITR_v2.1 : VD_Promoter Set (VD) : PmeI_site : Modified_Minimum_Consensus_Kozak : hPAH_codop_ORF_v2 : PacI_site : WPRE_3pUTR : bGH/spacer : spacer_right-ITR_v1 : right-ITR_v1 (ceDNA412). ceDNA412는 실시예 12에 기재된 본 연구에서 대조군으로 작용하였다.
코돈 최적화된 인간 PAH 버전 2(hPAH_codop_ORF_v2)를 함유하는ceDNA의 핵산 서열은 본원에 서열번호 577로 제시되어 있으며, 이는 VD 프로모터 세트, 인트론, UTR, 제한 엔도뉴클레아제 부위, 시스 및 전사 후 조절 요소를 포함한다(ceDNA34).
인트론과 인트론 플랭킹 영역을 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29(hPAH-r5-s29::mod-Intron_oIVS-v2_33bpFlanks)를 함유하는 ceDNA의 핵산 서열은 본원에 서열번호 581로 제시되어 있으며, 이는 hAAT 프로모터와, 다른 인핸서(즉, PromoterSet-1476), 인트론, UTR, 제한 엔도뉴클레아제 부위, 시스 및 전사 후 조절 요소를 포함한다(ceDNA41).
코돈 최적화된 인간 PAH 버전 2(hPAH_codop_ORF_v2)를 함유하는 ceDNA의 핵산 서열은 본원에 서열번호 579로 제시되어 있으며, 이는 TTR 프로모터와, 다른 인핸서(즉, HS-CRM8_FOXA_HNF4_consensus_v1), 인트론, UTR, 제한 엔도뉴클레아제 부위, 시스 및 전사 후 조절 요소를 포함한다(ceDNA36).
인트론과 인트론 플랭킹 영역을 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29(hPAH-r5-s29::oIVS1B_33bpFlanks)를 함유하는 ceDNA의 핵산 서열은 본원에 서열번호 583으로 제시되어 있으며, 이는 TTR 프로모터와, 다른 인핸서(즉, HS-CRM8_FOXA_HNF4_consensus_v1), 인트론, UTR, 제한 엔도뉴클레아제 부위, 시스 및 전사 후 조절 요소를 포함한다(ceDNA43).
인트론과 인트론 플랭킹 영역을 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29(hPAH-r5-s29::oIVS1B_33bpFlanks)를 함유하는 ceDNA의 핵산 서열은 본원에 서열번호 582로 제시되어 있으며, 이는 TTR 프로모터와, 다른 인핸서(즉, 3x_HNF_FOXA_v1), 인트론, UTR, 제한 엔도뉴클레아제 부위, 시스 및 전사 후 조절 요소를 포함한다(ceDNA42).
본 연구에 사용되고 상기 기재된 바와 같은 ceDNA 벡터의 특징은 하기 표 32에 개략되어 있다.
[표 32]
연구 설계
ceDNA PAH 벡터(임의의 LNP 캡슐화 없이 단독으로)와 대조군을 각각 대략 약 7주령 내지 10주령의 혼성 연령 일치 PAHenu2 마우스에 투여하였다. 네이키드 ceDNA 벡터를, 0일차에 90 ml/㎏ 내지 100 ml/㎏의 용량 부피로 측면 꼬리 정맥을 통해 유체역학적 정맥내 주사로, 동물당(군당 5마리 동물) 0.1 ㎍(선택된 동물만) 또는 0.5 ㎍으로 투여하였다. 28일차는 종결 시점이었다. 연구 설계는 하기 표 33에 제시되어 있다.
[표 33]
각각, 표 34A 및 표 34B에 따라, 중간 및 종료 시점에서 혈액을 채취하였다.
[표 34A]
[표 34B]
연구 세부사항
종(수, 성별, 연령): 60마리 + 예비용 5마리 PAHenu2 돌연변이(MUT) 마우스(혼성, 약 6주령 내지 8주령, 도착 시 연령 일치); 5마리 야생형(WT); 혼성, 한배새끼; 연령 일치. 동물은 투여 개시 시 약 7주령 내지 10주령이었다.
케이지 사이드 관찰: 케이지 사이드 관찰은 매일 수행하였다.
임상 관찰: 0일차에 시험 물질을 투여하고 약 1시간, 약 5시간 내지 약 6시간, 및 약 24시간 후에 임상 관찰을 수행하였으며, 이는 나머지 그룹에도 적용할 수 있다.
화합물 부류: 재조합 DNA 벡터, ceDNA.
체중: 모든 동물의 체중을 -4일차, 0일차, 1일차, 2일차, 3일차, 7일차, 14일차, 21일차 및 28일차(안락사 전)에 기록하였다.
투여 제형: 시험 물품은 농축 스톡으로 공급하였다. 스톡을 실온까지 가온시키고, 사용 직전 제공된 PBS를 이용하여 희석하였다. 투여가 즉시 수행되지 않는 경우, 준비된 물질을 약 4℃에서 보관할 수 있다.
용량 투여: 0일차에, 군 1 내지 군 12에 대해 시험 물질을 측면 꼬리 정맥을 통해 동물당 설정된 부피, 90 내지 100 ml/㎏(군 내 가장 가벼운 동물에 따라 달라짐)로 유체역학적 IV 투여로 투여하였다.
채혈 전 금식: 모든 동물(모든 군)을 -4일차, 0일차, 1일차, 2일차, 3일차, 7일차, 14일차, 21일차 및 28일차에, 모든 중간 및 종료 시 채혈 전 최소 4시간 동안 금식시켰다.
먹이를 제거하고, 침구를 교체하였다. 8시간 이하의 금식 기간 동안 각각의 중간 채혈 종결 시 먹이를 다시 제공하였다.
중간 채혈: -4일차, 3일차, 7일차, 14일차 및 21일차에, 군 1 내지 군 12의 모든 동물에서 중간 채혈을 수행하였다. 동물은 공복 시 혈청 수집을 위한 전혈을 가지고 있었다. 채취 후, 동물에게 젖산 링거액 0.5 mL 내지 1.0 mL를 피하 투여하였다.
채혈: 혈청용 전혈은 복재 정맥에서 채취하였다. 전혈을 혈전 활성화제가 포함된 혈청 분리기 튜브에 채취하고, 시설 SOP에 따라 1개의 혈청 분취량으로 처리하였다. 모든 샘플을 드라이 아이스 상에서 배송될 때까지 공칭 -70℃에서 보관하였다.
예정되지 않은 안락사: 예정된 시점 이전에 안락사시킨 빈사 상태의 동물에서 말단 조직을 채취하였다. 가능한 경우, 죽은 채로 발견된 동물에서 조직을 채취하여 보관하였다.
안락사: 28일차에, 최소 4시간 공복 후, CO2 질식, 개흉술 및 방혈을 통해 동물을 안락사시켰다.
종료 시 혈액: 채혈로부터의 전혈을 혈전 활성화제가 포함된 혈청 분리기 튜브에 채취하고, 시설 SOP에 따라 2개의 혈청 분취량으로 처리하였다. 모든 샘플을 드라이 아이스 상에서 배송될 때까지 공칭 -70℃에서 보관하였다.
페닐알라닌(PHE) 수준: Pure Honey에서 PHE 수준에 대해 혈청 샘플을 분석하였다.
활성 수준: Pure Honey에서 활성 수준에 대해 2개의 동결된 간 샘플을 분석하였다.
결과
본 연구에서는 2개의 코돈 최적화된 PAH 서열(즉, hPAH_codop_ORF_v2 및 hPAH-r5-s29::hIVS1B_33bpFlanks)을 상이한 프로모터 또는 적어도 인핸서를 수반하는 프로모터를 갖는 프로모터 세트(즉, VD 프로모터 세트, PromoterSet-1476, 및 인핸서 중 하나로서 HS-CRM_FOXA_HNF4_consensus_v1 또는 3x_HNF4_FOXA_v1을 갖는 TTR 프로모터)와 조합으로 시험하였다. 각각의 시험된 ceDNA 작제물에 함유된 특정 요소는 표 32에 개략되어 있다.
도 19a 및 도 19b에 제시된 바와 같이, 0.5 ㎍ 용량에서, ceDNA412와 이의 상응하는 합성적으로 생산된 대응 벡터인 ceDNA34는 동등한 PAH 활성과 PHE 교정을 나타냈다. 0.5 ㎍ 용량에서, 다른 합성적으로 생산된 벡터, 즉, ceDNA36, ceDNA41 및 ceDNA43은 3일 이내에 전체 5마리 마우스 중 적어도 1 마리에서 PHE 수준(PHE μM)의 목표 농도(350 μM 미만) 아래로의 신속한 교정을 나타냈다. 특히, ceDNA41과 ceDNA43은, 투여 3일 이내에 전체 5마리 마우스 중 최대 4마리가 목표 농도 아래인 PHE 수준을 달성했다는 점에서, 대조군 ceDNA412를 능가하였다.
ceDNA36과 ceDNA43은 각각 HS-CRM_FOXA_HNF4_consensus_v1 인핸서와 조합된 TTR 프로모터를 가졌지만, ceDNA43이 hPAH-r5-s29::hIVS1B_33bpFlanks PAH 서열(CpG 함량 = 0)을 함유하고, ceDNA41이 hPAH_codop_ORF_v2 PAH 서열(CpG 함량 = 77)을 함유한다는 점에서 PAH 서열이 다르다. ceDNA36과 비교하여 ceDNA43에서의 우수한 PHE 교정은 PAH 서열에서 CpG 최소화의 중요성을 보여준다(도 19c 및 도 19e 참조). 유사하게, 상이한 생산 방법과는 별개로, ceDNA41과 ceDNA412는 또한 ceDNA41이 hPAH-r5-s29::hIVS1B_33bpFlanks PAH 서열을 함유하고, ceDNA412가 hPAH_codop_ORF_v2 PAH 서열을 함유한다는 점에서 PAH 서열이 다르다. ceDNA41은 ceDNA412와 비교하여 우수한 PHE 우수한 교정을 나타냈다(도 19d 및 도 19a 참조).
인핸서로서 HS-CRM_FOXA_HNF4_consensus_v1과 조합된 TTR 프로모터를 함유하는 벡터, 즉, ceDNA43과 ceDNA36은 모두 투여 3일 이내에 전체 5마리 마우스 중 적어도 1마리에서 PHE 교정을 나타냈으며, ceDNA43은 전체 5마리 마우스 중 4마리에서 PHE 교정을 달성하였다(도 19b 및 도 19e 참조). 놀랍게도, 동일한 TTR 프로모터와 조합으로 사용된 3x_HNF4_FOXA_v1이 HNF4 결합 부위의 3개의 카피를 함유하는 점에서 ceDNA43과 다른 ceDNA42는, 어떠한 마우스에서도 PHE 교정을 달성하지 못했다(도 19d 참조).
0.5 ㎍ 투여 연구에서 볼 수 있는 바와 같이, CpG 함량 = 0인 hPAH-r5-s29::hIVS1B_33bpFlanks PAH 서열을 발현하고, 인핸서로서HS-CRM_FOXA_HNF4_consensus_v1과 조합된 TTR 프로모터를 함유하는 합성적으로 생산된 ceDNA43은, 연구된 모든 벡터 중에서 가장 강력한 벡터였다.
따라서, 실시예 6 내지 실시예 12는, 코돈 최적화된 PAH 핵산 서열을 포함하는 ceDNA 작제물(예를 들어, ceDNA 벡터)이 페닐알라닌 수준(예를 들어, 발현 및 지속기간)의 최적 교정에 대해 시험된 특정 시스-작용 요소(예를 들어, 특정 프로모터, 특정 인핸서, 및 특정 프로모터와 인핸서 조합)와 신중하게 조합될 수 있음을 보여주었다. 나아가, 실시예 12 연구는, 합성적으로 생산된 ceDNA 작제물이 PAH 결핍 PAHenu2 마우스에서 동등하거나 더 강력한 PHE 교정을 나타냄을 입증한다.
핵산 서열:
코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH Codop2")의 핵산 서열은 하기에 제시되어 있다(ceDNA412). 프로모터에는 밑줄이 그어져 있고(서열번호 191), 코돈 최적화된 PAH 버전 2 오픈리딩프레임(ORF)에는 이중 밑줄이 그어져 있다(서열번호 382).
AAAGTAGCCGAAGATGACGGTTTGTCACATGGAGTTGGCAGGATGTTTGATTAAAAACATAACAGGAAGAAAAATGCCCCGCTGTGGGCGGACAAAATAGTTGGGAACTGGGAGGGGTGGAAATGGAGTTTTTAAGGATTATTTAGGGAAGAGTGACAAAATAGATGGGAACTGGGTGTAGCGTCGTAAGCTAATACGAAAATTAAAAATGACAAAATAGTTTGGAACTAGATTTCACTTATCTGGTTCGGATCTCCTAGGCCTGCAGGCAGCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTTGTAGTTAATGATTAACCCGCCATGCTACTTATCGCGGCCGCCGGGGGAGGCTGCTGGTGAATATTAACCAAGGTCACCCCAGTTATCGGAGGAGCAAACAGGGGCTAAGTCCACACGCGTGGTACCGTCTGTCTGCACATTTCGTAGAGCGAGTGTTCCGATACTCTAATCTCCCTAGGCAAGGTTCATATTTGTGTAGGTTACTTATTCTCCTTTTGTTGACTAAGTCAATAATCAGAATCAGCAGGTTTGGAGTCAGCTTGGCAGGGATCAGCAGCCTGGGTTGGAAGGAGGGGGTATAAAAGCCCCTTCACCAGGAGAAGCCGTCACACAGATCCACAAGCTCCTGAAGAGGTAAGGGTTTAAGGGATGGTTGGTTGGTGGGGTATTAATGTTTAATTACCTGGAGCACCTGCCTGAAATCACTTTTTTTCAGGTTGGTTTAAACCGCAGCCACCATGAGCACCGCCGTGCTGGAAAATCCTGGCCTGGGCAGAAAGCTGAGCGACTTCGGCCAAGAGACAAGCTACATCGAGGACAACTGCAACCAGAACGGCGCCATCAGCCTGATCTTCAGCCTGAAAGAAGAAGTGGGCGCCCTGGCCAAGGTGCTGAGACTGTTCGAAGAGAACGACGTGAACCTGACACACATCGAGAGCAGACCCAGCAGACTGAAGAAGGACGAGTACGAGTTCTTCACCCACCTGGACAAGCGGAGCCTGCCTGCTCTGACCAACATCATCAAGATCCTGCGGCACGACATCGGCGCCACAGTGCACGAACTGAGCCGGGACAAGAAAAAGGACACCGTGCCATGGTTCCCCAGAACCATCCAAGAGCTGGACAGATTCGCCAACCAGATCCTGAGCTATGGCGCCGAGCTGGACGCTGATCACCCTGGCTTTAAGGACCCCGTGTACCGGGCCAGAAGAAAGCAGTTTGCCGATATCGCCTACAACTACCGGCACGGCCAGCCTATTCCTCGGGTCGAGTACATGGAAGAGGAAAAGAAAACCTGGGGCACCGTGTTCAAGACCCTGAAGTCCCTGTACAAGACCCACGCCTGCTACGAGTACAACCACATCTTCCCACTGCTCGAAAAGTACTGCGGCTTCCACGAGGACAATATCCCTCAGCTTGAGGACGTGTCCCAGTTCCTGCAGACCTGCACCGGCTTTAGACTGAGGCCAGTTGCCGGACTGCTGAGCAGCAGAGATTTTCTCGGCGGCCTGGCCTTCAGAGTGTTCCACTGTACCCAGTACATCAGACACGGCAGCAAGCCCATGTACACCCCTGAGCCTGATATCTGCCACGAGCTGCTGGGACATGTGCCCCTGTTCAGCGATAGAAGCTTCGCCCAGTTCAGCCAAGAGATCGGACTGGCTTCTCTGGGAGCCCCTGACGAGTACATTGAGAAGCTGGCCACCATCTACTGGTTCACCGTGGAATTCGGCCTGTGCAAGCAGGGCGACAGCATCAAAGCTTATGGCGCTGGCCTGCTGTCTAGCTTCGGCGAGCTGCAGTACTGTCTGAGCGAGAAGCCTAAGCTGCTGCCCCTGGAACTGGAAAAGACCGCCATCCAGAACTACACCGTGACCGAGTTCCAGCCTCTGTACTACGTGGCCGAGAGCTTCAACGACGCCAAAGAAAAAGTGCGGAACTTCGCCGCCACCATTCCTCGGCCTTTCAGCGTCAGATACGACCCCTACACACAGCGGATCGAGGTGCTGGACAACACACAGCAGCTGAAAATTCTGGCCGACTCCATCAACAGCGAGATCGGCATCCTGTGCAGCGCCCTGCAGAAAATCAAGTGATAGTTAATTAAGAGCATCTTACCGCCATTTATTCCCATATTTGTTCTGTTTTTCTTGATTTGGGTATACATTTAAATGTTAATAAAACAAAATGGTGGGGCAATCATTTACATTTTTAGGGATATGTAATTACTAGTTCAGGTGTATTGCCACAAGACAAACATGTTAAGAAACTTTCCCGTTATTTACGCTCTGTTCCTGTTAATCAACCTCTGGATTACAAAATTTGTGAAAGATTGACTGATATTCTTAACTATGTTGCTCCTTTTACGCTGTGTGGATATGCTGCTTTATAGCCTCTGTATCTAGCTATTGCTTCCCGTACGGCTTTCGTTTTCTCCTCCTTGTATAAATCCTGGTTGCTGTCTCTTTTAGAGGAGTTGTGGCCCGTTGTCCGTCAACGTGGCGTGGTGTGCTCTGTGTTTGCTGACGCAACCCCCACTGGCTGGGGCATTGCCACCACCTGTCAACTCCTTTCTGGGACTTTCGCTTTCCCCCTCCCGATCGCCACGGCAGAACTCATCGCCGCCTGCCTTGCCCGCTGCTGGACAGGGGCTAGGTTGCTGGGCACTGATAATTCCGTGGTGTTGTCTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGCTCTAGAGCATGGCTACGTAGATAAGTAGCATGGCGGGTTAATCATTAACTACACCTGCAGGAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGCTGCCTGCAGGGGCGCGCCTCGAGCCATGGTGCTAGCAGCTGATGCATAGCATGCGGTACCGGGAGATGGGGGAGGCTAACTGAAACACGGAAGGAGACAATACCGGAAGGAACCCGCGCTATGACGGCAATAAAAAGACAGAATAAAACGCACGGGTGTTGGGTCGTTTGTTCATAAACGCGGGGTTCGGTCCCAGGGCTGGCACTCTGTCGATACCCCACCGAGACCCCATTGGGACCAATACGCCCGCGTTTCTTCCTTTTCCCCACCCCAACCCCCAAGTTCGGGTGAAGGCCCAGGGCTCGCAGCCAACGTCGGGGCGGCAAGCCCTGCCATAGCCACTACGGGTACGTAGGCCAACCACTAGAACTATAGCTAGAGTCCTGGGCGAACAAACGATGCTCGCCTTCCAGAAAACCGAGGATGCGAACCACTTCATCCGGGGTCAGCACCACCGGCAAGCGCCGCGACGGCCGAGGTCTACCGATCTCCTGAAGCCAGGGCAGATCCGTGCACAGCACCTTGCCGTAGAAGAACAGCAAGGCCGCCAATGCCTGACGATGCGTGGAGACCGAAACCTTGCGCTCGTTCGCCAGCCAGGACAGAAATGCCTCGACTTCGCTGCTGCCCAAGGTTGCCGGGTGACGCACACCGTGGAAACGGATGAAGGCACGAACCCAGTTGACATAAGCCTGTTCGGTTCGTAAACTGTAATGCAAGTAGCGTATGCGCTCACGCAACTGGTCCAGAACCTTGACCGAACGCAGCGGTGGTAACGGCGCAGTGGCGGTTTTCATGGCTTGTTATGACTGTTTTTTTGTACAGTCTATGCCTCGGGCATCCAAGCAGCAAGCGCGTTACGCCGTGGGTCGATGTTTGATGTTATGGAGCAGCAACGATGTTACGCAGCAGCAACGATGTTACGCAGCAGGGCAGTCGCCCTAAAACAAAGTTAGGTGGCTCAAGTATGGGCATCATTCGCACATGTAGGCTCGGCCCTGACCAAGTCAAATCCATGCGGGCTGCTCTTGATCTTTTCGGTCGTGAGTTCGGAGACGTAGCCACCTACTCCCAACATCAGCCGGACTCCGATTACCTCGGGAACTTGCTCCGTAGTAAGACATTCATCGCGCTTGCTGCCTTCGACCAAGAAGCGGTTGTTGGCGCTCTCGCGGCTTACGTTCTGCCCAGGTTTGAGCAGCCGCGTAGTGAGATCTATATCTATGATCTCGCAGTCTCCGGCGAGCACCGGAGGCAGGGCATTGCCACCGCGCTCATCAATCTCCTCAAGCATGAGGCCAACGCGCTTGGTGCTTATGTGATCTACGTGCAAGCAGATTACGGTGACGATCCCGCAGTGGCTCTCTATACAAAGTTGGGCATACGGGAAGAAGTGATGCACTTTGATATCGACCCAAGTACCGCCACCTAACAATTCGTTCAAGCCGAGATCGGCTTCCCGGCCGCGGAGTTGTTCGGTAAATTGTCACAACGCCGCGAATATAGTCTTTACCATGCCCTTGGCCACGCCCCTCTTTAATACGACGGGCAATTTGCACTTCAGAAAATGAAGAGTTTGCTTTAGCCATAACAAAAGTCCAGTATGCTTTTTCACAGCATAACTGGACTGATTTCAGTTTACAACTATTCTGTCTAGTTTAAGACTTTATTGTCATAGTTTAGATCTATTTTGTTCAGTTTAAGACTTTATTGTCCGCCCACACCCGCTTACGCAGGGCATCCATTTATTACTCAACCGTAACCGATTTTGCCAGGTTACGCGGCTGGTCTGCGGTGTGAAATACCGCACAGATGCGTAAGGAGAAAATACCGCATCAGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCAATGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGGACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGAAATTGTAAACGTTAATATTTTGTTAAAATTCGCGTTAAATTTTTGTTAAATCAGCTCATTTTTTAACCAATAGGCCGAAATCGGCAAAATCCCTTATAAATCAAAAGAATAGACCGAGATAGGGTTGAGTGTTGTTCCAGTTTGGAACAAGAGTCCACTATTAAAGAACGTGGACTCCAACGTCAAAGGGCGAAAAACCGTCTATCAGGGCGATGGCCCACTACGTGAACCATCACCCTAATCAAGTTTTTTGGGGTCGAGGTGCCGTAAAGCACTAAATCGGAACCCTAAAGGGAGCCCCCGATTTAGAGCTTGACGGGGAAAGCCGGCGAACGTGGCGAGAAAGGAAGGGAAGAAAGCGAAAGGAGCGGGCGCTAGGGCGCTGGCAAGTGTAGCGGTCACGCTGCGCGTAACCACCACACCCGCCGCGCTTAATGCGCCGCTACAGGGCGCGTCCCATTCGCCATTCAGGCTGCAAATAAGCGTTGATATTCAGTCAATTACAAACATTAATAACGAAGAGATGACAGAAAAATTTTCATTCTGTGACAGAGAA (서열번호 192)
상기 ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, VD_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1을 포함한다.
일부 구현예에 따르면, 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH Codop2")의 핵산 서열은 서열번호 192를 포함한다. 일부 구현예에 따르면, 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH Codop2")의 핵산 서열은 서열번호 192와 적어도 85% 동일하다. 일부 구현예에 따르면, 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH Codop2")의 핵산 서열은 서열번호 192와 적어도 90% 동일하다. 일부 구현예에 따르면, 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH Codop2")의 핵산 서열은 서열번호 192와 적어도 91% 동일하다. 일부 구현예에 따르면, 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH Codop2")의 핵산 서열은 서열번호 192와 적어도 92% 동일하다. 일부 구현예에 따르면, 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH Codop2")의 핵산 서열은 서열번호 192와 적어도 93% 동일하다. 일부 구현예에 따르면, 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH Codop2")의 핵산 서열은 서열번호 192와 적어도 94% 동일하다. 일부 구현예에 따르면, 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH Codop2")의 핵산 서열은 서열번호 192와 적어도 95% 동일하다. 일부 구현예에 따르면, 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH Codop2")의 핵산 서열은 서열번호 192와 적어도 96% 동일하다. 일부 구현예에 따르면, 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH Codop2")의 핵산 서열은 서열번호 192와 적어도 97% 동일하다. 일부 구현예에 따르면, 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH Codop2")의 핵산 서열은 서열번호 192와 적어도 98% 동일하다. 일부 구현예에 따르면, 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH Codop2")의 핵산 서열은 서열번호 192와 적어도 99% 동일하다. 일부 구현예에 따르면, 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH Codop2")의 핵산 서열은 서열번호 192로 이루어져 있다.
인간 PAH cDNA를 함유하는 ceDNA(코돈 최적화되지 않은 hPAH cDNA에 연결된 ceDNA VD 프로모터)의 핵산 서열이 하기에 제시되어 있다. 프로모터에는 밑줄이 그어져 있고(서열번호 191), PAH 오픈리딩프레임(ORF)에는 이중 밑줄이 그어져 있다(서열번호 394; ceDNA802).
GGCCGGCCCCTGCAGGCAGCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTTGTAGTTAATGATTAACCCGCCATGCTACTTATCTACGTAGCCATGCTCTAGACGGGGGAGGCTGCTGGTGAATATTAACCAAGGTCACCCCAGTTATCGGAGGAGCAAACAGGGGCTAAGTCCACACGCGTGGTACCGTCTGTCTGCACATTTCGTAGAGCGAGTGTTCCGATACTCTAATCTCCCTAGGCAAGGTTCATATTTGTGTAGGTTACTTATTCTCCTTTTGTTGACTAAGTCAATAATCAGAATCAGCAGGTTTGGAGTCAGCTTGGCAGGGATCAGCAGCCTGGGTTGGAAGGAGGGGGTATAAAAGCCCCTTCACCAGGAGAAGCCGTCACACAGATCCACAAGCTCCTGAAGAGGTAAGGGTTTAAGGGATGGTTGGTTGGTGGGGTATTAATGTTTAATTACCTGGAGCACCTGCCTGAAATCACTTTTTTTCAGGTTGGTTTAAACGCCGCCACCATGTCCACTGCGGTCCTGGAAAACCCAGGCTTGGGCAGGAAACTCTCTGACTTTGGACAGGAAACAAGCTATATTGAAGACAACTGCAATCAAAATGGTGCCATATCACTGATCTTCTCACTCAAAGAAGAAGTTGGTGCATTGGCCAAAGTATTGCGCTTATTTGAGGAGAATGATGTAAACCTGACCCACATTGAATCTAGACCTTCTCGTTTAAAGAAAGATGAGTATGAATTTTTCACCCATTTGGATAAACGTAGCCTGCCTGCTCTGACAAACATCATCAAGATCTTGAGGCATGACATTGGTGCCACTGTCCATGAGCTTTCACGAGATAAGAAGAAAGACACAGTGCCCTGGTTCCCAAGAACCATTCAAGAGCTGGACAGATTTGCCAATCAGATTCTCAGCTATGGAGCGGAACTGGATGCTGACCACCCTGGTTTTAAAGATCCTGTGTACCGTGCAAGACGGAAGCAGTTTGCTGACATTGCCTACAACTACCGCCATGGGCAGCCCATCCCTCGAGTGGAATACATGGAGGAAGAAAAGAAAACATGGGGCACAGTGTTCAAGACTCTGAAGTCCTTGTATAAAACCCATGCTTGCTATGAGTACAATCACATTTTTCCACTTCTTGAAAAGTACTGTGGCTTCCATGAAGATAACATTCCCCAGCTGGAAGACGTTTCTCAGTTCCTGCAGACTTGCACTGGTTTCCGCCTCCGACCTGTGGCTGGCCTGCTTTCCTCTCGGGATTTCTTGGGTGGCCTGGCCTTCCGAGTCTTCCACTGCACACAGTACATCAGACATGGATCCAAGCCCATGTATACCCCCGAACCTGACATCTGCCATGAGCTGTTGGGACATGTGCCCTTGTTTTCAGATCGCAGCTTTGCCCAGTTTTCCCAGGAAATTGGCCTTGCCTCTCTGGGTGCACCTGATGAATACATTGAAAAGCTCGCCACAATTTACTGGTTTACTGTGGAGTTTGGGCTCTGCAAACAAGGAGACTCCATAAAGGCATATGGTGCTGGGCTCCTGTCATCCTTTGGTGAATTACAGTACTGCTTATCAGAGAAGCCAAAGCTTCTCCCCCTGGAGCTGGAGAAGACAGCCATCCAAAATTACACTGTCACGGAGTTCCAGCCCCTCTATTACGTGGCAGAGAGTTTTAATGATGCCAAGGAGAAAGTAAGGAACTTTGCTGCCACAATACCTCGGCCCTTCTCAGTTCGCTACGACCCATACACCCAAAGGATTGAGGTCTTGGACAATACCCAGCAGCTTAAGATTTTGGCTGATTCCATTAACAGTGAAATTGGAATCCTTTGCAGTGCCCTCCAGAAAATAAAGTAATTAATTAAGAGCATCTTACCGCCATTTATTCCCATATTTGTTCTGTTTTTCTTGATTTGGGTATACATTTAAATGTTAATAAAACAAAATGGTGGGGCAATCATTTACATTTTTAGGGATATGTAATTACTAGTTCAGGTGTATTGCCACAAGACAAACATGTTAAGAAACTTTCCCGTTATTTACGCTCTGTTCCTGTTAATCAACCTCTGGATTACAAAATTTGTGAAAGATTGACTGATATTCTTAACTATGTTGCTCCTTTTACGCTGTGTGGATATGCTGCTTTATAGCCTCTGTATCTAGCTATTGCTTCCCGTACGGCTTTCGTTTTCTCCTCCTTGTATAAATCCTGGTTGCTGTCTCTTTTAGAGGAGTTGTGGCCCGTTGTCCGTCAACGTGGCGTGGTGTGCTCTGTGTTTGCTGACGCAACCCCCACTGGCTGGGGCATTGCCACCACCTGTCAACTCCTTTCTGGGACTTTCGCTTTCCCCCTCCCGATCGCCACGGCAGAACTCATCGCCGCCTGCCTTGCCCGCTGCTGGACAGGGGCTAGGTTGCTGGGCACTGATAATTCCGTGGTGTTGTCTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGCTCTAGAGCATGGCTACGTAGATAAGTAGCATGGCGGGTTAATCATTAACTACACCTGCAGGAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGCTGCCTGCAGGGGCGCGCCTCGAGGCATGCGGTACCAAGCTTGTCGAGAAGTACTAGAGGATCATAATCAGCCATACCACATTTGTAGAGGTTTTACTTGCTTTAAAAAACCTCCCACACCTCCCCCTGAACCTGAAACATAAAATGAATGCAATTGTTGTTGTTAACTTGTTTATTGCAGCTTATAATGGTTACAAATAAAGCAATAGCATCACAAATTTCACAAATAAAGCATTTTTTTCACTGCATTCTAGTTGTGGTTTGTCCAAACTCATCAATGTATCTTATCATGTCTGGATCTGATCACTGATATCGCCTAGGAGATCCGAACCAGATAAGTGAAATCTAGTTCCAAACTATTTTGTCATTTTTAATTTTCGTATTAGCTTACGACGCTACACCCAGTTCCCATCTATTTTGTCACTCTTCCCTAAATAATCCTTAAAAACTCCATTTCCACCCCTCCCAGTTCCCAACTATTTTGTCCGCCCACAGCGGGGCATTTTTCTTCCTGTTATGTTTTTAATCAAACATCCTGCCAACTCCATGTGACAAACCGTCATCTTCGGCTACTTTTTCTCTGTCACAGAATGAAAATTTTTCTGTCATCTCTTCGTTATTAATGTTTGTAATTGACTGAATATCAACGCTTATTTGCAGCCTGAATGGCGAATGGGACGCGCCCTGTAGCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCCTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTTGATTAGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACCCTATCTCGGTCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAATATTAACGTTTACAATTTCAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAGACAATAACCCTGATAAATGCTTCAATAATATTGAAAAAGGAAGAGTATGAGTATTCAACATTTCCGTGTCGCCCTTATTCCCTTTTTTGCGGCATTTTGCCTTCCTGTTTTTGCTCACCCAGAAACGCTGGTGAAAGTAAAAGATGCTGAAGATCAGTTGGGTGCACGAGTGGGTTACATCGAACTGGATCTCAACAGCGGTAAGATCCTTGAGAGTTTTCGCCCCGAAGAACGTTTTCCAATGATGAGCACTTTTAAAGTTCTGCTATGTGGCGCGGTATTATCCCGTATTGACGCCGGGCAAGAGCAACTCGGTCGCCGCATACACTATTCTCAGAATGACTTGGTTGAGTACTCACCAGTCACAGAAAAGCATCTTACGGATGGCATGACAGTAAGAGAATTATGCAGTGCTGCCATAACCATGAGTGATAACACTGCGGCCAACTTACTTCTGACAACGATCGGAGGACCGAAGGAGCTAACCGCTTTTTTGCACAACATGGGGGATCATGTAACTCGCCTTGATCGTTGGGAACCGGAGCTGAATGAAGCCATACCAAACGACGAGCGTGACACCACGATGCCTGTAGCAATGGCAACAACGTTGCGCAAACTATTAACTGGCGAACTACTTACTCTAGCTTCCCGGCAACAATTAATAGACTGGATGGAGGCGGATAAAGTTGCAGGACCACTTCTGCGCTCGGCCCTTCCGGCTGGCTGGTTTATTGCTGATAAATCTGGAGCCGGTGAGCGTGGGTCTCGCGGTATCATTGCAGCACTGGGGCCAGATGGTAAGCCCTCCCGTATCGTAGTTATCTACACGACGGGGAGTCAGGCAACTATGGATGAACGAAATAGACAGATCGCTGAGATAGGTGCCTCACTGATTAAGCATTGGTAACTGTCAGACCAAGTTTACTCATATATACTTTAGATTGATTTAAAACTTCATTTTTAATTTAAAAGGATCTAGGTGAAGATCCTTTTTGATAATCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTCCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCATTGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGTTCTTTCCTGCGTTATCCCCTGATTCTGTGGATAACCGTATTACCGCCTTTGAGTGAGCTGATACCGCTCGCCGCAGCCGAACGACCGAGCGCAGCGAGTCAGTGAGCGAGGAAGCGGAAGAGCGCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTCACACCGCAGACCAGCCGCGTAACCTGGCAAAATCGGTTACGGTTGAGTAATAAATGGATGCCCTGCGTAAGCGGGTGTGGGCGGACAATAAAGTCTTAAACTGAACAAAATAGATCTAAACTATGACAATAAAGTCTTAAACTAGACAGAATAGTTGTAAACTGAAATCAGTCCAGTTATGCTGTGAAAAAGCATACTGGACTTTTGTTATGGCTAAAGCAAACTCTTCATTTTCTGAAGTGCAAATTGCCCGTCGTATTAAAGAGGGGCGTGGCCAAGGGCATGGTAAAGACTATATTCGCGGCGTTGTGACAATTTACCGAACAACTCCGCGGCCGGGAAGCCGATCTCGGCTTGAACGAATTGTTAGGTGGCGGTACTTGGGTCGATATCAAAGTGCATCACTTCTTCCCGTATGCCCAACTTTGTATAGAGAGCCACTGCGGGATCGTCACCGTAATCTGCTTGCACGTAGATCACATAAGCACCAAGCGCGTTGGCCTCATGCTTGAGGAGATTGATGAGCGCGGTGGCAATGCCCTGCCTCCGGTGCTCGCCGGAGACTGCGAGATCATAGATATAGATCTCACTACGCGGCTGCTCAAACCTGGGCAGAACGTAAGCCGCGAGAGCGCCAACAACCGCTTCTTGGTCGAAGGCAGCAAGCGCGATGAATGTCTTACTACGGAGCAAGTTCCCGAGGTAATCGGAGTCCGGCTGATGTTGGGAGTAGGTGGCTACGTCTCCGAACTCACGACCGAAAAGATCAAGAGCAGCCCGCATGGATTTGACTTGGTCAGGGCCGAGCCTACATGTGCGAATGATGCCCATACTTGAGCCACCTAACTTTGTTTTAGGGCGACTGCCCTGCTGCGTAACATCGTTGCTGCTGCGTAACATCGTTGCTGCTCCATAACATCAAACATCGACCCACGGCGTAACGCGCTTGCTGCTTGGATGCCCGAGGCATAGACTGTACAAAAAAACAGTCATAACAAGCCATGAAAACCGCCACTGCGCCGTTACCACCGCTGCGTTCGGTCAAGGTTCTGGACCAGTTGCGTGAGCGCATACGCTACTTGCATTACAGTTTACGAACCGAACAGGCTTATGTCAACTGGGTTCGTGCCTTCATCCGTTTCCACGGTGTGCGTCACCCGGCAACCTTGGGCAGCAGCGAAGTCGAGGCATTTCTGTCCTGGCTGGCGAACGAGCGCAAGGTTTCGGTCTCCACGCATCGTCAGGCATTGGCGGCCTTGCTGTTCTTCTACGGCAAGGTGCTGTGCACGGATCTGCCCTGGCTTCAGGAGATCGGAAGACCTCGGCCGTCGCGGCGCTTGCCGGTGGTGCTGACCCCGGATGAAGTGGTTCGCATCCTCGGTTTTCTGGAAGGCGAGCATCGTTTGTTCGCCCAGGACTCTAGCTATAGTTCTAGTGGTTGGCTACGTATACTCCGGAATATTAATAGATCATGGAGATAATTAAAATGATAACCATCTCGCAAATAAATAAGTATTTTACTGTTTTCGTAACAGTTTTGTAATAAAAAAACCTATAAATATTCCGGATTATTCATACCGTCCCACCATCGGGCGCGGATCTCGGTCCGAAACCATGTCGTACTACCATCACCATCACCATCACGATTACGATATCCCAACGACCGAAAACCTGTATTTTCAGGGCGCCATGGGATCC (서열번호 193)
서열번호 193은 하기 요소를 포함한다. Left-ITR_v1 : spacer_left-ITR_v1 : VD_Promoter Set : PmeI_site : Consensus_Kozak : hPAH_cDNA_ORF_v3 : PacI_site : WPRE_3pUTR : bGH : spacer_right-ITR_v1 : right-ITR_v1.
일부 구현예에 따르면, 인간 PAH cDNA를 함유하는 ceDNA(코돈 최적화되지 않은 hPAH cDNA에 연결된 ceDNA VD 프로모터)의 핵산 서열은 서열번호 193을 포함한다. 일부 구현예에 따르면, 인간 PAH cDNA를 함유하는 ceDNA(코돈 최적화되지 않은 hPAH cDNA에 연결된 ceDNA VD 프로모터)의 핵산 서열은 서열번호 193과 적어도 85% 동일하다. 일부 구현예에 따르면, 인간 PAH cDNA를 함유하는 ceDNA(코돈 최적화되지 않은 hPAH cDNA에 연결된 ceDNA VD 프로모터)의 핵산 서열은 서열번호 193과 적어도 90% 동일하다. 일부 구현예에 따르면, 인간 PAH cDNA를 함유하는 ceDNA(코돈 최적화되지 않은 hPAH cDNA에 연결된 ceDNA VD 프로모터)의 핵산 서열은 서열번호 193과 적어도 91% 동일하다. 일부 구현예에 따르면, 인간 PAH cDNA를 함유하는 ceDNA(코돈 최적화되지 않은 hPAH cDNA에 연결된 ceDNA VD 프로모터)의 핵산 서열은 서열번호 193과 적어도 92% 동일하다. 일부 구현예에 따르면, 인간 PAH cDNA를 함유하는 ceDNA(코돈 최적화되지 않은 hPAH cDNA에 연결된 ceDNA VD 프로모터)의 핵산 서열은 서열번호 193과 적어도 93% 동일하다. 일부 구현예에 따르면, 인간 PAH cDNA를 함유하는 ceDNA(코돈 최적화되지 않은 hPAH cDNA에 연결된 ceDNA VD 프로모터)의 핵산 서열은 서열번호 193과 적어도 94% 동일하다. 일부 구현예에 따르면, 인간 PAH cDNA를 함유하는 ceDNA(코돈 최적화되지 않은 hPAH cDNA에 연결된 ceDNA VD 프로모터)의 핵산 서열은 서열번호 193과 적어도 95% 동일하다. 일부 구현예에 따르면, 인간 PAH cDNA를 함유하는 ceDNA(코돈 최적화되지 않은 hPAH cDNA에 연결된 ceDNA VD 프로모터)의 핵산 서열은 서열번호 193과 적어도 96% 동일하다. 일부 구현예에 따르면, 인간 PAH cDNA를 함유하는 ceDNA(코돈 최적화되지 않은 hPAH cDNA에 연결된 ceDNA VD 프로모터)의 핵산 서열은 서열번호 193과 적어도 97% 동일하다. 일부 구현예에 따르면, 인간 PAH cDNA를 함유하는 ceDNA(코돈 최적화되지 않은 hPAH cDNA에 연결된 ceDNA VD 프로모터)의 핵산 서열은 서열번호 193과 적어도 98% 동일하다. 일부 구현예에 따르면, 인간 PAH cDNA를 함유하는 ceDNA(코돈 최적화되지 않은 hPAH cDNA에 연결된 ceDNA VD 프로모터)의 핵산 서열은 서열번호 193과 적어도 99% 동일하다. 일부 구현예에 따르면, 인간 PAH cDNA를 함유하는 ceDNA(코돈 최적화되지 않은 hPAH cDNA에 연결된 ceDNA VD 프로모터)의 핵산 서열은 서열번호 193으로 이루어져 있다.
특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH Codop2")의 핵산 서열은 하기에 제시되어 있다(ceDNA1132).
CCTGCAGGCAGCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTTGTAGTTAATGATTAACCCGCCATGCTACTTATCGCGGCCGCGGGGGAGGCTGCTGGTGAATATTAACCAAGGTCACCCCAGTTATCGGAGGAGCAAACAGGGGCTAAGTCCACCGGGGGAGGCTGCTGGTGAATATTAACCAAGGTCACCCCAGTTATCGGAGGAGCAAACAGGGGCTAAGTCCACCGGGGGAGGCTGCTGGTGAATATTAACCAAGGTCACCCCAGTTATCGGAGGAGCAAACAGGGGCTAAGTCCACGGTACCCACTGGGAGGATGTTGAGTAAGATGGAAAACTACTGATGACCCTTGCAGAGACAGAGTATTAGGACATGTTTGAACAGGGGCCGGGCGATCAGCAGGTAGCTCTAGAGGATCCCCGTCTGTCTGCACATTTCGTAGAGCGAGTGTTCCGATACTCTAATCTCCCTAGGCAAGGTTCATATTTGTGTAGGTTACTTATTCTCCTTTTGTTGACTAAGTCAATAATCAGAATCAGCAGGTTTGGAGTCAGCTTGGCAGGGATCAGCAGCCTGGGTTGGAAGGAGGGGGTATAAAAGCCCCTTCACCAGGAGAAGCCGTCACACAGATCCACAAGCTCCTGAAGAGGTAAGGGTTTAAGGGATGGTTGGTTGGTGGGGTATTAATGTTTAATTACCTGGAGCACCTGCCTGAAATCACTTTTTTTCAGGTTGGGTTTAAACCGCAGCCACCATGAGCACCGCCGTGCTGGAAAATCCTGGCCTGGGCAGAAAGCTGAGCGACTTCGGCCAAGAGACAAGCTACATCGAGGACAACTGCAACCAGAACGGCGCCATCAGCCTGATCTTCAGCCTGAAAGAAGAAGTGGGCGCCCTGGCCAAGGTGCTGAGACTGTTCGAAGAGAACGACGTGAACCTGACACACATCGAGAGCAGACCCAGCAGACTGAAGAAGGACGAGTACGAGTTCTTCACCCACCTGGACAAGCGGAGCCTGCCTGCTCTGACCAACATCATCAAGATCCTGCGGCACGACATCGGCGCCACAGTGCACGAACTGAGCCGGGACAAGAAAAAGGACACCGTGCCATGGTTCCCCAGAACCATCCAAGAGCTGGACAGATTCGCCAACCAGATCCTGAGCTATGGCGCCGAGCTGGACGCTGATCACCCTGGCTTTAAGGACCCCGTGTACCGGGCCAGAAGAAAGCAGTTTGCCGATATCGCCTACAACTACCGGCACGGCCAGCCTATTCCTCGGGTCGAGTACATGGAAGAGGAAAAGAAAACCTGGGGCACCGTGTTCAAGACCCTGAAGTCCCTGTACAAGACCCACGCCTGCTACGAGTACAACCACATCTTCCCACTGCTCGAAAAGTACTGCGGCTTCCACGAGGACAATATCCCTCAGCTTGAGGACGTGTCCCAGTTCCTGCAGACCTGCACCGGCTTTAGACTGAGGCCAGTTGCCGGACTGCTGAGCAGCAGAGATTTTCTCGGCGGCCTGGCCTTCAGAGTGTTCCACTGTACCCAGTACATCAGACACGGCAGCAAGCCCATGTACACCCCTGAGCCTGATATCTGCCACGAGCTGCTGGGACATGTGCCCCTGTTCAGCGATAGAAGCTTCGCCCAGTTCAGCCAAGAGATCGGACTGGCTTCTCTGGGAGCCCCTGACGAGTACATTGAGAAGCTGGCCACCATCTACTGGTTCACCGTGGAATTCGGCCTGTGCAAGCAGGGCGACAGCATCAAAGCTTATGGCGCTGGCCTGCTGTCTAGCTTCGGCGAGCTGCAGTACTGTCTGAGCGAGAAGCCTAAGCTGCTGCCCCTGGAACTGGAAAAGACCGCCATCCAGAACTACACCGTGACCGAGTTCCAGCCTCTGTACTACGTGGCCGAGAGCTTCAACGACGCCAAAGAAAAAGTGCGGAACTTCGCCGCCACCATTCCTCGGCCTTTCAGCGTCAGATACGACCCCTACACACAGCGGATCGAGGTGCTGGACAACACACAGCAGCTGAAAATTCTGGCCGACTCCATCAACAGCGAGATCGGCATCCTGTGCAGCGCCCTGCAGAAAATCAAGTGATAGTTAATTAAGAGCATCTTACCGCCATTTATTCCCATATTTGTTCTGTTTTTCTTGATTTGGGTATACATTTAAATGTTAATAAAACAAAATGGTGGGGCAATCATTTACATTTTTAGGGATATGTAATTACTAGTTCAGGTGTATTGCCACAAGACAAACATGTTAAGAAACTTTCCCGTTATTTACGCTCTGTTCCTGTTAATCAACCTCTGGATTACAAAATTTGTGAAAGATTGACTGATATTCTTAACTATGTTGCTCCTTTTACGCTGTGTGGATATGCTGCTTTATAGCCTCTGTATCTAGCTATTGCTTCCCGTACGGCTTTCGTTTTCTCCTCCTTGTATAAATCCTGGTTGCTGTCTCTTTTAGAGGAGTTGTGGCCCGTTGTCCGTCAACGTGGCGTGGTGTGCTCTGTGTTTGCTGACGCAACCCCCACTGGCTGGGGCATTGCCACCACCTGTCAACTCCTTTCTGGGACTTTCGCTTTCCCCCTCCCGATCGCCACGGCAGAACTCATCGCCGCCTGCCTTGCCCGCTGCTGGACAGGGGCTAGGTTGCTGGGCACTGATAATTCCGTGGTGTTGTCTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGCTCTAGAGCATGGCTACGTAGATAAGTAGCATGGCGGGTTAATCATTAACTACACCTGCAGGAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGCTGCCTGCAGG (서열번호 194)
서열번호 194는 하기 요소를 포함한다. Left-ITR_v1, spacer_left-ITR_v2.1, 3xSerpEnh-TTRe-TTRm, MVM_intron, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1.
일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 194를 포함한다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 194와 적어도 85% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 194와 적어도 90% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 194와 적어도 91% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 194와 적어도 92% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 194와 적어도 93% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 194와 적어도 94% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 194와 적어도 95% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 194와 적어도 96% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 194와 적어도 97% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 194와 적어도 98% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 194와 적어도 99% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 194로 이루어진다.
특정 시스-조절 요소를 갖고 29번 아미노산이 결실된 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH Codop2")의 핵산 서열은 서열번호 195로 제시된 서열이다(ceDNA1274).
서열번호 195는 하기 요소를 포함한다. left-ITR_v1, spacer_left-ITR_v2.1, VD_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2_delta1-29aa, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1.
일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 delta1-29aa를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2_delta1-29aa")의 핵산 서열은 서열번호 195를 포함한다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 delta1-29aa를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2_delta1-29aa")의 핵산 서열은 서열번호 195와 적어도 85% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 delta1-29aa를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2_delta1-29aa")의 핵산 서열은 서열번호 195와 적어도 90% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 delta1-29aa를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2_delta1-29aa")의 핵산 서열은 서열번호 195와 적어도 91% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 delta1-29aa를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2_delta1-29aa")의 핵산 서열은 서열번호 195와 적어도 92% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 delta1-29aa를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2_delta1-29aa")의 핵산 서열은 서열번호 195와 적어도 93% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 delta1-29aa를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2_delta1-29aa")의 핵산 서열은 서열번호 195와 적어도 94% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 delta1-29aa를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2_delta1-29aa")의 핵산 서열은 서열번호 195와 적어도 95% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 delta1-29aa를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2_delta1-29aa")의 핵산 서열은 서열번호 195와 적어도 96% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 delta1-29aa를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2_delta1-29aa")의 핵산 서열은 서열번호 195와 적어도 97% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 delta1-29aa를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2_delta1-29aa")의 핵산 서열은 서열번호 195와 적어도 98% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 delta1-29aa를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2_delta1-29aa")의 핵산 서열은 서열번호 195와 적어도 99% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 delta1-29aa를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2_delta1-29aa")의 핵산 서열은 서열번호 195로 이루어진다.
특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 196으로 제시된 서열이다(ceDNA1414).
서열번호 196은 하기 요소를 포함한다. left-ITR_v1, spacer_left-ITR_v2.1, 3xVanD_TTRe_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH-r5-s29::hIVS1B, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1.
일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 196을 포함한다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 196과 적어도 85% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 196과 적어도 90% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 196과 적어도 91% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 196과 적어도 92% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 196과 적어도 93% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 196과 적어도 94% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 196과 적어도 95% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 196과 적어도 96% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 196과 적어도 97% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 196과 적어도 98% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 196과 적어도 99% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 196으로 이루어진다.
특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 197로 제시된 서열이다(ceDNA1416).
서열번호 197은 하기 요소를 포함한다. left-ITR_v1, spacer_left-ITR_v2.1, 3xVanD_TTRe_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH-r5-s29::hIVS1B_33bpFlanks, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1.
일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 197을 포함한다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 197과 적어도 85% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 197과 적어도 90% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 197과 적어도 91% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 197과 적어도 92% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 197과 적어도 93% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 197과 적어도 94% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 197과 적어도 95% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 197과 적어도 96% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 197과 적어도 97% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 197과 적어도 98% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 197과 적어도 99% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 197로 이루어진다. 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 198로 제시된 서열이다(ceDNA1428).
서열번호 198은 하기 요소를 포함한다. left-ITR_v1, spacer_left-ITR_v2.1, 3xVanD_TTRe_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH-r5-s29::mod-Intron_oIVS-v2_33bpFlanks, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1.
일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 198을 포함한다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 198과 적어도 85% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 198과 적어도 90% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 198과 적어도 91% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 198과 적어도 92% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 198과 적어도 93% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 198과 적어도 94% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 198과 적어도 95% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 198과 적어도 96% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 198과 적어도 97% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 198과 적어도 98% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 198과 적어도 99% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 198로 이루어진다.
특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 199로 제시된 서열이다(ceDNA1430).
서열번호 199는 하기 요소를 포함한다. left-ITR_v1, spacer_left-ITR_v2.1, 3xVanD_TTRe_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2_mIVS-intron1B_33bpFlanks, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1.
일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 199를 포함한다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 199와 적어도 85% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 199와 적어도 90% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 199와 적어도 91% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 199와 적어도 92% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 199와 적어도 93% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 199와 적어도 94% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 199와 적어도 95% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 199와 적어도 96% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 199와 적어도 97% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 199와 적어도 98% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 199와 적어도 99% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 199로 이루어진다.
특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 200으로 제시된 서열이다(ceDNA1432).
CCTGCAGGCAGCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTTGTAGTTAATGATTAACCCGCCATGCTACTTATCGCGGCCGCGGGGGAGGCTGCTGGTGAATATTAACCAAGGTCACCCCAGTTATCGGAGGAGCAAACAGGGGCTAAGTCCACCGGGGGAGGCTGCTGGTGAATATTAACCAAGGTCACCCCAGTTATCGGAGGAGCAAACAGGGGCTAAGTCCACCGGGGGAGGCTGCTGGTGAATATTAACCAAGGTCACCCCAGTTATCGGAGGAGCAAACAGGGGCTAAGTCCACGGTACCCACTGGGAGGATGTTGAGTAAGATGGAAAACTACTGATGACCCTTGCAGAGACAGAGTATTAGGACATGTTTGAACAGGGGCCGGGCGATCAGCAGGTAGCTCTAGAGGATCCCCGTCTGTCTGCACATTTCGTAGAGCGAGTGTTCCGATACTCTAATCTCCCTAGGCAAGGTTCATATTTGTGTAGGTTACTTATTCTCCTTTTGTTGACTAAGTCAATAATCAGAATCAGCAGGTTTGGAGTCAGCTTGGCAGGGATCAGCAGCCTGGGTTGGAAGGAGGGGGTATAAAAGCCCCTTCACCAGGAGAAGCCGTCACACAGATCCACAAGCTCCTGAAGAGGTAAGGGTTTAAGGGATGGTTGGTTGGTGGGGTATTAATGTTTAATTACCTGGAGCACCTGCCTGAAATCACTTTTTTTCAGGTTGGGTTTAAACCGCAGCCACCATGAGCACCGCCGTGCTGGAAAATCCTGGCTTGGGCAGGAAACTCTCTGACTTTGGACAGGTGAGCCACGGCAGCCTGAGCTGCTCAGTTAGGGGAATTTGGGCCTCCAGAGAAAGAGATCCGAAGACTGCTGGTGCTTCCTGGTTTCATAAGCTCAGTAAGAAGTCTGAATTCGTTGGAAGCTGATGATAGAAGAAAGAGTTCATGCTTGCTTTGTCCATGGAGGTTTAACAGGAATGAATTGCTAAACTGTGGAAAATGTTTTAAACAAATGCATCTTATCCTGTAGGAAACAAGCTATATTGAAGACAACTGCAATCAAAACGGCGCCATCAGCCTGATCTTCAGCCTGAAAGAAGAAGTGGGCGCCCTGGCCAAGGTGCTGAGACTGTTCGAAGAGAACGACGTGAACCTGACACACATCGAGAGCAGACCCAGCAGACTGAAGAAGGACGAGTACGAGTTCTTCACCCACCTGGACAAGCGGAGCCTGCCTGCTCTGACCAACATCATCAAGATCCTGCGGCACGACATCGGCGCCACAGTGCACGAACTGAGCCGGGACAAGAAAAAGGACACCGTGCCATGGTTCCCCAGAACCATCCAAGAGCTGGACAGATTCGCCAACCAGATCCTGAGCTATGGCGCCGAGCTGGACGCTGATCACCCTGGCTTTAAGGACCCCGTGTACCGGGCCAGAAGAAAGCAGTTTGCCGATATCGCCTACAACTACCGGCACGGCCAGCCTATTCCTCGGGTCGAGTACATGGAAGAGGAAAAGAAAACCTGGGGCACCGTGTTCAAGACCCTGAAGTCCCTGTACAAGACCCACGCCTGCTACGAGTACAACCACATCTTCCCACTGCTCGAAAAGTACTGCGGCTTCCACGAGGACAATATCCCTCAGCTTGAGGACGTGTCCCAGTTCCTGCAGACCTGCACCGGCTTTAGACTGAGGCCAGTTGCCGGACTGCTGAGCAGCAGAGATTTTCTCGGCGGCCTGGCCTTCAGAGTGTTCCACTGTACCCAGTACATCAGACACGGCAGCAAGCCCATGTACACCCCTGAGCCTGATATCTGCCACGAGCTGCTGGGACATGTGCCCCTGTTCAGCGATAGAAGCTTCGCCCAGTTCAGCCAAGAGATCGGACTGGCTTCTCTGGGAGCCCCTGACGAGTACATTGAGAAGCTGGCCACCATCTACTGGTTCACCGTGGAATTCGGCCTGTGCAAGCAGGGCGACAGCATCAAAGCTTATGGCGCTGGCCTGCTGTCTAGCTTCGGCGAGCTGCAGTACTGTCTGAGCGAGAAGCCTAAGCTGCTGCCCCTGGAACTGGAAAAGACCGCCATCCAGAACTACACCGTGACCGAGTTCCAGCCTCTGTACTACGTGGCCGAGAGCTTCAACGACGCCAAAGAAAAAGTGCGGAACTTCGCCGCCACCATTCCTCGGCCTTTCAGCGTCAGATACGACCCCTACACACAGCGGATCGAGGTGCTGGACAACACACAGCAGCTGAAAATTCTGGCCGACTCCATCAACAGCGAGATCGGCATCCTGTGCAGCGCCCTGCAGAAAATCAAGTGAtagTTAATTAAGAGCATCTTACCGCCATTTATTCCCATATTTGTTCTGTTTTTCTTGATTTGGGTATACATTTAAATGTTAATAAAACAAAATGGTGGGGCAATCATTTACATTTTTAGGGATATGTAATTACTAGTTCAGGTGTATTGCCACAAGACAAACATGTTAAGAAACTTTCCCGTTATTTACGCTCTGTTCCTGTTAATCAACCTCTGGATTACAAAATTTGTGAAAGATTGACTGATATTCTTAACTATGTTGCTCCTTTTACGCTGTGTGGATATGCTGCTTTATAGCCTCTGTATCTAGCTATTGCTTCCCGTACGGCTTTCGTTTTCTCCTCCTTGTATAAATCCTGGTTGCTGTCTCTTTTAGAGGAGTTGTGGCCCGTTGTCCGTCAACGTGGCGTGGTGTGCTCTGTGTTTGCTGACGCAACCCCCACTGGCTGGGGCATTGCCACCACCTGTCAACTCCTTTCTGGGACTTTCGCTTTCCCCCTCCCGATCGCCACGGCAGAACTCATCGCCGCCTGCCTTGCCCGCTGCTGGACAGGGGCTAGGTTGCTGGGCACTGATAATTCCGTGGTGTTGTCTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGCTCTAGAGCATGGCTACGTAGATAAGTAGCATGGCGGGTTAATCATTAACTACACCTGCAGGAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGCTGCCTGCAGG (서열번호 200)
서열번호 200은 하기 요소를 포함한다. left-ITR_v1, spacer_left-ITR_v2.1, 3xVanD_TTRe_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2_modified_Intron1_33bpFlanks, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1.
일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 200을 포함한다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 200과 적어도 85% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 200과 적어도 90% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 200과 적어도 91% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 200과 적어도 92% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 200과 적어도 93% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 200과 적어도 94% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 200과 적어도 95% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 200과 적어도 96% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 200과 적어도 97% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 200과 적어도 98% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 200과 적어도 99% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 200으로 이루어진다.
특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 201로 제시된 서열이다(ceDNA1436).
서열번호 202는 하기 요소를 포함한다. left-ITR_v1, spacer_left-ITR_v2.1, hAAT(979)_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1.
일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 201을 포함한다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 201과 적어도 85% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 201과 적어도 90% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 201과 적어도 91% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 201과 적어도 92% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 201과 적어도 93% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 201과 적어도 94% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 201과 적어도 95% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 201과 적어도 96% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 201과 적어도 97% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 201과 적어도 98% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 201과 적어도 99% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 201로 이루어진다.
특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 202로 제시된 서열이다(ceDNA1458).
서열번호 202는 하기 요소를 포함한다. left-ITR_v1, spacer_left-ITR_v2.1, VD_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, HBBv2_3pUTR, SV40_polyA, spacer_right-ITR_v1, right-ITR_v1.
일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 202를 포함한다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 202와 적어도 85% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 202와 적어도 90% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 202와 적어도 91% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 202와 적어도 92% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 202와 적어도 93% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 202와 적어도 94% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 202와 적어도 95% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 202와 적어도 96% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 202와 적어도 97% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 202와 적어도 98% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 202와 적어도 99% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 202로 이루어진다.
특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 203으로 제시된 서열이다(ceDNA1459).
서열번호 203은 하기 요소를 포함한다. left-ITR_v1, spacer_left-ITR_v2.1, VD_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, HBBv3_3pUTR, SV40_polyA, spacer_right-ITR_v1, right-ITR_v1.
일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 203을 포함한다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 203과 적어도 85% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 203과 적어도 90% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 203과 적어도 91% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 203과 적어도 92% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 203과 적어도 93% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 203과 적어도 94% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 203과 적어도 95% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 203과 적어도 96% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 203과 적어도 97% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 203과 적어도 98% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 203과 적어도 99% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 203으로 이루어진다.
특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 204로 제시된 서열이다(ceDNA1464).
서열번호 204는 하기 요소를 포함한다. left-ITR_v1, spacer_left-ITR_v2.1, VD_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, SV40_polyA, spacer_right-ITR_v1, right-ITR_v1.
일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 204를 포함한다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 204와 적어도 85% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 204와 적어도 90% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 204와 적어도 91% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 204와 적어도 92% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 204와 적어도 93% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 204와 적어도 94% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 204와 적어도 95% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 204와 적어도 96% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 204와 적어도 97% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 204와 적어도 98% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 204와 적어도 99% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 204로 이루어진다.
특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 205로 제시된 서열이다(ceDNA1466).
서열번호 205는 하기 요소를 포함한다. left-ITR_v1, spacer_left-ITR_v2.1, VD_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, HBBv2_3pUTR, spacer_right-ITR_v1, right-ITR_v1.
일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 205를 포함한다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 205와 적어도 85% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 205와 적어도 90% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 205와 적어도 91% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 205와 적어도 92% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 205와 적어도 93% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 205와 적어도 94% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 205와 적어도 95% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 205와 적어도 96% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 205와 적어도 97% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 205와 적어도 98% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 205와 적어도 99% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 205로 이루어진다.
특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 206으로 제시된 서열이다(ceDNA1471).
서열번호 206은 하기 요소를 포함한다. left-ITR_v1, spacer_left-ITR_v2.1, 3xHNF1-4_ProEnh_10mer, BamHI_site, TTR_liver_specific_Promoter, MVM_intron, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1.
일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 206을 포함한다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 206과 적어도 85% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 206과 적어도 90% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 206과 적어도 91% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 206과 적어도 92% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 206과 적어도 93% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 206과 적어도 94% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 206과 적어도 95% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 206과 적어도 96% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 206과 적어도 97% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 206과 적어도 98% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 206과 적어도 99% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 206으로 이루어진다.
특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 207로 제시된 서열이다(ceDNA1472).
서열번호 207은 하기 요소를 포함한다. left-ITR_v1, spacer_left-ITR_v2.1, 3xHNF1-4_ProEnh_10mer, HS-CRM8_SERP_Enhancer_nospacer, HS-CRM8_SERP_Enhancer_nospacer, BamHI_site, TTR_liver_specific_Promoter, MVM_intron, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1.
일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 207을 포함한다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 207과 적어도 85% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 207과 적어도 90% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 207과 적어도 91% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 207과 적어도 92% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 207과 적어도 93% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 207과 적어도 94% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 207과 적어도 95% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 207과 적어도 96% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 207과 적어도 97% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 207과 적어도 98% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 207과 적어도 99% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 207로 이루어진다.
특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 208로 제시된 서열이다(ceDNA1473).
서열번호 208은 하기 요소를 포함한다. left-ITR_v1, spacer_left-ITR_v2.1, CpGfree20mer_1, 5xHNF1_ProEnh_10mer, BamHI_site, TTR_liver_specific_Promoter, MVM_intron, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1.
일부 구현예에 따르면, 특정 시스-요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 208을 포함한다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 208과 적어도 85% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 208과 적어도 90% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 2082와 적어도 91% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 208과 적어도 92% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 208과 적어도 93% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 208과 적어도 94% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 208과 적어도 95% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 208과 적어도 96% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 208과 적어도 97% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 208과 적어도 98% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 208과 적어도 99% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 208로 이루어진다.
특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 209로 제시된 서열이다(ceDNA1474).
서열번호 209는 하기 요소를 포함한다. left-ITR_v1, spacer_left-ITR_v2.1, CpGfree20mer_1, 5xHNF1_ProEnh_10mer, 3xVanD_TTRe_PromoterSet_v2, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1.
일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 209를 포함한다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 209와 적어도 85% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 209와 적어도 90% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 209와 적어도 91% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 209와 적어도 92% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 209와 적어도 93% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 209와 적어도 94% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 209와 적어도 95% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 209와 적어도 96% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 209와 적어도 97% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 209와 적어도 98% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 209와 적어도 99% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 209로 이루어진다.
특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 210으로 제시된 서열이다(ceDNA1527).
서열번호 210은 하기 요소를 포함한다. left-ITR_v1, spacer_left-ITR_v2.1, 3xVanD_TTRe_PromoterSet_v2, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1.
일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 210을 포함한다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 210과 적어도 85% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 210과 적어도 90% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 210과 적어도 91% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 210과 적어도 92% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 210과 적어도 93% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 210과 적어도 94% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 210과 적어도 95% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 210과 적어도 96% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 210과 적어도 97% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 210과 적어도 98% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 210과 적어도 99% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 210으로 이루어진다.
특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 211로 제시된 서열이다(ceDNA1528).
서열번호 211은 하기 요소를 포함한다. left-ITR_v1, spacer_left-ITR_v2.1, CpGmin_hAAT_Promoter_Set, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1.
일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 211을 포함한다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 211과 적어도 85% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 211과 적어도 90% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 211과 적어도 91% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 211과 적어도 92% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 211과 적어도 93% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 211과 적어도 94% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 211과 적어도 95% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 211과 적어도 96% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 211과 적어도 97% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 211과 적어도 98% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 211과 적어도 99% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 211로 이루어진다.
특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r3-s34를 함유하는 ceDNA(ceDNA "hPAH-r3-s34")의 핵산 서열은 서열번호 212로 제시된 서열이다(ceDNA1529).
서열번호 212는 하기 요소를 포함한다. left-ITR_v1, spacer_left-ITR_v2, HS-CRM8_SERP_Enhancer_nospacer, HS-CRM8_SERP_Enhancer_nospacer, HS-CRM8_SERP_Enhancer_nospacer, BamHI_site, TTR-promoter-d5pUTR, MVM_intron, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH-r3-s34, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1.
일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r3-s34를 함유하는 ceDNA(ceDNA "hPAH-r3-s34")의 핵산 서열은 서열번호 212를 포함한다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r3-s34를 함유하는 ceDNA(ceDNA "hPAH-r3-s34")의 핵산 서열은 서열번호 212와 적어도 85% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r3-s34를 함유하는 ceDNA(ceDNA "hPAH-r3-s34")의 핵산 서열은 서열번호 212와 적어도 90% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r3-s34를 함유하는 ceDNA(ceDNA "hPAH-r3-s34")의 핵산 서열은 서열번호 212와 적어도 91% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r3-s34를 함유하는 ceDNA(ceDNA "hPAH-r3-s34")의 핵산 서열은 서열번호 212와 적어도 92% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r3-s34를 함유하는 ceDNA(ceDNA "hPAH-r3-s34")의 핵산 서열은 서열번호 212와 적어도 93% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r3-s34를 함유하는 ceDNA(ceDNA "hPAH-r3-s34")의 핵산 서열은 서열번호 212와 적어도 94% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r3-s34")의 핵산 서열은 서열번호 212와 적어도 95% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r3-s34를 함유하는 ceDNA(ceDNA "hPAH-r3-s34")의 핵산 서열은 서열번호 212와 적어도 96% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r3-s34를 함유하는 ceDNA(ceDNA "hPAH-r3-s34")의 핵산 서열은 서열번호 212와 적어도 97% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r3-s34를 함유하는 ceDNA(ceDNA "hPAH-r3-s34")의 핵산 서열은 서열번호 212와 적어도 98% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r3-s34를 함유하는 ceDNA(ceDNA "hPAH-r3-s34")의 핵산 서열은 서열번호 212와 적어도 99% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r3-s34를 함유하는 ceDNA(ceDNA "hPAH-r3-s34")의 핵산 서열은 서열번호 212로 이루어진다.
특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 213으로 제시된 서열이다(ceDNA1530).
서열번호 213은 하기 요소를 포함한다: left-ITR_v1, spacer_left-ITR_v2, HS-CRM8_SERP_Enhancer_nospacer, HS-CRM8_SERP_Enhancer_nospacer, HS-CRM8_SERP_Enhancer_nospacer, BamHI_site, TTR-promoter-d5pUTR, MVM_intron, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH-r5-s29, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1.
일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 213을 포함한다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 213과 적어도 85% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 213과 적어도 90% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 213과 적어도 91% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 213과 적어도 92% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 213과 적어도 93% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 213과 적어도 94% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 213과 적어도 95% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 213과 적어도 96% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 213과 적어도 97% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 213과 적어도 98% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 213과 적어도 99% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 213으로 이루어진다.
추가의 전장 ceDNA PAH 작제물 서열은 표 35에 제시되어 있다. 일부 구현예에서, 전장 ceDNA PAH 작제물 서열의 핵산 서열은 표 35에 제시된 임의의 서열과 적어도 90% 동일하다. 일부 구현예에서, 전장 ceDNA PAH 작제물 서열의 핵산 서열은 표 35에 제시된 임의의 서열과 적어도 95% 동일하다. 일부 구현예에서, 전장 ceDNA PAH 작제물 서열의 핵산 서열은 표 35에 제시된 임의의 서열과 적어도 96% 동일하다. 일부 구현예에서, 전장 ceDNA PAH 작제물 서열의 핵산 서열은 표 35에 제시된 임의의 서열과 적어도 97% 동일하다. 일부 구현예에서, 전장 ceDNA PAH 작제물 서열의 핵산 서열은 표 35에 제시된 임의의 서열과 적어도 98% 동일하다. 일부 구현예에서, 전장 ceDNA PAH 작제물 서열의 핵산 서열은 표 35에 제시된 임의의 서열과 적어도 99% 동일하다. 일부 구현예에서, 전장 ceDNA PAH 작제물 서열의 핵산 서열은 표 35에 제시된 임의의 서열을 포함한다. 일부 구현예에서, 전장 ceDNA PAH 작제물 서열의 핵산 서열은 표 35에 제시된 임의의 서열로 이루어진다.
[표 35]
참고문헌
본 명세서 및 본원의 실시예에 인용된, 비제한적으로, 특허 및 특허 출원을 포함하는 모든 간행물 및 참고문헌은, 각각의 개별적인 간행물 또는 참고문헌이 구체적으로 및 개별적으로 완전하게 기재된 것으로서 본원에 참조로서 인용되는 것으로 표시된 바와 같이, 그 전문이 본원에 참조로서 인용된다. 본 출원이 우선권을 주장하는 임의의 특허 출원 또한 간행물 및 참고문헌에 대해 상기 기재된 방식으로 본원에 참조로서 인용된다.
SEQUENCE LISTING
<110> GENERATION BIO CO.
KEENAN, Jessica Lynn
<120> CLOSED-ENDED DNA VECTORS AND USES THEREOF FOR
EXPRESSING PHENYLALANINE HYDROXYLASE (PAH)
<130> 131698-08120
<140>
<141>
<150> 63/078,954
<151> 2020-09-16
<160> 1026
<170> PatentIn version 3.5
<210> 1
<211> 141
<212> DNA
<213> Adeno-associated virus 2
<400> 1
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120
gagcgcgcag ctgcctgcag g 141
<210> 2
<211> 141
<212> DNA
<213> Adeno-associated virus 2
<400> 2
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc t 141
<210> 3
<400> 3
000
<210> 4
<400> 4
000
<210> 5
<211> 143
<212> DNA
<213> Adeno-associated virus 1
<400> 5
ttgcccactc cctctctgcg cgctcgctcg ctcggtgggg cctgcggacc aaaggtccgc 60
agacggcaga ggtctcctct gccggcccca ccgagcgagc gacgcgcgca gagagggagt 120
gggcaactcc atcactaggg taa 143
<210> 6
<211> 144
<212> DNA
<213> Adeno-associated virus 3
<400> 6
ttggccactc cctctatgcg cactcgctcg ctcggtgggg cctggcgacc aaaggtcgcc 60
agacggacgt gggtttccac gtccggcccc accgagcgag cgagtgcgca tagagggagt 120
ggccaactcc atcactagag gtat 144
<210> 7
<211> 127
<212> DNA
<213> Adeno-associated virus 4
<400> 7
ttggccactc cctctatgcg cgctcgctca ctcactcggc cctggagacc aaaggtctcc 60
agactgccgg cctctggccg gcagggccga gtgagtgagc gagcgcgcat agagggagtg 120
gccaact 127
<210> 8
<211> 166
<212> DNA
<213> Adeno-associated virus 5
<400> 8
tcccccctgt cgcgttcgct cgctcgctgg ctcgtttggg ggggcgacgg ccagagggcc 60
gtcgtctggc agctctttga gctgccaccc ccccaaacga gccagcgagc gagcgaacgc 120
gacagggggg agagtgccac actctcaagc aagggggttt tgtaag 166
<210> 9
<211> 144
<212> DNA
<213> Adeno-associated virus 6
<400> 9
ttgcccactc cctctaatgc gcgctcgctc gctcggtggg gcctgcggac caaaggtccg 60
cagacggcag aggtctcctc tgccggcccc accgagcgag cgagcgcgca tagagggagt 120
gggcaactcc atcactaggg gtat 144
<210> 10
<211> 143
<212> DNA
<213> Adeno-associated virus 1
<400> 10
ttaccctagt gatggagttg cccactccct ctctgcgcgc gtcgctcgct cggtggggcc 60
ggcagaggag acctctgccg tctgcggacc tttggtccgc aggccccacc gagcgagcga 120
gcgcgcagag agggagtggg caa 143
<210> 11
<211> 144
<212> DNA
<213> Adeno-associated virus 3
<400> 11
atacctctag tgatggagtt ggccactccc tctatgcgca ctcgctcgct cggtggggcc 60
ggacgtggaa acccacgtcc gtctggcgac ctttggtcgc caggccccac cgagcgagcg 120
agtgcgcata gagggagtgg ccaa 144
<210> 12
<211> 127
<212> DNA
<213> Adeno-associated virus 4
<400> 12
agttggccac attagctatg cgcgctcgct cactcactcg gccctggaga ccaaaggtct 60
ccagactgcc ggcctctggc cggcagggcc gagtgagtga gcgagcgcgc atagagggag 120
tggccaa 127
<210> 13
<211> 166
<212> DNA
<213> Adeno-associated virus 5
<400> 13
cttacaaaac ccccttgctt gagagtgtgg cactctcccc cctgtcgcgt tcgctcgctc 60
gctggctcgt ttgggggggt ggcagctcaa agagctgcca gacgacggcc ctctggccgt 120
cgccccccca aacgagccag cgagcgagcg aacgcgacag ggggga 166
<210> 14
<211> 144
<212> DNA
<213> Adeno-associated virus 6
<400> 14
atacccctag tgatggagtt gcccactccc tctatgcgcg ctcgctcgct cggtggggcc 60
ggcagaggag acctctgccg tctgcggacc tttggtccgc aggccccacc gagcgagcga 120
gcgcgcatta gagggagtgg gcaa 144
<210> 15
<211> 120
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 15
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
cgcacgcccg ggtttcccgg gcggcctcag tgagcgagcg agcgcgcagc tgcctgcagg 120
<210> 16
<211> 122
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 16
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgacgcccg ggctttgccc gggcggcctc agtgagcgag cgagcgcgca gctgcctgca 120
gg 122
<210> 17
<211> 129
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 17
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgacc aaaggtcgcc cgacgcccgg gcgcctcagt gagcgagcga gcgcgcagct 120
gcctgcagg 129
<210> 18
<211> 101
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 18
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ctttgcctca gtgagcgagc gagcgcgcag ctgcctgcag g 101
<210> 19
<211> 139
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 19
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgaca aagtcgcccg acgcccgggc tttgcccggg cggcctcagt gagcgagcga 120
gcgcgcagct gcctgcagg 139
<210> 20
<211> 137
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 20
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgaaa atcgcccgac gcccgggctt tgcccgggcg gcctcagtga gcgagcgagc 120
gcgcagctgc ctgcagg 137
<210> 21
<211> 135
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 21
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgaaa cgcccgacgc ccgggctttg cccgggcggc ctcagtgagc gagcgagcgc 120
gcagctgcct gcagg 135
<210> 22
<211> 133
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 22
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcaaag cccgacgccc gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc 120
agctgcctgc agg 133
<210> 23
<211> 139
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 23
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgacc aaaggtcgcc cgacgcccgg gtttcccggg cggcctcagt gagcgagcga 120
gcgcgcagct gcctgcagg 139
<210> 24
<211> 137
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 24
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgacc aaaggtcgcc cgacgcccgg tttccgggcg gcctcagtga gcgagcgagc 120
gcgcagctgc ctgcagg 137
<210> 25
<211> 135
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 25
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgacc aaaggtcgcc cgacgcccgt ttcgggcggc ctcagtgagc gagcgagcgc 120
gcagctgcct gcagg 135
<210> 26
<211> 133
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 26
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgacc aaaggtcgcc cgacgccctt tgggcggcct cagtgagcga gcgagcgcgc 120
agctgcctgc agg 133
<210> 27
<211> 131
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 27
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgacc aaaggtcgcc cgacgccttt ggcggcctca gtgagcgagc gagcgcgcag 120
ctgcctgcag g 131
<210> 28
<211> 129
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 28
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgacc aaaggtcgcc cgacgctttg cggcctcagt gagcgagcga gcgcgcagct 120
gcctgcagg 129
<210> 29
<211> 127
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 29
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgacc aaaggtcgcc cgacgtttcg gcctcagtga gcgagcgagc gcgcagctgc 120
ctgcagg 127
<210> 30
<211> 122
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 30
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgacc aaaggtcgcc cgacggcctc agtgagcgag cgagcgcgca gctgcctgca 120
gg 122
<210> 31
<211> 130
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 31
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgacc aaaggtcgcc cgacgcccgg gcggcctcag tgagcgagcg agcgcgcagc 120
tgcctgcagg 130
<210> 32
<211> 120
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 32
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggaaacc cgggcgtgcg 60
cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact aggggttcct 120
<210> 33
<211> 122
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 33
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgt cgggcgacct ttggtcgccc 60
ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc aactccatca ctaggggttc 120
ct 122
<210> 34
<211> 122
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 34
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc aactccatca ctaggggttc 120
ct 122
<210> 35
<211> 129
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 35
cctgcaggca gctgcgcgct cgctcgctca ctgaggcgcc cgggcgtcgg gcgacctttg 60
gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg agtggccaac tccatcacta 120
ggggttcct 129
<210> 36
<211> 101
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 36
cctgcaggca gctgcgcgct cgctcgctca ctgaggcaaa gcctcagtga gcgagcgagc 60
gcgcagagag ggagtggcca actccatcac taggggttcc t 101
<210> 37
<211> 139
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 37
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacttt gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg agtggccaac 120
tccatcacta ggggttcct 139
<210> 38
<211> 137
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 38
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgatttt cgcccggcct cagtgagcga gcgagcgcgc agagagggag tggccaactc 120
catcactagg ggttcct 137
<210> 39
<211> 135
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 39
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgtttcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg gccaactcca 120
tcactagggg ttcct 135
<210> 40
<211> 133
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 40
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggctttgcc cggcctcagt gagcgagcga gcgcgcagag agggagtggc caactccatc 120
actaggggtt cct 133
<210> 41
<211> 139
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 41
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggaaacc cgggcgtcgg 60
gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg agtggccaac 120
tccatcacta ggggttcct 139
<210> 42
<211> 137
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 42
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccggaaaccg ggcgtcgggc 60
gacctttggt cgcccggcct cagtgagcga gcgagcgcgc agagagggag tggccaactc 120
catcactagg ggttcct 137
<210> 43
<211> 135
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 43
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgaaacggg cgtcgggcga 60
cctttggtcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg gccaactcca 120
tcactagggg ttcct 135
<210> 44
<211> 133
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 44
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccaaagggcg tcgggcgacc 60
tttggtcgcc cggcctcagt gagcgagcga gcgcgcagag agggagtggc caactccatc 120
actaggggtt cct 133
<210> 45
<211> 131
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 45
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc caaaggcgtc gggcgacctt 60
tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca actccatcac 120
taggggttcc t 131
<210> 46
<211> 129
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 46
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc aaagcgtcgg gcgacctttg 60
gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg agtggccaac tccatcacta 120
ggggttcct 129
<210> 47
<211> 127
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 47
cctgcaggca gctgcgcgct cgctcgctca ctgaggccga aacgtcgggc gacctttggt 60
cgcccggcct cagtgagcga gcgagcgcgc agagagggag tggccaactc catcactagg 120
ggttcct 127
<210> 48
<211> 122
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 48
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgacc aaaggtcgcc cgacggcctc agtgagcgag cgagcgcgca gctgcctgca 120
gg 122
<210> 49
<211> 12
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 49
cgatcgttcg at 12
<210> 50
<211> 12
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 50
atcgaaccat cg 12
<210> 51
<211> 12
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 51
atcgaacgat cg 12
<210> 52
<211> 165
<212> DNA
<213> Adeno-associated virus 2
<400> 52
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgcccgggc aaagcccggg cgtcgggcga cctttggtcg cccggcctca gtgagcgagc 120
gagcgcgcag agagggagtg gccaactcca tcactagggg ttcct 165
<210> 53
<211> 140
<212> DNA
<213> Adeno-associated virus 2
<400> 53
cccctagtga tggagttggc cactccctct ctgcgcgctc gctcgctcac tgaggccgcc 60
cgggcaaagc ccgggcgtcg ggcgaccttt ggtcgcccgg cctcagtgag cgagcgagcg 120
cgcagagaga tcactagggg 140
<210> 54
<211> 90
<212> DNA
<213> Adeno-associated virus 2
<400> 54
gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggg cgacctttgg 60
tcgcccggcc tcagtgagcg agcgagcgcg 90
<210> 55
<211> 91
<212> DNA
<213> Adeno-associated virus 2
<400> 55
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggctttgc 60
ccgggcggcc tcagtgagcg agcgagcgcg c 91
<210> 56
<400> 56
000
<210> 57
<400> 57
000
<210> 58
<400> 58
000
<210> 59
<400> 59
000
<210> 60
<211> 16
<212> DNA
<213> Adeno-associated virus 2
<400> 60
gcgcgctcgc tcgctc 16
<210> 61
<211> 6
<212> DNA
<213> Adeno-associated virus 2
<400> 61
ggttga 6
<210> 62
<211> 4
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown: TRS
sequence
<400> 62
agtt 4
<210> 63
<211> 6
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown: TRS
sequence
<400> 63
ggttgg 6
<210> 64
<211> 6
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown: TRS
sequence
<400> 64
agttgg 6
<210> 65
<211> 6
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown: TRS
sequence
<400> 65
agttga 6
<210> 66
<211> 6
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown: TRS
sequence
<400> 66
rrttrr 6
<210> 67
<400> 67
000
<210> 68
<400> 68
000
<210> 69
<211> 8
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 69
actgaggc 8
<210> 70
<211> 8
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 70
gcctcagt 8
<210> 71
<211> 16
<212> DNA
<213> Adeno-associated virus 2
<400> 71
gagcgagcga gcgcgc 16
<210> 72
<400> 72
000
<210> 73
<400> 73
000
<210> 74
<400> 74
000
<210> 75
<400> 75
000
<210> 76
<400> 76
000
<210> 77
<400> 77
000
<210> 78
<400> 78
000
<210> 79
<400> 79
000
<210> 80
<400> 80
000
<210> 81
<400> 81
000
<210> 82
<400> 82
000
<210> 83
<400> 83
000
<210> 84
<400> 84
000
<210> 85
<400> 85
000
<210> 86
<400> 86
000
<210> 87
<400> 87
000
<210> 88
<400> 88
000
<210> 89
<400> 89
000
<210> 90
<211> 7
<212> PRT
<213> Simian virus 40
<400> 90
Pro Lys Lys Lys Arg Lys Val
1 5
<210> 91
<211> 21
<212> DNA
<213> Simian virus 40
<400> 91
cccaagaaga agaggaaggt g 21
<210> 92
<211> 16
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown: Nucleoplasmin
peptide
<400> 92
Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1 5 10 15
<210> 93
<211> 9
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown: c-myc
peptide
<400> 93
Pro Ala Ala Lys Arg Val Lys Leu Asp
1 5
<210> 94
<211> 11
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown: c-myc
peptide
<400> 94
Arg Gln Arg Arg Asn Glu Leu Lys Arg Ser Pro
1 5 10
<210> 95
<211> 38
<212> PRT
<213> Homo sapiens
<400> 95
Asn Gln Ser Ser Asn Phe Gly Pro Met Lys Gly Gly Asn Phe Gly Gly
1 5 10 15
Arg Ser Ser Gly Pro Tyr Gly Gly Gly Gly Gln Tyr Phe Ala Lys Pro
20 25 30
Arg Asn Gln Gly Gly Tyr
35
<210> 96
<211> 42
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown: IBB domain from
importin-alpha polypeptide
<400> 96
Arg Met Arg Ile Glx Phe Lys Asn Lys Gly Lys Asp Thr Ala Glu Leu
1 5 10 15
Arg Arg Arg Arg Val Glu Val Ser Val Glu Leu Arg Lys Ala Lys Lys
20 25 30
Asp Glu Gln Ile Leu Lys Arg Arg Asn Val
35 40
<210> 97
<211> 8
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown: myoma T protein
peptide
<400> 97
Val Ser Arg Lys Arg Pro Arg Pro
1 5
<210> 98
<211> 8
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown: myoma T protein
peptide
<400> 98
Pro Pro Lys Lys Ala Arg Glu Asp
1 5
<210> 99
<211> 8
<212> PRT
<213> Homo sapiens
<400> 99
Pro Gln Pro Lys Lys Lys Pro Leu
1 5
<210> 100
<211> 12
<212> PRT
<213> Mus sp.
<400> 100
Ser Ala Leu Ile Lys Lys Lys Lys Lys Met Ala Pro
1 5 10
<210> 101
<400> 101
000
<210> 102
<400> 102
000
<210> 103
<400> 103
000
<210> 104
<400> 104
000
<210> 105
<400> 105
000
<210> 106
<400> 106
000
<210> 107
<400> 107
000
<210> 108
<400> 108
000
<210> 109
<400> 109
000
<210> 110
<400> 110
000
<210> 111
<400> 111
000
<210> 112
<400> 112
000
<210> 113
<211> 79
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 113
gcgcgctcgc tcgctcactg aggccgcccg ggcgtcgggc gacctttggt cgcccggcct 60
cagtgagcga gcgagcgcg 79
<210> 114
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 114
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggcggcct 60
cagtgagcga gcgagcgcgc 80
<210> 115
<400> 115
000
<210> 116
<400> 116
000
<210> 117
<211> 5
<212> PRT
<213> Influenza virus
<400> 117
Asp Arg Leu Arg Arg
1 5
<210> 118
<211> 7
<212> PRT
<213> Influenza virus
<400> 118
Pro Lys Gln Lys Lys Arg Lys
1 5
<210> 119
<211> 10
<212> PRT
<213> Hepatitis virus
<400> 119
Arg Lys Leu Lys Lys Lys Ile Lys Lys Leu
1 5 10
<210> 120
<211> 10
<212> PRT
<213> Mus sp.
<400> 120
Arg Glu Lys Lys Lys Phe Leu Lys Arg Arg
1 5 10
<210> 121
<211> 20
<212> PRT
<213> Homo sapiens
<400> 121
Lys Arg Lys Gly Asp Glu Val Asp Gly Val Asp Glu Val Ala Lys Lys
1 5 10 15
Lys Ser Lys Lys
20
<210> 122
<211> 17
<212> PRT
<213> Homo sapiens
<400> 122
Arg Lys Cys Leu Gln Ala Gly Met Asn Leu Glu Ala Arg Lys Thr Lys
1 5 10 15
Lys
<210> 123
<400> 123
000
<210> 124
<400> 124
000
<210> 125
<400> 125
000
<210> 126
<400> 126
000
<210> 127
<400> 127
000
<210> 128
<400> 128
000
<210> 129
<400> 129
000
<210> 130
<400> 130
000
<210> 131
<400> 131
000
<210> 132
<400> 132
000
<210> 133
<400> 133
000
<210> 134
<400> 134
000
<210> 135
<400> 135
000
<210> 136
<400> 136
000
<210> 137
<400> 137
000
<210> 138
<400> 138
000
<210> 139
<400> 139
000
<210> 140
<400> 140
000
<210> 141
<400> 141
000
<210> 142
<400> 142
000
<210> 143
<400> 143
000
<210> 144
<400> 144
000
<210> 145
<400> 145
000
<210> 146
<400> 146
000
<210> 147
<400> 147
000
<210> 148
<400> 148
000
<210> 149
<400> 149
000
<210> 150
<400> 150
000
<210> 151
<400> 151
000
<210> 152
<400> 152
000
<210> 153
<400> 153
000
<210> 154
<400> 154
000
<210> 155
<400> 155
000
<210> 156
<400> 156
000
<210> 157
<400> 157
000
<210> 158
<400> 158
000
<210> 159
<400> 159
000
<210> 160
<400> 160
000
<210> 161
<400> 161
000
<210> 162
<400> 162
000
<210> 163
<400> 163
000
<210> 164
<400> 164
000
<210> 165
<400> 165
000
<210> 166
<400> 166
000
<210> 167
<400> 167
000
<210> 168
<400> 168
000
<210> 169
<400> 169
000
<210> 170
<400> 170
000
<210> 171
<400> 171
000
<210> 172
<400> 172
000
<210> 173
<400> 173
000
<210> 174
<400> 174
000
<210> 175
<400> 175
000
<210> 176
<400> 176
000
<210> 177
<400> 177
000
<210> 178
<400> 178
000
<210> 179
<400> 179
000
<210> 180
<400> 180
000
<210> 181
<400> 181
000
<210> 182
<400> 182
000
<210> 183
<400> 183
000
<210> 184
<400> 184
000
<210> 185
<400> 185
000
<210> 186
<400> 186
000
<210> 187
<400> 187
000
<210> 188
<400> 188
000
<210> 189
<400> 189
000
<210> 190
<400> 190
000
<210> 191
<211> 225
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 191
ccgtctgtct gcacatttcg tagagcgagt gttccgatac tctaatctcc ctaggcaagg 60
ttcatatttg tgtaggttac ttattctcct tttgttgact aagtcaataa tcagaatcag 120
caggtttgga gtcagcttgg cagggatcag cagcctgggt tggaaggagg gggtataaaa 180
gccccttcac caggagaagc cgtcacacag atccacaagc tcctg 225
<210> 192
<211> 7551
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 192
aaagtagccg aagatgacgg tttgtcacat ggagttggca ggatgtttga ttaaaaacat 60
aacaggaaga aaaatgcccc gctgtgggcg gacaaaatag ttgggaactg ggaggggtgg 120
aaatggagtt tttaaggatt atttagggaa gagtgacaaa atagatggga actgggtgta 180
gcgtcgtaag ctaatacgaa aattaaaaat gacaaaatag tttggaacta gatttcactt 240
atctggttcg gatctcctag gcctgcaggc agctgcgcgc tcgctcgctc actgaggccg 300
cccgggcaaa gcccgggcgt cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag 360
cgcgcagaga gggagtggcc aactccatca ctaggggttc cttgtagtta atgattaacc 420
cgccatgcta cttatcgcgg ccgccggggg aggctgctgg tgaatattaa ccaaggtcac 480
cccagttatc ggaggagcaa acaggggcta agtccacacg cgtggtaccg tctgtctgca 540
catttcgtag agcgagtgtt ccgatactct aatctcccta ggcaaggttc atatttgtgt 600
aggttactta ttctcctttt gttgactaag tcaataatca gaatcagcag gtttggagtc 660
agcttggcag ggatcagcag cctgggttgg aaggaggggg tataaaagcc ccttcaccag 720
gagaagccgt cacacagatc cacaagctcc tgaagaggta agggtttaag ggatggttgg 780
ttggtggggt attaatgttt aattacctgg agcacctgcc tgaaatcact ttttttcagg 840
ttggtttaaa ccgcagccac catgagcacc gccgtgctgg aaaatcctgg cctgggcaga 900
aagctgagcg acttcggcca agagacaagc tacatcgagg acaactgcaa ccagaacggc 960
gccatcagcc tgatcttcag cctgaaagaa gaagtgggcg ccctggccaa ggtgctgaga 1020
ctgttcgaag agaacgacgt gaacctgaca cacatcgaga gcagacccag cagactgaag 1080
aaggacgagt acgagttctt cacccacctg gacaagcgga gcctgcctgc tctgaccaac 1140
atcatcaaga tcctgcggca cgacatcggc gccacagtgc acgaactgag ccgggacaag 1200
aaaaaggaca ccgtgccatg gttccccaga accatccaag agctggacag attcgccaac 1260
cagatcctga gctatggcgc cgagctggac gctgatcacc ctggctttaa ggaccccgtg 1320
taccgggcca gaagaaagca gtttgccgat atcgcctaca actaccggca cggccagcct 1380
attcctcggg tcgagtacat ggaagaggaa aagaaaacct ggggcaccgt gttcaagacc 1440
ctgaagtccc tgtacaagac ccacgcctgc tacgagtaca accacatctt cccactgctc 1500
gaaaagtact gcggcttcca cgaggacaat atccctcagc ttgaggacgt gtcccagttc 1560
ctgcagacct gcaccggctt tagactgagg ccagttgccg gactgctgag cagcagagat 1620
tttctcggcg gcctggcctt cagagtgttc cactgtaccc agtacatcag acacggcagc 1680
aagcccatgt acacccctga gcctgatatc tgccacgagc tgctgggaca tgtgcccctg 1740
ttcagcgata gaagcttcgc ccagttcagc caagagatcg gactggcttc tctgggagcc 1800
cctgacgagt acattgagaa gctggccacc atctactggt tcaccgtgga attcggcctg 1860
tgcaagcagg gcgacagcat caaagcttat ggcgctggcc tgctgtctag cttcggcgag 1920
ctgcagtact gtctgagcga gaagcctaag ctgctgcccc tggaactgga aaagaccgcc 1980
atccagaact acaccgtgac cgagttccag cctctgtact acgtggccga gagcttcaac 2040
gacgccaaag aaaaagtgcg gaacttcgcc gccaccattc ctcggccttt cagcgtcaga 2100
tacgacccct acacacagcg gatcgaggtg ctggacaaca cacagcagct gaaaattctg 2160
gccgactcca tcaacagcga gatcggcatc ctgtgcagcg ccctgcagaa aatcaagtga 2220
tagttaatta agagcatctt accgccattt attcccatat ttgttctgtt tttcttgatt 2280
tgggtataca tttaaatgtt aataaaacaa aatggtgggg caatcattta catttttagg 2340
gatatgtaat tactagttca ggtgtattgc cacaagacaa acatgttaag aaactttccc 2400
gttatttacg ctctgttcct gttaatcaac ctctggatta caaaatttgt gaaagattga 2460
ctgatattct taactatgtt gctcctttta cgctgtgtgg atatgctgct ttatagcctc 2520
tgtatctagc tattgcttcc cgtacggctt tcgttttctc ctccttgtat aaatcctggt 2580
tgctgtctct tttagaggag ttgtggcccg ttgtccgtca acgtggcgtg gtgtgctctg 2640
tgtttgctga cgcaaccccc actggctggg gcattgccac cacctgtcaa ctcctttctg 2700
ggactttcgc tttccccctc ccgatcgcca cggcagaact catcgccgcc tgccttgccc 2760
gctgctggac aggggctagg ttgctgggca ctgataattc cgtggtgttg tctgtgcctt 2820
ctagttgcca gccatctgtt gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg 2880
ccactcccac tgtcctttcc taataaaatg aggaaattgc atcgcattgt ctgagtaggt 2940
gtcattctat tctggggggt ggggtggggc aggacagcaa gggggaggat tgggaagaca 3000
atagcaggca tgctggggat gcggtgggct ctatggctct agagcatggc tacgtagata 3060
agtagcatgg cgggttaatc attaactaca cctgcaggag gaacccctag tgatggagtt 3120
ggccactccc tctctgcgcg ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg 3180
acgcccgggc ggcctcagtg agcgagcgag cgcgcagctg cctgcagggg cgcgcctcga 3240
gccatggtgc tagcagctga tgcatagcat gcggtaccgg gagatggggg aggctaactg 3300
aaacacggaa ggagacaata ccggaaggaa cccgcgctat gacggcaata aaaagacaga 3360
ataaaacgca cgggtgttgg gtcgtttgtt cataaacgcg gggttcggtc ccagggctgg 3420
cactctgtcg ataccccacc gagaccccat tgggaccaat acgcccgcgt ttcttccttt 3480
tccccacccc aacccccaag ttcgggtgaa ggcccagggc tcgcagccaa cgtcggggcg 3540
gcaagccctg ccatagccac tacgggtacg taggccaacc actagaacta tagctagagt 3600
cctgggcgaa caaacgatgc tcgccttcca gaaaaccgag gatgcgaacc acttcatccg 3660
gggtcagcac caccggcaag cgccgcgacg gccgaggtct accgatctcc tgaagccagg 3720
gcagatccgt gcacagcacc ttgccgtaga agaacagcaa ggccgccaat gcctgacgat 3780
gcgtggagac cgaaaccttg cgctcgttcg ccagccagga cagaaatgcc tcgacttcgc 3840
tgctgcccaa ggttgccggg tgacgcacac cgtggaaacg gatgaaggca cgaacccagt 3900
tgacataagc ctgttcggtt cgtaaactgt aatgcaagta gcgtatgcgc tcacgcaact 3960
ggtccagaac cttgaccgaa cgcagcggtg gtaacggcgc agtggcggtt ttcatggctt 4020
gttatgactg tttttttgta cagtctatgc ctcgggcatc caagcagcaa gcgcgttacg 4080
ccgtgggtcg atgtttgatg ttatggagca gcaacgatgt tacgcagcag caacgatgtt 4140
acgcagcagg gcagtcgccc taaaacaaag ttaggtggct caagtatggg catcattcgc 4200
acatgtaggc tcggccctga ccaagtcaaa tccatgcggg ctgctcttga tcttttcggt 4260
cgtgagttcg gagacgtagc cacctactcc caacatcagc cggactccga ttacctcggg 4320
aacttgctcc gtagtaagac attcatcgcg cttgctgcct tcgaccaaga agcggttgtt 4380
ggcgctctcg cggcttacgt tctgcccagg tttgagcagc cgcgtagtga gatctatatc 4440
tatgatctcg cagtctccgg cgagcaccgg aggcagggca ttgccaccgc gctcatcaat 4500
ctcctcaagc atgaggccaa cgcgcttggt gcttatgtga tctacgtgca agcagattac 4560
ggtgacgatc ccgcagtggc tctctataca aagttgggca tacgggaaga agtgatgcac 4620
tttgatatcg acccaagtac cgccacctaa caattcgttc aagccgagat cggcttcccg 4680
gccgcggagt tgttcggtaa attgtcacaa cgccgcgaat atagtcttta ccatgccctt 4740
ggccacgccc ctctttaata cgacgggcaa tttgcacttc agaaaatgaa gagtttgctt 4800
tagccataac aaaagtccag tatgcttttt cacagcataa ctggactgat ttcagtttac 4860
aactattctg tctagtttaa gactttattg tcatagttta gatctatttt gttcagttta 4920
agactttatt gtccgcccac acccgcttac gcagggcatc catttattac tcaaccgtaa 4980
ccgattttgc caggttacgc ggctggtctg cggtgtgaaa taccgcacag atgcgtaagg 5040
agaaaatacc gcatcaggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc 5100
gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa 5160
tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt 5220
aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa 5280
aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt 5340
ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg 5400
tccgcctttc tcccttcggg aagcgtggcg ctttctcaat gctcacgctg taggtatctc 5460
agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc 5520
gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta 5580
tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct 5640
acagagttct tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc 5700
tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa 5760
caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa 5820
aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa 5880
aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt 5940
ttaaattaaa aatgaagttt taaatcaatc taaagtatat atgagtaaac ttggtctgac 6000
agttaccaat gcttaatcag tgaggcacct atctcagcga tctgtctatt tcgttcatcc 6060
atagttgcct gactccccgt cgtgtagata actacgatac gggagggctt accatctggc 6120
cccagtgctg caatgatacc gcgagaccca cgctcaccgg ctccagattt atcagcaata 6180
aaccagccag ccggaagggc cgagcgcaga agtggtcctg caactttatc cgcctccatc 6240
cagtctatta attgttgccg ggaagctaga gtaagtagtt cgccagttaa tagtttgcgc 6300
aacgttgttg ccattgctac aggcatcgtg gtgtcacgct cgtcgtttgg tatggcttca 6360
ttcagctccg gttcccaacg atcaaggcga gttacatgat cccccatgtt gtgcaaaaaa 6420
gcggttagct ccttcggtcc tccgatcgtt gtcagaagta agttggccgc agtgttatca 6480
ctcatggtta tggcagcact gcataattct cttactgtca tgccatccgt aagatgcttt 6540
tctgtgactg gtgagtactc aaccaagtca ttctgagaat agtgtatgcg gcgaccgagt 6600
tgctcttgcc cggcgtcaat acgggataat accgcgccac atagcagaac tttaaaagtg 6660
ctcatcattg gaaaacgttc ttcggggcga aaactctcaa ggatcttacc gctgttgaga 6720
tccagttcga tgtaacccac tcgtgcaccc aactgatctt cagcatcttt tactttcacc 6780
agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg aataagggcg 6840
acacggaaat gttgaatact catactcttc ctttttcaat attattgaag catttatcag 6900
ggttattgtc tcatgagcgg atacatattt gaatgtattt agaaaaataa acaaataggg 6960
gttccgcgca catttccccg aaaagtgcca cctgaaattg taaacgttaa tattttgtta 7020
aaattcgcgt taaatttttg ttaaatcagc tcatttttta accaataggc cgaaatcggc 7080
aaaatccctt ataaatcaaa agaatagacc gagatagggt tgagtgttgt tccagtttgg 7140
aacaagagtc cactattaaa gaacgtggac tccaacgtca aagggcgaaa aaccgtctat 7200
cagggcgatg gcccactacg tgaaccatca ccctaatcaa gttttttggg gtcgaggtgc 7260
cgtaaagcac taaatcggaa ccctaaaggg agcccccgat ttagagcttg acggggaaag 7320
ccggcgaacg tggcgagaaa ggaagggaag aaagcgaaag gagcgggcgc tagggcgctg 7380
gcaagtgtag cggtcacgct gcgcgtaacc accacacccg ccgcgcttaa tgcgccgcta 7440
cagggcgcgt cccattcgcc attcaggctg caaataagcg ttgatattca gtcaattaca 7500
aacattaata acgaagagat gacagaaaaa ttttcattct gtgacagaga a 7551
<210> 193
<211> 7780
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 193
ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc 60
cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg 120
agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt 180
atctacgtag ccatgctcta gacgggggag gctgctggtg aatattaacc aaggtcaccc 240
cagttatcgg aggagcaaac aggggctaag tccacacgcg tggtaccgtc tgtctgcaca 300
tttcgtagag cgagtgttcc gatactctaa tctccctagg caaggttcat atttgtgtag 360
gttacttatt ctccttttgt tgactaagtc aataatcaga atcagcaggt ttggagtcag 420
cttggcaggg atcagcagcc tgggttggaa ggagggggta taaaagcccc ttcaccagga 480
gaagccgtca cacagatcca caagctcctg aagaggtaag ggtttaaggg atggttggtt 540
ggtggggtat taatgtttaa ttacctggag cacctgcctg aaatcacttt ttttcaggtt 600
ggtttaaacg ccgccaccat gtccactgcg gtcctggaaa acccaggctt gggcaggaaa 660
ctctctgact ttggacagga aacaagctat attgaagaca actgcaatca aaatggtgcc 720
atatcactga tcttctcact caaagaagaa gttggtgcat tggccaaagt attgcgctta 780
tttgaggaga atgatgtaaa cctgacccac attgaatcta gaccttctcg tttaaagaaa 840
gatgagtatg aatttttcac ccatttggat aaacgtagcc tgcctgctct gacaaacatc 900
atcaagatct tgaggcatga cattggtgcc actgtccatg agctttcacg agataagaag 960
aaagacacag tgccctggtt cccaagaacc attcaagagc tggacagatt tgccaatcag 1020
attctcagct atggagcgga actggatgct gaccaccctg gttttaaaga tcctgtgtac 1080
cgtgcaagac ggaagcagtt tgctgacatt gcctacaact accgccatgg gcagcccatc 1140
cctcgagtgg aatacatgga ggaagaaaag aaaacatggg gcacagtgtt caagactctg 1200
aagtccttgt ataaaaccca tgcttgctat gagtacaatc acatttttcc acttcttgaa 1260
aagtactgtg gcttccatga agataacatt ccccagctgg aagacgtttc tcagttcctg 1320
cagacttgca ctggtttccg cctccgacct gtggctggcc tgctttcctc tcgggatttc 1380
ttgggtggcc tggccttccg agtcttccac tgcacacagt acatcagaca tggatccaag 1440
cccatgtata cccccgaacc tgacatctgc catgagctgt tgggacatgt gcccttgttt 1500
tcagatcgca gctttgccca gttttcccag gaaattggcc ttgcctctct gggtgcacct 1560
gatgaataca ttgaaaagct cgccacaatt tactggttta ctgtggagtt tgggctctgc 1620
aaacaaggag actccataaa ggcatatggt gctgggctcc tgtcatcctt tggtgaatta 1680
cagtactgct tatcagagaa gccaaagctt ctccccctgg agctggagaa gacagccatc 1740
caaaattaca ctgtcacgga gttccagccc ctctattacg tggcagagag ttttaatgat 1800
gccaaggaga aagtaaggaa ctttgctgcc acaatacctc ggcccttctc agttcgctac 1860
gacccataca cccaaaggat tgaggtcttg gacaataccc agcagcttaa gattttggct 1920
gattccatta acagtgaaat tggaatcctt tgcagtgccc tccagaaaat aaagtaatta 1980
attaagagca tcttaccgcc atttattccc atatttgttc tgtttttctt gatttgggta 2040
tacatttaaa tgttaataaa acaaaatggt ggggcaatca tttacatttt tagggatatg 2100
taattactag ttcaggtgta ttgccacaag acaaacatgt taagaaactt tcccgttatt 2160
tacgctctgt tcctgttaat caacctctgg attacaaaat ttgtgaaaga ttgactgata 2220
ttcttaacta tgttgctcct tttacgctgt gtggatatgc tgctttatag cctctgtatc 2280
tagctattgc ttcccgtacg gctttcgttt tctcctcctt gtataaatcc tggttgctgt 2340
ctcttttaga ggagttgtgg cccgttgtcc gtcaacgtgg cgtggtgtgc tctgtgtttg 2400
ctgacgcaac ccccactggc tggggcattg ccaccacctg tcaactcctt tctgggactt 2460
tcgctttccc cctcccgatc gccacggcag aactcatcgc cgcctgcctt gcccgctgct 2520
ggacaggggc taggttgctg ggcactgata attccgtggt gttgtctgtg ccttctagtt 2580
gccagccatc tgttgtttgc ccctcccccg tgccttcctt gaccctggaa ggtgccactc 2640
ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca ttgtctgagt aggtgtcatt 2700
ctattctggg gggtggggtg gggcaggaca gcaaggggga ggattgggaa gacaatagca 2760
ggcatgctgg ggatgcggtg ggctctatgg ctctagagca tggctacgta gataagtagc 2820
atggcgggtt aatcattaac tacacctgca ggaggaaccc ctagtgatgg agttggccac 2880
tccctctctg cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg cccgacgccc 2940
gggcggcctc agtgagcgag cgagcgcgca gctgcctgca ggggcgcgcc tcgaggcatg 3000
cggtaccaag cttgtcgaga agtactagag gatcataatc agccatacca catttgtaga 3060
ggttttactt gctttaaaaa acctcccaca cctccccctg aacctgaaac ataaaatgaa 3120
tgcaattgtt gttgttaact tgtttattgc agcttataat ggttacaaat aaagcaatag 3180
catcacaaat ttcacaaata aagcattttt ttcactgcat tctagttgtg gtttgtccaa 3240
actcatcaat gtatcttatc atgtctggat ctgatcactg atatcgccta ggagatccga 3300
accagataag tgaaatctag ttccaaacta ttttgtcatt tttaattttc gtattagctt 3360
acgacgctac acccagttcc catctatttt gtcactcttc cctaaataat ccttaaaaac 3420
tccatttcca cccctcccag ttcccaacta ttttgtccgc ccacagcggg gcatttttct 3480
tcctgttatg tttttaatca aacatcctgc caactccatg tgacaaaccg tcatcttcgg 3540
ctactttttc tctgtcacag aatgaaaatt tttctgtcat ctcttcgtta ttaatgtttg 3600
taattgactg aatatcaacg cttatttgca gcctgaatgg cgaatgggac gcgccctgta 3660
gcggcgcatt aagcgcggcg ggtgtggtgg ttacgcgcag cgtgaccgct acacttgcca 3720
gcgccctagc gcccgctcct ttcgctttct tcccttcctt tctcgccacg ttcgccggct 3780
ttccccgtca agctctaaat cgggggctcc ctttagggtt ccgatttagt gctttacggc 3840
acctcgaccc caaaaaactt gattagggtg atggttcacg tagtgggcca tcgccctgat 3900
agacggtttt tcgccctttg acgttggagt ccacgttctt taatagtgga ctcttgttcc 3960
aaactggaac aacactcaac cctatctcgg tctattcttt tgatttataa gggattttgc 4020
cgatttcggc ctattggtta aaaaatgagc tgatttaaca aaaatttaac gcgaatttta 4080
acaaaatatt aacgtttaca atttcaggtg gcacttttcg gggaaatgtg cgcggaaccc 4140
ctatttgttt atttttctaa atacattcaa atatgtatcc gctcatgaga caataaccct 4200
gataaatgct tcaataatat tgaaaaagga agagtatgag tattcaacat ttccgtgtcg 4260
cccttattcc cttttttgcg gcattttgcc ttcctgtttt tgctcaccca gaaacgctgg 4320
tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt gggttacatc gaactggatc 4380
tcaacagcgg taagatcctt gagagttttc gccccgaaga acgttttcca atgatgagca 4440
cttttaaagt tctgctatgt ggcgcggtat tatcccgtat tgacgccggg caagagcaac 4500
tcggtcgccg catacactat tctcagaatg acttggttga gtactcacca gtcacagaaa 4560
agcatcttac ggatggcatg acagtaagag aattatgcag tgctgccata accatgagtg 4620
ataacactgc ggccaactta cttctgacaa cgatcggagg accgaaggag ctaaccgctt 4680
ttttgcacaa catgggggat catgtaactc gccttgatcg ttgggaaccg gagctgaatg 4740
aagccatacc aaacgacgag cgtgacacca cgatgcctgt agcaatggca acaacgttgc 4800
gcaaactatt aactggcgaa ctacttactc tagcttcccg gcaacaatta atagactgga 4860
tggaggcgga taaagttgca ggaccacttc tgcgctcggc ccttccggct ggctggttta 4920
ttgctgataa atctggagcc ggtgagcgtg ggtctcgcgg tatcattgca gcactggggc 4980
cagatggtaa gccctcccgt atcgtagtta tctacacgac ggggagtcag gcaactatgg 5040
atgaacgaaa tagacagatc gctgagatag gtgcctcact gattaagcat tggtaactgt 5100
cagaccaagt ttactcatat atactttaga ttgatttaaa acttcatttt taatttaaaa 5160
ggatctaggt gaagatcctt tttgataatc tcatgaccaa aatcccttaa cgtgagtttt 5220
cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga gatccttttt 5280
ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg gtggtttgtt 5340
tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc agagcgcaga 5400
taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag aactctgtag 5460
caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc agtggcgata 5520
agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg cagcggtcgg 5580
gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac accgaactga 5640
gatacctaca gcgtgagcat tgagaaagcg ccacgcttcc cgaagggaga aaggcggaca 5700
ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt ccagggggaa 5760
acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag cgtcgatttt 5820
tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg gcctttttac 5880
ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta tcccctgatt 5940
ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc agccgaacga 6000
ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg tattttctcc 6060
ttacgcatct gtgcggtatt tcacaccgca gaccagccgc gtaacctggc aaaatcggtt 6120
acggttgagt aataaatgga tgccctgcgt aagcgggtgt gggcggacaa taaagtctta 6180
aactgaacaa aatagatcta aactatgaca ataaagtctt aaactagaca gaatagttgt 6240
aaactgaaat cagtccagtt atgctgtgaa aaagcatact ggacttttgt tatggctaaa 6300
gcaaactctt cattttctga agtgcaaatt gcccgtcgta ttaaagaggg gcgtggccaa 6360
gggcatggta aagactatat tcgcggcgtt gtgacaattt accgaacaac tccgcggccg 6420
ggaagccgat ctcggcttga acgaattgtt aggtggcggt acttgggtcg atatcaaagt 6480
gcatcacttc ttcccgtatg cccaactttg tatagagagc cactgcggga tcgtcaccgt 6540
aatctgcttg cacgtagatc acataagcac caagcgcgtt ggcctcatgc ttgaggagat 6600
tgatgagcgc ggtggcaatg ccctgcctcc ggtgctcgcc ggagactgcg agatcataga 6660
tatagatctc actacgcggc tgctcaaacc tgggcagaac gtaagccgcg agagcgccaa 6720
caaccgcttc ttggtcgaag gcagcaagcg cgatgaatgt cttactacgg agcaagttcc 6780
cgaggtaatc ggagtccggc tgatgttggg agtaggtggc tacgtctccg aactcacgac 6840
cgaaaagatc aagagcagcc cgcatggatt tgacttggtc agggccgagc ctacatgtgc 6900
gaatgatgcc catacttgag ccacctaact ttgttttagg gcgactgccc tgctgcgtaa 6960
catcgttgct gctgcgtaac atcgttgctg ctccataaca tcaaacatcg acccacggcg 7020
taacgcgctt gctgcttgga tgcccgaggc atagactgta caaaaaaaca gtcataacaa 7080
gccatgaaaa ccgccactgc gccgttacca ccgctgcgtt cggtcaaggt tctggaccag 7140
ttgcgtgagc gcatacgcta cttgcattac agtttacgaa ccgaacaggc ttatgtcaac 7200
tgggttcgtg ccttcatccg tttccacggt gtgcgtcacc cggcaacctt gggcagcagc 7260
gaagtcgagg catttctgtc ctggctggcg aacgagcgca aggtttcggt ctccacgcat 7320
cgtcaggcat tggcggcctt gctgttcttc tacggcaagg tgctgtgcac ggatctgccc 7380
tggcttcagg agatcggaag acctcggccg tcgcggcgct tgccggtggt gctgaccccg 7440
gatgaagtgg ttcgcatcct cggttttctg gaaggcgagc atcgtttgtt cgcccaggac 7500
tctagctata gttctagtgg ttggctacgt atactccgga atattaatag atcatggaga 7560
taattaaaat gataaccatc tcgcaaataa ataagtattt tactgttttc gtaacagttt 7620
tgtaataaaa aaacctataa atattccgga ttattcatac cgtcccacca tcgggcgcgg 7680
atctcggtcc gaaaccatgt cgtactacca tcaccatcac catcacgatt acgatatccc 7740
aacgaccgaa aacctgtatt ttcagggcgc catgggatcc 7780
<210> 194
<211> 3222
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 194
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180
cgcgggggag gctgctggtg aatattaacc aaggtcaccc cagttatcgg aggagcaaac 240
aggggctaag tccaccgggg gaggctgctg gtgaatatta accaaggtca ccccagttat 300
cggaggagca aacaggggct aagtccaccg ggggaggctg ctggtgaata ttaaccaagg 360
tcaccccagt tatcggagga gcaaacaggg gctaagtcca cggtacccac tgggaggatg 420
ttgagtaaga tggaaaacta ctgatgaccc ttgcagagac agagtattag gacatgtttg 480
aacaggggcc gggcgatcag caggtagctc tagaggatcc ccgtctgtct gcacatttcg 540
tagagcgagt gttccgatac tctaatctcc ctaggcaagg ttcatatttg tgtaggttac 600
ttattctcct tttgttgact aagtcaataa tcagaatcag caggtttgga gtcagcttgg 660
cagggatcag cagcctgggt tggaaggagg gggtataaaa gccccttcac caggagaagc 720
cgtcacacag atccacaagc tcctgaagag gtaagggttt aagggatggt tggttggtgg 780
ggtattaatg tttaattacc tggagcacct gcctgaaatc actttttttc aggttgggtt 840
taaaccgcag ccaccatgag caccgccgtg ctggaaaatc ctggcctggg cagaaagctg 900
agcgacttcg gccaagagac aagctacatc gaggacaact gcaaccagaa cggcgccatc 960
agcctgatct tcagcctgaa agaagaagtg ggcgccctgg ccaaggtgct gagactgttc 1020
gaagagaacg acgtgaacct gacacacatc gagagcagac ccagcagact gaagaaggac 1080
gagtacgagt tcttcaccca cctggacaag cggagcctgc ctgctctgac caacatcatc 1140
aagatcctgc ggcacgacat cggcgccaca gtgcacgaac tgagccggga caagaaaaag 1200
gacaccgtgc catggttccc cagaaccatc caagagctgg acagattcgc caaccagatc 1260
ctgagctatg gcgccgagct ggacgctgat caccctggct ttaaggaccc cgtgtaccgg 1320
gccagaagaa agcagtttgc cgatatcgcc tacaactacc ggcacggcca gcctattcct 1380
cgggtcgagt acatggaaga ggaaaagaaa acctggggca ccgtgttcaa gaccctgaag 1440
tccctgtaca agacccacgc ctgctacgag tacaaccaca tcttcccact gctcgaaaag 1500
tactgcggct tccacgagga caatatccct cagcttgagg acgtgtccca gttcctgcag 1560
acctgcaccg gctttagact gaggccagtt gccggactgc tgagcagcag agattttctc 1620
ggcggcctgg ccttcagagt gttccactgt acccagtaca tcagacacgg cagcaagccc 1680
atgtacaccc ctgagcctga tatctgccac gagctgctgg gacatgtgcc cctgttcagc 1740
gatagaagct tcgcccagtt cagccaagag atcggactgg cttctctggg agcccctgac 1800
gagtacattg agaagctggc caccatctac tggttcaccg tggaattcgg cctgtgcaag 1860
cagggcgaca gcatcaaagc ttatggcgct ggcctgctgt ctagcttcgg cgagctgcag 1920
tactgtctga gcgagaagcc taagctgctg cccctggaac tggaaaagac cgccatccag 1980
aactacaccg tgaccgagtt ccagcctctg tactacgtgg ccgagagctt caacgacgcc 2040
aaagaaaaag tgcggaactt cgccgccacc attcctcggc ctttcagcgt cagatacgac 2100
ccctacacac agcggatcga ggtgctggac aacacacagc agctgaaaat tctggccgac 2160
tccatcaaca gcgagatcgg catcctgtgc agcgccctgc agaaaatcaa gtgatagtta 2220
attaagagca tcttaccgcc atttattccc atatttgttc tgtttttctt gatttgggta 2280
tacatttaaa tgttaataaa acaaaatggt ggggcaatca tttacatttt tagggatatg 2340
taattactag ttcaggtgta ttgccacaag acaaacatgt taagaaactt tcccgttatt 2400
tacgctctgt tcctgttaat caacctctgg attacaaaat ttgtgaaaga ttgactgata 2460
ttcttaacta tgttgctcct tttacgctgt gtggatatgc tgctttatag cctctgtatc 2520
tagctattgc ttcccgtacg gctttcgttt tctcctcctt gtataaatcc tggttgctgt 2580
ctcttttaga ggagttgtgg cccgttgtcc gtcaacgtgg cgtggtgtgc tctgtgtttg 2640
ctgacgcaac ccccactggc tggggcattg ccaccacctg tcaactcctt tctgggactt 2700
tcgctttccc cctcccgatc gccacggcag aactcatcgc cgcctgcctt gcccgctgct 2760
ggacaggggc taggttgctg ggcactgata attccgtggt gttgtctgtg ccttctagtt 2820
gccagccatc tgttgtttgc ccctcccccg tgccttcctt gaccctggaa ggtgccactc 2880
ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca ttgtctgagt aggtgtcatt 2940
ctattctggg gggtggggtg gggcaggaca gcaaggggga ggattgggaa gacaatagca 3000
ggcatgctgg ggatgcggtg ggctctatgg ctctagagca tggctacgta gataagtagc 3060
atggcgggtt aatcattaac tacacctgca ggaggaaccc ctagtgatgg agttggccac 3120
tccctctctg cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg cccgacgccc 3180
gggcggcctc agtgagcgag cgagcgcgca gctgcctgca gg 3222
<210> 195
<211> 2883
<212> DNA
<213> Homo sapiens
<400> 195
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180
cgccggggga ggctgctggt gaatattaac caaggtcacc ccagttatcg gaggagcaaa 240
caggggctaa gtccacacgc gtggtaccgt ctgtctgcac atttcgtaga gcgagtgttc 300
cgatactcta atctccctag gcaaggttca tatttgtgta ggttacttat tctccttttg 360
ttgactaagt caataatcag aatcagcagg tttggagtca gcttggcagg gatcagcagc 420
ctgggttgga aggagggggt ataaaagccc cttcaccagg agaagccgtc acacagatcc 480
acaagctcct gaagaggtaa gggtttaagg gatggttggt tggtggggta ttaatgttta 540
attacctgga gcacctgcct gaaatcactt tttttcaggt tggtttaaac cgcagccacc 600
atgaaccaga acggcgccat cagcctgatc ttcagcctga aagaagaagt gggcgccctg 660
gccaaggtgc tgagactgtt cgaagagaac gacgtgaacc tgacacacat cgagagcaga 720
cccagcagac tgaagaagga cgagtacgag ttcttcaccc acctggacaa gcggagcctg 780
cctgctctga ccaacatcat caagatcctg cggcacgaca tcggcgccac agtgcacgaa 840
ctgagccggg acaagaaaaa ggacaccgtg ccatggttcc ccagaaccat ccaagagctg 900
gacagattcg ccaaccagat cctgagctat ggcgccgagc tggacgctga tcaccctggc 960
tttaaggacc ccgtgtaccg ggccagaaga aagcagtttg ccgatatcgc ctacaactac 1020
cggcacggcc agcctattcc tcgggtcgag tacatggaag aggaaaagaa aacctggggc 1080
accgtgttca agaccctgaa gtccctgtac aagacccacg cctgctacga gtacaaccac 1140
atcttcccac tgctcgaaaa gtactgcggc ttccacgagg acaatatccc tcagcttgag 1200
gacgtgtccc agttcctgca gacctgcacc ggctttagac tgaggccagt tgccggactg 1260
ctgagcagca gagattttct cggcggcctg gccttcagag tgttccactg tacccagtac 1320
atcagacacg gcagcaagcc catgtacacc cctgagcctg atatctgcca cgagctgctg 1380
ggacatgtgc ccctgttcag cgatagaagc ttcgcccagt tcagccaaga gatcggactg 1440
gcttctctgg gagcccctga cgagtacatt gagaagctgg ccaccatcta ctggttcacc 1500
gtggaattcg gcctgtgcaa gcagggcgac agcatcaaag cttatggcgc tggcctgctg 1560
tctagcttcg gcgagctgca gtactgtctg agcgagaagc ctaagctgct gcccctggaa 1620
ctggaaaaga ccgccatcca gaactacacc gtgaccgagt tccagcctct gtactacgtg 1680
gccgagagct tcaacgacgc caaagaaaaa gtgcggaact tcgccgccac cattcctcgg 1740
cctttcagcg tcagatacga cccctacaca cagcggatcg aggtgctgga caacacacag 1800
cagctgaaaa ttctggccga ctccatcaac agcgagatcg gcatcctgtg cagcgccctg 1860
cagaaaatca agtgatagtt aattaagagc atcttaccgc catttattcc catatttgtt 1920
ctgtttttct tgatttgggt atacatttaa atgttaataa aacaaaatgg tggggcaatc 1980
atttacattt ttagggatat gtaattacta gttcaggtgt attgccacaa gacaaacatg 2040
ttaagaaact ttcccgttat ttacgctctg ttcctgttaa tcaacctctg gattacaaaa 2100
tttgtgaaag attgactgat attcttaact atgttgctcc ttttacgctg tgtggatatg 2160
ctgctttata gcctctgtat ctagctattg cttcccgtac ggctttcgtt ttctcctcct 2220
tgtataaatc ctggttgctg tctcttttag aggagttgtg gcccgttgtc cgtcaacgtg 2280
gcgtggtgtg ctctgtgttt gctgacgcaa cccccactgg ctggggcatt gccaccacct 2340
gtcaactcct ttctgggact ttcgctttcc ccctcccgat cgccacggca gaactcatcg 2400
ccgcctgcct tgcccgctgc tggacagggg ctaggttgct gggcactgat aattccgtgg 2460
tgttgtctgt gccttctagt tgccagccat ctgttgtttg cccctccccc gtgccttcct 2520
tgaccctgga aggtgccact cccactgtcc tttcctaata aaatgaggaa attgcatcgc 2580
attgtctgag taggtgtcat tctattctgg ggggtggggt ggggcaggac agcaaggggg 2640
aggattggga agacaatagc aggcatgctg gggatgcggt gggctctatg gctctagagc 2700
atggctacgt agataagtag catggcgggt taatcattaa ctacacctgc aggaggaacc 2760
cctagtgatg gagttggcca ctccctctct gcgcgctcgc tcgctcactg aggccgggcg 2820
accaaaggtc gcccgacgcc cgggcggcct cagtgagcga gcgagcgcgc agctgcctgc 2880
agg 2883
<210> 196
<211> 4089
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 196
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180
cgcgggggag gctgctggtg aatattaacc aaggtcaccc cagttatcgg aggagcaaac 240
aggggctaag tccaccgggg gaggctgctg gtgaatatta accaaggtca ccccagttat 300
cggaggagca aacaggggct aagtccaccg ggggaggctg ctggtgaata ttaaccaagg 360
tcaccccagt tatcggagga gcaaacaggg gctaagtcca cggtacccac tgggaggatg 420
ttgagtaaga tggaaaacta ctgatgaccc ttgcagagac agagtattag gacatgtttg 480
aacaggggcc gggcgatcag caggtagctc tagaggatcc ccgtctgtct gcacatttcg 540
tagagcgagt gttccgatac tctaatctcc ctaggcaagg ttcatatttg tgtaggttac 600
ttattctcct tttgttgact aagtcaataa tcagaatcag caggtttgga gtcagcttgg 660
cagggatcag cagcctgggt tggaaggagg gggtataaaa gccccttcac caggagaagc 720
cgtcacacag atccacaagc tcctgaagag gtaagggttt aagggatggt tggttggtgg 780
ggtattaatg tttaattacc tggagcacct gcctgaaatc actttttttc aggttgggtt 840
taaaccgcag ccaccatgtc cacagctgtg ctggagaacc ctggcctggg cagaaagctg 900
tctgactttg gccaggtgag ccagggcagc ctgagctgct cagttagggg aatttgggcc 960
tccagagaaa gagatcccaa gactgctggt gcttcctggt ttcataagct cagtaagaag 1020
tctgaattgg ttggaagctg atgagaatat ccaggaagtc aacagacaaa tgtcctcaac 1080
aattgtttct aagtaggaga acatctgtcc tgggtggctt tcacaggaat gaatgaccat 1140
tgctttaggg ggttggggat ctggcctcca gaactgccac caattagctg tgtgtctttg 1200
gacaagttac tgtccctctc tgttgtctgt ttactcttct gtacactgaa ggggttccaa 1260
tccaggtctt aggattcaaa agcctgtgca tgttccattt ttagtacttt ccacactgta 1320
tttctcaatg tctttctggg acattttata aatcatatta tatcacctct aaggatcttt 1380
cagtttgtta tatatgtgtc tattaagtta gattgtgagc tcctaaaaga taaagcattg 1440
tcttattcat ctttaaattt ctcagagccc aaatagtgcc tggaacctag tagttgctca 1500
ataaaaggta ttgaatttac aggattgaat ggtgacatca atgaataatt gaagattcct 1560
taagctgata actgacccag tagcatcatt gatcatttaa ttgccctgga cttacttatt 1620
ttccaccaca ctacatattt ctgtatagaa tatatatagc tcattgtatt gcaagattta 1680
actagaagaa agagttcatg cttgctttgt ccatgtaggt ttaacaggaa tgaattgcta 1740
aactgtggaa aatgttttaa acaaatgcat cttatcctgt aggagacctc ctacattgag 1800
gacaactgca accagaatgg agccatctcc ctgatcttct ccctgaagga ggaggtggga 1860
gccctggcca aggtgctgag actgtttgag gagaatgatg tgaacctgac ccacattgag 1920
tccagaccct ccagactgaa gaaggatgag tatgagttct tcacccacct ggacaagaga 1980
tccctgcctg ccctgaccaa catcatcaag atcctgagac atgacattgg agccacagtg 2040
catgagctgt ccagagacaa gaagaaggac acagtgccct ggttccccag aaccatccag 2100
gagctggaca gatttgccaa ccagatcctg tcctatggag ctgagctgga tgctgaccac 2160
cctggcttca aggaccctgt gtacagggcc agaagaaagc agtttgctga cattgcctac 2220
aactacagac atggccagcc catccccaga gtggagtaca tggaggagga gaagaagacc 2280
tggggcacag tgttcaagac cctgaagtcc ctgtacaaga cccatgcctg ctatgagtac 2340
aaccacatct tccccctgct ggagaagtac tgtggcttcc atgaggacaa catcccccag 2400
ctggaggatg tgtcccagtt cctgcagacc tgcacaggct tcagactgag acctgtggct 2460
ggcctgctgt cctccagaga cttcctggga ggcctggcct tcagagtgtt ccactgcacc 2520
cagtacatca gacatggctc caagcccatg tacacccctg agcctgacat ctgccatgag 2580
ctgctgggcc atgtgcccct gttctctgac agatcctttg cccagttctc ccaggagatt 2640
ggcctggcct ccctgggagc ccctgatgag tacattgaga agctggccac catctactgg 2700
ttcacagtgg agtttggcct gtgcaagcag ggagactcca tcaaggccta tggagctggc 2760
ctgctgtcct cctttggaga gctgcagtac tgcctgtctg agaagcccaa gctgctgccc 2820
ctggagctgg agaagacagc catccagaac tacacagtga cagagttcca gcccctgtac 2880
tatgtggctg agtccttcaa tgatgccaag gagaaggtca gaaactttgc tgccaccatc 2940
cccagaccct tctctgtgag atatgacccc tacacccaga gaattgaggt gctggacaac 3000
acccagcagc tgaagatcct ggctgactcc atcaactctg agattggcat cctgtgctct 3060
gccctgcaga agatcaagta aaccttaatt aagagcatct taccgccatt tattcccata 3120
tttgttctgt ttttcttgat ttgggtatac atttaaatgt taataaaaca aaatggtggg 3180
gcaatcattt acatttttag ggatatgtaa ttactagttc aggtgtattg ccacaagaca 3240
aacatgttaa gaaactttcc cgttatttac gctctgttcc tgttaatcaa cctctggatt 3300
acaaaatttg tgaaagattg actgatattc ttaactatgt tgctcctttt acgctgtgtg 3360
gatatgctgc tttatagcct ctgtatctag ctattgcttc ccgtacggct ttcgttttct 3420
cctccttgta taaatcctgg ttgctgtctc ttttagagga gttgtggccc gttgtccgtc 3480
aacgtggcgt ggtgtgctct gtgtttgctg acgcaacccc cactggctgg ggcattgcca 3540
ccacctgtca actcctttct gggactttcg ctttccccct cccgatcgcc acggcagaac 3600
tcatcgccgc ctgccttgcc cgctgctgga caggggctag gttgctgggc actgataatt 3660
ccgtggtgtt gtctgtgcct tctagttgcc agccatctgt tgtttgcccc tcccccgtgc 3720
cttccttgac cctggaaggt gccactccca ctgtcctttc ctaataaaat gaggaaattg 3780
catcgcattg tctgagtagg tgtcattcta ttctgggggg tggggtgggg caggacagca 3840
agggggagga ttgggaagac aatagcaggc atgctgggga tgcggtgggc tctatggctc 3900
tagagcatgg ctacgtagat aagtagcatg gcgggttaat cattaactac acctgcagga 3960
ggaaccccta gtgatggagt tggccactcc ctctctgcgc gctcgctcgc tcactgaggc 4020
cgggcgacca aaggtcgccc gacgcccggg cggcctcagt gagcgagcga gcgcgcagct 4080
gcctgcagg 4089
<210> 197
<211> 4089
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 197
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180
cgcgggggag gctgctggtg aatattaacc aaggtcaccc cagttatcgg aggagcaaac 240
aggggctaag tccaccgggg gaggctgctg gtgaatatta accaaggtca ccccagttat 300
cggaggagca aacaggggct aagtccaccg ggggaggctg ctggtgaata ttaaccaagg 360
tcaccccagt tatcggagga gcaaacaggg gctaagtcca cggtacccac tgggaggatg 420
ttgagtaaga tggaaaacta ctgatgaccc ttgcagagac agagtattag gacatgtttg 480
aacaggggcc gggcgatcag caggtagctc tagaggatcc ccgtctgtct gcacatttcg 540
tagagcgagt gttccgatac tctaatctcc ctaggcaagg ttcatatttg tgtaggttac 600
ttattctcct tttgttgact aagtcaataa tcagaatcag caggtttgga gtcagcttgg 660
cagggatcag cagcctgggt tggaaggagg gggtataaaa gccccttcac caggagaagc 720
cgtcacacag atccacaagc tcctgaagag gtaagggttt aagggatggt tggttggtgg 780
ggtattaatg tttaattacc tggagcacct gcctgaaatc actttttttc aggttgggtt 840
taaaccgcag ccaccatgtc cacagctgtg ctggagaacc ctggcttggg caggaaactc 900
tctgactttg gacaggtgag ccagggcagc ctgagctgct cagttagggg aatttgggcc 960
tccagagaaa gagatcccaa gactgctggt gcttcctggt ttcataagct cagtaagaag 1020
tctgaattgg ttggaagctg atgagaatat ccaggaagtc aacagacaaa tgtcctcaac 1080
aattgtttct aagtaggaga acatctgtcc tgggtggctt tcacaggaat gaatgaccat 1140
tgctttaggg ggttggggat ctggcctcca gaactgccac caattagctg tgtgtctttg 1200
gacaagttac tgtccctctc tgttgtctgt ttactcttct gtacactgaa ggggttccaa 1260
tccaggtctt aggattcaaa agcctgtgca tgttccattt ttagtacttt ccacactgta 1320
tttctcaatg tctttctggg acattttata aatcatatta tatcacctct aaggatcttt 1380
cagtttgtta tatatgtgtc tattaagtta gattgtgagc tcctaaaaga taaagcattg 1440
tcttattcat ctttaaattt ctcagagccc aaatagtgcc tggaacctag tagttgctca 1500
ataaaaggta ttgaatttac aggattgaat ggtgacatca atgaataatt gaagattcct 1560
taagctgata actgacccag tagcatcatt gatcatttaa ttgccctgga cttacttatt 1620
ttccaccaca ctacatattt ctgtatagaa tatatatagc tcattgtatt gcaagattta 1680
actagaagaa agagttcatg cttgctttgt ccatgtaggt ttaacaggaa tgaattgcta 1740
aactgtggaa aatgttttaa acaaatgcat cttatcctgt aggaaacaag ctatattgaa 1800
gacaactgca atcaaaatgg agccatctcc ctgatcttct ccctgaagga ggaggtggga 1860
gccctggcca aggtgctgag actgtttgag gagaatgatg tgaacctgac ccacattgag 1920
tccagaccct ccagactgaa gaaggatgag tatgagttct tcacccacct ggacaagaga 1980
tccctgcctg ccctgaccaa catcatcaag atcctgagac atgacattgg agccacagtg 2040
catgagctgt ccagagacaa gaagaaggac acagtgccct ggttccccag aaccatccag 2100
gagctggaca gatttgccaa ccagatcctg tcctatggag ctgagctgga tgctgaccac 2160
cctggcttca aggaccctgt gtacagggcc agaagaaagc agtttgctga cattgcctac 2220
aactacagac atggccagcc catccccaga gtggagtaca tggaggagga gaagaagacc 2280
tggggcacag tgttcaagac cctgaagtcc ctgtacaaga cccatgcctg ctatgagtac 2340
aaccacatct tccccctgct ggagaagtac tgtggcttcc atgaggacaa catcccccag 2400
ctggaggatg tgtcccagtt cctgcagacc tgcacaggct tcagactgag acctgtggct 2460
ggcctgctgt cctccagaga cttcctggga ggcctggcct tcagagtgtt ccactgcacc 2520
cagtacatca gacatggctc caagcccatg tacacccctg agcctgacat ctgccatgag 2580
ctgctgggcc atgtgcccct gttctctgac agatcctttg cccagttctc ccaggagatt 2640
ggcctggcct ccctgggagc ccctgatgag tacattgaga agctggccac catctactgg 2700
ttcacagtgg agtttggcct gtgcaagcag ggagactcca tcaaggccta tggagctggc 2760
ctgctgtcct cctttggaga gctgcagtac tgcctgtctg agaagcccaa gctgctgccc 2820
ctggagctgg agaagacagc catccagaac tacacagtga cagagttcca gcccctgtac 2880
tatgtggctg agtccttcaa tgatgccaag gagaaggtca gaaactttgc tgccaccatc 2940
cccagaccct tctctgtgag atatgacccc tacacccaga gaattgaggt gctggacaac 3000
acccagcagc tgaagatcct ggctgactcc atcaactctg agattggcat cctgtgctct 3060
gccctgcaga agatcaagta aaccttaatt aagagcatct taccgccatt tattcccata 3120
tttgttctgt ttttcttgat ttgggtatac atttaaatgt taataaaaca aaatggtggg 3180
gcaatcattt acatttttag ggatatgtaa ttactagttc aggtgtattg ccacaagaca 3240
aacatgttaa gaaactttcc cgttatttac gctctgttcc tgttaatcaa cctctggatt 3300
acaaaatttg tgaaagattg actgatattc ttaactatgt tgctcctttt acgctgtgtg 3360
gatatgctgc tttatagcct ctgtatctag ctattgcttc ccgtacggct ttcgttttct 3420
cctccttgta taaatcctgg ttgctgtctc ttttagagga gttgtggccc gttgtccgtc 3480
aacgtggcgt ggtgtgctct gtgtttgctg acgcaacccc cactggctgg ggcattgcca 3540
ccacctgtca actcctttct gggactttcg ctttccccct cccgatcgcc acggcagaac 3600
tcatcgccgc ctgccttgcc cgctgctgga caggggctag gttgctgggc actgataatt 3660
ccgtggtgtt gtctgtgcct tctagttgcc agccatctgt tgtttgcccc tcccccgtgc 3720
cttccttgac cctggaaggt gccactccca ctgtcctttc ctaataaaat gaggaaattg 3780
catcgcattg tctgagtagg tgtcattcta ttctgggggg tggggtgggg caggacagca 3840
agggggagga ttgggaagac aatagcaggc atgctgggga tgcggtgggc tctatggctc 3900
tagagcatgg ctacgtagat aagtagcatg gcgggttaat cattaactac acctgcagga 3960
ggaaccccta gtgatggagt tggccactcc ctctctgcgc gctcgctcgc tcactgaggc 4020
cgggcgacca aaggtcgccc gacgcccggg cggcctcagt gagcgagcga gcgcgcagct 4080
gcctgcagg 4089
<210> 198
<211> 3451
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 198
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180
cgcgggggag gctgctggtg aatattaacc aaggtcaccc cagttatcgg aggagcaaac 240
aggggctaag tccaccgggg gaggctgctg gtgaatatta accaaggtca ccccagttat 300
cggaggagca aacaggggct aagtccaccg ggggaggctg ctggtgaata ttaaccaagg 360
tcaccccagt tatcggagga gcaaacaggg gctaagtcca cggtacccac tgggaggatg 420
ttgagtaaga tggaaaacta ctgatgaccc ttgcagagac agagtattag gacatgtttg 480
aacaggggcc gggcgatcag caggtagctc tagaggatcc ccgtctgtct gcacatttcg 540
tagagcgagt gttccgatac tctaatctcc ctaggcaagg ttcatatttg tgtaggttac 600
ttattctcct tttgttgact aagtcaataa tcagaatcag caggtttgga gtcagcttgg 660
cagggatcag cagcctgggt tggaaggagg gggtataaaa gccccttcac caggagaagc 720
cgtcacacag atccacaagc tcctgaagag gtaagggttt aagggatggt tggttggtgg 780
ggtattaatg tttaattacc tggagcacct gcctgaaatc actttttttc aggttgggtt 840
taaaccgcag ccaccatgtc cacagctgtg ctggagaacc ctggcttggg caggaaactc 900
tctgactttg gacaggtgag ccagggcagc ctgagctgct cagttagggg aatttgggcc 960
tccagagaaa gagatctgaa gactgctggt gcttcctggt ttcataagct cagtaagaag 1020
tctgaattca ttggaagctg atgatagaag aaagagttca tgcttgcttt gtccatggag 1080
gtttaacagg aatgaattgc taaactgtgg aaaatgtttt aaacaaatgc atcttatcct 1140
gtaggaaaca agctatattg aagacaactg caatcaaaat ggagccatct ccctgatctt 1200
ctccctgaag gaggaggtgg gagccctggc caaggtgctg agactgtttg aggagaatga 1260
tgtgaacctg acccacattg agtccagacc ctccagactg aagaaggatg agtatgagtt 1320
cttcacccac ctggacaaga gatccctgcc tgccctgacc aacatcatca agatcctgag 1380
acatgacatt ggagccacag tgcatgagct gtccagagac aagaagaagg acacagtgcc 1440
ctggttcccc agaaccatcc aggagctgga cagatttgcc aaccagatcc tgtcctatgg 1500
agctgagctg gatgctgacc accctggctt caaggaccct gtgtacaggg ccagaagaaa 1560
gcagtttgct gacattgcct acaactacag acatggccag cccatcccca gagtggagta 1620
catggaggag gagaagaaga cctggggcac agtgttcaag accctgaagt ccctgtacaa 1680
gacccatgcc tgctatgagt acaaccacat cttccccctg ctggagaagt actgtggctt 1740
ccatgaggac aacatccccc agctggagga tgtgtcccag ttcctgcaga cctgcacagg 1800
cttcagactg agacctgtgg ctggcctgct gtcctccaga gacttcctgg gaggcctggc 1860
cttcagagtg ttccactgca cccagtacat cagacatggc tccaagccca tgtacacccc 1920
tgagcctgac atctgccatg agctgctggg ccatgtgccc ctgttctctg acagatcctt 1980
tgcccagttc tcccaggaga ttggcctggc ctccctggga gcccctgatg agtacattga 2040
gaagctggcc accatctact ggttcacagt ggagtttggc ctgtgcaagc agggagactc 2100
catcaaggcc tatggagctg gcctgctgtc ctcctttgga gagctgcagt actgcctgtc 2160
tgagaagccc aagctgctgc ccctggagct ggagaagaca gccatccaga actacacagt 2220
gacagagttc cagcccctgt actatgtggc tgagtccttc aatgatgcca aggagaaggt 2280
cagaaacttt gctgccacca tccccagacc cttctctgtg agatatgacc cctacaccca 2340
gagaattgag gtgctggaca acacccagca gctgaagatc ctggctgact ccatcaactc 2400
tgagattggc atcctgtgct ctgccctgca gaagatcaag taaaccttaa ttaagagcat 2460
cttaccgcca tttattccca tatttgttct gtttttcttg atttgggtat acatttaaat 2520
gttaataaaa caaaatggtg gggcaatcat ttacattttt agggatatgt aattactagt 2580
tcaggtgtat tgccacaaga caaacatgtt aagaaacttt cccgttattt acgctctgtt 2640
cctgttaatc aacctctgga ttacaaaatt tgtgaaagat tgactgatat tcttaactat 2700
gttgctcctt ttacgctgtg tggatatgct gctttatagc ctctgtatct agctattgct 2760
tcccgtacgg ctttcgtttt ctcctccttg tataaatcct ggttgctgtc tcttttagag 2820
gagttgtggc ccgttgtccg tcaacgtggc gtggtgtgct ctgtgtttgc tgacgcaacc 2880
cccactggct ggggcattgc caccacctgt caactccttt ctgggacttt cgctttcccc 2940
ctcccgatcg ccacggcaga actcatcgcc gcctgccttg cccgctgctg gacaggggct 3000
aggttgctgg gcactgataa ttccgtggtg ttgtctgtgc cttctagttg ccagccatct 3060
gttgtttgcc cctcccccgt gccttccttg accctggaag gtgccactcc cactgtcctt 3120
tcctaataaa atgaggaaat tgcatcgcat tgtctgagta ggtgtcattc tattctgggg 3180
ggtggggtgg ggcaggacag caagggggag gattgggaag acaatagcag gcatgctggg 3240
gatgcggtgg gctctatggc tctagagcat ggctacgtag ataagtagca tggcgggtta 3300
atcattaact acacctgcag gaggaacccc tagtgatgga gttggccact ccctctctgc 3360
gcgctcgctc gctcactgag gccgggcgac caaaggtcgc ccgacgcccg ggcggcctca 3420
gtgagcgagc gagcgcgcag ctgcctgcag g 3451
<210> 199
<211> 4042
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 199
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180
cgcgggggag gctgctggtg aatattaacc aaggtcaccc cagttatcgg aggagcaaac 240
aggggctaag tccaccgggg gaggctgctg gtgaatatta accaaggtca ccccagttat 300
cggaggagca aacaggggct aagtccaccg ggggaggctg ctggtgaata ttaaccaagg 360
tcaccccagt tatcggagga gcaaacaggg gctaagtcca cggtacccac tgggaggatg 420
ttgagtaaga tggaaaacta ctgatgaccc ttgcagagac agagtattag gacatgtttg 480
aacaggggcc gggcgatcag caggtagctc tagaggatcc ccgtctgtct gcacatttcg 540
tagagcgagt gttccgatac tctaatctcc ctaggcaagg ttcatatttg tgtaggttac 600
ttattctcct tttgttgact aagtcaataa tcagaatcag caggtttgga gtcagcttgg 660
cagggatcag cagcctgggt tggaaggagg gggtataaaa gccccttcac caggagaagc 720
cgtcacacag atccacaagc tcctgaagag gtaagggttt aagggatggt tggttggtgg 780
ggtattaatg tttaattacc tggagcacct gcctgaaatc actttttttc aggttgggtt 840
taaaccgcag ccaccatgag caccgccgtg ctggaaaatc ctggcttggg caggaaactc 900
tctgactttg gacaggtaag cctgttgggc ttccactgct aggagagaat tggttcccca 960
catgtgaaag cagtctggga aatgctggta tttccagtct cctaaggcta ctaagaaata 1020
tgactttatt tagaggcgag gaaaatgccc aggaagtcaa ctgatgagtc tagtcttaac 1080
aagttgagga tacagaaagt tggggatctg agctgctacc aacatctgtg tgtctttggg 1140
tggctcattg gtatcctctg cctattggct ttatcttctg tacactgaaa ggaaatggct 1200
ggtccttagt cacctaccca ggtcttggat ccatagccta cggatgtccc atttttattg 1260
ctttttatat tttgtctccc agtgtctttt tgaggatttt tttttttttt ttgcatcact 1320
tgctcttcct ctaagaatct cctgacttct tgtacatgtg tctgatggtc agaattttag 1380
cactgaagta tgggcgtatt tatcataatt caggtttata tcctttcaga tatgggctag 1440
ggtctggtat tagggtgctc attaaaaaat gttgattttt gtcagtgtct agtgacatca 1500
atgcataatt taaggttcta taaattgaaa gctaacccag gagtgactca tcctctcatt 1560
gttttcaact tacttatttc tgatcacact gacttccctg tggaatacac gtggttcact 1620
gtgttccaaa gcttaacgag cagaaaaagg ttatgctcgt ctcttcttga gaggttttaa 1680
gagaataatt gctaagctgt gaaaaacatt ttaaccaagt gatctaatta tgtaggaaac 1740
aagctatatt gaagacaact gcaatcaaaa cggcgccatc agcctgatct tcagcctgaa 1800
agaagaagtg ggcgccctgg ccaaggtgct gagactgttc gaagagaacg acgtgaacct 1860
gacacacatc gagagcagac ccagcagact gaagaaggac gagtacgagt tcttcaccca 1920
cctggacaag cggagcctgc ctgctctgac caacatcatc aagatcctgc ggcacgacat 1980
cggcgccaca gtgcacgaac tgagccggga caagaaaaag gacaccgtgc catggttccc 2040
cagaaccatc caagagctgg acagattcgc caaccagatc ctgagctatg gcgccgagct 2100
ggacgctgat caccctggct ttaaggaccc cgtgtaccgg gccagaagaa agcagtttgc 2160
cgatatcgcc tacaactacc ggcacggcca gcctattcct cgggtcgagt acatggaaga 2220
ggaaaagaaa acctggggca ccgtgttcaa gaccctgaag tccctgtaca agacccacgc 2280
ctgctacgag tacaaccaca tcttcccact gctcgaaaag tactgcggct tccacgagga 2340
caatatccct cagcttgagg acgtgtccca gttcctgcag acctgcaccg gctttagact 2400
gaggccagtt gccggactgc tgagcagcag agattttctc ggcggcctgg ccttcagagt 2460
gttccactgt acccagtaca tcagacacgg cagcaagccc atgtacaccc ctgagcctga 2520
tatctgccac gagctgctgg gacatgtgcc cctgttcagc gatagaagct tcgcccagtt 2580
cagccaagag atcggactgg cttctctggg agcccctgac gagtacattg agaagctggc 2640
caccatctac tggttcaccg tggaattcgg cctgtgcaag cagggcgaca gcatcaaagc 2700
ttatggcgct ggcctgctgt ctagcttcgg cgagctgcag tactgtctga gcgagaagcc 2760
taagctgctg cccctggaac tggaaaagac cgccatccag aactacaccg tgaccgagtt 2820
ccagcctctg tactacgtgg ccgagagctt caacgacgcc aaagaaaaag tgcggaactt 2880
cgccgccacc attcctcggc ctttcagcgt cagatacgac ccctacacac agcggatcga 2940
ggtgctggac aacacacagc agctgaaaat tctggccgac tccatcaaca gcgagatcgg 3000
catcctgtgc agcgccctgc agaaaatcaa gtgatagtta attaagagca tcttaccgcc 3060
atttattccc atatttgttc tgtttttctt gatttgggta tacatttaaa tgttaataaa 3120
acaaaatggt ggggcaatca tttacatttt tagggatatg taattactag ttcaggtgta 3180
ttgccacaag acaaacatgt taagaaactt tcccgttatt tacgctctgt tcctgttaat 3240
caacctctgg attacaaaat ttgtgaaaga ttgactgata ttcttaacta tgttgctcct 3300
tttacgctgt gtggatatgc tgctttatag cctctgtatc tagctattgc ttcccgtacg 3360
gctttcgttt tctcctcctt gtataaatcc tggttgctgt ctcttttaga ggagttgtgg 3420
cccgttgtcc gtcaacgtgg cgtggtgtgc tctgtgtttg ctgacgcaac ccccactggc 3480
tggggcattg ccaccacctg tcaactcctt tctgggactt tcgctttccc cctcccgatc 3540
gccacggcag aactcatcgc cgcctgcctt gcccgctgct ggacaggggc taggttgctg 3600
ggcactgata attccgtggt gttgtctgtg ccttctagtt gccagccatc tgttgtttgc 3660
ccctcccccg tgccttcctt gaccctggaa ggtgccactc ccactgtcct ttcctaataa 3720
aatgaggaaa ttgcatcgca ttgtctgagt aggtgtcatt ctattctggg gggtggggtg 3780
gggcaggaca gcaaggggga ggattgggaa gacaatagca ggcatgctgg ggatgcggtg 3840
ggctctatgg ctctagagca tggctacgta gataagtagc atggcgggtt aatcattaac 3900
tacacctgca ggaggaaccc ctagtgatgg agttggccac tccctctctg cgcgctcgct 3960
cgctcactga ggccgggcga ccaaaggtcg cccgacgccc gggcggcctc agtgagcgag 4020
cgagcgcgca gctgcctgca gg 4042
<210> 200
<211> 3451
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 200
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180
cgcgggggag gctgctggtg aatattaacc aaggtcaccc cagttatcgg aggagcaaac 240
aggggctaag tccaccgggg gaggctgctg gtgaatatta accaaggtca ccccagttat 300
cggaggagca aacaggggct aagtccaccg ggggaggctg ctggtgaata ttaaccaagg 360
tcaccccagt tatcggagga gcaaacaggg gctaagtcca cggtacccac tgggaggatg 420
ttgagtaaga tggaaaacta ctgatgaccc ttgcagagac agagtattag gacatgtttg 480
aacaggggcc gggcgatcag caggtagctc tagaggatcc ccgtctgtct gcacatttcg 540
tagagcgagt gttccgatac tctaatctcc ctaggcaagg ttcatatttg tgtaggttac 600
ttattctcct tttgttgact aagtcaataa tcagaatcag caggtttgga gtcagcttgg 660
cagggatcag cagcctgggt tggaaggagg gggtataaaa gccccttcac caggagaagc 720
cgtcacacag atccacaagc tcctgaagag gtaagggttt aagggatggt tggttggtgg 780
ggtattaatg tttaattacc tggagcacct gcctgaaatc actttttttc aggttgggtt 840
taaaccgcag ccaccatgag caccgccgtg ctggaaaatc ctggcttggg caggaaactc 900
tctgactttg gacaggtgag ccacggcagc ctgagctgct cagttagggg aatttgggcc 960
tccagagaaa gagatccgaa gactgctggt gcttcctggt ttcataagct cagtaagaag 1020
tctgaattcg ttggaagctg atgatagaag aaagagttca tgcttgcttt gtccatggag 1080
gtttaacagg aatgaattgc taaactgtgg aaaatgtttt aaacaaatgc atcttatcct 1140
gtaggaaaca agctatattg aagacaactg caatcaaaac ggcgccatca gcctgatctt 1200
cagcctgaaa gaagaagtgg gcgccctggc caaggtgctg agactgttcg aagagaacga 1260
cgtgaacctg acacacatcg agagcagacc cagcagactg aagaaggacg agtacgagtt 1320
cttcacccac ctggacaagc ggagcctgcc tgctctgacc aacatcatca agatcctgcg 1380
gcacgacatc ggcgccacag tgcacgaact gagccgggac aagaaaaagg acaccgtgcc 1440
atggttcccc agaaccatcc aagagctgga cagattcgcc aaccagatcc tgagctatgg 1500
cgccgagctg gacgctgatc accctggctt taaggacccc gtgtaccggg ccagaagaaa 1560
gcagtttgcc gatatcgcct acaactaccg gcacggccag cctattcctc gggtcgagta 1620
catggaagag gaaaagaaaa cctggggcac cgtgttcaag accctgaagt ccctgtacaa 1680
gacccacgcc tgctacgagt acaaccacat cttcccactg ctcgaaaagt actgcggctt 1740
ccacgaggac aatatccctc agcttgagga cgtgtcccag ttcctgcaga cctgcaccgg 1800
ctttagactg aggccagttg ccggactgct gagcagcaga gattttctcg gcggcctggc 1860
cttcagagtg ttccactgta cccagtacat cagacacggc agcaagccca tgtacacccc 1920
tgagcctgat atctgccacg agctgctggg acatgtgccc ctgttcagcg atagaagctt 1980
cgcccagttc agccaagaga tcggactggc ttctctggga gcccctgacg agtacattga 2040
gaagctggcc accatctact ggttcaccgt ggaattcggc ctgtgcaagc agggcgacag 2100
catcaaagct tatggcgctg gcctgctgtc tagcttcggc gagctgcagt actgtctgag 2160
cgagaagcct aagctgctgc ccctggaact ggaaaagacc gccatccaga actacaccgt 2220
gaccgagttc cagcctctgt actacgtggc cgagagcttc aacgacgcca aagaaaaagt 2280
gcggaacttc gccgccacca ttcctcggcc tttcagcgtc agatacgacc cctacacaca 2340
gcggatcgag gtgctggaca acacacagca gctgaaaatt ctggccgact ccatcaacag 2400
cgagatcggc atcctgtgca gcgccctgca gaaaatcaag tgatagttaa ttaagagcat 2460
cttaccgcca tttattccca tatttgttct gtttttcttg atttgggtat acatttaaat 2520
gttaataaaa caaaatggtg gggcaatcat ttacattttt agggatatgt aattactagt 2580
tcaggtgtat tgccacaaga caaacatgtt aagaaacttt cccgttattt acgctctgtt 2640
cctgttaatc aacctctgga ttacaaaatt tgtgaaagat tgactgatat tcttaactat 2700
gttgctcctt ttacgctgtg tggatatgct gctttatagc ctctgtatct agctattgct 2760
tcccgtacgg ctttcgtttt ctcctccttg tataaatcct ggttgctgtc tcttttagag 2820
gagttgtggc ccgttgtccg tcaacgtggc gtggtgtgct ctgtgtttgc tgacgcaacc 2880
cccactggct ggggcattgc caccacctgt caactccttt ctgggacttt cgctttcccc 2940
ctcccgatcg ccacggcaga actcatcgcc gcctgccttg cccgctgctg gacaggggct 3000
aggttgctgg gcactgataa ttccgtggtg ttgtctgtgc cttctagttg ccagccatct 3060
gttgtttgcc cctcccccgt gccttccttg accctggaag gtgccactcc cactgtcctt 3120
tcctaataaa atgaggaaat tgcatcgcat tgtctgagta ggtgtcattc tattctgggg 3180
ggtggggtgg ggcaggacag caagggggag gattgggaag acaatagcag gcatgctggg 3240
gatgcggtgg gctctatggc tctagagcat ggctacgtag ataagtagca tggcgggtta 3300
atcattaact acacctgcag gaggaacccc tagtgatgga gttggccact ccctctctgc 3360
gcgctcgctc gctcactgag gccgggcgac caaaggtcgc ccgacgcccg ggcggcctca 3420
gtgagcgagc gagcgcgcag ctgcctgcag g 3451
<210> 201
<211> 3840
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 201
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180
cgcaggctca gaggcacaca ggagtttctg ggctcaccct gcccccttcc aacccctcag 240
ttcccatcct ccagcagctg tttgtgtgct gcctctgaag tccacactga acaaacttca 300
gcctactcat gtccctaaaa tgggcaaaca ttgcaagcag caaacagcaa acacacagcc 360
ctccctgcct gctgaccttg gagctggggc agaggtcaga gacctctctg ggcccatgcc 420
acctccaaca tccacttgac cccttggaat ttcagtggag aggagcagag gttgtcctgg 480
tgtggtttag gtagtgtgag agggtccagg ttcaaaacca cttgctgggt ggggagttgt 540
cagtaagtgg ctatgcccca accctgaagc ctgtttcccc atctgtacaa tggaaatgat 600
aaagaccccc atctgatagg gtttttgtgg caaataaaca tttggttttt ttgttttgtt 660
ttgttttgtt ttttgagatg gaggtttgct ctgtggccca ggctggagtg cagtgacaca 720
atctcatctc accacaacct tcccctgcct cagcctccca agtagctggg attacaagca 780
tgtgccacca cacctggcta attttctatt tttagtagag atgggtttct ccatgttggt 840
cagcctcagc ctcccaagta actgggatta caggcctgtg ccaccacacc tggctaattt 900
tttctatttt tgacagggat ggggtttcac catgttggtc aggctggtct agaggtactg 960
gatcttgcta ccagtggaac agccactaag gattctgcag tgagagcaga gggccagcta 1020
agtggtactc tcccagagac tgtctgactc atgccacccc ctccaccttg gacacaggac 1080
actgtggttt ctgagccagg tacaatgact ccttttggta agtgcagtgg aagctgtaca 1140
ctgcccaggc aaagtgtctg ggcagcatag gcaggtgact cagatcccag ccagtggact 1200
tagcccctgt ttgctcctct gataactggg gtgaccttgg ttaatattca ccagcagcct 1260
cccctgttgc ccctctggat ccactgctta aatacagaca aggacagggc cctgtctcct 1320
cagcttcagg caccaccact gacctgggac agtgaataat tactctaagg taaatataaa 1380
atttttaagt gtataatgtg ttaaactact gattctaatt gtttctctct tttagattcc 1440
aacctttgga actgagttta aaccgcagcc accatgagca ccgccgtgct ggaaaatcct 1500
ggcctgggca gaaagctgag cgacttcggc caagagacaa gctacatcga ggacaactgc 1560
aaccagaacg gcgccatcag cctgatcttc agcctgaaag aagaagtggg cgccctggcc 1620
aaggtgctga gactgttcga agagaacgac gtgaacctga cacacatcga gagcagaccc 1680
agcagactga agaaggacga gtacgagttc ttcacccacc tggacaagcg gagcctgcct 1740
gctctgacca acatcatcaa gatcctgcgg cacgacatcg gcgccacagt gcacgaactg 1800
agccgggaca agaaaaagga caccgtgcca tggttcccca gaaccatcca agagctggac 1860
agattcgcca accagatcct gagctatggc gccgagctgg acgctgatca ccctggcttt 1920
aaggaccccg tgtaccgggc cagaagaaag cagtttgccg atatcgccta caactaccgg 1980
cacggccagc ctattcctcg ggtcgagtac atggaagagg aaaagaaaac ctggggcacc 2040
gtgttcaaga ccctgaagtc cctgtacaag acccacgcct gctacgagta caaccacatc 2100
ttcccactgc tcgaaaagta ctgcggcttc cacgaggaca atatccctca gcttgaggac 2160
gtgtcccagt tcctgcagac ctgcaccggc tttagactga ggccagttgc cggactgctg 2220
agcagcagag attttctcgg cggcctggcc ttcagagtgt tccactgtac ccagtacatc 2280
agacacggca gcaagcccat gtacacccct gagcctgata tctgccacga gctgctggga 2340
catgtgcccc tgttcagcga tagaagcttc gcccagttca gccaagagat cggactggct 2400
tctctgggag cccctgacga gtacattgag aagctggcca ccatctactg gttcaccgtg 2460
gaattcggcc tgtgcaagca gggcgacagc atcaaagctt atggcgctgg cctgctgtct 2520
agcttcggcg agctgcagta ctgtctgagc gagaagccta agctgctgcc cctggaactg 2580
gaaaagaccg ccatccagaa ctacaccgtg accgagttcc agcctctgta ctacgtggcc 2640
gagagcttca acgacgccaa agaaaaagtg cggaacttcg ccgccaccat tcctcggcct 2700
ttcagcgtca gatacgaccc ctacacacag cggatcgagg tgctggacaa cacacagcag 2760
ctgaaaattc tggccgactc catcaacagc gagatcggca tcctgtgcag cgccctgcag 2820
aaaatcaagt gatagttaat taagagcatc ttaccgccat ttattcccat atttgttctg 2880
tttttcttga tttgggtata catttaaatg ttaataaaac aaaatggtgg ggcaatcatt 2940
tacattttta gggatatgta attactagtt caggtgtatt gccacaagac aaacatgtta 3000
agaaactttc ccgttattta cgctctgttc ctgttaatca acctctggat tacaaaattt 3060
gtgaaagatt gactgatatt cttaactatg ttgctccttt tacgctgtgt ggatatgctg 3120
ctttatagcc tctgtatcta gctattgctt cccgtacggc tttcgttttc tcctccttgt 3180
ataaatcctg gttgctgtct cttttagagg agttgtggcc cgttgtccgt caacgtggcg 3240
tggtgtgctc tgtgtttgct gacgcaaccc ccactggctg gggcattgcc accacctgtc 3300
aactcctttc tgggactttc gctttccccc tcccgatcgc cacggcagaa ctcatcgccg 3360
cctgccttgc ccgctgctgg acaggggcta ggttgctggg cactgataat tccgtggtgt 3420
tgtctgtgcc ttctagttgc cagccatctg ttgtttgccc ctcccccgtg ccttccttga 3480
ccctggaagg tgccactccc actgtccttt cctaataaaa tgaggaaatt gcatcgcatt 3540
gtctgagtag gtgtcattct attctggggg gtggggtggg gcaggacagc aagggggagg 3600
attgggaaga caatagcagg catgctgggg atgcggtggg ctctatggct ctagagcatg 3660
gctacgtaga taagtagcat ggcgggttaa tcattaacta cacctgcagg aggaacccct 3720
agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc 3780
aaaggtcgcc cgacgcccgg gcggcctcag tgagcgagcg agcgcgcagc tgcctgcagg 3840
<210> 202
<211> 2778
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 202
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180
cgccggggga ggctgctggt gaatattaac caaggtcacc ccagttatcg gaggagcaaa 240
caggggctaa gtccacacgc gtggtaccgt ctgtctgcac atttcgtaga gcgagtgttc 300
cgatactcta atctccctag gcaaggttca tatttgtgta ggttacttat tctccttttg 360
ttgactaagt caataatcag aatcagcagg tttggagtca gcttggcagg gatcagcagc 420
ctgggttgga aggagggggt ataaaagccc cttcaccagg agaagccgtc acacagatcc 480
acaagctcct gaagaggtaa gggtttaagg gatggttggt tggtggggta ttaatgttta 540
attacctgga gcacctgcct gaaatcactt tttttcaggt tggtttaaac cgcagccacc 600
atgagcaccg ccgtgctgga aaatcctggc ctgggcagaa agctgagcga cttcggccaa 660
gagacaagct acatcgagga caactgcaac cagaacggcg ccatcagcct gatcttcagc 720
ctgaaagaag aagtgggcgc cctggccaag gtgctgagac tgttcgaaga gaacgacgtg 780
aacctgacac acatcgagag cagacccagc agactgaaga aggacgagta cgagttcttc 840
acccacctgg acaagcggag cctgcctgct ctgaccaaca tcatcaagat cctgcggcac 900
gacatcggcg ccacagtgca cgaactgagc cgggacaaga aaaaggacac cgtgccatgg 960
ttccccagaa ccatccaaga gctggacaga ttcgccaacc agatcctgag ctatggcgcc 1020
gagctggacg ctgatcaccc tggctttaag gaccccgtgt accgggccag aagaaagcag 1080
tttgccgata tcgcctacaa ctaccggcac ggccagccta ttcctcgggt cgagtacatg 1140
gaagaggaaa agaaaacctg gggcaccgtg ttcaagaccc tgaagtccct gtacaagacc 1200
cacgcctgct acgagtacaa ccacatcttc ccactgctcg aaaagtactg cggcttccac 1260
gaggacaata tccctcagct tgaggacgtg tcccagttcc tgcagacctg caccggcttt 1320
agactgaggc cagttgccgg actgctgagc agcagagatt ttctcggcgg cctggccttc 1380
agagtgttcc actgtaccca gtacatcaga cacggcagca agcccatgta cacccctgag 1440
cctgatatct gccacgagct gctgggacat gtgcccctgt tcagcgatag aagcttcgcc 1500
cagttcagcc aagagatcgg actggcttct ctgggagccc ctgacgagta cattgagaag 1560
ctggccacca tctactggtt caccgtggaa ttcggcctgt gcaagcaggg cgacagcatc 1620
aaagcttatg gcgctggcct gctgtctagc ttcggcgagc tgcagtactg tctgagcgag 1680
aagcctaagc tgctgcccct ggaactggaa aagaccgcca tccagaacta caccgtgacc 1740
gagttccagc ctctgtacta cgtggccgag agcttcaacg acgccaaaga aaaagtgcgg 1800
aacttcgccg ccaccattcc tcggcctttc agcgtcagat acgaccccta cacacagcgg 1860
atcgaggtgc tggacaacac acagcagctg aaaattctgg ccgactccat caacagcgag 1920
atcggcatcc tgtgcagcgc cctgcagaaa atcaagtgat agttaattaa gctcgctttc 1980
ttgctgtcca atttctatta aaggttcctt tgttccctaa gtccaactac taaactgggg 2040
gatattatga agggccttga gcatctggat tctgcctaat aaaaaacatt tattttcatt 2100
gcaatgatgt atttaaatta tttctgaata ttttactaaa aagggaatgt gggaggtcag 2160
tgcatttaaa acataaagaa atgaagagct agttcaaacc ttgggaaaat acactatatc 2220
ttaaactcca tgaaagaagg tgaggctgca aacagctaat gcacattggc aacagcccct 2280
gatgcctatg ccttattcat ccctcagaaa aggattcaag tagaggcttg atttggaggt 2340
taaagttttg ctatgctgta ttttacagac atgataagat acattgatga gtttggacaa 2400
accacaacta gaatgcagtg aaaaaaatgc tttatttgtg aaatttgtga tgctattgct 2460
ttatttgtaa ccattataag ctgcaataaa caagttaaca acaacaattg cattcatttt 2520
atgtttcagg ttcaggggga gatgtgggag gttttttaaa gcaagtaaaa cctctacaaa 2580
tgtggtatct agagcatggc tacgtagata agtagcatgg cgggttaatc attaactaca 2640
cctgcaggag gaacccctag tgatggagtt ggccactccc tctctgcgcg ctcgctcgct 2700
cactgaggcc gggcgaccaa aggtcgcccg acgcccgggc ggcctcagtg agcgagcgag 2760
cgcgcagctg cctgcagg 2778
<210> 203
<211> 2490
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 203
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180
cgccggggga ggctgctggt gaatattaac caaggtcacc ccagttatcg gaggagcaaa 240
caggggctaa gtccacacgc gtggtaccgt ctgtctgcac atttcgtaga gcgagtgttc 300
cgatactcta atctccctag gcaaggttca tatttgtgta ggttacttat tctccttttg 360
ttgactaagt caataatcag aatcagcagg tttggagtca gcttggcagg gatcagcagc 420
ctgggttgga aggagggggt ataaaagccc cttcaccagg agaagccgtc acacagatcc 480
acaagctcct gaagaggtaa gggtttaagg gatggttggt tggtggggta ttaatgttta 540
attacctgga gcacctgcct gaaatcactt tttttcaggt tggtttaaac cgcagccacc 600
atgagcaccg ccgtgctgga aaatcctggc ctgggcagaa agctgagcga cttcggccaa 660
gagacaagct acatcgagga caactgcaac cagaacggcg ccatcagcct gatcttcagc 720
ctgaaagaag aagtgggcgc cctggccaag gtgctgagac tgttcgaaga gaacgacgtg 780
aacctgacac acatcgagag cagacccagc agactgaaga aggacgagta cgagttcttc 840
acccacctgg acaagcggag cctgcctgct ctgaccaaca tcatcaagat cctgcggcac 900
gacatcggcg ccacagtgca cgaactgagc cgggacaaga aaaaggacac cgtgccatgg 960
ttccccagaa ccatccaaga gctggacaga ttcgccaacc agatcctgag ctatggcgcc 1020
gagctggacg ctgatcaccc tggctttaag gaccccgtgt accgggccag aagaaagcag 1080
tttgccgata tcgcctacaa ctaccggcac ggccagccta ttcctcgggt cgagtacatg 1140
gaagaggaaa agaaaacctg gggcaccgtg ttcaagaccc tgaagtccct gtacaagacc 1200
cacgcctgct acgagtacaa ccacatcttc ccactgctcg aaaagtactg cggcttccac 1260
gaggacaata tccctcagct tgaggacgtg tcccagttcc tgcagacctg caccggcttt 1320
agactgaggc cagttgccgg actgctgagc agcagagatt ttctcggcgg cctggccttc 1380
agagtgttcc actgtaccca gtacatcaga cacggcagca agcccatgta cacccctgag 1440
cctgatatct gccacgagct gctgggacat gtgcccctgt tcagcgatag aagcttcgcc 1500
cagttcagcc aagagatcgg actggcttct ctgggagccc ctgacgagta cattgagaag 1560
ctggccacca tctactggtt caccgtggaa ttcggcctgt gcaagcaggg cgacagcatc 1620
aaagcttatg gcgctggcct gctgtctagc ttcggcgagc tgcagtactg tctgagcgag 1680
aagcctaagc tgctgcccct ggaactggaa aagaccgcca tccagaacta caccgtgacc 1740
gagttccagc ctctgtacta cgtggccgag agcttcaacg acgccaaaga aaaagtgcgg 1800
aacttcgccg ccaccattcc tcggcctttc agcgtcagat acgaccccta cacacagcgg 1860
atcgaggtgc tggacaacac acagcagctg aaaattctgg ccgactccat caacagcgag 1920
atcggcatcc tgtgcagcgc cctgcagaaa atcaagtgat agttaattaa gctcgctttc 1980
ttgctgtcca atttctatta aaggttcctt tgttccctaa gtccaactac taaactgggg 2040
gatattatga agggccttga gcatctggat tctgcctcag acatgataag atacattgat 2100
gagtttggac aaaccacaac tagaatgcag tgaaaaaaat gctttatttg tgaaatttgt 2160
gatgctattg ctttatttgt aaccattata agctgcaata aacaagttaa caacaacaat 2220
tgcattcatt ttatgtttca ggttcagggg gagatgtggg aggtttttta aagcaagtaa 2280
aacctctaca aatgtggtat ctagagcatg gctacgtaga taagtagcat ggcgggttaa 2340
tcattaacta cacctgcagg aggaacccct agtgatggag ttggccactc cctctctgcg 2400
cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg gcggcctcag 2460
tgagcgagcg agcgcgcagc tgcctgcagg 2490
<210> 204
<211> 2964
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 204
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180
cgccggggga ggctgctggt gaatattaac caaggtcacc ccagttatcg gaggagcaaa 240
caggggctaa gtccacacgc gtggtaccgt ctgtctgcac atttcgtaga gcgagtgttc 300
cgatactcta atctccctag gcaaggttca tatttgtgta ggttacttat tctccttttg 360
ttgactaagt caataatcag aatcagcagg tttggagtca gcttggcagg gatcagcagc 420
ctgggttgga aggagggggt ataaaagccc cttcaccagg agaagccgtc acacagatcc 480
acaagctcct gaagaggtaa gggtttaagg gatggttggt tggtggggta ttaatgttta 540
attacctgga gcacctgcct gaaatcactt tttttcaggt tggtttaaac cgcagccacc 600
atgagcaccg ccgtgctgga aaatcctggc ctgggcagaa agctgagcga cttcggccaa 660
gagacaagct acatcgagga caactgcaac cagaacggcg ccatcagcct gatcttcagc 720
ctgaaagaag aagtgggcgc cctggccaag gtgctgagac tgttcgaaga gaacgacgtg 780
aacctgacac acatcgagag cagacccagc agactgaaga aggacgagta cgagttcttc 840
acccacctgg acaagcggag cctgcctgct ctgaccaaca tcatcaagat cctgcggcac 900
gacatcggcg ccacagtgca cgaactgagc cgggacaaga aaaaggacac cgtgccatgg 960
ttccccagaa ccatccaaga gctggacaga ttcgccaacc agatcctgag ctatggcgcc 1020
gagctggacg ctgatcaccc tggctttaag gaccccgtgt accgggccag aagaaagcag 1080
tttgccgata tcgcctacaa ctaccggcac ggccagccta ttcctcgggt cgagtacatg 1140
gaagaggaaa agaaaacctg gggcaccgtg ttcaagaccc tgaagtccct gtacaagacc 1200
cacgcctgct acgagtacaa ccacatcttc ccactgctcg aaaagtactg cggcttccac 1260
gaggacaata tccctcagct tgaggacgtg tcccagttcc tgcagacctg caccggcttt 1320
agactgaggc cagttgccgg actgctgagc agcagagatt ttctcggcgg cctggccttc 1380
agagtgttcc actgtaccca gtacatcaga cacggcagca agcccatgta cacccctgag 1440
cctgatatct gccacgagct gctgggacat gtgcccctgt tcagcgatag aagcttcgcc 1500
cagttcagcc aagagatcgg actggcttct ctgggagccc ctgacgagta cattgagaag 1560
ctggccacca tctactggtt caccgtggaa ttcggcctgt gcaagcaggg cgacagcatc 1620
aaagcttatg gcgctggcct gctgtctagc ttcggcgagc tgcagtactg tctgagcgag 1680
aagcctaagc tgctgcccct ggaactggaa aagaccgcca tccagaacta caccgtgacc 1740
gagttccagc ctctgtacta cgtggccgag agcttcaacg acgccaaaga aaaagtgcgg 1800
aacttcgccg ccaccattcc tcggcctttc agcgtcagat acgaccccta cacacagcgg 1860
atcgaggtgc tggacaacac acagcagctg aaaattctgg ccgactccat caacagcgag 1920
atcggcatcc tgtgcagcgc cctgcagaaa atcaagtgat agttaattaa gagcatctta 1980
ccgccattta ttcccatatt tgttctgttt ttcttgattt gggtatacat ttaaatgtta 2040
ataaaacaaa atggtggggc aatcatttac atttttaggg atatgtaatt actagttcag 2100
gtgtattgcc acaagacaaa catgttaaga aactttcccg ttatttacgc tctgttcctg 2160
ttaatcaacc tctggattac aaaatttgtg aaagattgac tgatattctt aactatgttg 2220
ctccttttac gctgtgtgga tatgctgctt tatagcctct gtatctagct attgcttccc 2280
gtacggcttt cgttttctcc tccttgtata aatcctggtt gctgtctctt ttagaggagt 2340
tgtggcccgt tgtccgtcaa cgtggcgtgg tgtgctctgt gtttgctgac gcaaccccca 2400
ctggctgggg cattgccacc acctgtcaac tcctttctgg gactttcgct ttccccctcc 2460
cgatcgccac ggcagaactc atcgccgcct gccttgcccg ctgctggaca ggggctaggt 2520
tgctgggcac tgataattcc gtggtgttgt ccagacatga taagatacat tgatgagttt 2580
ggacaaacca caactagaat gcagtgaaaa aaatgcttta tttgtgaaat ttgtgatgct 2640
attgctttat ttgtaaccat tataagctgc aataaacaag ttaacaacaa caattgcatt 2700
cattttatgt ttcaggttca gggggagatg tgggaggttt tttaaagcaa gtaaaacctc 2760
tacaaatgtg gtatctagag catggctacg tagataagta gcatggcggg ttaatcatta 2820
actacacctg caggaggaac ccctagtgat ggagttggcc actccctctc tgcgcgctcg 2880
ctcgctcact gaggccgggc gaccaaaggt cgcccgacgc ccgggcggcc tcagtgagcg 2940
agcgagcgcg cagctgcctg cagg 2964
<210> 205
<211> 3137
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 205
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180
cgccggggga ggctgctggt gaatattaac caaggtcacc ccagttatcg gaggagcaaa 240
caggggctaa gtccacacgc gtggtaccgt ctgtctgcac atttcgtaga gcgagtgttc 300
cgatactcta atctccctag gcaaggttca tatttgtgta ggttacttat tctccttttg 360
ttgactaagt caataatcag aatcagcagg tttggagtca gcttggcagg gatcagcagc 420
ctgggttgga aggagggggt ataaaagccc cttcaccagg agaagccgtc acacagatcc 480
acaagctcct gaagaggtaa gggtttaagg gatggttggt tggtggggta ttaatgttta 540
attacctgga gcacctgcct gaaatcactt tttttcaggt tggtttaaac cgcagccacc 600
atgagcaccg ccgtgctgga aaatcctggc ctgggcagaa agctgagcga cttcggccaa 660
gagacaagct acatcgagga caactgcaac cagaacggcg ccatcagcct gatcttcagc 720
ctgaaagaag aagtgggcgc cctggccaag gtgctgagac tgttcgaaga gaacgacgtg 780
aacctgacac acatcgagag cagacccagc agactgaaga aggacgagta cgagttcttc 840
acccacctgg acaagcggag cctgcctgct ctgaccaaca tcatcaagat cctgcggcac 900
gacatcggcg ccacagtgca cgaactgagc cgggacaaga aaaaggacac cgtgccatgg 960
ttccccagaa ccatccaaga gctggacaga ttcgccaacc agatcctgag ctatggcgcc 1020
gagctggacg ctgatcaccc tggctttaag gaccccgtgt accgggccag aagaaagcag 1080
tttgccgata tcgcctacaa ctaccggcac ggccagccta ttcctcgggt cgagtacatg 1140
gaagaggaaa agaaaacctg gggcaccgtg ttcaagaccc tgaagtccct gtacaagacc 1200
cacgcctgct acgagtacaa ccacatcttc ccactgctcg aaaagtactg cggcttccac 1260
gaggacaata tccctcagct tgaggacgtg tcccagttcc tgcagacctg caccggcttt 1320
agactgaggc cagttgccgg actgctgagc agcagagatt ttctcggcgg cctggccttc 1380
agagtgttcc actgtaccca gtacatcaga cacggcagca agcccatgta cacccctgag 1440
cctgatatct gccacgagct gctgggacat gtgcccctgt tcagcgatag aagcttcgcc 1500
cagttcagcc aagagatcgg actggcttct ctgggagccc ctgacgagta cattgagaag 1560
ctggccacca tctactggtt caccgtggaa ttcggcctgt gcaagcaggg cgacagcatc 1620
aaagcttatg gcgctggcct gctgtctagc ttcggcgagc tgcagtactg tctgagcgag 1680
aagcctaagc tgctgcccct ggaactggaa aagaccgcca tccagaacta caccgtgacc 1740
gagttccagc ctctgtacta cgtggccgag agcttcaacg acgccaaaga aaaagtgcgg 1800
aacttcgccg ccaccattcc tcggcctttc agcgtcagat acgaccccta cacacagcgg 1860
atcgaggtgc tggacaacac acagcagctg aaaattctgg ccgactccat caacagcgag 1920
atcggcatcc tgtgcagcgc cctgcagaaa atcaagtgat agttaattaa gagcatctta 1980
ccgccattta ttcccatatt tgttctgttt ttcttgattt gggtatacat ttaaatgtta 2040
ataaaacaaa atggtggggc aatcatttac atttttaggg atatgtaatt actagttcag 2100
gtgtattgcc acaagacaaa catgttaaga aactttcccg ttatttacgc tctgttcctg 2160
ttaatcaacc tctggattac aaaatttgtg aaagattgac tgatattctt aactatgttg 2220
ctccttttac gctgtgtgga tatgctgctt tatagcctct gtatctagct attgcttccc 2280
gtacggcttt cgttttctcc tccttgtata aatcctggtt gctgtctctt ttagaggagt 2340
tgtggcccgt tgtccgtcaa cgtggcgtgg tgtgctctgt gtttgctgac gcaaccccca 2400
ctggctgggg cattgccacc acctgtcaac tcctttctgg gactttcgct ttccccctcc 2460
cgatcgccac ggcagaactc atcgccgcct gccttgcccg ctgctggaca ggggctaggt 2520
tgctgggcac tgataattcc gtggtgttgt cgctcgcttt cttgctgtcc aatttctatt 2580
aaaggttcct ttgttcccta agtccaacta ctaaactggg ggatattatg aagggccttg 2640
agcatctgga ttctgcctaa taaaaaacat ttattttcat tgcaatgatg tatttaaatt 2700
atttctgaat attttactaa aaagggaatg tgggaggtca gtgcatttaa aacataaaga 2760
aatgaagagc tagttcaaac cttgggaaaa tacactatat cttaaactcc atgaaagaag 2820
gtgaggctgc aaacagctaa tgcacattgg caacagcccc tgatgcctat gccttattca 2880
tccctcagaa aaggattcaa gtagaggctt gatttggagg ttaaagtttt gctatgctgt 2940
attttatcta gagcatggct acgtagataa gtagcatggc gggttaatca ttaactacac 3000
ctgcaggagg aacccctagt gatggagttg gccactccct ctctgcgcgc tcgctcgctc 3060
actgaggccg ggcgaccaaa ggtcgcccga cgcccgggcg gcctcagtga gcgagcgagc 3120
gcgcagctgc ctgcagg 3137
<210> 206
<211> 3117
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 206
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180
cgcgttaatc attaacgctt gtactttggt acagttaatc attaacgctt gtactttggt 240
acagttaatc attaacgctt gtactttggt acaatcgatg cgagaacttg tgcctccccg 300
tgttcctgct ctttgtccct ctgtcctact tagactaata tttgccttgg gtactgcaaa 360
caggaaatgg gggagggaca ggagtagggc ggagggtagt taagaatgtg gatccccgtc 420
tgtctgcaca tttcgtagag cgagtgttcc gatactctaa tctccctagg caaggttcat 480
atttgtgtag gttacttatt ctccttttgt tgactaagtc aataatcaga atcagcaggt 540
ttggagtcag cttggcaggg atcagcagcc tgggttggaa ggagggggta taaaagcccc 600
ttcaccagga gaagccgtca cacagatcca caagctcctg aagaggtaag ggtttaaggg 660
atggttggtt ggtggggtat taatgtttaa ttacctggag cacctgcctg aaatcacttt 720
ttttcaggtt gggtttaaac cgcagccacc atgagcaccg ccgtgctgga aaatcctggc 780
ctgggcagaa agctgagcga cttcggccaa gagacaagct acatcgagga caactgcaac 840
cagaacggcg ccatcagcct gatcttcagc ctgaaagaag aagtgggcgc cctggccaag 900
gtgctgagac tgttcgaaga gaacgacgtg aacctgacac acatcgagag cagacccagc 960
agactgaaga aggacgagta cgagttcttc acccacctgg acaagcggag cctgcctgct 1020
ctgaccaaca tcatcaagat cctgcggcac gacatcggcg ccacagtgca cgaactgagc 1080
cgggacaaga aaaaggacac cgtgccatgg ttccccagaa ccatccaaga gctggacaga 1140
ttcgccaacc agatcctgag ctatggcgcc gagctggacg ctgatcaccc tggctttaag 1200
gaccccgtgt accgggccag aagaaagcag tttgccgata tcgcctacaa ctaccggcac 1260
ggccagccta ttcctcgggt cgagtacatg gaagaggaaa agaaaacctg gggcaccgtg 1320
ttcaagaccc tgaagtccct gtacaagacc cacgcctgct acgagtacaa ccacatcttc 1380
ccactgctcg aaaagtactg cggcttccac gaggacaata tccctcagct tgaggacgtg 1440
tcccagttcc tgcagacctg caccggcttt agactgaggc cagttgccgg actgctgagc 1500
agcagagatt ttctcggcgg cctggccttc agagtgttcc actgtaccca gtacatcaga 1560
cacggcagca agcccatgta cacccctgag cctgatatct gccacgagct gctgggacat 1620
gtgcccctgt tcagcgatag aagcttcgcc cagttcagcc aagagatcgg actggcttct 1680
ctgggagccc ctgacgagta cattgagaag ctggccacca tctactggtt caccgtggaa 1740
ttcggcctgt gcaagcaggg cgacagcatc aaagcttatg gcgctggcct gctgtctagc 1800
ttcggcgagc tgcagtactg tctgagcgag aagcctaagc tgctgcccct ggaactggaa 1860
aagaccgcca tccagaacta caccgtgacc gagttccagc ctctgtacta cgtggccgag 1920
agcttcaacg acgccaaaga aaaagtgcgg aacttcgccg ccaccattcc tcggcctttc 1980
agcgtcagat acgaccccta cacacagcgg atcgaggtgc tggacaacac acagcagctg 2040
aaaattctgg ccgactccat caacagcgag atcggcatcc tgtgcagcgc cctgcagaaa 2100
atcaagtgat agttaattaa gagcatctta ccgccattta ttcccatatt tgttctgttt 2160
ttcttgattt gggtatacat ttaaatgtta ataaaacaaa atggtggggc aatcatttac 2220
atttttaggg atatgtaatt actagttcag gtgtattgcc acaagacaaa catgttaaga 2280
aactttcccg ttatttacgc tctgttcctg ttaatcaacc tctggattac aaaatttgtg 2340
aaagattgac tgatattctt aactatgttg ctccttttac gctgtgtgga tatgctgctt 2400
tatagcctct gtatctagct attgcttccc gtacggcttt cgttttctcc tccttgtata 2460
aatcctggtt gctgtctctt ttagaggagt tgtggcccgt tgtccgtcaa cgtggcgtgg 2520
tgtgctctgt gtttgctgac gcaaccccca ctggctgggg cattgccacc acctgtcaac 2580
tcctttctgg gactttcgct ttccccctcc cgatcgccac ggcagaactc atcgccgcct 2640
gccttgcccg ctgctggaca ggggctaggt tgctgggcac tgataattcc gtggtgttgt 2700
ctgtgccttc tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc 2760
tggaaggtgc cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc 2820
tgagtaggtg tcattctatt ctggggggtg gggtggggca ggacagcaag ggggaggatt 2880
gggaagacaa tagcaggcat gctggggatg cggtgggctc tatggctcta gagcatggct 2940
acgtagataa gtagcatggc gggttaatca ttaactacac ctgcaggagg aacccctagt 3000
gatggagttg gccactccct ctctgcgcgc tcgctcgctc actgaggccg ggcgaccaaa 3060
ggtcgcccga cgcccgggcg gcctcagtga gcgagcgagc gcgcagctgc ctgcagg 3117
<210> 207
<211> 3454
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 207
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180
cgcgttaatc attaacgctt gtactttggt acagttaatc attaacgctt gtactttggt 240
acagttaatc attaacgctt gtactttggt acaatcgatg cgagaacttg tgcctccccg 300
tgttcctgct ctttgtccct ctgtcctact tagactaata tttgccttgg gtactgcaaa 360
caggaaatgg gggagggaca ggagtagggc ggagggtagt taagaatgtc aattgggggg 420
aggctgctgg tgaatattaa ccaaggtcac cccagttatc ggaggagcaa acaggggcta 480
agtccaccgg gggaggctgc tggtgaatat taaccaaggt caccccagtt atcggaggag 540
caaacagggg ctaagtccac cgggggaggc tgctggtgaa tattaaccaa ggtcacccca 600
gttatcggag gagcaaacag gggctaagtc cacggtaccc actgggagga tgttgagtaa 660
gatggaaaac tactgatgac ccttgcagag acagagtatt aggacatgtt tgaacagggg 720
ccgggcgatc agcaggtagc actagaggat ccccgtctgt ctgcacattt cgtagagcga 780
gtgttccgat actctaatct ccctaggcaa ggttcatatt tgtgtaggtt acttattctc 840
cttttgttga ctaagtcaat aatcagaatc agcaggtttg gagtcagctt ggcagggatc 900
agcagcctgg gttggaagga gggggtataa aagccccttc accaggagaa gccgtcacac 960
agatccacaa gctcctgaag aggtaagggt ttaagggatg gttggttggt ggggtattaa 1020
tgtttaatta cctggagcac ctgcctgaaa tcactttttt tcaggttggg tttaaaccgc 1080
agccaccatg agcaccgccg tgctggaaaa tcctggcctg ggcagaaagc tgagcgactt 1140
cggccaagag acaagctaca tcgaggacaa ctgcaaccag aacggcgcca tcagcctgat 1200
cttcagcctg aaagaagaag tgggcgccct ggccaaggtg ctgagactgt tcgaagagaa 1260
cgacgtgaac ctgacacaca tcgagagcag acccagcaga ctgaagaagg acgagtacga 1320
gttcttcacc cacctggaca agcggagcct gcctgctctg accaacatca tcaagatcct 1380
gcggcacgac atcggcgcca cagtgcacga actgagccgg gacaagaaaa aggacaccgt 1440
gccatggttc cccagaacca tccaagagct ggacagattc gccaaccaga tcctgagcta 1500
tggcgccgag ctggacgctg atcaccctgg ctttaaggac cccgtgtacc gggccagaag 1560
aaagcagttt gccgatatcg cctacaacta ccggcacggc cagcctattc ctcgggtcga 1620
gtacatggaa gaggaaaaga aaacctgggg caccgtgttc aagaccctga agtccctgta 1680
caagacccac gcctgctacg agtacaacca catcttccca ctgctcgaaa agtactgcgg 1740
cttccacgag gacaatatcc ctcagcttga ggacgtgtcc cagttcctgc agacctgcac 1800
cggctttaga ctgaggccag ttgccggact gctgagcagc agagattttc tcggcggcct 1860
ggccttcaga gtgttccact gtacccagta catcagacac ggcagcaagc ccatgtacac 1920
ccctgagcct gatatctgcc acgagctgct gggacatgtg cccctgttca gcgatagaag 1980
cttcgcccag ttcagccaag agatcggact ggcttctctg ggagcccctg acgagtacat 2040
tgagaagctg gccaccatct actggttcac cgtggaattc ggcctgtgca agcagggcga 2100
cagcatcaaa gcttatggcg ctggcctgct gtctagcttc ggcgagctgc agtactgtct 2160
gagcgagaag cctaagctgc tgcccctgga actggaaaag accgccatcc agaactacac 2220
cgtgaccgag ttccagcctc tgtactacgt ggccgagagc ttcaacgacg ccaaagaaaa 2280
agtgcggaac ttcgccgcca ccattcctcg gcctttcagc gtcagatacg acccctacac 2340
acagcggatc gaggtgctgg acaacacaca gcagctgaaa attctggccg actccatcaa 2400
cagcgagatc ggcatcctgt gcagcgccct gcagaaaatc aagtgatagt taattaagag 2460
catcttaccg ccatttattc ccatatttgt tctgtttttc ttgatttggg tatacattta 2520
aatgttaata aaacaaaatg gtggggcaat catttacatt tttagggata tgtaattact 2580
agttcaggtg tattgccaca agacaaacat gttaagaaac tttcccgtta tttacgctct 2640
gttcctgtta atcaacctct ggattacaaa atttgtgaaa gattgactga tattcttaac 2700
tatgttgctc cttttacgct gtgtggatat gctgctttat agcctctgta tctagctatt 2760
gcttcccgta cggctttcgt tttctcctcc ttgtataaat cctggttgct gtctctttta 2820
gaggagttgt ggcccgttgt ccgtcaacgt ggcgtggtgt gctctgtgtt tgctgacgca 2880
acccccactg gctggggcat tgccaccacc tgtcaactcc tttctgggac tttcgctttc 2940
cccctcccga tcgccacggc agaactcatc gccgcctgcc ttgcccgctg ctggacaggg 3000
gctaggttgc tgggcactga taattccgtg gtgttgtctg tgccttctag ttgccagcca 3060
tctgttgttt gcccctcccc cgtgccttcc ttgaccctgg aaggtgccac tcccactgtc 3120
ctttcctaat aaaatgagga aattgcatcg cattgtctga gtaggtgtca ttctattctg 3180
gggggtgggg tggggcagga cagcaagggg gaggattggg aagacaatag caggcatgct 3240
ggggatgcgg tgggctctat ggctctagag catggctacg tagataagta gcatggcggg 3300
ttaatcatta actacacctg caggaggaac ccctagtgat ggagttggcc actccctctc 3360
tgcgcgctcg ctcgctcact gaggccgggc gaccaaaggt cgcccgacgc ccgggcggcc 3420
tcagtgagcg agcgagcgcg cagctgcctg cagg 3454
<210> 208
<211> 3112
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 208
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180
cgcaacaggt tagtttgact agcgttaatc attaacgtta atcattaacg ttaatcatta 240
acgttaatca ttaacgttaa tcattaacat cgatgcgaga acttgtgcct ccccgtgttc 300
ctgctctttg tccctctgtc ctacttagac taatatttgc cttgggtact gcaaacagga 360
aatgggggag ggacaggagt agggcggagg gtagttaaga atgtggatcc ccgtctgtct 420
gcacatttcg tagagcgagt gttccgatac tctaatctcc ctaggcaagg ttcatatttg 480
tgtaggttac ttattctcct tttgttgact aagtcaataa tcagaatcag caggtttgga 540
gtcagcttgg cagggatcag cagcctgggt tggaaggagg gggtataaaa gccccttcac 600
caggagaagc cgtcacacag atccacaagc tcctgaagag gtaagggttt aagggatggt 660
tggttggtgg ggtattaatg tttaattacc tggagcacct gcctgaaatc actttttttc 720
aggttgggtt taaaccgcag ccaccatgag caccgccgtg ctggaaaatc ctggcctggg 780
cagaaagctg agcgacttcg gccaagagac aagctacatc gaggacaact gcaaccagaa 840
cggcgccatc agcctgatct tcagcctgaa agaagaagtg ggcgccctgg ccaaggtgct 900
gagactgttc gaagagaacg acgtgaacct gacacacatc gagagcagac ccagcagact 960
gaagaaggac gagtacgagt tcttcaccca cctggacaag cggagcctgc ctgctctgac 1020
caacatcatc aagatcctgc ggcacgacat cggcgccaca gtgcacgaac tgagccggga 1080
caagaaaaag gacaccgtgc catggttccc cagaaccatc caagagctgg acagattcgc 1140
caaccagatc ctgagctatg gcgccgagct ggacgctgat caccctggct ttaaggaccc 1200
cgtgtaccgg gccagaagaa agcagtttgc cgatatcgcc tacaactacc ggcacggcca 1260
gcctattcct cgggtcgagt acatggaaga ggaaaagaaa acctggggca ccgtgttcaa 1320
gaccctgaag tccctgtaca agacccacgc ctgctacgag tacaaccaca tcttcccact 1380
gctcgaaaag tactgcggct tccacgagga caatatccct cagcttgagg acgtgtccca 1440
gttcctgcag acctgcaccg gctttagact gaggccagtt gccggactgc tgagcagcag 1500
agattttctc ggcggcctgg ccttcagagt gttccactgt acccagtaca tcagacacgg 1560
cagcaagccc atgtacaccc ctgagcctga tatctgccac gagctgctgg gacatgtgcc 1620
cctgttcagc gatagaagct tcgcccagtt cagccaagag atcggactgg cttctctggg 1680
agcccctgac gagtacattg agaagctggc caccatctac tggttcaccg tggaattcgg 1740
cctgtgcaag cagggcgaca gcatcaaagc ttatggcgct ggcctgctgt ctagcttcgg 1800
cgagctgcag tactgtctga gcgagaagcc taagctgctg cccctggaac tggaaaagac 1860
cgccatccag aactacaccg tgaccgagtt ccagcctctg tactacgtgg ccgagagctt 1920
caacgacgcc aaagaaaaag tgcggaactt cgccgccacc attcctcggc ctttcagcgt 1980
cagatacgac ccctacacac agcggatcga ggtgctggac aacacacagc agctgaaaat 2040
tctggccgac tccatcaaca gcgagatcgg catcctgtgc agcgccctgc agaaaatcaa 2100
gtgatagtta attaagagca tcttaccgcc atttattccc atatttgttc tgtttttctt 2160
gatttgggta tacatttaaa tgttaataaa acaaaatggt ggggcaatca tttacatttt 2220
tagggatatg taattactag ttcaggtgta ttgccacaag acaaacatgt taagaaactt 2280
tcccgttatt tacgctctgt tcctgttaat caacctctgg attacaaaat ttgtgaaaga 2340
ttgactgata ttcttaacta tgttgctcct tttacgctgt gtggatatgc tgctttatag 2400
cctctgtatc tagctattgc ttcccgtacg gctttcgttt tctcctcctt gtataaatcc 2460
tggttgctgt ctcttttaga ggagttgtgg cccgttgtcc gtcaacgtgg cgtggtgtgc 2520
tctgtgtttg ctgacgcaac ccccactggc tggggcattg ccaccacctg tcaactcctt 2580
tctgggactt tcgctttccc cctcccgatc gccacggcag aactcatcgc cgcctgcctt 2640
gcccgctgct ggacaggggc taggttgctg ggcactgata attccgtggt gttgtctgtg 2700
ccttctagtt gccagccatc tgttgtttgc ccctcccccg tgccttcctt gaccctggaa 2760
ggtgccactc ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca ttgtctgagt 2820
aggtgtcatt ctattctggg gggtggggtg gggcaggaca gcaaggggga ggattgggaa 2880
gacaatagca ggcatgctgg ggatgcggtg ggctctatgg ctctagagca tggctacgta 2940
gataagtagc atggcgggtt aatcattaac tacacctgca ggaggaaccc ctagtgatgg 3000
agttggccac tccctctctg cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg 3060
cccgacgccc gggcggcctc agtgagcgag cgagcgcgca gctgcctgca gg 3112
<210> 209
<211> 3449
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 209
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180
cgcaacaggt tagtttgact agcgttaatc attaacgtta atcattaacg ttaatcatta 240
acgttaatca ttaacgttaa tcattaacat cgatgcgaga acttgtgcct ccccgtgttc 300
ctgctctttg tccctctgtc ctacttagac taatatttgc cttgggtact gcaaacagga 360
aatgggggag ggacaggagt agggcggagg gtagttaaga atgtcaattg gggggaggct 420
gctggtgaat attaaccaag gtcaccccag ttatcggagg agcaaacagg ggctaagtcc 480
accgggggag gctgctggtg aatattaacc aaggtcaccc cagttatcgg aggagcaaac 540
aggggctaag tccaccgggg gaggctgctg gtgaatatta accaaggtca ccccagttat 600
cggaggagca aacaggggct aagtccacgg tacccactgg gaggatgttg agtaagatgg 660
aaaactactg atgacccttg cagagacaga gtattaggac atgtttgaac aggggccggg 720
cgatcagcag gtagcactag aggatccccg tctgtctgca catttcgtag agcgagtgtt 780
ccgatactct aatctcccta ggcaaggttc atatttgtgt aggttactta ttctcctttt 840
gttgactaag tcaataatca gaatcagcag gtttggagtc agcttggcag ggatcagcag 900
cctgggttgg aaggaggggg tataaaagcc ccttcaccag gagaagccgt cacacagatc 960
cacaagctcc tgaagaggta agggtttaag ggatggttgg ttggtggggt attaatgttt 1020
aattacctgg agcacctgcc tgaaatcact ttttttcagg ttgggtttaa accgcagcca 1080
ccatgagcac cgccgtgctg gaaaatcctg gcctgggcag aaagctgagc gacttcggcc 1140
aagagacaag ctacatcgag gacaactgca accagaacgg cgccatcagc ctgatcttca 1200
gcctgaaaga agaagtgggc gccctggcca aggtgctgag actgttcgaa gagaacgacg 1260
tgaacctgac acacatcgag agcagaccca gcagactgaa gaaggacgag tacgagttct 1320
tcacccacct ggacaagcgg agcctgcctg ctctgaccaa catcatcaag atcctgcggc 1380
acgacatcgg cgccacagtg cacgaactga gccgggacaa gaaaaaggac accgtgccat 1440
ggttccccag aaccatccaa gagctggaca gattcgccaa ccagatcctg agctatggcg 1500
ccgagctgga cgctgatcac cctggcttta aggaccccgt gtaccgggcc agaagaaagc 1560
agtttgccga tatcgcctac aactaccggc acggccagcc tattcctcgg gtcgagtaca 1620
tggaagagga aaagaaaacc tggggcaccg tgttcaagac cctgaagtcc ctgtacaaga 1680
cccacgcctg ctacgagtac aaccacatct tcccactgct cgaaaagtac tgcggcttcc 1740
acgaggacaa tatccctcag cttgaggacg tgtcccagtt cctgcagacc tgcaccggct 1800
ttagactgag gccagttgcc ggactgctga gcagcagaga ttttctcggc ggcctggcct 1860
tcagagtgtt ccactgtacc cagtacatca gacacggcag caagcccatg tacacccctg 1920
agcctgatat ctgccacgag ctgctgggac atgtgcccct gttcagcgat agaagcttcg 1980
cccagttcag ccaagagatc ggactggctt ctctgggagc ccctgacgag tacattgaga 2040
agctggccac catctactgg ttcaccgtgg aattcggcct gtgcaagcag ggcgacagca 2100
tcaaagctta tggcgctggc ctgctgtcta gcttcggcga gctgcagtac tgtctgagcg 2160
agaagcctaa gctgctgccc ctggaactgg aaaagaccgc catccagaac tacaccgtga 2220
ccgagttcca gcctctgtac tacgtggccg agagcttcaa cgacgccaaa gaaaaagtgc 2280
ggaacttcgc cgccaccatt cctcggcctt tcagcgtcag atacgacccc tacacacagc 2340
ggatcgaggt gctggacaac acacagcagc tgaaaattct ggccgactcc atcaacagcg 2400
agatcggcat cctgtgcagc gccctgcaga aaatcaagtg atagttaatt aagagcatct 2460
taccgccatt tattcccata tttgttctgt ttttcttgat ttgggtatac atttaaatgt 2520
taataaaaca aaatggtggg gcaatcattt acatttttag ggatatgtaa ttactagttc 2580
aggtgtattg ccacaagaca aacatgttaa gaaactttcc cgttatttac gctctgttcc 2640
tgttaatcaa cctctggatt acaaaatttg tgaaagattg actgatattc ttaactatgt 2700
tgctcctttt acgctgtgtg gatatgctgc tttatagcct ctgtatctag ctattgcttc 2760
ccgtacggct ttcgttttct cctccttgta taaatcctgg ttgctgtctc ttttagagga 2820
gttgtggccc gttgtccgtc aacgtggcgt ggtgtgctct gtgtttgctg acgcaacccc 2880
cactggctgg ggcattgcca ccacctgtca actcctttct gggactttcg ctttccccct 2940
cccgatcgcc acggcagaac tcatcgccgc ctgccttgcc cgctgctgga caggggctag 3000
gttgctgggc actgataatt ccgtggtgtt gtctgtgcct tctagttgcc agccatctgt 3060
tgtttgcccc tcccccgtgc cttccttgac cctggaaggt gccactccca ctgtcctttc 3120
ctaataaaat gaggaaattg catcgcattg tctgagtagg tgtcattcta ttctgggggg 3180
tggggtgggg caggacagca agggggagga ttgggaagac aatagcaggc atgctgggga 3240
tgcggtgggc tctatggctc tagagcatgg ctacgtagat aagtagcatg gcgggttaat 3300
cattaactac acctgcagga ggaaccccta gtgatggagt tggccactcc ctctctgcgc 3360
gctcgctcgc tcactgaggc cgggcgacca aaggtcgccc gacgcccggg cggcctcagt 3420
gagcgagcga gcgcgcagct gcctgcagg 3449
<210> 210
<211> 3222
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 210
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180
cgcgggggag gctgctggtg aatattaacc aaggtcaccc cagttatcgg aggagcaaac 240
aggggctaag tccaccgggg gaggctgctg gtgaatatta accaaggtca ccccagttat 300
cggaggagca aacaggggct aagtccaccg ggggaggctg ctggtgaata ttaaccaagg 360
tcaccccagt tatcggagga gcaaacaggg gctaagtcca cggtacccac tgggaggatg 420
ttgagtaaga tggaaaacta ctgatgaccc ttgcagagac agagtattag gacatgtttg 480
aacaggggcc gggcgatcag caggtagcac tagaggatcc ccgtctgtct gcacatttcg 540
tagagcgagt gttccgatac tctaatctcc ctaggcaagg ttcatatttg tgtaggttac 600
ttattctcct tttgttgact aagtcaataa tcagaatcag caggtttgga gtcagcttgg 660
cagggatcag cagcctgggt tggaaggagg gggtataaaa gccccttcac caggagaagc 720
cgtcacacag atccacaagc tcctgaagag gtaagggttt aagggatggt tggttggtgg 780
ggtattaatg tttaattacc tggagcacct gcctgaaatc actttttttc aggttgggtt 840
taaaccgcag ccaccatgag caccgccgtg ctggaaaatc ctggcctggg cagaaagctg 900
agcgacttcg gccaagagac aagctacatc gaggacaact gcaaccagaa cggcgccatc 960
agcctgatct tcagcctgaa agaagaagtg ggcgccctgg ccaaggtgct gagactgttc 1020
gaagagaacg acgtgaacct gacacacatc gagagcagac ccagcagact gaagaaggac 1080
gagtacgagt tcttcaccca cctggacaag cggagcctgc ctgctctgac caacatcatc 1140
aagatcctgc ggcacgacat cggcgccaca gtgcacgaac tgagccggga caagaaaaag 1200
gacaccgtgc catggttccc cagaaccatc caagagctgg acagattcgc caaccagatc 1260
ctgagctatg gcgccgagct ggacgctgat caccctggct ttaaggaccc cgtgtaccgg 1320
gccagaagaa agcagtttgc cgatatcgcc tacaactacc ggcacggcca gcctattcct 1380
cgggtcgagt acatggaaga ggaaaagaaa acctggggca ccgtgttcaa gaccctgaag 1440
tccctgtaca agacccacgc ctgctacgag tacaaccaca tcttcccact gctcgaaaag 1500
tactgcggct tccacgagga caatatccct cagcttgagg acgtgtccca gttcctgcag 1560
acctgcaccg gctttagact gaggccagtt gccggactgc tgagcagcag agattttctc 1620
ggcggcctgg ccttcagagt gttccactgt acccagtaca tcagacacgg cagcaagccc 1680
atgtacaccc ctgagcctga tatctgccac gagctgctgg gacatgtgcc cctgttcagc 1740
gatagaagct tcgcccagtt cagccaagag atcggactgg cttctctggg agcccctgac 1800
gagtacattg agaagctggc caccatctac tggttcaccg tggaattcgg cctgtgcaag 1860
cagggcgaca gcatcaaagc ttatggcgct ggcctgctgt ctagcttcgg cgagctgcag 1920
tactgtctga gcgagaagcc taagctgctg cccctggaac tggaaaagac cgccatccag 1980
aactacaccg tgaccgagtt ccagcctctg tactacgtgg ccgagagctt caacgacgcc 2040
aaagaaaaag tgcggaactt cgccgccacc attcctcggc ctttcagcgt cagatacgac 2100
ccctacacac agcggatcga ggtgctggac aacacacagc agctgaaaat tctggccgac 2160
tccatcaaca gcgagatcgg catcctgtgc agcgccctgc agaaaatcaa gtgatagtta 2220
attaagagca tcttaccgcc atttattccc atatttgttc tgtttttctt gatttgggta 2280
tacatttaaa tgttaataaa acaaaatggt ggggcaatca tttacatttt tagggatatg 2340
taattactag ttcaggtgta ttgccacaag acaaacatgt taagaaactt tcccgttatt 2400
tacgctctgt tcctgttaat caacctctgg attacaaaat ttgtgaaaga ttgactgata 2460
ttcttaacta tgttgctcct tttacgctgt gtggatatgc tgctttatag cctctgtatc 2520
tagctattgc ttcccgtacg gctttcgttt tctcctcctt gtataaatcc tggttgctgt 2580
ctcttttaga ggagttgtgg cccgttgtcc gtcaacgtgg cgtggtgtgc tctgtgtttg 2640
ctgacgcaac ccccactggc tggggcattg ccaccacctg tcaactcctt tctgggactt 2700
tcgctttccc cctcccgatc gccacggcag aactcatcgc cgcctgcctt gcccgctgct 2760
ggacaggggc taggttgctg ggcactgata attccgtggt gttgtctgtg ccttctagtt 2820
gccagccatc tgttgtttgc ccctcccccg tgccttcctt gaccctggaa ggtgccactc 2880
ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca ttgtctgagt aggtgtcatt 2940
ctattctggg gggtggggtg gggcaggaca gcaaggggga ggattgggaa gacaatagca 3000
ggcatgctgg ggatgcggtg ggctctatgg ctctagagca tggctacgta gataagtagc 3060
atggcgggtt aatcattaac tacacctgca ggaggaaccc ctagtgatgg agttggccac 3120
tccctctctg cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg cccgacgccc 3180
gggcggcctc agtgagcgag cgagcgcgca gctgcctgca gg 3222
<210> 211
<211> 3222
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 211
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180
cgcgggggag gctgctggtg aatattaacc aaggtcaccc cagttatcgg aggagcaaac 240
aggggctaag tccaccgggg gaggctgctg gtgaatatta accaaggtca ccccagttat 300
cggaggagca aacaggggct aagtccaccg ggggaggctg ctggtgaata ttaaccaagg 360
tcaccccagt tatcggagga gcaaacaggg gctaagtcca cggtacccac tgggaggatg 420
ttgagtaaga tggaaaacta ctgatgaccc ttgcagagac agagtattag gacatgtttg 480
aacaggggcc gggcgatcag caggtagcac tagaggatcc ccgtctgtct gcacatttcg 540
tagagcgagt gttccgatac tctaatctcc ctaggcaagg ttcatatttg tgtaggttac 600
ttattctcct tttgttgact aagtcaataa tcagaatcag caggtttgga gtcagcttgg 660
cagggatcag cagcctgggt tggaaggagg gggtataaaa gccccttcac caggagaagc 720
cgtcacacag atccacaagc tcctgaagag gtaagggttt aagggatggt tggttggtgg 780
ggtattaatg tttaattacc tggagcacct gcctgaaatc actttttttc aggttgggtt 840
taaaccgcag ccaccatgag caccgccgtg ctggaaaatc ctggcctggg cagaaagctg 900
agcgacttcg gccaagagac aagctacatc gaggacaact gcaaccagaa cggcgccatc 960
agcctgatct tcagcctgaa agaagaagtg ggcgccctgg ccaaggtgct gagactgttc 1020
gaagagaacg acgtgaacct gacacacatc gagagcagac ccagcagact gaagaaggac 1080
gagtacgagt tcttcaccca cctggacaag cggagcctgc ctgctctgac caacatcatc 1140
aagatcctgc ggcacgacat cggcgccaca gtgcacgaac tgagccggga caagaaaaag 1200
gacaccgtgc catggttccc cagaaccatc caagagctgg acagattcgc caaccagatc 1260
ctgagctatg gcgccgagct ggacgctgat caccctggct ttaaggaccc cgtgtaccgg 1320
gccagaagaa agcagtttgc cgatatcgcc tacaactacc ggcacggcca gcctattcct 1380
cgggtcgagt acatggaaga ggaaaagaaa acctggggca ccgtgttcaa gaccctgaag 1440
tccctgtaca agacccacgc ctgctacgag tacaaccaca tcttcccact gctcgaaaag 1500
tactgcggct tccacgagga caatatccct cagcttgagg acgtgtccca gttcctgcag 1560
acctgcaccg gctttagact gaggccagtt gccggactgc tgagcagcag agattttctc 1620
ggcggcctgg ccttcagagt gttccactgt acccagtaca tcagacacgg cagcaagccc 1680
atgtacaccc ctgagcctga tatctgccac gagctgctgg gacatgtgcc cctgttcagc 1740
gatagaagct tcgcccagtt cagccaagag atcggactgg cttctctggg agcccctgac 1800
gagtacattg agaagctggc caccatctac tggttcaccg tggaattcgg cctgtgcaag 1860
cagggcgaca gcatcaaagc ttatggcgct ggcctgctgt ctagcttcgg cgagctgcag 1920
tactgtctga gcgagaagcc taagctgctg cccctggaac tggaaaagac cgccatccag 1980
aactacaccg tgaccgagtt ccagcctctg tactacgtgg ccgagagctt caacgacgcc 2040
aaagaaaaag tgcggaactt cgccgccacc attcctcggc ctttcagcgt cagatacgac 2100
ccctacacac agcggatcga ggtgctggac aacacacagc agctgaaaat tctggccgac 2160
tccatcaaca gcgagatcgg catcctgtgc agcgccctgc agaaaatcaa gtgatagtta 2220
attaagagca tcttaccgcc atttattccc atatttgttc tgtttttctt gatttgggta 2280
tacatttaaa tgttaataaa acaaaatggt ggggcaatca tttacatttt tagggatatg 2340
taattactag ttcaggtgta ttgccacaag acaaacatgt taagaaactt tcccgttatt 2400
tacgctctgt tcctgttaat caacctctgg attacaaaat ttgtgaaaga ttgactgata 2460
ttcttaacta tgttgctcct tttacgctgt gtggatatgc tgctttatag cctctgtatc 2520
tagctattgc ttcccgtacg gctttcgttt tctcctcctt gtataaatcc tggttgctgt 2580
ctcttttaga ggagttgtgg cccgttgtcc gtcaacgtgg cgtggtgtgc tctgtgtttg 2640
ctgacgcaac ccccactggc tggggcattg ccaccacctg tcaactcctt tctgggactt 2700
tcgctttccc cctcccgatc gccacggcag aactcatcgc cgcctgcctt gcccgctgct 2760
ggacaggggc taggttgctg ggcactgata attccgtggt gttgtctgtg ccttctagtt 2820
gccagccatc tgttgtttgc ccctcccccg tgccttcctt gaccctggaa ggtgccactc 2880
ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca ttgtctgagt aggtgtcatt 2940
ctattctggg gggtggggtg gggcaggaca gcaaggggga ggattgggaa gacaatagca 3000
ggcatgctgg ggatgcggtg ggctctatgg ctctagagca tggctacgta gataagtagc 3060
atggcgggtt aatcattaac tacacctgca ggaggaaccc ctagtgatgg agttggccac 3120
tccctctctg cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg cccgacgccc 3180
gggcggcctc agtgagcgag cgagcgcgca gctgcctgca gg 3222
<210> 212
<211> 3220
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 212
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180
cgcgggggag gctgctggtg aatattaacc aaggtcaccc cagttatcgg aggagcaaac 240
aggggctaag tccaccgggg gaggctgctg gtgaatatta accaaggtca ccccagttat 300
cggaggagca aacaggggct aagtccaccg ggggaggctg ctggtgaata ttaaccaagg 360
tcaccccagt tatcggagga gcaaacaggg gctaagtcca cggtacccac tgggaggatg 420
ttgagtaaga tggaaaacta ctgatgaccc ttgcagagac agagtattag gacatgtttg 480
aacaggggcc gggcgatcag caggtagcac tagaggatcc ccgtctgtct gcacatttcg 540
tagagcgagt gttccgatac tctaatctcc ctaggcaagg ttcatatttg tgtaggttac 600
ttattctcct tttgttgact aagtcaataa tcagaatcag caggtttgga gtcagcttgg 660
cagggatcag cagcctgggt tggaaggagg gggtataaaa gccccttcac caggagaagc 720
cgtcacacag atccacaagc tcctaagagg taagggttta agggatggtt ggttggtggg 780
gtattaatgt ttaattacct ggagcacctg cctgaaatca ctttttttca ggttggttta 840
aaccgcagcc accatgagta cagcagtgtt agagaatcca ggcctaggta gaaagctgtc 900
tgactttggc caggagacct cctacattga ggacaactgc aaccagaatg gagccatcag 960
cctgatcttc agcctgaagg aggaggtggg agccctggcc aaggtgctga gactgtttga 1020
ggagaatgat gtgaacctga cccacattga gtccagaccc tccagactga agaaggatga 1080
gtatgagttc ttcacccacc tggacaagag atccctgcct gctctgacca acatcatcaa 1140
gatcctgaga catgatattg gagccacagt gcatgagctg agcagggaca agaagaagga 1200
cacagtgcct tggttcccca gaaccatcca ggagctggac aggtttgcca accagatcct 1260
gtcctatgga gctgagctgg atgctgacca ccctggattt aaggatcctg tgtacagggc 1320
cagaaggaag cagtttgctg acattgccta caactacagg catggccagc ccatccccag 1380
ggtggagtac atggaggagg agaagaagac ctggggcact gtgttcaaga ccctgaagag 1440
cctgtacaag acccatgcct gctatgagta caaccacatc ttccccctgc tggagaagta 1500
ctgtggcttc catgaggaca acatccctca gctggaggat gtgtcccagt tcctgcagac 1560
ctgcacaggc ttcagactga gacctgtggc tggcctgctg tctagcagag acttcctggg 1620
aggcctggcc ttcagagtgt tccactgcac ccagtacatc agacatggaa gcaagcccat 1680
gtacacccct gagccagaca tctgccatga gctgctgggc catgtgcccc tgttctctga 1740
tagatccttt gcccagttca gccaggagat tggcctggcc agcctgggag cccctgatga 1800
gtacattgag aagctggcca ccatctactg gttcacagtg gagtttggcc tgtgcaagca 1860
gggagactcc atcaaggcct atggagctgg actgctgtcc tcctttggag agctgcagta 1920
ctgcctgtct gagaagccca agctgctgcc cctggagctg gagaagacag ccatccagaa 1980
ctacacagtg acagagttcc agcccctgta ctatgtggct gagagcttca atgatgccaa 2040
ggagaaggtg agaaactttg ctgccaccat ccccagaccc ttctctgtga ggtatgaccc 2100
ctacacccag aggattgagg tgctggacaa cacccagcag ctgaagatcc tggctgactc 2160
catcaactct gagattggca tcctgtgctc tgccctgcag aagatcaagt aaaccttaat 2220
taagagcatc ttaccgccat ttattcccat atttgttctg tttttcttga tttgggtata 2280
catttaaatg ttaataaaac aaaatggtgg ggcaatcatt tacattttta gggatatgta 2340
attactagtt caggtgtatt gccacaagac aaacatgtta agaaactttc ccgttattta 2400
cgctctgttc ctgttaatca acctctggat tacaaaattt gtgaaagatt gactgatatt 2460
cttaactatg ttgctccttt tacgctgtgt ggatatgctg ctttatagcc tctgtatcta 2520
gctattgctt cccgtacggc tttcgttttc tcctccttgt ataaatcctg gttgctgtct 2580
cttttagagg agttgtggcc cgttgtccgt caacgtggcg tggtgtgctc tgtgtttgct 2640
gacgcaaccc ccactggctg gggcattgcc accacctgtc aactcctttc tgggactttc 2700
gctttccccc tcccgatcgc cacggcagaa ctcatcgccg cctgccttgc ccgctgctgg 2760
acaggggcta ggttgctggg cactgataat tccgtggtgt tgtctgtgcc ttctagttgc 2820
cagccatctg ttgtttgccc ctcccccgtg ccttccttga ccctggaagg tgccactccc 2880
actgtccttt cctaataaaa tgaggaaatt gcatcgcatt gtctgagtag gtgtcattct 2940
attctggggg gtggggtggg gcaggacagc aagggggagg attgggaaga caatagcagg 3000
catgctgggg atgcggtggg ctctatggct ctagagcatg gctacgtaga taagtagcat 3060
ggcgggttaa tcattaacta cacctgcagg aggaacccct agtgatggag ttggccactc 3120
cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg 3180
gcggcctcag tgagcgagcg agcgcgcagc tgcctgcagg 3220
<210> 213
<211> 3220
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 213
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180
cgcgggggag gctgctggtg aatattaacc aaggtcaccc cagttatcgg aggagcaaac 240
aggggctaag tccaccgggg gaggctgctg gtgaatatta accaaggtca ccccagttat 300
cggaggagca aacaggggct aagtccaccg ggggaggctg ctggtgaata ttaaccaagg 360
tcaccccagt tatcggagga gcaaacaggg gctaagtcca cggtacccac tgggaggatg 420
ttgagtaaga tggaaaacta ctgatgaccc ttgcagagac agagtattag gacatgtttg 480
aacaggggcc gggcgatcag caggtagcac tagaggatcc ccgtctgtct gcacatttcg 540
tagagcgagt gttccgatac tctaatctcc ctaggcaagg ttcatatttg tgtaggttac 600
ttattctcct tttgttgact aagtcaataa tcagaatcag caggtttgga gtcagcttgg 660
cagggatcag cagcctgggt tggaaggagg gggtataaaa gccccttcac caggagaagc 720
cgtcacacag atccacaagc tcctaagagg taagggttta agggatggtt ggttggtggg 780
gtattaatgt ttaattacct ggagcacctg cctgaaatca ctttttttca ggttggttta 840
aaccgcagcc accatgtcca cagctgtgct ggagaaccct ggcctgggca gaaagctgtc 900
tgactttggc caggagacct cctacattga ggacaactgc aaccagaatg gagccatctc 960
cctgatcttc tccctgaagg aggaggtggg agccctggcc aaggtgctga gactgtttga 1020
ggagaatgat gtgaacctga cccacattga gtccagaccc tccagactga agaaggatga 1080
gtatgagttc ttcacccacc tggacaagag atccctgcct gccctgacca acatcatcaa 1140
gatcctgaga catgacattg gagccacagt gcatgagctg tccagagaca agaagaagga 1200
cacagtgccc tggttcccca gaaccatcca ggagctggac agatttgcca accagatcct 1260
gtcctatgga gctgagctgg atgctgacca ccctggcttc aaggaccctg tgtacagggc 1320
cagaagaaag cagtttgctg acattgccta caactacaga catggccagc ccatccccag 1380
agtggagtac atggaggagg agaagaagac ctggggcaca gtgttcaaga ccctgaagtc 1440
cctgtacaag acccatgcct gctatgagta caaccacatc ttccccctgc tggagaagta 1500
ctgtggcttc catgaggaca acatccccca gctggaggat gtgtcccagt tcctgcagac 1560
ctgcacaggc ttcagactga gacctgtggc tggcctgctg tcctccagag acttcctggg 1620
aggcctggcc ttcagagtgt tccactgcac ccagtacatc agacatggct ccaagcccat 1680
gtacacccct gagcctgaca tctgccatga gctgctgggc catgtgcccc tgttctctga 1740
cagatccttt gcccagttct cccaggagat tggcctggcc tccctgggag cccctgatga 1800
gtacattgag aagctggcca ccatctactg gttcacagtg gagtttggcc tgtgcaagca 1860
gggagactcc atcaaggcct atggagctgg cctgctgtcc tcctttggag agctgcagta 1920
ctgcctgtct gagaagccca agctgctgcc cctggagctg gagaagacag ccatccagaa 1980
ctacacagtg acagagttcc agcccctgta ctatgtggct gagtccttca atgatgccaa 2040
ggagaaggtc agaaactttg ctgccaccat ccccagaccc ttctctgtga gatatgaccc 2100
ctacacccag agaattgagg tgctggacaa cacccagcag ctgaagatcc tggctgactc 2160
catcaactct gagattggca tcctgtgctc tgccctgcag aagatcaagt aaaccttaat 2220
taagagcatc ttaccgccat ttattcccat atttgttctg tttttcttga tttgggtata 2280
catttaaatg ttaataaaac aaaatggtgg ggcaatcatt tacattttta gggatatgta 2340
attactagtt caggtgtatt gccacaagac aaacatgtta agaaactttc ccgttattta 2400
cgctctgttc ctgttaatca acctctggat tacaaaattt gtgaaagatt gactgatatt 2460
cttaactatg ttgctccttt tacgctgtgt ggatatgctg ctttatagcc tctgtatcta 2520
gctattgctt cccgtacggc tttcgttttc tcctccttgt ataaatcctg gttgctgtct 2580
cttttagagg agttgtggcc cgttgtccgt caacgtggcg tggtgtgctc tgtgtttgct 2640
gacgcaaccc ccactggctg gggcattgcc accacctgtc aactcctttc tgggactttc 2700
gctttccccc tcccgatcgc cacggcagaa ctcatcgccg cctgccttgc ccgctgctgg 2760
acaggggcta ggttgctggg cactgataat tccgtggtgt tgtctgtgcc ttctagttgc 2820
cagccatctg ttgtttgccc ctcccccgtg ccttccttga ccctggaagg tgccactccc 2880
actgtccttt cctaataaaa tgaggaaatt gcatcgcatt gtctgagtag gtgtcattct 2940
attctggggg gtggggtggg gcaggacagc aagggggagg attgggaaga caatagcagg 3000
catgctgggg atgcggtggg ctctatggct ctagagcatg gctacgtaga taagtagcat 3060
ggcgggttaa tcattaacta cacctgcagg aggaacccct agtgatggag ttggccactc 3120
cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg 3180
gcggcctcag tgagcgagcg agcgcgcagc tgcctgcagg 3220
<210> 214
<400> 214
000
<210> 215
<400> 215
000
<210> 216
<400> 216
000
<210> 217
<400> 217
000
<210> 218
<400> 218
000
<210> 219
<400> 219
000
<210> 220
<400> 220
000
<210> 221
<400> 221
000
<210> 222
<400> 222
000
<210> 223
<400> 223
000
<210> 224
<400> 224
000
<210> 225
<400> 225
000
<210> 226
<400> 226
000
<210> 227
<400> 227
000
<210> 228
<400> 228
000
<210> 229
<400> 229
000
<210> 230
<400> 230
000
<210> 231
<400> 231
000
<210> 232
<400> 232
000
<210> 233
<400> 233
000
<210> 234
<400> 234
000
<210> 235
<400> 235
000
<210> 236
<400> 236
000
<210> 237
<400> 237
000
<210> 238
<400> 238
000
<210> 239
<400> 239
000
<210> 240
<400> 240
000
<210> 241
<400> 241
000
<210> 242
<400> 242
000
<210> 243
<400> 243
000
<210> 244
<400> 244
000
<210> 245
<400> 245
000
<210> 246
<400> 246
000
<210> 247
<400> 247
000
<210> 248
<400> 248
000
<210> 249
<400> 249
000
<210> 250
<400> 250
000
<210> 251
<400> 251
000
<210> 252
<400> 252
000
<210> 253
<400> 253
000
<210> 254
<400> 254
000
<210> 255
<400> 255
000
<210> 256
<400> 256
000
<210> 257
<400> 257
000
<210> 258
<400> 258
000
<210> 259
<400> 259
000
<210> 260
<400> 260
000
<210> 261
<400> 261
000
<210> 262
<400> 262
000
<210> 263
<400> 263
000
<210> 264
<400> 264
000
<210> 265
<400> 265
000
<210> 266
<400> 266
000
<210> 267
<400> 267
000
<210> 268
<400> 268
000
<210> 269
<400> 269
000
<210> 270
<400> 270
000
<210> 271
<400> 271
000
<210> 272
<400> 272
000
<210> 273
<400> 273
000
<210> 274
<400> 274
000
<210> 275
<400> 275
000
<210> 276
<400> 276
000
<210> 277
<400> 277
000
<210> 278
<400> 278
000
<210> 279
<400> 279
000
<210> 280
<400> 280
000
<210> 281
<400> 281
000
<210> 282
<400> 282
000
<210> 283
<400> 283
000
<210> 284
<400> 284
000
<210> 285
<400> 285
000
<210> 286
<400> 286
000
<210> 287
<400> 287
000
<210> 288
<400> 288
000
<210> 289
<400> 289
000
<210> 290
<400> 290
000
<210> 291
<400> 291
000
<210> 292
<400> 292
000
<210> 293
<400> 293
000
<210> 294
<400> 294
000
<210> 295
<400> 295
000
<210> 296
<400> 296
000
<210> 297
<400> 297
000
<210> 298
<400> 298
000
<210> 299
<400> 299
000
<210> 300
<400> 300
000
<210> 301
<400> 301
000
<210> 302
<400> 302
000
<210> 303
<400> 303
000
<210> 304
<400> 304
000
<210> 305
<400> 305
000
<210> 306
<400> 306
000
<210> 307
<400> 307
000
<210> 308
<400> 308
000
<210> 309
<400> 309
000
<210> 310
<400> 310
000
<210> 311
<400> 311
000
<210> 312
<400> 312
000
<210> 313
<400> 313
000
<210> 314
<400> 314
000
<210> 315
<400> 315
000
<210> 316
<400> 316
000
<210> 317
<400> 317
000
<210> 318
<400> 318
000
<210> 319
<400> 319
000
<210> 320
<400> 320
000
<210> 321
<400> 321
000
<210> 322
<400> 322
000
<210> 323
<400> 323
000
<210> 324
<400> 324
000
<210> 325
<400> 325
000
<210> 326
<400> 326
000
<210> 327
<400> 327
000
<210> 328
<400> 328
000
<210> 329
<400> 329
000
<210> 330
<400> 330
000
<210> 331
<400> 331
000
<210> 332
<400> 332
000
<210> 333
<400> 333
000
<210> 334
<400> 334
000
<210> 335
<400> 335
000
<210> 336
<400> 336
000
<210> 337
<400> 337
000
<210> 338
<400> 338
000
<210> 339
<400> 339
000
<210> 340
<400> 340
000
<210> 341
<400> 341
000
<210> 342
<400> 342
000
<210> 343
<400> 343
000
<210> 344
<400> 344
000
<210> 345
<400> 345
000
<210> 346
<400> 346
000
<210> 347
<400> 347
000
<210> 348
<400> 348
000
<210> 349
<400> 349
000
<210> 350
<400> 350
000
<210> 351
<400> 351
000
<210> 352
<400> 352
000
<210> 353
<400> 353
000
<210> 354
<400> 354
000
<210> 355
<400> 355
000
<210> 356
<400> 356
000
<210> 357
<400> 357
000
<210> 358
<400> 358
000
<210> 359
<400> 359
000
<210> 360
<400> 360
000
<210> 361
<400> 361
000
<210> 362
<400> 362
000
<210> 363
<400> 363
000
<210> 364
<400> 364
000
<210> 365
<400> 365
000
<210> 366
<400> 366
000
<210> 367
<400> 367
000
<210> 368
<400> 368
000
<210> 369
<400> 369
000
<210> 370
<400> 370
000
<210> 371
<400> 371
000
<210> 372
<400> 372
000
<210> 373
<400> 373
000
<210> 374
<400> 374
000
<210> 375
<400> 375
000
<210> 376
<400> 376
000
<210> 377
<400> 377
000
<210> 378
<400> 378
000
<210> 379
<400> 379
000
<210> 380
<400> 380
000
<210> 381
<400> 381
000
<210> 382
<211> 1359
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 382
atgagcaccg ccgtgctgga aaatcctggc ctgggcagaa agctgagcga cttcggccaa 60
gagacaagct acatcgagga caactgcaac cagaacggcg ccatcagcct gatcttcagc 120
ctgaaagaag aagtgggcgc cctggccaag gtgctgagac tgttcgaaga gaacgacgtg 180
aacctgacac acatcgagag cagacccagc agactgaaga aggacgagta cgagttcttc 240
acccacctgg acaagcggag cctgcctgct ctgaccaaca tcatcaagat cctgcggcac 300
gacatcggcg ccacagtgca cgaactgagc cgggacaaga aaaaggacac cgtgccatgg 360
ttccccagaa ccatccaaga gctggacaga ttcgccaacc agatcctgag ctatggcgcc 420
gagctggacg ctgatcaccc tggctttaag gaccccgtgt accgggccag aagaaagcag 480
tttgccgata tcgcctacaa ctaccggcac ggccagccta ttcctcgggt cgagtacatg 540
gaagaggaaa agaaaacctg gggcaccgtg ttcaagaccc tgaagtccct gtacaagacc 600
cacgcctgct acgagtacaa ccacatcttc ccactgctcg aaaagtactg cggcttccac 660
gaggacaata tccctcagct tgaggacgtg tcccagttcc tgcagacctg caccggcttt 720
agactgaggc cagttgccgg actgctgagc agcagagatt ttctcggcgg cctggccttc 780
agagtgttcc actgtaccca gtacatcaga cacggcagca agcccatgta cacccctgag 840
cctgatatct gccacgagct gctgggacat gtgcccctgt tcagcgatag aagcttcgcc 900
cagttcagcc aagagatcgg actggcttct ctgggagccc ctgacgagta cattgagaag 960
ctggccacca tctactggtt caccgtggaa ttcggcctgt gcaagcaggg cgacagcatc 1020
aaagcttatg gcgctggcct gctgtctagc ttcggcgagc tgcagtactg tctgagcgag 1080
aagcctaagc tgctgcccct ggaactggaa aagaccgcca tccagaacta caccgtgacc 1140
gagttccagc ctctgtacta cgtggccgag agcttcaacg acgccaaaga aaaagtgcgg 1200
aacttcgccg ccaccattcc tcggcctttc agcgtcagat acgaccccta cacacagcgg 1260
atcgaggtgc tggacaacac acagcagctg aaaattctgg ccgactccat caacagcgag 1320
atcggcatcc tgtgcagcgc cctgcagaaa atcaagtga 1359
<210> 383
<211> 1363
<212> DNA
<213> Homo sapiens
<400> 383
atgtccactg cggtcctgga aaacccaggc ttgggcagga aactctctga ctttggacag 60
gaaacaagct atattgaaga caactgcaat caaaatggtg ccatatcact gatcttctca 120
ctcaaagaag aagttggtgc attggccaaa gtattgcgct tatttgagga gaatgatgta 180
aacctgaccc acattgaatc tagaccttct cgtttaaaga aagatgagta tgaatttttc 240
acccatttgg ataaacgtag cctgcctgct ctgacaaaca tcatcaagat cttgaggcat 300
gacattggtg ccactgtcca tgagctttca cgagataaga agaaagacac agtgccctgg 360
ttcccaagaa ccattcaaga gctggacaga tttgccaatc agattctcag ctatggagcg 420
gaactggatg ctgaccaccc tggttttaaa gatcctgtgt accgtgcaag acggaagcag 480
tttgctgaca ttgcctacaa ctaccgccat gggcagccca tccctcgagt ggaatacatg 540
gaggaagaaa agaaaacatg gggcacagtg ttcaagactc tgaagtcctt gtataaaacc 600
catgcttgct atgagtacaa tcacattttt ccacttcttg aaaagtactg tggcttccat 660
gaagataaca ttccccagct ggaagacgtt tctcagttcc tgcagacttg cactggtttc 720
cgcctccgac ctgtggctgg cctgctttcc tctcgggatt tcttgggtgg cctggccttc 780
cgagtcttcc actgcacaca gtacatcaga catggatcca agcccatgta tacccccgaa 840
cctgacatct gccatgagct gttgggacat gtgcccttgt tttcagatcg cagctttgcc 900
cagttttccc aggaaattgg ccttgcctct ctgggtgcac ctgatgaata cattgaaaag 960
ctcgccacaa tttactggtt tactgtggag tttgggctct gcaaacaagg agactccata 1020
aaggcatatg gtgctgggct cctgtcatcc tttggtgaat tacagtactg cttatcagag 1080
aagccaaagc ttctccccct ggagctggag aagacagcca tccaaaatta cactgtcacg 1140
gagttccagc ccctctatta cgtggcagag agttttaatg atgccaagga gaaagtaagg 1200
aactttgctg ccacaatacc tcggcccttc tcagttcgct acgacccata cacccaaagg 1260
attgaggtct tggacaatac ccagcagctt aagattttgg ctgattccat taacagtgaa 1320
attggaatcc tttgcagtgc cctccagaaa ataaagtaat taa 1363
<210> 384
<211> 3359
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 384
atgagcaccg ccgtgctgga aaatcctggc ttgggcagga aactctctga ctttggacag 60
gtgagccagg gcagcctgag ctgctcagtt aggggaattt gggcctccag agaaagagat 120
cccaagactg ctggtgcttc ctggtttcat aagctcagta agaagtctga attggttgga 180
agctgatgag aatatccagg aagtcaacag acaaatgtcc tcaacaattg tttctaagta 240
ggagaacatc tgtcctgggt ggctttcaca ggaatgaatg accattgctt tagggggttg 300
gggatctggc ctccagaact gccaccaatt agctgtgtgt ctttggacaa gttactgtcc 360
ctctctgttg tctgtttact cttctgtaca ctgaaggggc tggtccctaa tgatctggga 420
tgggatgtgg aatccttcta gatttctttt gtaatattta taaagtgctc tcagcaaggt 480
atcaaaatgg caaaattgtg agtaactatc ctcctttcat tttgggaaga agatgaggca 540
tgaagagaat tcagacagaa acttactcag accaggggag gcagaaacta agcagagagg 600
aaaatgacca agagttagcc ctgggcatgg aatgtgaaag aaccctaaag gtgacttgga 660
aataatgccc aaggtatatt ccattctcct ggatttgttg gcattttctt gaggtgaaga 720
attgcagaat acattcttta atgtgaccta catatttacc catgtgagga agtctgctcc 780
tggactcttg agattcagtc ataaagccca ggccagggaa ataatgtaag tctgcaggcc 840
cctgtcatca gtaggattag ggagaagagt tctcagtaga aaacagggag gctggagaga 900
aaagaatggt taatgttaag gttaatataa ctagaaagac tgcagaactt aggactgatt 960
tttatttgaa tccttaaaaa aaaaaatttc ttatgaaaat agtacatggc tcttaggaga 1020
cagaacttat tgtacagagg aacagtgtga gagtcagagt gaattttatg tattattttt 1080
ggacttaggc taatgattta gcaaactctg gaatgtcagc cctaacccca accttggttt 1140
tctgtcacat gcatgtagta agtgctagat cctggacatt ctttgagatt tagtttaaga 1200
ctaagtttat tttctgatag gttatttgtg tactttcatg gattttgtaa ctctttttca 1260
acaattggat gtctcagatc tcagcatatg ggagcaagtt aatgcttcct gagatctttg 1320
ccaaaggtca agaggtcatt tttgtgtatt tataattttc catcattttt atatacttct 1380
caatattctt tttaaactat tcttttcctt ttttcatcct ctgaatactg ttttgacaga 1440
tcttgttatt agcatgcttt cagggatgag aaaactaaga aagctgaatg atttgcccaa 1500
agtagtccac ctggaaaatg aaagagagag gattccaatc caggtcttag gattcaaaag 1560
cctgtgcatg ttccattttt agtactttcc acactgtatt tctcaatgtc tttctgggac 1620
attttataaa tcatattata tcacctctaa ggatctttca gtttgttata tatgtgtcta 1680
ttaagttaga ttgtgagctc ctaaaagata aagcattgtc ttattcatct ttaaatttct 1740
cagagcccaa atagtgcctg gaacctagta gttgctcaat aaaaggtatt gaatttacag 1800
gattgaatgg tgacatcaat gaataattga agattcctta agctgataac tgacccagta 1860
gcatcattga tcatttaatt gccctggact tacttatttt ccaccacact acatatttct 1920
gtatagaata tatatagctc attgtattgc aagatttaac tagaagaaag agttcatgct 1980
tgctttgtcc atgtaggttt aacaggaatg aattgctaaa ctgtggaaaa tgttttaaac 2040
aaatgcatct tatcctgtag gaaacaagct atattgaaga caactgcaat caaaacggcg 2100
ccatcagcct gatcttcagc ctgaaagaag aagtgggcgc cctggccaag gtgctgagac 2160
tgttcgaaga gaacgacgtg aacctgacac acatcgagag cagacccagc agactgaaga 2220
aggacgagta cgagttcttc acccacctgg acaagcggag cctgcctgct ctgaccaaca 2280
tcatcaagat cctgcggcac gacatcggcg ccacagtgca cgaactgagc cgggacaaga 2340
aaaaggacac cgtgccatgg ttccccagaa ccatccaaga gctggacaga ttcgccaacc 2400
agatcctgag ctatggcgcc gagctggacg ctgatcaccc tggctttaag gaccccgtgt 2460
accgggccag aagaaagcag tttgccgata tcgcctacaa ctaccggcac ggccagccta 2520
ttcctcgggt cgagtacatg gaagaggaaa agaaaacctg gggcaccgtg ttcaagaccc 2580
tgaagtccct gtacaagacc cacgcctgct acgagtacaa ccacatcttc ccactgctcg 2640
aaaagtactg cggcttccac gaggacaata tccctcagct tgaggacgtg tcccagttcc 2700
tgcagacctg caccggcttt agactgaggc cagttgccgg actgctgagc agcagagatt 2760
ttctcggcgg cctggccttc agagtgttcc actgtaccca gtacatcaga cacggcagca 2820
agcccatgta cacccctgag cctgatatct gccacgagct gctgggacat gtgcccctgt 2880
tcagcgatag aagcttcgcc cagttcagcc aagagatcgg actggcttct ctgggagccc 2940
ctgacgagta cattgagaag ctggccacca tctactggtt caccgtggaa ttcggcctgt 3000
gcaagcaggg cgacagcatc aaagcttatg gcgctggcct gctgtctagc ttcggcgagc 3060
tgcagtactg tctgagcgag aagcctaagc tgctgcccct ggaactggaa aagaccgcca 3120
tccagaacta caccgtgacc gagttccagc ctctgtacta cgtggccgag agcttcaacg 3180
acgccaaaga aaaagtgcgg aacttcgccg ccaccattcc tcggcctttc agcgtcagat 3240
acgaccccta cacacagcgg atcgaggtgc tggacaacac acagcagctg aaaattctgg 3300
ccgactccat caacagcgag atcggcatcc tgtgcagcgc cctgcagaaa atcaagtga 3359
<210> 385
<211> 2226
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 385
atgagcaccg ccgtgctgga aaatcctggc ttgggcagga aactctctga ctttggacag 60
gtgagccagg gcagcctgag ctgctcagtt aggggaattt gggcctccag agaaagagat 120
cccaagactg ctggtgcttc ctggtttcat aagctcagta agaagtctga attggttgga 180
agctgatgag aatatccagg aagtcaacag acaaatgtcc tcaacaattg tttctaagta 240
ggagaacatc tgtcctgggt ggctttcaca ggaatgaatg accattgctt tagggggttg 300
gggatctggc ctccagaact gccaccaatt agctgtgtgt ctttggacaa gttactgtcc 360
ctctctgttg tctgtttact cttctgtaca ctgaaggggt tccaatccag gtcttaggat 420
tcaaaagcct gtgcatgttc catttttagt actttccaca ctgtatttct caatgtcttt 480
ctgggacatt ttataaatca tattatatca cctctaagga tctttcagtt tgttatatat 540
gtgtctatta agttagattg tgagctccta aaagataaag cattgtctta ttcatcttta 600
aatttctcag agcccaaata gtgcctggaa cctagtagtt gctcaataaa aggtattgaa 660
tttacaggat tgaatggtga catcaatgaa taattgaaga ttccttaagc tgataactga 720
cccagtagca tcattgatca tttaattgcc ctggacttac ttattttcca ccacactaca 780
tatttctgta tagaatatat atagctcatt gtattgcaag atttaactag aagaaagagt 840
tcatgcttgc tttgtccatg taggtttaac aggaatgaat tgctaaactg tggaaaatgt 900
tttaaacaaa tgcatcttat cctgtaggaa acaagctata ttgaagacaa ctgcaatcaa 960
aacggcgcca tcagcctgat cttcagcctg aaagaagaag tgggcgccct ggccaaggtg 1020
ctgagactgt tcgaagagaa cgacgtgaac ctgacacaca tcgagagcag acccagcaga 1080
ctgaagaagg acgagtacga gttcttcacc cacctggaca agcggagcct gcctgctctg 1140
accaacatca tcaagatcct gcggcacgac atcggcgcca cagtgcacga actgagccgg 1200
gacaagaaaa aggacaccgt gccatggttc cccagaacca tccaagagct ggacagattc 1260
gccaaccaga tcctgagcta tggcgccgag ctggacgctg atcaccctgg ctttaaggac 1320
cccgtgtacc gggccagaag aaagcagttt gccgatatcg cctacaacta ccggcacggc 1380
cagcctattc ctcgggtcga gtacatggaa gaggaaaaga aaacctgggg caccgtgttc 1440
aagaccctga agtccctgta caagacccac gcctgctacg agtacaacca catcttccca 1500
ctgctcgaaa agtactgcgg cttccacgag gacaatatcc ctcagcttga ggacgtgtcc 1560
cagttcctgc agacctgcac cggctttaga ctgaggccag ttgccggact gctgagcagc 1620
agagattttc tcggcggcct ggccttcaga gtgttccact gtacccagta catcagacac 1680
ggcagcaagc ccatgtacac ccctgagcct gatatctgcc acgagctgct gggacatgtg 1740
cccctgttca gcgatagaag cttcgcccag ttcagccaag agatcggact ggcttctctg 1800
ggagcccctg acgagtacat tgagaagctg gccaccatct actggttcac cgtggaattc 1860
ggcctgtgca agcagggcga cagcatcaaa gcttatggcg ctggcctgct gtctagcttc 1920
ggcgagctgc agtactgtct gagcgagaag cctaagctgc tgcccctgga actggaaaag 1980
accgccatcc agaactacac cgtgaccgag ttccagcctc tgtactacgt ggccgagagc 2040
ttcaacgacg ccaaagaaaa agtgcggaac ttcgccgcca ccattcctcg gcctttcagc 2100
gtcagatacg acccctacac acagcggatc gaggtgctgg acaacacaca gcagctgaaa 2160
attctggccg actccatcaa cagcgagatc ggcatcctgt gcagcgccct gcagaaaatc 2220
aagtga 2226
<210> 386
<211> 2179
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 386
atgagcaccg ccgtgctgga aaatcctggc ctgggcagaa agctgagcga cttcggccag 60
gtaagcctgt tgggcttcca ctgctaggag agaattggtt ccccacatgt gaaagcagtc 120
tgggaaatgc tggtatttcc agtctcctaa ggctactaag aaatatgact ttatttagag 180
gcgaggaaaa tgcccaggaa gtcaactgat gagtctagtc ttaacaagtt gaggatacag 240
aaagttgggg atctgagctg ctaccaacat ctgtgtgtct ttgggtggct cattggtatc 300
ctctgcctat tggctttatc ttctgtacac tgaaaggaaa tggctggtcc ttagtcacct 360
acccaggtct tggatccata gcctacggat gtcccatttt tattgctttt tatattttgt 420
ctcccagtgt ctttttgagg attttttttt tttttttgca tcacttgctc ttcctctaag 480
aatctcctga cttcttgtac atgtgtctga tggtcagaat tttagcactg aagtatgggc 540
gtatttatca taattcaggt ttatatcctt tcagatatgg gctagggtct ggtattaggg 600
tgctcattaa aaaatgttga tttttgtcag tgtctagtga catcaatgca taatttaagg 660
ttctataaat tgaaagctaa cccaggagtg actcatcctc tcattgtttt caacttactt 720
atttctgatc acactgactt ccctgtggaa tacacgtggt tcactgtgtt ccaaagctta 780
acgagcagaa aaaggttatg ctcgtctctt cttgagaggt tttaagagaa taattgctaa 840
gctgtgaaaa acattttaac caagtgatct aattatgtag gagacaagct acatcgagga 900
caactgcaac cagaacggcg ccatcagcct gatcttcagc ctgaaagaag aagtgggcgc 960
cctggccaag gtgctgagac tgttcgaaga gaacgacgtg aacctgacac acatcgagag 1020
cagacccagc agactgaaga aggacgagta cgagttcttc acccacctgg acaagcggag 1080
cctgcctgct ctgaccaaca tcatcaagat cctgcggcac gacatcggcg ccacagtgca 1140
cgaactgagc cgggacaaga aaaaggacac cgtgccatgg ttccccagaa ccatccaaga 1200
gctggacaga ttcgccaacc agatcctgag ctatggcgcc gagctggacg ctgatcaccc 1260
tggctttaag gaccccgtgt accgggccag aagaaagcag tttgccgata tcgcctacaa 1320
ctaccggcac ggccagccta ttcctcgggt cgagtacatg gaagaggaaa agaaaacctg 1380
gggcaccgtg ttcaagaccc tgaagtccct gtacaagacc cacgcctgct acgagtacaa 1440
ccacatcttc ccactgctcg aaaagtactg cggcttccac gaggacaata tccctcagct 1500
tgaggacgtg tcccagttcc tgcagacctg caccggcttt agactgaggc cagttgccgg 1560
actgctgagc agcagagatt ttctcggcgg cctggccttc agagtgttcc actgtaccca 1620
gtacatcaga cacggcagca agcccatgta cacccctgag cctgatatct gccacgagct 1680
gctgggacat gtgcccctgt tcagcgatag aagcttcgcc cagttcagcc aagagatcgg 1740
actggcttct ctgggagccc ctgacgagta cattgagaag ctggccacca tctactggtt 1800
caccgtggaa ttcggcctgt gcaagcaggg cgacagcatc aaagcttatg gcgctggcct 1860
gctgtctagc ttcggcgagc tgcagtactg tctgagcgag aagcctaagc tgctgcccct 1920
ggaactggaa aagaccgcca tccagaacta caccgtgacc gagttccagc ctctgtacta 1980
cgtggccgag agcttcaacg acgccaaaga aaaagtgcgg aacttcgccg ccaccattcc 2040
tcggcctttc agcgtcagat acgaccccta cacacagcgg atcgaggtgc tggacaacac 2100
acagcagctg aaaattctgg ccgactccat caacagcgag atcggcatcc tgtgcagcgc 2160
cctgcagaaa atcaagtga 2179
<210> 387
<211> 2179
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 387
atgagcaccg ccgtgctgga aaatcctggc ttgggcagga aactctctga ctttggacag 60
gtaagcctgt tgggcttcca ctgctaggag agaattggtt ccccacatgt gaaagcagtc 120
tgggaaatgc tggtatttcc agtctcctaa ggctactaag aaatatgact ttatttagag 180
gcgaggaaaa tgcccaggaa gtcaactgat gagtctagtc ttaacaagtt gaggatacag 240
aaagttgggg atctgagctg ctaccaacat ctgtgtgtct ttgggtggct cattggtatc 300
ctctgcctat tggctttatc ttctgtacac tgaaaggaaa tggctggtcc ttagtcacct 360
acccaggtct tggatccata gcctacggat gtcccatttt tattgctttt tatattttgt 420
ctcccagtgt ctttttgagg attttttttt tttttttgca tcacttgctc ttcctctaag 480
aatctcctga cttcttgtac atgtgtctga tggtcagaat tttagcactg aagtatgggc 540
gtatttatca taattcaggt ttatatcctt tcagatatgg gctagggtct ggtattaggg 600
tgctcattaa aaaatgttga tttttgtcag tgtctagtga catcaatgca taatttaagg 660
ttctataaat tgaaagctaa cccaggagtg actcatcctc tcattgtttt caacttactt 720
atttctgatc acactgactt ccctgtggaa tacacgtggt tcactgtgtt ccaaagctta 780
acgagcagaa aaaggttatg ctcgtctctt cttgagaggt tttaagagaa taattgctaa 840
gctgtgaaaa acattttaac caagtgatct aattatgtag gaaacaagct atattgaaga 900
caactgcaat caaaacggcg ccatcagcct gatcttcagc ctgaaagaag aagtgggcgc 960
cctggccaag gtgctgagac tgttcgaaga gaacgacgtg aacctgacac acatcgagag 1020
cagacccagc agactgaaga aggacgagta cgagttcttc acccacctgg acaagcggag 1080
cctgcctgct ctgaccaaca tcatcaagat cctgcggcac gacatcggcg ccacagtgca 1140
cgaactgagc cgggacaaga aaaaggacac cgtgccatgg ttccccagaa ccatccaaga 1200
gctggacaga ttcgccaacc agatcctgag ctatggcgcc gagctggacg ctgatcaccc 1260
tggctttaag gaccccgtgt accgggccag aagaaagcag tttgccgata tcgcctacaa 1320
ctaccggcac ggccagccta ttcctcgggt cgagtacatg gaagaggaaa agaaaacctg 1380
gggcaccgtg ttcaagaccc tgaagtccct gtacaagacc cacgcctgct acgagtacaa 1440
ccacatcttc ccactgctcg aaaagtactg cggcttccac gaggacaata tccctcagct 1500
tgaggacgtg tcccagttcc tgcagacctg caccggcttt agactgaggc cagttgccgg 1560
actgctgagc agcagagatt ttctcggcgg cctggccttc agagtgttcc actgtaccca 1620
gtacatcaga cacggcagca agcccatgta cacccctgag cctgatatct gccacgagct 1680
gctgggacat gtgcccctgt tcagcgatag aagcttcgcc cagttcagcc aagagatcgg 1740
actggcttct ctgggagccc ctgacgagta cattgagaag ctggccacca tctactggtt 1800
caccgtggaa ttcggcctgt gcaagcaggg cgacagcatc aaagcttatg gcgctggcct 1860
gctgtctagc ttcggcgagc tgcagtactg tctgagcgag aagcctaagc tgctgcccct 1920
ggaactggaa aagaccgcca tccagaacta caccgtgacc gagttccagc ctctgtacta 1980
cgtggccgag agcttcaacg acgccaaaga aaaagtgcgg aacttcgccg ccaccattcc 2040
tcggcctttc agcgtcagat acgaccccta cacacagcgg atcgaggtgc tggacaacac 2100
acagcagctg aaaattctgg ccgactccat caacagcgag atcggcatcc tgtgcagcgc 2160
cctgcagaaa atcaagtga 2179
<210> 388
<211> 1362
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 388
atgagtaccg ccgtgctgga aaaccctgga ctgggacgca aactgagtga cttcggacag 60
gaaacatcat acattgagga taattgtaac cagaatggcg ccatctctct gatcttcagc 120
ctgaaggaag aagtgggcgc cctggcaaag gtgctgcgcc tgtttgagga gaacgacgtg 180
aatctgaccc acatcgagtc ccggccttct agactgaaga aggacgagta cgagttcttt 240
acccacctgg ataagcggtc cctgccagcc ctgacaaaca tcatcaagat cctgcgccac 300
gacattggag caacagtgca cgagctgtct agagacaaga agaaggatac cgtgccctgg 360
ttccctcgga caatccagga gctggataga tttgccaacc agatcctgtc ttacggcgca 420
gagctggatg cagatcaccc tggcttcaag gacccagtgt atcgggcccg gagaaagcag 480
tttgccgata tcgcctacaa ttatagacac ggacagccaa tccctagagt ggagtatatg 540
gaggaggaga agaagacctg gggcacagtg ttcaagaccc tgaagagcct gtacaagaca 600
cacgcctgct acgagtataa ccacatcttc cccctgctgg agaagtattg tggctttcac 660
gaggacaata tccctcagct ggaggacgtg agccagttcc tgcagacctg cacaggcttt 720
aggctgcgcc cagtggcagg actgctgagc tccagagact tcctgggagg actggccttc 780
agagtgtttc actgcaccca gtacatcagg cacggctcca agccaatgta tacaccagag 840
cccgacatct gtcacgagct gctgggccac gtgcccctgt ttagcgatag atccttcgcc 900
cagttttccc aggagattgg actggcatct ctgggagcac ctgacgagta catcgagaag 960
ctggccacca tctattggtt cacagtggag tttggcctgt gcaagcaggg cgatagcatc 1020
aaggcctacg gcgcaggact gctgtctagc ttcggcgagc tgcagtattg tctgtccgag 1080
aagccaaagc tgctgcccct ggagctggag aagaccgcca tccagaacta caccgtgaca 1140
gagttccagc ccctgtacta tgtggccgag tcttttaacg atgccaagga gaaggtgaga 1200
aatttcgccg ccacaatccc taggcccttc agcgtgcggt acgaccctta tacccagagg 1260
atcgaggtgc tggataatac acagcagctg aagatcctgg ccgactccat caatagcgaa 1320
atcggcatcc tgtgctcagc cctgcagaaa atcaaataat aa 1362
<210> 389
<211> 2226
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 389
atgagcaccg ccgtgctgga aaatcctggc ctgggcagaa agctgagcga cttcggccag 60
gtgagccagg gcagcctgag ctgctcagtt aggggaattt gggcctccag agaaagagat 120
cccaagactg ctggtgcttc ctggtttcat aagctcagta agaagtctga attggttgga 180
agctgatgag aatatccagg aagtcaacag acaaatgtcc tcaacaattg tttctaagta 240
ggagaacatc tgtcctgggt ggctttcaca ggaatgaatg accattgctt tagggggttg 300
gggatctggc ctccagaact gccaccaatt agctgtgtgt ctttggacaa gttactgtcc 360
ctctctgttg tctgtttact cttctgtaca ctgaaggggt tccaatccag gtcttaggat 420
tcaaaagcct gtgcatgttc catttttagt actttccaca ctgtatttct caatgtcttt 480
ctgggacatt ttataaatca tattatatca cctctaagga tctttcagtt tgttatatat 540
gtgtctatta agttagattg tgagctccta aaagataaag cattgtctta ttcatcttta 600
aatttctcag agcccaaata gtgcctggaa cctagtagtt gctcaataaa aggtattgaa 660
tttacaggat tgaatggtga catcaatgaa taattgaaga ttccttaagc tgataactga 720
cccagtagca tcattgatca tttaattgcc ctggacttac ttattttcca ccacactaca 780
tatttctgta tagaatatat atagctcatt gtattgcaag atttaactag aagaaagagt 840
tcatgcttgc tttgtccatg taggtttaac aggaatgaat tgctaaactg tggaaaatgt 900
tttaaacaaa tgcatcttat cctgtaggag acaagctaca tcgaggacaa ctgcaaccag 960
aacggcgcca tcagcctgat cttcagcctg aaagaagaag tgggcgccct ggccaaggtg 1020
ctgagactgt tcgaagagaa cgacgtgaac ctgacacaca tcgagagcag acccagcaga 1080
ctgaagaagg acgagtacga gttcttcacc cacctggaca agcggagcct gcctgctctg 1140
accaacatca tcaagatcct gcggcacgac atcggcgcca cagtgcacga actgagccgg 1200
gacaagaaaa aggacaccgt gccatggttc cccagaacca tccaagagct ggacagattc 1260
gccaaccaga tcctgagcta tggcgccgag ctggacgctg atcaccctgg ctttaaggac 1320
cccgtgtacc gggccagaag aaagcagttt gccgatatcg cctacaacta ccggcacggc 1380
cagcctattc ctcgggtcga gtacatggaa gaggaaaaga aaacctgggg caccgtgttc 1440
aagaccctga agtccctgta caagacccac gcctgctacg agtacaacca catcttccca 1500
ctgctcgaaa agtactgcgg cttccacgag gacaatatcc ctcagcttga ggacgtgtcc 1560
cagttcctgc agacctgcac cggctttaga ctgaggccag ttgccggact gctgagcagc 1620
agagattttc tcggcggcct ggccttcaga gtgttccact gtacccagta catcagacac 1680
ggcagcaagc ccatgtacac ccctgagcct gatatctgcc acgagctgct gggacatgtg 1740
cccctgttca gcgatagaag cttcgcccag ttcagccaag agatcggact ggcttctctg 1800
ggagcccctg acgagtacat tgagaagctg gccaccatct actggttcac cgtggaattc 1860
ggcctgtgca agcagggcga cagcatcaaa gcttatggcg ctggcctgct gtctagcttc 1920
ggcgagctgc agtactgtct gagcgagaag cctaagctgc tgcccctgga actggaaaag 1980
accgccatcc agaactacac cgtgaccgag ttccagcctc tgtactacgt ggccgagagc 2040
ttcaacgacg ccaaagaaaa agtgcggaac ttcgccgcca ccattcctcg gcctttcagc 2100
gtcagatacg acccctacac acagcggatc gaggtgctgg acaacacaca gcagctgaaa 2160
attctggccg actccatcaa cagcgagatc ggcatcctgt gcagcgccct gcagaaaatc 2220
aagtga 2226
<210> 390
<211> 1359
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 390
atgagcaccg ccgtgctgga aaatcctggc ttgggcagga aactctctga ctttggacag 60
gaaacaagct atattgaaga caactgcaat caaaacggcg ccatcagcct gatcttcagc 120
ctgaaagaag aagtgggcgc cctggccaag gtgctgagac tgttcgaaga gaacgacgtg 180
aacctgacac acatcgagag cagacccagc agactgaaga aggacgagta cgagttcttc 240
acccacctgg acaagcggag cctgcctgct ctgaccaaca tcatcaagat cctgcggcac 300
gacatcggcg ccacagtgca cgaactgagc cgggacaaga aaaaggacac cgtgccatgg 360
ttccccagaa ccatccaaga gctggacaga ttcgccaacc agatcctgag ctatggcgcc 420
gagctggacg ctgatcaccc tggctttaag gaccccgtgt accgggccag aagaaagcag 480
tttgccgata tcgcctacaa ctaccggcac ggccagccta ttcctcgggt cgagtacatg 540
gaagaggaaa agaaaacctg gggcaccgtg ttcaagaccc tgaagtccct gtacaagacc 600
cacgcctgct acgagtacaa ccacatcttc ccactgctcg aaaagtactg cggcttccac 660
gaggacaata tccctcagct tgaggacgtg tcccagttcc tgcagacctg caccggcttt 720
agactgaggc cagttgccgg actgctgagc agcagagatt ttctcggcgg cctggccttc 780
agagtgttcc actgtaccca gtacatcaga cacggcagca agcccatgta cacccctgag 840
cctgatatct gccacgagct gctgggacat gtgcccctgt tcagcgatag aagcttcgcc 900
cagttcagcc aagagatcgg actggcttct ctgggagccc ctgacgagta cattgagaag 960
ctggccacca tctactggtt caccgtggaa ttcggcctgt gcaagcaggg cgacagcatc 1020
aaagcttatg gcgctggcct gctgtctagc ttcggcgagc tgcagtactg tctgagcgag 1080
aagcctaagc tgctgcccct ggaactggaa aagaccgcca tccagaacta caccgtgacc 1140
gagttccagc ctctgtacta cgtggccgag agcttcaacg acgccaaaga aaaagtgcgg 1200
aacttcgccg ccaccattcc tcggcctttc agcgtcagat acgaccccta cacacagcgg 1260
atcgaggtgc tggacaacac acagcagctg aaaattctgg ccgactccat caacagcgag 1320
atcggcatcc tgtgcagcgc cctgcagaaa atcaagtga 1359
<210> 391
<211> 1359
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 391
atgagcaccg ccgtgctgga aaatcctggc ctgggcagaa agctgagcga cttcggccag 60
gagacaagct acatcgagga caactgcaac cagaacggcg ccatcagcct gatcttcagc 120
ctgaaagaag aagtgggcgc cctggccaag gtgctgagac tgttcgaaga gaacgacgtg 180
aacctgacac acatcgagag cagacccagc agactgaaga aggacgagta cgagttcttc 240
acccacctgg acaagcggag cctgcctgct ctgaccaaca tcatcaagat cctgcggcac 300
gacatcggcg ccacagtgca cgaactgagc cgggacaaga aaaaggacac cgtgccatgg 360
ttccccagaa ccatccaaga gctggacaga ttcgccaacc agatcctgag ctatggcgcc 420
gagctggacg ctgatcaccc tggctttaag gaccccgtgt accgggccag aagaaagcag 480
tttgccgata tcgcctacaa ctaccggcac ggccagccta ttcctcgggt cgagtacatg 540
gaagaggaaa agaaaacctg gggcaccgtg ttcaagaccc tgaagtccct gtacaagacc 600
cacgcctgct acgagtacaa ccacatcttc ccactgctcg aaaagtactg cggcttccac 660
gaggacaata tccctcagct tgaggacgtg tcccagttcc tgcagacctg caccggcttt 720
agactgaggc cagttgccgg actgctgagc agcagagatt ttctcggcgg cctggccttc 780
agagtgttcc actgtaccca gtacatcaga cacggcagca agcccatgta cacccctgag 840
cctgatatct gccacgagct gctgggacat gtgcccctgt tcagcgatag aagcttcgcc 900
cagttcagcc aagagatcgg actggcttct ctgggagccc ctgacgagta cattgagaag 960
ctggccacca tctactggtt caccgtggaa ttcggcctgt gcaagcaggg cgacagcatc 1020
aaagcttatg gcgctggcct gctgtctagc ttcggcgagc tgcagtactg tctgagcgag 1080
aagcctaagc tgctgcccct ggaactggaa aagaccgcca tccagaacta caccgtgacc 1140
gagttccagc ctctgtacta cgtggccgag agcttcaacg acgccaaaga aaaagtgcgg 1200
aacttcgccg ccaccattcc tcggcctttc agcgtcagat acgaccccta cacacagcgg 1260
atcgaggtgc tggacaacac acagcagctg aaaattctgg ccgactccat caacagcgag 1320
atcggcatcc tgtgcagcgc cctgcagaaa atcaagtga 1359
<210> 392
<211> 1588
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 392
atgagcaccg ccgtgctgga aaatcctggc ttgggcagga aactctctga ctttggacag 60
gtgagccacg gcagcctgag ctgctcagtt aggggaattt gggcctccag agaaagagat 120
ccgaagactg ctggtgcttc ctggtttcat aagctcagta agaagtctga attcgttgga 180
agctgatgat agaagaaaga gttcatgctt gctttgtcca tggaggttta acaggaatga 240
attgctaaac tgtggaaaat gttttaaaca aatgcatctt atcctgtagg aaacaagcta 300
tattgaagac aactgcaatc aaaacggcgc catcagcctg atcttcagcc tgaaagaaga 360
agtgggcgcc ctggccaagg tgctgagact gttcgaagag aacgacgtga acctgacaca 420
catcgagagc agacccagca gactgaagaa ggacgagtac gagttcttca cccacctgga 480
caagcggagc ctgcctgctc tgaccaacat catcaagatc ctgcggcacg acatcggcgc 540
cacagtgcac gaactgagcc gggacaagaa aaaggacacc gtgccatggt tccccagaac 600
catccaagag ctggacagat tcgccaacca gatcctgagc tatggcgccg agctggacgc 660
tgatcaccct ggctttaagg accccgtgta ccgggccaga agaaagcagt ttgccgatat 720
cgcctacaac taccggcacg gccagcctat tcctcgggtc gagtacatgg aagaggaaaa 780
gaaaacctgg ggcaccgtgt tcaagaccct gaagtccctg tacaagaccc acgcctgcta 840
cgagtacaac cacatcttcc cactgctcga aaagtactgc ggcttccacg aggacaatat 900
ccctcagctt gaggacgtgt cccagttcct gcagacctgc accggcttta gactgaggcc 960
agttgccgga ctgctgagca gcagagattt tctcggcggc ctggccttca gagtgttcca 1020
ctgtacccag tacatcagac acggcagcaa gcccatgtac acccctgagc ctgatatctg 1080
ccacgagctg ctgggacatg tgcccctgtt cagcgataga agcttcgccc agttcagcca 1140
agagatcgga ctggcttctc tgggagcccc tgacgagtac attgagaagc tggccaccat 1200
ctactggttc accgtggaat tcggcctgtg caagcagggc gacagcatca aagcttatgg 1260
cgctggcctg ctgtctagct tcggcgagct gcagtactgt ctgagcgaga agcctaagct 1320
gctgcccctg gaactggaaa agaccgccat ccagaactac accgtgaccg agttccagcc 1380
tctgtactac gtggccgaga gcttcaacga cgccaaagaa aaagtgcgga acttcgccgc 1440
caccattcct cggcctttca gcgtcagata cgacccctac acacagcgga tcgaggtgct 1500
ggacaacaca cagcagctga aaattctggc cgactccatc aacagcgaga tcggcatcct 1560
gtgcagcgcc ctgcagaaaa tcaagtga 1588
<210> 393
<211> 1359
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 393
atgagcaccg ccgtgctgga aaatcctggc ctgggcagaa agctgagcga cttcggccaa 60
gagacaagct acatcgagga caactgcaac cagaacggcg ccatcagcct gatcttcagc 120
ctgaaagaag aagtgggcgc cctggccaag gtgctgagac tgttcgaaga gaacgacgtg 180
aacctgacac acatcgagag cagacccagc agactgaaga aggacgagta cgagttcttc 240
acccacctgg acaagcggag cctgcctgct ctgaccaaca tcatcaagat cctgcggcac 300
gacatcggcg ccacagtgca cgaactgagc cgggacaaga aaaaggacac cgtgccatgg 360
ttccccagaa ccatccaaga gctggacaga ttcgccaacc agatcctgag ctatggcgcc 420
gagctggacg ctgatcaccc tggctttaag gaccccgtgt accgggccag aagaaagcag 480
tttgccgata tcgcctacaa ctaccggcac ggccagccta ttcctcgggt cgagtacatg 540
gaagaggaaa agaaaacctg gggcaccgtg ttcaagaccc tgaagtccct gtacaagacc 600
cacgcctgct acgagtacaa ccacatcttc ccactgctcg aaaagtactg cggcttccac 660
gaggacaata tccctcagct tgaggacgtg tcccagttcc tgcagaccga taccggcttt 720
agactgaggc cagttgccgg actgctgagc agcagagatt ttctcggcgg cctggccttc 780
agagtgttcc actgtaccca gtacatcaga cacggcagca agcccatgta cacccctgag 840
cctgatatct gccacgagct gctgggacat gtgcccctgt tcagcgatag aagcttcgcc 900
cagttcagcc aagagatcgg actggcttct ctgggagccc ctgacgagta cattgagaag 960
ctggccacca tctactggtt caccgtggaa ttcggcctgt gcaagcaggg cgacagcatc 1020
aaagcttatg gcgctggcct gctgtctagc ttcggcgagc tgcagtactg tctgagcgag 1080
aagcctaagc tgctgcccct ggaactggaa aagaccgcca tccagaacta caccgtgacc 1140
gagttccagc ctctgtacta cgtggccgag agcttcaacg acgccaaaga aaaagtgcgg 1200
aacttcgccg ccaccattcc tcggcctttc agcgtcagat acgaccccta cacacagcgg 1260
atcgaggtgc tggacaacac acagcagctg aaaattctgg ccgactccat caacagcgag 1320
atcggcatcc tgtgcagcgc cctgcagaaa atcaagtga 1359
<210> 394
<211> 2634
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 394
atgagcaccg ccgtgctgga aaatcctggc ctgggcagaa agctgagcga cttcggccaa 60
gagacaagct acatcgagga caactgcaac cagaacggcg ccatcagcct gatcttcagc 120
ctgaaagaag aagtgggcgc cctggccaag gtgctgagac tgttcgaaga gaacgacgtg 180
aacctgacac acatcgagag cagacccagc agactgaaga aggacgagta cgagttcttc 240
acccacctgg acaagcggag cctgcctgct ctgaccaaca tcatcaagat cctgcggcac 300
gacatcggcg ccacagtgca cgaactgagc cgggacaaga aaaaggacac cgtgccatgg 360
ttccccagaa ccatccaaga gctggacaga ttcgccaacc agatcctgag ctatggcgcc 420
gagctggacg ctgatcaccc tggctttaag gaccccgtgt accgggccag aagaaagcag 480
tttgccgata tcgcctacaa ctaccggcac ggccagccta ttcctcgggt cgagtacatg 540
gaagaggaaa agaaaacctg gggcaccgtg ttcaagaccc tgaagtccct gtacaagacc 600
cacgcctgct acgagtacaa ccacatcttc ccactgctcg aaaagtactg cggcttccac 660
gaggacaata tccctcagct tgaggacgtg tcccagttcc tgcagacctg caccggcttt 720
agactgaggc cagttgccgg actgctgagc agcagagatt ttctcggcgg cctggccttc 780
agagtgttcc actgtaccca gtacatcaga cacggcagca agcccatgta cacccctgag 840
cctgatatct gccacgagct gctgggacat gtgcccctgt tcagcgatag aagcttcgcc 900
cagttcagcc aagagatcgg actggcttct ctgggagccc ctgacgagta cattgagaag 960
ctggccacca tctactggtt caccgtggaa ttcggcctgt gcaagcaggg cgacagcatc 1020
aaagcttatg gcgctggcct gctgtctagc ttcggcgagc tgcagtactg tctgagcgag 1080
aagcctaagc tgctgcccct ggaactggaa aagaccgcca tccagaacta caccgtgacc 1140
gagttccagc ctctgtacta cgtggccgag agcttcaacg acgccaaaga aaaagtgcgg 1200
aacttcgccg ccaccattcc tcggcctttc agcgtcagat acgaccccta cacacagcgg 1260
atcgaggtgc tggacaacac acagcagctg aaaattctgg ccgactccat caacagcgag 1320
atcggcatcc tgtgcagcgc cctgcagaaa atcaagtgaa tgaaccagaa cggcgccatc 1380
agcctgatct tcagcctgaa agaagaagtg ggcgccctgg ccaaggtgct gagactgttc 1440
gaagagaacg acgtgaacct gacacacatc gagagcagac ccagcagact gaagaaggac 1500
gagtacgagt tcttcaccca cctggacaag cggagcctgc ctgctctgac caacatcatc 1560
aagatcctgc ggcacgacat cggcgccaca gtgcacgaac tgagccggga caagaaaaag 1620
gacaccgtgc catggttccc cagaaccatc caagagctgg acagattcgc caaccagatc 1680
ctgagctatg gcgccgagct ggacgctgat caccctggct ttaaggaccc cgtgtaccgg 1740
gccagaagaa agcagtttgc cgatatcgcc tacaactacc ggcacggcca gcctattcct 1800
cgggtcgagt acatggaaga ggaaaagaaa acctggggca ccgtgttcaa gaccctgaag 1860
tccctgtaca agacccacgc ctgctacgag tacaaccaca tcttcccact gctcgaaaag 1920
tactgcggct tccacgagga caatatccct cagcttgagg acgtgtccca gttcctgcag 1980
acctgcaccg gctttagact gaggccagtt gccggactgc tgagcagcag agattttctc 2040
ggcggcctgg ccttcagagt gttccactgt acccagtaca tcagacacgg cagcaagccc 2100
atgtacaccc ctgagcctga tatctgccac gagctgctgg gacatgtgcc cctgttcagc 2160
gatagaagct tcgcccagtt cagccaagag atcggactgg cttctctggg agcccctgac 2220
gagtacattg agaagctggc caccatctac tggttcaccg tggaattcgg cctgtgcaag 2280
cagggcgaca gcatcaaagc ttatggcgct ggcctgctgt ctagcttcgg cgagctgcag 2340
tactgtctga gcgagaagcc taagctgctg cccctggaac tggaaaagac cgccatccag 2400
aactacaccg tgaccgagtt ccagcctctg tactacgtgg ccgagagctt caacgacgcc 2460
aaagaaaaag tgcggaactt cgccgccacc attcctcggc ctttcagcgt cagatacgac 2520
ccctacacac agcggatcga ggtgctggac aacacacagc agctgaaaat tctggccgac 2580
tccatcaaca gcgagatcgg catcctgtgc agcgccctgc agaaaatcaa gtga 2634
<210> 395
<211> 1359
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 395
atgagcaccg ccgtgctgga aaatcctggc ctgggcagaa agctgagcga cttcggccaa 60
gagacaagct acatcgagga caactgcaac cagaacggcg ccatcagcct gatcttcagc 120
ctgaaagaag aagtgggcgc cctggccaag gtgctgagac tgttcgaaga gaacgacgtg 180
aacctgacac acatcgagag cagacccagc agactgaaga aggacgagta cgagttcttc 240
acccacctgg acaagcggag cctgcctgct ctgaccaaca tcatcaagat cctgcggcac 300
gacatcggcg ccacagtgca cgaactgagc cgggacaaga aaaaggacac cgtgccatgg 360
ttccccagaa ccatccaaga gctggacaga ttcgccaacc agatcctgag ctatggcgcc 420
gagctggacg ctgatcaccc tggctttaag gaccccgtgt accgggccag aagaaagcag 480
tttgccgata tcgcctacaa ctaccggcac ggccagccta ttcctcgggt cgagtacatg 540
gaagaggaaa agaaaacctg gggcaccgtg ttcaagaccc tgaagtccct gtacaagacc 600
cacgcctgct acgagtacaa ccacatcttc ccactgctcg aaaagtactg cggcttccac 660
gaggacaata tccctcagct tgaggacgtg tcccagttcc tgcagacctg caccggcttt 720
agactgaggc cagttgccgg actgctgagc agcagagatt ttctcggcgg cctggccttc 780
agagtgttcc actgtaccca gtacatcaga cacggcagca agcccatgta cacccctgag 840
cctgatatct gccacgagct gctgggacat gtgcccctgt tcagcgatag aagcttcgcc 900
cagttcagcc aagagatcgg actggcttct ctgggagccc ctgacgagta cattgagaag 960
ctggccacca tctactggtt caccgtggaa ttcggcctgt gcaagcaggg cgacagcatc 1020
aaagcttatg gcgctggcct gctgtctagc ttcggcgagc tgcagtactg tctgagcgag 1080
aagcctaagc tgctgcccct ggaactggaa aagaccgcca tccagaacta caccgtgacc 1140
gagttccagc ctctgtacta cgtggccgag agcttcaacg acgccaaaga aaaagtgcgg 1200
aacttcgccg ccaccattcc tcggcctttc agcgtcagat acgaccccta cacacagcgg 1260
atcgaggtgc tggacaacac acagcagctg aaaattctgg ccgactccat caacagcgag 1320
atcggcatcc tgtgcagcgc cctgcagaaa atcaagtaa 1359
<210> 396
<211> 1359
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 396
atgagtacag cagtgttaga gaatccaggc cttggtagaa agctgtctga ctttggccag 60
gagaccagct acatcgagga caactgcaac cagaatggag ccatcagcct gatcttcagc 120
ctgaaggagg aggtgggcgc cctggccaag gtgctgaggc tgttcgagga gaacgacgtg 180
aacctgaccc acattgagtc cagaccctcc agactgaaga aggatgagta cgagttcttc 240
acccacctgg acaagagatc cctgcctgcc ctgaccaaca tcatcaagat cctgagacac 300
gacatcggcg ccaccgtgca cgagctgtcc agagacaaga agaaggacac cgtgccctgg 360
ttccccagaa ccatccagga gctggacagg ttcgccaacc agatcctgtc ctacggcgcc 420
gagctggatg ccgaccaccc aggcttcaag gaccctgtgt acagggccag aaggaagcag 480
tttgctgaca tcgcctataa ctacaggcac ggccagccca tccctagagt ggagtacatg 540
gaggaggaga agaagacctg gggcaccgtg ttcaagaccc tgaagtccct gtacaagacc 600
cacgcctgct atgagtacaa ccacatcttc cccctgctgg agaagtactg cggcttccac 660
gaggacaaca tccctcagct ggaggatgtg tcccagttcc tgcagacctg cacaggcttc 720
agactgagac ctgtggctgg cctgctgtct agcagagact tcctgggagg cctggccttc 780
agagtgttcc actgcaccca gtacatcaga catggaagca agcccatgta cacccctgag 840
ccagacatct gccatgagct gctgggccat gtgcccctgt tctctgatag atcctttgcc 900
cagttcagcc aggagattgg cctggccagc ctgggagccc ctgatgagta cattgagaag 960
ctggccacca tctactggtt cacagtggag tttggcctgt gcaagcaggg agactccatc 1020
aaggcctatg gagctggact gctgtcctcc tttggagagc tgcagtactg cctgtctgag 1080
aagcccaagc tgctgcccct ggagctggag aagacagcca tccagaacta cacagtgaca 1140
gagttccagc ccctgtacta tgtggctgag agcttcaatg atgccaagga gaaggtgaga 1200
aactttgctg ccaccatccc cagacccttc tctgtgaggt atgaccccta cacccagagg 1260
attgaggtgc tggacaacac ccagcagctg aagatcctgg ctgactccat caactctgag 1320
attggcatcc tgtgctctgc cctgcagaag atcaagtaa 1359
<210> 397
<211> 1359
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 397
atgagtacag cagtgttaga gaatccaggc ctaggtagaa agctgtctga ctttggccag 60
gagacctcct acattgagga caactgcaac cagaatggag ccatcagcct gatcttcagc 120
ctgaaggagg aggtgggagc cctggccaag gtgctgagac tgtttgagga gaatgatgtg 180
aacctgaccc acattgagtc cagaccctcc agactgaaga aggatgagta tgagttcttc 240
acccacctgg acaagagatc cctgcctgct ctgaccaaca tcatcaagat cctgagacat 300
gatattggag ccacagtgca tgagctgagc agggacaaga agaaggacac agtgccttgg 360
ttccccagaa ccatccagga gctggacagg tttgccaacc agatcctgtc ctatggagct 420
gagctggatg ctgaccaccc tggatttaag gatcctgtgt acagggccag aaggaagcag 480
tttgctgaca ttgcctacaa ctacaggcat ggccagccca tccccagggt ggagtacatg 540
gaggaggaga agaagacctg gggcactgtg ttcaagaccc tgaagagcct gtacaagacc 600
catgcctgct atgagtacaa ccacatcttc cccctgctgg agaagtactg tggcttccat 660
gaggacaaca tccctcagct ggaggatgtg tcccagttcc tgcagacctg cacaggcttc 720
agactgagac ctgtggctgg cctgctgtct agcagagact tcctgggcgg cctggccttc 780
agagtgttcc actgcaccca gtacatccgg cacggaagca agcccatgta cacccctgag 840
cctgacatct gccacgagct gctgggccac gtgcccctgt tctccgacag atccttcgcc 900
cagttcagcc aggagattgg cctggcctcc ctgggagccc ctgacgagta catcgagaag 960
ctggccacca tctactggtt caccgtggag tttggcctgt gcaagcaggg agactccatc 1020
aaggcctacg gcgccggcct gctgtcctcc ttcggcgagc tgcagtactg cctgtctgag 1080
aagcccaagc tgctgcccct ggagctggag aagaccgcca tccagaacta caccgtgacc 1140
gagttccagc ccctgtacta cgtggctgag tctttcaacg acgccaagga gaaggtgaga 1200
aacttcgccg ccaccatccc cagacccttc tctgtgcgct acgaccccta cacccagagg 1260
attgaggtgc tggacaacac ccagcagctg aagatcctgg ctgactccat caactctgag 1320
attggcatcc tgtgctctgc cctgcagaag atcaagtaa 1359
<210> 398
<211> 1359
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 398
atgagtacag cagtgttaga gaatccaggc ctaggtagaa agctgtctga ctttggccag 60
gagacctcct acattgagga caactgcaac cagaatggag ccatcagcct gatcttcagc 120
ctgaaggagg aggtgggagc cctggccaag gtgctgagac tgtttgagga gaatgatgtg 180
aacctgaccc acattgagtc cagaccctcc agactgaaga aggatgagta tgagttcttc 240
acccacctgg acaagagatc cctgcctgct ctgaccaaca tcatcaagat cctgagacat 300
gatattggag ccacagtgca tgagctgagc agggacaaga agaaggacac agtgccttgg 360
ttccccagaa ccatccagga gctggacagg tttgccaacc agatcctgtc ctatggagct 420
gagctggatg ctgaccaccc tggatttaag gatcctgtgt acagggccag aaggaagcag 480
tttgctgaca ttgcctacaa ctacaggcat ggccagccca tccccagggt ggagtacatg 540
gaggaggaga agaagacctg gggcactgtg ttcaagaccc tgaagagcct gtacaagacc 600
catgcctgct atgagtacaa ccacatcttc cccctgctgg agaagtactg tggcttccat 660
gaggacaaca tccctcagct ggaggatgtg tcccagttcc tgcagacctg cacaggcttc 720
agactgagac ctgtggctgg cctgctgtct agcagagact tcctgggagg cctggccttc 780
agagtgttcc actgcaccca gtacatcaga catggaagca agcccatgta cacccctgag 840
ccagacatct gccatgagct gctgggccat gtgcccctgt tctctgatag atcctttgcc 900
cagttcagcc aggagattgg cctggccagc ctgggagccc ctgatgagta cattgagaag 960
ctggccacca tctactggtt cacagtggag tttggcctgt gcaagcaggg agactccatc 1020
aaggcctatg gagctggact gctgtcctcc tttggagagc tgcagtactg cctgtctgag 1080
aagcccaagc tgctgcccct ggagctggag aagacagcca tccagaacta cacagtgaca 1140
gagttccagc ccctgtacta tgtggctgag agcttcaatg atgccaagga gaaggtgaga 1200
aactttgctg ccaccatccc cagacccttc tctgtgaggt atgaccccta cacccagagg 1260
attgaggtgc tggacaacac ccagcagctg aagatcctgg ctgactccat caactctgag 1320
attggcatcc tgtgctctgc cctgcagaag atcaagtaa 1359
<210> 399
<211> 1359
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 399
atgagcaccg ccgtgctgga gaaccccggc ctgggcagaa agctgtctga ctttggccag 60
gagaccagct acatcgagga caactgcaac cagaatggag ccatcagcct gatcttcagc 120
ctgaaggagg aggtgggcgc cctggccaag gtgctgaggc tgttcgagga gaacgacgtg 180
aacctgaccc acattgagtc cagaccctcc agactgaaga aggatgagta cgagttcttc 240
acccacctgg acaagagatc cctgcctgct ctgaccaaca tcatcaagat cctgagacac 300
gacatcggcg ccaccgtgca cgagctgtcc agagacaaga agaaggacac cgtgccctgg 360
ttccccagaa ccatccagga gctggacagg ttcgccaacc agatcctgtc ctacggcgcc 420
gagctggatg ccgaccaccc aggcttcaag gaccctgtgt acagggccag aaggaagcag 480
tttgctgaca tcgcctacaa ctacaggcac ggccagccca tccctagagt ggagtacatg 540
gaggaggaga agaagacctg gggcaccgtg ttcaagaccc tgaagtccct gtacaagacc 600
cacgcctgct atgagtacaa ccacatcttc cccctgctgg agaagtactg cggcttccac 660
gaggacaaca tcccccagct ggaggacgtg tcccagttcc tgcagacctg caccggcttc 720
agactgaggc cagtggccgg cctgctgtct agcagagact tcctgggcgg cctggccttc 780
agagtgttcc actgcaccca gtacatccgg cacggaagca agcccatgta cacccctgag 840
cctgacatct gccacgagct gctgggccac gtgcccctgt tctccgacag atccttcgcc 900
cagttcagcc aggagattgg cctggcctcc ctgggagccc ctgacgagta catcgagaag 960
ctggccacca tctactggtt caccgtggag tttggcctgt gcaagcaggg agactccatc 1020
aaggcctacg gcgccggcct gctgtcctcc ttcggcgagc tgcagtactg cctgtctgag 1080
aagcccaagc tgctgcccct ggagctggag aagaccgcca tccagaacta caccgtgacc 1140
gagttccagc ccctgtacta cgtggctgag tctttcaacg acgccaagga gaaggtgaga 1200
aacttcgccg ccaccatccc cagacccttc tctgtgcgct acgaccccta cacccagagg 1260
atcgaggtgc tggacaacac ccagcagctg aagatcctgg ccgactccat caactctgag 1320
atcggcatcc tgtgctctgc cctgcagaag atcaagtaa 1359
<210> 400
<211> 1359
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 400
atgagtacag cagtgttaga gaacccaggc cttggcagaa aactgtctga ctttggccag 60
gagacctcct acattgagga caactgcaac cagaatggag ccatttctct catcttctcc 120
ctgaaagaag aagtgggggc tctggccaag gtgctgagac tgtttgagga gaatgatgtg 180
aacctgacac atatagagag cagaccttcc agactcaaaa aagatgagta tgagttcttc 240
acccacctgg ataagaggag cctgcctgcc ctcaccaaca tcatcaaaat cctcagacat 300
gacattggtg ccacagtcca tgagctgagt agagacaaga agaaggacac agtcccctgg 360
ttccccagaa ctattcagga actggacagg tttgccaatc agatcctgtc ctatggagct 420
gagcttgatg ctgaccaccc aggtttcaag gatcctgtgt acagagccag gaggaagcag 480
tttgcagata ttgcctacaa ctacaggcat ggacagccca tccccagggt ggagtacatg 540
gaggaagaga agaaaacctg gggcactgtg ttcaaaaccc tgaagagcct gtacaagacc 600
catgcctgct atgaatacaa tcacatcttt cctctgctgg agaagtactg tggcttccat 660
gaagacaata ttccccagct ggaagatgtc tcccagttcc ttcagacctg cacaggattc 720
aggctgaggc cagtggctgg cctcctgagc tccagggact tcctgggagg cctggccttc 780
agagtcttcc actgcactca gtatatcagg catggctcca agcccatgta caccccagag 840
cctgacatct gccatgagct gctgggccat gtgcccctct tcagtgacag atcctttgcc 900
cagttcagcc aagaaattgg attggcctct ctgggggccc ctgatgaata tattgaaaag 960
ctggctacca tctactggtt tacagtggaa tttgggctgt gcaaacaggg agacagcatc 1020
aaggcctatg gtgctggact gctcagcagc tttggagagc tccagtactg cctgtcagag 1080
aaacccaagc tcctgcccct ggagttggaa aaaacagcca tccagaacta tactgtcaca 1140
gaattccagc ctctctacta tgtggcagag tccttcaatg atgccaaaga gaaagtgagg 1200
aactttgctg ccaccattcc aagacccttc tctgtgagat atgaccccta cacacagaga 1260
attgaggtgt tggataacac ccagcagctc aagattctgg cagactccat caactctgag 1320
attggcatcc tgtgttctgc cctgcagaag atcaagtaa 1359
<210> 401
<211> 1359
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 401
atgagtacag cagtgttaga gaacccaggc cttggaagaa aactgtctga ctttggccag 60
gagacctcct acatcgagga caactgcaac cagaatggag ccatttctct catcttctcc 120
ctgaaagaag aagtgggggc tctggccaag gtgctgcggc tgtttgagga gaatgatgtg 180
aacctgacac atatagagag ccgcccttcc agactcaaaa aagatgagta tgagttcttc 240
acccacctgg ataagaggag cctgcctgcc ctcaccaaca tcatcaaaat cctcagacat 300
gacattggtg ccacagtcca cgagctgagt agagacaaga agaaggacac cgtcccctgg 360
ttccccagaa ctattcagga actggacagg tttgccaatc agatcctgtc ctatggagct 420
gagcttgatg ctgaccaccc aggtttcaag gatcctgtgt acagagccag gaggaagcag 480
tttgcagata ttgcctacaa ctaccgccat ggacagccca tccccagggt ggagtacatg 540
gaggaagaga agaaaacctg gggcactgtg ttcaaaaccc tgaagagcct gtacaagacc 600
catgcctgct atgaatacaa tcacatcttt cctctgctgg agaagtactg tggcttccat 660
gaagacaata ttccccagct ggaagatgtc tcccagttcc ttcagacctg cacaggattc 720
aggctgaggc cagtggctgg cctcctgagc tccagggact tcctgggagg cctggccttc 780
agagtcttcc actgcactca gtatatcagg catggctcca agcccatgta caccccagag 840
cctgacatct gccatgagct gctgggccat gtgcccctct tcagtgacag atcctttgcc 900
cagttcagcc aagaaattgg attggcctct ctgggggccc ctgatgaata tattgaaaag 960
ctggctacca tctactggtt tacagtggaa tttgggctgt gcaaacaggg agacagcatc 1020
aaggcctatg gtgctggact gctcagcagc tttggagagc tccagtactg cctgtcagag 1080
aaacccaagc tcctgcccct ggagttggaa aaaacagcca tccagaacta tactgtcaca 1140
gaattccagc ctctctacta cgtggccgag tccttcaacg atgccaaaga gaaagtgagg 1200
aactttgctg ccaccattcc aagacccttc tctgtgagat atgaccccta cacacagaga 1260
attgaggtgt tggataacac ccagcagctc aagattctgg cagactccat caactctgag 1320
attggcatcc tgtgttctgc cctgcagaag atcaagtaa 1359
<210> 402
<211> 1359
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 402
atgtccaccg ctgtgctgga gaaccctggc ctgggcagaa agctgtctga ctttggccag 60
gagacctcct acattgagga caactgcaac cagaatggag ccatctccct gatcttctcc 120
ctgaaggagg aggtgggagc cctggccaag gtgctgagac tgtttgagga gaatgatgtg 180
aacctgaccc acattgagtc cagaccctcc agactgaaga aggatgagta tgagttcttc 240
acccacctgg acaagagatc cctgcctgcc ctgaccaaca tcatcaagat cctgagacat 300
gacattggag ccaccgtgca tgagctgtcc agagacaaga agaaggacac cgtgccctgg 360
ttccccagaa ccatccagga gctggacaga tttgccaacc agatcctgtc ctatggagct 420
gagctggatg ctgaccaccc tggcttcaag gaccctgtgt acagagccag aagaaagcag 480
tttgctgaca ttgcctacaa ctacagacat ggccagccca tccccagagt ggagtacatg 540
gaggaggaga agaagacctg gggcaccgtg ttcaagaccc tgaagtccct gtacaagacc 600
catgcctgct atgagtacaa ccacatcttc cccctgctgg agaagtactg tggcttccat 660
gaggacaaca tcccccagct ggaggatgtg tcccagttcc tgcagacctg caccggcttc 720
agactgagac ctgtggctgg cctgctgtcc tccagagact tcctgggagg cctggccttc 780
agagtgttcc actgcaccca gtacatcaga catggctcca agcccatgta cacccctgag 840
cctgacatct gccatgagct gctgggccat gtgcccctgt tctctgacag atcctttgcc 900
cagttctccc aggagattgg cctggcctcc ctgggagccc ctgatgagta cattgagaag 960
ctggccacca tctactggtt caccgtggag tttggcctgt gcaagcaggg agactccatc 1020
aaggcctatg gagctggcct gctgtcctcc tttggagagc tgcagtactg cctgtctgag 1080
aagcccaagc tgctgcccct ggagctggag aagaccgcca tccagaacta caccgtgacc 1140
gagttccagc ccctgtacta tgtggctgag tccttcaatg atgccaagga gaaggtcaga 1200
aactttgctg ccaccatccc cagacccttc tctgtgagat atgaccccta cacccagaga 1260
attgaggtgc tggacaacac ccagcagctg aagatcctgg ctgactccat caactctgag 1320
attggcatcc tgtgctctgc cctgcagaag atcaagtaa 1359
<210> 403
<211> 1359
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 403
atgtccacag ctgtgctgga gaaccctggc ctgggcagaa agctgtctga ctttggccag 60
gagacctcct acattgagga caactgcaac cagaatggag ccatctccct gatcttctcc 120
ctgaaggagg aggtgggagc cctggccaag gtgctgagac tgtttgagga gaatgatgtg 180
aacctgaccc acattgagtc cagaccctcc agactgaaga aggatgagta tgagttcttc 240
acccacctgg acaagagatc cctgcctgcc ctgaccaaca tcatcaagat cctgagacat 300
gacattggag ccacagtgca tgagctgtcc agagacaaga agaaggacac agtgccctgg 360
ttccccagaa ccatccagga gctggacaga tttgccaacc agatcctgtc ctatggagct 420
gagctggatg ctgaccaccc tggcttcaag gaccctgtgt acagggccag aagaaagcag 480
tttgctgaca ttgcctacaa ctacagacat ggccagccca tccccagagt ggagtacatg 540
gaggaggaga agaagacctg gggcacagtg ttcaagaccc tgaagtccct gtacaagacc 600
catgcctgct atgagtacaa ccacatcttc cccctgctgg agaagtactg tggcttccat 660
gaggacaaca tcccccagct ggaggatgtg tcccagttcc tgcagacctg cacaggcttc 720
agactgagac ctgtggctgg cctgctgtcc tccagagact tcctgggagg cctggccttc 780
agagtgttcc actgcaccca gtacatcaga catggctcca agcccatgta cacccctgag 840
cctgacatct gccatgagct gctgggccat gtgcccctgt tctctgacag atcctttgcc 900
cagttctccc aggagattgg cctggcctcc ctgggagccc ctgatgagta cattgagaag 960
ctggccacca tctactggtt cacagtggag tttggcctgt gcaagcaggg agactccatc 1020
aaggcctatg gagctggcct gctgtcctcc tttggagagc tgcagtactg cctgtctgag 1080
aagcccaagc tgctgcccct ggagctggag aagacagcca tccagaacta cacagtgaca 1140
gagttccagc ccctgtacta tgtggctgag tccttcaatg atgccaagga gaaggtcaga 1200
aactttgctg ccaccatccc cagacccttc tctgtgagat atgaccccta cacccagaga 1260
attgaggtgc tggacaacac ccagcagctg aagatcctgg ctgactccat caactctgag 1320
attggcatcc tgtgctctgc cctgcagaag atcaagtaa 1359
<210> 404
<211> 1359
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 404
atgagcaccg ccgtgctgga gaacccgggg ctcggccgga agttgtccga cttcgggcag 60
gagacctcct acatcgagga taactgcaac caaaacgggg cgatcagtct catcttcagc 120
ttgaaagagg aggtcggcgc cctggcgaaa gtgctgaggc tcttcgagga gaacgacgtg 180
aacctcaccc atatcgagtc caggccgtct cggctgaaaa aggacgagta cgagttcttc 240
acccacttag acaagaggtc gctgcccgcg ctgacgaaca tcatcaagat ccttcgccac 300
gacatcgggg ccaccgtgca cgagctgagc agggacaaga agaaggatac agtcccgtgg 360
ttcccccgca ccattcagga gctcgatcgt ttcgccaacc agatcctcag ctacggtgcg 420
gaactcgacg cggatcaccc aggcttcaag gaccccgtgt accgcgcgcg ccggaaacag 480
ttcgccgata tcgcgtacaa ctaccgccat ggccagccga tcccccgggt cgaatacatg 540
gaggaggaaa agaagacgtg ggggacggtg ttcaaaacgc tgaagtcatt gtataagacc 600
cacgcgtgct acgagtataa ccacatcttc cccctgctgg aaaagtactg cggatttcac 660
gaggacaaca tcccccagct ggaggacgtg agccagttcc tccagacctg cacggggttc 720
cgcctgcggc cggtggccgg gctgctttcc tctcgcgact tcctgggcgg gttggccttc 780
cgggtgttcc actgcaccca gtacatccgc cacggctcca agccgatgta cactcccgag 840
ccggacatct gccacgagtt gctggggcac gtgcctttgt tcagcgaccg cagcttcgcc 900
cagttcagcc aggagatcgg cctcgcctca ctgggcgccc ccgatgagta catagagaaa 960
ttggcgacga tctactggtt tactgtcgag ttcgggctct gcaagcaggg cgactcgatc 1020
aaggcgtacg gcgcgggctt gctgagctct ttcggcgagc tgcagtattg cctgagcgag 1080
aagcccaagc tgttgcccct tgagctagag aagacagcaa tccagaacta cacggtcacc 1140
gagttccagc ccttgtacta cgtggccgag tccttcaatg acgccaagga gaaggtgagg 1200
aatttcgcag ccaccatccc caggcccttc tcggtgcgct acgaccccta tacccagcgc 1260
attgaggtcc tggataacac ccagcagctg aagatcttgg ccgacagcat caactccgag 1320
attggcatct tgtgctccgc actgcagaag atcaagtaa 1359
<210> 405
<211> 1359
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 405
atgagcacag ctgtactcga aaaccctggt cttggtagaa aattgagtga ttttggtcag 60
gagacctctt acattgagga taactgtaat caaaatggag ccatttctct tattttctcc 120
cttaaagagg aggtaggagc tttagcaaaa gtactgagat tgtttgagga gaatgatgtc 180
aatcttaccc atattgaatc taggccaagc cgccttaaaa aagatgaata tgaatttttc 240
actcatcttg acaaaaggag tcttcctgca cttactaata tcataaaaat actgaggcac 300
gatattggtg ccactgttca tgaactaagt cgggataaaa agaaggatac tgttccctgg 360
ttccccagaa caattcaaga acttgacaga tttgcaaatc aaattctcag ctatggtgct 420
gaattggacg ctgaccatcc tggatttaag gaccctgttt atagggctag gagaaagcag 480
tttgctgaca tagcttacaa ctatcgccat ggtcaaccaa taccaagggt ggaatatatg 540
gaggaagaga agaaaacatg gggtactgta tttaaaactt taaagtctct ttataagacc 600
catgcttgtt acgagtataa tcatatattc ccactccttg aaaaatattg tggctttcat 660
gaggacaata tcccccaact ggaagatgta tcccaatttc ttcagacttg tactgggttc 720
aggctaagac ctgtagcagg acttctaagt agtagagatt ttcttggggg gctagctttt 780
agagtgtttc attgcactca gtacatcaga catggttcca agcctatgta cactcctgaa 840
cctgatattt gccatgaatt gcttggtcat gttcctctat tctctgatag atcatttgct 900
caattttcac aagagattgg tctggcaagt ctgggagcac ctgatgagta tattgagaag 960
ctggctacta tctattggtt tacagtagag tttggactgt gcaagcaggg tgattcaatc 1020
aaggcctatg gcgcaggttt actctcttca tttggagagt tgcagtattg cctgtcagag 1080
aagcccaagc tgttaccctt agagttggag aagactgcaa tccagaacta tacagtaaca 1140
gagtttcagc ccctctacta tgttgcagaa tcatttaatg atgctaaaga gaaagttagg 1200
aattttgctg ctacaattcc tagacccttt tcagttagat atgatcccta tacacagagg 1260
attgaggttc tggataacac acagcagctg aaaattttgg ctgattctat aaacagtgag 1320
ataggtatac tatgctctgc tctacagaag atcaagtaa 1359
<210> 406
<211> 1359
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 406
atgagtacag cagttttaga gaacccagga ttaggcagga agctgtcaga ttttggccag 60
gaaaccagct atatagaaga caactgcaac cagaatggag ccatttctct catcttttcc 120
ctcaaggaag aagtgggggc cctggctaaa gtactcagac tttttgaaga gaatgatgtc 180
aacctgaccc atattgagag tagacccagc aggctcaaga aggatgagta tgagttcttt 240
actcacttgg acaaaaggtc acttccagct ctcaccaaca taatcaaaat cctcagacat 300
gacattggag ccactgtcca tgagctcagc agggacaaga agaaggatac tgtgccctgg 360
ttcccaagga ctattcagga gttagataga tttgccaacc agatcctgtc ctatggggct 420
gaactggatg cagaccaccc tggatttaaa gaccctgtgt acagagctag aagaaagcag 480
tttgctgata ttgcctacaa ctacaggcat gggcagccca ttcctagagt ggaatacatg 540
gaggaagaga aaaagacctg gggaacagtc ttcaaaaccc tcaagtctct gtacaagacc 600
catgcctgct atgaatataa tcacatcttc cccttgctgg aaaagtactg tggcttccat 660
gaggacaaca ttccccaact agaagatgtg tcccagttcc tgcagacctg cactgggttc 720
agattaagac ctgtggcagg acttctgtct tccagagact tcctgggtgg gcttgcattc 780
agggtgttcc actgcaccca gtacatcaga catgggagca agcccatgta cacacctgag 840
cctgatattt gccatgaact cttaggacat gttccactct tttctgacag gagttttgcc 900
cagtttagcc aggagatagg cctagcatcc ctgggagcac cagatgaata cattgaaaaa 960
ctggccacca tctactggtt cacagtggag tttgggctat gcaaacaggg agattccatc 1020
aaggcctatg gagctggcct gttatcttcc tttggagaac tccagtattg cctgagtgag 1080
aagcccaagc ttctcccact ggagctggag aagactgcca tccagaacta tactgtcact 1140
gaattccagc ccctttacta tgtggctgag agcttcaatg atgctaagga gaaggtgagg 1200
aattttgctg caaccatccc caggcccttc tctgtcaggt atgaccccta cacccagaga 1260
atagaggtgc tggacaacac ccagcagctg aagatcttgg ctgacagcat caactctgag 1320
attggcatcc tctgctctgc cttgcagaag attaagtaa 1359
<210> 407
<211> 1359
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 407
atgagtacag cagttttaga gaacccagga ttaggcagga agctgagcga tttcggccag 60
gagaccagct atatcgagga caactgcaac cagaacgggg ccatctcgct gatcttctcc 120
ctcaaggaag aggtcggggc cctcgccaag gtcttgcgcc tgttcgagga gaacgacgtg 180
aaccttacgc acattgagag ccgccccagc aggttgaaga aggatgagta cgagttcttc 240
acccacctgg acaagcgcag cctgcccgcg ctgaccaaca tcatcaagat cttgcgccac 300
gacatcgggg cgacggtgca cgagctctcc cgggataaaa agaaggacac cgtgccctgg 360
ttcccccgca ccatccagga attggacagg ttcgccaacc agatcctctc ctacggggcg 420
gagctggacg cggaccaccc cggctttaag gaccccgtct accgcgcccg ccgcaagcag 480
ttcgccgaca tcgcctacaa ttacaggcac gggcaaccca tcccgcgggt ggagtacatg 540
gaggaggaga agaagacctg gggcaccgtc ttcaagaccc tgaagagcct ctacaagaca 600
cacgcgtgct acgagtacaa ccacatcttc cctttgctag agaagtactg cgggttccac 660
gaagacaata ttccccagtt ggaggacgtg tcccagtttc tgcagacctg cacgggcttc 720
aggttgaggc ccgtcgccgg cttgttgagc agcagggact tcctgggagg cctcgccttc 780
agggtgttcc attgcaccca gtatatcaga cacggctcga agcccatgta cacccccgag 840
cccgacatct gccatgagct gctggggcac gtgcccttgt tctccgacag gtcgttcgcc 900
cagttcagcc aggagatcgg gctggcctcc ttgggcgccc cggatgagta catcgaaaag 960
ctggccacca tctactggtt cacagtggag tttgggttgt gcaagcaggg ggacagcatc 1020
aaggcttacg gggcgggcct gctctcctcc ttcggggagc tccagtactg cctctcggag 1080
aagcccaagt tgctccccct ggagttggag aagacagcca tccaaaacta cactgtgacg 1140
gagttccagc ccttgtacta cgtcgccgag tccttcaacg atgccaagga gaaggtgagg 1200
aactttgccg ccacgatccc caggcccttc tctgtcaggt acgaccccta cacccagcgc 1260
atcgaggtgc tggacaacac gcagcagctg aagatcctgg cggactccat caactccgag 1320
attggcatct tgtgctccgc cctgcagaag atcaaataa 1359
<210> 408
<211> 1359
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 408
atgtccactg cagtcctgga gaatccagga ctggggagga aactgtctga ctttgggcaa 60
gagacctcct atattgagga caactgtaac caaaatggag ccatctccct gatcttttcc 120
ctgaaagaag aggtgggggc cttagctaag gtgcttaggc tttttgagga gaatgatgtg 180
aatctgactc acattgagtc taggcccagt agactgaaga aggatgagta tgaattcttt 240
acccatctgg ataaaagatc cctccctgct ctgactaaca tcatcaagat cttgaggcat 300
gatataggtg ccactgtgca tgagctgtcc agagacaaga agaaggacac tgtgccatgg 360
tttccaagga caatccagga gctggacagg tttgccaatc agatcctgag ctatggggct 420
gagctggatg ctgaccaccc tggcttcaag gacccagtgt acagggccag gagaaagcag 480
tttgctgaca tagcctacaa ctatagacat gggcagccca ttcctagggt ggagtacatg 540
gaggaagaga agaagacctg ggggactgtg ttcaagaccc tcaagtccct gtacaagacc 600
catgcctgct atgagtacaa tcacatcttc cccttgctgg agaagtactg tgggttccat 660
gaggacaaca tcccccagct ggaagatgtc tcacagttcc tgcagacctg cacaggtttc 720
aggttgagac cagttgctgg cctgctgtca agcagagact tcttgggggg actggccttt 780
agagtgttcc attgtaccca gtacatcaga catggctcca agcccatgta caccccagag 840
ccagacatct gccatgagct cctggggcat gtgcccctgt tttctgatag atcctttgcc 900
cagttcagcc aggagattgg cttggccagc ttgggagccc ctgatgagta cattgagaaa 960
ctggccacca tttattggtt cacagtggaa tttggactct gcaagcaagg ggacagcatc 1020
aaggcctatg gagctggctt gctgtccagc tttggagagc tgcagtactg cctgtctgag 1080
aagcccaagc tcctgcccct ggagctggaa aagactgcca tccagaatta tacagtgact 1140
gagttccagc ccctgtacta tgtggcagag tccttcaatg atgccaagga gaaagtgagg 1200
aactttgcag ccaccatccc cagacccttc tctgtcagat atgaccccta cacccagaga 1260
attgaggtgc tggataacac ccagcagctg aagattctgg ctgacagcat caactcagag 1320
attggcatcc tgtgctctgc cctgcagaag atcaagtaa 1359
<210> 409
<211> 1359
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 409
atgtctacag cagtcctgga aaacccagga ttgggtagga agctgtcaga ctttgggcaa 60
gagacttcct acattgaaga caactgcaac caaaatggag caatcagctt aatcttcagt 120
ttgaaagagg aggtgggtgc cctggctaaa gtcctgagac tatttgaaga gaatgatgta 180
aacctgacac atattgagag tagaccatct agactcaaaa aggatgagta tgagttcttc 240
acacacttgg ataagagaag cttaccagct ctgacaaaca tcatcaaaat actgaggcat 300
gatataggtg ccacagtaca tgaacttagc agggacaaaa agaaagatac tgtaccctgg 360
tttcctagaa ctatacagga gttagataga tttgcaaatc agattttgag ctatggggct 420
gagttggatg ctgatcaccc tggatttaaa gatcctgtct atagggcaag aagaaaacaa 480
tttgcagata tagcatataa ctacagacat ggacaaccta taccaagggt ggaatatatg 540
gaagaggaaa agaaaacatg gggtacagtt ttcaaaacac ttaaatctct atacaaaact 600
catgcttgtt atgaatataa ccacattttc cctctactgg aaaaatactg tggttttcat 660
gaggacaaca taccacagct agaagatgtc agccagtttc tccaaacatg tacaggtttt 720
aggttaagac cagttgctgg gctgctcagt agtagggact tcctgggggg tcttgctttc 780
agagtattcc actgcactca atatataaga catggcagta agccaatgta tactcctgag 840
ccagatatat gtcatgagtt gttaggacat gtacctttat tttcagacag gtcttttgca 900
cagttttctc aagaaattgg actagccagt ctaggggctc ctgatgaata tattgaaaag 960
ttagctacta tttactggtt tacagtagag tttggtcttt gtaagcaggg ggatagcatc 1020
aaagcatatg gggcaggact tttatcttcc tttggggaac tccaatactg tttaagtgaa 1080
aagcctaaac tcctaccctt agaactagag aaaactgcta tacagaacta cactgttact 1140
gaatttcagc ctctatatta tgttgctgaa tcttttaatg atgccaaaga aaaagtaagg 1200
aactttgctg ctaccatacc taggccattt tcagttaggt atgacccata cacacagagg 1260
attgaggtct tagataacac acaacaactg aagatattgg ctgacagcat aaactcagag 1320
ataggtatac tttgtagtgc tctacagaag ataaagtaa 1359
<210> 410
<211> 1359
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 410
atgtctacag cagtcttgga aaacccagga ttgggtagga agctgtcaga ctttgggcaa 60
gagactagct acattgaaga caactgcaac caaaatggag ccatcagctt aatcttcagt 120
ttaaaagagg aggttggtgc cctggctaag gtcctgagac tgtttgaaga gaatgatgtg 180
aacctgacac acattgagag cagaccatcc agactgaaga aggatgagta tgagttcttc 240
acacacctgg ataagagaag cctgccagca ctgacaaaca tcatcaagat tctgagacat 300
gacattggtg ctactgtgca tgagctgtca agggataaga agaaggacac agtgccctgg 360
ttccccagaa ccattcagga actggataga tttgccaacc agatcctgtc ctatggggct 420
gagctggatg cagatcaccc tggattcaag gatccagtgt acagagcaag gagaaagcag 480
tttgctgaca ttgcatataa ctacagacat ggccagccaa ttcctagagt ggagtacatg 540
gaggaagaga agaagacctg gggaacagtt ttcaagacac tcaaatccct ctacaagacc 600
catgcttgct atgagtacaa tcatatcttc ccactgctgg agaagtactg tggcttccat 660
gaggacaata tcccccagct ggaagatgtg tctcagttcc tgcagacctg cacaggcttc 720
aggctgagac ctgttgctgg actgctgtcc agtagggact ttctgggagg actggctttc 780
agagtgttcc attgcaccca gtatatcaga catggaagca agcccatgta cacacctgag 840
ccagacatct gccatgagct actgggccat gtgccacttt tttcagacag atcctttgcc 900
cagtttagcc aggaaattgg actggcatct ctgggggccc cagatgagta cattgagaag 960
ctggctacca tctactggtt cacagtggag tttggactgt gcaagcaggg ggattctatc 1020
aaggcctatg gagcaggact cctgtcctct tttggagagc tgcagtactg cctgagtgag 1080
aagccaaagc tgctgccact ggagctggaa aagactgcta tccagaacta cactgtgact 1140
gagttccagc cactgtacta tgtggctgag tcattcaatg atgccaagga gaaagtcagg 1200
aactttgctg ccactatccc caggcccttc agtgtgagat atgaccctta cacacagagg 1260
attgaggtcc tggacaatac acagcagctg aaaatcctgg ctgatagcat caactctgag 1320
attggcatcc tgtgcagtgc cctgcagaag atcaagtaa 1359
<210> 411
<211> 1359
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 411
atgtcaacag cagttttaga aaacccaggg ctaggaagaa agttgtcaga ctttggccag 60
gagacctcat acattgagga caattgtaac cagaatgggg ccatctccct gatcttttct 120
ctgaaggagg aggtgggtgc cctggctaaa gtcctgagac tgtttgaaga gaatgatgtg 180
aacctgaccc acattgagag cagaccatcc agactgaaga aggatgagta tgagttcttc 240
acacacctgg ataagagaag cctgccagca ctgacaaaca tcatcaagat tctgagacat 300
gacattggtg ctacagtgca tgagctgtca agggataaga agaaggacac agtgccctgg 360
ttccccagaa ccattcagga actggacaga tttgccaacc agatcctgtc ctatggggct 420
gagctggatg cagatcaccc aggattcaag gatccagtgt acagagcaag gagaaagcag 480
tttgctgaca ttgcatacaa ctacagacat ggccagccaa ttcctagagt ggagtacatg 540
gaggaggaga agaagacctg gggaacagtt ttcaagacac tcaaatccct ctacaagacc 600
catgcttgct atgagtacaa tcatatcttc ccactgctgg agaagtactg tggcttccat 660
gaggacaata tcccccagct ggaagatgtg tctcagttcc tgcagacctg cacaggcttc 720
aggctgagac ctgttgctgg actgctgtcc agcagggact ttctgggagg actggctttc 780
agagtgttcc actgcaccca gtatatcaga catggaagca agcccatgta cacacctgag 840
ccagacatct gccatgagct gctgggccat gtgccactgt tttcagacag atcctttgcc 900
cagtttagcc aggagattgg actggcatct ctgggagccc cagatgagta cattgagaag 960
ctggctacca tctactggtt cacagtggag tttggactgt gcaagcaggg ggattctatc 1020
aaggcctatg gagcaggact gctgtcctct tttggagagc tgcagtactg cctgagtgag 1080
aagccaaagc tgctgccact ggagctggaa aagactgcta tccagaacta cactgtgact 1140
gagttccagc cactgtacta tgtggctgag tcattcaatg atgccaagga gaaagtcagg 1200
aactttgctg ccactatccc cagacccttc tcagtgagat atgaccctta cacacagagg 1260
attgaggtcc tggacaatac acagcagctg aaaatcctgg ctgacagcat caactcagag 1320
attggcatcc tgtgcagtgc cctgcagaag atcaagtaa 1359
<210> 412
<211> 1359
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 412
atgtctactg ctgtcttgga aaatccagga ctgggcagga aactttcaga ttttggacaa 60
gaaacaagct acattgaaga taattgtaac caaaatggag ctatttcctt aatcttcagt 120
ctcaaagagg aagtaggtgc ccttgctaag gtactaagac tatttgaaga gaatgatgta 180
aacctcactc atatagagtc aaggcctagt aggctcaaga aagatgaata tgagttcttt 240
acccatttgg ataagagatc ccttccagcc ctcactaata tcataaaaat cctgaggcat 300
gatatagggg ccactgtaca tgaactaagt agggataaga aaaaagatac tgtgccatgg 360
tttccaagga ctatacaaga actagacagg tttgcaaacc aaattttgtc ctatggtgca 420
gagctagatg ctgaccatcc aggctttaag gatccagttt atagagccag aaggaaacag 480
tttgctgaca tagcttataa ctataggcat ggtcaaccca taccaagggt tgaatacatg 540
gaggaggaaa agaagacctg gggaactgta tttaaaaccc tgaaatctct gtacaagact 600
catgcttgtt atgagtataa ccatatcttc cccttgttag aaaagtattg tggatttcat 660
gaagataata ttccccagct tgaggatgta tcacagttct tacaaacctg tactggcttt 720
aggctaagac ctgtagcagg tttactgtcc tcaagagatt ttctgggggg gctagcattt 780
agggtttttc attgtacaca atacataagg catgggagta agcccatgta tacacctgag 840
ccagatatat gccatgaact gttaggccat gtacctttat tctcagatag aagctttgca 900
caattcagtc aagaaatagg gttggcatca ctaggagccc cagatgaata cattgaaaag 960
ctagcaacca tatattggtt tacagtagaa tttggattgt gcaagcaagg agactcaatc 1020
aaagcttatg gggctggact gctatcttcc tttggagaat tacagtattg tttgtctgag 1080
aaacccaaac tcttgccatt ggagttagag aagactgcca tacagaacta tactgttact 1140
gagttccaac ctctatacta tgttgcagaa tctttcaatg atgctaaaga gaaagttaga 1200
aactttgctg ctactatacc taggccattc agtgtcaggt atgatccata tacacaaaga 1260
atagaggttt tggataacac tcaacaactg aagatactag ctgattctat aaacagtgag 1320
attgggatac tatgcagtgc ccttcaaaag ataaaatag 1359
<210> 413
<211> 1359
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 413
atgtccacag cagttttaga gaatccaggt ttaggtagaa agctctcaga ctttggtcaa 60
gagacaagct acattgagga taactgcaac cagaatggag ccatctccct tatcttcagc 120
ttgaaggagg aagtaggtgc acttgctaag gtactgagac tatttgaaga gaatgatgtt 180
aacctaactc atatagagtc aaggcctagt aggctcaaga aagatgaata tgagttcttt 240
acccatttgg ataagaggtc cttacctgcc ttaactaata tcataaaaat tctgaggcat 300
gacatagggg ccactgtgca tgaattgagt agggataaga aaaaagatac tgtgccatgg 360
tttccaagga ctattcaaga actagatagg tttgcaaacc aaattttgtc ctatggtgca 420
gagctagatg ctgatcatcc aggctttaag gatccagttt atagagccag aaggaaacaa 480
tttgctgaca tagcttataa ctataggcat ggtcaaccca taccaagggt tgaatatatg 540
gaagaagaaa agaaaacctg gggaactgtc tttaagacct taaaaagcct atacaaaact 600
catgcttgtt atgagtataa tcatatcttc ccactgttag aaaagtattg tggatttcat 660
gaagataata ttccccagct tgaggatgta tcacagttcc tgcaaacctg tacaggcttt 720
aggctaagac ctgtagcagg tttattgtcc tcaagagatt ttctgggggg gctagcattt 780
agggtttttc attgtacaca atacataagg catgggtcta agcccatgta tacacctgag 840
ccagatatat gccatgaact gttaggccat gtacctttat tctcagatag aagctttgca 900
caattcagtc aagaaatagg gttggcatca ctaggagccc cagatgaata cattgaaaag 960
ctagcaacta tatattggtt tacagtagaa tttggattgt gcaagcaagg agactcaatc 1020
aaagcttatg gggctggact gctatcttcc tttggagaat tacagtattg tttgtctgag 1080
aaacccaaac tcttgccatt ggagttagag aaaactgcca tacagaacta tactgttact 1140
gagttccaac ctctatacta tgttgcagaa tcttttaatg atgctaaaga gaaagttaga 1200
aactttgctg ctactatacc taggccattc agtgtcaggt atgatccata tacacaaaga 1260
atagaggttt tggataacac tcaacaactg aagatactag ctgattctat aaacagtgag 1320
atagggatac tatgttcagc ccttcaaaag ataaaatag 1359
<210> 414
<211> 1359
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 414
atgtccacag cagttttaga gaatccaggt ttaggtagaa agctctcaga ctttggtcaa 60
gagacaagct acattgaaga caactgcaac cagaatggag ccatctccct tatcttcagc 120
ttgaaagaag aggtgggtgc tttggccaag gtgctgagac tgtttgaaga aaatgatgtc 180
aacctcactc acattgagtc aaggccttca agattgaaga aagatgagta tgaattcttc 240
acacatttgg ataagaggtc cctgccagcc ctgaccaaca tcatcaaaat tctgaggcat 300
gatattgggg ccacagtcca tgaactcagc agggacaaga aaaaagatac tgtgccctgg 360
tttccaagaa ccatccagga gctggacagg tttgccaatc agatcttatc ctatggggct 420
gagttggatg cagaccaccc aggcttcaag gatcctgtgt acagagctag aaggaaacaa 480
tttgcagaca ttgcttacaa ctataggcat ggtcagccca tccccagggt ggaatacatg 540
gaggaggaaa agaagacctg gggaactgta tttaaaaccc tgaaatctct gtataaaact 600
catgcctgct atgagtacaa tcacatcttt ccactcttgg agaaatactg tgggttccat 660
gaggacaata ttccccagct ggaggatgtg tctcagttcc tgcagacctg cactggtttt 720
aggctgagac ctgtagcagg tttgctatcc tcaagagact tcctgggggg cctagcattt 780
agggttttcc actgcaccca gtacatcaga catgggtcaa aacccatgta cacccctgag 840
ccagacatct gccatgagct cctgggccat gtgcctctct tctcagacag atcttttgca 900
cagtttagcc aggaaatagg cttggcctcc ttgggtgcac cagatgaata tatagaaaaa 960
ctagctacaa tctattggtt cactgttgaa tttggcttgt gcaagcaggg agactcaatc 1020
aaggcttatg gagctggttt gcttagctcc tttggggagc tgcaatactg cctttctgag 1080
aagcccaagt tgctgccact ggaattggag aagacagcca ttcagaacta cacagtgaca 1140
gagttccagc ctctgtatta tgtagcagaa agcttcaatg atgccaaaga gaaggttaga 1200
aattttgctg ctactattcc tagaccattc agtgtcaggt atgaccccta tactcagagg 1260
atagaggtgt tggacaacac tcagcagctc aagattctgg ctgacagtat caactcagaa 1320
attggaatcc tgtgttctgc ccttcagaag ataaaatag 1359
<210> 415
<211> 1359
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 415
atgagcacag cagtcttaga aaatccaggc ctgggaagga agttgtctga ctttggccag 60
gagacctcct acattgagga caactgcaac cagaatgggg ccatctcctt gatcttcagc 120
ctgaaggaag aagttggagc attagctaag gttctaagac tatttgagga aaatgatgtg 180
aatttgactc atatagaatc taggcccagt aggctgaaaa aagatgaata tgaatttttt 240
actcacttag acaaaagatc tctgccagct ttaactaata ttatcaagat ccttagacat 300
gacattggag ctacagtaca tgagctttca agggataaaa agaaggatac agtcccatgg 360
tttccaagaa caatacagga gctagacaga tttgcaaatc aaatcctttc atatggggct 420
gagcttgatg ctgaccaccc aggcttcaaa gaccctgttt acagggccag aaggaaacaa 480
tttgcagata tagcatacaa ctacaggcat ggtcaaccca tccctagggt ggagtacatg 540
gaggaggaaa agaagacctg gggcacagtg ttcaagacac tgaagtccct gtacaagaca 600
catgcttgct atgaatataa tcacatcttc cctctcctgg agaaatactg tggctttcat 660
gaggacaaca taccacaatt ggaagatgta agtcaattct tgcagacatg cactggcttc 720
aggctgaggc ctgtggctgg tctactgagc tccagagact tcctgggagg cttggcattc 780
agggtcttcc actgcaccca gtatataagg catggctcca agcctatgta caccccagag 840
cctgacatct gccatgagtt attgggtcat gttcctctct tctctgatag aagctttgcc 900
cagttctccc aagagatagg tttagcatca ctaggggctc cagatgagta cattgagaag 960
ctagctacca tatattggtt tacagttgaa tttggtctat gcaagcaagg tgacagcata 1020
aaggcttatg gagctggcct cttgagctcc tttggagaat tacaatattg tttgtctgaa 1080
aaacccaaac tacttccttt agaacttgag aaaacagcta tacaaaacta tactgtaaca 1140
gagttccaac ctttatatta tgttgctgaa agtttcaatg atgctaaaga gaaggtgagg 1200
aattttgcag ctacaatacc tagaccattt agtgtaaggt atgatcctta tacccaaaga 1260
attgaagttt tggataatac acaacaacta aagatcttag ctgattcaat caatagtgaa 1320
attggtatcc tatgcagtgc tttacaaaag ataaaataa 1359
<210> 416
<211> 1359
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 416
atgagcacag ctgtcttgga aaacccaggc ctgggcagga agttgtctga ctttggccag 60
gagacctcct acattgagga caactgcaac cagaatgggg ccatctcctt gatcttcagc 120
ctgaaggagg aggtgggagc cctggccaag gtcctgaggc tgtttgagga gaatgatgtg 180
aacctgaccc acattgagtc caggcccagt aggctgaaga aggatgagta tgagttcttc 240
acccacctgg acaagagatc cctgccagct ctgaccaaca tcattaagat cctgagacat 300
gacattgggg ccacagtgca tgagctgagc agggacaaga agaaggacac agtgccctgg 360
ttccccagaa ccatccagga gctggacagg tttgccaacc agatcctgtc ctatggagct 420
gagctggatg cagaccaccc tggcttcaag gacccagtgt acagggccag aaggaagcag 480
tttgctgaca ttgcctacaa ctacaggcat ggccagccca tcccaagggt ggagtacatg 540
gaggaggaga agaagacctg gggcacagtg ttcaagacac tgaagtccct gtacaagacc 600
catgcttgct atgagtataa ccacatcttc cctctcctgg agaaatactg tggcttccat 660
gaggacaaca tccctcagct ggaggatgtg agtcagttcc tgcagacctg cactggcttc 720
aggctgaggc ctgtggcagg actcctgagc agcagggact tcctgggagg cttggccttc 780
agggtgttcc actgcaccca gtatatcagg catggctcca agcctatgta caccccagag 840
cctgacatct gccatgagct gctggggcat gtgcccctgt tctctgacag gagctttgcc 900
cagttcagcc aggagattgg cctggcctcc ctgggggctc ctgatgagta cattgagaag 960
ctggctacca tctactggtt tacagtggag tttgggctgt gcaagcaggg ggacagcatc 1020
aaggcctatg gggctgggct gctgtcctcc tttggagagc tgcagtactg cctgtctgag 1080
aagcccaagc tcctccccct ggagctggag aagactgcca tccagaacta cactgtgaca 1140
gagttccagc ccctgtacta tgtggcagag tccttcaatg atgccaagga gaaggtgagg 1200
aactttgctg ccaccatccc caggcccttc tcagtgagat atgaccccta cacccagagg 1260
attgaggtgc tggacaacac ccagcagctg aagatcctgg cagacagcat caactctgag 1320
attggaatcc tgtgctctgc cctgcagaag atcaagtaa 1359
<210> 417
<211> 2226
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 417
atgagtacag cagtgttaga gaatccaggc ctaggtagaa agctgtctga ctttggccag 60
gtgagccagg gcagcctgag ctgctcagtt aggggaattt gggcctccag agaaagagat 120
cccaagactg ctggtgcttc ctggtttcat aagctcagta agaagtctga attggttgga 180
agctgatgag aatatccagg aagtcaacag acaaatgtcc tcaacaattg tttctaagta 240
ggagaacatc tgtcctgggt ggctttcaca ggaatgaatg accattgctt tagggggttg 300
gggatctggc ctccagaact gccaccaatt agctgtgtgt ctttggacaa gttactgtcc 360
ctctctgttg tctgtttact cttctgtaca ctgaaggggt tccaatccag gtcttaggat 420
tcaaaagcct gtgcatgttc catttttagt actttccaca ctgtatttct caatgtcttt 480
ctgggacatt ttataaatca tattatatca cctctaagga tctttcagtt tgttatatat 540
gtgtctatta agttagattg tgagctccta aaagataaag cattgtctta ttcatcttta 600
aatttctcag agcccaaata gtgcctggaa cctagtagtt gctcaataaa aggtattgaa 660
tttacaggat tgaatggtga catcaatgaa taattgaaga ttccttaagc tgataactga 720
cccagtagca tcattgatca tttaattgcc ctggacttac ttattttcca ccacactaca 780
tatttctgta tagaatatat atagctcatt gtattgcaag atttaactag aagaaagagt 840
tcatgcttgc tttgtccatg taggtttaac aggaatgaat tgctaaactg tggaaaatgt 900
tttaaacaaa tgcatcttat cctgtaggag acctcctaca ttgaggacaa ctgcaaccag 960
aatggagcca tcagcctgat cttcagcctg aaggaggagg tgggagccct ggccaaggtg 1020
ctgagactgt ttgaggagaa tgatgtgaac ctgacccaca ttgagtccag accctccaga 1080
ctgaagaagg atgagtatga gttcttcacc cacctggaca agagatccct gcctgctctg 1140
accaacatca tcaagatcct gagacatgat attggagcca cagtgcatga gctgagcagg 1200
gacaagaaga aggacacagt gccttggttc cccagaacca tccaggagct ggacaggttt 1260
gccaaccaga tcctgtccta tggagctgag ctggatgctg accaccctgg atttaaggat 1320
cctgtgtaca gggccagaag gaagcagttt gctgacattg cctacaacta caggcatggc 1380
cagcccatcc ccagggtgga gtacatggag gaggagaaga agacctgggg cactgtgttc 1440
aagaccctga agagcctgta caagacccat gcctgctatg agtacaacca catcttcccc 1500
ctgctggaga agtactgtgg cttccatgag gacaacatcc ctcagctgga ggatgtgtcc 1560
cagttcctgc agacctgcac aggcttcaga ctgagacctg tggctggcct gctgtctagc 1620
agagacttcc tgggaggcct ggccttcaga gtgttccact gcacccagta catcagacat 1680
ggaagcaagc ccatgtacac ccctgagcca gacatctgcc atgagctgct gggccatgtg 1740
cccctgttct ctgatagatc ctttgcccag ttcagccagg agattggcct ggccagcctg 1800
ggagcccctg atgagtacat tgagaagctg gccaccatct actggttcac agtggagttt 1860
ggcctgtgca agcagggaga ctccatcaag gcctatggag ctggactgct gtcctccttt 1920
ggagagctgc agtactgcct gtctgagaag cccaagctgc tgcccctgga gctggagaag 1980
acagccatcc agaactacac agtgacagag ttccagcccc tgtactatgt ggctgagagc 2040
ttcaatgatg ccaaggagaa ggtgagaaac tttgctgcca ccatccccag acccttctct 2100
gtgaggtatg acccctacac ccagaggatt gaggtgctgg acaacaccca gcagctgaag 2160
atcctggctg actccatcaa ctctgagatt ggcatcctgt gctctgccct gcagaagatc 2220
aagtaa 2226
<210> 418
<211> 2226
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 418
atgagtacag cagtgttaga gaatccaggc ttgggcagga aactctctga ctttggacag 60
gtgagccagg gcagcctgag ctgctcagtt aggggaattt gggcctccag agaaagagat 120
cccaagactg ctggtgcttc ctggtttcat aagctcagta agaagtctga attggttgga 180
agctgatgag aatatccagg aagtcaacag acaaatgtcc tcaacaattg tttctaagta 240
ggagaacatc tgtcctgggt ggctttcaca ggaatgaatg accattgctt tagggggttg 300
gggatctggc ctccagaact gccaccaatt agctgtgtgt ctttggacaa gttactgtcc 360
ctctctgttg tctgtttact cttctgtaca ctgaaggggt tccaatccag gtcttaggat 420
tcaaaagcct gtgcatgttc catttttagt actttccaca ctgtatttct caatgtcttt 480
ctgggacatt ttataaatca tattatatca cctctaagga tctttcagtt tgttatatat 540
gtgtctatta agttagattg tgagctccta aaagataaag cattgtctta ttcatcttta 600
aatttctcag agcccaaata gtgcctggaa cctagtagtt gctcaataaa aggtattgaa 660
tttacaggat tgaatggtga catcaatgaa taattgaaga ttccttaagc tgataactga 720
cccagtagca tcattgatca tttaattgcc ctggacttac ttattttcca ccacactaca 780
tatttctgta tagaatatat atagctcatt gtattgcaag atttaactag aagaaagagt 840
tcatgcttgc tttgtccatg taggtttaac aggaatgaat tgctaaactg tggaaaatgt 900
tttaaacaaa tgcatcttat cctgtaggaa acaagctata ttgaagacaa ctgcaatcaa 960
aatggagcca tcagcctgat cttcagcctg aaggaggagg tgggagccct ggccaaggtg 1020
ctgagactgt ttgaggagaa tgatgtgaac ctgacccaca ttgagtccag accctccaga 1080
ctgaagaagg atgagtatga gttcttcacc cacctggaca agagatccct gcctgctctg 1140
accaacatca tcaagatcct gagacatgat attggagcca cagtgcatga gctgagcagg 1200
gacaagaaga aggacacagt gccttggttc cccagaacca tccaggagct ggacaggttt 1260
gccaaccaga tcctgtccta tggagctgag ctggatgctg accaccctgg atttaaggat 1320
cctgtgtaca gggccagaag gaagcagttt gctgacattg cctacaacta caggcatggc 1380
cagcccatcc ccagggtgga gtacatggag gaggagaaga agacctgggg cactgtgttc 1440
aagaccctga agagcctgta caagacccat gcctgctatg agtacaacca catcttcccc 1500
ctgctggaga agtactgtgg cttccatgag gacaacatcc ctcagctgga ggatgtgtcc 1560
cagttcctgc agacctgcac aggcttcaga ctgagacctg tggctggcct gctgtctagc 1620
agagacttcc tgggaggcct ggccttcaga gtgttccact gcacccagta catcagacat 1680
ggaagcaagc ccatgtacac ccctgagcca gacatctgcc atgagctgct gggccatgtg 1740
cccctgttct ctgatagatc ctttgcccag ttcagccagg agattggcct ggccagcctg 1800
ggagcccctg atgagtacat tgagaagctg gccaccatct actggttcac agtggagttt 1860
ggcctgtgca agcagggaga ctccatcaag gcctatggag ctggactgct gtcctccttt 1920
ggagagctgc agtactgcct gtctgagaag cccaagctgc tgcccctgga gctggagaag 1980
acagccatcc agaactacac agtgacagag ttccagcccc tgtactatgt ggctgagagc 2040
ttcaatgatg ccaaggagaa ggtgagaaac tttgctgcca ccatccccag acccttctct 2100
gtgaggtatg acccctacac ccagaggatt gaggtgctgg acaacaccca gcagctgaag 2160
atcctggctg actccatcaa ctctgagatt ggcatcctgt gctctgccct gcagaagatc 2220
aagtaa 2226
<210> 419
<211> 2179
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 419
atgagtacag cagtgttaga gaatccaggc ctaggtagaa agctgtctga ctttggccag 60
gtaagcctgt tgggcttcca ctgctaggag agaattggtt ccccacatgt gaaagcagtc 120
tgggaaatgc tggtatttcc agtctcctaa ggctactaag aaatatgact ttatttagag 180
gcgaggaaaa tgcccaggaa gtcaactgat gagtctagtc ttaacaagtt gaggatacag 240
aaagttgggg atctgagctg ctaccaacat ctgtgtgtct ttgggtggct cattggtatc 300
ctctgcctat tggctttatc ttctgtacac tgaaaggaaa tggctggtcc ttagtcacct 360
acccaggtct tggatccata gcctacggat gtcccatttt tattgctttt tatattttgt 420
ctcccagtgt ctttttgagg attttttttt tttttttgca tcacttgctc ttcctctaag 480
aatctcctga cttcttgtac atgtgtctga tggtcagaat tttagcactg aagtatgggc 540
gtatttatca taattcaggt ttatatcctt tcagatatgg gctagggtct ggtattaggg 600
tgctcattaa aaaatgttga tttttgtcag tgtctagtga catcaatgca taatttaagg 660
ttctataaat tgaaagctaa cccaggagtg actcatcctc tcattgtttt caacttactt 720
atttctgatc acactgactt ccctgtggaa tacacgtggt tcactgtgtt ccaaagctta 780
acgagcagaa aaaggttatg ctcgtctctt cttgagaggt tttaagagaa taattgctaa 840
gctgtgaaaa acattttaac caagtgatct aattatgtag gagacctcct acattgagga 900
caactgcaac cagaatggag ccatcagcct gatcttcagc ctgaaggagg aggtgggagc 960
cctggccaag gtgctgagac tgtttgagga gaatgatgtg aacctgaccc acattgagtc 1020
cagaccctcc agactgaaga aggatgagta tgagttcttc acccacctgg acaagagatc 1080
cctgcctgct ctgaccaaca tcatcaagat cctgagacat gatattggag ccacagtgca 1140
tgagctgagc agggacaaga agaaggacac agtgccttgg ttccccagaa ccatccagga 1200
gctggacagg tttgccaacc agatcctgtc ctatggagct gagctggatg ctgaccaccc 1260
tggatttaag gatcctgtgt acagggccag aaggaagcag tttgctgaca ttgcctacaa 1320
ctacaggcat ggccagccca tccccagggt ggagtacatg gaggaggaga agaagacctg 1380
gggcactgtg ttcaagaccc tgaagagcct gtacaagacc catgcctgct atgagtacaa 1440
ccacatcttc cccctgctgg agaagtactg tggcttccat gaggacaaca tccctcagct 1500
ggaggatgtg tcccagttcc tgcagacctg cacaggcttc agactgagac ctgtggctgg 1560
cctgctgtct agcagagact tcctgggagg cctggccttc agagtgttcc actgcaccca 1620
gtacatcaga catggaagca agcccatgta cacccctgag ccagacatct gccatgagct 1680
gctgggccat gtgcccctgt tctctgatag atcctttgcc cagttcagcc aggagattgg 1740
cctggccagc ctgggagccc ctgatgagta cattgagaag ctggccacca tctactggtt 1800
cacagtggag tttggcctgt gcaagcaggg agactccatc aaggcctatg gagctggact 1860
gctgtcctcc tttggagagc tgcagtactg cctgtctgag aagcccaagc tgctgcccct 1920
ggagctggag aagacagcca tccagaacta cacagtgaca gagttccagc ccctgtacta 1980
tgtggctgag agcttcaatg atgccaagga gaaggtgaga aactttgctg ccaccatccc 2040
cagacccttc tctgtgaggt atgaccccta cacccagagg attgaggtgc tggacaacac 2100
ccagcagctg aagatcctgg ctgactccat caactctgag attggcatcc tgtgctctgc 2160
cctgcagaag atcaagtaa 2179
<210> 420
<211> 2179
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 420
atgagtacag cagtgttaga gaatccaggc ttgggcagga aactctctga ctttggacag 60
gtaagcctgt tgggcttcca ctgctaggag agaattggtt ccccacatgt gaaagcagtc 120
tgggaaatgc tggtatttcc agtctcctaa ggctactaag aaatatgact ttatttagag 180
gcgaggaaaa tgcccaggaa gtcaactgat gagtctagtc ttaacaagtt gaggatacag 240
aaagttgggg atctgagctg ctaccaacat ctgtgtgtct ttgggtggct cattggtatc 300
ctctgcctat tggctttatc ttctgtacac tgaaaggaaa tggctggtcc ttagtcacct 360
acccaggtct tggatccata gcctacggat gtcccatttt tattgctttt tatattttgt 420
ctcccagtgt ctttttgagg attttttttt tttttttgca tcacttgctc ttcctctaag 480
aatctcctga cttcttgtac atgtgtctga tggtcagaat tttagcactg aagtatgggc 540
gtatttatca taattcaggt ttatatcctt tcagatatgg gctagggtct ggtattaggg 600
tgctcattaa aaaatgttga tttttgtcag tgtctagtga catcaatgca taatttaagg 660
ttctataaat tgaaagctaa cccaggagtg actcatcctc tcattgtttt caacttactt 720
atttctgatc acactgactt ccctgtggaa tacacgtggt tcactgtgtt ccaaagctta 780
acgagcagaa aaaggttatg ctcgtctctt cttgagaggt tttaagagaa taattgctaa 840
gctgtgaaaa acattttaac caagtgatct aattatgtag gaaacaagct atattgaaga 900
caactgcaat caaaatggag ccatcagcct gatcttcagc ctgaaggagg aggtgggagc 960
cctggccaag gtgctgagac tgtttgagga gaatgatgtg aacctgaccc acattgagtc 1020
cagaccctcc agactgaaga aggatgagta tgagttcttc acccacctgg acaagagatc 1080
cctgcctgct ctgaccaaca tcatcaagat cctgagacat gatattggag ccacagtgca 1140
tgagctgagc agggacaaga agaaggacac agtgccttgg ttccccagaa ccatccagga 1200
gctggacagg tttgccaacc agatcctgtc ctatggagct gagctggatg ctgaccaccc 1260
tggatttaag gatcctgtgt acagggccag aaggaagcag tttgctgaca ttgcctacaa 1320
ctacaggcat ggccagccca tccccagggt ggagtacatg gaggaggaga agaagacctg 1380
gggcactgtg ttcaagaccc tgaagagcct gtacaagacc catgcctgct atgagtacaa 1440
ccacatcttc cccctgctgg agaagtactg tggcttccat gaggacaaca tccctcagct 1500
ggaggatgtg tcccagttcc tgcagacctg cacaggcttc agactgagac ctgtggctgg 1560
cctgctgtct agcagagact tcctgggagg cctggccttc agagtgttcc actgcaccca 1620
gtacatcaga catggaagca agcccatgta cacccctgag ccagacatct gccatgagct 1680
gctgggccat gtgcccctgt tctctgatag atcctttgcc cagttcagcc aggagattgg 1740
cctggccagc ctgggagccc ctgatgagta cattgagaag ctggccacca tctactggtt 1800
cacagtggag tttggcctgt gcaagcaggg agactccatc aaggcctatg gagctggact 1860
gctgtcctcc tttggagagc tgcagtactg cctgtctgag aagcccaagc tgctgcccct 1920
ggagctggag aagacagcca tccagaacta cacagtgaca gagttccagc ccctgtacta 1980
tgtggctgag agcttcaatg atgccaagga gaaggtgaga aactttgctg ccaccatccc 2040
cagacccttc tctgtgaggt atgaccccta cacccagagg attgaggtgc tggacaacac 2100
ccagcagctg aagatcctgg ctgactccat caactctgag attggcatcc tgtgctctgc 2160
cctgcagaag atcaagtaa 2179
<210> 421
<211> 1588
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 421
atgagtacag cagtgttaga gaatccaggc ctaggtagaa agctgtctga ctttggccag 60
gtgagccacg gcagcctgag ctgctcagtt aggggaattt gggcctccag agaaagagat 120
ccgaagactg ctggtgcttc ctggtttcat aagctcagta agaagtctga attcgttgga 180
agctgatgat agaagaaaga gttcatgctt gctttgtcca tggaggttta acaggaatga 240
attgctaaac tgtggaaaat gttttaaaca aatgcatctt atcctgtagg agacctccta 300
cattgaggac aactgcaacc agaatggagc catcagcctg atcttcagcc tgaaggagga 360
ggtgggagcc ctggccaagg tgctgagact gtttgaggag aatgatgtga acctgaccca 420
cattgagtcc agaccctcca gactgaagaa ggatgagtat gagttcttca cccacctgga 480
caagagatcc ctgcctgctc tgaccaacat catcaagatc ctgagacatg atattggagc 540
cacagtgcat gagctgagca gggacaagaa gaaggacaca gtgccttggt tccccagaac 600
catccaggag ctggacaggt ttgccaacca gatcctgtcc tatggagctg agctggatgc 660
tgaccaccct ggatttaagg atcctgtgta cagggccaga aggaagcagt ttgctgacat 720
tgcctacaac tacaggcatg gccagcccat ccccagggtg gagtacatgg aggaggagaa 780
gaagacctgg ggcactgtgt tcaagaccct gaagagcctg tacaagaccc atgcctgcta 840
tgagtacaac cacatcttcc ccctgctgga gaagtactgt ggcttccatg aggacaacat 900
ccctcagctg gaggatgtgt cccagttcct gcagacctgc acaggcttca gactgagacc 960
tgtggctggc ctgctgtcta gcagagactt cctgggaggc ctggccttca gagtgttcca 1020
ctgcacccag tacatcagac atggaagcaa gcccatgtac acccctgagc cagacatctg 1080
ccatgagctg ctgggccatg tgcccctgtt ctctgataga tcctttgccc agttcagcca 1140
ggagattggc ctggccagcc tgggagcccc tgatgagtac attgagaagc tggccaccat 1200
ctactggttc acagtggagt ttggcctgtg caagcaggga gactccatca aggcctatgg 1260
agctggactg ctgtcctcct ttggagagct gcagtactgc ctgtctgaga agcccaagct 1320
gctgcccctg gagctggaga agacagccat ccagaactac acagtgacag agttccagcc 1380
cctgtactat gtggctgaga gcttcaatga tgccaaggag aaggtgagaa actttgctgc 1440
caccatcccc agacccttct ctgtgaggta tgacccctac acccagagga ttgaggtgct 1500
ggacaacacc cagcagctga agatcctggc tgactccatc aactctgaga ttggcatcct 1560
gtgctctgcc ctgcagaaga tcaagtaa 1588
<210> 422
<211> 1588
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 422
atgagtacag cagtgttaga gaatccaggc ttgggcagga aactctctga ctttggacag 60
gtgagccacg gcagcctgag ctgctcagtt aggggaattt gggcctccag agaaagagat 120
ccgaagactg ctggtgcttc ctggtttcat aagctcagta agaagtctga attcgttgga 180
agctgatgat agaagaaaga gttcatgctt gctttgtcca tggaggttta acaggaatga 240
attgctaaac tgtggaaaat gttttaaaca aatgcatctt atcctgtagg aaacaagcta 300
tattgaagac aactgcaatc aaaatggagc catcagcctg atcttcagcc tgaaggagga 360
ggtgggagcc ctggccaagg tgctgagact gtttgaggag aatgatgtga acctgaccca 420
cattgagtcc agaccctcca gactgaagaa ggatgagtat gagttcttca cccacctgga 480
caagagatcc ctgcctgctc tgaccaacat catcaagatc ctgagacatg atattggagc 540
cacagtgcat gagctgagca gggacaagaa gaaggacaca gtgccttggt tccccagaac 600
catccaggag ctggacaggt ttgccaacca gatcctgtcc tatggagctg agctggatgc 660
tgaccaccct ggatttaagg atcctgtgta cagggccaga aggaagcagt ttgctgacat 720
tgcctacaac tacaggcatg gccagcccat ccccagggtg gagtacatgg aggaggagaa 780
gaagacctgg ggcactgtgt tcaagaccct gaagagcctg tacaagaccc atgcctgcta 840
tgagtacaac cacatcttcc ccctgctgga gaagtactgt ggcttccatg aggacaacat 900
ccctcagctg gaggatgtgt cccagttcct gcagacctgc acaggcttca gactgagacc 960
tgtggctggc ctgctgtcta gcagagactt cctgggaggc ctggccttca gagtgttcca 1020
ctgcacccag tacatcagac atggaagcaa gcccatgtac acccctgagc cagacatctg 1080
ccatgagctg ctgggccatg tgcccctgtt ctctgataga tcctttgccc agttcagcca 1140
ggagattggc ctggccagcc tgggagcccc tgatgagtac attgagaagc tggccaccat 1200
ctactggttc acagtggagt ttggcctgtg caagcaggga gactccatca aggcctatgg 1260
agctggactg ctgtcctcct ttggagagct gcagtactgc ctgtctgaga agcccaagct 1320
gctgcccctg gagctggaga agacagccat ccagaactac acagtgacag agttccagcc 1380
cctgtactat gtggctgaga gcttcaatga tgccaaggag aaggtgagaa actttgctgc 1440
caccatcccc agacccttct ctgtgaggta tgacccctac acccagagga ttgaggtgct 1500
ggacaacacc cagcagctga agatcctggc tgactccatc aactctgaga ttggcatcct 1560
gtgctctgcc ctgcagaaga tcaagtaa 1588
<210> 423
<211> 1588
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 423
atgagtacag cagtgttaga gaatccaggc ttgggcagga aactctctga ctttggacag 60
gtgagccagg gcagcctgag ctgctcagtt aggggaattt gggcctccag agaaagagat 120
ctgaagactg ctggtgcttc ctggtttcat aagctcagta agaagtctga attcattgga 180
agctgatgat agaagaaaga gttcatgctt gctttgtcca tggaggttta acaggaatga 240
attgctaaac tgtggaaaat gttttaaaca aatgcatctt atcctgtagg aaacaagcta 300
tattgaagac aactgcaatc aaaatggagc catcagcctg atcttcagcc tgaaggagga 360
ggtgggagcc ctggccaagg tgctgagact gtttgaggag aatgatgtga acctgaccca 420
cattgagtcc agaccctcca gactgaagaa ggatgagtat gagttcttca cccacctgga 480
caagagatcc ctgcctgctc tgaccaacat catcaagatc ctgagacatg atattggagc 540
cacagtgcat gagctgagca gggacaagaa gaaggacaca gtgccttggt tccccagaac 600
catccaggag ctggacaggt ttgccaacca gatcctgtcc tatggagctg agctggatgc 660
tgaccaccct ggatttaagg atcctgtgta cagggccaga aggaagcagt ttgctgacat 720
tgcctacaac tacaggcatg gccagcccat ccccagggtg gagtacatgg aggaggagaa 780
gaagacctgg ggcactgtgt tcaagaccct gaagagcctg tacaagaccc atgcctgcta 840
tgagtacaac cacatcttcc ccctgctgga gaagtactgt ggcttccatg aggacaacat 900
ccctcagctg gaggatgtgt cccagttcct gcagacctgc acaggcttca gactgagacc 960
tgtggctggc ctgctgtcta gcagagactt cctgggaggc ctggccttca gagtgttcca 1020
ctgcacccag tacatcagac atggaagcaa gcccatgtac acccctgagc cagacatctg 1080
ccatgagctg ctgggccatg tgcccctgtt ctctgataga tcctttgccc agttcagcca 1140
ggagattggc ctggccagcc tgggagcccc tgatgagtac attgagaagc tggccaccat 1200
ctactggttc acagtggagt ttggcctgtg caagcaggga gactccatca aggcctatgg 1260
agctggactg ctgtcctcct ttggagagct gcagtactgc ctgtctgaga agcccaagct 1320
gctgcccctg gagctggaga agacagccat ccagaactac acagtgacag agttccagcc 1380
cctgtactat gtggctgaga gcttcaatga tgccaaggag aaggtgagaa actttgctgc 1440
caccatcccc agacccttct ctgtgaggta tgacccctac acccagagga ttgaggtgct 1500
ggacaacacc cagcagctga agatcctggc tgactccatc aactctgaga ttggcatcct 1560
gtgctctgcc ctgcagaaga tcaagtaa 1588
<210> 424
<211> 2226
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 424
atgtccacag ctgtgctgga gaaccctggc ctgggcagaa agctgtctga ctttggccag 60
gtgagccagg gcagcctgag ctgctcagtt aggggaattt gggcctccag agaaagagat 120
cccaagactg ctggtgcttc ctggtttcat aagctcagta agaagtctga attggttgga 180
agctgatgag aatatccagg aagtcaacag acaaatgtcc tcaacaattg tttctaagta 240
ggagaacatc tgtcctgggt ggctttcaca ggaatgaatg accattgctt tagggggttg 300
gggatctggc ctccagaact gccaccaatt agctgtgtgt ctttggacaa gttactgtcc 360
ctctctgttg tctgtttact cttctgtaca ctgaaggggt tccaatccag gtcttaggat 420
tcaaaagcct gtgcatgttc catttttagt actttccaca ctgtatttct caatgtcttt 480
ctgggacatt ttataaatca tattatatca cctctaagga tctttcagtt tgttatatat 540
gtgtctatta agttagattg tgagctccta aaagataaag cattgtctta ttcatcttta 600
aatttctcag agcccaaata gtgcctggaa cctagtagtt gctcaataaa aggtattgaa 660
tttacaggat tgaatggtga catcaatgaa taattgaaga ttccttaagc tgataactga 720
cccagtagca tcattgatca tttaattgcc ctggacttac ttattttcca ccacactaca 780
tatttctgta tagaatatat atagctcatt gtattgcaag atttaactag aagaaagagt 840
tcatgcttgc tttgtccatg taggtttaac aggaatgaat tgctaaactg tggaaaatgt 900
tttaaacaaa tgcatcttat cctgtaggag acctcctaca ttgaggacaa ctgcaaccag 960
aatggagcca tctccctgat cttctccctg aaggaggagg tgggagccct ggccaaggtg 1020
ctgagactgt ttgaggagaa tgatgtgaac ctgacccaca ttgagtccag accctccaga 1080
ctgaagaagg atgagtatga gttcttcacc cacctggaca agagatccct gcctgccctg 1140
accaacatca tcaagatcct gagacatgac attggagcca cagtgcatga gctgtccaga 1200
gacaagaaga aggacacagt gccctggttc cccagaacca tccaggagct ggacagattt 1260
gccaaccaga tcctgtccta tggagctgag ctggatgctg accaccctgg cttcaaggac 1320
cctgtgtaca gggccagaag aaagcagttt gctgacattg cctacaacta cagacatggc 1380
cagcccatcc ccagagtgga gtacatggag gaggagaaga agacctgggg cacagtgttc 1440
aagaccctga agtccctgta caagacccat gcctgctatg agtacaacca catcttcccc 1500
ctgctggaga agtactgtgg cttccatgag gacaacatcc cccagctgga ggatgtgtcc 1560
cagttcctgc agacctgcac aggcttcaga ctgagacctg tggctggcct gctgtcctcc 1620
agagacttcc tgggaggcct ggccttcaga gtgttccact gcacccagta catcagacat 1680
ggctccaagc ccatgtacac ccctgagcct gacatctgcc atgagctgct gggccatgtg 1740
cccctgttct ctgacagatc ctttgcccag ttctcccagg agattggcct ggcctccctg 1800
ggagcccctg atgagtacat tgagaagctg gccaccatct actggttcac agtggagttt 1860
ggcctgtgca agcagggaga ctccatcaag gcctatggag ctggcctgct gtcctccttt 1920
ggagagctgc agtactgcct gtctgagaag cccaagctgc tgcccctgga gctggagaag 1980
acagccatcc agaactacac agtgacagag ttccagcccc tgtactatgt ggctgagtcc 2040
ttcaatgatg ccaaggagaa ggtcagaaac tttgctgcca ccatccccag acccttctct 2100
gtgagatatg acccctacac ccagagaatt gaggtgctgg acaacaccca gcagctgaag 2160
atcctggctg actccatcaa ctctgagatt ggcatcctgt gctctgccct gcagaagatc 2220
aagtaa 2226
<210> 425
<211> 2226
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 425
atgtccacag ctgtgctgga gaaccctggc ttgggcagga aactctctga ctttggacag 60
gtgagccagg gcagcctgag ctgctcagtt aggggaattt gggcctccag agaaagagat 120
cccaagactg ctggtgcttc ctggtttcat aagctcagta agaagtctga attggttgga 180
agctgatgag aatatccagg aagtcaacag acaaatgtcc tcaacaattg tttctaagta 240
ggagaacatc tgtcctgggt ggctttcaca ggaatgaatg accattgctt tagggggttg 300
gggatctggc ctccagaact gccaccaatt agctgtgtgt ctttggacaa gttactgtcc 360
ctctctgttg tctgtttact cttctgtaca ctgaaggggt tccaatccag gtcttaggat 420
tcaaaagcct gtgcatgttc catttttagt actttccaca ctgtatttct caatgtcttt 480
ctgggacatt ttataaatca tattatatca cctctaagga tctttcagtt tgttatatat 540
gtgtctatta agttagattg tgagctccta aaagataaag cattgtctta ttcatcttta 600
aatttctcag agcccaaata gtgcctggaa cctagtagtt gctcaataaa aggtattgaa 660
tttacaggat tgaatggtga catcaatgaa taattgaaga ttccttaagc tgataactga 720
cccagtagca tcattgatca tttaattgcc ctggacttac ttattttcca ccacactaca 780
tatttctgta tagaatatat atagctcatt gtattgcaag atttaactag aagaaagagt 840
tcatgcttgc tttgtccatg taggtttaac aggaatgaat tgctaaactg tggaaaatgt 900
tttaaacaaa tgcatcttat cctgtaggaa acaagctata ttgaagacaa ctgcaatcaa 960
aatggagcca tctccctgat cttctccctg aaggaggagg tgggagccct ggccaaggtg 1020
ctgagactgt ttgaggagaa tgatgtgaac ctgacccaca ttgagtccag accctccaga 1080
ctgaagaagg atgagtatga gttcttcacc cacctggaca agagatccct gcctgccctg 1140
accaacatca tcaagatcct gagacatgac attggagcca cagtgcatga gctgtccaga 1200
gacaagaaga aggacacagt gccctggttc cccagaacca tccaggagct ggacagattt 1260
gccaaccaga tcctgtccta tggagctgag ctggatgctg accaccctgg cttcaaggac 1320
cctgtgtaca gggccagaag aaagcagttt gctgacattg cctacaacta cagacatggc 1380
cagcccatcc ccagagtgga gtacatggag gaggagaaga agacctgggg cacagtgttc 1440
aagaccctga agtccctgta caagacccat gcctgctatg agtacaacca catcttcccc 1500
ctgctggaga agtactgtgg cttccatgag gacaacatcc cccagctgga ggatgtgtcc 1560
cagttcctgc agacctgcac aggcttcaga ctgagacctg tggctggcct gctgtcctcc 1620
agagacttcc tgggaggcct ggccttcaga gtgttccact gcacccagta catcagacat 1680
ggctccaagc ccatgtacac ccctgagcct gacatctgcc atgagctgct gggccatgtg 1740
cccctgttct ctgacagatc ctttgcccag ttctcccagg agattggcct ggcctccctg 1800
ggagcccctg atgagtacat tgagaagctg gccaccatct actggttcac agtggagttt 1860
ggcctgtgca agcagggaga ctccatcaag gcctatggag ctggcctgct gtcctccttt 1920
ggagagctgc agtactgcct gtctgagaag cccaagctgc tgcccctgga gctggagaag 1980
acagccatcc agaactacac agtgacagag ttccagcccc tgtactatgt ggctgagtcc 2040
ttcaatgatg ccaaggagaa ggtcagaaac tttgctgcca ccatccccag acccttctct 2100
gtgagatatg acccctacac ccagagaatt gaggtgctgg acaacaccca gcagctgaag 2160
atcctggctg actccatcaa ctctgagatt ggcatcctgt gctctgccct gcagaagatc 2220
aagtaa 2226
<210> 426
<211> 2179
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 426
atgtccacag ctgtgctgga gaaccctggc ctgggcagaa agctgtctga ctttggccag 60
gtaagcctgt tgggcttcca ctgctaggag agaattggtt ccccacatgt gaaagcagtc 120
tgggaaatgc tggtatttcc agtctcctaa ggctactaag aaatatgact ttatttagag 180
gcgaggaaaa tgcccaggaa gtcaactgat gagtctagtc ttaacaagtt gaggatacag 240
aaagttgggg atctgagctg ctaccaacat ctgtgtgtct ttgggtggct cattggtatc 300
ctctgcctat tggctttatc ttctgtacac tgaaaggaaa tggctggtcc ttagtcacct 360
acccaggtct tggatccata gcctacggat gtcccatttt tattgctttt tatattttgt 420
ctcccagtgt ctttttgagg attttttttt tttttttgca tcacttgctc ttcctctaag 480
aatctcctga cttcttgtac atgtgtctga tggtcagaat tttagcactg aagtatgggc 540
gtatttatca taattcaggt ttatatcctt tcagatatgg gctagggtct ggtattaggg 600
tgctcattaa aaaatgttga tttttgtcag tgtctagtga catcaatgca taatttaagg 660
ttctataaat tgaaagctaa cccaggagtg actcatcctc tcattgtttt caacttactt 720
atttctgatc acactgactt ccctgtggaa tacacgtggt tcactgtgtt ccaaagctta 780
acgagcagaa aaaggttatg ctcgtctctt cttgagaggt tttaagagaa taattgctaa 840
gctgtgaaaa acattttaac caagtgatct aattatgtag gagacctcct acattgagga 900
caactgcaac cagaatggag ccatctccct gatcttctcc ctgaaggagg aggtgggagc 960
cctggccaag gtgctgagac tgtttgagga gaatgatgtg aacctgaccc acattgagtc 1020
cagaccctcc agactgaaga aggatgagta tgagttcttc acccacctgg acaagagatc 1080
cctgcctgcc ctgaccaaca tcatcaagat cctgagacat gacattggag ccacagtgca 1140
tgagctgtcc agagacaaga agaaggacac agtgccctgg ttccccagaa ccatccagga 1200
gctggacaga tttgccaacc agatcctgtc ctatggagct gagctggatg ctgaccaccc 1260
tggcttcaag gaccctgtgt acagggccag aagaaagcag tttgctgaca ttgcctacaa 1320
ctacagacat ggccagccca tccccagagt ggagtacatg gaggaggaga agaagacctg 1380
gggcacagtg ttcaagaccc tgaagtccct gtacaagacc catgcctgct atgagtacaa 1440
ccacatcttc cccctgctgg agaagtactg tggcttccat gaggacaaca tcccccagct 1500
ggaggatgtg tcccagttcc tgcagacctg cacaggcttc agactgagac ctgtggctgg 1560
cctgctgtcc tccagagact tcctgggagg cctggccttc agagtgttcc actgcaccca 1620
gtacatcaga catggctcca agcccatgta cacccctgag cctgacatct gccatgagct 1680
gctgggccat gtgcccctgt tctctgacag atcctttgcc cagttctccc aggagattgg 1740
cctggcctcc ctgggagccc ctgatgagta cattgagaag ctggccacca tctactggtt 1800
cacagtggag tttggcctgt gcaagcaggg agactccatc aaggcctatg gagctggcct 1860
gctgtcctcc tttggagagc tgcagtactg cctgtctgag aagcccaagc tgctgcccct 1920
ggagctggag aagacagcca tccagaacta cacagtgaca gagttccagc ccctgtacta 1980
tgtggctgag tccttcaatg atgccaagga gaaggtcaga aactttgctg ccaccatccc 2040
cagacccttc tctgtgagat atgaccccta cacccagaga attgaggtgc tggacaacac 2100
ccagcagctg aagatcctgg ctgactccat caactctgag attggcatcc tgtgctctgc 2160
cctgcagaag atcaagtaa 2179
<210> 427
<211> 2179
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 427
atgtccacag ctgtgctgga gaaccctggc ttgggcagga aactctctga ctttggacag 60
gtaagcctgt tgggcttcca ctgctaggag agaattggtt ccccacatgt gaaagcagtc 120
tgggaaatgc tggtatttcc agtctcctaa ggctactaag aaatatgact ttatttagag 180
gcgaggaaaa tgcccaggaa gtcaactgat gagtctagtc ttaacaagtt gaggatacag 240
aaagttgggg atctgagctg ctaccaacat ctgtgtgtct ttgggtggct cattggtatc 300
ctctgcctat tggctttatc ttctgtacac tgaaaggaaa tggctggtcc ttagtcacct 360
acccaggtct tggatccata gcctacggat gtcccatttt tattgctttt tatattttgt 420
ctcccagtgt ctttttgagg attttttttt tttttttgca tcacttgctc ttcctctaag 480
aatctcctga cttcttgtac atgtgtctga tggtcagaat tttagcactg aagtatgggc 540
gtatttatca taattcaggt ttatatcctt tcagatatgg gctagggtct ggtattaggg 600
tgctcattaa aaaatgttga tttttgtcag tgtctagtga catcaatgca taatttaagg 660
ttctataaat tgaaagctaa cccaggagtg actcatcctc tcattgtttt caacttactt 720
atttctgatc acactgactt ccctgtggaa tacacgtggt tcactgtgtt ccaaagctta 780
acgagcagaa aaaggttatg ctcgtctctt cttgagaggt tttaagagaa taattgctaa 840
gctgtgaaaa acattttaac caagtgatct aattatgtag gaaacaagct atattgaaga 900
caactgcaat caaaatggag ccatctccct gatcttctcc ctgaaggagg aggtgggagc 960
cctggccaag gtgctgagac tgtttgagga gaatgatgtg aacctgaccc acattgagtc 1020
cagaccctcc agactgaaga aggatgagta tgagttcttc acccacctgg acaagagatc 1080
cctgcctgcc ctgaccaaca tcatcaagat cctgagacat gacattggag ccacagtgca 1140
tgagctgtcc agagacaaga agaaggacac agtgccctgg ttccccagaa ccatccagga 1200
gctggacaga tttgccaacc agatcctgtc ctatggagct gagctggatg ctgaccaccc 1260
tggcttcaag gaccctgtgt acagggccag aagaaagcag tttgctgaca ttgcctacaa 1320
ctacagacat ggccagccca tccccagagt ggagtacatg gaggaggaga agaagacctg 1380
gggcacagtg ttcaagaccc tgaagtccct gtacaagacc catgcctgct atgagtacaa 1440
ccacatcttc cccctgctgg agaagtactg tggcttccat gaggacaaca tcccccagct 1500
ggaggatgtg tcccagttcc tgcagacctg cacaggcttc agactgagac ctgtggctgg 1560
cctgctgtcc tccagagact tcctgggagg cctggccttc agagtgttcc actgcaccca 1620
gtacatcaga catggctcca agcccatgta cacccctgag cctgacatct gccatgagct 1680
gctgggccat gtgcccctgt tctctgacag atcctttgcc cagttctccc aggagattgg 1740
cctggcctcc ctgggagccc ctgatgagta cattgagaag ctggccacca tctactggtt 1800
cacagtggag tttggcctgt gcaagcaggg agactccatc aaggcctatg gagctggcct 1860
gctgtcctcc tttggagagc tgcagtactg cctgtctgag aagcccaagc tgctgcccct 1920
ggagctggag aagacagcca tccagaacta cacagtgaca gagttccagc ccctgtacta 1980
tgtggctgag tccttcaatg atgccaagga gaaggtcaga aactttgctg ccaccatccc 2040
cagacccttc tctgtgagat atgaccccta cacccagaga attgaggtgc tggacaacac 2100
ccagcagctg aagatcctgg ctgactccat caactctgag attggcatcc tgtgctctgc 2160
cctgcagaag atcaagtaa 2179
<210> 428
<211> 1588
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 428
atgtccacag ctgtgctgga gaaccctggc ctgggcagaa agctgtctga ctttggccag 60
gtgagccacg gcagcctgag ctgctcagtt aggggaattt gggcctccag agaaagagat 120
ccgaagactg ctggtgcttc ctggtttcat aagctcagta agaagtctga attcgttgga 180
agctgatgat agaagaaaga gttcatgctt gctttgtcca tggaggttta acaggaatga 240
attgctaaac tgtggaaaat gttttaaaca aatgcatctt atcctgtagg agacctccta 300
cattgaggac aactgcaacc agaatggagc catctccctg atcttctccc tgaaggagga 360
ggtgggagcc ctggccaagg tgctgagact gtttgaggag aatgatgtga acctgaccca 420
cattgagtcc agaccctcca gactgaagaa ggatgagtat gagttcttca cccacctgga 480
caagagatcc ctgcctgccc tgaccaacat catcaagatc ctgagacatg acattggagc 540
cacagtgcat gagctgtcca gagacaagaa gaaggacaca gtgccctggt tccccagaac 600
catccaggag ctggacagat ttgccaacca gatcctgtcc tatggagctg agctggatgc 660
tgaccaccct ggcttcaagg accctgtgta cagggccaga agaaagcagt ttgctgacat 720
tgcctacaac tacagacatg gccagcccat ccccagagtg gagtacatgg aggaggagaa 780
gaagacctgg ggcacagtgt tcaagaccct gaagtccctg tacaagaccc atgcctgcta 840
tgagtacaac cacatcttcc ccctgctgga gaagtactgt ggcttccatg aggacaacat 900
cccccagctg gaggatgtgt cccagttcct gcagacctgc acaggcttca gactgagacc 960
tgtggctggc ctgctgtcct ccagagactt cctgggaggc ctggccttca gagtgttcca 1020
ctgcacccag tacatcagac atggctccaa gcccatgtac acccctgagc ctgacatctg 1080
ccatgagctg ctgggccatg tgcccctgtt ctctgacaga tcctttgccc agttctccca 1140
ggagattggc ctggcctccc tgggagcccc tgatgagtac attgagaagc tggccaccat 1200
ctactggttc acagtggagt ttggcctgtg caagcaggga gactccatca aggcctatgg 1260
agctggcctg ctgtcctcct ttggagagct gcagtactgc ctgtctgaga agcccaagct 1320
gctgcccctg gagctggaga agacagccat ccagaactac acagtgacag agttccagcc 1380
cctgtactat gtggctgagt ccttcaatga tgccaaggag aaggtcagaa actttgctgc 1440
caccatcccc agacccttct ctgtgagata tgacccctac acccagagaa ttgaggtgct 1500
ggacaacacc cagcagctga agatcctggc tgactccatc aactctgaga ttggcatcct 1560
gtgctctgcc ctgcagaaga tcaagtaa 1588
<210> 429
<211> 1588
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 429
atgtccacag ctgtgctgga gaaccctggc ttgggcagga aactctctga ctttggacag 60
gtgagccacg gcagcctgag ctgctcagtt aggggaattt gggcctccag agaaagagat 120
ccgaagactg ctggtgcttc ctggtttcat aagctcagta agaagtctga attcgttgga 180
agctgatgat agaagaaaga gttcatgctt gctttgtcca tggaggttta acaggaatga 240
attgctaaac tgtggaaaat gttttaaaca aatgcatctt atcctgtagg aaacaagcta 300
tattgaagac aactgcaatc aaaatggagc catctccctg atcttctccc tgaaggagga 360
ggtgggagcc ctggccaagg tgctgagact gtttgaggag aatgatgtga acctgaccca 420
cattgagtcc agaccctcca gactgaagaa ggatgagtat gagttcttca cccacctgga 480
caagagatcc ctgcctgccc tgaccaacat catcaagatc ctgagacatg acattggagc 540
cacagtgcat gagctgtcca gagacaagaa gaaggacaca gtgccctggt tccccagaac 600
catccaggag ctggacagat ttgccaacca gatcctgtcc tatggagctg agctggatgc 660
tgaccaccct ggcttcaagg accctgtgta cagggccaga agaaagcagt ttgctgacat 720
tgcctacaac tacagacatg gccagcccat ccccagagtg gagtacatgg aggaggagaa 780
gaagacctgg ggcacagtgt tcaagaccct gaagtccctg tacaagaccc atgcctgcta 840
tgagtacaac cacatcttcc ccctgctgga gaagtactgt ggcttccatg aggacaacat 900
cccccagctg gaggatgtgt cccagttcct gcagacctgc acaggcttca gactgagacc 960
tgtggctggc ctgctgtcct ccagagactt cctgggaggc ctggccttca gagtgttcca 1020
ctgcacccag tacatcagac atggctccaa gcccatgtac acccctgagc ctgacatctg 1080
ccatgagctg ctgggccatg tgcccctgtt ctctgacaga tcctttgccc agttctccca 1140
ggagattggc ctggcctccc tgggagcccc tgatgagtac attgagaagc tggccaccat 1200
ctactggttc acagtggagt ttggcctgtg caagcaggga gactccatca aggcctatgg 1260
agctggcctg ctgtcctcct ttggagagct gcagtactgc ctgtctgaga agcccaagct 1320
gctgcccctg gagctggaga agacagccat ccagaactac acagtgacag agttccagcc 1380
cctgtactat gtggctgagt ccttcaatga tgccaaggag aaggtcagaa actttgctgc 1440
caccatcccc agacccttct ctgtgagata tgacccctac acccagagaa ttgaggtgct 1500
ggacaacacc cagcagctga agatcctggc tgactccatc aactctgaga ttggcatcct 1560
gtgctctgcc ctgcagaaga tcaagtaa 1588
<210> 430
<211> 1588
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 430
atgtccacag ctgtgctgga gaaccctggc ctgggcagaa agctgtctga ctttggccag 60
gtgagccagg gcagcctgag ctgctcagtt aggggaattt gggcctccag agaaagagat 120
ctgaagactg ctggtgcttc ctggtttcat aagctcagta agaagtctga attcattgga 180
agctgatgat agaagaaaga gttcatgctt gctttgtcca tggaggttta acaggaatga 240
attgctaaac tgtggaaaat gttttaaaca aatgcatctt atcctgtagg agacctccta 300
cattgaggac aactgcaacc agaatggagc catctccctg atcttctccc tgaaggagga 360
ggtgggagcc ctggccaagg tgctgagact gtttgaggag aatgatgtga acctgaccca 420
cattgagtcc agaccctcca gactgaagaa ggatgagtat gagttcttca cccacctgga 480
caagagatcc ctgcctgccc tgaccaacat catcaagatc ctgagacatg acattggagc 540
cacagtgcat gagctgtcca gagacaagaa gaaggacaca gtgccctggt tccccagaac 600
catccaggag ctggacagat ttgccaacca gatcctgtcc tatggagctg agctggatgc 660
tgaccaccct ggcttcaagg accctgtgta cagggccaga agaaagcagt ttgctgacat 720
tgcctacaac tacagacatg gccagcccat ccccagagtg gagtacatgg aggaggagaa 780
gaagacctgg ggcacagtgt tcaagaccct gaagtccctg tacaagaccc atgcctgcta 840
tgagtacaac cacatcttcc ccctgctgga gaagtactgt ggcttccatg aggacaacat 900
cccccagctg gaggatgtgt cccagttcct gcagacctgc acaggcttca gactgagacc 960
tgtggctggc ctgctgtcct ccagagactt cctgggaggc ctggccttca gagtgttcca 1020
ctgcacccag tacatcagac atggctccaa gcccatgtac acccctgagc ctgacatctg 1080
ccatgagctg ctgggccatg tgcccctgtt ctctgacaga tcctttgccc agttctccca 1140
ggagattggc ctggcctccc tgggagcccc tgatgagtac attgagaagc tggccaccat 1200
ctactggttc acagtggagt ttggcctgtg caagcaggga gactccatca aggcctatgg 1260
agctggcctg ctgtcctcct ttggagagct gcagtactgc ctgtctgaga agcccaagct 1320
gctgcccctg gagctggaga agacagccat ccagaactac acagtgacag agttccagcc 1380
cctgtactat gtggctgagt ccttcaatga tgccaaggag aaggtcagaa actttgctgc 1440
caccatcccc agacccttct ctgtgagata tgacccctac acccagagaa ttgaggtgct 1500
ggacaacacc cagcagctga agatcctggc tgactccatc aactctgaga ttggcatcct 1560
gtgctctgcc ctgcagaaga tcaagtaa 1588
<210> 431
<211> 1588
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 431
atgtccacag ctgtgctgga gaaccctggc ttgggcagga aactctctga ctttggacag 60
gtgagccagg gcagcctgag ctgctcagtt aggggaattt gggcctccag agaaagagat 120
ctgaagactg ctggtgcttc ctggtttcat aagctcagta agaagtctga attcattgga 180
agctgatgat agaagaaaga gttcatgctt gctttgtcca tggaggttta acaggaatga 240
attgctaaac tgtggaaaat gttttaaaca aatgcatctt atcctgtagg aaacaagcta 300
tattgaagac aactgcaatc aaaatggagc catctccctg atcttctccc tgaaggagga 360
ggtgggagcc ctggccaagg tgctgagact gtttgaggag aatgatgtga acctgaccca 420
cattgagtcc agaccctcca gactgaagaa ggatgagtat gagttcttca cccacctgga 480
caagagatcc ctgcctgccc tgaccaacat catcaagatc ctgagacatg acattggagc 540
cacagtgcat gagctgtcca gagacaagaa gaaggacaca gtgccctggt tccccagaac 600
catccaggag ctggacagat ttgccaacca gatcctgtcc tatggagctg agctggatgc 660
tgaccaccct ggcttcaagg accctgtgta cagggccaga agaaagcagt ttgctgacat 720
tgcctacaac tacagacatg gccagcccat ccccagagtg gagtacatgg aggaggagaa 780
gaagacctgg ggcacagtgt tcaagaccct gaagtccctg tacaagaccc atgcctgcta 840
tgagtacaac cacatcttcc ccctgctgga gaagtactgt ggcttccatg aggacaacat 900
cccccagctg gaggatgtgt cccagttcct gcagacctgc acaggcttca gactgagacc 960
tgtggctggc ctgctgtcct ccagagactt cctgggaggc ctggccttca gagtgttcca 1020
ctgcacccag tacatcagac atggctccaa gcccatgtac acccctgagc ctgacatctg 1080
ccatgagctg ctgggccatg tgcccctgtt ctctgacaga tcctttgccc agttctccca 1140
ggagattggc ctggcctccc tgggagcccc tgatgagtac attgagaagc tggccaccat 1200
ctactggttc acagtggagt ttggcctgtg caagcaggga gactccatca aggcctatgg 1260
agctggcctg ctgtcctcct ttggagagct gcagtactgc ctgtctgaga agcccaagct 1320
gctgcccctg gagctggaga agacagccat ccagaactac acagtgacag agttccagcc 1380
cctgtactat gtggctgagt ccttcaatga tgccaaggag aaggtcagaa actttgctgc 1440
caccatcccc agacccttct ctgtgagata tgacccctac acccagagaa ttgaggtgct 1500
ggacaacacc cagcagctga agatcctggc tgactccatc aactctgaga ttggcatcct 1560
gtgctctgcc ctgcagaaga tcaagtaa 1588
<210> 432
<211> 1588
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 432
atgagcaccg ccgtgctgga aaatcctggc ttgggcagga aactctctga ctttggacag 60
gtgagccagg gcagcctgag ctgctcagtt aggggaattt gggcctccag agaaagagat 120
ctgaagactg ctggtgcttc ctggtttcat aagctcagta agaagtctga attcattgga 180
agctgatgat agaagaaaga gttcatgctt gctttgtcca tggaggttta acaggaatga 240
attgctaaac tgtggaaaat gttttaaaca aatgcatctt atcctgtagg aaacaagcta 300
tattgaagac aactgcaatc aaaacggcgc catcagcctg atcttcagcc tgaaagaaga 360
agtgggcgcc ctggccaagg tgctgagact gttcgaagag aacgacgtga acctgacaca 420
catcgagagc agacccagca gactgaagaa ggacgagtac gagttcttca cccacctgga 480
caagcggagc ctgcctgctc tgaccaacat catcaagatc ctgcggcacg acatcggcgc 540
cacagtgcac gaactgagcc gggacaagaa aaaggacacc gtgccatggt tccccagaac 600
catccaagag ctggacagat tcgccaacca gatcctgagc tatggcgccg agctggacgc 660
tgatcaccct ggctttaagg accccgtgta ccgggccaga agaaagcagt ttgccgatat 720
cgcctacaac taccggcacg gccagcctat tcctcgggtc gagtacatgg aagaggaaaa 780
gaaaacctgg ggcaccgtgt tcaagaccct gaagtccctg tacaagaccc acgcctgcta 840
cgagtacaac cacatcttcc cactgctcga aaagtactgc ggcttccacg aggacaatat 900
ccctcagctt gaggacgtgt cccagttcct gcagacctgc accggcttta gactgaggcc 960
agttgccgga ctgctgagca gcagagattt tctcggcggc ctggccttca gagtgttcca 1020
ctgtacccag tacatcagac acggcagcaa gcccatgtac acccctgagc ctgatatctg 1080
ccacgagctg ctgggacatg tgcccctgtt cagcgataga agcttcgccc agttcagcca 1140
agagatcgga ctggcttctc tgggagcccc tgacgagtac attgagaagc tggccaccat 1200
ctactggttc accgtggaat tcggcctgtg caagcagggc gacagcatca aagcttatgg 1260
cgctggcctg ctgtctagct tcggcgagct gcagtactgt ctgagcgaga agcctaagct 1320
gctgcccctg gaactggaaa agaccgccat ccagaactac accgtgaccg agttccagcc 1380
tctgtactac gtggccgaga gcttcaacga cgccaaagaa aaagtgcgga acttcgccgc 1440
caccattcct cggcctttca gcgtcagata cgacccctac acacagcgga tcgaggtgct 1500
ggacaacaca cagcagctga aaattctggc cgactccatc aacagcgaga tcggcatcct 1560
gtgcagcgcc ctgcagaaaa tcaagtga 1588
<210> 433
<211> 2179
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 433
atgagcaccg ccgtgctgga aaatcctggc ttgggcagga aactctctga ctttggacag 60
gtaagcctgt tgggcttcca ctgctaggag agaattggtt ccccacatgt gaaagcagtc 120
tgggaaatgc tggtatttcc agtctcctaa ggctactaag aaatatgact ttatttagag 180
gccaggaaaa tgcccaggaa gtcaactgat gagtctagtc ttaacaagtt gaggatacag 240
aaagttgggg atctgagctg ctaccaacat ctgtgtgtct ttgggtggct cattggtatc 300
ctctgcctat tggctttatc ttctgtacac tgaaaggaaa tggctggtcc ttagtcacct 360
acccaggtct tggatccata gcctagggat gtcccatttt tattgctttt tatattttgt 420
ctcccagtgt ctttttgagg attttttttt tttttttgca tcacttgctc ttcctctaag 480
aatctcctga cttcttgtac atgtgtctga tggtcagaat tttagcactg aagtatgggc 540
ctatttatca taattcaggt ttatatcctt tcagatatgg gctagggtct ggtattaggg 600
tgctcattaa aaaatgttga tttttgtcag tgtctagtga catcaatgca taatttaagg 660
ttctataaat tgaaagctaa cccaggagtg actcatcctc tcattgtttt caacttactt 720
atttctgatc acactgactt ccctgtggaa tacacctggt tcactgtgtt ccaaagctta 780
aggagcagaa aaaggttatg ctcctctctt cttgagaggt tttaagagaa taattgctaa 840
gctgtgaaaa acattttaac caagtgatct aattatgtag gaaacaagct atattgaaga 900
caactgcaat caaaacggcg ccatcagcct gatcttcagc ctgaaagaag aagtgggcgc 960
cctggccaag gtgctgagac tgttcgaaga gaacgacgtg aacctgacac acatcgagag 1020
cagacccagc agactgaaga aggacgagta cgagttcttc acccacctgg acaagcggag 1080
cctgcctgct ctgaccaaca tcatcaagat cctgcggcac gacatcggcg ccacagtgca 1140
cgaactgagc cgggacaaga aaaaggacac cgtgccatgg ttccccagaa ccatccaaga 1200
gctggacaga ttcgccaacc agatcctgag ctatggcgcc gagctggacg ctgatcaccc 1260
tggctttaag gaccccgtgt accgggccag aagaaagcag tttgccgata tcgcctacaa 1320
ctaccggcac ggccagccta ttcctcgggt cgagtacatg gaagaggaaa agaaaacctg 1380
gggcaccgtg ttcaagaccc tgaagtccct gtacaagacc cacgcctgct acgagtacaa 1440
ccacatcttc ccactgctcg aaaagtactg cggcttccac gaggacaata tccctcagct 1500
tgaggacgtg tcccagttcc tgcagacctg caccggcttt agactgaggc cagttgccgg 1560
actgctgagc agcagagatt ttctcggcgg cctggccttc agagtgttcc actgtaccca 1620
gtacatcaga cacggcagca agcccatgta cacccctgag cctgatatct gccacgagct 1680
gctgggacat gtgcccctgt tcagcgatag aagcttcgcc cagttcagcc aagagatcgg 1740
actggcttct ctgggagccc ctgacgagta cattgagaag ctggccacca tctactggtt 1800
caccgtggaa ttcggcctgt gcaagcaggg cgacagcatc aaagcttatg gcgctggcct 1860
gctgtctagc ttcggcgagc tgcagtactg tctgagcgag aagcctaagc tgctgcccct 1920
ggaactggaa aagaccgcca tccagaacta caccgtgacc gagttccagc ctctgtacta 1980
cgtggccgag agcttcaacg acgccaaaga aaaagtgcgg aacttcgccg ccaccattcc 2040
tcggcctttc agcgtcagat acgaccccta cacacagcgg atcgaggtgc tggacaacac 2100
acagcagctg aaaattctgg ccgactccat caacagcgag atcggcatcc tgtgcagcgc 2160
cctgcagaaa atcaagtga 2179
<210> 434
<211> 2226
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 434
atgagcaccg ccgtgctgga aaatcctggc ttgggcagga aactctctga ctttggacag 60
gtgagccacg gcagcctgag ctgctcagtt aggggaattt gggcctccag agaaagagat 120
ccgaagactg ctggtgcttc ctggtttcat aagctcagta agaagtctga attcgttgga 180
agctgatgag aatatccagg aagtcaacag acaaatgtcc tcaacaattg tttctaagta 240
ggagaacatc tgtcctcggt ggctttcaca ggaatgaatg accattgctt tagggggttg 300
gggatctggc ctccagaact gccaccaatt agctgtgtgt ctttggacaa gttactgtcc 360
ctctctgttg tctgtttact cttctgtaca ctgaaggggt tccaatccag gtcttacgat 420
tcaaaagcct gtgcatgttc catttttagt actttccaca ctgtatttct caatgtcttt 480
ctgggacatt ttataaatca tattatatca cctctaagga tctttcagtt tgttatatat 540
gtgtctatta agttagattg tgagctccta aaagataaag cattgtctta ttcatcttta 600
aatttctcag agcccaaata gtgcctggaa cctagtagtt gctcaataaa aggtattgaa 660
tttacaggat tgaatggtga catcaatgaa taattgaaga ttccttaagc tgataactga 720
cccagtagca tcattgatca tttaattgcc ctggacttac ttattttcca ccacactaca 780
tatttctgta tagaatatat atagctcatt gtattgcaag atttaactag aagaaagagt 840
tcatgcttgc tttgtccatg gaggtttaac aggaatgaat tgctaaactg tggaaaatgt 900
tttaaacaaa tgcatcttat cctgtaggaa acaagctata ttgaagacaa ctgcaatcaa 960
aacggcgcca tcagcctgat cttcagcctg aaagaagaag tgggcgccct ggccaaggtg 1020
ctgagactgt tcgaagagaa cgacgtgaac ctgacacaca tcgagagcag acccagcaga 1080
ctgaagaagg acgagtacga gttcttcacc cacctggaca agcggagcct gcctgctctg 1140
accaacatca tcaagatcct gcggcacgac atcggcgcca cagtgcacga actgagccgg 1200
gacaagaaaa aggacaccgt gccatggttc cccagaacca tccaagagct ggacagattc 1260
gccaaccaga tcctgagcta tggcgccgag ctggacgctg atcaccctgg ctttaaggac 1320
cccgtgtacc gggccagaag aaagcagttt gccgatatcg cctacaacta ccggcacggc 1380
cagcctattc ctcgggtcga gtacatggaa gaggaaaaga aaacctgggg caccgtgttc 1440
aagaccctga agtccctgta caagacccac gcctgctacg agtacaacca catcttccca 1500
ctgctcgaaa agtactgcgg cttccacgag gacaatatcc ctcagcttga ggacgtgtcc 1560
cagttcctgc agacctgcac cggctttaga ctgaggccag ttgccggact gctgagcagc 1620
agagattttc tcggcggcct ggccttcaga gtgttccact gtacccagta catcagacac 1680
ggcagcaagc ccatgtacac ccctgagcct gatatctgcc acgagctgct gggacatgtg 1740
cccctgttca gcgatagaag cttcgcccag ttcagccaag agatcggact ggcttctctg 1800
ggagcccctg acgagtacat tgagaagctg gccaccatct actggttcac cgtggaattc 1860
ggcctgtgca agcagggcga cagcatcaaa gcttatggcg ctggcctgct gtctagcttc 1920
ggcgagctgc agtactgtct gagcgagaag cctaagctgc tgcccctgga actggaaaag 1980
accgccatcc agaactacac cgtgaccgag ttccagcctc tgtactacgt ggccgagagc 2040
ttcaacgacg ccaaagaaaa agtgcggaac ttcgccgcca ccattcctcg gcctttcagc 2100
gtcagatacg acccctacac acagcggatc gaggtgctgg acaacacaca gcagctgaaa 2160
attctggccg actccatcaa cagcgagatc ggcatcctgt gcagcgccct gcagaaaatc 2220
aagtga 2226
<210> 435
<211> 1359
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 435
atgtcaactg cagtgttaga gaacccaggc cttggtagaa agctttcaga ctttggacaa 60
gaaaccagct acattgaaga taactgcaac cagaatggtg ccatctccct gatcttcagc 120
ctgaaggaag aagtgggagc cctggccaag gtcctgaggc tctttgaaga gaatgatgtg 180
aacctcaccc acattgagtc cagacccagc aggctcaaga aggatgagta tgaattcttc 240
acccacctgg ataagaggtc cctccctgcc ctcaccaaca tcatcaagat cctgagacat 300
gacattgggg ccactgtcca tgaactgtcc agggacaaga agaaggacac tgtgccctgg 360
ttcccaagga ccatccagga actggacaga tttgccaacc aaatcctgtc ctatggtgct 420
gagctggatg ctgaccaccc tggattcaag gaccctgtgt acagagccag aaggaaacag 480
tttgcagaca ttgcctacaa ctacagacat gggcagccta tcccaagagt ggagtacatg 540
gaagaagaga agaaaacctg gggcactgtg ttcaagaccc ttaagtccct gtacaagacc 600
catgcctgct atgagtacaa ccacatcttc cccctgctgg agaagtactg tggcttccat 660
gaggacaaca tcccccagct ggaagatgtg tcccagttcc tccaaacttg cactgggttc 720
aggctgaggc ctgtggctgg cctgctgagc tccagagact tcttgggtgg actggccttc 780
agagtgttcc actgcaccca gtacatcaga catggctcca agcccatgta cacccctgag 840
cctgacatct gtcatgaact cctgggccat gtgcccttgt tcagtgacag aagctttgcc 900
cagttcagcc aggaaattgg ccttgcctcc ctgggagccc ctgatgagta cattgaaaag 960
ctagccacca tctactggtt cactgtggaa tttggcttgt gcaaacaggg agactccatc 1020
aaggcctatg gagctggact gctgtcctcc tttggggaac tgcagtactg cctctctgag 1080
aagcccaagc tcctgcccct ggaactggag aaaacagcca tccagaacta cactgtcact 1140
gagttccagc ccctctacta tgtggcagag agcttcaatg atgccaagga aaaagtcaga 1200
aactttgctg ccaccatccc aaggccattc tcagtcagat atgaccccta cacccaaagg 1260
attgaagtgc tggacaacac ccagcagctc aagatcttgg cagactccat aaactcagag 1320
attggaatcc tgtgctctgc cctgcaaaag attaagtaa 1359
<210> 436
<211> 1359
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 436
atgtcaactg ctgtgctgga aaaccctgga ttaggaagaa agctctcaga ctttggtcaa 60
gaaacctcct acattgagga caactgcaac cagaatggtg ccatctccct catcttctcc 120
ctgaaagagg aagtgggagc cctggccaag gtcctgaggc tctttgagga aaatgatgtc 180
aacctgaccc acattgagtc caggcccagc agactgaaga aggatgagta tgaattcttc 240
acccacctgg acaagagaag cctccctgcc ctcaccaaca tcatcaagat cctcagacat 300
gacattggag ccactgtgca tgaactcagc agagacaaga agaaggacac tgtgccatgg 360
ttccctagga ccatccagga actggatagg tttgccaacc aaatcctctc ctatggagca 420
gagctggatg cagaccaccc tggattcaag gacccagtgt acagggccag gaggaaacag 480
tttgcagaca ttgcctacaa ctacagacat ggccagccca tccctagagt ggagtacatg 540
gaagaagaga agaaaacctg gggcactgtg ttcaagaccc tgaagtccct gtacaagacc 600
catgcctgct atgagtacaa ccacatcttc cccctgctgg agaagtactg tggcttccat 660
gaggacaaca tcccccagct ggaagatgtg tcccagttcc tccaaacttg cactggattc 720
aggcttagac ctgtggctgg cctgttgagc agcagagact tcctgggagg gctggccttc 780
agagtgttcc actgtaccca gtacatcaga catggctcca agcccatgta cacccctgag 840
cctgacatct gccatgaatt gcttggccat gtgcccctgt tcagtgatag atcctttgcc 900
caattctccc aagaaattgg cctggccagc cttggagccc ctgatgagta cattgaaaag 960
cttgccacca tctactggtt cactgtggaa tttggcctgt gcaaacaggg ggactccata 1020
aaggcctatg gtgctggact gctgtcctcc tttggggaac tgcagtactg cttgtcagag 1080
aagcccaagt tgctgcccct ggaactggaa aagacagcca tccagaacta cactgtcact 1140
gagttccagc ccctctacta tgtggcagag agcttcaatg atgccaagga aaaagtcaga 1200
aactttgctg ccaccatccc aaggccattc tcagtcagat atgacccata cacccagagg 1260
attgaagtgc tggacaacac ccagcagctg aagatcctgg ctgactccat caactcagag 1320
attgggatcc tgtgctctgc cctccaaaag attaagtaa 1359
<210> 437
<211> 1359
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 437
atgtccactg ctgtccttga aaaccctggc cttggtagaa agctctctga ttttggacaa 60
gaaaccagct acattgagga caactgcaac cagaatggtg ccatctcact aatcttcagc 120
ctgaaggaag aagtgggagc cctggccaag gtcttgagac tctttgagga aaatgatgtc 180
aacctcaccc acattgagtc caggccatcc agactcaaga aggatgagta tgaattcttc 240
acccacctgg acaagaggtc cttgcctgcc ctcacaaaca tcatcaagat cctgagacat 300
gacattgggg ccactgtgca tgagctgtcc agagacaaga aaaaggacac tgtgccttgg 360
ttcccaagaa ccatccagga actggacaga tttgccaacc aaatcctgag ctatggggct 420
gagttggatg cagaccaccc tggattcaag gacccagtgt acagggccag gagaaagcag 480
tttgcagaca ttgcctacaa ctacagacat ggccagccca tcccaagggt ggagtacatg 540
gaagaggaaa agaaaacctg gggcactgtg ttcaagaccc tgaagtccct gtacaagacc 600
catgcctgct atgagtacaa ccacatcttc cccctcctgg aaaagtactg tggcttccat 660
gaggacaaca tcccccagct ggaagatgtg tcccagttcc tccaaacctg tactgggttc 720
aggctgaggc ctgtggctgg actgctgagc tccagggact tcctgggtgg actggccttc 780
agggtgttcc actgcaccca gtacatcaga catggatcca agcccatgta cacccctgag 840
cctgacattt gccatgaact gctgggccat gtgcccttgt tcagtgatag aagctttgcc 900
cagttctccc aagaaattgg cctggcctcc ctgggagccc ctgatgagta cattgaaaag 960
cttgccacca tctactggtt cactgtggaa tttggcctgt gcaaacaggg agactccatc 1020
aaggcctatg gagctgggct cctgagctcc tttggagagc tccagtactg cctgtcagag 1080
aagcccaagc tcctgcccct ggaacttgaa aagactgcca tccagaacta cactgtgact 1140
gagttccagc ccctgtacta tgtggcagag tccttcaatg atgccaagga aaaagtcaga 1200
aactttgctg ccaccatccc aagacccttc tctgtgagat atgaccccta cacccaaagg 1260
attgaagtcc tggacaacac ccagcagctg aagatcctgg cagacagcat caactcagag 1320
ataggcatcc tgtgctcagc cctccaaaag attaagtaa 1359
<210> 438
<211> 1359
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 438
atgagcactg ctgtccttga aaaccctggc cttggaagaa agctctctga ctttggacaa 60
gaaacctcct acattgagga caactgcaac cagaatggtg ccatctccct catcttctcc 120
ctgaaagagg aagtgggagc cctggccaag gtcctgaggc tctttgaaga gaatgatgtg 180
aacctcaccc acattgagtc cagacccagc aggctcaaga aagatgagta tgaattcttc 240
acccacctgg acaagagatc cttgcctgcc ctcaccaaca tcatcaagat cctgagacat 300
gacattggag ccactgtgca tgaactgtcc agggacaaga agaaggacac tgtgccctgg 360
ttcccaagga ccatccagga acttgacaga tttgccaacc aaatcctgtc ctatggtgct 420
gagctggatg cagaccaccc tggattcaag gacccagtgt acagagccag gagaaagcag 480
tttgctgaca tagcctacaa ctacagacat ggccagccca ttccaagagt ggagtacatg 540
gaagaagaga agaaaacctg ggggactgtg ttcaagaccc tgaagtccct gtacaagacc 600
catgcctgct atgagtacaa ccacatcttc cccctgctgg agaagtactg tggcttccat 660
gaggacaaca tcccccagct ggaagatgtg tcccagttcc tgcaaacttg cactgggttc 720
aggctcagac ctgtggctgg cttactgagc tccagggact tcctgggtgg actagccttc 780
agggtgttcc actgcaccca gtacatcaga catggctcca agcccatgta cacccctgag 840
cctgatatct gccatgaact gctgggccat gtgcccttgt tcagtgacag aagctttgcc 900
cagttctccc aagaaattgg ccttgcctcc ctgggggccc ctgatgagta cattgaaaag 960
ctggccacca tctactggtt cactgtggaa tttggcttgt gcaaacaggg agactccatc 1020
aaggcctatg gggcaggact gctgagcagc tttggagagc tgcagtactg cctgtcagag 1080
aagcccaagc tcctgcccct ggaactggaa aagactgcca tccagaacta cactgtcact 1140
gagttccagc ccctctacta tgtggcagag tccttcaatg atgccaagga aaaagtcagg 1200
aactttgcag ccacaatccc tagaccattc tcagtcagat atgacccata cacccagagg 1260
attgaagtgc tggacaacac ccagcagctc aagatcttgg ctgatagcat caactcagag 1320
attggaatcc tgtgttcagc cctccaaaag attaagtaa 1359
<210> 439
<211> 1359
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 439
atgtcaaccg ccgtgcttga aaatcctgga ctcggaagga aattgtcaga ctttggacaa 60
gaaacctcct atatcgagga caactgcaac cagaacggcg ccatctctct catcttttcg 120
ctgaaagaag aggtcggagc cctggccaag gtcctgagac tgttcgaaga gaatgacgtc 180
aacctcactc acatcgagtc ccgcccgtca cggctgaaga aagacgaata cgagttcttc 240
acccatctgg ataagcgctc gttgcctgcg ctgactaaca tcataaagat tctgcggcac 300
gacatcggcg cgactgtgca cgagctgagc cgggataaga agaaggacac tgtgccatgg 360
ttcccccgga ccattcaaga actggacaga ttcgcgaacc agattctgtc ctatggcgcc 420
gagctggacg ctgaccaccc cgggttcaag gaccctgtgt accgcgctag acgcaagcag 480
ttcgcagaca tcgcctacaa ctatcggcat gggcagccga ttccccgcgt cgagtacatg 540
gaagaagaga agaaaacctg gggtaccgtg ttcaagactc tgaagtcgct gtacaagacc 600
cacgcatgct acgagtacaa ccatatcttc ccgctcctcg agaagtactg cggtttccac 660
gaggataaca ttccccaatt ggaagatgtg tcccagttcc tgcaaacttg cacaggcttt 720
aggcttagac cggtggcggg cctcctgagc tcccgggatt tcctcggcgg actcgccttc 780
cgggtgttcc actgcactca gtacattcgg cacgggagca agccgatgta cacccccgaa 840
ccggatatct gtcatgaact tctgggacac gtgccactct tctccgaccg aagcttcgcg 900
cagttctccc aagaaatcgg actggcctcc ctgggtgccc ctgatgagta catcgaaaag 960
cttgccacca tctactggtt taccgtggag ttcggcctgt gcaaacaggg agacagcatc 1020
aaggcatacg gggccggcct gctgtcctcg ttcggagaac tgcagtactg cctgtcggag 1080
aagcccaagt tgctgcccct cgaactggag aaaacggcca tccagaacta caccgtgacc 1140
gagttccagc cgctgtacta cgtggccgaa agcttcaacg acgccaagga aaaggtccgc 1200
aactttgcgg ctaccatccc gaggcctttc tccgtgcgct acgacccata cactcagcgg 1260
atcgaagtgc tggataacac ccagcagctg aagatcctcg ccgactccat taactccgag 1320
attggaatcc tgtgttccgc tctgcaaaag attaagtga 1359
<210> 440
<211> 1359
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 440
atgtcaaccg ccgtgctcga gaaccctgga cttggaagaa aactgtcaga cttcggacaa 60
gagacttctt acatcgagga taactgcaac cagaatggcg cgatttcgct gatattcagc 120
ctgaaggaag aggtcggagc cctggccaag gtcctgcggc ttttcgagga aaacgacgtg 180
aacctgactc acatcgagtc ccggccgagc agactcaaga aggacgaata cgaattcttc 240
acccatctcg ataagcgctc gctgccggcg cttactaaca ttatcaagat cctgcgccac 300
gatatcggag ccaccgtgca tgaactgtcg agggataaga aaaaggatac cgtgccgtgg 360
ttcccgagga ccatccagga actggaccgc ttcgctaacc aaatcttgag ctatggcgcg 420
gaactcgacg ctgaccaccc cgggttcaag gatcccgtgt accgggccag acgcaagcag 480
ttcgcagaca ttgcctacaa ctatcgacac ggccagccta ttccacgggt ggagtacatg 540
gaagaagaga aaaagacctg gggcaccgtg ttcaagaccc tgaagtccct gtacaagact 600
cacgcctgct acgagtacaa ccacatcttc cctctgctcg aaaagtactg cgggttccat 660
gaggacaaca tccctcagct cgaggacgtg tcacagttcc tgcaaacgtg cactggcttt 720
cggctgaggc cggtggccgg tctgctgagc tcaagggatt ttctgggcgg actggcgttc 780
cgcgtgttcc actgcaccca gtatatccgc catggtagca agcccatgta cactccggag 840
cctgacattt gccacgaact actgggacac gtgccgttgt ttagcgaccg gtcgtttgcc 900
caattctccc aagaaatcgg actggcctcc ctgggggcgc cagacgagta cattgaaaag 960
ctcgcaacca tctactggtt caccgtggaa ttcggactgt gcaaacaggg cgattcgatc 1020
aaggcctacg gcgccgggct cctgtcctcc ttcggtgaac tgcagtactg tctgtccgag 1080
aagcccaagc tcctgcccct cgagcttgaa aagacagcta tccagaacta cactgtcacc 1140
gagttccagc cactctacta cgtggccgag tccttcaatg acgccaagga aaaagtccgg 1200
aacttcgcgg caaccattcc tagacccttc tccgtgcgct acgacccgta cacccagcgg 1260
atcgaagtgc tggacaacac ccagcagttg aagatcctgg ccgactccat caactccgaa 1320
atcggtattt tgtgttccgc cctgcaaaag attaagtga 1359
<210> 441
<211> 348
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 441
gatcttgcta ccagtggaac agccactaag gattctgcag tgagagcaga gggccagcta 60
agtggtactc tcccagagac tgtctgactc acgccacccc ctccaccttg gacacaggac 120
gctgtggttt ctgagccagg tacaatgact cctttcggta agtgcagtgg aagctgtaca 180
ctgcccaggc aaagcgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact 240
tagcccctgt ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct 300
cccccgttgc ccctctggat ccactgctta aatacggacg aggacagg 348
<210> 442
<211> 202
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 442
gtctgtctgc acatttcgta gagcgagtgt tccgatactc taatctccct aggcaaggtt 60
catatttgtg taggttactt attctccttt tgttgactaa gtcaataatc agaatcagca 120
ggtttggagt cagcttggca gggatcagca gcctgggttg gaaggagggg gtataaaagc 180
cccttcacca ggagaagccg tc 202
<210> 443
<211> 348
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 443
gatcttgcta ccagtggaac agccactaag gattctgcag tgagagcaga gggccagcta 60
agtggtactc tcccagagac tgtctgactc atgccacccc ctccaccttg gacacaggac 120
actgtggttt ctgagccagg tacaatgact ccttttggta agtgcagtgg aagctgtaca 180
ctgcccaggc aaagtgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact 240
tagcccctgt ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct 300
cccccgttgc ccctctggat ccactgctta aatacggacg aggacagg 348
<210> 444
<211> 348
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 444
gatcttgcta ccagtggaac agccactaag gattctgcag tgagagcaga gggccagcta 60
agtggtactc tcccagagac tgtctgactc acgccacccc ctccaccttg gacacaggac 120
gctgtggttt ctgagccagg tacaatgact cctttcggta agtgcagtgg aagctgtaca 180
ctgcccaggc aaagcgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact 240
tagcccctgt ttgctcctct gataactggg gtgaccttgg ttaatattca ccagcagcct 300
cccctgttgc ccctctggat ccactgctta aatacggaca aggacagg 348
<210> 445
<211> 348
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 445
gatcttgcta ccagtggaac agccactaag gattctgcag tgagagcaga gggccagcta 60
agtggtactc tcccagagac tgtctgactc acgccacccc ctccaccttg gacacaggac 120
gctgtggttt ctgagccagg tacaatgact cctttcggta agtgcagtgg aagctgtaca 180
ctgcccaggc aaagcgtctg ggcagcatag gcaggcgact cagatcccag ccagtggact 240
tagcccctgt ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct 300
cccccgttgc ccctctggat ccactgctta aatacggacg aggacagg 348
<210> 446
<211> 348
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 446
gatcttgcta ccagtggaac agccactaag gattctgcag tgagagcaga gggccagcta 60
agtggtactc tcccagagac tgtctgactc acgccacccc ctccaccttg gacacaggac 120
gctgtggttt ctgagccagg tacaatgact cctttcggta agtgcagtgg aagctgtaca 180
ctgcccaggc aaagcgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact 240
tagcccctgt ttgctcctct gataactggg gtgaccttgg ttaatattca ccagcagcct 300
cccccgttgc ccctctggat ccactgctta aatacagacg aggacagg 348
<210> 447
<211> 348
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 447
gatcttgcta ccagtggaac agccactaag gattctgcag tgagagcaga gggccagcta 60
agtggtactc tcccagagac tgtctgactc atgccacccc ctccaccttg gacacaggac 120
actgtggttt ctgagccagg tacaatgact ccttttggta agtgcagtgg aagctgtaca 180
ctgcccaggc aaagtgtctg ggcagcatag gcaggtgact cagatcccag ccagtggact 240
tagcccctgt ttgctcctct gataactggg gtgaccttgg ttaatattca ccagcagcct 300
cccctgttgc ccctctggat ccactgctta aatacagaca aggacagg 348
<210> 448
<211> 318
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 448
gattctgcag tgagagcaga gggccagcta agtggtactc tcccagagac tgtctgactc 60
acgccacccc ctccaccttg gacacaggac gctgtggttt ctgagccagg tacaatgact 120
cctttcggta agtgcagtgg aagctgtaca ctgcccaggc aaagcgtccg ggcagcgtag 180
gcgggcgact cagatcccag ccagtggact tagcccctgt ttgctcctcc gataactggg 240
gtgaccttgg ttaatattca ccagcagcct cccccgttgc ccctctggat ccactgctta 300
aatacggacg aggacagg 318
<210> 449
<211> 72
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 449
gggggaggct gctggtgaat attaaccaag gtcaccccag ttatcggagg agcaaacagg 60
ggctaagtcc ac 72
<210> 450
<211> 100
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 450
cactgggagg atgttgagta agatggaaaa ctactgatga cccttgcaga gacagagtat 60
taggacatgt ttgaacaggg gccgggcgat cagcaggtag 100
<210> 451
<211> 13
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 451
gttaatcatt aac 13
<210> 452
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 452
gcttgtactt tggtaca 17
<210> 453
<211> 770
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 453
aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60
ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120
tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180
cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240
tccaacatcc actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt 300
ggtttaggta gtgtgagagg gtccgggttc aaaaccactt gctgggtggg gagtcgtcag 360
taagtggcta tgccccgacc ccgaagcctg tttccccatc tgtacaatgg aaatgataaa 420
gacgcccatc tgatagggtt tttgtggcaa ataaacattt ggtttttttg ttttgttttg 480
ttttgttttt tgagatggag gtttgctctg tcgcccaggc tggagtgcag tgacacaatc 540
tcatctcacc acaaccttcc cctgcctcag cctcccaagt agctgggatt acaagcatgt 600
gccaccacac ctggctaatt ttctattttt agtagagacg ggtttctcca tgttggtcag 660
cctcagcctc ccaagtaact gggattacag gcctgtgcca ccacacccgg ctaatttttt 720
ctatttttga cagggacggg gtttcaccat gttggtcagg ctggtctaga 770
<210> 454
<211> 120
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 454
gcgagaactt gtgcctcccc gtgttcctgc tctttgtccc tctgtcctac ttagactaat 60
atttgccttg ggtactgcaa acaggaaatg ggggagggac aggagtaggg cggagggtag 120
<210> 455
<211> 770
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 455
aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60
ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120
tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180
cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240
tccaacatcc actcgacccc ttggaatttc agtggagagg agcagaggtt gtcctggtgt 300
ggtttaggta gtgtgagagg gtccaggttc aaaaccactt gctgggtggg gagttgtcag 360
taagtggcta tgccccgacc ccgaagcctg tttccccatc tgtacaatgg aaatgataaa 420
gacgcccatc tgatagggtt tttgtggcaa ataaacattt ggtttttttg ttttgttttg 480
ttttgttttt tgagatggag gtttgctctg tcgcccaggc tggagtgcag tgacacaatc 540
tcatctcacc acaaccttcc cctgcctcag cctcccaagt agctgggatt acaagcatgt 600
gccaccacac ctggctaatt ttctattttt agtagagacg ggtttctcca tgttggtcag 660
cctcagcctc ccaagtaact gggattacag gcctgtgcca ccacacccgg ctaatttttt 720
ctatttttga cagggacggg gtttcaccat gttggtcagg ctggtctaga 770
<210> 456
<211> 770
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 456
aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60
ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120
tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180
cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240
tccaacatcc acttgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt 300
ggtttaggta gtgtgagagg gtccgggttc aaaaccactt gctgggtggg gagtcgtcag 360
taagtggcta tgccccaacc ctgaagcctg tttccccatc tgtacaatgg aaatgataaa 420
gacccccatc tgatagggtt tttgtggcaa ataaacattt ggtttttttg ttttgttttg 480
ttttgttttt tgagatggag gtttgctctg tcgcccaggc tggagtgcag tgacacaatc 540
tcatctcacc acaaccttcc cctgcctcag cctcccaagt agctgggatt acaagcatgt 600
gccaccacac ctggctaatt ttctattttt agtagagacg ggtttctcca tgttggtcag 660
cctcagcctc ccaagtaact gggattacag gcctgtgcca ccacacccgg ctaatttttt 720
ctatttttga cagggacggg gtttcaccat gttggtcagg ctggtctaga 770
<210> 457
<211> 770
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 457
aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60
ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120
tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180
cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240
tccaacatcc actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt 300
ggtttaggta gtgtgagagg gtccgggttc aaaaccactt gctgggtggg gagtcgtcag 360
taagtggcta tgccccgacc ccgaagcctg tttccccatc tgtacaatgg aaatgataaa 420
gacgcccatc tgatagggtt tttgtggcaa ataaacattt ggtttttttg ttttgttttg 480
ttttgttttt tgagatggag gtttgctctg tggcccaggc tggagtgcag tgacacaatc 540
tcatctcacc acaaccttcc cctgcctcag cctcccaagt agctgggatt acaagcatgt 600
gccaccacac ctggctaatt ttctattttt agtagagatg ggtttctcca tgttggtcag 660
cctcagcctc ccaagtaact gggattacag gcctgtgcca ccacacctgg ctaatttttt 720
ctatttttga cagggatggg gtttcaccat gttggtcagg ctggtctaga 770
<210> 458
<211> 770
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 458
aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60
ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120
tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180
cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240
tccaacatcc acttgacccc ttggaatttc agtggagagg agcagaggtt gtcctggtgt 300
ggtttaggta gtgtgagagg gtccaggttc aaaaccactt gctgggtggg gagttgtcag 360
taagtggcta tgccccaacc ctgaagcctg tttccccatc tgtacaatgg aaatgataaa 420
gacccccatc tgatagggtt tttgtggcaa ataaacattt ggtttttttg ttttgttttg 480
ttttgttttt tgagatggag gtttgctctg tggcccaggc tggagtgcag tgacacaatc 540
tcatctcacc acaaccttcc cctgcctcag cctcccaagt agctgggatt acaagcatgt 600
gccaccacac ctggctaatt ttctattttt agtagagatg ggtttctcca tgttggtcag 660
cctcagcctc ccaagtaact gggattacag gcctgtgcca ccacacctgg ctaatttttt 720
ctatttttga cagggatggg gtttcaccat gttggtcagg ctggtctaga 770
<210> 459
<211> 117
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 459
ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc 60
tgaccttgga gctggggcag aggtcagaga cctctctggg cccatgccac ctccaac 117
<210> 460
<211> 90
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 460
gttaatcatt aacgcttgta ctttggtaca gttaatcatt aacgcttgta ctttggtaca 60
gttaatcatt aacgcttgta ctttggtaca 90
<210> 461
<211> 321
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 461
aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60
ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120
tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180
cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240
tccaacatcc actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt 300
ggtttaggta gtgtgagagg g 321
<210> 462
<211> 436
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 462
gttaatcatt aacgcttgta ctttggtaca gttaatcatt aacgcttgta ctttggtaca 60
gttaatcatt aacgcttgta ctttggtaca atcgatgcga gaacttgtgc ctccccgtgt 120
tcctgctctt tgtccctctg tcctacttag actaatattt gccttgggta ctgcaaacag 180
gaaatggggg agggacagga gtagggcgga gggtagttaa gaatgtggat ccccgtctgt 240
ctgcacattt cgtagagcga gtgttccgat actctaatct ccctaggcaa ggttcatatt 300
tgtgtaggtt acttattctc cttttgttga ctaagtcaat aatcagaatc agcaggtttg 360
gagtcagctt ggcagggatc agcagcctgg gttggaagga gggggtataa aagccccttc 420
accaggagaa gccgtc 436
<210> 463
<211> 773
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 463
gttaatcatt aacgcttgta ctttggtaca gttaatcatt aacgcttgta ctttggtaca 60
gttaatcatt aacgcttgta ctttggtaca atcgatgcga gaacttgtgc ctccccgtgt 120
tcctgctctt tgtccctctg tcctacttag actaatattt gccttgggta ctgcaaacag 180
gaaatggggg agggacagga gtagggcgga gggtagttaa gaatgtcaat tggggggagg 240
ctgctggtga atattaacca aggtcacccc agttatcgga ggagcaaaca ggggctaagt 300
ccaccggggg aggctgctgg tgaatattaa ccaaggtcac cccagttatc ggaggagcaa 360
acaggggcta agtccaccgg gggaggctgc tggtgaatat taaccaaggt caccccagtt 420
atcggaggag caaacagggg ctaagtccac ggtacccact gggaggatgt tgagtaagat 480
ggaaaactac tgatgaccct tgcagagaca gagtattagg acatgtttga acaggggccg 540
ggcgatcagc aggtagcact agaggatccc cgtctgtctg cacatttcgt agagcgagtg 600
ttccgatact ctaatctccc taggcaaggt tcatatttgt gtaggttact tattctcctt 660
ttgttgacta agtcaataat cagaatcagc aggtttggag tcagcttggc agggatcagc 720
agcctgggtt ggaaggaggg ggtataaaag ccccttcacc aggagaagcc gtc 773
<210> 464
<211> 431
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 464
aacaggttag tttgactagc gttaatcatt aacgttaatc attaacgtta atcattaacg 60
ttaatcatta acgttaatca ttaacatcga tgcgagaact tgtgcctccc cgtgttcctg 120
ctctttgtcc ctctgtccta cttagactaa tatttgcctt gggtactgca aacaggaaat 180
gggggaggga caggagtagg gcggagggta gttaagaatg tggatccccg tctgtctgca 240
catttcgtag agcgagtgtt ccgatactct aatctcccta ggcaaggttc atatttgtgt 300
aggttactta ttctcctttt gttgactaag tcaataatca gaatcagcag gtttggagtc 360
agcttggcag ggatcagcag cctgggttgg aaggaggggg tataaaagcc ccttcaccag 420
gagaagccgt c 431
<210> 465
<211> 768
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 465
aacaggttag tttgactagc gttaatcatt aacgttaatc attaacgtta atcattaacg 60
ttaatcatta acgttaatca ttaacatcga tgcgagaact tgtgcctccc cgtgttcctg 120
ctctttgtcc ctctgtccta cttagactaa tatttgcctt gggtactgca aacaggaaat 180
gggggaggga caggagtagg gcggagggta gttaagaatg tcaattgggg ggaggctgct 240
ggtgaatatt aaccaaggtc accccagtta tcggaggagc aaacaggggc taagtccacc 300
gggggaggct gctggtgaat attaaccaag gtcaccccag ttatcggagg agcaaacagg 360
ggctaagtcc accgggggag gctgctggtg aatattaacc aaggtcaccc cagttatcgg 420
aggagcaaac aggggctaag tccacggtac ccactgggag gatgttgagt aagatggaaa 480
actactgatg acccttgcag agacagagta ttaggacatg tttgaacagg ggccgggcga 540
tcagcaggta gcactagagg atccccgtct gtctgcacat ttcgtagagc gagtgttccg 600
atactctaat ctccctaggc aaggttcata tttgtgtagg ttacttattc tccttttgtt 660
gactaagtca ataatcagaa tcagcaggtt tggagtcagc ttggcaggga tcagcagcct 720
gggttggaag gagggggtat aaaagcccct tcaccaggag aagccgtc 768
<210> 466
<211> 540
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 466
gttaatcatt aacgcttgta ctttggtaca gttaatcatt aacgcttgta ctttggtaca 60
gttaatcatt aacgcttgta ctttggtaca atcgatgcga gaacttgtgc ctccccgtgt 120
tcctgctctt tgtccctctg tcctacttag actaatattt gccttgggta ctgcaaacag 180
gaaatggggg agggacagga gtagggcgga gggtagcccg gggattctgc agtgagagca 240
gagggccagc taagtggtac tctcccagag actgtctgac tcacgccacc ccctccacct 300
tggacacagg acgctgtggt ttctgagcca ggtacaatga ctcctttcgg taagtgcagt 360
ggaagctgta cactgcccag gcaaagcgtc cgggcagcgt aggcgggcga ctcagatccc 420
agccagtgga cttagcccct gtttgctcct ccgataactg gggtgacctt ggttaatatt 480
caccagcagc ctcccccgtt gcccctctgg atccactgct taaatacgga cgaggacagg 540
<210> 467
<211> 624
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 467
agcaacagat cattctatgg gttaatcatt aacaacaggt taggcttgta ctttggtaca 60
ttggctccta gttaatcatt aacttagcaa tgtgcttgta ctttggtaca tagttaccta 120
gttaatcatt aacaaacagt atggcttgta ctttggtaca agcaacagat cattctatgg 180
gcgagaactt gtgcctcccc gtgttcctgc tctttgtccc tctgtcctac ttagactaat 240
atttgccttg ggtactgcaa acaggaaatg ggggagggac aggagtaggg cggagggtag 300
caattggatt ctgcagtgag agcagagggc cagctaagtg gtactctccc agagactgtc 360
tgactcacgc caccccctcc accttggaca caggacgctg tggtttctga gccaggtaca 420
atgactcctt tcggtaagtg cagtggaagc tgtacactgc ccaggcaaag cgtccgggca 480
gcgtaggcgg gcgactcaga tcccagccag tggacttagc ccctgtttgc tcctccgata 540
actggggtga ccttggttaa tattcaccag cagcctcccc cgttgcccct ctggatccac 600
tgcttaaata cggacgagga cagg 624
<210> 468
<211> 951
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 468
aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60
ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120
tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180
cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240
tccaacatcc actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt 300
ggtttaggta gtgtgagagg gcttaagagc aacagatcat tctatgggtt aatcattaac 360
aacaggttag gcttgtactt tggtacattg gctcctagtt aatcattaac ttagcaatgt 420
gcttgtactt tggtacatag ttacctagtt aatcattaac aaacagtatg gcttgtactt 480
tggtacaagc aacagatcat tctatgggcg agaacttgtg cctccccgtg ttcctgctct 540
ttgtccctct gtcctactta gactaatatt tgccttgggt actgcaaaca ggaaatgggg 600
gagggacagg agtagggcgg agggtagcaa ttggattctg cagtgagagc agagggccag 660
ctaagtggta ctctcccaga gactgtctga ctcacgccac cccctccacc ttggacacag 720
gacgctgtgg tttctgagcc aggtacaatg actcctttcg gtaagtgcag tggaagctgt 780
acactgccca ggcaaagcgt ccgggcagcg taggcgggcg actcagatcc cagccagtgg 840
acttagcccc tgtttgctcc tccgataact ggggtgacct tggttaatat tcaccagcag 900
cctcccccgt tgcccctctg gatccactgc ttaaatacgg acgaggacag g 951
<210> 469
<211> 535
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 469
aacaggttag tttgactagc gttaatcatt aacgttaatc attaacgtta atcattaacg 60
ttaatcatta acgttaatca ttaacatcga tgcgagaact tgtgcctccc cgtgttcctg 120
ctctttgtcc ctctgtccta cttagactaa tatttgcctt gggtactgca aacaggaaat 180
gggggaggga caggagtagg gcggagggta gcccggggat tctgcagtga gagcagaggg 240
ccagctaagt ggtactctcc cagagactgt ctgactcacg ccaccccctc caccttggac 300
acaggacgct gtggtttctg agccaggtac aatgactcct ttcggtaagt gcagtggaag 360
ctgtacactg cccaggcaaa gcgtccgggc agcgtaggcg ggcgactcag atcccagcca 420
gtggacttag cccctgtttg ctcctccgat aactggggtg accttggtta atattcacca 480
gcagcctccc ccgttgcccc tctggatcca ctgcttaaat acggacgagg acagg 535
<210> 470
<211> 579
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 470
agcaacagat cattctatgg gttaatcatt aacaacaggt taggttaatc attaacttgg 60
ctcctagtta atcattaaca aacagtatgg ttaatcatta acaaattctg gggttaatca 120
ttaactagtt acctagcgag aacttgtgcc tccccgtgtt cctgctcttt gtccctctgt 180
cctacttaga ctaatatttg ccttgggtac tgcaaacagg aaatggggga gggacaggag 240
tagggcggag ggtagcaatt ggattctgca gtgagagcag agggccagct aagtggtact 300
ctcccagaga ctgtctgact cacgccaccc cctccacctt ggacacagga cgctgtggtt 360
tctgagccag gtacaatgac tcctttcggt aagtgcagtg gaagctgtac actgcccagg 420
caaagcgtcc gggcagcgta ggcgggcgac tcagatccca gccagtggac ttagcccctg 480
tttgctcctc cgataactgg ggtgaccttg gttaatattc accagcagcc tcccccgttg 540
cccctctgga tccactgctt aaatacggac gaggacagg 579
<210> 471
<211> 906
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 471
aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60
ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120
tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180
cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240
tccaacatcc actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt 300
ggtttaggta gtgtgagagg gcttaagagc aacagatcat tctatgggtt aatcattaac 360
aacaggttag gttaatcatt aacttggctc ctagttaatc attaacaaac agtatggtta 420
atcattaaca aattctgggg ttaatcatta actagttacc tagcgagaac ttgtgcctcc 480
ccgtgttcct gctctttgtc cctctgtcct acttagacta atatttgcct tgggtactgc 540
aaacaggaaa tgggggaggg acaggagtag ggcggagggt agcaattgga ttctgcagtg 600
agagcagagg gccagctaag tggtactctc ccagagactg tctgactcac gccaccccct 660
ccaccttgga cacaggacgc tgtggtttct gagccaggta caatgactcc tttcggtaag 720
tgcagtggaa gctgtacact gcccaggcaa agcgtccggg cagcgtaggc gggcgactca 780
gatcccagcc agtggactta gcccctgttt gctcctccga taactggggt gaccttggtt 840
aatattcacc agcagcctcc cccgttgccc ctctggatcc actgcttaaa tacggacgag 900
gacagg 906
<210> 472
<211> 286
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 472
gggggaggct gctggtgaat attaaccaag gtcaccccag ttatcggagg agcaaacagg 60
ggctaagtcc acacgcgtgg taccgtctgt ctgcacattt cgtagagcga gtgttccgat 120
actctaatct ccctaggcaa ggttcatatt tgtgtaggtt acttattctc cttttgttga 180
ctaagtcaat aatcagaatc agcaggtttg gagtcagctt ggcagggatc agcagcctgg 240
gttggaagga gggggtataa aagccccttc accaggagaa gccgtc 286
<210> 473
<211> 541
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 473
gggggaggct gctggtgaat attaaccaag gtcaccccag ttatcggagg agcaaacagg 60
ggctaagtcc accgggggag gctgctggtg aatattaacc aaggtcaccc cagttatcgg 120
aggagcaaac aggggctaag tccaccgggg gaggctgctg gtgaatatta accaaggtca 180
ccccagttat cggaggagca aacaggggct aagtccacgg tacccactgg gaggatgttg 240
agtaagatgg aaaactactg atgacccttg cagagacaga gtattaggac atgtttgaac 300
aggggccggg cgatcagcag gtagctctag aggatccccg tctgtctgca catttcgtag 360
agcgagtgtt ccgatactct aatctcccta ggcaaggttc atatttgtgt aggttactta 420
ttctcctttt gttgactaag tcaataatca gaatcagcag gtttggagtc agcttggcag 480
ggatcagcag cctgggttgg aaggaggggg tataaaagcc ccttcaccag gagaagccgt 540
c 541
<210> 474
<211> 452
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 474
cggtacgcgg gggaggctgc tggtgaatat taaccaaggt caccccagtt atcggaggag 60
caaacagggg ctaagtccac cgggggaggc tgctggtgaa tattaaccaa ggtcacccca 120
gttatcggag gagcaaacag gggctaagtc caccggggga ggctgctggt gaatattaac 180
caaggtcacc ccagttatcg gaggagcaaa caggggctaa gtccactgta caacgcgtga 240
attcgctagc gtctgtctgc acatttcgta gagcgagtgt tccgatactc taatctccct 300
aggcaaggtt catatttgtg taggttactt attctccttt tgttgactaa gtcaataatc 360
agaatcagca ggtttggagt cagcttggca gggatcagca gcctgggttg gaaggagggg 420
gtataaaagc cccttcacca ggagaagccg tc 452
<210> 475
<211> 1125
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 475
aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60
ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120
tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180
cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240
tccaacatcc actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt 300
ggtttaggta gtgtgagagg gtccgggttc aaaaccactt gctgggtggg gagtcgtcag 360
taagtggcta tgccccgacc ccgaagcctg tttccccatc tgtacaatgg aaatgataaa 420
gacgcccatc tgatagggtt tttgtggcaa ataaacattt ggtttttttg ttttgttttg 480
ttttgttttt tgagatggag gtttgctctg tcgcccaggc tggagtgcag tgacacaatc 540
tcatctcacc acaaccttcc cctgcctcag cctcccaagt agctgggatt acaagcatgt 600
gccaccacac ctggctaatt ttctattttt agtagagacg ggtttctcca tgttggtcag 660
cctcagcctc ccaagtaact gggattacag gcctgtgcca ccacacccgg ctaatttttt 720
ctatttttga cagggacggg gtttcaccat gttggtcagg ctggtctaga ggtactggat 780
cttgctacca gtggaacagc cactaaggat tctgcagtga gagcagaggg ccagctaagt 840
ggtactctcc cagagactgt ctgactcacg ccaccccctc caccttggac acaggacgct 900
gtggtttctg agccaggtac aatgactcct ttcggtaagt gcagtggaag ctgtacactg 960
cccaggcaaa gcgtccgggc agcgtaggcg ggcgactcag atcccagcca gtggacttag 1020
cccctgtttg ctcctccgat aactggggtg accttggtta atattcacca gcagcctccc 1080
ccgttgcccc tctggatcca ctgcttaaat acggacgagg acagg 1125
<210> 476
<400> 476
000
<210> 477
<400> 477
000
<210> 478
<211> 541
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 478
gggggaggct gctggtgaat attaaccaag gtcaccccag ttatcggagg agcaaacagg 60
ggctaagtcc accgggggag gctgctggtg aatattaacc aaggtcaccc cagttatcgg 120
aggagcaaac aggggctaag tccaccgggg gaggctgctg gtgaatatta accaaggtca 180
ccccagttat cggaggagca aacaggggct aagtccacgg tacccactgg gaggatgttg 240
agtaagatgg aaaactactg atgacccttg cagagacaga gtattaggac atgtttgaac 300
aggggccggg cgatcagcag gtagcactag aggatccccg tctgtctgca catttcgtag 360
agcgagtgtt ccgatactct aatctcccta ggcaaggttc atatttgtgt aggttactta 420
ttctcctttt gttgactaag tcaataatca gaatcagcag gtttggagtc agcttggcag 480
ggatcagcag cctgggttgg aaggaggggg tataaaagcc ccttcaccag gagaagccgt 540
c 541
<210> 479
<211> 1125
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 479
aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60
ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120
tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180
cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240
tccaacatcc acttgacccc ttggaatttc agtggagagg agcagaggtt gtcctggtgt 300
ggtttaggta gtgtgagagg gtccaggttc aaaaccactt gctgggtggg gagttgtcag 360
taagtggcta tgccccaacc ctgaagcctg tttccccatc tgtacaatgg aaatgataaa 420
gacccccatc tgatagggtt tttgtggcaa ataaacattt ggtttttttg ttttgttttg 480
ttttgttttt tgagatggag gtttgctctg tggcccaggc tggagtgcag tgacacaatc 540
tcatctcacc acaaccttcc cctgcctcag cctcccaagt agctgggatt acaagcatgt 600
gccaccacac ctggctaatt ttctattttt agtagagatg ggtttctcca tgttggtcag 660
cctcagcctc ccaagtaact gggattacag gcctgtgcca ccacacctgg ctaatttttt 720
ctatttttga cagggatggg gtttcaccat gttggtcagg ctggtctaga ggtactggat 780
cttgctacca gtggaacagc cactaaggat tctgcagtga gagcagaggg ccagctaagt 840
ggtactctcc cagagactgt ctgactcatg ccaccccctc caccttggac acaggacact 900
gtggtttctg agccaggtac aatgactcct tttggtaagt gcagtggaag ctgtacactg 960
cccaggcaaa gtgtctgggc agcataggca ggtgactcag atcccagcca gtggacttag 1020
cccctgtttg ctcctctgat aactggggtg accttggtta atattcacca gcagcctccc 1080
ctgttgcccc tctggatcca ctgcttaaat acagacaagg acagg 1125
<210> 480
<211> 3990
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 480
gtccaagcca ctctaaaggg caatctggca gcactttgtg aaattaagag tgcatgttcc 60
ctatgattca taatagcacc actcttctat cccagaaaat ttctacccca ggcctataag 120
ggaagaaaga taaggaaatt tatcacagta ttgtttgggg tggtgaaaaa ttagcaatga 180
cttagatgtc cataactgga aaataaagaa gtcaagtgtg gcaaatacac actgggatat 240
tctgaaccat ttagaaaagc aaagaactag atacatattc agcagcatgg ctggatccta 300
agaacacagt tgaaagaaaa aagaaactat gaaatctata gtacatccat agattgtagt 360
aaatctatag tgccacatca catatccatg aaaaatacat atacgcacaa acatttctat 420
gtattttaca agttcaaggc taaacatcat attagagaag ttgcctctgg ggaaaggcag 480
tgagagtgag gaattatgat aaaagagaat gaataaaaaa acaagagaag ggtcatgtag 540
gttttgtttc tgtgccatga actcatggat tatgattaac tcaaccttct gcacatgaag 600
ataaacaaga aagaactgat aaacctgcaa tggttgggta atcttcaact tccaaatcag 660
caaaggtcag ctctaagttt gccaagtaca caacttctca tcttgtgaca tgttccccac 720
ctctgtgcag tgttaaaaaa tacctcagtg gtctactgac tgactgtgga tgcttcttct 780
agatgtgcct ttttttcctc catttcctta gcacccagca ctgctctcat tatagcagca 840
cattgcattc caaccaaatt gaacaaaaag gtggcttaaa aatcatctgc aagtttatgg 900
cacaagcaat ctcttatttt tatcttagtg cataaataaa tttttccttt ttgccagaat 960
aatttttttt aaagaagcga ttagtttttc ttctctcaga tagcaatgat gtgctttcct 1020
ctcaacctag atttagggca tttttatgtg agataggatt aaaaattcca tttttgtaca 1080
accactatgg agaacagttt ggcagttccc caaaaaacta aaaatagagc tactatatga 1140
tctagtgatc ccactgctgg gtatatacct ataagaaagg aaatcagtat atcaaagaga 1200
tgtctgttct tttatgtttg ttgcagcact gttcacaata gccaagatct ggaagcaacc 1260
caagtctcca tcaacatggg ttttaaaaaa atgtggtact ttaatacaca atggagtact 1320
attcagcaat aaaaaagaat gagatcctgt tatttgcaat aacatggaca gaactggagg 1380
tcattatgtc aaatgaaata agccaggcac agaaagccaa acatcacata ttctcactca 1440
tatgtggggt ctaaaaatca aaacaatctg attcatggag ctagagagta gagagctaat 1500
taccagaggt ggggaagggt agtaggggcc tggaggggag gtggagatgg ttaataggta 1560
caaaaaaata tagaaagaat gaataagacc tagtatttga tagtacaaca gggcgaatat 1620
agtcaaaata atttaattat acatttaaaa atacctgaaa gagtataatt ggcttgtttg 1680
caacacaaaa gataaatgct tgaggggatg gatgccccat tttcaatgat gtgattatta 1740
cacattgcat gcctgtatca aaatattgca catactccat gaatgcatac atctactatg 1800
ttcccacaaa aattaaacat tagaaaaaag agttgcattt tcagctgtta tggggagaag 1860
aaagaaaagc tatcattttg ttgtcctaaa aattatgttg tcctcatttc aaacaggaaa 1920
gcaaaagtat ttgagagcca gtgcagtgcc ttggtgttgg gtgaaacata gattgaattt 1980
gggccatttg tttaaacttc ctaggcctca gtttcttgcc tattaaaagg gagtgcatag 2040
ttcatgggat tgttaagagg aagaagtgaa accatgcacg tggagagcgt ggcacagtgt 2100
ctaagacaga gtgtgcatgc aaataagtag ataatattct ttgcttttct ttattgcatg 2160
cctgtaatat ttttggagtt gtcacattca ttgccctcaa gtagcatcaa gggatgaaat 2220
tatgtttgta agaaaatcct gaggctgagg aatacaacat gttttatgtc tactacactg 2280
aaaaatgccg gagtcagata aagaatacag attctcctga ggatggaaat caagatcttc 2340
gccttcaata tttaacaaca ttgagcttcc aacttactat gggaaatatt catcaggccc 2400
ctaaaggttc cttttggaca gaaattgcac ttgttatatc tgtattctta gcagacagta 2460
gacagcctgg cacatcataa aggcttaagg aatcctaaat atcccttaaa attctcattt 2520
taaagacaaa aacaaaacaa aaaaaaaaaa caaaaaaaaa ctgaggcatg ggcttgacca 2580
aatcagtggt agaaccaaga gttaaaccac ttgttttgaa tcctaaacct gagttttatt 2640
ttacttattt atttatttat ttgtttattt attttcagat gcttggtcaa agaacagtgg 2700
gaggagaggg atgggcttcc agcaaccttt attattggct tattttctta cagcccatta 2760
ctttctcttg ggaaaatatt aagcaggcac tcaaggcttg aggcccctga gttttcacat 2820
cctttctgaa cctctgaacc tgctttccag cattctttta tactttgttt tacctcctgg 2880
tcagtaatgc ctcaccctca gtcttctcta aaagtgtggt taatggcatc ttcctgacta 2940
tttgaagacc actggccaaa tcccaccagc tcactcatag accatccccc tactttactt 3000
tcttcaaaag acttagccct acctaaactt atttatatgt ttattttctg cccaccagaa 3060
tggcagcata gctggggagg cagagtctgt tttgttcatt gctgtattcc caaagactag 3120
aacaccacca agcacacggt acaggtctca gtaattattg tcaaatttat gtggatttgc 3180
ttttaaacaa tatcttccat ttactgagtg tttatgtgga agaactgtac taaattttaa 3240
tgcatttctt tattcctatt cttaaaacct tccagcaagg tggctctacc accctctttt 3300
ccgagcttca ggagcagttg tgcgaatagc tggagaacac caggctggat ttaaacccag 3360
atcgctctta catttgctct ttacctgctg tgctcagcgt tcacgtgccc tctagctgta 3420
gttttctgaa gtcagcgcac agcaaggcag tgtgcttaga ggttaacaga agggaaaaca 3480
acaacaacaa aaatctaaat gagaatcctg actgtttcag ctgggggtaa ggggggcgga 3540
ttattcatat aattgttata ccagacggtc gcaggcttag tccaattgca gagaactcgc 3600
ttcccaggct tctgagagtc ccggaagtgc ctaaacctgt ctaatcgacg gggcttgggt 3660
ggcccgtcgc tccctggctt cttcccttta cccagggcgg gcagcgaagt ggtgcctcct 3720
gcgtccccca caccctccct cagcccctcc cctccggccc gtcctgggca ggtgacctgg 3780
agcatccggc aggctgccct ggcctcctgc gtcaggacaa cgcccacgag gggcgttact 3840
gtgcggagat gcaccacgca agagacaccc tttgtaactc tcttctcctc cctagtgcga 3900
ggttaaaacc ttcagcccca cgtgctgttt gcaaacctgc ctgtacctga ggccctaaaa 3960
agccagagac ctcactcccg gggagccagc 3990
<210> 481
<211> 3983
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 481
gtccaagcca ctctaaaggg caatctggca gcactttgtg aaattaagag tgcatgttcc 60
ctatgattca taatagcacc actcttctat cccagaaaat ttctacccca ggcctataag 120
ggaagaaaga taaggaaatt tatcacagta ttgtttgggg tggtgaaaaa ttagcaatga 180
cttagatgtc cataactgga aaataaagaa gtcaagtgtg gcaaatacac actgggatat 240
tctgaaccat ttagaaaagc aaagaactag atacatattc agcagcatgg ctggatccta 300
agaacacagt tgaaagaaaa aagaaactat gaaatctata gtacatccat agattgtagt 360
aaatctatag tgccacatca catatccatg aaaaatacat atacgcacaa acatttctat 420
gtattttaca agttcaaggc taaacatcat attagagaag ttgcctctgg ggaaaggcag 480
tgagagtgag gaattatgat aaaagagaat gaataaaaaa acaagagaag ggtcatgtag 540
gttttgtttc tgtgccatga actcatggat tatgattaac tcaaccttct gcacatgaag 600
ataaacaaga aagaactgat aaacctgcaa tggttgggta atcttcaact tccaaatcag 660
caaaggtcag ctctaagttt gccaagtaca caacttctca tcttgtgaca tgttccccac 720
ctctgtgcag tgttaaaaaa tacctcagtg gtctactgac tgactgtgga tgcttcttct 780
agatgtgcct ttttttcctc catttcctta gcacccagca ctgctctcat tatagcagca 840
cattgcattc caaccaaatt gaacaaaaag gtggcttaaa aatcatctgc aagtttatgg 900
cacaagcaat ctcttatttt tatcttagtg cataaataaa tttttccttt ttgccagaat 960
aatttttttt aaagaagcga ttagtttttc ttctctcaga tagcaatgat gtgctttcct 1020
ctcaacctag atttagggca tttttatgtg agataggatt aaaaattcca tttttgtaca 1080
accactatgg agaacagttt ggcagttccc caaaaaacta aaaatagagc tactatatga 1140
tctagtgatc ccactgctgg gtatatacct ataagaaagg aaatcagtat atcaaagaga 1200
tgtctgttct tttatgtttg ttgcagcact gttcacaata gccaagatct ggaagcaacc 1260
caagtctcca tcaacatggg ttttaaaaaa atgtggtact ttaatacaca atggagtact 1320
attcagcaat aaaaaagaat gagatcctgt tatttgcaat aacatggaca gaactggagg 1380
tcattatgtc aaatgaaata agccaggcac agaaagccaa acatcacata ttctcactca 1440
tatgtggggt ctaaaaatca aaacaatctg attcatggag ctagagagta gagagctaat 1500
taccagaggt ggggaagggt agtaggggcc tggaggggag gtggagatgg ttaataggta 1560
caaaaaaata tagaaagaat gaataagacc tagtatttga tagtacaaca gggcgaatat 1620
agtcaaaata atttaattat acatttaaaa atacctgaaa gagtataatt ggcttgtttg 1680
caacacaaaa gataaatgct tgaggggatg gatgccccat tttcaatgat gtgattatta 1740
cacattgcat gcctgtatca aaatattgca catactccat gaatgcatac atctactatg 1800
ttcccacaaa aattaaacat tagaaaaaag agttgcattt tcagctgtta tggggagaag 1860
aaagaaaagc tatcattttg ttgtcctaaa aattatgttg tcctcatttc aaacaggaaa 1920
gcaaaagtat ttgagagcca gtgcagtgcc ttggtgttgg gtgaaacata gattgaattt 1980
gggccatttg tttaaacttc ctaggcctca gtttcttgcc tattaaaagg gagtgcatag 2040
ttcatgggat tgttaagagg aagaagtgaa accatgcacg tggagagcgt ggcacagtgt 2100
ctaagacaga gtgtgcatgc aaataagtag ataatattct ttgcttttct ttattgcatg 2160
cctgtaatat ttttggagtt gtcacattca ttgccctcaa gtagcatcaa gggatgaaat 2220
tatgtttgta agaaaatcct gaggctgagg aatacaacat gttttatgtc tactacactg 2280
aaaaatgccg gagtcagata aagaatacag attctcctga ggatggaaat caagatcttc 2340
gccttcaata tttaacaaca ttgagcttcc aacttactat gggaaatatt catcaggccc 2400
ctaaaggttc cttttggaca gaaattgcac ttgttatatc tgtattctta gcagacagta 2460
gacagcctgg cacatcataa aggcttaagg aatcctaaat atcccttaaa attctcattt 2520
taaagacaaa aacaaaacaa aaaaaaaaaa caaaaaaaaa ctgaggcatg ggcttgacca 2580
aatcagtggt agaaccaaga gttaaaccac ttgttttgaa tcctaaacct gagttttatt 2640
ttacttattt atttatttat ttgtttattt attttcagat gcttggtcaa agaacagtgg 2700
gaggagaggg atgggcttcc agcaaccttt attattggct tattttctta cagcccatta 2760
ctttctcttg ggaaaatatt aagcaggcac tcaaggcttg aggcccctga gttttcacat 2820
cctttctgaa cctctgaacc tgctttccag cattctttta tactttgttt tacctcctgg 2880
tcagtaatgc ctcaccctca gtcttctcta aaagtgtggt taatggcatc ttcctgacta 2940
tttgaagacc actggccaaa tcccaccagc tcactcatag accatccccc tactttactt 3000
tcttcaaaag acttagccct acctaaactt atttatatgt ttattttctg cccaccagaa 3060
tggcagcata gctggggagg cagagtctgt tttgttcatt gctgtattcc caaagactag 3120
aacaccacca agcacacggt acaggtctca gtaattattg tcaaatttat gtggatttgc 3180
ttttaaacaa tatcttccat ttactgagtg tttatgtgga agaactgtac taaattttaa 3240
tgcatttctt tattcctatt cttaaaacct tccagcaagg tggctctacc accctctttt 3300
ccgagcttca ggagcagttg tgcgaatagc tggagaacac caggctggat ttaaacccag 3360
atcgctctta catttgctct ttacctgctg tgctcagcgt tcacgtgccc tctagctgta 3420
gttttctgaa gtcagcgcac agcaaggcag tgtgcttaga ggttaacaga agggaaaaca 3480
acaacaacaa aaatctaaat gagaatcctg actgtttcag ctgggggtaa ggggggcgga 3540
ttattcatat aattgttata ccagacggtc gcaggcttag tccaattgca gagaactcgc 3600
ttcccaggct tctgagagtc ccggaagtgc ctaaacctgt ctaatcgacg gggcttgggt 3660
ggcccgtcgc tccctggctt cttcccttta cccagggcgg gcagcgaagt ggtgcctcct 3720
gcgtccccca caccctccct cagcccctcc cctccggccc gtcctgggca ggtgacctgg 3780
agcatccggc aggctgccct ggcctcctgc gtcaggacaa cgcccacgag gggcgttact 3840
gtgcggagat gcaccacgca agagacaccc tttgtaactc tcttctcctc cctagtgcga 3900
ggttaaaacc ttcagcccca cgtgctgttt gcaaacctgc ctgtacctga ggccctaaaa 3960
agccagagac ctcactcccg ggg 3983
<210> 482
<211> 129
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 482
acacagatcc acaagctcct gaagaggtaa gggtttaagg gatggttggt tggtggggta 60
ttaatgttta attacctgga gcacctgcct gaaatcactt tttttcaggt tggtttaaac 120
gccgccacc 129
<210> 483
<211> 130
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 483
acacagatcc acaagctcct gaagaggtaa gggtttaagg gatggttggt tggtggggta 60
ttaatgttta attacctgga gcacctgcct gaaatcactt tttttcaggt tgggtttaaa 120
cgccgccacc 130
<210> 484
<211> 129
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 484
acacagatcc acaagctcct gaagaggtaa gggtttaagg gatggttggt tggtggggta 60
ttaatgttta attacctgga gcacctgcct gaaatcactt tttttcaggt tgggttaaac 120
gccgccacc 129
<210> 485
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 485
gccctgtctc ctcagcttca ggcaccacca ctgacctggg acagtgaat 49
<210> 486
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 486
acacagatcc acaagctcct gaagaggttg gtttaaacgc cgccacc 47
<210> 487
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 487
catttcgtgg gctaagttta agctactctc gctccgggat aagagtttca 50
<210> 488
<400> 488
000
<210> 489
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 489
gggacatcgt agagagtcgt actta 25
<210> 490
<211> 162
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 490
gccctgtctc ctcagcttca ggcaccacca ctgacctggg acagtgaata attactctaa 60
ggtaaatata aaatttttaa gtgtataatg tgttaaacta ctgattctaa ttgtttctct 120
cttttagatt ccaacctttg gaactgagtt taaacagcca cc 162
<210> 491
<211> 165
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 491
gccctgtctc ctcagcttca ggcaccacca ctgacctggg acagtgaata attactctaa 60
ggtaaatata aaatttttaa gtgtataatg tgttaaacta ctgattctaa ttgtttctct 120
cttttagatt ccaacctttg gaactgagtt taaaccgcag ccacc 165
<210> 492
<211> 164
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 492
gccctgtctc ctcagcttca ggcaccacca ctgacctggg acagtgaata attactctaa 60
ggtaaatata aaatttttaa gtgtataatg tgttaaacta ctgattctaa ttgtttctct 120
cttttagatt ccaacctttg gaactgagtt taaacgccgc cacc 164
<210> 493
<211> 230
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 493
gccctgtctc ctcagcttca ggcaccacca ctgacctggg acagtgaata attactctaa 60
ggtaaatata aaatttttaa gtgtataatg tgttaaacta ctgattctaa ttgtttctct 120
cttttagatt ccaacctttg gaactgagtt taaacgggac atcgtagaga gtcgtactta 180
catttcgtgg gctaagttta agctactctc gctccgggat aagagtttca 230
<210> 494
<211> 150
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 494
gccctgtctc ctcagcttca ggcaccacca ctgacctggg acagtgaata attactctaa 60
ggtaaatata aaatttttaa gtgtataatg tgttaaacta ctgattctaa ttgtttctct 120
cttttagatt ccaacctttg gaactgaacc 150
<210> 495
<211> 135
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 495
acacagatcc acaagctcct gtctagaaag aggtaagggt ttaagggatg gttggttggt 60
ggggtattaa tgtttaatta cctggagcac ctgcctgaaa tcactttttt tcaggttggt 120
ttaaacgccg ccacc 135
<210> 496
<211> 136
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 496
acacagatcc acaagctcct gtctagaaag aggtaagggt ttaagggatg gttggttggt 60
ggggtattaa tgtttaatta cctggagcac ctgcctgaaa tcactttttt tcaggttggg 120
tttaaacgcc gccacc 136
<210> 497
<211> 135
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 497
acacagatcc acaagctcct gtctagaaag aggtaagggt ttaagggatg gttggttggt 60
ggggtattaa tgtttaatta cctggagcac ctgcctgaaa tcactttttt tcaggttggg 120
ttaaacgccg ccacc 135
<210> 498
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 498
acacagatcc acaagctcct g 21
<210> 499
<211> 67
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 499
gccctgtctc ctcagcttca ggcaccacca ctgacctggg acagtgaatg tttaaaccgc 60
agccacc 67
<210> 500
<211> 131
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 500
acacagatcc acaagctcct gaagaggtaa gggtttaagg gatggttggt tggtggggta 60
ttaatgttta attacctgga gcacctgcct gaaatcactt tttttcaggt tgggtttaaa 120
ccgcagccac c 131
<210> 501
<211> 195
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 501
acacagatcc acaagctcct gaagaggtaa gggtttaagg gatggttggt tggtggggta 60
ttaatgttta attacctgga gcacctgcct gaaatcactt tttttcaggt tggtttaaac 120
gggacatcgt agagagtcgt acttacattt cgtgggctaa gtttaagcta ctctcgctcc 180
gggataagag tttca 195
<210> 502
<211> 130
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 502
acacagatcc acaagctcct gaagaggtaa gggtttaagg gatggttggt tggtggggta 60
ttaatgttta attacctgga gcacctgcct gaaatcactt tttttcaggt tgggttaaac 120
cgcagccacc 130
<210> 503
<211> 130
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 503
acacagatcc acaagctcct gaagaggtaa gggtttaagg gatggttggt tggtggggta 60
ttaatgttta attacctgga gcacctgcct gaaatcactt tttttcaggt tggtttaaac 120
cgcagccacc 130
<210> 504
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 504
acacagatcc acaagctcct gaagaggttg gtttaaaccg cagccacc 48
<210> 505
<211> 137
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 505
acacagatcc acaagctcct gtctagaaag aggtaagggt ttaagggatg gttggttggt 60
ggggtattaa tgtttaatta cctggagcac ctgcctgaaa tcactttttt tcaggttggg 120
tttaaaccgc agccacc 137
<210> 506
<211> 136
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 506
acacagatcc acaagctcct gtctagaaag aggtaagggt ttaagggatg gttggttggt 60
ggggtattaa tgtttaatta cctggagcac ctgcctgaaa tcactttttt tcaggttggg 120
ttaaaccgca gccacc 136
<210> 507
<211> 136
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 507
acacagatcc acaagctcct gtctagaaag aggtaagggt ttaagggatg gttggttggt 60
ggggtattaa tgtttaatta cctggagcac ctgcctgaaa tcactttttt tcaggttggt 120
ttaaaccgca gccacc 136
<210> 508
<211> 66
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 508
gccctgtctc ctcagcttca ggcaccacca ctgacctggg acagtgaatg tttaaacgcc 60
gccacc 66
<210> 509
<211> 867
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 509
gtgagccagg gcagcctgag ctgctcagtt aggggaattt gggcctccag agaaagagat 60
cccaagactg ctggtgcttc ctggtttcat aagctcagta agaagtctga attggttgga 120
agctgatgag aatatccagg aagtcaacag acaaatgtcc tcaacaattg tttctaagta 180
ggagaacatc tgtcctgggt ggctttcaca ggaatgaatg accattgctt tagggggttg 240
gggatctggc ctccagaact gccaccaatt agctgtgtgt ctttggacaa gttactgtcc 300
ctctctgttg tctgtttact cttctgtaca ctgaaggggt tccaatccag gtcttaggat 360
tcaaaagcct gtgcatgttc catttttagt actttccaca ctgtatttct caatgtcttt 420
ctgggacatt ttataaatca tattatatca cctctaagga tctttcagtt tgttatatat 480
gtgtctatta agttagattg tgagctccta aaagataaag cattgtctta ttcatcttta 540
aatttctcag agcccaaata gtgcctggaa cctagtagtt gctcaataaa aggtattgaa 600
tttacaggat tgaatggtga catcaatgaa taattgaaga ttccttaagc tgataactga 660
cccagtagca tcattgatca tttaattgcc ctggacttac ttattttcca ccacactaca 720
tatttctgta tagaatatat atagctcatt gtattgcaag atttaactag aagaaagagt 780
tcatgcttgc tttgtccatg taggtttaac aggaatgaat tgctaaactg tggaaaatgt 840
tttaaacaaa tgcatcttat cctgtag 867
<210> 510
<211> 867
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 510
gtgagccacg gcagcctgag ctgctcagtt aggggaattt gggcctccag agaaagagat 60
ccgaagactg ctggtgcttc ctggtttcat aagctcagta agaagtctga attcgttgga 120
agctgatgag aatatccagg aagtcaacag acaaatgtcc tcaacaattg tttctaagta 180
ggagaacatc tgtcctcggt ggctttcaca ggaatgaatg accattgctt tagggggttg 240
gggatctggc ctccagaact gccaccaatt agctgtgtgt ctttggacaa gttactgtcc 300
ctctctgttg tctgtttact cttctgtaca ctgaaggggt tccaatccag gtcttacgat 360
tcaaaagcct gtgcatgttc catttttagt actttccaca ctgtatttct caatgtcttt 420
ctgggacatt ttataaatca tattatatca cctctaagga tctttcagtt tgttatatat 480
gtgtctatta agttagattg tgagctccta aaagataaag cattgtctta ttcatcttta 540
aatttctcag agcccaaata gtgcctggaa cctagtagtt gctcaataaa aggtattgaa 600
tttacaggat tgaatggtga catcaatgaa taattgaaga ttccttaagc tgataactga 660
cccagtagca tcattgatca tttaattgcc ctggacttac ttattttcca ccacactaca 720
tatttctgta tagaatatat atagctcatt gtattgcaag atttaactag aagaaagagt 780
tcatgcttgc tttgtccatg gaggtttaac aggaatgaat tgctaaactg tggaaaatgt 840
tttaaacaaa tgcatcttat cctgtag 867
<210> 511
<211> 229
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 511
gtgagccagg gcagcctgag ctgctcagtt aggggaattt gggcctccag agaaagagat 60
cccaagactg ctggtgcttc ctggtttcat aagctcagta agaagtctga attggttgga 120
agctgatgat agaagaaaga gttcatgctt gctttgtcca tggaggttta acaggaatga 180
attgctaaac tgtggaaaat gttttaaaca aatgcatctt atcctgtag 229
<210> 512
<211> 2000
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 512
gtgagccagg gcagcctgag ctgctcagtt aggggaattt gggcctccag agaaagagat 60
cccaagactg ctggtgcttc ctggtttcat aagctcagta agaagtctga attggttgga 120
agctgatgag aatatccagg aagtcaacag acaaatgtcc tcaacaattg tttctaagta 180
ggagaacatc tgtcctgggt ggctttcaca ggaatgaatg accattgctt tagggggttg 240
gggatctggc ctccagaact gccaccaatt agctgtgtgt ctttggacaa gttactgtcc 300
ctctctgttg tctgtttact cttctgtaca ctgaaggggc tggtccctaa tgatctggga 360
tgggatgtgg aatccttcta gatttctttt gtaatattta taaagtgctc tcagcaaggt 420
atcaaaatgg caaaattgtg agtaactatc ctcctttcat tttgggaaga agatgaggca 480
tgaagagaat tcagacagaa acttactcag accaggggag gcagaaacta agcagagagg 540
aaaatgacca agagttagcc ctgggcatgg aatgtgaaag aaccctaaag gtgacttgga 600
aataatgccc aaggtatatt ccattctcct ggatttgttg gcattttctt gaggtgaaga 660
attgcagaat acattcttta atgtgaccta catatttacc catgtgagga agtctgctcc 720
tggactcttg agattcagtc ataaagccca ggccagggaa ataatgtaag tctgcaggcc 780
cctgtcatca gtaggattag ggagaagagt tctcagtaga aaacagggag gctggagaga 840
aaagaatggt taatgttaag gttaatataa ctagaaagac tgcagaactt aggactgatt 900
tttatttgaa tccttaaaaa aaaaaatttc ttatgaaaat agtacatggc tcttaggaga 960
cagaacttat tgtacagagg aacagtgtga gagtcagagt gaattttatg tattattttt 1020
ggacttaggc taatgattta gcaaactctg gaatgtcagc cctaacccca accttggttt 1080
tctgtcacat gcatgtagta agtgctagat cctggacatt ctttgagatt tagtttaaga 1140
ctaagtttat tttctgatag gttatttgtg tactttcatg gattttgtaa ctctttttca 1200
acaattggat gtctcagatc tcagcatatg ggagcaagtt aatgcttcct gagatctttg 1260
ccaaaggtca agaggtcatt tttgtgtatt tataattttc catcattttt atatacttct 1320
caatattctt tttaaactat tcttttcctt ttttcatcct ctgaatactg ttttgacaga 1380
tcttgttatt agcatgcttt cagggatgag aaaactaaga aagctgaatg atttgcccaa 1440
agtagtccac ctggaaaatg aaagagagag gattccaatc caggtcttag gattcaaaag 1500
cctgtgcatg ttccattttt agtactttcc acactgtatt tctcaatgtc tttctgggac 1560
attttataaa tcatattata tcacctctaa ggatctttca gtttgttata tatgtgtcta 1620
ttaagttaga ttgtgagctc ctaaaagata aagcattgtc ttattcatct ttaaatttct 1680
cagagcccaa atagtgcctg gaacctagta gttgctcaat aaaaggtatt gaatttacag 1740
gattgaatgg tgacatcaat gaataattga agattcctta agctgataac tgacccagta 1800
gcatcattga tcatttaatt gccctggact tacttatttt ccaccacact acatatttct 1860
gtatagaata tatatagctc attgtattgc aagatttaac tagaagaaag agttcatgct 1920
tgctttgtcc atgtaggttt aacaggaatg aattgctaaa ctgtggaaaa tgttttaaac 1980
aaatgcatct tatcctgtag 2000
<210> 513
<211> 820
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 513
gtaagcctgt tgggcttcca ctgctaggag agaattggtt ccccacatgt gaaagcagtc 60
tgggaaatgc tggtatttcc agtctcctaa ggctactaag aaatatgact ttatttagag 120
gcgaggaaaa tgcccaggaa gtcaactgat gagtctagtc ttaacaagtt gaggatacag 180
aaagttgggg atctgagctg ctaccaacat ctgtgtgtct ttgggtggct cattggtatc 240
ctctgcctat tggctttatc ttctgtacac tgaaaggaaa tggctggtcc ttagtcacct 300
acccaggtct tggatccata gcctacggat gtcccatttt tattgctttt tatattttgt 360
ctcccagtgt ctttttgagg attttttttt tttttttgca tcacttgctc ttcctctaag 420
aatctcctga cttcttgtac atgtgtctga tggtcagaat tttagcactg aagtatgggc 480
gtatttatca taattcaggt ttatatcctt tcagatatgg gctagggtct ggtattaggg 540
tgctcattaa aaaatgttga tttttgtcag tgtctagtga catcaatgca taatttaagg 600
ttctataaat tgaaagctaa cccaggagtg actcatcctc tcattgtttt caacttactt 660
atttctgatc acactgactt ccctgtggaa tacacgtggt tcactgtgtt ccaaagctta 720
acgagcagaa aaaggttatg ctcgtctctt cttgagaggt tttaagagaa taattgctaa 780
gctgtgaaaa acattttaac caagtgatct aattatgtag 820
<210> 514
<211> 820
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 514
gtaagcctgt tgggcttcca ctgctaggag agaattggtt ccccacatgt gaaagcagtc 60
tgggaaatgc tggtatttcc agtctcctaa ggctactaag aaatatgact ttatttagag 120
gccaggaaaa tgcccaggaa gtcaactgat gagtctagtc ttaacaagtt gaggatacag 180
aaagttgggg atctgagctg ctaccaacat ctgtgtgtct ttgggtggct cattggtatc 240
ctctgcctat tggctttatc ttctgtacac tgaaaggaaa tggctggtcc ttagtcacct 300
acccaggtct tggatccata gcctagggat gtcccatttt tattgctttt tatattttgt 360
ctcccagtgt ctttttgagg attttttttt tttttttgca tcacttgctc ttcctctaag 420
aatctcctga cttcttgtac atgtgtctga tggtcagaat tttagcactg aagtatgggc 480
ctatttatca taattcaggt ttatatcctt tcagatatgg gctagggtct ggtattaggg 540
tgctcattaa aaaatgttga tttttgtcag tgtctagtga catcaatgca taatttaagg 600
ttctataaat tgaaagctaa cccaggagtg actcatcctc tcattgtttt caacttactt 660
atttctgatc acactgactt ccctgtggaa tacacctggt tcactgtgtt ccaaagctta 720
aggagcagaa aaaggttatg ctcctctctt cttgagaggt tttaagagaa taattgctaa 780
gctgtgaaaa acattttaac caagtgatct aattatgtag 820
<210> 515
<211> 229
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 515
gtgagccacg gcagcctgag ctgctcagtt aggggaattt gggcctccag agaaagagat 60
ccgaagactg ctggtgcttc ctggtttcat aagctcagta agaagtctga attcgttgga 120
agctgatgat agaagaaaga gttcatgctt gctttgtcca tggaggttta acaggaatga 180
attgctaaac tgtggaaaat gttttaaaca aatgcatctt atcctgtag 229
<210> 516
<211> 229
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 516
gtgagccagg gcagcctgag ctgctcagtt aggggaattt gggcctccag agaaagagat 60
ctgaagactg ctggtgcttc ctggtttcat aagctcagta agaagtctga attcattgga 120
agctgatgat agaagaaaga gttcatgctt gctttgtcca tggaggttta acaggaatga 180
attgctaaac tgtggaaaat gttttaaaca aatgcatctt atcctgtag 229
<210> 517
<211> 225
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 517
tgtgccttct agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct 60
ggaaggtgcc actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct 120
gagtaggtgt cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg 180
ggaagacaat agcaggcatg ctggggatgc ggtgggctct atggc 225
<210> 518
<211> 581
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 518
gagcatctta ccgccattta ttcccatatt tgttctgttt ttcttgattt gggtatacat 60
ttaaatgtta ataaaacaaa atggtggggc aatcatttac atttttaggg atatgtaatt 120
actagttcag gtgtattgcc acaagacaaa catgttaaga aactttcccg ttatttacgc 180
tctgttcctg ttaatcaacc tctggattac aaaatttgtg aaagattgac tgatattctt 240
aactatgttg ctccttttac gctgtgtgga tatgctgctt tatagcctct gtatctagct 300
attgcttccc gtacggcttt cgttttctcc tccttgtata aatcctggtt gctgtctctt 360
ttagaggagt tgtggcccgt tgtccgtcaa cgtggcgtgg tgtgctctgt gtttgctgac 420
gcaaccccca ctggctgggg cattgccacc acctgtcaac tcctttctgg gactttcgct 480
ttccccctcc cgatcgccac ggcagaactc atcgccgcct gccttgcccg ctgctggaca 540
ggggctaggt tgctgggcac tgataattcc gtggtgttgt c 581
<210> 519
<211> 222
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 519
cagacatgat aagatacatt gatgagtttg gacaaaccac aactagaatg cagtgaaaaa 60
aatgctttat ttgtgaaatt tgtgatgcta ttgctttatt tgtaaccatt ataagctgca 120
ataaacaagt taacaacaac aattgcattc attttatgtt tcaggttcag ggggagatgt 180
gggaggtttt ttaaagcaag taaaacctct acaaatgtgg ta 222
<210> 520
<211> 395
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 520
taaaatacag catagcaaaa ctttaacctc caaatcaagc ctctacttga atccttttct 60
gagggatgaa taaggcatag gcatcagggg ctgttgccaa tgtgcattag ctgtttgcag 120
cctcaccttc tttcatggag tttaagatat agtgtatttt cccaaggttt gaactagctc 180
ttcatttctt tatgttttaa atgcactgac ctcccacatt ccctttttag taaaatattc 240
agaaataatt taaatacatc attgcaatga aaataaatgt tttttattag gcagaatcca 300
gatgctcaag gcccttcata atatccccca gtttagtagt tggacttagg gaacaaagga 360
acctttaata gaaattggac agcaagaaag cgagc 395
<210> 521
<211> 107
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 521
gctcgctttc ttgctgtcca atttctatta aaggttcctt tgttccctaa gtccaactac 60
taaactgggg gatattatga agggccttga gcatctggat tctgcct 107
<210> 522
<211> 395
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 522
gctcgctttc ttgctgtcca atttctatta aaggttcctt tgttccctaa gtccaactac 60
taaactgggg gatattatga agggccttga gcatctggat tctgcctaat aaaaaacatt 120
tattttcatt gcaatgatgt atttaaatta tttctgaata ttttactaaa aagggaatgt 180
gggaggtcag tgcatttaaa acataaagaa atgaagagct agttcaaacc ttgggaaaat 240
acactatatc ttaaactcca tgaaagaagg tgaggctgca aacagctaat gcacattggc 300
aacagcccct gatgcctatg ccttattcat ccctcagaaa aggattcaag tagaggcttg 360
atttggaggt taaagttttg ctatgctgta tttta 395
<210> 523
<211> 107
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 523
gcttgctttc ttgctgtcca atttctatta aaggttcctt tgttccctaa gtccaactac 60
taaactgggg gatattatga agggccttga gcatctggat tctgcct 107
<210> 524
<211> 395
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 524
gcttgctttc ttgctgtcca atttctatta aaggttcctt tgttccctaa gtccaactac 60
taaactgggg gatattatga agggccttga gcatctggat tctgcctaat aaaaaacatt 120
tattttcatt gcaatgatgt atttaaatta tttctgaata ttttactaaa aagggaatgt 180
gggaggtcag tgcatttaaa acataaagaa atgaagagct agttcaaacc ttgggaaaat 240
acactatatc ttaaactcca tgaaagaagg tgaggctgca aacagctaat gcacattggc 300
aacagcccct gatgcctatg ccttattcat ccctcagaaa aggattcaag tagaggcttg 360
atttggaggt taaagttttg ctatgctgta tttta 395
<210> 525
<211> 395
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 525
taaaatacag catagcaaaa ctttaacctc caaatcaagc ctctacttga atccttttct 60
gagggatgaa taaggcatag gcatcagggg ctgttgccaa tgtgcattag ctgtttgcag 120
cctcaccttc tttcatggag tttaagatat agtgtatttt cccaaggttt gaactagctc 180
ttcatttctt tatgttttaa atgcactgac ctcccacatt ccctttttag taaaatattc 240
agaaataatt taaatacatc attgcaatga aaataaatgt tttttattag gcagaatcca 300
gatgctcaag gcccttcata atatccccca gtttagtagt tggacttagg gaacaaagga 360
acctttaata gaaattggac agcaagaaag caagc 395
<210> 526
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 526
ctggggactt tccagctggg gactttccag ctggggactt tccagg 46
<210> 527
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 527
aggattagtc ccccagtgca c 21
<210> 528
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 528
agcctgcact tagagtgtct agg 23
<210> 529
<211> 70
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 529
tggggacttt ccgctgggga ctttccgctg gggactttcc gctggggact ttccgctggg 60
gactttccgc 70
<210> 530
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 530
acgggtggta cagaatgttc ttttggcgtc gacacgggtg gtacagaatg ttcttttggc 60
<210> 531
<211> 15
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 531
tgacgtcaag atcta 15
<210> 532
<211> 840
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 532
aacaggttag tttgactagc tggttgctga ctaattgaga tgcatgcttt gcatacttct 60
gcctgctggg gagcctgggg actttccaca cctggttgct gactaattga gatgcatgct 120
ttgcatactt ctgcctgctg gggagcctgg ggactttcca caccttaaga atgtaaattc 180
tgggtggttg ctgactaatt gagatgcatg ctttgcatac ttctgcctgc tggggagcct 240
ggggactttc cacacctggt tgctgactaa ttgagatgca tgctttgcat acttctgcct 300
gctggggagc ctggggactt tccacaccta gttacctaat ttgttagatg gttgctgact 360
aattgagatg catgctttgc atacttctgc ctgctgggga gcctggggac tttccacacc 420
tggttgctga ctaattgaga tgcatgcttt gcatacttct gcctgctggg gagcctgggg 480
actttccaca ccaatggcac tcaaacagta tgtggttgct gactaattga gatgcatgct 540
ttgcatactt ctgcctgctg gggagcctgg ggactttcca cacctggttg ctgactaatt 600
gagatgcatg ctttgcatac ttctgcctgc tggggagcct ggggactttc cacaccactt 660
ttagtcagag gttaattggt tgctgactaa ttgagatgca tgctttgcat acttctgcct 720
gctggggagc ctggggactt tccacacctg gttgctgact aattgagatg catgctttgc 780
atacttctgc ctgctgggga gcctggggac tttccacacc ttggctccta ggtcatgcac 840
<210> 533
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 533
acgggaagaa cattttgtac gtttggcgtc gacacgggaa gaacattttg tacgtttggc 60
<210> 534
<211> 72
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 534
tggttgctga ctaattgaga tgcatgcttt gcatacttct gcctgctggg gagcctgggg 60
actttccaca cc 72
<210> 535
<211> 144
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 535
tggttgctga ctaattgaga tgcatgcttt gcatacttct gcctgctggg gagcctgggg 60
actttccaca cctggttgct gactaattga gatgcatgct ttgcatactt ctgcctgctg 120
gggagcctgg ggactttcca cacc 144
<210> 536
<211> 840
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 536
aacaggttag tttgactagc tggttgctga ctaattgaga tgcatgcttt gcatacttct 60
gcctgctggg gagcctgggg actttccaca cctggttgct gactaattga gatgcatgct 120
ttgcatactt ctgcctgctg gggagcctgg ggactttcca caccttaaga atgtaaattc 180
tgggtggttg ctgactaatt gagatgcatg ctttgcatac ttctgcctgc tggggagcct 240
ggggactttc cacacctggt tgctgactaa ttgagatgca tgctttgcat acttctgcct 300
gctggggagc ctggggactt tccacaccta gttacctaat ttgttagatg gttgctgact 360
aattgagatg catgctttgc atacttctgc ctgctgggga gcctggggac tttccacacc 420
tggttgctga ctaattgaga tgcatgcttt gcatacttct gcctgctggg gagcctgggg 480
actttccaca ccaatggcac tcaaacagta tgtggttgct gactaattga gatgcatgct 540
ttgcatactt ctgcctgctg gggagcctgg ggactttcca cacctggttg ctgactaatt 600
gagatgcatg ctttgcatac ttctgcctgc tggggagcct ggggactttc cacaccactt 660
ttagtcagag gttaattggt tgctgactaa ttgagatgca tgctttgcat acttctgcct 720
gctggggagc ctggggactt tccacacctg gttgctgact aattgagatg catgctttgc 780
atacttctgc ctgctgggga gcctggggac tttccacacc ttggctccta gatcatgcac 840
<210> 537
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 537
gccgccacc 9
<210> 538
<211> 7
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 538
agccacc 7
<210> 539
<211> 10
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 539
cgcagccacc 10
<210> 540
<211> 3
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 540
acc 3
<210> 541
<211> 6558
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 541
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180
cgcgtccaag ccactctaaa gggcaatctg gcagcacttt gtgaaattaa gagtgcatgt 240
tccctatgat tcataatagc accactcttc tatcccagaa aatttctacc ccaggcctat 300
aagggaagaa agataaggaa atttatcaca gtattgtttg gggtggtgaa aaattagcaa 360
tgacttagat gtccataact ggaaaataaa gaagtcaagt gtggcaaata cacactggga 420
tattctgaac catttagaaa agcaaagaac tagatacata ttcagcagca tggctggatc 480
ctaagaacac agttgaaaga aaaaagaaac tatgaaatct atagtacatc catagattgt 540
agtaaatcta tagtgccaca tcacatatcc atgaaaaata catatacgca caaacatttc 600
tatgtatttt acaagttcaa ggctaaacat catattagag aagttgcctc tggggaaagg 660
cagtgagagt gaggaattat gataaaagag aatgaataaa aaaacaagag aagggtcatg 720
taggttttgt ttctgtgcca tgaactcatg gattatgatt aactcaacct tctgcacatg 780
aagataaaca agaaagaact gataaacctg caatggttgg gtaatcttca acttccaaat 840
cagcaaaggt cagctctaag tttgccaagt acacaacttc tcatcttgtg acatgttccc 900
cacctctgtg cagtgttaaa aaatacctca gtggtctact gactgactgt ggatgcttct 960
tctagatgtg cctttttttc ctccatttcc ttagcaccca gcactgctct cattatagca 1020
gcacattgca ttccaaccaa attgaacaaa aaggtggctt aaaaatcatc tgcaagttta 1080
tggcacaagc aatctcttat ttttatctta gtgcataaat aaatttttcc tttttgccag 1140
aataattttt tttaaagaag cgattagttt ttcttctctc agatagcaat gatgtgcttt 1200
cctctcaacc tagatttagg gcatttttat gtgagatagg attaaaaatt ccatttttgt 1260
acaaccacta tggagaacag tttggcagtt ccccaaaaaa ctaaaaatag agctactata 1320
tgatctagtg atcccactgc tgggtatata cctataagaa aggaaatcag tatatcaaag 1380
agatgtctgt tcttttatgt ttgttgcagc actgttcaca atagccaaga tctggaagca 1440
acccaagtct ccatcaacat gggttttaaa aaaatgtggt actttaatac acaatggagt 1500
actattcagc aataaaaaag aatgagatcc tgttatttgc aataacatgg acagaactgg 1560
aggtcattat gtcaaatgaa ataagccagg cacagaaagc caaacatcac atattctcac 1620
tcatatgtgg ggtctaaaaa tcaaaacaat ctgattcatg gagctagaga gtagagagct 1680
aattaccaga ggtggggaag ggtagtaggg gcctggaggg gaggtggaga tggttaatag 1740
gtacaaaaaa atatagaaag aatgaataag acctagtatt tgatagtaca acagggcgaa 1800
tatagtcaaa ataatttaat tatacattta aaaatacctg aaagagtata attggcttgt 1860
ttgcaacaca aaagataaat gcttgagggg atggatgccc cattttcaat gatgtgatta 1920
ttacacattg catgcctgta tcaaaatatt gcacatactc catgaatgca tacatctact 1980
atgttcccac aaaaattaaa cattagaaaa aagagttgca ttttcagctg ttatggggag 2040
aagaaagaaa agctatcatt ttgttgtcct aaaaattatg ttgtcctcat ttcaaacagg 2100
aaagcaaaag tatttgagag ccagtgcagt gccttggtgt tgggtgaaac atagattgaa 2160
tttgggccat ttgtttaaac ttcctaggcc tcagtttctt gcctattaaa agggagtgca 2220
tagttcatgg gattgttaag aggaagaagt gaaaccatgc acgtggagag cgtggcacag 2280
tgtctaagac agagtgtgca tgcaaataag tagataatat tctttgcttt tctttattgc 2340
atgcctgtaa tatttttgga gttgtcacat tcattgccct caagtagcat caagggatga 2400
aattatgttt gtaagaaaat cctgaggctg aggaatacaa catgttttat gtctactaca 2460
ctgaaaaatg ccggagtcag ataaagaata cagattctcc tgaggatgga aatcaagatc 2520
ttcgccttca atatttaaca acattgagct tccaacttac tatgggaaat attcatcagg 2580
cccctaaagg ttccttttgg acagaaattg cacttgttat atctgtattc ttagcagaca 2640
gtagacagcc tggcacatca taaaggctta aggaatccta aatatccctt aaaattctca 2700
ttttaaagac aaaaacaaaa caaaaaaaaa aaacaaaaaa aaactgaggc atgggcttga 2760
ccaaatcagt ggtagaacca agagttaaac cacttgtttt gaatcctaaa cctgagtttt 2820
attttactta tttatttatt tatttgttta tttattttca gatgcttggt caaagaacag 2880
tgggaggaga gggatgggct tccagcaacc tttattattg gcttattttc ttacagccca 2940
ttactttctc ttgggaaaat attaagcagg cactcaaggc ttgaggcccc tgagttttca 3000
catcctttct gaacctctga acctgctttc cagcattctt ttatactttg ttttacctcc 3060
tggtcagtaa tgcctcaccc tcagtcttct ctaaaagtgt ggttaatggc atcttcctga 3120
ctatttgaag accactggcc aaatcccacc agctcactca tagaccatcc ccctacttta 3180
ctttcttcaa aagacttagc cctacctaaa cttatttata tgtttatttt ctgcccacca 3240
gaatggcagc atagctgggg aggcagagtc tgttttgttc attgctgtat tcccaaagac 3300
tagaacacca ccaagcacac ggtacaggtc tcagtaatta ttgtcaaatt tatgtggatt 3360
tgcttttaaa caatatcttc catttactga gtgtttatgt ggaagaactg tactaaattt 3420
taatgcattt ctttattcct attcttaaaa ccttccagca aggtggctct accaccctct 3480
tttccgagct tcaggagcag ttgtgcgaat agctggagaa caccaggctg gatttaaacc 3540
cagatcgctc ttacatttgc tctttacctg ctgtgctcag cgttcacgtg ccctctagct 3600
gtagttttct gaagtcagcg cacagcaagg cagtgtgctt agaggttaac agaagggaaa 3660
acaacaacaa caaaaatcta aatgagaatc ctgactgttt cagctggggg taaggggggc 3720
ggattattca tataattgtt ataccagacg gtcgcaggct tagtccaatt gcagagaact 3780
cgcttcccag gcttctgaga gtcccggaag tgcctaaacc tgtctaatcg acggggcttg 3840
ggtggcccgt cgctccctgg cttcttccct ttacccaggg cgggcagcga agtggtgcct 3900
cctgcgtccc ccacaccctc cctcagcccc tcccctccgg cccgtcctgg gcaggtgacc 3960
tggagcatcc ggcaggctgc cctggcctcc tgcgtcagga caacgcccac gaggggcgtt 4020
actgtgcgga gatgcaccac gcaagagaca ccctttgtaa ctctcttctc ctccctagtg 4080
cgaggttaaa accttcagcc ccacgtgctg tttgcaaacc tgcctgtacc tgaggcccta 4140
aaaagccaga gacctcactc ccggggagcc agcgtttaaa ccgcagccac catgagcacc 4200
gccgtgctgg aaaatcctgg cctgggcaga aagctgagcg acttcggcca agagacaagc 4260
tacatcgagg acaactgcaa ccagaacggc gccatcagcc tgatcttcag cctgaaagaa 4320
gaagtgggcg ccctggccaa ggtgctgaga ctgttcgaag agaacgacgt gaacctgaca 4380
cacatcgaga gcagacccag cagactgaag aaggacgagt acgagttctt cacccacctg 4440
gacaagcgga gcctgcctgc tctgaccaac atcatcaaga tcctgcggca cgacatcggc 4500
gccacagtgc acgaactgag ccgggacaag aaaaaggaca ccgtgccatg gttccccaga 4560
accatccaag agctggacag attcgccaac cagatcctga gctatggcgc cgagctggac 4620
gctgatcacc ctggctttaa ggaccccgtg taccgggcca gaagaaagca gtttgccgat 4680
atcgcctaca actaccggca cggccagcct attcctcggg tcgagtacat ggaagaggaa 4740
aagaaaacct ggggcaccgt gttcaagacc ctgaagtccc tgtacaagac ccacgcctgc 4800
tacgagtaca accacatctt cccactgctc gaaaagtact gcggcttcca cgaggacaat 4860
atccctcagc ttgaggacgt gtcccagttc ctgcagacct gcaccggctt tagactgagg 4920
ccagttgccg gactgctgag cagcagagat tttctcggcg gcctggcctt cagagtgttc 4980
cactgtaccc agtacatcag acacggcagc aagcccatgt acacccctga gcctgatatc 5040
tgccacgagc tgctgggaca tgtgcccctg ttcagcgata gaagcttcgc ccagttcagc 5100
caagagatcg gactggcttc tctgggagcc cctgacgagt acattgagaa gctggccacc 5160
atctactggt tcaccgtgga attcggcctg tgcaagcagg gcgacagcat caaagcttat 5220
ggcgctggcc tgctgtctag cttcggcgag ctgcagtact gtctgagcga gaagcctaag 5280
ctgctgcccc tggaactgga aaagaccgcc atccagaact acaccgtgac cgagttccag 5340
cctctgtact acgtggccga gagcttcaac gacgccaaag aaaaagtgcg gaacttcgcc 5400
gccaccattc ctcggccttt cagcgtcaga tacgacccct acacacagcg gatcgaggtg 5460
ctggacaaca cacagcagct gaaaattctg gccgactcca tcaacagcga gatcggcatc 5520
ctgtgcagcg ccctgcagaa aatcaagtga tagttaatta agagcatctt accgccattt 5580
attcccatat ttgttctgtt tttcttgatt tgggtataca tttaaatgtt aataaaacaa 5640
aatggtgggg caatcattta catttttagg gatatgtaat tactagttca ggtgtattgc 5700
cacaagacaa acatgttaag aaactttccc gttatttacg ctctgttcct gttaatcaac 5760
ctctggatta caaaatttgt gaaagattga ctgatattct taactatgtt gctcctttta 5820
cgctgtgtgg atatgctgct ttatagcctc tgtatctagc tattgcttcc cgtacggctt 5880
tcgttttctc ctccttgtat aaatcctggt tgctgtctct tttagaggag ttgtggcccg 5940
ttgtccgtca acgtggcgtg gtgtgctctg tgtttgctga cgcaaccccc actggctggg 6000
gcattgccac cacctgtcaa ctcctttctg ggactttcgc tttccccctc ccgatcgcca 6060
cggcagaact catcgccgcc tgccttgccc gctgctggac aggggctagg ttgctgggca 6120
ctgataattc cgtggtgttg tctgtgcctt ctagttgcca gccatctgtt gtttgcccct 6180
cccccgtgcc ttccttgacc ctggaaggtg ccactcccac tgtcctttcc taataaaatg 6240
aggaaattgc atcgcattgt ctgagtaggt gtcattctat tctggggggt ggggtggggc 6300
aggacagcaa gggggaggat tgggaagaca atagcaggca tgctggggat gcggtgggct 6360
ctatggctct agagcatggc tacgtagata agtagcatgg cgggttaatc attaactaca 6420
cctgcaggag gaacccctag tgatggagtt ggccactccc tctctgcgcg ctcgctcgct 6480
cactgaggcc gggcgaccaa aggtcgcccg acgcccgggc ggcctcagtg agcgagcgag 6540
cgcgcagctg cctgcagg 6558
<210> 542
<211> 6642
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 542
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180
cgcgtccaag ccactctaaa gggcaatctg gcagcacttt gtgaaattaa gagtgcatgt 240
tccctatgat tcataatagc accactcttc tatcccagaa aatttctacc ccaggcctat 300
aagggaagaa agataaggaa atttatcaca gtattgtttg gggtggtgaa aaattagcaa 360
tgacttagat gtccataact ggaaaataaa gaagtcaagt gtggcaaata cacactggga 420
tattctgaac catttagaaa agcaaagaac tagatacata ttcagcagca tggctggatc 480
ctaagaacac agttgaaaga aaaaagaaac tatgaaatct atagtacatc catagattgt 540
agtaaatcta tagtgccaca tcacatatcc atgaaaaata catatacgca caaacatttc 600
tatgtatttt acaagttcaa ggctaaacat catattagag aagttgcctc tggggaaagg 660
cagtgagagt gaggaattat gataaaagag aatgaataaa aaaacaagag aagggtcatg 720
taggttttgt ttctgtgcca tgaactcatg gattatgatt aactcaacct tctgcacatg 780
aagataaaca agaaagaact gataaacctg caatggttgg gtaatcttca acttccaaat 840
cagcaaaggt cagctctaag tttgccaagt acacaacttc tcatcttgtg acatgttccc 900
cacctctgtg cagtgttaaa aaatacctca gtggtctact gactgactgt ggatgcttct 960
tctagatgtg cctttttttc ctccatttcc ttagcaccca gcactgctct cattatagca 1020
gcacattgca ttccaaccaa attgaacaaa aaggtggctt aaaaatcatc tgcaagttta 1080
tggcacaagc aatctcttat ttttatctta gtgcataaat aaatttttcc tttttgccag 1140
aataattttt tttaaagaag cgattagttt ttcttctctc agatagcaat gatgtgcttt 1200
cctctcaacc tagatttagg gcatttttat gtgagatagg attaaaaatt ccatttttgt 1260
acaaccacta tggagaacag tttggcagtt ccccaaaaaa ctaaaaatag agctactata 1320
tgatctagtg atcccactgc tgggtatata cctataagaa aggaaatcag tatatcaaag 1380
agatgtctgt tcttttatgt ttgttgcagc actgttcaca atagccaaga tctggaagca 1440
acccaagtct ccatcaacat gggttttaaa aaaatgtggt actttaatac acaatggagt 1500
actattcagc aataaaaaag aatgagatcc tgttatttgc aataacatgg acagaactgg 1560
aggtcattat gtcaaatgaa ataagccagg cacagaaagc caaacatcac atattctcac 1620
tcatatgtgg ggtctaaaaa tcaaaacaat ctgattcatg gagctagaga gtagagagct 1680
aattaccaga ggtggggaag ggtagtaggg gcctggaggg gaggtggaga tggttaatag 1740
gtacaaaaaa atatagaaag aatgaataag acctagtatt tgatagtaca acagggcgaa 1800
tatagtcaaa ataatttaat tatacattta aaaatacctg aaagagtata attggcttgt 1860
ttgcaacaca aaagataaat gcttgagggg atggatgccc cattttcaat gatgtgatta 1920
ttacacattg catgcctgta tcaaaatatt gcacatactc catgaatgca tacatctact 1980
atgttcccac aaaaattaaa cattagaaaa aagagttgca ttttcagctg ttatggggag 2040
aagaaagaaa agctatcatt ttgttgtcct aaaaattatg ttgtcctcat ttcaaacagg 2100
aaagcaaaag tatttgagag ccagtgcagt gccttggtgt tgggtgaaac atagattgaa 2160
tttgggccat ttgtttaaac ttcctaggcc tcagtttctt gcctattaaa agggagtgca 2220
tagttcatgg gattgttaag aggaagaagt gaaaccatgc acgtggagag cgtggcacag 2280
tgtctaagac agagtgtgca tgcaaataag tagataatat tctttgcttt tctttattgc 2340
atgcctgtaa tatttttgga gttgtcacat tcattgccct caagtagcat caagggatga 2400
aattatgttt gtaagaaaat cctgaggctg aggaatacaa catgttttat gtctactaca 2460
ctgaaaaatg ccggagtcag ataaagaata cagattctcc tgaggatgga aatcaagatc 2520
ttcgccttca atatttaaca acattgagct tccaacttac tatgggaaat attcatcagg 2580
cccctaaagg ttccttttgg acagaaattg cacttgttat atctgtattc ttagcagaca 2640
gtagacagcc tggcacatca taaaggctta aggaatccta aatatccctt aaaattctca 2700
ttttaaagac aaaaacaaaa caaaaaaaaa aaacaaaaaa aaactgaggc atgggcttga 2760
ccaaatcagt ggtagaacca agagttaaac cacttgtttt gaatcctaaa cctgagtttt 2820
attttactta tttatttatt tatttgttta tttattttca gatgcttggt caaagaacag 2880
tgggaggaga gggatgggct tccagcaacc tttattattg gcttattttc ttacagccca 2940
ttactttctc ttgggaaaat attaagcagg cactcaaggc ttgaggcccc tgagttttca 3000
catcctttct gaacctctga acctgctttc cagcattctt ttatactttg ttttacctcc 3060
tggtcagtaa tgcctcaccc tcagtcttct ctaaaagtgt ggttaatggc atcttcctga 3120
ctatttgaag accactggcc aaatcccacc agctcactca tagaccatcc ccctacttta 3180
ctttcttcaa aagacttagc cctacctaaa cttatttata tgtttatttt ctgcccacca 3240
gaatggcagc atagctgggg aggcagagtc tgttttgttc attgctgtat tcccaaagac 3300
tagaacacca ccaagcacac ggtacaggtc tcagtaatta ttgtcaaatt tatgtggatt 3360
tgcttttaaa caatatcttc catttactga gtgtttatgt ggaagaactg tactaaattt 3420
taatgcattt ctttattcct attcttaaaa ccttccagca aggtggctct accaccctct 3480
tttccgagct tcaggagcag ttgtgcgaat agctggagaa caccaggctg gatttaaacc 3540
cagatcgctc ttacatttgc tctttacctg ctgtgctcag cgttcacgtg ccctctagct 3600
gtagttttct gaagtcagcg cacagcaagg cagtgtgctt agaggttaac agaagggaaa 3660
acaacaacaa caaaaatcta aatgagaatc ctgactgttt cagctggggg taaggggggc 3720
ggattattca tataattgtt ataccagacg gtcgcaggct tagtccaatt gcagagaact 3780
cgcttcccag gcttctgaga gtcccggaag tgcctaaacc tgtctaatcg acggggcttg 3840
ggtggcccgt cgctccctgg cttcttccct ttacccaggg cgggcagcga agtggtgcct 3900
cctgcgtccc ccacaccctc cctcagcccc tcccctccgg cccgtcctgg gcaggtgacc 3960
tggagcatcc ggcaggctgc cctggcctcc tgcgtcagga caacgcccac gaggggcgtt 4020
actgtgcgga gatgcaccac gcaagagaca ccctttgtaa ctctcttctc ctccctagtg 4080
cgaggttaaa accttcagcc ccacgtgctg tttgcaaacc tgcctgtacc tgaggcccta 4140
aaaagccaga gacctcactc ccggggaaga ggtaagggtt taagggatgg ttggttggtg 4200
gggtattaat gtttaattac ctggagcacc tgcctgaaat cacttttttt caggttggtt 4260
taaaccgcag ccaccatgag caccgccgtg ctggaaaatc ctggcctggg cagaaagctg 4320
agcgacttcg gccaagagac aagctacatc gaggacaact gcaaccagaa cggcgccatc 4380
agcctgatct tcagcctgaa agaagaagtg ggcgccctgg ccaaggtgct gagactgttc 4440
gaagagaacg acgtgaacct gacacacatc gagagcagac ccagcagact gaagaaggac 4500
gagtacgagt tcttcaccca cctggacaag cggagcctgc ctgctctgac caacatcatc 4560
aagatcctgc ggcacgacat cggcgccaca gtgcacgaac tgagccggga caagaaaaag 4620
gacaccgtgc catggttccc cagaaccatc caagagctgg acagattcgc caaccagatc 4680
ctgagctatg gcgccgagct ggacgctgat caccctggct ttaaggaccc cgtgtaccgg 4740
gccagaagaa agcagtttgc cgatatcgcc tacaactacc ggcacggcca gcctattcct 4800
cgggtcgagt acatggaaga ggaaaagaaa acctggggca ccgtgttcaa gaccctgaag 4860
tccctgtaca agacccacgc ctgctacgag tacaaccaca tcttcccact gctcgaaaag 4920
tactgcggct tccacgagga caatatccct cagcttgagg acgtgtccca gttcctgcag 4980
acctgcaccg gctttagact gaggccagtt gccggactgc tgagcagcag agattttctc 5040
ggcggcctgg ccttcagagt gttccactgt acccagtaca tcagacacgg cagcaagccc 5100
atgtacaccc ctgagcctga tatctgccac gagctgctgg gacatgtgcc cctgttcagc 5160
gatagaagct tcgcccagtt cagccaagag atcggactgg cttctctggg agcccctgac 5220
gagtacattg agaagctggc caccatctac tggttcaccg tggaattcgg cctgtgcaag 5280
cagggcgaca gcatcaaagc ttatggcgct ggcctgctgt ctagcttcgg cgagctgcag 5340
tactgtctga gcgagaagcc taagctgctg cccctggaac tggaaaagac cgccatccag 5400
aactacaccg tgaccgagtt ccagcctctg tactacgtgg ccgagagctt caacgacgcc 5460
aaagaaaaag tgcggaactt cgccgccacc attcctcggc ctttcagcgt cagatacgac 5520
ccctacacac agcggatcga ggtgctggac aacacacagc agctgaaaat tctggccgac 5580
tccatcaaca gcgagatcgg catcctgtgc agcgccctgc agaaaatcaa gtgatagtta 5640
attaagagca tcttaccgcc atttattccc atatttgttc tgtttttctt gatttgggta 5700
tacatttaaa tgttaataaa acaaaatggt ggggcaatca tttacatttt tagggatatg 5760
taattactag ttcaggtgta ttgccacaag acaaacatgt taagaaactt tcccgttatt 5820
tacgctctgt tcctgttaat caacctctgg attacaaaat ttgtgaaaga ttgactgata 5880
ttcttaacta tgttgctcct tttacgctgt gtggatatgc tgctttatag cctctgtatc 5940
tagctattgc ttcccgtacg gctttcgttt tctcctcctt gtataaatcc tggttgctgt 6000
ctcttttaga ggagttgtgg cccgttgtcc gtcaacgtgg cgtggtgtgc tctgtgtttg 6060
ctgacgcaac ccccactggc tggggcattg ccaccacctg tcaactcctt tctgggactt 6120
tcgctttccc cctcccgatc gccacggcag aactcatcgc cgcctgcctt gcccgctgct 6180
ggacaggggc taggttgctg ggcactgata attccgtggt gttgtctgtg ccttctagtt 6240
gccagccatc tgttgtttgc ccctcccccg tgccttcctt gaccctggaa ggtgccactc 6300
ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca ttgtctgagt aggtgtcatt 6360
ctattctggg gggtggggtg gggcaggaca gcaaggggga ggattgggaa gacaatagca 6420
ggcatgctgg ggatgcggtg ggctctatgg ctctagagca tggctacgta gataagtagc 6480
atggcgggtt aatcattaac tacacctgca ggaggaaccc ctagtgatgg agttggccac 6540
tccctctctg cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg cccgacgccc 6600
gggcggcctc agtgagcgag cgagcgcgca gctgcctgca gg 6642
<210> 543
<211> 2967
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 543
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180
cgccggggga ggctgctggt gaatattaac caaggtcacc ccagttatcg gaggagcaaa 240
caggggctaa gtccacacgc gtggtaccgt ctgtctgcac atttcgtaga gcgagtgttc 300
cgatactcta atctccctag gcaaggttca tatttgtgta ggttacttat tctccttttg 360
ttgactaagt caataatcag aatcagcagg tttggagtca gcttggcagg gatcagcagc 420
ctgggttgga aggagggggt ataaaagccc cttcaccagg agaagccgtc acacagatcc 480
acaagctcct gaagaggtaa gggtttaagg gatggttggt tggtggggta ttaatgttta 540
attacctgga gcacctgcct gaaatcactt tttttcaggt tggtttaaac cgcagccacc 600
atgagtacag cagtgttaga gaatccaggc ctaggtagaa agctgtctga ctttggccag 660
gagacctcct acattgagga caactgcaac cagaatggag ccatcagcct gatcttcagc 720
ctgaaggagg aggtgggagc cctggccaag gtgctgagac tgtttgagga gaatgatgtg 780
aacctgaccc acattgagtc cagaccctcc agactgaaga aggatgagta tgagttcttc 840
acccacctgg acaagagatc cctgcctgct ctgaccaaca tcatcaagat cctgagacat 900
gatattggag ccacagtgca tgagctgagc agggacaaga agaaggacac agtgccttgg 960
ttccccagaa ccatccagga gctggacagg tttgccaacc agatcctgtc ctatggagct 1020
gagctggatg ctgaccaccc tggatttaag gatcctgtgt acagggccag aaggaagcag 1080
tttgctgaca ttgcctacaa ctacaggcat ggccagccca tccccagggt ggagtacatg 1140
gaggaggaga agaagacctg gggcactgtg ttcaagaccc tgaagagcct gtacaagacc 1200
catgcctgct atgagtacaa ccacatcttc cccctgctgg agaagtactg tggcttccat 1260
gaggacaaca tccctcagct ggaggatgtg tcccagttcc tgcagacctg cacaggcttc 1320
agactgagac ctgtggctgg cctgctgtct agcagagact tcctgggagg cctggccttc 1380
agagtgttcc actgcaccca gtacatcaga catggaagca agcccatgta cacccctgag 1440
ccagacatct gccatgagct gctgggccat gtgcccctgt tctctgatag atcctttgcc 1500
cagttcagcc aggagattgg cctggccagc ctgggagccc ctgatgagta cattgagaag 1560
ctggccacca tctactggtt cacagtggag tttggcctgt gcaagcaggg agactccatc 1620
aaggcctatg gagctggact gctgtcctcc tttggagagc tgcagtactg cctgtctgag 1680
aagcccaagc tgctgcccct ggagctggag aagacagcca tccagaacta cacagtgaca 1740
gagttccagc ccctgtacta tgtggctgag agcttcaatg atgccaagga gaaggtgaga 1800
aactttgctg ccaccatccc cagacccttc tctgtgaggt atgaccccta cacccagagg 1860
attgaggtgc tggacaacac ccagcagctg aagatcctgg ctgactccat caactctgag 1920
attggcatcc tgtgctctgc cctgcagaag atcaagtaaa ccttaattaa gagcatctta 1980
ccgccattta ttcccatatt tgttctgttt ttcttgattt gggtatacat ttaaatgtta 2040
ataaaacaaa atggtggggc aatcatttac atttttaggg atatgtaatt actagttcag 2100
gtgtattgcc acaagacaaa catgttaaga aactttcccg ttatttacgc tctgttcctg 2160
ttaatcaacc tctggattac aaaatttgtg aaagattgac tgatattctt aactatgttg 2220
ctccttttac gctgtgtgga tatgctgctt tatagcctct gtatctagct attgcttccc 2280
gtacggcttt cgttttctcc tccttgtata aatcctggtt gctgtctctt ttagaggagt 2340
tgtggcccgt tgtccgtcaa cgtggcgtgg tgtgctctgt gtttgctgac gcaaccccca 2400
ctggctgggg cattgccacc acctgtcaac tcctttctgg gactttcgct ttccccctcc 2460
cgatcgccac ggcagaactc atcgccgcct gccttgcccg ctgctggaca ggggctaggt 2520
tgctgggcac tgataattcc gtggtgttgt ctgtgccttc tagttgccag ccatctgttg 2580
tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc cactcccact gtcctttcct 2640
aataaaatga ggaaattgca tcgcattgtc tgagtaggtg tcattctatt ctggggggtg 2700
gggtggggca ggacagcaag ggggaggatt gggaagacaa tagcaggcat gctggggatg 2760
cggtgggctc tatggctcta gagcatggct acgtagataa gtagcatggc gggttaatca 2820
ttaactacac ctgcaggagg aacccctagt gatggagttg gccactccct ctctgcgcgc 2880
tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga cgcccgggcg gcctcagtga 2940
gcgagcgagc gcgcagctgc ctgcagg 2967
<210> 544
<211> 2967
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 544
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180
cgccggggga ggctgctggt gaatattaac caaggtcacc ccagttatcg gaggagcaaa 240
caggggctaa gtccacacgc gtggtaccgt ctgtctgcac atttcgtaga gcgagtgttc 300
cgatactcta atctccctag gcaaggttca tatttgtgta ggttacttat tctccttttg 360
ttgactaagt caataatcag aatcagcagg tttggagtca gcttggcagg gatcagcagc 420
ctgggttgga aggagggggt ataaaagccc cttcaccagg agaagccgtc acacagatcc 480
acaagctcct gaagaggtaa gggtttaagg gatggttggt tggtggggta ttaatgttta 540
attacctgga gcacctgcct gaaatcactt tttttcaggt tggtttaaac cgcagccacc 600
atgtccacag ctgtgctgga gaaccctggc ctgggcagaa agctgtctga ctttggccag 660
gagacctcct acattgagga caactgcaac cagaatggag ccatctccct gatcttctcc 720
ctgaaggagg aggtgggagc cctggccaag gtgctgagac tgtttgagga gaatgatgtg 780
aacctgaccc acattgagtc cagaccctcc agactgaaga aggatgagta tgagttcttc 840
acccacctgg acaagagatc cctgcctgcc ctgaccaaca tcatcaagat cctgagacat 900
gacattggag ccacagtgca tgagctgtcc agagacaaga agaaggacac agtgccctgg 960
ttccccagaa ccatccagga gctggacaga tttgccaacc agatcctgtc ctatggagct 1020
gagctggatg ctgaccaccc tggcttcaag gaccctgtgt acagggccag aagaaagcag 1080
tttgctgaca ttgcctacaa ctacagacat ggccagccca tccccagagt ggagtacatg 1140
gaggaggaga agaagacctg gggcacagtg ttcaagaccc tgaagtccct gtacaagacc 1200
catgcctgct atgagtacaa ccacatcttc cccctgctgg agaagtactg tggcttccat 1260
gaggacaaca tcccccagct ggaggatgtg tcccagttcc tgcagacctg cacaggcttc 1320
agactgagac ctgtggctgg cctgctgtcc tccagagact tcctgggagg cctggccttc 1380
agagtgttcc actgcaccca gtacatcaga catggctcca agcccatgta cacccctgag 1440
cctgacatct gccatgagct gctgggccat gtgcccctgt tctctgacag atcctttgcc 1500
cagttctccc aggagattgg cctggcctcc ctgggagccc ctgatgagta cattgagaag 1560
ctggccacca tctactggtt cacagtggag tttggcctgt gcaagcaggg agactccatc 1620
aaggcctatg gagctggcct gctgtcctcc tttggagagc tgcagtactg cctgtctgag 1680
aagcccaagc tgctgcccct ggagctggag aagacagcca tccagaacta cacagtgaca 1740
gagttccagc ccctgtacta tgtggctgag tccttcaatg atgccaagga gaaggtcaga 1800
aactttgctg ccaccatccc cagacccttc tctgtgagat atgaccccta cacccagaga 1860
attgaggtgc tggacaacac ccagcagctg aagatcctgg ctgactccat caactctgag 1920
attggcatcc tgtgctctgc cctgcagaag atcaagtaaa ccttaattaa gagcatctta 1980
ccgccattta ttcccatatt tgttctgttt ttcttgattt gggtatacat ttaaatgtta 2040
ataaaacaaa atggtggggc aatcatttac atttttaggg atatgtaatt actagttcag 2100
gtgtattgcc acaagacaaa catgttaaga aactttcccg ttatttacgc tctgttcctg 2160
ttaatcaacc tctggattac aaaatttgtg aaagattgac tgatattctt aactatgttg 2220
ctccttttac gctgtgtgga tatgctgctt tatagcctct gtatctagct attgcttccc 2280
gtacggcttt cgttttctcc tccttgtata aatcctggtt gctgtctctt ttagaggagt 2340
tgtggcccgt tgtccgtcaa cgtggcgtgg tgtgctctgt gtttgctgac gcaaccccca 2400
ctggctgggg cattgccacc acctgtcaac tcctttctgg gactttcgct ttccccctcc 2460
cgatcgccac ggcagaactc atcgccgcct gccttgcccg ctgctggaca ggggctaggt 2520
tgctgggcac tgataattcc gtggtgttgt ctgtgccttc tagttgccag ccatctgttg 2580
tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc cactcccact gtcctttcct 2640
aataaaatga ggaaattgca tcgcattgtc tgagtaggtg tcattctatt ctggggggtg 2700
gggtggggca ggacagcaag ggggaggatt gggaagacaa tagcaggcat gctggggatg 2760
cggtgggctc tatggctcta gagcatggct acgtagataa gtagcatggc gggttaatca 2820
ttaactacac ctgcaggagg aacccctagt gatggagttg gccactccct ctctgcgcgc 2880
tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga cgcccgggcg gcctcagtga 2940
gcgagcgagc gcgcagctgc ctgcagg 2967
<210> 545
<211> 3977
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 545
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180
cgcgttaatc attaacgctt gtactttggt acagttaatc attaacgctt gtactttggt 240
acagttaatc attaacgctt gtactttggt acaatcgatg cgagaacttg tgcctccccg 300
tgttcctgct ctttgtccct ctgtcctact tagactaata tttgccttgg gtactgcaaa 360
caggaaatgg gggagggaca ggagtagggc ggagggtagc ccggggattc tgcagtgaga 420
gcagagggcc agctaagtgg tactctccca gagactgtct gactcacgcc accccctcca 480
ccttggacac aggacgctgt ggtttctgag ccaggtacaa tgactccttt cggtaagtgc 540
agtggaagct gtacactgcc caggcaaagc gtccgggcag cgtaggcggg cgactcagat 600
cccagccagt ggacttagcc cctgtttgct cctccgataa ctggggtgac cttggttaat 660
attcaccagc agcctccccc gttgcccctc tggatccact gcttaaatac ggacgaggac 720
agggccctgt ctcctcagct tcaggcacca ccactgacct gggacagtga atgtttaaac 780
cgcagccacc atgagcaccg ccgtgctgga aaatcctggc ttgggcagga aactctctga 840
ctttggacag gtaagcctgt tgggcttcca ctgctaggag agaattggtt ccccacatgt 900
gaaagcagtc tgggaaatgc tggtatttcc agtctcctaa ggctactaag aaatatgact 960
ttatttagag gcgaggaaaa tgcccaggaa gtcaactgat gagtctagtc ttaacaagtt 1020
gaggatacag aaagttgggg atctgagctg ctaccaacat ctgtgtgtct ttgggtggct 1080
cattggtatc ctctgcctat tggctttatc ttctgtacac tgaaaggaaa tggctggtcc 1140
ttagtcacct acccaggtct tggatccata gcctacggat gtcccatttt tattgctttt 1200
tatattttgt ctcccagtgt ctttttgagg attttttttt tttttttgca tcacttgctc 1260
ttcctctaag aatctcctga cttcttgtac atgtgtctga tggtcagaat tttagcactg 1320
aagtatgggc gtatttatca taattcaggt ttatatcctt tcagatatgg gctagggtct 1380
ggtattaggg tgctcattaa aaaatgttga tttttgtcag tgtctagtga catcaatgca 1440
taatttaagg ttctataaat tgaaagctaa cccaggagtg actcatcctc tcattgtttt 1500
caacttactt atttctgatc acactgactt ccctgtggaa tacacgtggt tcactgtgtt 1560
ccaaagctta acgagcagaa aaaggttatg ctcgtctctt cttgagaggt tttaagagaa 1620
taattgctaa gctgtgaaaa acattttaac caagtgatct aattatgtag gaaacaagct 1680
atattgaaga caactgcaat caaaacggcg ccatcagcct gatcttcagc ctgaaagaag 1740
aagtgggcgc cctggccaag gtgctgagac tgttcgaaga gaacgacgtg aacctgacac 1800
acatcgagag cagacccagc agactgaaga aggacgagta cgagttcttc acccacctgg 1860
acaagcggag cctgcctgct ctgaccaaca tcatcaagat cctgcggcac gacatcggcg 1920
ccacagtgca cgaactgagc cgggacaaga aaaaggacac cgtgccatgg ttccccagaa 1980
ccatccaaga gctggacaga ttcgccaacc agatcctgag ctatggcgcc gagctggacg 2040
ctgatcaccc tggctttaag gaccccgtgt accgggccag aagaaagcag tttgccgata 2100
tcgcctacaa ctaccggcac ggccagccta ttcctcgggt cgagtacatg gaagaggaaa 2160
agaaaacctg gggcaccgtg ttcaagaccc tgaagtccct gtacaagacc cacgcctgct 2220
acgagtacaa ccacatcttc ccactgctcg aaaagtactg cggcttccac gaggacaata 2280
tccctcagct tgaggacgtg tcccagttcc tgcagacctg caccggcttt agactgaggc 2340
cagttgccgg actgctgagc agcagagatt ttctcggcgg cctggccttc agagtgttcc 2400
actgtaccca gtacatcaga cacggcagca agcccatgta cacccctgag cctgatatct 2460
gccacgagct gctgggacat gtgcccctgt tcagcgatag aagcttcgcc cagttcagcc 2520
aagagatcgg actggcttct ctgggagccc ctgacgagta cattgagaag ctggccacca 2580
tctactggtt caccgtggaa ttcggcctgt gcaagcaggg cgacagcatc aaagcttatg 2640
gcgctggcct gctgtctagc ttcggcgagc tgcagtactg tctgagcgag aagcctaagc 2700
tgctgcccct ggaactggaa aagaccgcca tccagaacta caccgtgacc gagttccagc 2760
ctctgtacta cgtggccgag agcttcaacg acgccaaaga aaaagtgcgg aacttcgccg 2820
ccaccattcc tcggcctttc agcgtcagat acgaccccta cacacagcgg atcgaggtgc 2880
tggacaacac acagcagctg aaaattctgg ccgactccat caacagcgag atcggcatcc 2940
tgtgcagcgc cctgcagaaa atcaagtgat agttaattaa gagcatctta ccgccattta 3000
ttcccatatt tgttctgttt ttcttgattt gggtatacat ttaaatgtta ataaaacaaa 3060
atggtggggc aatcatttac atttttaggg atatgtaatt actagttcag gtgtattgcc 3120
acaagacaaa catgttaaga aactttcccg ttatttacgc tctgttcctg ttaatcaacc 3180
tctggattac aaaatttgtg aaagattgac tgatattctt aactatgttg ctccttttac 3240
gctgtgtgga tatgctgctt tatagcctct gtatctagct attgcttccc gtacggcttt 3300
cgttttctcc tccttgtata aatcctggtt gctgtctctt ttagaggagt tgtggcccgt 3360
tgtccgtcaa cgtggcgtgg tgtgctctgt gtttgctgac gcaaccccca ctggctgggg 3420
cattgccacc acctgtcaac tcctttctgg gactttcgct ttccccctcc cgatcgccac 3480
ggcagaactc atcgccgcct gccttgcccg ctgctggaca ggggctaggt tgctgggcac 3540
tgataattcc gtggtgttgt ctgtgccttc tagttgccag ccatctgttg tttgcccctc 3600
ccccgtgcct tccttgaccc tggaaggtgc cactcccact gtcctttcct aataaaatga 3660
ggaaattgca tcgcattgtc tgagtaggtg tcattctatt ctggggggtg gggtggggca 3720
ggacagcaag ggggaggatt gggaagacaa tagcaggcat gctggggatg cggtgggctc 3780
tatggctcta gagcatggct acgtagataa gtagcatggc gggttaatca ttaactacac 3840
ctgcaggagg aacccctagt gatggagttg gccactccct ctctgcgcgc tcgctcgctc 3900
actgaggccg ggcgaccaaa ggtcgcccga cgcccgggcg gcctcagtga gcgagcgagc 3960
gcgcagctgc ctgcagg 3977
<210> 546
<211> 4061
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 546
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180
cgcagcaaca gatcattcta tgggttaatc attaacaaca ggttaggctt gtactttggt 240
acattggctc ctagttaatc attaacttag caatgtgctt gtactttggt acatagttac 300
ctagttaatc attaacaaac agtatggctt gtactttggt acaagcaaca gatcattcta 360
tgggcgagaa cttgtgcctc cccgtgttcc tgctctttgt ccctctgtcc tacttagact 420
aatatttgcc ttgggtactg caaacaggaa atgggggagg gacaggagta gggcggaggg 480
tagcaattgg attctgcagt gagagcagag ggccagctaa gtggtactct cccagagact 540
gtctgactca cgccaccccc tccaccttgg acacaggacg ctgtggtttc tgagccaggt 600
acaatgactc ctttcggtaa gtgcagtgga agctgtacac tgcccaggca aagcgtccgg 660
gcagcgtagg cgggcgactc agatcccagc cagtggactt agcccctgtt tgctcctccg 720
ataactgggg tgaccttggt taatattcac cagcagcctc ccccgttgcc cctctggatc 780
cactgcttaa atacggacga ggacagggcc ctgtctcctc agcttcaggc accaccactg 840
acctgggaca gtgaatgttt aaaccgcagc caccatgagc accgccgtgc tggaaaatcc 900
tggcttgggc aggaaactct ctgactttgg acaggtaagc ctgttgggct tccactgcta 960
ggagagaatt ggttccccac atgtgaaagc agtctgggaa atgctggtat ttccagtctc 1020
ctaaggctac taagaaatat gactttattt agaggcgagg aaaatgccca ggaagtcaac 1080
tgatgagtct agtcttaaca agttgaggat acagaaagtt ggggatctga gctgctacca 1140
acatctgtgt gtctttgggt ggctcattgg tatcctctgc ctattggctt tatcttctgt 1200
acactgaaag gaaatggctg gtccttagtc acctacccag gtcttggatc catagcctac 1260
ggatgtccca tttttattgc tttttatatt ttgtctccca gtgtcttttt gaggattttt 1320
tttttttttt tgcatcactt gctcttcctc taagaatctc ctgacttctt gtacatgtgt 1380
ctgatggtca gaattttagc actgaagtat gggcgtattt atcataattc aggtttatat 1440
cctttcagat atgggctagg gtctggtatt agggtgctca ttaaaaaatg ttgatttttg 1500
tcagtgtcta gtgacatcaa tgcataattt aaggttctat aaattgaaag ctaacccagg 1560
agtgactcat cctctcattg ttttcaactt acttatttct gatcacactg acttccctgt 1620
ggaatacacg tggttcactg tgttccaaag cttaacgagc agaaaaaggt tatgctcgtc 1680
tcttcttgag aggttttaag agaataattg ctaagctgtg aaaaacattt taaccaagtg 1740
atctaattat gtaggaaaca agctatattg aagacaactg caatcaaaac ggcgccatca 1800
gcctgatctt cagcctgaaa gaagaagtgg gcgccctggc caaggtgctg agactgttcg 1860
aagagaacga cgtgaacctg acacacatcg agagcagacc cagcagactg aagaaggacg 1920
agtacgagtt cttcacccac ctggacaagc ggagcctgcc tgctctgacc aacatcatca 1980
agatcctgcg gcacgacatc ggcgccacag tgcacgaact gagccgggac aagaaaaagg 2040
acaccgtgcc atggttcccc agaaccatcc aagagctgga cagattcgcc aaccagatcc 2100
tgagctatgg cgccgagctg gacgctgatc accctggctt taaggacccc gtgtaccggg 2160
ccagaagaaa gcagtttgcc gatatcgcct acaactaccg gcacggccag cctattcctc 2220
gggtcgagta catggaagag gaaaagaaaa cctggggcac cgtgttcaag accctgaagt 2280
ccctgtacaa gacccacgcc tgctacgagt acaaccacat cttcccactg ctcgaaaagt 2340
actgcggctt ccacgaggac aatatccctc agcttgagga cgtgtcccag ttcctgcaga 2400
cctgcaccgg ctttagactg aggccagttg ccggactgct gagcagcaga gattttctcg 2460
gcggcctggc cttcagagtg ttccactgta cccagtacat cagacacggc agcaagccca 2520
tgtacacccc tgagcctgat atctgccacg agctgctggg acatgtgccc ctgttcagcg 2580
atagaagctt cgcccagttc agccaagaga tcggactggc ttctctggga gcccctgacg 2640
agtacattga gaagctggcc accatctact ggttcaccgt ggaattcggc ctgtgcaagc 2700
agggcgacag catcaaagct tatggcgctg gcctgctgtc tagcttcggc gagctgcagt 2760
actgtctgag cgagaagcct aagctgctgc ccctggaact ggaaaagacc gccatccaga 2820
actacaccgt gaccgagttc cagcctctgt actacgtggc cgagagcttc aacgacgcca 2880
aagaaaaagt gcggaacttc gccgccacca ttcctcggcc tttcagcgtc agatacgacc 2940
cctacacaca gcggatcgag gtgctggaca acacacagca gctgaaaatt ctggccgact 3000
ccatcaacag cgagatcggc atcctgtgca gcgccctgca gaaaatcaag tgatagttaa 3060
ttaagagcat cttaccgcca tttattccca tatttgttct gtttttcttg atttgggtat 3120
acatttaaat gttaataaaa caaaatggtg gggcaatcat ttacattttt agggatatgt 3180
aattactagt tcaggtgtat tgccacaaga caaacatgtt aagaaacttt cccgttattt 3240
acgctctgtt cctgttaatc aacctctgga ttacaaaatt tgtgaaagat tgactgatat 3300
tcttaactat gttgctcctt ttacgctgtg tggatatgct gctttatagc ctctgtatct 3360
agctattgct tcccgtacgg ctttcgtttt ctcctccttg tataaatcct ggttgctgtc 3420
tcttttagag gagttgtggc ccgttgtccg tcaacgtggc gtggtgtgct ctgtgtttgc 3480
tgacgcaacc cccactggct ggggcattgc caccacctgt caactccttt ctgggacttt 3540
cgctttcccc ctcccgatcg ccacggcaga actcatcgcc gcctgccttg cccgctgctg 3600
gacaggggct aggttgctgg gcactgataa ttccgtggtg ttgtctgtgc cttctagttg 3660
ccagccatct gttgtttgcc cctcccccgt gccttccttg accctggaag gtgccactcc 3720
cactgtcctt tcctaataaa atgaggaaat tgcatcgcat tgtctgagta ggtgtcattc 3780
tattctgggg ggtggggtgg ggcaggacag caagggggag gattgggaag acaatagcag 3840
gcatgctggg gatgcggtgg gctctatggc tctagagcat ggctacgtag ataagtagca 3900
tggcgggtta atcattaact acacctgcag gaggaacccc tagtgatgga gttggccact 3960
ccctctctgc gcgctcgctc gctcactgag gccgggcgac caaaggtcgc ccgacgcccg 4020
ggcggcctca gtgagcgagc gagcgcgcag ctgcctgcag g 4061
<210> 547
<211> 4388
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 547
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180
cgcaggctca gaggcacaca ggagtttctg ggctcaccct gcccccttcc aacccctcag 240
ttcccatcct ccagcagctg tttgtgtgct gcctctgaag tccacactga acaaacttca 300
gcctactcat gtccctaaaa tgggcaaaca ttgcaagcag caaacagcaa acacacagcc 360
ctccctgcct gctgaccttg gagctggggc agaggtcaga gacctctctg ggcccatgcc 420
acctccaaca tccactcgac cccttggaat ttcggtggag aggagcagag gttgtcctgg 480
cgtggtttag gtagtgtgag agggcttaag agcaacagat cattctatgg gttaatcatt 540
aacaacaggt taggcttgta ctttggtaca ttggctccta gttaatcatt aacttagcaa 600
tgtgcttgta ctttggtaca tagttaccta gttaatcatt aacaaacagt atggcttgta 660
ctttggtaca agcaacagat cattctatgg gcgagaactt gtgcctcccc gtgttcctgc 720
tctttgtccc tctgtcctac ttagactaat atttgccttg ggtactgcaa acaggaaatg 780
ggggagggac aggagtaggg cggagggtag caattggatt ctgcagtgag agcagagggc 840
cagctaagtg gtactctccc agagactgtc tgactcacgc caccccctcc accttggaca 900
caggacgctg tggtttctga gccaggtaca atgactcctt tcggtaagtg cagtggaagc 960
tgtacactgc ccaggcaaag cgtccgggca gcgtaggcgg gcgactcaga tcccagccag 1020
tggacttagc ccctgtttgc tcctccgata actggggtga ccttggttaa tattcaccag 1080
cagcctcccc cgttgcccct ctggatccac tgcttaaata cggacgagga cagggccctg 1140
tctcctcagc ttcaggcacc accactgacc tgggacagtg aatgtttaaa ccgcagccac 1200
catgagcacc gccgtgctgg aaaatcctgg cttgggcagg aaactctctg actttggaca 1260
ggtaagcctg ttgggcttcc actgctagga gagaattggt tccccacatg tgaaagcagt 1320
ctgggaaatg ctggtatttc cagtctccta aggctactaa gaaatatgac tttatttaga 1380
ggcgaggaaa atgcccagga agtcaactga tgagtctagt cttaacaagt tgaggataca 1440
gaaagttggg gatctgagct gctaccaaca tctgtgtgtc tttgggtggc tcattggtat 1500
cctctgccta ttggctttat cttctgtaca ctgaaaggaa atggctggtc cttagtcacc 1560
tacccaggtc ttggatccat agcctacgga tgtcccattt ttattgcttt ttatattttg 1620
tctcccagtg tctttttgag gatttttttt ttttttttgc atcacttgct cttcctctaa 1680
gaatctcctg acttcttgta catgtgtctg atggtcagaa ttttagcact gaagtatggg 1740
cgtatttatc ataattcagg tttatatcct ttcagatatg ggctagggtc tggtattagg 1800
gtgctcatta aaaaatgttg atttttgtca gtgtctagtg acatcaatgc ataatttaag 1860
gttctataaa ttgaaagcta acccaggagt gactcatcct ctcattgttt tcaacttact 1920
tatttctgat cacactgact tccctgtgga atacacgtgg ttcactgtgt tccaaagctt 1980
aacgagcaga aaaaggttat gctcgtctct tcttgagagg ttttaagaga ataattgcta 2040
agctgtgaaa aacattttaa ccaagtgatc taattatgta ggaaacaagc tatattgaag 2100
acaactgcaa tcaaaacggc gccatcagcc tgatcttcag cctgaaagaa gaagtgggcg 2160
ccctggccaa ggtgctgaga ctgttcgaag agaacgacgt gaacctgaca cacatcgaga 2220
gcagacccag cagactgaag aaggacgagt acgagttctt cacccacctg gacaagcgga 2280
gcctgcctgc tctgaccaac atcatcaaga tcctgcggca cgacatcggc gccacagtgc 2340
acgaactgag ccgggacaag aaaaaggaca ccgtgccatg gttccccaga accatccaag 2400
agctggacag attcgccaac cagatcctga gctatggcgc cgagctggac gctgatcacc 2460
ctggctttaa ggaccccgtg taccgggcca gaagaaagca gtttgccgat atcgcctaca 2520
actaccggca cggccagcct attcctcggg tcgagtacat ggaagaggaa aagaaaacct 2580
ggggcaccgt gttcaagacc ctgaagtccc tgtacaagac ccacgcctgc tacgagtaca 2640
accacatctt cccactgctc gaaaagtact gcggcttcca cgaggacaat atccctcagc 2700
ttgaggacgt gtcccagttc ctgcagacct gcaccggctt tagactgagg ccagttgccg 2760
gactgctgag cagcagagat tttctcggcg gcctggcctt cagagtgttc cactgtaccc 2820
agtacatcag acacggcagc aagcccatgt acacccctga gcctgatatc tgccacgagc 2880
tgctgggaca tgtgcccctg ttcagcgata gaagcttcgc ccagttcagc caagagatcg 2940
gactggcttc tctgggagcc cctgacgagt acattgagaa gctggccacc atctactggt 3000
tcaccgtgga attcggcctg tgcaagcagg gcgacagcat caaagcttat ggcgctggcc 3060
tgctgtctag cttcggcgag ctgcagtact gtctgagcga gaagcctaag ctgctgcccc 3120
tggaactgga aaagaccgcc atccagaact acaccgtgac cgagttccag cctctgtact 3180
acgtggccga gagcttcaac gacgccaaag aaaaagtgcg gaacttcgcc gccaccattc 3240
ctcggccttt cagcgtcaga tacgacccct acacacagcg gatcgaggtg ctggacaaca 3300
cacagcagct gaaaattctg gccgactcca tcaacagcga gatcggcatc ctgtgcagcg 3360
ccctgcagaa aatcaagtga tagttaatta agagcatctt accgccattt attcccatat 3420
ttgttctgtt tttcttgatt tgggtataca tttaaatgtt aataaaacaa aatggtgggg 3480
caatcattta catttttagg gatatgtaat tactagttca ggtgtattgc cacaagacaa 3540
acatgttaag aaactttccc gttatttacg ctctgttcct gttaatcaac ctctggatta 3600
caaaatttgt gaaagattga ctgatattct taactatgtt gctcctttta cgctgtgtgg 3660
atatgctgct ttatagcctc tgtatctagc tattgcttcc cgtacggctt tcgttttctc 3720
ctccttgtat aaatcctggt tgctgtctct tttagaggag ttgtggcccg ttgtccgtca 3780
acgtggcgtg gtgtgctctg tgtttgctga cgcaaccccc actggctggg gcattgccac 3840
cacctgtcaa ctcctttctg ggactttcgc tttccccctc ccgatcgcca cggcagaact 3900
catcgccgcc tgccttgccc gctgctggac aggggctagg ttgctgggca ctgataattc 3960
cgtggtgttg tctgtgcctt ctagttgcca gccatctgtt gtttgcccct cccccgtgcc 4020
ttccttgacc ctggaaggtg ccactcccac tgtcctttcc taataaaatg aggaaattgc 4080
atcgcattgt ctgagtaggt gtcattctat tctggggggt ggggtggggc aggacagcaa 4140
gggggaggat tgggaagaca atagcaggca tgctggggat gcggtgggct ctatggctct 4200
agagcatggc tacgtagata agtagcatgg cgggttaatc attaactaca cctgcaggag 4260
gaacccctag tgatggagtt ggccactccc tctctgcgcg ctcgctcgct cactgaggcc 4320
gggcgaccaa aggtcgcccg acgcccgggc ggcctcagtg agcgagcgag cgcgcagctg 4380
cctgcagg 4388
<210> 548
<211> 3972
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 548
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180
cgcaacaggt tagtttgact agcgttaatc attaacgtta atcattaacg ttaatcatta 240
acgttaatca ttaacgttaa tcattaacat cgatgcgaga acttgtgcct ccccgtgttc 300
ctgctctttg tccctctgtc ctacttagac taatatttgc cttgggtact gcaaacagga 360
aatgggggag ggacaggagt agggcggagg gtagcccggg gattctgcag tgagagcaga 420
gggccagcta agtggtactc tcccagagac tgtctgactc acgccacccc ctccaccttg 480
gacacaggac gctgtggttt ctgagccagg tacaatgact cctttcggta agtgcagtgg 540
aagctgtaca ctgcccaggc aaagcgtccg ggcagcgtag gcgggcgact cagatcccag 600
ccagtggact tagcccctgt ttgctcctcc gataactggg gtgaccttgg ttaatattca 660
ccagcagcct cccccgttgc ccctctggat ccactgctta aatacggacg aggacagggc 720
cctgtctcct cagcttcagg caccaccact gacctgggac agtgaatgtt taaaccgcag 780
ccaccatgag caccgccgtg ctggaaaatc ctggcttggg caggaaactc tctgactttg 840
gacaggtaag cctgttgggc ttccactgct aggagagaat tggttcccca catgtgaaag 900
cagtctggga aatgctggta tttccagtct cctaaggcta ctaagaaata tgactttatt 960
tagaggcgag gaaaatgccc aggaagtcaa ctgatgagtc tagtcttaac aagttgagga 1020
tacagaaagt tggggatctg agctgctacc aacatctgtg tgtctttggg tggctcattg 1080
gtatcctctg cctattggct ttatcttctg tacactgaaa ggaaatggct ggtccttagt 1140
cacctaccca ggtcttggat ccatagccta cggatgtccc atttttattg ctttttatat 1200
tttgtctccc agtgtctttt tgaggatttt tttttttttt ttgcatcact tgctcttcct 1260
ctaagaatct cctgacttct tgtacatgtg tctgatggtc agaattttag cactgaagta 1320
tgggcgtatt tatcataatt caggtttata tcctttcaga tatgggctag ggtctggtat 1380
tagggtgctc attaaaaaat gttgattttt gtcagtgtct agtgacatca atgcataatt 1440
taaggttcta taaattgaaa gctaacccag gagtgactca tcctctcatt gttttcaact 1500
tacttatttc tgatcacact gacttccctg tggaatacac gtggttcact gtgttccaaa 1560
gcttaacgag cagaaaaagg ttatgctcgt ctcttcttga gaggttttaa gagaataatt 1620
gctaagctgt gaaaaacatt ttaaccaagt gatctaatta tgtaggaaac aagctatatt 1680
gaagacaact gcaatcaaaa cggcgccatc agcctgatct tcagcctgaa agaagaagtg 1740
ggcgccctgg ccaaggtgct gagactgttc gaagagaacg acgtgaacct gacacacatc 1800
gagagcagac ccagcagact gaagaaggac gagtacgagt tcttcaccca cctggacaag 1860
cggagcctgc ctgctctgac caacatcatc aagatcctgc ggcacgacat cggcgccaca 1920
gtgcacgaac tgagccggga caagaaaaag gacaccgtgc catggttccc cagaaccatc 1980
caagagctgg acagattcgc caaccagatc ctgagctatg gcgccgagct ggacgctgat 2040
caccctggct ttaaggaccc cgtgtaccgg gccagaagaa agcagtttgc cgatatcgcc 2100
tacaactacc ggcacggcca gcctattcct cgggtcgagt acatggaaga ggaaaagaaa 2160
acctggggca ccgtgttcaa gaccctgaag tccctgtaca agacccacgc ctgctacgag 2220
tacaaccaca tcttcccact gctcgaaaag tactgcggct tccacgagga caatatccct 2280
cagcttgagg acgtgtccca gttcctgcag acctgcaccg gctttagact gaggccagtt 2340
gccggactgc tgagcagcag agattttctc ggcggcctgg ccttcagagt gttccactgt 2400
acccagtaca tcagacacgg cagcaagccc atgtacaccc ctgagcctga tatctgccac 2460
gagctgctgg gacatgtgcc cctgttcagc gatagaagct tcgcccagtt cagccaagag 2520
atcggactgg cttctctggg agcccctgac gagtacattg agaagctggc caccatctac 2580
tggttcaccg tggaattcgg cctgtgcaag cagggcgaca gcatcaaagc ttatggcgct 2640
ggcctgctgt ctagcttcgg cgagctgcag tactgtctga gcgagaagcc taagctgctg 2700
cccctggaac tggaaaagac cgccatccag aactacaccg tgaccgagtt ccagcctctg 2760
tactacgtgg ccgagagctt caacgacgcc aaagaaaaag tgcggaactt cgccgccacc 2820
attcctcggc ctttcagcgt cagatacgac ccctacacac agcggatcga ggtgctggac 2880
aacacacagc agctgaaaat tctggccgac tccatcaaca gcgagatcgg catcctgtgc 2940
agcgccctgc agaaaatcaa gtgatagtta attaagagca tcttaccgcc atttattccc 3000
atatttgttc tgtttttctt gatttgggta tacatttaaa tgttaataaa acaaaatggt 3060
ggggcaatca tttacatttt tagggatatg taattactag ttcaggtgta ttgccacaag 3120
acaaacatgt taagaaactt tcccgttatt tacgctctgt tcctgttaat caacctctgg 3180
attacaaaat ttgtgaaaga ttgactgata ttcttaacta tgttgctcct tttacgctgt 3240
gtggatatgc tgctttatag cctctgtatc tagctattgc ttcccgtacg gctttcgttt 3300
tctcctcctt gtataaatcc tggttgctgt ctcttttaga ggagttgtgg cccgttgtcc 3360
gtcaacgtgg cgtggtgtgc tctgtgtttg ctgacgcaac ccccactggc tggggcattg 3420
ccaccacctg tcaactcctt tctgggactt tcgctttccc cctcccgatc gccacggcag 3480
aactcatcgc cgcctgcctt gcccgctgct ggacaggggc taggttgctg ggcactgata 3540
attccgtggt gttgtctgtg ccttctagtt gccagccatc tgttgtttgc ccctcccccg 3600
tgccttcctt gaccctggaa ggtgccactc ccactgtcct ttcctaataa aatgaggaaa 3660
ttgcatcgca ttgtctgagt aggtgtcatt ctattctggg gggtggggtg gggcaggaca 3720
gcaaggggga ggattgggaa gacaatagca ggcatgctgg ggatgcggtg ggctctatgg 3780
ctctagagca tggctacgta gataagtagc atggcgggtt aatcattaac tacacctgca 3840
ggaggaaccc ctagtgatgg agttggccac tccctctctg cgcgctcgct cgctcactga 3900
ggccgggcga ccaaaggtcg cccgacgccc gggcggcctc agtgagcgag cgagcgcgca 3960
gctgcctgca gg 3972
<210> 549
<211> 4016
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 549
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180
cgcagcaaca gatcattcta tgggttaatc attaacaaca ggttaggtta atcattaact 240
tggctcctag ttaatcatta acaaacagta tggttaatca ttaacaaatt ctggggttaa 300
tcattaacta gttacctagc gagaacttgt gcctccccgt gttcctgctc tttgtccctc 360
tgtcctactt agactaatat ttgccttggg tactgcaaac aggaaatggg ggagggacag 420
gagtagggcg gagggtagca attggattct gcagtgagag cagagggcca gctaagtggt 480
actctcccag agactgtctg actcacgcca ccccctccac cttggacaca ggacgctgtg 540
gtttctgagc caggtacaat gactcctttc ggtaagtgca gtggaagctg tacactgccc 600
aggcaaagcg tccgggcagc gtaggcgggc gactcagatc ccagccagtg gacttagccc 660
ctgtttgctc ctccgataac tggggtgacc ttggttaata ttcaccagca gcctcccccg 720
ttgcccctct ggatccactg cttaaatacg gacgaggaca gggccctgtc tcctcagctt 780
caggcaccac cactgacctg ggacagtgaa tgtttaaacc gcagccacca tgagcaccgc 840
cgtgctggaa aatcctggct tgggcaggaa actctctgac tttggacagg taagcctgtt 900
gggcttccac tgctaggaga gaattggttc cccacatgtg aaagcagtct gggaaatgct 960
ggtatttcca gtctcctaag gctactaaga aatatgactt tatttagagg cgaggaaaat 1020
gcccaggaag tcaactgatg agtctagtct taacaagttg aggatacaga aagttgggga 1080
tctgagctgc taccaacatc tgtgtgtctt tgggtggctc attggtatcc tctgcctatt 1140
ggctttatct tctgtacact gaaaggaaat ggctggtcct tagtcaccta cccaggtctt 1200
ggatccatag cctacggatg tcccattttt attgcttttt atattttgtc tcccagtgtc 1260
tttttgagga tttttttttt ttttttgcat cacttgctct tcctctaaga atctcctgac 1320
ttcttgtaca tgtgtctgat ggtcagaatt ttagcactga agtatgggcg tatttatcat 1380
aattcaggtt tatatccttt cagatatggg ctagggtctg gtattagggt gctcattaaa 1440
aaatgttgat ttttgtcagt gtctagtgac atcaatgcat aatttaaggt tctataaatt 1500
gaaagctaac ccaggagtga ctcatcctct cattgttttc aacttactta tttctgatca 1560
cactgacttc cctgtggaat acacgtggtt cactgtgttc caaagcttaa cgagcagaaa 1620
aaggttatgc tcgtctcttc ttgagaggtt ttaagagaat aattgctaag ctgtgaaaaa 1680
cattttaacc aagtgatcta attatgtagg aaacaagcta tattgaagac aactgcaatc 1740
aaaacggcgc catcagcctg atcttcagcc tgaaagaaga agtgggcgcc ctggccaagg 1800
tgctgagact gttcgaagag aacgacgtga acctgacaca catcgagagc agacccagca 1860
gactgaagaa ggacgagtac gagttcttca cccacctgga caagcggagc ctgcctgctc 1920
tgaccaacat catcaagatc ctgcggcacg acatcggcgc cacagtgcac gaactgagcc 1980
gggacaagaa aaaggacacc gtgccatggt tccccagaac catccaagag ctggacagat 2040
tcgccaacca gatcctgagc tatggcgccg agctggacgc tgatcaccct ggctttaagg 2100
accccgtgta ccgggccaga agaaagcagt ttgccgatat cgcctacaac taccggcacg 2160
gccagcctat tcctcgggtc gagtacatgg aagaggaaaa gaaaacctgg ggcaccgtgt 2220
tcaagaccct gaagtccctg tacaagaccc acgcctgcta cgagtacaac cacatcttcc 2280
cactgctcga aaagtactgc ggcttccacg aggacaatat ccctcagctt gaggacgtgt 2340
cccagttcct gcagacctgc accggcttta gactgaggcc agttgccgga ctgctgagca 2400
gcagagattt tctcggcggc ctggccttca gagtgttcca ctgtacccag tacatcagac 2460
acggcagcaa gcccatgtac acccctgagc ctgatatctg ccacgagctg ctgggacatg 2520
tgcccctgtt cagcgataga agcttcgccc agttcagcca agagatcgga ctggcttctc 2580
tgggagcccc tgacgagtac attgagaagc tggccaccat ctactggttc accgtggaat 2640
tcggcctgtg caagcagggc gacagcatca aagcttatgg cgctggcctg ctgtctagct 2700
tcggcgagct gcagtactgt ctgagcgaga agcctaagct gctgcccctg gaactggaaa 2760
agaccgccat ccagaactac accgtgaccg agttccagcc tctgtactac gtggccgaga 2820
gcttcaacga cgccaaagaa aaagtgcgga acttcgccgc caccattcct cggcctttca 2880
gcgtcagata cgacccctac acacagcgga tcgaggtgct ggacaacaca cagcagctga 2940
aaattctggc cgactccatc aacagcgaga tcggcatcct gtgcagcgcc ctgcagaaaa 3000
tcaagtgata gttaattaag agcatcttac cgccatttat tcccatattt gttctgtttt 3060
tcttgatttg ggtatacatt taaatgttaa taaaacaaaa tggtggggca atcatttaca 3120
tttttaggga tatgtaatta ctagttcagg tgtattgcca caagacaaac atgttaagaa 3180
actttcccgt tatttacgct ctgttcctgt taatcaacct ctggattaca aaatttgtga 3240
aagattgact gatattctta actatgttgc tccttttacg ctgtgtggat atgctgcttt 3300
atagcctctg tatctagcta ttgcttcccg tacggctttc gttttctcct ccttgtataa 3360
atcctggttg ctgtctcttt tagaggagtt gtggcccgtt gtccgtcaac gtggcgtggt 3420
gtgctctgtg tttgctgacg caacccccac tggctggggc attgccacca cctgtcaact 3480
cctttctggg actttcgctt tccccctccc gatcgccacg gcagaactca tcgccgcctg 3540
ccttgcccgc tgctggacag gggctaggtt gctgggcact gataattccg tggtgttgtc 3600
tgtgccttct agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct 3660
ggaaggtgcc actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct 3720
gagtaggtgt cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg 3780
ggaagacaat agcaggcatg ctggggatgc ggtgggctct atggctctag agcatggcta 3840
cgtagataag tagcatggcg ggttaatcat taactacacc tgcaggagga acccctagtg 3900
atggagttgg ccactccctc tctgcgcgct cgctcgctca ctgaggccgg gcgaccaaag 3960
gtcgcccgac gcccgggcgg cctcagtgag cgagcgagcg cgcagctgcc tgcagg 4016
<210> 550
<211> 4343
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 550
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180
cgcaggctca gaggcacaca ggagtttctg ggctcaccct gcccccttcc aacccctcag 240
ttcccatcct ccagcagctg tttgtgtgct gcctctgaag tccacactga acaaacttca 300
gcctactcat gtccctaaaa tgggcaaaca ttgcaagcag caaacagcaa acacacagcc 360
ctccctgcct gctgaccttg gagctggggc agaggtcaga gacctctctg ggcccatgcc 420
acctccaaca tccactcgac cccttggaat ttcggtggag aggagcagag gttgtcctgg 480
cgtggtttag gtagtgtgag agggcttaag agcaacagat cattctatgg gttaatcatt 540
aacaacaggt taggttaatc attaacttgg ctcctagtta atcattaaca aacagtatgg 600
ttaatcatta acaaattctg gggttaatca ttaactagtt acctagcgag aacttgtgcc 660
tccccgtgtt cctgctcttt gtccctctgt cctacttaga ctaatatttg ccttgggtac 720
tgcaaacagg aaatggggga gggacaggag tagggcggag ggtagcaatt ggattctgca 780
gtgagagcag agggccagct aagtggtact ctcccagaga ctgtctgact cacgccaccc 840
cctccacctt ggacacagga cgctgtggtt tctgagccag gtacaatgac tcctttcggt 900
aagtgcagtg gaagctgtac actgcccagg caaagcgtcc gggcagcgta ggcgggcgac 960
tcagatccca gccagtggac ttagcccctg tttgctcctc cgataactgg ggtgaccttg 1020
gttaatattc accagcagcc tcccccgttg cccctctgga tccactgctt aaatacggac 1080
gaggacaggg ccctgtctcc tcagcttcag gcaccaccac tgacctggga cagtgaatgt 1140
ttaaaccgca gccaccatga gcaccgccgt gctggaaaat cctggcttgg gcaggaaact 1200
ctctgacttt ggacaggtaa gcctgttggg cttccactgc taggagagaa ttggttcccc 1260
acatgtgaaa gcagtctggg aaatgctggt atttccagtc tcctaaggct actaagaaat 1320
atgactttat ttagaggcga ggaaaatgcc caggaagtca actgatgagt ctagtcttaa 1380
caagttgagg atacagaaag ttggggatct gagctgctac caacatctgt gtgtctttgg 1440
gtggctcatt ggtatcctct gcctattggc tttatcttct gtacactgaa aggaaatggc 1500
tggtccttag tcacctaccc aggtcttgga tccatagcct acggatgtcc catttttatt 1560
gctttttata ttttgtctcc cagtgtcttt ttgaggattt tttttttttt tttgcatcac 1620
ttgctcttcc tctaagaatc tcctgacttc ttgtacatgt gtctgatggt cagaatttta 1680
gcactgaagt atgggcgtat ttatcataat tcaggtttat atcctttcag atatgggcta 1740
gggtctggta ttagggtgct cattaaaaaa tgttgatttt tgtcagtgtc tagtgacatc 1800
aatgcataat ttaaggttct ataaattgaa agctaaccca ggagtgactc atcctctcat 1860
tgttttcaac ttacttattt ctgatcacac tgacttccct gtggaataca cgtggttcac 1920
tgtgttccaa agcttaacga gcagaaaaag gttatgctcg tctcttcttg agaggtttta 1980
agagaataat tgctaagctg tgaaaaacat tttaaccaag tgatctaatt atgtaggaaa 2040
caagctatat tgaagacaac tgcaatcaaa acggcgccat cagcctgatc ttcagcctga 2100
aagaagaagt gggcgccctg gccaaggtgc tgagactgtt cgaagagaac gacgtgaacc 2160
tgacacacat cgagagcaga cccagcagac tgaagaagga cgagtacgag ttcttcaccc 2220
acctggacaa gcggagcctg cctgctctga ccaacatcat caagatcctg cggcacgaca 2280
tcggcgccac agtgcacgaa ctgagccggg acaagaaaaa ggacaccgtg ccatggttcc 2340
ccagaaccat ccaagagctg gacagattcg ccaaccagat cctgagctat ggcgccgagc 2400
tggacgctga tcaccctggc tttaaggacc ccgtgtaccg ggccagaaga aagcagtttg 2460
ccgatatcgc ctacaactac cggcacggcc agcctattcc tcgggtcgag tacatggaag 2520
aggaaaagaa aacctggggc accgtgttca agaccctgaa gtccctgtac aagacccacg 2580
cctgctacga gtacaaccac atcttcccac tgctcgaaaa gtactgcggc ttccacgagg 2640
acaatatccc tcagcttgag gacgtgtccc agttcctgca gacctgcacc ggctttagac 2700
tgaggccagt tgccggactg ctgagcagca gagattttct cggcggcctg gccttcagag 2760
tgttccactg tacccagtac atcagacacg gcagcaagcc catgtacacc cctgagcctg 2820
atatctgcca cgagctgctg ggacatgtgc ccctgttcag cgatagaagc ttcgcccagt 2880
tcagccaaga gatcggactg gcttctctgg gagcccctga cgagtacatt gagaagctgg 2940
ccaccatcta ctggttcacc gtggaattcg gcctgtgcaa gcagggcgac agcatcaaag 3000
cttatggcgc tggcctgctg tctagcttcg gcgagctgca gtactgtctg agcgagaagc 3060
ctaagctgct gcccctggaa ctggaaaaga ccgccatcca gaactacacc gtgaccgagt 3120
tccagcctct gtactacgtg gccgagagct tcaacgacgc caaagaaaaa gtgcggaact 3180
tcgccgccac cattcctcgg cctttcagcg tcagatacga cccctacaca cagcggatcg 3240
aggtgctgga caacacacag cagctgaaaa ttctggccga ctccatcaac agcgagatcg 3300
gcatcctgtg cagcgccctg cagaaaatca agtgatagtt aattaagagc atcttaccgc 3360
catttattcc catatttgtt ctgtttttct tgatttgggt atacatttaa atgttaataa 3420
aacaaaatgg tggggcaatc atttacattt ttagggatat gtaattacta gttcaggtgt 3480
attgccacaa gacaaacatg ttaagaaact ttcccgttat ttacgctctg ttcctgttaa 3540
tcaacctctg gattacaaaa tttgtgaaag attgactgat attcttaact atgttgctcc 3600
ttttacgctg tgtggatatg ctgctttata gcctctgtat ctagctattg cttcccgtac 3660
ggctttcgtt ttctcctcct tgtataaatc ctggttgctg tctcttttag aggagttgtg 3720
gcccgttgtc cgtcaacgtg gcgtggtgtg ctctgtgttt gctgacgcaa cccccactgg 3780
ctggggcatt gccaccacct gtcaactcct ttctgggact ttcgctttcc ccctcccgat 3840
cgccacggca gaactcatcg ccgcctgcct tgcccgctgc tggacagggg ctaggttgct 3900
gggcactgat aattccgtgg tgttgtctgt gccttctagt tgccagccat ctgttgtttg 3960
cccctccccc gtgccttcct tgaccctgga aggtgccact cccactgtcc tttcctaata 4020
aaatgaggaa attgcatcgc attgtctgag taggtgtcat tctattctgg ggggtggggt 4080
ggggcaggac agcaaggggg aggattggga agacaatagc aggcatgctg gggatgcggt 4140
gggctctatg gctctagagc atggctacgt agataagtag catggcgggt taatcattaa 4200
ctacacctgc aggaggaacc cctagtgatg gagttggcca ctccctctct gcgcgctcgc 4260
tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggcggcct cagtgagcga 4320
gcgagcgcgc agctgcctgc agg 4343
<210> 551
<211> 3916
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 551
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180
cgccggggga ggctgctggt gaatattaac caaggtcacc ccagttatcg gaggagcaaa 240
caggggctaa gtccacacgc gtggtaccgt ctgtctgcac atttcgtaga gcgagtgttc 300
cgatactcta atctccctag gcaaggttca tatttgtgta ggttacttat tctccttttg 360
ttgactaagt caataatcag aatcagcagg tttggagtca gcttggcagg gatcagcagc 420
ctgggttgga aggagggggt ataaaagccc cttcaccagg agaagccgtc acacagatcc 480
acaagctcct gaagaggtaa gggtttaagg gatggttggt tggtggggta ttaatgttta 540
attacctgga gcacctgcct gaaatcactt tttttcaggt tggtttaaac cgcagccacc 600
atgagcaccg ccgtgctgga aaatcctggc ttgggcagga aactctctga ctttggacag 660
gtgagccacg gcagcctgag ctgctcagtt aggggaattt gggcctccag agaaagagat 720
ccgaagactg ctggtgcttc ctggtttcat aagctcagta agaagtctga attcgttgga 780
agctgatgat agaagaaaga gttcatgctt gctttgtcca tggaggttta acaggaatga 840
attgctaaac tgtggaaaat gttttaaaca aatgcatctt atcctgtagg aaacaagcta 900
tattgaagac aactgcaatc aaaacggcgc catcagcctg atcttcagcc tgaaagaaga 960
agtgggcgcc ctggccaagg tgctgagact gttcgaagag aacgacgtga acctgacaca 1020
catcgagagc agacccagca gactgaagaa ggacgagtac gagttcttca cccacctgga 1080
caagcggagc ctgcctgctc tgaccaacat catcaagatc ctgcggcacg acatcggcgc 1140
cacagtgcac gaactgagcc gggacaagaa aaaggacacc gtgccatggt tccccagaac 1200
catccaagag ctggacagat tcgccaacca gatcctgagc tatggcgccg agctggacgc 1260
tgatcaccct ggctttaagg accccgtgta ccgggccaga agaaagcagt ttgccgatat 1320
cgcctacaac taccggcacg gccagcctat tcctcgggtc gagtacatgg aagaggaaaa 1380
gaaaacctgg ggcaccgtgt tcaagaccct gaagtccctg tacaagaccc acgcctgcta 1440
cgagtacaac cacatcttcc cactgctcga aaagtactgc ggcttccacg aggacaatat 1500
ccctcagctt gaggacgtgt cccagttcct gcagacctgc accggcttta gactgaggcc 1560
agttgccgga ctgctgagca gcagagattt tctcggcggc ctggccttca gagtgttcca 1620
ctgtacccag tacatcagac acggcagcaa gcccatgtac acccctgagc ctgatatctg 1680
ccacgagctg ctgggacatg tgcccctgtt cagcgataga agcttcgccc agttcagcca 1740
agagatcgga ctggcttctc tgggagcccc tgacgagtac attgagaagc tggccaccat 1800
ctactggttc accgtggaat tcggcctgtg caagcagggc gacagcatca aagcttatgg 1860
cgctggcctg ctgtctagct tcggcgagct gcagtactgt ctgagcgaga agcctaagct 1920
gctgcccctg gaactggaaa agaccgccat ccagaactac accgtgaccg agttccagcc 1980
tctgtactac gtggccgaga gcttcaacga cgccaaagaa aaagtgcgga acttcgccgc 2040
caccattcct cggcctttca gcgtcagata cgacccctac acacagcgga tcgaggtgct 2100
ggacaacaca cagcagctga aaattctggc cgactccatc aacagcgaga tcggcatcct 2160
gtgcagcgcc ctgcagaaaa tcaagtgata gttaattaag agcatcttac cgccatttat 2220
tcccatattt gttctgtttt tcttgatttg ggtatacatt taaatgttaa taaaacaaaa 2280
tggtggggca atcatttaca tttttaggga tatgtaatta ctagttcagg tgtattgcca 2340
caagacaaac atgttaagaa actttcccgt tatttacgct ctgttcctgt taatcaacct 2400
ctggattaca aaatttgtga aagattgact gatattctta actatgttgc tccttttacg 2460
ctgtgtggat atgctgcttt atagcctctg tatctagcta ttgcttcccg tacggctttc 2520
gttttctcct ccttgtataa atcctggttg ctgtctcttt tagaggagtt gtggcccgtt 2580
gtccgtcaac gtggcgtggt gtgctctgtg tttgctgacg caacccccac tggctggggc 2640
attgccacca cctgtcaact cctttctggg actttcgctt tccccctccc gatcgccacg 2700
gcagaactca tcgccgcctg ccttgcccgc tgctggacag gggctaggtt gctgggcact 2760
gataattccg tggtgttgtc tgtgccttct agttgccagc catctgttgt ttgcccctcc 2820
cccgtgcctt ccttgaccct ggaaggtgcc actcccactg tcctttccta ataaaatgag 2880
gaaattgcat cgcattgtct gagtaggtgt cattctattc tggggggtgg ggtggggcag 2940
gacagcaagg gggaggattg ggaagacaat agcaggcatg ctggggatgc ggtgggctct 3000
atggccttaa gaacaggtta gtttgactag cgggaggtgg tccctgcagt tacgccaatg 3060
ataacccccg ccagaaaaat cttagtagcc ttcccttttt gttttccgtg ccccaactcg 3120
gcggattgac tcggcccctt ccggaaacac ccgaatcaac ttctagtcaa attattgttc 3180
acgccgcaat gacccacccc tggcccgcgt ctgtggaact gacccctggt gtacaggaga 3240
gttcgctgct gaaagtggtc ccaaaggggt actagttttt aagctcccaa ctccccctcc 3300
cccagcgtct ggaggattcc acaccctcgc accgcagggg cgaggaagtg ggcggagtcc 3360
ggttttggcg ccagccgctg aggctgccaa gcagaaaagc caccgctgag gagactccgg 3420
tcactgtcct cgccccgcct cccccttccc tccccttggg gaccaccggg cgccacgccg 3480
cgaacgttaa gtgccgcggt cgtcggcgcc tccgccctcc cccttgggcc ccaattccca 3540
gcgggcgcgg cgcgcggccc ctccccccgc cgggcgcgcg cccgctgccc cgcccttcgt 3600
ggccgcccgg cgtgggcggt gccacccctc cccccggcgg ccccgcgcgc agctcccggc 3660
tccctccccc ttcggatgtg gcttgagctg taggcgcgga gggccagaga cttcacaacc 3720
tagtttctag agcatggcta cgtagataag tagcatggcg ggttaatcat taactacacc 3780
tgcaggagga acccctagtg atggagttgg ccactccctc tctgcgcgct cgctcgctca 3840
ctgaggccgg gcgaccaaag gtcgcccgac gcccgggcgg cctcagtgag cgagcgagcg 3900
cgcagctgcc tgcagg 3916
<210> 552
<211> 3916
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 552
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180
cgccggggga ggctgctggt gaatattaac caaggtcacc ccagttatcg gaggagcaaa 240
caggggctaa gtccacacgc gtggtaccgt ctgtctgcac atttcgtaga gcgagtgttc 300
cgatactcta atctccctag gcaaggttca tatttgtgta ggttacttat tctccttttg 360
ttgactaagt caataatcag aatcagcagg tttggagtca gcttggcagg gatcagcagc 420
ctgggttgga aggagggggt ataaaagccc cttcaccagg agaagccgtc acacagatcc 480
acaagctcct gaagaggtaa gggtttaagg gatggttggt tggtggggta ttaatgttta 540
attacctgga gcacctgcct gaaatcactt tttttcaggt tggtttaaac cgcagccacc 600
atgagcaccg ccgtgctgga aaatcctggc ttgggcagga aactctctga ctttggacag 660
gtgagccacg gcagcctgag ctgctcagtt aggggaattt gggcctccag agaaagagat 720
ccgaagactg ctggtgcttc ctggtttcat aagctcagta agaagtctga attcgttgga 780
agctgatgat agaagaaaga gttcatgctt gctttgtcca tggaggttta acaggaatga 840
attgctaaac tgtggaaaat gttttaaaca aatgcatctt atcctgtagg aaacaagcta 900
tattgaagac aactgcaatc aaaacggcgc catcagcctg atcttcagcc tgaaagaaga 960
agtgggcgcc ctggccaagg tgctgagact gttcgaagag aacgacgtga acctgacaca 1020
catcgagagc agacccagca gactgaagaa ggacgagtac gagttcttca cccacctgga 1080
caagcggagc ctgcctgctc tgaccaacat catcaagatc ctgcggcacg acatcggcgc 1140
cacagtgcac gaactgagcc gggacaagaa aaaggacacc gtgccatggt tccccagaac 1200
catccaagag ctggacagat tcgccaacca gatcctgagc tatggcgccg agctggacgc 1260
tgatcaccct ggctttaagg accccgtgta ccgggccaga agaaagcagt ttgccgatat 1320
cgcctacaac taccggcacg gccagcctat tcctcgggtc gagtacatgg aagaggaaaa 1380
gaaaacctgg ggcaccgtgt tcaagaccct gaagtccctg tacaagaccc acgcctgcta 1440
cgagtacaac cacatcttcc cactgctcga aaagtactgc ggcttccacg aggacaatat 1500
ccctcagctt gaggacgtgt cccagttcct gcagacctgc accggcttta gactgaggcc 1560
agttgccgga ctgctgagca gcagagattt tctcggcggc ctggccttca gagtgttcca 1620
ctgtacccag tacatcagac acggcagcaa gcccatgtac acccctgagc ctgatatctg 1680
ccacgagctg ctgggacatg tgcccctgtt cagcgataga agcttcgccc agttcagcca 1740
agagatcgga ctggcttctc tgggagcccc tgacgagtac attgagaagc tggccaccat 1800
ctactggttc accgtggaat tcggcctgtg caagcagggc gacagcatca aagcttatgg 1860
cgctggcctg ctgtctagct tcggcgagct gcagtactgt ctgagcgaga agcctaagct 1920
gctgcccctg gaactggaaa agaccgccat ccagaactac accgtgaccg agttccagcc 1980
tctgtactac gtggccgaga gcttcaacga cgccaaagaa aaagtgcgga acttcgccgc 2040
caccattcct cggcctttca gcgtcagata cgacccctac acacagcgga tcgaggtgct 2100
ggacaacaca cagcagctga aaattctggc cgactccatc aacagcgaga tcggcatcct 2160
gtgcagcgcc ctgcagaaaa tcaagtgata gttaattaag agcatcttac cgccatttat 2220
tcccatattt gttctgtttt tcttgatttg ggtatacatt taaatgttaa taaaacaaaa 2280
tggtggggca atcatttaca tttttaggga tatgtaatta ctagttcagg tgtattgcca 2340
caagacaaac atgttaagaa actttcccgt tatttacgct ctgttcctgt taatcaacct 2400
ctggattaca aaatttgtga aagattgact gatattctta actatgttgc tccttttacg 2460
ctgtgtggat atgctgcttt atagcctctg tatctagcta ttgcttcccg tacggctttc 2520
gttttctcct ccttgtataa atcctggttg ctgtctcttt tagaggagtt gtggcccgtt 2580
gtccgtcaac gtggcgtggt gtgctctgtg tttgctgacg caacccccac tggctggggc 2640
attgccacca cctgtcaact cctttctggg actttcgctt tccccctccc gatcgccacg 2700
gcagaactca tcgccgcctg ccttgcccgc tgctggacag gggctaggtt gctgggcact 2760
gataattccg tggtgttgtc tgtgccttct agttgccagc catctgttgt ttgcccctcc 2820
cccgtgcctt ccttgaccct ggaaggtgcc actcccactg tcctttccta ataaaatgag 2880
gaaattgcat cgcattgtct gagtaggtgt cattctattc tggggggtgg ggtggggcag 2940
gacagcaagg gggaggattg ggaagacaat agcaggcatg ctggggatgc ggtgggctct 3000
atggccttaa gaactaggtt gtgaagtctc tggccctccg cgcctacagc tcaagccaca 3060
tccgaagggg gagggagccg ggagctgcgc gcggggccgc cggggggagg ggtggcaccg 3120
cccacgccgg gcggccacga agggcggggc agcgggcgcg cgcccggcgg ggggaggggc 3180
cgcgcgccgc gcccgctggg aattggggcc caagggggag ggcggaggcg ccgacgaccg 3240
cggcacttaa cgttcgcggc gtggcgcccg gtggtcccca aggggaggga agggggaggc 3300
ggggcgagga cagtgaccgg agtctcctca gcggtggctt ttctgcttgg cagcctcagc 3360
ggctggcgcc aaaaccggac tccgcccact tcctcgcccc tgcggtgcga gggtgtggaa 3420
tcctccagac gctgggggag ggggagttgg gagcttaaaa actagtaccc ctttgggacc 3480
actttcagca gcgaactctc ctgtacacca ggggtcagtt ccacagacgc gggccagggg 3540
tgggtcattg cggcgtgaac aataatttga ctagaagttg attcgggtgt ttccggaagg 3600
ggccgagtca atccgccgag ttggggcacg gaaaacaaaa agggaaggct actaagattt 3660
ttctggcggg ggttatcatt ggcgtaactg cagggaccac ctcccgctag tcaaactaac 3720
ctgtttctag agcatggcta cgtagataag tagcatggcg ggttaatcat taactacacc 3780
tgcaggagga acccctagtg atggagttgg ccactccctc tctgcgcgct cgctcgctca 3840
ctgaggccgg gcgaccaaag gtcgcccgac gcccgggcgg cctcagtgag cgagcgagcg 3900
cgcagctgcc tgcagg 3916
<210> 553
<211> 3916
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 553
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180
cgcaacaggt tagtttgact agcgggaggt ggtccctgca gttacgccaa tgataacccc 240
cgccagaaaa atcttagtag ccttcccttt ttgttttccg tgccccaact cggcggattg 300
actcggcccc ttccggaaac acccgaatca acttctagtc aaattattgt tcacgccgca 360
atgacccacc cctggcccgc gtctgtggaa ctgacccctg gtgtacagga gagttcgctg 420
ctgaaagtgg tcccaaaggg gtactagttt ttaagctccc aactccccct cccccagcgt 480
ctggaggatt ccacaccctc gcaccgcagg ggcgaggaag tgggcggagt ccggttttgg 540
cgccagccgc tgaggctgcc aagcagaaaa gccaccgctg aggagactcc ggtcactgtc 600
ctcgccccgc ctcccccttc cctccccttg gggaccaccg ggcgccacgc cgcgaacgtt 660
aagtgccgcg gtcgtcggcg cctccgccct cccccttggg ccccaattcc cagcgggcgc 720
ggcgcgcggc ccctcccccc gccgggcgcg cgcccgctgc cccgcccttc gtggccgccc 780
ggcgtgggcg gtgccacccc tccccccggc ggccccgcgc gcagctcccg gctccctccc 840
ccttcggatg tggcttgagc tgtaggcgcg gagggccaga gacttcacaa cctagttcat 900
atgcggggga ggctgctggt gaatattaac caaggtcacc ccagttatcg gaggagcaaa 960
caggggctaa gtccacacgc gtggtaccgt ctgtctgcac atttcgtaga gcgagtgttc 1020
cgatactcta atctccctag gcaaggttca tatttgtgta ggttacttat tctccttttg 1080
ttgactaagt caataatcag aatcagcagg tttggagtca gcttggcagg gatcagcagc 1140
ctgggttgga aggagggggt ataaaagccc cttcaccagg agaagccgtc acacagatcc 1200
acaagctcct gaagaggtaa gggtttaagg gatggttggt tggtggggta ttaatgttta 1260
attacctgga gcacctgcct gaaatcactt tttttcaggt tggtttaaac cgcagccacc 1320
atgagcaccg ccgtgctgga aaatcctggc ttgggcagga aactctctga ctttggacag 1380
gtgagccacg gcagcctgag ctgctcagtt aggggaattt gggcctccag agaaagagat 1440
ccgaagactg ctggtgcttc ctggtttcat aagctcagta agaagtctga attcgttgga 1500
agctgatgat agaagaaaga gttcatgctt gctttgtcca tggaggttta acaggaatga 1560
attgctaaac tgtggaaaat gttttaaaca aatgcatctt atcctgtagg aaacaagcta 1620
tattgaagac aactgcaatc aaaacggcgc catcagcctg atcttcagcc tgaaagaaga 1680
agtgggcgcc ctggccaagg tgctgagact gttcgaagag aacgacgtga acctgacaca 1740
catcgagagc agacccagca gactgaagaa ggacgagtac gagttcttca cccacctgga 1800
caagcggagc ctgcctgctc tgaccaacat catcaagatc ctgcggcacg acatcggcgc 1860
cacagtgcac gaactgagcc gggacaagaa aaaggacacc gtgccatggt tccccagaac 1920
catccaagag ctggacagat tcgccaacca gatcctgagc tatggcgccg agctggacgc 1980
tgatcaccct ggctttaagg accccgtgta ccgggccaga agaaagcagt ttgccgatat 2040
cgcctacaac taccggcacg gccagcctat tcctcgggtc gagtacatgg aagaggaaaa 2100
gaaaacctgg ggcaccgtgt tcaagaccct gaagtccctg tacaagaccc acgcctgcta 2160
cgagtacaac cacatcttcc cactgctcga aaagtactgc ggcttccacg aggacaatat 2220
ccctcagctt gaggacgtgt cccagttcct gcagacctgc accggcttta gactgaggcc 2280
agttgccgga ctgctgagca gcagagattt tctcggcggc ctggccttca gagtgttcca 2340
ctgtacccag tacatcagac acggcagcaa gcccatgtac acccctgagc ctgatatctg 2400
ccacgagctg ctgggacatg tgcccctgtt cagcgataga agcttcgccc agttcagcca 2460
agagatcgga ctggcttctc tgggagcccc tgacgagtac attgagaagc tggccaccat 2520
ctactggttc accgtggaat tcggcctgtg caagcagggc gacagcatca aagcttatgg 2580
cgctggcctg ctgtctagct tcggcgagct gcagtactgt ctgagcgaga agcctaagct 2640
gctgcccctg gaactggaaa agaccgccat ccagaactac accgtgaccg agttccagcc 2700
tctgtactac gtggccgaga gcttcaacga cgccaaagaa aaagtgcgga acttcgccgc 2760
caccattcct cggcctttca gcgtcagata cgacccctac acacagcgga tcgaggtgct 2820
ggacaacaca cagcagctga aaattctggc cgactccatc aacagcgaga tcggcatcct 2880
gtgcagcgcc ctgcagaaaa tcaagtgata gttaattaag agcatcttac cgccatttat 2940
tcccatattt gttctgtttt tcttgatttg ggtatacatt taaatgttaa taaaacaaaa 3000
tggtggggca atcatttaca tttttaggga tatgtaatta ctagttcagg tgtattgcca 3060
caagacaaac atgttaagaa actttcccgt tatttacgct ctgttcctgt taatcaacct 3120
ctggattaca aaatttgtga aagattgact gatattctta actatgttgc tccttttacg 3180
ctgtgtggat atgctgcttt atagcctctg tatctagcta ttgcttcccg tacggctttc 3240
gttttctcct ccttgtataa atcctggttg ctgtctcttt tagaggagtt gtggcccgtt 3300
gtccgtcaac gtggcgtggt gtgctctgtg tttgctgacg caacccccac tggctggggc 3360
attgccacca cctgtcaact cctttctggg actttcgctt tccccctccc gatcgccacg 3420
gcagaactca tcgccgcctg ccttgcccgc tgctggacag gggctaggtt gctgggcact 3480
gataattccg tggtgttgtc tgtgccttct agttgccagc catctgttgt ttgcccctcc 3540
cccgtgcctt ccttgaccct ggaaggtgcc actcccactg tcctttccta ataaaatgag 3600
gaaattgcat cgcattgtct gagtaggtgt cattctattc tggggggtgg ggtggggcag 3660
gacagcaagg gggaggattg ggaagacaat agcaggcatg ctggggatgc ggtgggctct 3720
atggctctag agcatggcta cgtagataag tagcatggcg ggttaatcat taactacacc 3780
tgcaggagga acccctagtg atggagttgg ccactccctc tctgcgcgct cgctcgctca 3840
ctgaggccgg gcgaccaaag gtcgcccgac gcccgggcgg cctcagtgag cgagcgagcg 3900
cgcagctgcc tgcagg 3916
<210> 554
<211> 3916
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 554
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180
cgcaactagg ttgtgaagtc tctggccctc cgcgcctaca gctcaagcca catccgaagg 240
gggagggagc cgggagctgc gcgcggggcc gccgggggga ggggtggcac cgcccacgcc 300
gggcggccac gaagggcggg gcagcgggcg cgcgcccggc ggggggaggg gccgcgcgcc 360
gcgcccgctg ggaattgggg cccaaggggg agggcggagg cgccgacgac cgcggcactt 420
aacgttcgcg gcgtggcgcc cggtggtccc caaggggagg gaagggggag gcggggcgag 480
gacagtgacc ggagtctcct cagcggtggc ttttctgctt ggcagcctca gcggctggcg 540
ccaaaaccgg actccgccca cttcctcgcc cctgcggtgc gagggtgtgg aatcctccag 600
acgctggggg agggggagtt gggagcttaa aaactagtac ccctttggga ccactttcag 660
cagcgaactc tcctgtacac caggggtcag ttccacagac gcgggccagg ggtgggtcat 720
tgcggcgtga acaataattt gactagaagt tgattcgggt gtttccggaa ggggccgagt 780
caatccgccg agttggggca cggaaaacaa aaagggaagg ctactaagat ttttctggcg 840
ggggttatca ttggcgtaac tgcagggacc acctcccgct agtcaaacta acctgttcat 900
atgcggggga ggctgctggt gaatattaac caaggtcacc ccagttatcg gaggagcaaa 960
caggggctaa gtccacacgc gtggtaccgt ctgtctgcac atttcgtaga gcgagtgttc 1020
cgatactcta atctccctag gcaaggttca tatttgtgta ggttacttat tctccttttg 1080
ttgactaagt caataatcag aatcagcagg tttggagtca gcttggcagg gatcagcagc 1140
ctgggttgga aggagggggt ataaaagccc cttcaccagg agaagccgtc acacagatcc 1200
acaagctcct gaagaggtaa gggtttaagg gatggttggt tggtggggta ttaatgttta 1260
attacctgga gcacctgcct gaaatcactt tttttcaggt tggtttaaac cgcagccacc 1320
atgagcaccg ccgtgctgga aaatcctggc ttgggcagga aactctctga ctttggacag 1380
gtgagccacg gcagcctgag ctgctcagtt aggggaattt gggcctccag agaaagagat 1440
ccgaagactg ctggtgcttc ctggtttcat aagctcagta agaagtctga attcgttgga 1500
agctgatgat agaagaaaga gttcatgctt gctttgtcca tggaggttta acaggaatga 1560
attgctaaac tgtggaaaat gttttaaaca aatgcatctt atcctgtagg aaacaagcta 1620
tattgaagac aactgcaatc aaaacggcgc catcagcctg atcttcagcc tgaaagaaga 1680
agtgggcgcc ctggccaagg tgctgagact gttcgaagag aacgacgtga acctgacaca 1740
catcgagagc agacccagca gactgaagaa ggacgagtac gagttcttca cccacctgga 1800
caagcggagc ctgcctgctc tgaccaacat catcaagatc ctgcggcacg acatcggcgc 1860
cacagtgcac gaactgagcc gggacaagaa aaaggacacc gtgccatggt tccccagaac 1920
catccaagag ctggacagat tcgccaacca gatcctgagc tatggcgccg agctggacgc 1980
tgatcaccct ggctttaagg accccgtgta ccgggccaga agaaagcagt ttgccgatat 2040
cgcctacaac taccggcacg gccagcctat tcctcgggtc gagtacatgg aagaggaaaa 2100
gaaaacctgg ggcaccgtgt tcaagaccct gaagtccctg tacaagaccc acgcctgcta 2160
cgagtacaac cacatcttcc cactgctcga aaagtactgc ggcttccacg aggacaatat 2220
ccctcagctt gaggacgtgt cccagttcct gcagacctgc accggcttta gactgaggcc 2280
agttgccgga ctgctgagca gcagagattt tctcggcggc ctggccttca gagtgttcca 2340
ctgtacccag tacatcagac acggcagcaa gcccatgtac acccctgagc ctgatatctg 2400
ccacgagctg ctgggacatg tgcccctgtt cagcgataga agcttcgccc agttcagcca 2460
agagatcgga ctggcttctc tgggagcccc tgacgagtac attgagaagc tggccaccat 2520
ctactggttc accgtggaat tcggcctgtg caagcagggc gacagcatca aagcttatgg 2580
cgctggcctg ctgtctagct tcggcgagct gcagtactgt ctgagcgaga agcctaagct 2640
gctgcccctg gaactggaaa agaccgccat ccagaactac accgtgaccg agttccagcc 2700
tctgtactac gtggccgaga gcttcaacga cgccaaagaa aaagtgcgga acttcgccgc 2760
caccattcct cggcctttca gcgtcagata cgacccctac acacagcgga tcgaggtgct 2820
ggacaacaca cagcagctga aaattctggc cgactccatc aacagcgaga tcggcatcct 2880
gtgcagcgcc ctgcagaaaa tcaagtgata gttaattaag agcatcttac cgccatttat 2940
tcccatattt gttctgtttt tcttgatttg ggtatacatt taaatgttaa taaaacaaaa 3000
tggtggggca atcatttaca tttttaggga tatgtaatta ctagttcagg tgtattgcca 3060
caagacaaac atgttaagaa actttcccgt tatttacgct ctgttcctgt taatcaacct 3120
ctggattaca aaatttgtga aagattgact gatattctta actatgttgc tccttttacg 3180
ctgtgtggat atgctgcttt atagcctctg tatctagcta ttgcttcccg tacggctttc 3240
gttttctcct ccttgtataa atcctggttg ctgtctcttt tagaggagtt gtggcccgtt 3300
gtccgtcaac gtggcgtggt gtgctctgtg tttgctgacg caacccccac tggctggggc 3360
attgccacca cctgtcaact cctttctggg actttcgctt tccccctccc gatcgccacg 3420
gcagaactca tcgccgcctg ccttgcccgc tgctggacag gggctaggtt gctgggcact 3480
gataattccg tggtgttgtc tgtgccttct agttgccagc catctgttgt ttgcccctcc 3540
cccgtgcctt ccttgaccct ggaaggtgcc actcccactg tcctttccta ataaaatgag 3600
gaaattgcat cgcattgtct gagtaggtgt cattctattc tggggggtgg ggtggggcag 3660
gacagcaagg gggaggattg ggaagacaat agcaggcatg ctggggatgc ggtgggctct 3720
atggctctag agcatggcta cgtagataag tagcatggcg ggttaatcat taactacacc 3780
tgcaggagga acccctagtg atggagttgg ccactccctc tctgcgcgct cgctcgctca 3840
ctgaggccgg gcgaccaaag gtcgcccgac gcccgggcgg cctcagtgag cgagcgagcg 3900
cgcagctgcc tgcagg 3916
<210> 555
<211> 3302
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 555
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180
cgctcccttg ccaatagccg gtttaacttg ctataattaa ttcattggta taaactataa 240
acattccaat tgagataggg gagaaatcta gtaatcttct aagcatatgc gggggaggct 300
gctggtgaat attaaccaag gtcaccccag ttatcggagg agcaaacagg ggctaagtcc 360
acacgcgtgg taccgtctgt ctgcacattt cgtagagcga gtgttccgat actctaatct 420
ccctaggcaa ggttcatatt tgtgtaggtt acttattctc cttttgttga ctaagtcaat 480
aatcagaatc agcaggtttg gagtcagctt ggcagggatc agcagcctgg gttggaagga 540
gggggtataa aagccccttc accaggagaa gccgtcacac agatccacaa gctcctgaag 600
aggtaagggt ttaagggatg gttggttggt ggggtattaa tgtttaatta cctggagcac 660
ctgcctgaaa tcactttttt tcaggttggt ttaaaccgca gccaccatga gcaccgccgt 720
gctggaaaat cctggcttgg gcaggaaact ctctgacttt ggacaggtga gccacggcag 780
cctgagctgc tcagttaggg gaatttgggc ctccagagaa agagatccga agactgctgg 840
tgcttcctgg tttcataagc tcagtaagaa gtctgaattc gttggaagct gatgatagaa 900
gaaagagttc atgcttgctt tgtccatgga ggtttaacag gaatgaattg ctaaactgtg 960
gaaaatgttt taaacaaatg catcttatcc tgtaggaaac aagctatatt gaagacaact 1020
gcaatcaaaa cggcgccatc agcctgatct tcagcctgaa agaagaagtg ggcgccctgg 1080
ccaaggtgct gagactgttc gaagagaacg acgtgaacct gacacacatc gagagcagac 1140
ccagcagact gaagaaggac gagtacgagt tcttcaccca cctggacaag cggagcctgc 1200
ctgctctgac caacatcatc aagatcctgc ggcacgacat cggcgccaca gtgcacgaac 1260
tgagccggga caagaaaaag gacaccgtgc catggttccc cagaaccatc caagagctgg 1320
acagattcgc caaccagatc ctgagctatg gcgccgagct ggacgctgat caccctggct 1380
ttaaggaccc cgtgtaccgg gccagaagaa agcagtttgc cgatatcgcc tacaactacc 1440
ggcacggcca gcctattcct cgggtcgagt acatggaaga ggaaaagaaa acctggggca 1500
ccgtgttcaa gaccctgaag tccctgtaca agacccacgc ctgctacgag tacaaccaca 1560
tcttcccact gctcgaaaag tactgcggct tccacgagga caatatccct cagcttgagg 1620
acgtgtccca gttcctgcag acctgcaccg gctttagact gaggccagtt gccggactgc 1680
tgagcagcag agattttctc ggcggcctgg ccttcagagt gttccactgt acccagtaca 1740
tcagacacgg cagcaagccc atgtacaccc ctgagcctga tatctgccac gagctgctgg 1800
gacatgtgcc cctgttcagc gatagaagct tcgcccagtt cagccaagag atcggactgg 1860
cttctctggg agcccctgac gagtacattg agaagctggc caccatctac tggttcaccg 1920
tggaattcgg cctgtgcaag cagggcgaca gcatcaaagc ttatggcgct ggcctgctgt 1980
ctagcttcgg cgagctgcag tactgtctga gcgagaagcc taagctgctg cccctggaac 2040
tggaaaagac cgccatccag aactacaccg tgaccgagtt ccagcctctg tactacgtgg 2100
ccgagagctt caacgacgcc aaagaaaaag tgcggaactt cgccgccacc attcctcggc 2160
ctttcagcgt cagatacgac ccctacacac agcggatcga ggtgctggac aacacacagc 2220
agctgaaaat tctggccgac tccatcaaca gcgagatcgg catcctgtgc agcgccctgc 2280
agaaaatcaa gtgatagtta attaagagca tcttaccgcc atttattccc atatttgttc 2340
tgtttttctt gatttgggta tacatttaaa tgttaataaa acaaaatggt ggggcaatca 2400
tttacatttt tagggatatg taattactag ttcaggtgta ttgccacaag acaaacatgt 2460
taagaaactt tcccgttatt tacgctctgt tcctgttaat caacctctgg attacaaaat 2520
ttgtgaaaga ttgactgata ttcttaacta tgttgctcct tttacgctgt gtggatatgc 2580
tgctttatag cctctgtatc tagctattgc ttcccgtacg gctttcgttt tctcctcctt 2640
gtataaatcc tggttgctgt ctcttttaga ggagttgtgg cccgttgtcc gtcaacgtgg 2700
cgtggtgtgc tctgtgtttg ctgacgcaac ccccactggc tggggcattg ccaccacctg 2760
tcaactcctt tctgggactt tcgctttccc cctcccgatc gccacggcag aactcatcgc 2820
cgcctgcctt gcccgctgct ggacaggggc taggttgctg ggcactgata attccgtggt 2880
gttgtctgtg ccttctagtt gccagccatc tgttgtttgc ccctcccccg tgccttcctt 2940
gaccctggaa ggtgccactc ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca 3000
ttgtctgagt aggtgtcatt ctattctggg gggtggggtg gggcaggaca gcaaggggga 3060
ggattgggaa gacaatagca ggcatgctgg ggatgcggtg ggctctatgg ctctagagca 3120
tggctacgta gataagtagc atggcgggtt aatcattaac tacacctgca ggaggaaccc 3180
ctagtgatgg agttggccac tccctctctg cgcgctcgct cgctcactga ggccgggcga 3240
ccaaaggtcg cccgacgccc gggcggcctc agtgagcgag cgagcgcgca gctgcctgca 3300
gg 3302
<210> 556
<211> 3402
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 556
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180
cgcttctttg aatgttgtta tagagccacc ttgatgcctt gttagtgatg gttgctccta 240
tagtagtatt cctgtgatgc aaggtaaata tattgaagac ctgctgtaga catgaagcag 300
aacttgagtc ctgttgagtt aactgtgcta ctactattct gaagaaaata gtgtctacag 360
ctggaatgag ttggttgctc taccatatgc gggggaggct gctggtgaat attaaccaag 420
gtcaccccag ttatcggagg agcaaacagg ggctaagtcc acacgcgtgg taccgtctgt 480
ctgcacattt cgtagagcga gtgttccgat actctaatct ccctaggcaa ggttcatatt 540
tgtgtaggtt acttattctc cttttgttga ctaagtcaat aatcagaatc agcaggtttg 600
gagtcagctt ggcagggatc agcagcctgg gttggaagga gggggtataa aagccccttc 660
accaggagaa gccgtcacac agatccacaa gctcctgaag aggtaagggt ttaagggatg 720
gttggttggt ggggtattaa tgtttaatta cctggagcac ctgcctgaaa tcactttttt 780
tcaggttggt ttaaaccgca gccaccatga gcaccgccgt gctggaaaat cctggcttgg 840
gcaggaaact ctctgacttt ggacaggtga gccacggcag cctgagctgc tcagttaggg 900
gaatttgggc ctccagagaa agagatccga agactgctgg tgcttcctgg tttcataagc 960
tcagtaagaa gtctgaattc gttggaagct gatgatagaa gaaagagttc atgcttgctt 1020
tgtccatgga ggtttaacag gaatgaattg ctaaactgtg gaaaatgttt taaacaaatg 1080
catcttatcc tgtaggaaac aagctatatt gaagacaact gcaatcaaaa cggcgccatc 1140
agcctgatct tcagcctgaa agaagaagtg ggcgccctgg ccaaggtgct gagactgttc 1200
gaagagaacg acgtgaacct gacacacatc gagagcagac ccagcagact gaagaaggac 1260
gagtacgagt tcttcaccca cctggacaag cggagcctgc ctgctctgac caacatcatc 1320
aagatcctgc ggcacgacat cggcgccaca gtgcacgaac tgagccggga caagaaaaag 1380
gacaccgtgc catggttccc cagaaccatc caagagctgg acagattcgc caaccagatc 1440
ctgagctatg gcgccgagct ggacgctgat caccctggct ttaaggaccc cgtgtaccgg 1500
gccagaagaa agcagtttgc cgatatcgcc tacaactacc ggcacggcca gcctattcct 1560
cgggtcgagt acatggaaga ggaaaagaaa acctggggca ccgtgttcaa gaccctgaag 1620
tccctgtaca agacccacgc ctgctacgag tacaaccaca tcttcccact gctcgaaaag 1680
tactgcggct tccacgagga caatatccct cagcttgagg acgtgtccca gttcctgcag 1740
acctgcaccg gctttagact gaggccagtt gccggactgc tgagcagcag agattttctc 1800
ggcggcctgg ccttcagagt gttccactgt acccagtaca tcagacacgg cagcaagccc 1860
atgtacaccc ctgagcctga tatctgccac gagctgctgg gacatgtgcc cctgttcagc 1920
gatagaagct tcgcccagtt cagccaagag atcggactgg cttctctggg agcccctgac 1980
gagtacattg agaagctggc caccatctac tggttcaccg tggaattcgg cctgtgcaag 2040
cagggcgaca gcatcaaagc ttatggcgct ggcctgctgt ctagcttcgg cgagctgcag 2100
tactgtctga gcgagaagcc taagctgctg cccctggaac tggaaaagac cgccatccag 2160
aactacaccg tgaccgagtt ccagcctctg tactacgtgg ccgagagctt caacgacgcc 2220
aaagaaaaag tgcggaactt cgccgccacc attcctcggc ctttcagcgt cagatacgac 2280
ccctacacac agcggatcga ggtgctggac aacacacagc agctgaaaat tctggccgac 2340
tccatcaaca gcgagatcgg catcctgtgc agcgccctgc agaaaatcaa gtgatagtta 2400
attaagagca tcttaccgcc atttattccc atatttgttc tgtttttctt gatttgggta 2460
tacatttaaa tgttaataaa acaaaatggt ggggcaatca tttacatttt tagggatatg 2520
taattactag ttcaggtgta ttgccacaag acaaacatgt taagaaactt tcccgttatt 2580
tacgctctgt tcctgttaat caacctctgg attacaaaat ttgtgaaaga ttgactgata 2640
ttcttaacta tgttgctcct tttacgctgt gtggatatgc tgctttatag cctctgtatc 2700
tagctattgc ttcccgtacg gctttcgttt tctcctcctt gtataaatcc tggttgctgt 2760
ctcttttaga ggagttgtgg cccgttgtcc gtcaacgtgg cgtggtgtgc tctgtgtttg 2820
ctgacgcaac ccccactggc tggggcattg ccaccacctg tcaactcctt tctgggactt 2880
tcgctttccc cctcccgatc gccacggcag aactcatcgc cgcctgcctt gcccgctgct 2940
ggacaggggc taggttgctg ggcactgata attccgtggt gttgtctgtg ccttctagtt 3000
gccagccatc tgttgtttgc ccctcccccg tgccttcctt gaccctggaa ggtgccactc 3060
ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca ttgtctgagt aggtgtcatt 3120
ctattctggg gggtggggtg gggcaggaca gcaaggggga ggattgggaa gacaatagca 3180
ggcatgctgg ggatgcggtg ggctctatgg ctctagagca tggctacgta gataagtagc 3240
atggcgggtt aatcattaac tacacctgca ggaggaaccc ctagtgatgg agttggccac 3300
tccctctctg cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg cccgacgccc 3360
gggcggcctc agtgagcgag cgagcgcgca gctgcctgca gg 3402
<210> 557
<211> 3402
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 557
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180
cgcctaggcc taagatcata ctgtgattag ttacatataa cccagtttaa cagtattgag 240
cttgctaagg aactttagct tcaggtatac tattttcaag ccatcagctt aataactata 300
aatataccac tgctgggtga tgatattaga attagggtct agtaaaggat agacagtggc 360
attatgacta tatttcaaaa atacatatgc gggggaggct gctggtgaat attaaccaag 420
gtcaccccag ttatcggagg agcaaacagg ggctaagtcc acacgcgtgg taccgtctgt 480
ctgcacattt cgtagagcga gtgttccgat actctaatct ccctaggcaa ggttcatatt 540
tgtgtaggtt acttattctc cttttgttga ctaagtcaat aatcagaatc agcaggtttg 600
gagtcagctt ggcagggatc agcagcctgg gttggaagga gggggtataa aagccccttc 660
accaggagaa gccgtcacac agatccacaa gctcctgaag aggtaagggt ttaagggatg 720
gttggttggt ggggtattaa tgtttaatta cctggagcac ctgcctgaaa tcactttttt 780
tcaggttggt ttaaaccgca gccaccatga gcaccgccgt gctggaaaat cctggcttgg 840
gcaggaaact ctctgacttt ggacaggtga gccacggcag cctgagctgc tcagttaggg 900
gaatttgggc ctccagagaa agagatccga agactgctgg tgcttcctgg tttcataagc 960
tcagtaagaa gtctgaattc gttggaagct gatgatagaa gaaagagttc atgcttgctt 1020
tgtccatgga ggtttaacag gaatgaattg ctaaactgtg gaaaatgttt taaacaaatg 1080
catcttatcc tgtaggaaac aagctatatt gaagacaact gcaatcaaaa cggcgccatc 1140
agcctgatct tcagcctgaa agaagaagtg ggcgccctgg ccaaggtgct gagactgttc 1200
gaagagaacg acgtgaacct gacacacatc gagagcagac ccagcagact gaagaaggac 1260
gagtacgagt tcttcaccca cctggacaag cggagcctgc ctgctctgac caacatcatc 1320
aagatcctgc ggcacgacat cggcgccaca gtgcacgaac tgagccggga caagaaaaag 1380
gacaccgtgc catggttccc cagaaccatc caagagctgg acagattcgc caaccagatc 1440
ctgagctatg gcgccgagct ggacgctgat caccctggct ttaaggaccc cgtgtaccgg 1500
gccagaagaa agcagtttgc cgatatcgcc tacaactacc ggcacggcca gcctattcct 1560
cgggtcgagt acatggaaga ggaaaagaaa acctggggca ccgtgttcaa gaccctgaag 1620
tccctgtaca agacccacgc ctgctacgag tacaaccaca tcttcccact gctcgaaaag 1680
tactgcggct tccacgagga caatatccct cagcttgagg acgtgtccca gttcctgcag 1740
acctgcaccg gctttagact gaggccagtt gccggactgc tgagcagcag agattttctc 1800
ggcggcctgg ccttcagagt gttccactgt acccagtaca tcagacacgg cagcaagccc 1860
atgtacaccc ctgagcctga tatctgccac gagctgctgg gacatgtgcc cctgttcagc 1920
gatagaagct tcgcccagtt cagccaagag atcggactgg cttctctggg agcccctgac 1980
gagtacattg agaagctggc caccatctac tggttcaccg tggaattcgg cctgtgcaag 2040
cagggcgaca gcatcaaagc ttatggcgct ggcctgctgt ctagcttcgg cgagctgcag 2100
tactgtctga gcgagaagcc taagctgctg cccctggaac tggaaaagac cgccatccag 2160
aactacaccg tgaccgagtt ccagcctctg tactacgtgg ccgagagctt caacgacgcc 2220
aaagaaaaag tgcggaactt cgccgccacc attcctcggc ctttcagcgt cagatacgac 2280
ccctacacac agcggatcga ggtgctggac aacacacagc agctgaaaat tctggccgac 2340
tccatcaaca gcgagatcgg catcctgtgc agcgccctgc agaaaatcaa gtgatagtta 2400
attaagagca tcttaccgcc atttattccc atatttgttc tgtttttctt gatttgggta 2460
tacatttaaa tgttaataaa acaaaatggt ggggcaatca tttacatttt tagggatatg 2520
taattactag ttcaggtgta ttgccacaag acaaacatgt taagaaactt tcccgttatt 2580
tacgctctgt tcctgttaat caacctctgg attacaaaat ttgtgaaaga ttgactgata 2640
ttcttaacta tgttgctcct tttacgctgt gtggatatgc tgctttatag cctctgtatc 2700
tagctattgc ttcccgtacg gctttcgttt tctcctcctt gtataaatcc tggttgctgt 2760
ctcttttaga ggagttgtgg cccgttgtcc gtcaacgtgg cgtggtgtgc tctgtgtttg 2820
ctgacgcaac ccccactggc tggggcattg ccaccacctg tcaactcctt tctgggactt 2880
tcgctttccc cctcccgatc gccacggcag aactcatcgc cgcctgcctt gcccgctgct 2940
ggacaggggc taggttgctg ggcactgata attccgtggt gttgtctgtg ccttctagtt 3000
gccagccatc tgttgtttgc ccctcccccg tgccttcctt gaccctggaa ggtgccactc 3060
ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca ttgtctgagt aggtgtcatt 3120
ctattctggg gggtggggtg gggcaggaca gcaaggggga ggattgggaa gacaatagca 3180
ggcatgctgg ggatgcggtg ggctctatgg ctctagagca tggctacgta gataagtagc 3240
atggcgggtt aatcattaac tacacctgca ggaggaaccc ctagtgatgg agttggccac 3300
tccctctctg cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg cccgacgccc 3360
gggcggcctc agtgagcgag cgagcgcgca gctgcctgca gg 3402
<210> 558
<211> 3602
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 558
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180
cgcttctttg aatgttgtta tagagccacc ttgatgcctt gttagtgatg gttgctccta 240
tagtagtatt cctgtgatgc aaggtaaata tattgaagac ctgctgtaga catgaagcag 300
aacttgagtc ctgttgagtt aactgtgcta ctactattct gaagaaaata gtgtctacag 360
ctggaatgag ttggttgctc tacctaggcc taagatcata ctgtgattag ttacatataa 420
cccagtttaa cagtattgag cttgctaagg aactttagct tcaggtatac tattttcaag 480
ccatcagctt aataactata aatataccac tgctgggtga tgatattaga attagggtct 540
agtaaaggat agacagtggc attatgacta tatttcaaaa atacatatgc gggggaggct 600
gctggtgaat attaaccaag gtcaccccag ttatcggagg agcaaacagg ggctaagtcc 660
acacgcgtgg taccgtctgt ctgcacattt cgtagagcga gtgttccgat actctaatct 720
ccctaggcaa ggttcatatt tgtgtaggtt acttattctc cttttgttga ctaagtcaat 780
aatcagaatc agcaggtttg gagtcagctt ggcagggatc agcagcctgg gttggaagga 840
gggggtataa aagccccttc accaggagaa gccgtcacac agatccacaa gctcctgaag 900
aggtaagggt ttaagggatg gttggttggt ggggtattaa tgtttaatta cctggagcac 960
ctgcctgaaa tcactttttt tcaggttggt ttaaaccgca gccaccatga gcaccgccgt 1020
gctggaaaat cctggcttgg gcaggaaact ctctgacttt ggacaggtga gccacggcag 1080
cctgagctgc tcagttaggg gaatttgggc ctccagagaa agagatccga agactgctgg 1140
tgcttcctgg tttcataagc tcagtaagaa gtctgaattc gttggaagct gatgatagaa 1200
gaaagagttc atgcttgctt tgtccatgga ggtttaacag gaatgaattg ctaaactgtg 1260
gaaaatgttt taaacaaatg catcttatcc tgtaggaaac aagctatatt gaagacaact 1320
gcaatcaaaa cggcgccatc agcctgatct tcagcctgaa agaagaagtg ggcgccctgg 1380
ccaaggtgct gagactgttc gaagagaacg acgtgaacct gacacacatc gagagcagac 1440
ccagcagact gaagaaggac gagtacgagt tcttcaccca cctggacaag cggagcctgc 1500
ctgctctgac caacatcatc aagatcctgc ggcacgacat cggcgccaca gtgcacgaac 1560
tgagccggga caagaaaaag gacaccgtgc catggttccc cagaaccatc caagagctgg 1620
acagattcgc caaccagatc ctgagctatg gcgccgagct ggacgctgat caccctggct 1680
ttaaggaccc cgtgtaccgg gccagaagaa agcagtttgc cgatatcgcc tacaactacc 1740
ggcacggcca gcctattcct cgggtcgagt acatggaaga ggaaaagaaa acctggggca 1800
ccgtgttcaa gaccctgaag tccctgtaca agacccacgc ctgctacgag tacaaccaca 1860
tcttcccact gctcgaaaag tactgcggct tccacgagga caatatccct cagcttgagg 1920
acgtgtccca gttcctgcag acctgcaccg gctttagact gaggccagtt gccggactgc 1980
tgagcagcag agattttctc ggcggcctgg ccttcagagt gttccactgt acccagtaca 2040
tcagacacgg cagcaagccc atgtacaccc ctgagcctga tatctgccac gagctgctgg 2100
gacatgtgcc cctgttcagc gatagaagct tcgcccagtt cagccaagag atcggactgg 2160
cttctctggg agcccctgac gagtacattg agaagctggc caccatctac tggttcaccg 2220
tggaattcgg cctgtgcaag cagggcgaca gcatcaaagc ttatggcgct ggcctgctgt 2280
ctagcttcgg cgagctgcag tactgtctga gcgagaagcc taagctgctg cccctggaac 2340
tggaaaagac cgccatccag aactacaccg tgaccgagtt ccagcctctg tactacgtgg 2400
ccgagagctt caacgacgcc aaagaaaaag tgcggaactt cgccgccacc attcctcggc 2460
ctttcagcgt cagatacgac ccctacacac agcggatcga ggtgctggac aacacacagc 2520
agctgaaaat tctggccgac tccatcaaca gcgagatcgg catcctgtgc agcgccctgc 2580
agaaaatcaa gtgatagtta attaagagca tcttaccgcc atttattccc atatttgttc 2640
tgtttttctt gatttgggta tacatttaaa tgttaataaa acaaaatggt ggggcaatca 2700
tttacatttt tagggatatg taattactag ttcaggtgta ttgccacaag acaaacatgt 2760
taagaaactt tcccgttatt tacgctctgt tcctgttaat caacctctgg attacaaaat 2820
ttgtgaaaga ttgactgata ttcttaacta tgttgctcct tttacgctgt gtggatatgc 2880
tgctttatag cctctgtatc tagctattgc ttcccgtacg gctttcgttt tctcctcctt 2940
gtataaatcc tggttgctgt ctcttttaga ggagttgtgg cccgttgtcc gtcaacgtgg 3000
cgtggtgtgc tctgtgtttg ctgacgcaac ccccactggc tggggcattg ccaccacctg 3060
tcaactcctt tctgggactt tcgctttccc cctcccgatc gccacggcag aactcatcgc 3120
cgcctgcctt gcccgctgct ggacaggggc taggttgctg ggcactgata attccgtggt 3180
gttgtctgtg ccttctagtt gccagccatc tgttgtttgc ccctcccccg tgccttcctt 3240
gaccctggaa ggtgccactc ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca 3300
ttgtctgagt aggtgtcatt ctattctggg gggtggggtg gggcaggaca gcaaggggga 3360
ggattgggaa gacaatagca ggcatgctgg ggatgcggtg ggctctatgg ctctagagca 3420
tggctacgta gataagtagc atggcgggtt aatcattaac tacacctgca ggaggaaccc 3480
ctagtgatgg agttggccac tccctctctg cgcgctcgct cgctcactga ggccgggcga 3540
ccaaaggtcg cccgacgccc gggcggcctc agtgagcgag cgagcgcgca gctgcctgca 3600
gg 3602
<210> 559
<211> 4002
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 559
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180
cgcctgtcta gctcctcttc tgtcattgca acctctgtaa gggttttagt tctccttatt 240
ttttatgtct tgctctggta gtgctgacag aagcataata gtaagagtac tgtggatgta 300
cataaagcag caggcagggc taccaacctt agcctggcaa ctcatgatac tgtctgttca 360
tggactttta agttgcataa gaggaagctt tattcctgat agtgatagta gcttcaaatg 420
ttgtaagttc agcaaaatga gccaattatc agggcataat ccactattct tcacaacaag 480
gtgctctagt gaatttaggt cctctggagc agtatttcaa tctactaata ggggctctgc 540
aagatggtgg cagaggcttt ccaactgtac tctgtgctct tgttaccagt cagcttggta 600
cactccatac aaagtccagc aattgttttt gaattagggt gggtacactc ctggcataac 660
agaatgtccc tgcaatcaaa agtcctagtc cacatgattg attgacctta tactgaagag 720
taccctgtgg accaagtcaa tctgcagatg ctacattaac aataaatgtt aattacttca 780
ctagggatta gtctgttatt ttacaccttt ttcaaacctc tggcacttgc ataccattgt 840
agctaagata tgcttctatg aaatagccac cacaggtgat aagtccccct acacagcaat 900
cttagagcaa tattatccag agattgttgc agcagaaact gctgtatgct ttttacctca 960
cacactccta atgagctttt acccatatgc gggggaggct gctggtgaat attaaccaag 1020
gtcaccccag ttatcggagg agcaaacagg ggctaagtcc acacgcgtgg taccgtctgt 1080
ctgcacattt cgtagagcga gtgttccgat actctaatct ccctaggcaa ggttcatatt 1140
tgtgtaggtt acttattctc cttttgttga ctaagtcaat aatcagaatc agcaggtttg 1200
gagtcagctt ggcagggatc agcagcctgg gttggaagga gggggtataa aagccccttc 1260
accaggagaa gccgtcacac agatccacaa gctcctgaag aggtaagggt ttaagggatg 1320
gttggttggt ggggtattaa tgtttaatta cctggagcac ctgcctgaaa tcactttttt 1380
tcaggttggt ttaaaccgca gccaccatga gcaccgccgt gctggaaaat cctggcttgg 1440
gcaggaaact ctctgacttt ggacaggtga gccacggcag cctgagctgc tcagttaggg 1500
gaatttgggc ctccagagaa agagatccga agactgctgg tgcttcctgg tttcataagc 1560
tcagtaagaa gtctgaattc gttggaagct gatgatagaa gaaagagttc atgcttgctt 1620
tgtccatgga ggtttaacag gaatgaattg ctaaactgtg gaaaatgttt taaacaaatg 1680
catcttatcc tgtaggaaac aagctatatt gaagacaact gcaatcaaaa cggcgccatc 1740
agcctgatct tcagcctgaa agaagaagtg ggcgccctgg ccaaggtgct gagactgttc 1800
gaagagaacg acgtgaacct gacacacatc gagagcagac ccagcagact gaagaaggac 1860
gagtacgagt tcttcaccca cctggacaag cggagcctgc ctgctctgac caacatcatc 1920
aagatcctgc ggcacgacat cggcgccaca gtgcacgaac tgagccggga caagaaaaag 1980
gacaccgtgc catggttccc cagaaccatc caagagctgg acagattcgc caaccagatc 2040
ctgagctatg gcgccgagct ggacgctgat caccctggct ttaaggaccc cgtgtaccgg 2100
gccagaagaa agcagtttgc cgatatcgcc tacaactacc ggcacggcca gcctattcct 2160
cgggtcgagt acatggaaga ggaaaagaaa acctggggca ccgtgttcaa gaccctgaag 2220
tccctgtaca agacccacgc ctgctacgag tacaaccaca tcttcccact gctcgaaaag 2280
tactgcggct tccacgagga caatatccct cagcttgagg acgtgtccca gttcctgcag 2340
acctgcaccg gctttagact gaggccagtt gccggactgc tgagcagcag agattttctc 2400
ggcggcctgg ccttcagagt gttccactgt acccagtaca tcagacacgg cagcaagccc 2460
atgtacaccc ctgagcctga tatctgccac gagctgctgg gacatgtgcc cctgttcagc 2520
gatagaagct tcgcccagtt cagccaagag atcggactgg cttctctggg agcccctgac 2580
gagtacattg agaagctggc caccatctac tggttcaccg tggaattcgg cctgtgcaag 2640
cagggcgaca gcatcaaagc ttatggcgct ggcctgctgt ctagcttcgg cgagctgcag 2700
tactgtctga gcgagaagcc taagctgctg cccctggaac tggaaaagac cgccatccag 2760
aactacaccg tgaccgagtt ccagcctctg tactacgtgg ccgagagctt caacgacgcc 2820
aaagaaaaag tgcggaactt cgccgccacc attcctcggc ctttcagcgt cagatacgac 2880
ccctacacac agcggatcga ggtgctggac aacacacagc agctgaaaat tctggccgac 2940
tccatcaaca gcgagatcgg catcctgtgc agcgccctgc agaaaatcaa gtgatagtta 3000
attaagagca tcttaccgcc atttattccc atatttgttc tgtttttctt gatttgggta 3060
tacatttaaa tgttaataaa acaaaatggt ggggcaatca tttacatttt tagggatatg 3120
taattactag ttcaggtgta ttgccacaag acaaacatgt taagaaactt tcccgttatt 3180
tacgctctgt tcctgttaat caacctctgg attacaaaat ttgtgaaaga ttgactgata 3240
ttcttaacta tgttgctcct tttacgctgt gtggatatgc tgctttatag cctctgtatc 3300
tagctattgc ttcccgtacg gctttcgttt tctcctcctt gtataaatcc tggttgctgt 3360
ctcttttaga ggagttgtgg cccgttgtcc gtcaacgtgg cgtggtgtgc tctgtgtttg 3420
ctgacgcaac ccccactggc tggggcattg ccaccacctg tcaactcctt tctgggactt 3480
tcgctttccc cctcccgatc gccacggcag aactcatcgc cgcctgcctt gcccgctgct 3540
ggacaggggc taggttgctg ggcactgata attccgtggt gttgtctgtg ccttctagtt 3600
gccagccatc tgttgtttgc ccctcccccg tgccttcctt gaccctggaa ggtgccactc 3660
ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca ttgtctgagt aggtgtcatt 3720
ctattctggg gggtggggtg gggcaggaca gcaaggggga ggattgggaa gacaatagca 3780
ggcatgctgg ggatgcggtg ggctctatgg ctctagagca tggctacgta gataagtagc 3840
atggcgggtt aatcattaac tacacctgca ggaggaaccc ctagtgatgg agttggccac 3900
tccctctctg cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg cccgacgccc 3960
gggcggcctc agtgagcgag cgagcgcgca gctgcctgca gg 4002
<210> 560
<211> 3840
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 560
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180
cgcaggctca gaggcacaca ggagtttctg ggctcaccct gcccccttcc aacccctcag 240
ttcccatcct ccagcagctg tttgtgtgct gcctctgaag tccacactga acaaacttca 300
gcctactcat gtccctaaaa tgggcaaaca ttgcaagcag caaacagcaa acacacagcc 360
ctccctgcct gctgaccttg gagctggggc agaggtcaga gacctctctg ggcccatgcc 420
acctccaaca tccactcgac cccttggaat ttcggtggag aggagcagag gttgtcctgg 480
cgtggtttag gtagtgtgag agggtccggg ttcaaaacca cttgctgggt ggggagtcgt 540
cagtaagtgg ctatgccccg accccgaagc ctgtttcccc atctgtacaa tggaaatgat 600
aaagacgccc atctgatagg gtttttgtgg caaataaaca tttggttttt ttgttttgtt 660
ttgttttgtt ttttgagatg gaggtttgct ctgtcgccca ggctggagtg cagtgacaca 720
atctcatctc accacaacct tcccctgcct cagcctccca agtagctggg attacaagca 780
tgtgccacca cacctggcta attttctatt tttagtagag acgggtttct ccatgttggt 840
cagcctcagc ctcccaagta actgggatta caggcctgtg ccaccacacc cggctaattt 900
tttctatttt tgacagggac ggggtttcac catgttggtc aggctggtct agaggtactg 960
gatcttgcta ccagtggaac agccactaag gattctgcag tgagagcaga gggccagcta 1020
agtggtactc tcccagagac tgtctgactc acgccacccc ctccaccttg gacacaggac 1080
gctgtggttt ctgagccagg tacaatgact cctttcggta agtgcagtgg aagctgtaca 1140
ctgcccaggc aaagcgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact 1200
tagcccctgt ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct 1260
cccccgttgc ccctctggat ccactgctta aatacggacg aggacagggc cctgtctcct 1320
cagcttcagg caccaccact gacctgggac agtgaataat tactctaagg taaatataaa 1380
atttttaagt gtataatgtg ttaaactact gattctaatt gtttctctct tttagattcc 1440
aacctttgga actgagttta aaccgcagcc accatgagta cagcagtgtt agagaatcca 1500
ggcctaggta gaaagctgtc tgactttggc caggagacct cctacattga ggacaactgc 1560
aaccagaatg gagccatcag cctgatcttc agcctgaagg aggaggtggg agccctggcc 1620
aaggtgctga gactgtttga ggagaatgat gtgaacctga cccacattga gtccagaccc 1680
tccagactga agaaggatga gtatgagttc ttcacccacc tggacaagag atccctgcct 1740
gctctgacca acatcatcaa gatcctgaga catgatattg gagccacagt gcatgagctg 1800
agcagggaca agaagaagga cacagtgcct tggttcccca gaaccatcca ggagctggac 1860
aggtttgcca accagatcct gtcctatgga gctgagctgg atgctgacca ccctggattt 1920
aaggatcctg tgtacagggc cagaaggaag cagtttgctg acattgccta caactacagg 1980
catggccagc ccatccccag ggtggagtac atggaggagg agaagaagac ctggggcact 2040
gtgttcaaga ccctgaagag cctgtacaag acccatgcct gctatgagta caaccacatc 2100
ttccccctgc tggagaagta ctgtggcttc catgaggaca acatccctca gctggaggat 2160
gtgtcccagt tcctgcagac ctgcacaggc ttcagactga gacctgtggc tggcctgctg 2220
tctagcagag acttcctggg aggcctggcc ttcagagtgt tccactgcac ccagtacatc 2280
agacatggaa gcaagcccat gtacacccct gagccagaca tctgccatga gctgctgggc 2340
catgtgcccc tgttctctga tagatccttt gcccagttca gccaggagat tggcctggcc 2400
agcctgggag cccctgatga gtacattgag aagctggcca ccatctactg gttcacagtg 2460
gagtttggcc tgtgcaagca gggagactcc atcaaggcct atggagctgg actgctgtcc 2520
tcctttggag agctgcagta ctgcctgtct gagaagccca agctgctgcc cctggagctg 2580
gagaagacag ccatccagaa ctacacagtg acagagttcc agcccctgta ctatgtggct 2640
gagagcttca atgatgccaa ggagaaggtg agaaactttg ctgccaccat ccccagaccc 2700
ttctctgtga ggtatgaccc ctacacccag aggattgagg tgctggacaa cacccagcag 2760
ctgaagatcc tggctgactc catcaactct gagattggca tcctgtgctc tgccctgcag 2820
aagatcaagt aaaccttaat taagagcatc ttaccgccat ttattcccat atttgttctg 2880
tttttcttga tttgggtata catttaaatg ttaataaaac aaaatggtgg ggcaatcatt 2940
tacattttta gggatatgta attactagtt caggtgtatt gccacaagac aaacatgtta 3000
agaaactttc ccgttattta cgctctgttc ctgttaatca acctctggat tacaaaattt 3060
gtgaaagatt gactgatatt cttaactatg ttgctccttt tacgctgtgt ggatatgctg 3120
ctttatagcc tctgtatcta gctattgctt cccgtacggc tttcgttttc tcctccttgt 3180
ataaatcctg gttgctgtct cttttagagg agttgtggcc cgttgtccgt caacgtggcg 3240
tggtgtgctc tgtgtttgct gacgcaaccc ccactggctg gggcattgcc accacctgtc 3300
aactcctttc tgggactttc gctttccccc tcccgatcgc cacggcagaa ctcatcgccg 3360
cctgccttgc ccgctgctgg acaggggcta ggttgctggg cactgataat tccgtggtgt 3420
tgtctgtgcc ttctagttgc cagccatctg ttgtttgccc ctcccccgtg ccttccttga 3480
ccctggaagg tgccactccc actgtccttt cctaataaaa tgaggaaatt gcatcgcatt 3540
gtctgagtag gtgtcattct attctggggg gtggggtggg gcaggacagc aagggggagg 3600
attgggaaga caatagcagg catgctgggg atgcggtggg ctctatggct ctagagcatg 3660
gctacgtaga taagtagcat ggcgggttaa tcattaacta cacctgcagg aggaacccct 3720
agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc 3780
aaaggtcgcc cgacgcccgg gcggcctcag tgagcgagcg agcgcgcagc tgcctgcagg 3840
<210> 561
<211> 3840
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 561
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180
cgcaggctca gaggcacaca ggagtttctg ggctcaccct gcccccttcc aacccctcag 240
ttcccatcct ccagcagctg tttgtgtgct gcctctgaag tccacactga acaaacttca 300
gcctactcat gtccctaaaa tgggcaaaca ttgcaagcag caaacagcaa acacacagcc 360
ctccctgcct gctgaccttg gagctggggc agaggtcaga gacctctctg ggcccatgcc 420
acctccaaca tccactcgac cccttggaat ttcggtggag aggagcagag gttgtcctgg 480
cgtggtttag gtagtgtgag agggtccggg ttcaaaacca cttgctgggt ggggagtcgt 540
cagtaagtgg ctatgccccg accccgaagc ctgtttcccc atctgtacaa tggaaatgat 600
aaagacgccc atctgatagg gtttttgtgg caaataaaca tttggttttt ttgttttgtt 660
ttgttttgtt ttttgagatg gaggtttgct ctgtcgccca ggctggagtg cagtgacaca 720
atctcatctc accacaacct tcccctgcct cagcctccca agtagctggg attacaagca 780
tgtgccacca cacctggcta attttctatt tttagtagag acgggtttct ccatgttggt 840
cagcctcagc ctcccaagta actgggatta caggcctgtg ccaccacacc cggctaattt 900
tttctatttt tgacagggac ggggtttcac catgttggtc aggctggtct agaggtactg 960
gatcttgcta ccagtggaac agccactaag gattctgcag tgagagcaga gggccagcta 1020
agtggtactc tcccagagac tgtctgactc acgccacccc ctccaccttg gacacaggac 1080
gctgtggttt ctgagccagg tacaatgact cctttcggta agtgcagtgg aagctgtaca 1140
ctgcccaggc aaagcgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact 1200
tagcccctgt ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct 1260
cccccgttgc ccctctggat ccactgctta aatacggacg aggacagggc cctgtctcct 1320
cagcttcagg caccaccact gacctgggac agtgaataat tactctaagg taaatataaa 1380
atttttaagt gtataatgtg ttaaactact gattctaatt gtttctctct tttagattcc 1440
aacctttgga actgagttta aaccgcagcc accatgtcca cagctgtgct ggagaaccct 1500
ggcctgggca gaaagctgtc tgactttggc caggagacct cctacattga ggacaactgc 1560
aaccagaatg gagccatctc cctgatcttc tccctgaagg aggaggtggg agccctggcc 1620
aaggtgctga gactgtttga ggagaatgat gtgaacctga cccacattga gtccagaccc 1680
tccagactga agaaggatga gtatgagttc ttcacccacc tggacaagag atccctgcct 1740
gccctgacca acatcatcaa gatcctgaga catgacattg gagccacagt gcatgagctg 1800
tccagagaca agaagaagga cacagtgccc tggttcccca gaaccatcca ggagctggac 1860
agatttgcca accagatcct gtcctatgga gctgagctgg atgctgacca ccctggcttc 1920
aaggaccctg tgtacagggc cagaagaaag cagtttgctg acattgccta caactacaga 1980
catggccagc ccatccccag agtggagtac atggaggagg agaagaagac ctggggcaca 2040
gtgttcaaga ccctgaagtc cctgtacaag acccatgcct gctatgagta caaccacatc 2100
ttccccctgc tggagaagta ctgtggcttc catgaggaca acatccccca gctggaggat 2160
gtgtcccagt tcctgcagac ctgcacaggc ttcagactga gacctgtggc tggcctgctg 2220
tcctccagag acttcctggg aggcctggcc ttcagagtgt tccactgcac ccagtacatc 2280
agacatggct ccaagcccat gtacacccct gagcctgaca tctgccatga gctgctgggc 2340
catgtgcccc tgttctctga cagatccttt gcccagttct cccaggagat tggcctggcc 2400
tccctgggag cccctgatga gtacattgag aagctggcca ccatctactg gttcacagtg 2460
gagtttggcc tgtgcaagca gggagactcc atcaaggcct atggagctgg cctgctgtcc 2520
tcctttggag agctgcagta ctgcctgtct gagaagccca agctgctgcc cctggagctg 2580
gagaagacag ccatccagaa ctacacagtg acagagttcc agcccctgta ctatgtggct 2640
gagtccttca atgatgccaa ggagaaggtc agaaactttg ctgccaccat ccccagaccc 2700
ttctctgtga gatatgaccc ctacacccag agaattgagg tgctggacaa cacccagcag 2760
ctgaagatcc tggctgactc catcaactct gagattggca tcctgtgctc tgccctgcag 2820
aagatcaagt aaaccttaat taagagcatc ttaccgccat ttattcccat atttgttctg 2880
tttttcttga tttgggtata catttaaatg ttaataaaac aaaatggtgg ggcaatcatt 2940
tacattttta gggatatgta attactagtt caggtgtatt gccacaagac aaacatgtta 3000
agaaactttc ccgttattta cgctctgttc ctgttaatca acctctggat tacaaaattt 3060
gtgaaagatt gactgatatt cttaactatg ttgctccttt tacgctgtgt ggatatgctg 3120
ctttatagcc tctgtatcta gctattgctt cccgtacggc tttcgttttc tcctccttgt 3180
ataaatcctg gttgctgtct cttttagagg agttgtggcc cgttgtccgt caacgtggcg 3240
tggtgtgctc tgtgtttgct gacgcaaccc ccactggctg gggcattgcc accacctgtc 3300
aactcctttc tgggactttc gctttccccc tcccgatcgc cacggcagaa ctcatcgccg 3360
cctgccttgc ccgctgctgg acaggggcta ggttgctggg cactgataat tccgtggtgt 3420
tgtctgtgcc ttctagttgc cagccatctg ttgtttgccc ctcccccgtg ccttccttga 3480
ccctggaagg tgccactccc actgtccttt cctaataaaa tgaggaaatt gcatcgcatt 3540
gtctgagtag gtgtcattct attctggggg gtggggtggg gcaggacagc aagggggagg 3600
attgggaaga caatagcagg catgctgggg atgcggtggg ctctatggct ctagagcatg 3660
gctacgtaga taagtagcat ggcgggttaa tcattaacta cacctgcagg aggaacccct 3720
agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc 3780
aaaggtcgcc cgacgcccgg gcggcctcag tgagcgagcg agcgcgcagc tgcctgcagg 3840
<210> 562
<211> 2967
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 562
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180
cgccggggga ggctgctggt gaatattaac caaggtcacc ccagttatcg gaggagcaaa 240
caggggctaa gtccacacgc gtggtaccgt ctgtctgcac atttcgtaga gcgagtgttc 300
cgatactcta atctccctag gcaaggttca tatttgtgta ggttacttat tctccttttg 360
ttgactaagt caataatcag aatcagcagg tttggagtca gcttggcagg gatcagcagc 420
ctgggttgga aggagggggt ataaaagccc cttcaccagg agaagccgtc acacagatcc 480
acaagctcct gaagaggtaa gggtttaagg gatggttggt tggtggggta ttaatgttta 540
attacctgga gcacctgcct gaaatcactt tttttcaggt tggtttaaac cgcagccacc 600
atgtcaactg cagtgttaga gaacccaggc cttggtagaa agctttcaga ctttggacaa 660
gaaaccagct acattgaaga taactgcaac cagaatggtg ccatctccct gatcttcagc 720
ctgaaggaag aagtgggagc cctggccaag gtcctgaggc tctttgaaga gaatgatgtg 780
aacctcaccc acattgagtc cagacccagc aggctcaaga aggatgagta tgaattcttc 840
acccacctgg ataagaggtc cctccctgcc ctcaccaaca tcatcaagat cctgagacat 900
gacattgggg ccactgtcca tgaactgtcc agggacaaga agaaggacac tgtgccctgg 960
ttcccaagga ccatccagga actggacaga tttgccaacc aaatcctgtc ctatggtgct 1020
gagctggatg ctgaccaccc tggattcaag gaccctgtgt acagagccag aaggaaacag 1080
tttgcagaca ttgcctacaa ctacagacat gggcagccta tcccaagagt ggagtacatg 1140
gaagaagaga agaaaacctg gggcactgtg ttcaagaccc ttaagtccct gtacaagacc 1200
catgcctgct atgagtacaa ccacatcttc cccctgctgg agaagtactg tggcttccat 1260
gaggacaaca tcccccagct ggaagatgtg tcccagttcc tccaaacttg cactgggttc 1320
aggctgaggc ctgtggctgg cctgctgagc tccagagact tcttgggtgg actggccttc 1380
agagtgttcc actgcaccca gtacatcaga catggctcca agcccatgta cacccctgag 1440
cctgacatct gtcatgaact cctgggccat gtgcccttgt tcagtgacag aagctttgcc 1500
cagttcagcc aggaaattgg ccttgcctcc ctgggagccc ctgatgagta cattgaaaag 1560
ctagccacca tctactggtt cactgtggaa tttggcttgt gcaaacaggg agactccatc 1620
aaggcctatg gagctggact gctgtcctcc tttggggaac tgcagtactg cctctctgag 1680
aagcccaagc tcctgcccct ggaactggag aaaacagcca tccagaacta cactgtcact 1740
gagttccagc ccctctacta tgtggcagag agcttcaatg atgccaagga aaaagtcaga 1800
aactttgctg ccaccatccc aaggccattc tcagtcagat atgaccccta cacccaaagg 1860
attgaagtgc tggacaacac ccagcagctc aagatcttgg cagactccat aaactcagag 1920
attggaatcc tgtgctctgc cctgcaaaag attaagtaaa ccttaattaa gagcatctta 1980
ccgccattta ttcccatatt tgttctgttt ttcttgattt gggtatacat ttaaatgtta 2040
ataaaacaaa atggtggggc aatcatttac atttttaggg atatgtaatt actagttcag 2100
gtgtattgcc acaagacaaa catgttaaga aactttcccg ttatttacgc tctgttcctg 2160
ttaatcaacc tctggattac aaaatttgtg aaagattgac tgatattctt aactatgttg 2220
ctccttttac gctgtgtgga tatgctgctt tatagcctct gtatctagct attgcttccc 2280
gtacggcttt cgttttctcc tccttgtata aatcctggtt gctgtctctt ttagaggagt 2340
tgtggcccgt tgtccgtcaa cgtggcgtgg tgtgctctgt gtttgctgac gcaaccccca 2400
ctggctgggg cattgccacc acctgtcaac tcctttctgg gactttcgct ttccccctcc 2460
cgatcgccac ggcagaactc atcgccgcct gccttgcccg ctgctggaca ggggctaggt 2520
tgctgggcac tgataattcc gtggtgttgt ctgtgccttc tagttgccag ccatctgttg 2580
tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc cactcccact gtcctttcct 2640
aataaaatga ggaaattgca tcgcattgtc tgagtaggtg tcattctatt ctggggggtg 2700
gggtggggca ggacagcaag ggggaggatt gggaagacaa tagcaggcat gctggggatg 2760
cggtgggctc tatggctcta gagcatggct acgtagataa gtagcatggc gggttaatca 2820
ttaactacac ctgcaggagg aacccctagt gatggagttg gccactccct ctctgcgcgc 2880
tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga cgcccgggcg gcctcagtga 2940
gcgagcgagc gcgcagctgc ctgcagg 2967
<210> 563
<211> 2967
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 563
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180
cgccggggga ggctgctggt gaatattaac caaggtcacc ccagttatcg gaggagcaaa 240
caggggctaa gtccacacgc gtggtaccgt ctgtctgcac atttcgtaga gcgagtgttc 300
cgatactcta atctccctag gcaaggttca tatttgtgta ggttacttat tctccttttg 360
ttgactaagt caataatcag aatcagcagg tttggagtca gcttggcagg gatcagcagc 420
ctgggttgga aggagggggt ataaaagccc cttcaccagg agaagccgtc acacagatcc 480
acaagctcct gaagaggtaa gggtttaagg gatggttggt tggtggggta ttaatgttta 540
attacctgga gcacctgcct gaaatcactt tttttcaggt tggtttaaac cgcagccacc 600
atgtcaactg ctgtgctgga aaaccctgga ttaggaagaa agctctcaga ctttggtcaa 660
gaaacctcct acattgagga caactgcaac cagaatggtg ccatctccct catcttctcc 720
ctgaaagagg aagtgggagc cctggccaag gtcctgaggc tctttgagga aaatgatgtc 780
aacctgaccc acattgagtc caggcccagc agactgaaga aggatgagta tgaattcttc 840
acccacctgg acaagagaag cctccctgcc ctcaccaaca tcatcaagat cctcagacat 900
gacattggag ccactgtgca tgaactcagc agagacaaga agaaggacac tgtgccatgg 960
ttccctagga ccatccagga actggatagg tttgccaacc aaatcctctc ctatggagca 1020
gagctggatg cagaccaccc tggattcaag gacccagtgt acagggccag gaggaaacag 1080
tttgcagaca ttgcctacaa ctacagacat ggccagccca tccctagagt ggagtacatg 1140
gaagaagaga agaaaacctg gggcactgtg ttcaagaccc tgaagtccct gtacaagacc 1200
catgcctgct atgagtacaa ccacatcttc cccctgctgg agaagtactg tggcttccat 1260
gaggacaaca tcccccagct ggaagatgtg tcccagttcc tccaaacttg cactggattc 1320
aggcttagac ctgtggctgg cctgttgagc agcagagact tcctgggagg gctggccttc 1380
agagtgttcc actgtaccca gtacatcaga catggctcca agcccatgta cacccctgag 1440
cctgacatct gccatgaatt gcttggccat gtgcccctgt tcagtgatag atcctttgcc 1500
caattctccc aagaaattgg cctggccagc cttggagccc ctgatgagta cattgaaaag 1560
cttgccacca tctactggtt cactgtggaa tttggcctgt gcaaacaggg ggactccata 1620
aaggcctatg gtgctggact gctgtcctcc tttggggaac tgcagtactg cttgtcagag 1680
aagcccaagt tgctgcccct ggaactggaa aagacagcca tccagaacta cactgtcact 1740
gagttccagc ccctctacta tgtggcagag agcttcaatg atgccaagga aaaagtcaga 1800
aactttgctg ccaccatccc aaggccattc tcagtcagat atgacccata cacccagagg 1860
attgaagtgc tggacaacac ccagcagctg aagatcctgg ctgactccat caactcagag 1920
attgggatcc tgtgctctgc cctccaaaag attaagtaaa ccttaattaa gagcatctta 1980
ccgccattta ttcccatatt tgttctgttt ttcttgattt gggtatacat ttaaatgtta 2040
ataaaacaaa atggtggggc aatcatttac atttttaggg atatgtaatt actagttcag 2100
gtgtattgcc acaagacaaa catgttaaga aactttcccg ttatttacgc tctgttcctg 2160
ttaatcaacc tctggattac aaaatttgtg aaagattgac tgatattctt aactatgttg 2220
ctccttttac gctgtgtgga tatgctgctt tatagcctct gtatctagct attgcttccc 2280
gtacggcttt cgttttctcc tccttgtata aatcctggtt gctgtctctt ttagaggagt 2340
tgtggcccgt tgtccgtcaa cgtggcgtgg tgtgctctgt gtttgctgac gcaaccccca 2400
ctggctgggg cattgccacc acctgtcaac tcctttctgg gactttcgct ttccccctcc 2460
cgatcgccac ggcagaactc atcgccgcct gccttgcccg ctgctggaca ggggctaggt 2520
tgctgggcac tgataattcc gtggtgttgt ctgtgccttc tagttgccag ccatctgttg 2580
tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc cactcccact gtcctttcct 2640
aataaaatga ggaaattgca tcgcattgtc tgagtaggtg tcattctatt ctggggggtg 2700
gggtggggca ggacagcaag ggggaggatt gggaagacaa tagcaggcat gctggggatg 2760
cggtgggctc tatggctcta gagcatggct acgtagataa gtagcatggc gggttaatca 2820
ttaactacac ctgcaggagg aacccctagt gatggagttg gccactccct ctctgcgcgc 2880
tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga cgcccgggcg gcctcagtga 2940
gcgagcgagc gcgcagctgc ctgcagg 2967
<210> 564
<211> 2967
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 564
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180
cgccggggga ggctgctggt gaatattaac caaggtcacc ccagttatcg gaggagcaaa 240
caggggctaa gtccacacgc gtggtaccgt ctgtctgcac atttcgtaga gcgagtgttc 300
cgatactcta atctccctag gcaaggttca tatttgtgta ggttacttat tctccttttg 360
ttgactaagt caataatcag aatcagcagg tttggagtca gcttggcagg gatcagcagc 420
ctgggttgga aggagggggt ataaaagccc cttcaccagg agaagccgtc acacagatcc 480
acaagctcct gaagaggtaa gggtttaagg gatggttggt tggtggggta ttaatgttta 540
attacctgga gcacctgcct gaaatcactt tttttcaggt tggtttaaac cgcagccacc 600
atgtccactg ctgtccttga aaaccctggc cttggtagaa agctctctga ttttggacaa 660
gaaaccagct acattgagga caactgcaac cagaatggtg ccatctcact aatcttcagc 720
ctgaaggaag aagtgggagc cctggccaag gtcttgagac tctttgagga aaatgatgtc 780
aacctcaccc acattgagtc caggccatcc agactcaaga aggatgagta tgaattcttc 840
acccacctgg acaagaggtc cttgcctgcc ctcacaaaca tcatcaagat cctgagacat 900
gacattgggg ccactgtgca tgagctgtcc agagacaaga aaaaggacac tgtgccttgg 960
ttcccaagaa ccatccagga actggacaga tttgccaacc aaatcctgag ctatggggct 1020
gagttggatg cagaccaccc tggattcaag gacccagtgt acagggccag gagaaagcag 1080
tttgcagaca ttgcctacaa ctacagacat ggccagccca tcccaagggt ggagtacatg 1140
gaagaggaaa agaaaacctg gggcactgtg ttcaagaccc tgaagtccct gtacaagacc 1200
catgcctgct atgagtacaa ccacatcttc cccctcctgg aaaagtactg tggcttccat 1260
gaggacaaca tcccccagct ggaagatgtg tcccagttcc tccaaacctg tactgggttc 1320
aggctgaggc ctgtggctgg actgctgagc tccagggact tcctgggtgg actggccttc 1380
agggtgttcc actgcaccca gtacatcaga catggatcca agcccatgta cacccctgag 1440
cctgacattt gccatgaact gctgggccat gtgcccttgt tcagtgatag aagctttgcc 1500
cagttctccc aagaaattgg cctggcctcc ctgggagccc ctgatgagta cattgaaaag 1560
cttgccacca tctactggtt cactgtggaa tttggcctgt gcaaacaggg agactccatc 1620
aaggcctatg gagctgggct cctgagctcc tttggagagc tccagtactg cctgtcagag 1680
aagcccaagc tcctgcccct ggaacttgaa aagactgcca tccagaacta cactgtgact 1740
gagttccagc ccctgtacta tgtggcagag tccttcaatg atgccaagga aaaagtcaga 1800
aactttgctg ccaccatccc aagacccttc tctgtgagat atgaccccta cacccaaagg 1860
attgaagtcc tggacaacac ccagcagctg aagatcctgg cagacagcat caactcagag 1920
ataggcatcc tgtgctcagc cctccaaaag attaagtaaa ccttaattaa gagcatctta 1980
ccgccattta ttcccatatt tgttctgttt ttcttgattt gggtatacat ttaaatgtta 2040
ataaaacaaa atggtggggc aatcatttac atttttaggg atatgtaatt actagttcag 2100
gtgtattgcc acaagacaaa catgttaaga aactttcccg ttatttacgc tctgttcctg 2160
ttaatcaacc tctggattac aaaatttgtg aaagattgac tgatattctt aactatgttg 2220
ctccttttac gctgtgtgga tatgctgctt tatagcctct gtatctagct attgcttccc 2280
gtacggcttt cgttttctcc tccttgtata aatcctggtt gctgtctctt ttagaggagt 2340
tgtggcccgt tgtccgtcaa cgtggcgtgg tgtgctctgt gtttgctgac gcaaccccca 2400
ctggctgggg cattgccacc acctgtcaac tcctttctgg gactttcgct ttccccctcc 2460
cgatcgccac ggcagaactc atcgccgcct gccttgcccg ctgctggaca ggggctaggt 2520
tgctgggcac tgataattcc gtggtgttgt ctgtgccttc tagttgccag ccatctgttg 2580
tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc cactcccact gtcctttcct 2640
aataaaatga ggaaattgca tcgcattgtc tgagtaggtg tcattctatt ctggggggtg 2700
gggtggggca ggacagcaag ggggaggatt gggaagacaa tagcaggcat gctggggatg 2760
cggtgggctc tatggctcta gagcatggct acgtagataa gtagcatggc gggttaatca 2820
ttaactacac ctgcaggagg aacccctagt gatggagttg gccactccct ctctgcgcgc 2880
tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga cgcccgggcg gcctcagtga 2940
gcgagcgagc gcgcagctgc ctgcagg 2967
<210> 565
<211> 2967
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 565
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180
cgccggggga ggctgctggt gaatattaac caaggtcacc ccagttatcg gaggagcaaa 240
caggggctaa gtccacacgc gtggtaccgt ctgtctgcac atttcgtaga gcgagtgttc 300
cgatactcta atctccctag gcaaggttca tatttgtgta ggttacttat tctccttttg 360
ttgactaagt caataatcag aatcagcagg tttggagtca gcttggcagg gatcagcagc 420
ctgggttgga aggagggggt ataaaagccc cttcaccagg agaagccgtc acacagatcc 480
acaagctcct gaagaggtaa gggtttaagg gatggttggt tggtggggta ttaatgttta 540
attacctgga gcacctgcct gaaatcactt tttttcaggt tggtttaaac cgcagccacc 600
atgagcactg ctgtccttga aaaccctggc cttggaagaa agctctctga ctttggacaa 660
gaaacctcct acattgagga caactgcaac cagaatggtg ccatctccct catcttctcc 720
ctgaaagagg aagtgggagc cctggccaag gtcctgaggc tctttgaaga gaatgatgtg 780
aacctcaccc acattgagtc cagacccagc aggctcaaga aagatgagta tgaattcttc 840
acccacctgg acaagagatc cttgcctgcc ctcaccaaca tcatcaagat cctgagacat 900
gacattggag ccactgtgca tgaactgtcc agggacaaga agaaggacac tgtgccctgg 960
ttcccaagga ccatccagga acttgacaga tttgccaacc aaatcctgtc ctatggtgct 1020
gagctggatg cagaccaccc tggattcaag gacccagtgt acagagccag gagaaagcag 1080
tttgctgaca tagcctacaa ctacagacat ggccagccca ttccaagagt ggagtacatg 1140
gaagaagaga agaaaacctg ggggactgtg ttcaagaccc tgaagtccct gtacaagacc 1200
catgcctgct atgagtacaa ccacatcttc cccctgctgg agaagtactg tggcttccat 1260
gaggacaaca tcccccagct ggaagatgtg tcccagttcc tgcaaacttg cactgggttc 1320
aggctcagac ctgtggctgg cttactgagc tccagggact tcctgggtgg actagccttc 1380
agggtgttcc actgcaccca gtacatcaga catggctcca agcccatgta cacccctgag 1440
cctgatatct gccatgaact gctgggccat gtgcccttgt tcagtgacag aagctttgcc 1500
cagttctccc aagaaattgg ccttgcctcc ctgggggccc ctgatgagta cattgaaaag 1560
ctggccacca tctactggtt cactgtggaa tttggcttgt gcaaacaggg agactccatc 1620
aaggcctatg gggcaggact gctgagcagc tttggagagc tgcagtactg cctgtcagag 1680
aagcccaagc tcctgcccct ggaactggaa aagactgcca tccagaacta cactgtcact 1740
gagttccagc ccctctacta tgtggcagag tccttcaatg atgccaagga aaaagtcagg 1800
aactttgcag ccacaatccc tagaccattc tcagtcagat atgacccata cacccagagg 1860
attgaagtgc tggacaacac ccagcagctc aagatcttgg ctgatagcat caactcagag 1920
attggaatcc tgtgttcagc cctccaaaag attaagtaaa ccttaattaa gagcatctta 1980
ccgccattta ttcccatatt tgttctgttt ttcttgattt gggtatacat ttaaatgtta 2040
ataaaacaaa atggtggggc aatcatttac atttttaggg atatgtaatt actagttcag 2100
gtgtattgcc acaagacaaa catgttaaga aactttcccg ttatttacgc tctgttcctg 2160
ttaatcaacc tctggattac aaaatttgtg aaagattgac tgatattctt aactatgttg 2220
ctccttttac gctgtgtgga tatgctgctt tatagcctct gtatctagct attgcttccc 2280
gtacggcttt cgttttctcc tccttgtata aatcctggtt gctgtctctt ttagaggagt 2340
tgtggcccgt tgtccgtcaa cgtggcgtgg tgtgctctgt gtttgctgac gcaaccccca 2400
ctggctgggg cattgccacc acctgtcaac tcctttctgg gactttcgct ttccccctcc 2460
cgatcgccac ggcagaactc atcgccgcct gccttgcccg ctgctggaca ggggctaggt 2520
tgctgggcac tgataattcc gtggtgttgt ctgtgccttc tagttgccag ccatctgttg 2580
tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc cactcccact gtcctttcct 2640
aataaaatga ggaaattgca tcgcattgtc tgagtaggtg tcattctatt ctggggggtg 2700
gggtggggca ggacagcaag ggggaggatt gggaagacaa tagcaggcat gctggggatg 2760
cggtgggctc tatggctcta gagcatggct acgtagataa gtagcatggc gggttaatca 2820
ttaactacac ctgcaggagg aacccctagt gatggagttg gccactccct ctctgcgcgc 2880
tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga cgcccgggcg gcctcagtga 2940
gcgagcgagc gcgcagctgc ctgcagg 2967
<210> 566
<211> 2967
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 566
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180
cgccggggga ggctgctggt gaatattaac caaggtcacc ccagttatcg gaggagcaaa 240
caggggctaa gtccacacgc gtggtaccgt ctgtctgcac atttcgtaga gcgagtgttc 300
cgatactcta atctccctag gcaaggttca tatttgtgta ggttacttat tctccttttg 360
ttgactaagt caataatcag aatcagcagg tttggagtca gcttggcagg gatcagcagc 420
ctgggttgga aggagggggt ataaaagccc cttcaccagg agaagccgtc acacagatcc 480
acaagctcct gaagaggtaa gggtttaagg gatggttggt tggtggggta ttaatgttta 540
attacctgga gcacctgcct gaaatcactt tttttcaggt tggtttaaac cgcagccacc 600
atgtcaaccg ccgtgcttga aaatcctgga ctcggaagga aattgtcaga ctttggacaa 660
gaaacctcct atatcgagga caactgcaac cagaacggcg ccatctctct catcttttcg 720
ctgaaagaag aggtcggagc cctggccaag gtcctgagac tgttcgaaga gaatgacgtc 780
aacctcactc acatcgagtc ccgcccgtca cggctgaaga aagacgaata cgagttcttc 840
acccatctgg ataagcgctc gttgcctgcg ctgactaaca tcataaagat tctgcggcac 900
gacatcggcg cgactgtgca cgagctgagc cgggataaga agaaggacac tgtgccatgg 960
ttcccccgga ccattcaaga actggacaga ttcgcgaacc agattctgtc ctatggcgcc 1020
gagctggacg ctgaccaccc cgggttcaag gaccctgtgt accgcgctag acgcaagcag 1080
ttcgcagaca tcgcctacaa ctatcggcat gggcagccga ttccccgcgt cgagtacatg 1140
gaagaagaga agaaaacctg gggtaccgtg ttcaagactc tgaagtcgct gtacaagacc 1200
cacgcatgct acgagtacaa ccatatcttc ccgctcctcg agaagtactg cggtttccac 1260
gaggataaca ttccccaatt ggaagatgtg tcccagttcc tgcaaacttg cacaggcttt 1320
aggcttagac cggtggcggg cctcctgagc tcccgggatt tcctcggcgg actcgccttc 1380
cgggtgttcc actgcactca gtacattcgg cacgggagca agccgatgta cacccccgaa 1440
ccggatatct gtcatgaact tctgggacac gtgccactct tctccgaccg aagcttcgcg 1500
cagttctccc aagaaatcgg actggcctcc ctgggtgccc ctgatgagta catcgaaaag 1560
cttgccacca tctactggtt taccgtggag ttcggcctgt gcaaacaggg agacagcatc 1620
aaggcatacg gggccggcct gctgtcctcg ttcggagaac tgcagtactg cctgtcggag 1680
aagcccaagt tgctgcccct cgaactggag aaaacggcca tccagaacta caccgtgacc 1740
gagttccagc cgctgtacta cgtggccgaa agcttcaacg acgccaagga aaaggtccgc 1800
aactttgcgg ctaccatccc gaggcctttc tccgtgcgct acgacccata cactcagcgg 1860
atcgaagtgc tggataacac ccagcagctg aagatcctcg ccgactccat taactccgag 1920
attggaatcc tgtgttccgc tctgcaaaag attaagtgaa ccttaattaa gagcatctta 1980
ccgccattta ttcccatatt tgttctgttt ttcttgattt gggtatacat ttaaatgtta 2040
ataaaacaaa atggtggggc aatcatttac atttttaggg atatgtaatt actagttcag 2100
gtgtattgcc acaagacaaa catgttaaga aactttcccg ttatttacgc tctgttcctg 2160
ttaatcaacc tctggattac aaaatttgtg aaagattgac tgatattctt aactatgttg 2220
ctccttttac gctgtgtgga tatgctgctt tatagcctct gtatctagct attgcttccc 2280
gtacggcttt cgttttctcc tccttgtata aatcctggtt gctgtctctt ttagaggagt 2340
tgtggcccgt tgtccgtcaa cgtggcgtgg tgtgctctgt gtttgctgac gcaaccccca 2400
ctggctgggg cattgccacc acctgtcaac tcctttctgg gactttcgct ttccccctcc 2460
cgatcgccac ggcagaactc atcgccgcct gccttgcccg ctgctggaca ggggctaggt 2520
tgctgggcac tgataattcc gtggtgttgt ctgtgccttc tagttgccag ccatctgttg 2580
tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc cactcccact gtcctttcct 2640
aataaaatga ggaaattgca tcgcattgtc tgagtaggtg tcattctatt ctggggggtg 2700
gggtggggca ggacagcaag ggggaggatt gggaagacaa tagcaggcat gctggggatg 2760
cggtgggctc tatggctcta gagcatggct acgtagataa gtagcatggc gggttaatca 2820
ttaactacac ctgcaggagg aacccctagt gatggagttg gccactccct ctctgcgcgc 2880
tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga cgcccgggcg gcctcagtga 2940
gcgagcgagc gcgcagctgc ctgcagg 2967
<210> 567
<211> 2967
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 567
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180
cgccggggga ggctgctggt gaatattaac caaggtcacc ccagttatcg gaggagcaaa 240
caggggctaa gtccacacgc gtggtaccgt ctgtctgcac atttcgtaga gcgagtgttc 300
cgatactcta atctccctag gcaaggttca tatttgtgta ggttacttat tctccttttg 360
ttgactaagt caataatcag aatcagcagg tttggagtca gcttggcagg gatcagcagc 420
ctgggttgga aggagggggt ataaaagccc cttcaccagg agaagccgtc acacagatcc 480
acaagctcct gaagaggtaa gggtttaagg gatggttggt tggtggggta ttaatgttta 540
attacctgga gcacctgcct gaaatcactt tttttcaggt tggtttaaac cgcagccacc 600
atgtcaaccg ccgtgctcga gaaccctgga cttggaagaa aactgtcaga cttcggacaa 660
gagacttctt acatcgagga taactgcaac cagaatggcg cgatttcgct gatattcagc 720
ctgaaggaag aggtcggagc cctggccaag gtcctgcggc ttttcgagga aaacgacgtg 780
aacctgactc acatcgagtc ccggccgagc agactcaaga aggacgaata cgaattcttc 840
acccatctcg ataagcgctc gctgccggcg cttactaaca ttatcaagat cctgcgccac 900
gatatcggag ccaccgtgca tgaactgtcg agggataaga aaaaggatac cgtgccgtgg 960
ttcccgagga ccatccagga actggaccgc ttcgctaacc aaatcttgag ctatggcgcg 1020
gaactcgacg ctgaccaccc cgggttcaag gatcccgtgt accgggccag acgcaagcag 1080
ttcgcagaca ttgcctacaa ctatcgacac ggccagccta ttccacgggt ggagtacatg 1140
gaagaagaga aaaagacctg gggcaccgtg ttcaagaccc tgaagtccct gtacaagact 1200
cacgcctgct acgagtacaa ccacatcttc cctctgctcg aaaagtactg cgggttccat 1260
gaggacaaca tccctcagct cgaggacgtg tcacagttcc tgcaaacgtg cactggcttt 1320
cggctgaggc cggtggccgg tctgctgagc tcaagggatt ttctgggcgg actggcgttc 1380
cgcgtgttcc actgcaccca gtatatccgc catggtagca agcccatgta cactccggag 1440
cctgacattt gccacgaact actgggacac gtgccgttgt ttagcgaccg gtcgtttgcc 1500
caattctccc aagaaatcgg actggcctcc ctgggggcgc cagacgagta cattgaaaag 1560
ctcgcaacca tctactggtt caccgtggaa ttcggactgt gcaaacaggg cgattcgatc 1620
aaggcctacg gcgccgggct cctgtcctcc ttcggtgaac tgcagtactg tctgtccgag 1680
aagcccaagc tcctgcccct cgagcttgaa aagacagcta tccagaacta cactgtcacc 1740
gagttccagc cactctacta cgtggccgag tccttcaatg acgccaagga aaaagtccgg 1800
aacttcgcgg caaccattcc tagacccttc tccgtgcgct acgacccgta cacccagcgg 1860
atcgaagtgc tggacaacac ccagcagttg aagatcctgg ccgactccat caactccgaa 1920
atcggtattt tgtgttccgc cctgcaaaag attaagtgaa ccttaattaa gagcatctta 1980
ccgccattta ttcccatatt tgttctgttt ttcttgattt gggtatacat ttaaatgtta 2040
ataaaacaaa atggtggggc aatcatttac atttttaggg atatgtaatt actagttcag 2100
gtgtattgcc acaagacaaa catgttaaga aactttcccg ttatttacgc tctgttcctg 2160
ttaatcaacc tctggattac aaaatttgtg aaagattgac tgatattctt aactatgttg 2220
ctccttttac gctgtgtgga tatgctgctt tatagcctct gtatctagct attgcttccc 2280
gtacggcttt cgttttctcc tccttgtata aatcctggtt gctgtctctt ttagaggagt 2340
tgtggcccgt tgtccgtcaa cgtggcgtgg tgtgctctgt gtttgctgac gcaaccccca 2400
ctggctgggg cattgccacc acctgtcaac tcctttctgg gactttcgct ttccccctcc 2460
cgatcgccac ggcagaactc atcgccgcct gccttgcccg ctgctggaca ggggctaggt 2520
tgctgggcac tgataattcc gtggtgttgt ctgtgccttc tagttgccag ccatctgttg 2580
tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc cactcccact gtcctttcct 2640
aataaaatga ggaaattgca tcgcattgtc tgagtaggtg tcattctatt ctggggggtg 2700
gggtggggca ggacagcaag ggggaggatt gggaagacaa tagcaggcat gctggggatg 2760
cggtgggctc tatggctcta gagcatggct acgtagataa gtagcatggc gggttaatca 2820
ttaactacac ctgcaggagg aacccctagt gatggagttg gccactccct ctctgcgcgc 2880
tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga cgcccgggcg gcctcagtga 2940
gcgagcgagc gcgcagctgc ctgcagg 2967
<210> 568
<211> 2970
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 568
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180
cgccggggga ggctgctggt gaatattaac caaggtcacc ccagttatcg gaggagcaaa 240
caggggctaa gtccacacgc gtggtaccgt ctgtctgcac atttcgtaga gcgagtgttc 300
cgatactcta atctccctag gcaaggttca tatttgtgta ggttacttat tctccttttg 360
ttgactaagt caataatcag aatcagcagg tttggagtca gcttggcagg gatcagcagc 420
ctgggttgga aggagggggt ataaaagccc cttcaccagg agaagccgtc acacagatcc 480
acaagctcct gaagaggtaa gggtttaagg gatggttggt tggtggggta ttaatgttta 540
attacctgga gcacctgcct gaaatcactt tttttcaggt tggtttaaac cgcagccacc 600
atggccgctg tggtgctgga aaatggcgtg ctgagcagaa agctgagcga cttcggccaa 660
gagacaagct acatcgagga caacagcaac cagaacggcg ctgtgtccct gatcttcagc 720
ctgaaagaag aagtgggcgc cctggccaag gtgctgagac tgtttgagga aaacgagatc 780
aacctgacgc acatcgagag cagacccagc agactgaaca aggacgagta cgagttcttc 840
acctacctgg acaagagaag caagcccgtg ctgggcagca tcatcaagag cctgagaaac 900
gacatcggcg ccaccgtgca cgagctgagc agggacaaag aaaagaacac cgtgccatgg 960
ttccccagga ccatccaaga gctggacaga ttcgccaacc agatcctgtc ttacggcgcc 1020
gagctggacg ctgatcaccc tggctttaag gaccccgtgt acagagccag aagaaagcag 1080
ttcgccgata tcgcctacaa ctacagacac ggccagccta ttcctagagt cgagtacacc 1140
gaggaagaga gaaagacctg gggcaccgtg ttcagaaccc tgaaggccct gtacaagacc 1200
cacgcctgct acgagcacaa ccacatcttc ccactgctcg aaaagtactg cggcttccgc 1260
gaggataaca tccctcagct tgaggacgtg tcccagttcc tgcagacctg cacaggcttc 1320
agactgaggc cagttgctgg cctgctgtcc agcagagatt ttctcggcgg cctggccttc 1380
agagtgttcc actgtaccca gtacatcagg cacggcagca agcccatgta cacccctgag 1440
cctgacatct gccacgagct gctgggacat gtgcctctgt tcagcgacag aagcttcgcc 1500
cagttcagcc aagagatcgg cctggctagt ctgggcgctc ctgatgagta catcgagaag 1560
ctggccacca tctactggtt caccgtggaa ttcggcctgt gcaaagaggg cgacagcatc 1620
aaggcttatg gcgccggact gctgtctagc tttggcgagc tgcagtactg tctgagcgac 1680
aagcctaagc tgctgcccct ggaactggaa aagaccgcct gccaagagta cacagtgacc 1740
gagttccagc ctctgtacta cgtggccgag agcttcaacg acgccaaaga aaaagtgcgg 1800
accttcgccg ctacaatccc cagacctttc agcgtcagat acgaccccta cacacagcgc 1860
gtggaagtgc tggacaacac acagcagctg aagattctgg ccgactccat caacagcgaa 1920
gtgggcatcc tgtgtcacgc cctgcagaaa atcaagagct gatagttaat taagagcatc 1980
ttaccgccat ttattcccat atttgttctg tttttcttga tttgggtata catttaaatg 2040
ttaataaaac aaaatggtgg ggcaatcatt tacattttta gggatatgta attactagtt 2100
caggtgtatt gccacaagac aaacatgtta agaaactttc ccgttattta cgctctgttc 2160
ctgttaatca acctctggat tacaaaattt gtgaaagatt gactgatatt cttaactatg 2220
ttgctccttt tacgctgtgt ggatatgctg ctttatagcc tctgtatcta gctattgctt 2280
cccgtacggc tttcgttttc tcctccttgt ataaatcctg gttgctgtct cttttagagg 2340
agttgtggcc cgttgtccgt caacgtggcg tggtgtgctc tgtgtttgct gacgcaaccc 2400
ccactggctg gggcattgcc accacctgtc aactcctttc tgggactttc gctttccccc 2460
tcccgatcgc cacggcagaa ctcatcgccg cctgccttgc ccgctgctgg acaggggcta 2520
ggttgctggg cactgataat tccgtggtgt tgtctgtgcc ttctagttgc cagccatctg 2580
ttgtttgccc ctcccccgtg ccttccttga ccctggaagg tgccactccc actgtccttt 2640
cctaataaaa tgaggaaatt gcatcgcatt gtctgagtag gtgtcattct attctggggg 2700
gtggggtggg gcaggacagc aagggggagg attgggaaga caatagcagg catgctgggg 2760
atgcggtggg ctctatggct ctagagcatg gctacgtaga taagtagcat ggcgggttaa 2820
tcattaacta cacctgcagg aggaacccct agtgatggag ttggccactc cctctctgcg 2880
cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg gcggcctcag 2940
tgagcgagcg agcgcgcagc tgcctgcagg 2970
<210> 569
<211> 2970
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 569
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180
cgccggggga ggctgctggt gaatattaac caaggtcacc ccagttatcg gaggagcaaa 240
caggggctaa gtccacacgc gtggtaccgt ctgtctgcac atttcgtaga gcgagtgttc 300
cgatactcta atctccctag gcaaggttca tatttgtgta ggttacttat tctccttttg 360
ttgactaagt caataatcag aatcagcagg tttggagtca gcttggcagg gatcagcagc 420
ctgggttgga aggagggggt ataaaagccc cttcaccagg agaagccgtc acacagatcc 480
acaagctcct gaagaggtaa gggtttaagg gatggttggt tggtggggta ttaatgttta 540
attacctgga gcacctgcct gaaatcactt tttttcaggt tggtttaaac cgcagccacc 600
atggccgctg tggtgctgga aaatggcgtg ctgagcagaa agctgagcga cttcggccaa 660
gagacaagct acatcgagga caacagcaac cagaacggcg ctgtgtccct gatcttcagc 720
ctgaaagaag aagtgggcgc cctggccaag gtgctgagac tgtttgagga aaacgagatc 780
aacctgacgc acatcgagag cagacccagc agactgaaca aggacgagta cgagttcttc 840
acctacctgg acaagagaag caagcccgtg ctgggcagca tcatcaagag cctgagaaac 900
gacatcggcg ccaccgtgca cgagctgagc agggacaaag aaaagaacac cgtgccatgg 960
ttccccagga ccatccaaga gctggacaga ttcgccaacc agatcctgtc ttacggcgcc 1020
gagctggacg ctgatcaccc tggctttaag gaccccgtgt acagagccag aagaaagcag 1080
ttcgccgata tcgcctacaa ctacagacac ggccagccta ttcctagagt cgagtacacc 1140
gaggaagaga gaaagacctg gggcaccgtg ttcagaaccc tgaaggccct gtacaagacc 1200
cacgcctgct acgagcacaa ccacatcttc ccactgctcg aaaagtactg cggcttccgc 1260
gaggataaca tccctcagct tgaggacgtg tcccagttcc tgcagacctg cacaggcttc 1320
agactgaggc cagttgctgg cctgctgtcc agcagagatt ttctcggcgg cctggccttc 1380
agagtgttcc actgtaccca gtacatcagg cacggcagca agcccatgta cacccctgag 1440
cctgacatct gccacgagct gctgggacat gtgcctctgt tcagcgacag aagcttcgcc 1500
cagttcagcc aagagatcgg cctggctagt ctgggcgctc ctgatgagta catcgagaag 1560
ctggccacca tctactggtt caccgtggaa ttcggcctgt gcaaagaggg cgacagcatc 1620
aaggcttatg gcgccggact gctgtctagc tttggcgagc tgcagtactg tctgagcgac 1680
aagcctaagc tgctgcccct ggaactggaa aagaccgcct gccaagagta cacagtgacc 1740
gagttccagc ctctgtacta cgtggccgag agcttcaacg acgccaaaga aaaagtgcgg 1800
accttcgccg ctacaatccc cagacctttc agcgtcagat acgaccccta cacacagcgc 1860
gtggaagtgc tggacaacac acagcagctg aagattctgg ccgactccat caacagcgaa 1920
gtgggcatcc tgtgtcacgc cctgcagaaa atcaagagct gatagttaat taagagcatc 1980
ttaccgccat ttattcccat atttgttctg tttttcttga tttgggtata catttaaatg 2040
ttaataaaac aaaatggtgg ggcaatcatt tacattttta gggatatgta attactagtt 2100
caggtgtatt gccacaagac aaacatgtta agaaactttc ccgttattta cgctctgttc 2160
ctgttaatca acctctggat tacaaaattt gtgaaagatt gactgatatt cttaactatg 2220
ttgctccttt tacgctgtgt ggatatgctg ctttatagcc tctgtatcta gctattgctt 2280
cccgtacggc tttcgttttc tcctccttgt ataaatcctg gttgctgtct cttttagagg 2340
agttgtggcc cgttgtccgt caacgtggcg tggtgtgctc tgtgtttgct gacgcaaccc 2400
ccactggctg gggcattgcc accacctgtc aactcctttc tgggactttc gctttccccc 2460
tcccgatcgc cacggcagaa ctcatcgccg cctgccttgc ccgctgctgg acaggggcta 2520
ggttgctggg cactgataat tccgtggtgt tgtctgtgcc ttctagttgc cagccatctg 2580
ttgtttgccc ctcccccgtg ccttccttga ccctggaagg tgccactccc actgtccttt 2640
cctaataaaa tgaggaaatt gcatcgcatt gtctgagtag gtgtcattct attctggggg 2700
gtggggtggg gcaggacagc aagggggagg attgggaaga caatagcagg catgctgggg 2760
atgcggtggg ctctatggct ctagagcatg gctacgtaga taagtagcat ggcgggttaa 2820
tcattaacta cacctgcagg aggaacccct agtgatggag ttggccactc cctctctgcg 2880
cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg gcggcctcag 2940
tgagcgagcg agcgcgcagc tgcctgcagg 2970
<210> 570
<211> 3984
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 570
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180
cgcgttaatc attaacgctt gtactttggt acagttaatc attaacgctt gtactttggt 240
acagttaatc attaacgctt gtactttggt acaatcgatg cgagaacttg tgcctccccg 300
tgttcctgct ctttgtccct ctgtcctact tagactaata tttgccttgg gtactgcaaa 360
caggaaatgg gggagggaca ggagtagggc ggagggtagt taagaatgtg gatccccgtc 420
tgtctgcaca tttcgtagag cgagtgttcc gatactctaa tctccctagg caaggttcat 480
atttgtgtag gttacttatt ctccttttgt tgactaagtc aataatcaga atcagcaggt 540
ttggagtcag cttggcaggg atcagcagcc tgggttggaa ggagggggta taaaagcccc 600
ttcaccagga gaagccgtca cacagatcca caagctcctg aagaggtaag ggtttaaggg 660
atggttggtt ggtggggtat taatgtttaa ttacctggag cacctgcctg aaatcacttt 720
ttttcaggtt gggtttaaac cgcagccacc atgtccacag ctgtgctgga gaaccctggc 780
ttgggcagga aactctctga ctttggacag gtgagccagg gcagcctgag ctgctcagtt 840
aggggaattt gggcctccag agaaagagat cccaagactg ctggtgcttc ctggtttcat 900
aagctcagta agaagtctga attggttgga agctgatgag aatatccagg aagtcaacag 960
acaaatgtcc tcaacaattg tttctaagta ggagaacatc tgtcctgggt ggctttcaca 1020
ggaatgaatg accattgctt tagggggttg gggatctggc ctccagaact gccaccaatt 1080
agctgtgtgt ctttggacaa gttactgtcc ctctctgttg tctgtttact cttctgtaca 1140
ctgaaggggt tccaatccag gtcttaggat tcaaaagcct gtgcatgttc catttttagt 1200
actttccaca ctgtatttct caatgtcttt ctgggacatt ttataaatca tattatatca 1260
cctctaagga tctttcagtt tgttatatat gtgtctatta agttagattg tgagctccta 1320
aaagataaag cattgtctta ttcatcttta aatttctcag agcccaaata gtgcctggaa 1380
cctagtagtt gctcaataaa aggtattgaa tttacaggat tgaatggtga catcaatgaa 1440
taattgaaga ttccttaagc tgataactga cccagtagca tcattgatca tttaattgcc 1500
ctggacttac ttattttcca ccacactaca tatttctgta tagaatatat atagctcatt 1560
gtattgcaag atttaactag aagaaagagt tcatgcttgc tttgtccatg taggtttaac 1620
aggaatgaat tgctaaactg tggaaaatgt tttaaacaaa tgcatcttat cctgtaggaa 1680
acaagctata ttgaagacaa ctgcaatcaa aatggagcca tctccctgat cttctccctg 1740
aaggaggagg tgggagccct ggccaaggtg ctgagactgt ttgaggagaa tgatgtgaac 1800
ctgacccaca ttgagtccag accctccaga ctgaagaagg atgagtatga gttcttcacc 1860
cacctggaca agagatccct gcctgccctg accaacatca tcaagatcct gagacatgac 1920
attggagcca cagtgcatga gctgtccaga gacaagaaga aggacacagt gccctggttc 1980
cccagaacca tccaggagct ggacagattt gccaaccaga tcctgtccta tggagctgag 2040
ctggatgctg accaccctgg cttcaaggac cctgtgtaca gggccagaag aaagcagttt 2100
gctgacattg cctacaacta cagacatggc cagcccatcc ccagagtgga gtacatggag 2160
gaggagaaga agacctgggg cacagtgttc aagaccctga agtccctgta caagacccat 2220
gcctgctatg agtacaacca catcttcccc ctgctggaga agtactgtgg cttccatgag 2280
gacaacatcc cccagctgga ggatgtgtcc cagttcctgc agacctgcac aggcttcaga 2340
ctgagacctg tggctggcct gctgtcctcc agagacttcc tgggaggcct ggccttcaga 2400
gtgttccact gcacccagta catcagacat ggctccaagc ccatgtacac ccctgagcct 2460
gacatctgcc atgagctgct gggccatgtg cccctgttct ctgacagatc ctttgcccag 2520
ttctcccagg agattggcct ggcctccctg ggagcccctg atgagtacat tgagaagctg 2580
gccaccatct actggttcac agtggagttt ggcctgtgca agcagggaga ctccatcaag 2640
gcctatggag ctggcctgct gtcctccttt ggagagctgc agtactgcct gtctgagaag 2700
cccaagctgc tgcccctgga gctggagaag acagccatcc agaactacac agtgacagag 2760
ttccagcccc tgtactatgt ggctgagtcc ttcaatgatg ccaaggagaa ggtcagaaac 2820
tttgctgcca ccatccccag acccttctct gtgagatatg acccctacac ccagagaatt 2880
gaggtgctgg acaacaccca gcagctgaag atcctggctg actccatcaa ctctgagatt 2940
ggcatcctgt gctctgccct gcagaagatc aagtaaacct taattaagag catcttaccg 3000
ccatttattc ccatatttgt tctgtttttc ttgatttggg tatacattta aatgttaata 3060
aaacaaaatg gtggggcaat catttacatt tttagggata tgtaattact agttcaggtg 3120
tattgccaca agacaaacat gttaagaaac tttcccgtta tttacgctct gttcctgtta 3180
atcaacctct ggattacaaa atttgtgaaa gattgactga tattcttaac tatgttgctc 3240
cttttacgct gtgtggatat gctgctttat agcctctgta tctagctatt gcttcccgta 3300
cggctttcgt tttctcctcc ttgtataaat cctggttgct gtctctttta gaggagttgt 3360
ggcccgttgt ccgtcaacgt ggcgtggtgt gctctgtgtt tgctgacgca acccccactg 3420
gctggggcat tgccaccacc tgtcaactcc tttctgggac tttcgctttc cccctcccga 3480
tcgccacggc agaactcatc gccgcctgcc ttgcccgctg ctggacaggg gctaggttgc 3540
tgggcactga taattccgtg gtgttgtctg tgccttctag ttgccagcca tctgttgttt 3600
gcccctcccc cgtgccttcc ttgaccctgg aaggtgccac tcccactgtc ctttcctaat 3660
aaaatgagga aattgcatcg cattgtctga gtaggtgtca ttctattctg gggggtgggg 3720
tggggcagga cagcaagggg gaggattggg aagacaatag caggcatgct ggggatgcgg 3780
tgggctctat ggctctagag catggctacg tagataagta gcatggcggg ttaatcatta 3840
actacacctg caggaggaac ccctagtgat ggagttggcc actccctctc tgcgcgctcg 3900
ctcgctcact gaggccgggc gaccaaaggt cgcccgacgc ccgggcggcc tcagtgagcg 3960
agcgagcgcg cagctgcctg cagg 3984
<210> 571
<211> 3346
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 571
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180
cgcgttaatc attaacgctt gtactttggt acagttaatc attaacgctt gtactttggt 240
acagttaatc attaacgctt gtactttggt acaatcgatg cgagaacttg tgcctccccg 300
tgttcctgct ctttgtccct ctgtcctact tagactaata tttgccttgg gtactgcaaa 360
caggaaatgg gggagggaca ggagtagggc ggagggtagt taagaatgtg gatccccgtc 420
tgtctgcaca tttcgtagag cgagtgttcc gatactctaa tctccctagg caaggttcat 480
atttgtgtag gttacttatt ctccttttgt tgactaagtc aataatcaga atcagcaggt 540
ttggagtcag cttggcaggg atcagcagcc tgggttggaa ggagggggta taaaagcccc 600
ttcaccagga gaagccgtca cacagatcca caagctcctg aagaggtaag ggtttaaggg 660
atggttggtt ggtggggtat taatgtttaa ttacctggag cacctgcctg aaatcacttt 720
ttttcaggtt gggtttaaac cgcagccacc atgtccacag ctgtgctgga gaaccctggc 780
ttgggcagga aactctctga ctttggacag gtgagccagg gcagcctgag ctgctcagtt 840
aggggaattt gggcctccag agaaagagat ctgaagactg ctggtgcttc ctggtttcat 900
aagctcagta agaagtctga attcattgga agctgatgat agaagaaaga gttcatgctt 960
gctttgtcca tggaggttta acaggaatga attgctaaac tgtggaaaat gttttaaaca 1020
aatgcatctt atcctgtagg aaacaagcta tattgaagac aactgcaatc aaaatggagc 1080
catctccctg atcttctccc tgaaggagga ggtgggagcc ctggccaagg tgctgagact 1140
gtttgaggag aatgatgtga acctgaccca cattgagtcc agaccctcca gactgaagaa 1200
ggatgagtat gagttcttca cccacctgga caagagatcc ctgcctgccc tgaccaacat 1260
catcaagatc ctgagacatg acattggagc cacagtgcat gagctgtcca gagacaagaa 1320
gaaggacaca gtgccctggt tccccagaac catccaggag ctggacagat ttgccaacca 1380
gatcctgtcc tatggagctg agctggatgc tgaccaccct ggcttcaagg accctgtgta 1440
cagggccaga agaaagcagt ttgctgacat tgcctacaac tacagacatg gccagcccat 1500
ccccagagtg gagtacatgg aggaggagaa gaagacctgg ggcacagtgt tcaagaccct 1560
gaagtccctg tacaagaccc atgcctgcta tgagtacaac cacatcttcc ccctgctgga 1620
gaagtactgt ggcttccatg aggacaacat cccccagctg gaggatgtgt cccagttcct 1680
gcagacctgc acaggcttca gactgagacc tgtggctggc ctgctgtcct ccagagactt 1740
cctgggaggc ctggccttca gagtgttcca ctgcacccag tacatcagac atggctccaa 1800
gcccatgtac acccctgagc ctgacatctg ccatgagctg ctgggccatg tgcccctgtt 1860
ctctgacaga tcctttgccc agttctccca ggagattggc ctggcctccc tgggagcccc 1920
tgatgagtac attgagaagc tggccaccat ctactggttc acagtggagt ttggcctgtg 1980
caagcaggga gactccatca aggcctatgg agctggcctg ctgtcctcct ttggagagct 2040
gcagtactgc ctgtctgaga agcccaagct gctgcccctg gagctggaga agacagccat 2100
ccagaactac acagtgacag agttccagcc cctgtactat gtggctgagt ccttcaatga 2160
tgccaaggag aaggtcagaa actttgctgc caccatcccc agacccttct ctgtgagata 2220
tgacccctac acccagagaa ttgaggtgct ggacaacacc cagcagctga agatcctggc 2280
tgactccatc aactctgaga ttggcatcct gtgctctgcc ctgcagaaga tcaagtaaac 2340
cttaattaag agcatcttac cgccatttat tcccatattt gttctgtttt tcttgatttg 2400
ggtatacatt taaatgttaa taaaacaaaa tggtggggca atcatttaca tttttaggga 2460
tatgtaatta ctagttcagg tgtattgcca caagacaaac atgttaagaa actttcccgt 2520
tatttacgct ctgttcctgt taatcaacct ctggattaca aaatttgtga aagattgact 2580
gatattctta actatgttgc tccttttacg ctgtgtggat atgctgcttt atagcctctg 2640
tatctagcta ttgcttcccg tacggctttc gttttctcct ccttgtataa atcctggttg 2700
ctgtctcttt tagaggagtt gtggcccgtt gtccgtcaac gtggcgtggt gtgctctgtg 2760
tttgctgacg caacccccac tggctggggc attgccacca cctgtcaact cctttctggg 2820
actttcgctt tccccctccc gatcgccacg gcagaactca tcgccgcctg ccttgcccgc 2880
tgctggacag gggctaggtt gctgggcact gataattccg tggtgttgtc tgtgccttct 2940
agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc 3000
actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct gagtaggtgt 3060
cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg ggaagacaat 3120
agcaggcatg ctggggatgc ggtgggctct atggctctag agcatggcta cgtagataag 3180
tagcatggcg ggttaatcat taactacacc tgcaggagga acccctagtg atggagttgg 3240
ccactccctc tctgcgcgct cgctcgctca ctgaggccgg gcgaccaaag gtcgcccgac 3300
gcccgggcgg cctcagtgag cgagcgagcg cgcagctgcc tgcagg 3346
<210> 572
<211> 4108
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 572
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180
cgcagcaaca gatcattcta tgggttaatc attaacaaca ggttaggctt gtactttggt 240
acattggctc ctagttaatc attaacttag caatgtgctt gtactttggt acatagttac 300
ctagttaatc attaacaaac agtatggctt gtactttggt acaagcaaca gatcattcta 360
tgggcgagaa cttgtgcctc cccgtgttcc tgctctttgt ccctctgtcc tacttagact 420
aatatttgcc ttgggtactg caaacaggaa atgggggagg gacaggagta gggcggaggg 480
tagcaattgg attctgcagt gagagcagag ggccagctaa gtggtactct cccagagact 540
gtctgactca cgccaccccc tccaccttgg acacaggacg ctgtggtttc tgagccaggt 600
acaatgactc ctttcggtaa gtgcagtgga agctgtacac tgcccaggca aagcgtccgg 660
gcagcgtagg cgggcgactc agatcccagc cagtggactt agcccctgtt tgctcctccg 720
ataactgggg tgaccttggt taatattcac cagcagcctc ccccgttgcc cctctggatc 780
cactgcttaa atacggacga ggacagggcc ctgtctcctc agcttcaggc accaccactg 840
acctgggaca gtgaatgttt aaaccgcagc caccatgtcc acagctgtgc tggagaaccc 900
tggcttgggc aggaaactct ctgactttgg acaggtgagc cagggcagcc tgagctgctc 960
agttagggga atttgggcct ccagagaaag agatcccaag actgctggtg cttcctggtt 1020
tcataagctc agtaagaagt ctgaattggt tggaagctga tgagaatatc caggaagtca 1080
acagacaaat gtcctcaaca attgtttcta agtaggagaa catctgtcct gggtggcttt 1140
cacaggaatg aatgaccatt gctttagggg gttggggatc tggcctccag aactgccacc 1200
aattagctgt gtgtctttgg acaagttact gtccctctct gttgtctgtt tactcttctg 1260
tacactgaag gggttccaat ccaggtctta ggattcaaaa gcctgtgcat gttccatttt 1320
tagtactttc cacactgtat ttctcaatgt ctttctggga cattttataa atcatattat 1380
atcacctcta aggatctttc agtttgttat atatgtgtct attaagttag attgtgagct 1440
cctaaaagat aaagcattgt cttattcatc tttaaatttc tcagagccca aatagtgcct 1500
ggaacctagt agttgctcaa taaaaggtat tgaatttaca ggattgaatg gtgacatcaa 1560
tgaataattg aagattcctt aagctgataa ctgacccagt agcatcattg atcatttaat 1620
tgccctggac ttacttattt tccaccacac tacatatttc tgtatagaat atatatagct 1680
cattgtattg caagatttaa ctagaagaaa gagttcatgc ttgctttgtc catgtaggtt 1740
taacaggaat gaattgctaa actgtggaaa atgttttaaa caaatgcatc ttatcctgta 1800
ggaaacaagc tatattgaag acaactgcaa tcaaaatgga gccatctccc tgatcttctc 1860
cctgaaggag gaggtgggag ccctggccaa ggtgctgaga ctgtttgagg agaatgatgt 1920
gaacctgacc cacattgagt ccagaccctc cagactgaag aaggatgagt atgagttctt 1980
cacccacctg gacaagagat ccctgcctgc cctgaccaac atcatcaaga tcctgagaca 2040
tgacattgga gccacagtgc atgagctgtc cagagacaag aagaaggaca cagtgccctg 2100
gttccccaga accatccagg agctggacag atttgccaac cagatcctgt cctatggagc 2160
tgagctggat gctgaccacc ctggcttcaa ggaccctgtg tacagggcca gaagaaagca 2220
gtttgctgac attgcctaca actacagaca tggccagccc atccccagag tggagtacat 2280
ggaggaggag aagaagacct ggggcacagt gttcaagacc ctgaagtccc tgtacaagac 2340
ccatgcctgc tatgagtaca accacatctt ccccctgctg gagaagtact gtggcttcca 2400
tgaggacaac atcccccagc tggaggatgt gtcccagttc ctgcagacct gcacaggctt 2460
cagactgaga cctgtggctg gcctgctgtc ctccagagac ttcctgggag gcctggcctt 2520
cagagtgttc cactgcaccc agtacatcag acatggctcc aagcccatgt acacccctga 2580
gcctgacatc tgccatgagc tgctgggcca tgtgcccctg ttctctgaca gatcctttgc 2640
ccagttctcc caggagattg gcctggcctc cctgggagcc cctgatgagt acattgagaa 2700
gctggccacc atctactggt tcacagtgga gtttggcctg tgcaagcagg gagactccat 2760
caaggcctat ggagctggcc tgctgtcctc ctttggagag ctgcagtact gcctgtctga 2820
gaagcccaag ctgctgcccc tggagctgga gaagacagcc atccagaact acacagtgac 2880
agagttccag cccctgtact atgtggctga gtccttcaat gatgccaagg agaaggtcag 2940
aaactttgct gccaccatcc ccagaccctt ctctgtgaga tatgacccct acacccagag 3000
aattgaggtg ctggacaaca cccagcagct gaagatcctg gctgactcca tcaactctga 3060
gattggcatc ctgtgctctg ccctgcagaa gatcaagtaa accttaatta agagcatctt 3120
accgccattt attcccatat ttgttctgtt tttcttgatt tgggtataca tttaaatgtt 3180
aataaaacaa aatggtgggg caatcattta catttttagg gatatgtaat tactagttca 3240
ggtgtattgc cacaagacaa acatgttaag aaactttccc gttatttacg ctctgttcct 3300
gttaatcaac ctctggatta caaaatttgt gaaagattga ctgatattct taactatgtt 3360
gctcctttta cgctgtgtgg atatgctgct ttatagcctc tgtatctagc tattgcttcc 3420
cgtacggctt tcgttttctc ctccttgtat aaatcctggt tgctgtctct tttagaggag 3480
ttgtggcccg ttgtccgtca acgtggcgtg gtgtgctctg tgtttgctga cgcaaccccc 3540
actggctggg gcattgccac cacctgtcaa ctcctttctg ggactttcgc tttccccctc 3600
ccgatcgcca cggcagaact catcgccgcc tgccttgccc gctgctggac aggggctagg 3660
ttgctgggca ctgataattc cgtggtgttg tctgtgcctt ctagttgcca gccatctgtt 3720
gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg ccactcccac tgtcctttcc 3780
taataaaatg aggaaattgc atcgcattgt ctgagtaggt gtcattctat tctggggggt 3840
ggggtggggc aggacagcaa gggggaggat tgggaagaca atagcaggca tgctggggat 3900
gcggtgggct ctatggctct agagcatggc tacgtagata agtagcatgg cgggttaatc 3960
attaactaca cctgcaggag gaacccctag tgatggagtt ggccactccc tctctgcgcg 4020
ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg acgcccgggc ggcctcagtg 4080
agcgagcgag cgcgcagctg cctgcagg 4108
<210> 573
<211> 4063
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 573
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180
cgcagcaaca gatcattcta tgggttaatc attaacaaca ggttaggtta atcattaact 240
tggctcctag ttaatcatta acaaacagta tggttaatca ttaacaaatt ctggggttaa 300
tcattaacta gttacctagc gagaacttgt gcctccccgt gttcctgctc tttgtccctc 360
tgtcctactt agactaatat ttgccttggg tactgcaaac aggaaatggg ggagggacag 420
gagtagggcg gagggtagca attggattct gcagtgagag cagagggcca gctaagtggt 480
actctcccag agactgtctg actcacgcca ccccctccac cttggacaca ggacgctgtg 540
gtttctgagc caggtacaat gactcctttc ggtaagtgca gtggaagctg tacactgccc 600
aggcaaagcg tccgggcagc gtaggcgggc gactcagatc ccagccagtg gacttagccc 660
ctgtttgctc ctccgataac tggggtgacc ttggttaata ttcaccagca gcctcccccg 720
ttgcccctct ggatccactg cttaaatacg gacgaggaca gggccctgtc tcctcagctt 780
caggcaccac cactgacctg ggacagtgaa tgtttaaacc gcagccacca tgtccacagc 840
tgtgctggag aaccctggct tgggcaggaa actctctgac tttggacagg tgagccaggg 900
cagcctgagc tgctcagtta ggggaatttg ggcctccaga gaaagagatc ccaagactgc 960
tggtgcttcc tggtttcata agctcagtaa gaagtctgaa ttggttggaa gctgatgaga 1020
atatccagga agtcaacaga caaatgtcct caacaattgt ttctaagtag gagaacatct 1080
gtcctgggtg gctttcacag gaatgaatga ccattgcttt agggggttgg ggatctggcc 1140
tccagaactg ccaccaatta gctgtgtgtc tttggacaag ttactgtccc tctctgttgt 1200
ctgtttactc ttctgtacac tgaaggggtt ccaatccagg tcttaggatt caaaagcctg 1260
tgcatgttcc atttttagta ctttccacac tgtatttctc aatgtctttc tgggacattt 1320
tataaatcat attatatcac ctctaaggat ctttcagttt gttatatatg tgtctattaa 1380
gttagattgt gagctcctaa aagataaagc attgtcttat tcatctttaa atttctcaga 1440
gcccaaatag tgcctggaac ctagtagttg ctcaataaaa ggtattgaat ttacaggatt 1500
gaatggtgac atcaatgaat aattgaagat tccttaagct gataactgac ccagtagcat 1560
cattgatcat ttaattgccc tggacttact tattttccac cacactacat atttctgtat 1620
agaatatata tagctcattg tattgcaaga tttaactaga agaaagagtt catgcttgct 1680
ttgtccatgt aggtttaaca ggaatgaatt gctaaactgt ggaaaatgtt ttaaacaaat 1740
gcatcttatc ctgtaggaaa caagctatat tgaagacaac tgcaatcaaa atggagccat 1800
ctccctgatc ttctccctga aggaggaggt gggagccctg gccaaggtgc tgagactgtt 1860
tgaggagaat gatgtgaacc tgacccacat tgagtccaga ccctccagac tgaagaagga 1920
tgagtatgag ttcttcaccc acctggacaa gagatccctg cctgccctga ccaacatcat 1980
caagatcctg agacatgaca ttggagccac agtgcatgag ctgtccagag acaagaagaa 2040
ggacacagtg ccctggttcc ccagaaccat ccaggagctg gacagatttg ccaaccagat 2100
cctgtcctat ggagctgagc tggatgctga ccaccctggc ttcaaggacc ctgtgtacag 2160
ggccagaaga aagcagtttg ctgacattgc ctacaactac agacatggcc agcccatccc 2220
cagagtggag tacatggagg aggagaagaa gacctggggc acagtgttca agaccctgaa 2280
gtccctgtac aagacccatg cctgctatga gtacaaccac atcttccccc tgctggagaa 2340
gtactgtggc ttccatgagg acaacatccc ccagctggag gatgtgtccc agttcctgca 2400
gacctgcaca ggcttcagac tgagacctgt ggctggcctg ctgtcctcca gagacttcct 2460
gggaggcctg gccttcagag tgttccactg cacccagtac atcagacatg gctccaagcc 2520
catgtacacc cctgagcctg acatctgcca tgagctgctg ggccatgtgc ccctgttctc 2580
tgacagatcc tttgcccagt tctcccagga gattggcctg gcctccctgg gagcccctga 2640
tgagtacatt gagaagctgg ccaccatcta ctggttcaca gtggagtttg gcctgtgcaa 2700
gcagggagac tccatcaagg cctatggagc tggcctgctg tcctcctttg gagagctgca 2760
gtactgcctg tctgagaagc ccaagctgct gcccctggag ctggagaaga cagccatcca 2820
gaactacaca gtgacagagt tccagcccct gtactatgtg gctgagtcct tcaatgatgc 2880
caaggagaag gtcagaaact ttgctgccac catccccaga cccttctctg tgagatatga 2940
cccctacacc cagagaattg aggtgctgga caacacccag cagctgaaga tcctggctga 3000
ctccatcaac tctgagattg gcatcctgtg ctctgccctg cagaagatca agtaaacctt 3060
aattaagagc atcttaccgc catttattcc catatttgtt ctgtttttct tgatttgggt 3120
atacatttaa atgttaataa aacaaaatgg tggggcaatc atttacattt ttagggatat 3180
gtaattacta gttcaggtgt attgccacaa gacaaacatg ttaagaaact ttcccgttat 3240
ttacgctctg ttcctgttaa tcaacctctg gattacaaaa tttgtgaaag attgactgat 3300
attcttaact atgttgctcc ttttacgctg tgtggatatg ctgctttata gcctctgtat 3360
ctagctattg cttcccgtac ggctttcgtt ttctcctcct tgtataaatc ctggttgctg 3420
tctcttttag aggagttgtg gcccgttgtc cgtcaacgtg gcgtggtgtg ctctgtgttt 3480
gctgacgcaa cccccactgg ctggggcatt gccaccacct gtcaactcct ttctgggact 3540
ttcgctttcc ccctcccgat cgccacggca gaactcatcg ccgcctgcct tgcccgctgc 3600
tggacagggg ctaggttgct gggcactgat aattccgtgg tgttgtctgt gccttctagt 3660
tgccagccat ctgttgtttg cccctccccc gtgccttcct tgaccctgga aggtgccact 3720
cccactgtcc tttcctaata aaatgaggaa attgcatcgc attgtctgag taggtgtcat 3780
tctattctgg ggggtggggt ggggcaggac agcaaggggg aggattggga agacaatagc 3840
aggcatgctg gggatgcggt gggctctatg gctctagagc atggctacgt agataagtag 3900
catggcgggt taatcattaa ctacacctgc aggaggaacc cctagtgatg gagttggcca 3960
ctccctctct gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc 4020
cgggcggcct cagtgagcga gcgagcgcgc agctgcctgc agg 4063
<210> 574
<211> 3470
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 574
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180
cgcagcaaca gatcattcta tgggttaatc attaacaaca ggttaggctt gtactttggt 240
acattggctc ctagttaatc attaacttag caatgtgctt gtactttggt acatagttac 300
ctagttaatc attaacaaac agtatggctt gtactttggt acaagcaaca gatcattcta 360
tgggcgagaa cttgtgcctc cccgtgttcc tgctctttgt ccctctgtcc tacttagact 420
aatatttgcc ttgggtactg caaacaggaa atgggggagg gacaggagta gggcggaggg 480
tagcaattgg attctgcagt gagagcagag ggccagctaa gtggtactct cccagagact 540
gtctgactca cgccaccccc tccaccttgg acacaggacg ctgtggtttc tgagccaggt 600
acaatgactc ctttcggtaa gtgcagtgga agctgtacac tgcccaggca aagcgtccgg 660
gcagcgtagg cgggcgactc agatcccagc cagtggactt agcccctgtt tgctcctccg 720
ataactgggg tgaccttggt taatattcac cagcagcctc ccccgttgcc cctctggatc 780
cactgcttaa atacggacga ggacagggcc ctgtctcctc agcttcaggc accaccactg 840
acctgggaca gtgaatgttt aaaccgcagc caccatgtcc acagctgtgc tggagaaccc 900
tggcttgggc aggaaactct ctgactttgg acaggtgagc cagggcagcc tgagctgctc 960
agttagggga atttgggcct ccagagaaag agatctgaag actgctggtg cttcctggtt 1020
tcataagctc agtaagaagt ctgaattcat tggaagctga tgatagaaga aagagttcat 1080
gcttgctttg tccatggagg tttaacagga atgaattgct aaactgtgga aaatgtttta 1140
aacaaatgca tcttatcctg taggaaacaa gctatattga agacaactgc aatcaaaatg 1200
gagccatctc cctgatcttc tccctgaagg aggaggtggg agccctggcc aaggtgctga 1260
gactgtttga ggagaatgat gtgaacctga cccacattga gtccagaccc tccagactga 1320
agaaggatga gtatgagttc ttcacccacc tggacaagag atccctgcct gccctgacca 1380
acatcatcaa gatcctgaga catgacattg gagccacagt gcatgagctg tccagagaca 1440
agaagaagga cacagtgccc tggttcccca gaaccatcca ggagctggac agatttgcca 1500
accagatcct gtcctatgga gctgagctgg atgctgacca ccctggcttc aaggaccctg 1560
tgtacagggc cagaagaaag cagtttgctg acattgccta caactacaga catggccagc 1620
ccatccccag agtggagtac atggaggagg agaagaagac ctggggcaca gtgttcaaga 1680
ccctgaagtc cctgtacaag acccatgcct gctatgagta caaccacatc ttccccctgc 1740
tggagaagta ctgtggcttc catgaggaca acatccccca gctggaggat gtgtcccagt 1800
tcctgcagac ctgcacaggc ttcagactga gacctgtggc tggcctgctg tcctccagag 1860
acttcctggg aggcctggcc ttcagagtgt tccactgcac ccagtacatc agacatggct 1920
ccaagcccat gtacacccct gagcctgaca tctgccatga gctgctgggc catgtgcccc 1980
tgttctctga cagatccttt gcccagttct cccaggagat tggcctggcc tccctgggag 2040
cccctgatga gtacattgag aagctggcca ccatctactg gttcacagtg gagtttggcc 2100
tgtgcaagca gggagactcc atcaaggcct atggagctgg cctgctgtcc tcctttggag 2160
agctgcagta ctgcctgtct gagaagccca agctgctgcc cctggagctg gagaagacag 2220
ccatccagaa ctacacagtg acagagttcc agcccctgta ctatgtggct gagtccttca 2280
atgatgccaa ggagaaggtc agaaactttg ctgccaccat ccccagaccc ttctctgtga 2340
gatatgaccc ctacacccag agaattgagg tgctggacaa cacccagcag ctgaagatcc 2400
tggctgactc catcaactct gagattggca tcctgtgctc tgccctgcag aagatcaagt 2460
aaaccttaat taagagcatc ttaccgccat ttattcccat atttgttctg tttttcttga 2520
tttgggtata catttaaatg ttaataaaac aaaatggtgg ggcaatcatt tacattttta 2580
gggatatgta attactagtt caggtgtatt gccacaagac aaacatgtta agaaactttc 2640
ccgttattta cgctctgttc ctgttaatca acctctggat tacaaaattt gtgaaagatt 2700
gactgatatt cttaactatg ttgctccttt tacgctgtgt ggatatgctg ctttatagcc 2760
tctgtatcta gctattgctt cccgtacggc tttcgttttc tcctccttgt ataaatcctg 2820
gttgctgtct cttttagagg agttgtggcc cgttgtccgt caacgtggcg tggtgtgctc 2880
tgtgtttgct gacgcaaccc ccactggctg gggcattgcc accacctgtc aactcctttc 2940
tgggactttc gctttccccc tcccgatcgc cacggcagaa ctcatcgccg cctgccttgc 3000
ccgctgctgg acaggggcta ggttgctggg cactgataat tccgtggtgt tgtctgtgcc 3060
ttctagttgc cagccatctg ttgtttgccc ctcccccgtg ccttccttga ccctggaagg 3120
tgccactccc actgtccttt cctaataaaa tgaggaaatt gcatcgcatt gtctgagtag 3180
gtgtcattct attctggggg gtggggtggg gcaggacagc aagggggagg attgggaaga 3240
caatagcagg catgctgggg atgcggtggg ctctatggct ctagagcatg gctacgtaga 3300
taagtagcat ggcgggttaa tcattaacta cacctgcagg aggaacccct agtgatggag 3360
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 3420
cgacgcccgg gcggcctcag tgagcgagcg agcgcgcagc tgcctgcagg 3470
<210> 575
<211> 3425
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 575
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180
cgcagcaaca gatcattcta tgggttaatc attaacaaca ggttaggtta atcattaact 240
tggctcctag ttaatcatta acaaacagta tggttaatca ttaacaaatt ctggggttaa 300
tcattaacta gttacctagc gagaacttgt gcctccccgt gttcctgctc tttgtccctc 360
tgtcctactt agactaatat ttgccttggg tactgcaaac aggaaatggg ggagggacag 420
gagtagggcg gagggtagca attggattct gcagtgagag cagagggcca gctaagtggt 480
actctcccag agactgtctg actcacgcca ccccctccac cttggacaca ggacgctgtg 540
gtttctgagc caggtacaat gactcctttc ggtaagtgca gtggaagctg tacactgccc 600
aggcaaagcg tccgggcagc gtaggcgggc gactcagatc ccagccagtg gacttagccc 660
ctgtttgctc ctccgataac tggggtgacc ttggttaata ttcaccagca gcctcccccg 720
ttgcccctct ggatccactg cttaaatacg gacgaggaca gggccctgtc tcctcagctt 780
caggcaccac cactgacctg ggacagtgaa tgtttaaacc gcagccacca tgtccacagc 840
tgtgctggag aaccctggct tgggcaggaa actctctgac tttggacagg tgagccaggg 900
cagcctgagc tgctcagtta ggggaatttg ggcctccaga gaaagagatc tgaagactgc 960
tggtgcttcc tggtttcata agctcagtaa gaagtctgaa ttcattggaa gctgatgata 1020
gaagaaagag ttcatgcttg ctttgtccat ggaggtttaa caggaatgaa ttgctaaact 1080
gtggaaaatg ttttaaacaa atgcatctta tcctgtagga aacaagctat attgaagaca 1140
actgcaatca aaatggagcc atctccctga tcttctccct gaaggaggag gtgggagccc 1200
tggccaaggt gctgagactg tttgaggaga atgatgtgaa cctgacccac attgagtcca 1260
gaccctccag actgaagaag gatgagtatg agttcttcac ccacctggac aagagatccc 1320
tgcctgccct gaccaacatc atcaagatcc tgagacatga cattggagcc acagtgcatg 1380
agctgtccag agacaagaag aaggacacag tgccctggtt ccccagaacc atccaggagc 1440
tggacagatt tgccaaccag atcctgtcct atggagctga gctggatgct gaccaccctg 1500
gcttcaagga ccctgtgtac agggccagaa gaaagcagtt tgctgacatt gcctacaact 1560
acagacatgg ccagcccatc cccagagtgg agtacatgga ggaggagaag aagacctggg 1620
gcacagtgtt caagaccctg aagtccctgt acaagaccca tgcctgctat gagtacaacc 1680
acatcttccc cctgctggag aagtactgtg gcttccatga ggacaacatc ccccagctgg 1740
aggatgtgtc ccagttcctg cagacctgca caggcttcag actgagacct gtggctggcc 1800
tgctgtcctc cagagacttc ctgggaggcc tggccttcag agtgttccac tgcacccagt 1860
acatcagaca tggctccaag cccatgtaca cccctgagcc tgacatctgc catgagctgc 1920
tgggccatgt gcccctgttc tctgacagat cctttgccca gttctcccag gagattggcc 1980
tggcctccct gggagcccct gatgagtaca ttgagaagct ggccaccatc tactggttca 2040
cagtggagtt tggcctgtgc aagcagggag actccatcaa ggcctatgga gctggcctgc 2100
tgtcctcctt tggagagctg cagtactgcc tgtctgagaa gcccaagctg ctgcccctgg 2160
agctggagaa gacagccatc cagaactaca cagtgacaga gttccagccc ctgtactatg 2220
tggctgagtc cttcaatgat gccaaggaga aggtcagaaa ctttgctgcc accatcccca 2280
gacccttctc tgtgagatat gacccctaca cccagagaat tgaggtgctg gacaacaccc 2340
agcagctgaa gatcctggct gactccatca actctgagat tggcatcctg tgctctgccc 2400
tgcagaagat caagtaaacc ttaattaaga gcatcttacc gccatttatt cccatatttg 2460
ttctgttttt cttgatttgg gtatacattt aaatgttaat aaaacaaaat ggtggggcaa 2520
tcatttacat ttttagggat atgtaattac tagttcaggt gtattgccac aagacaaaca 2580
tgttaagaaa ctttcccgtt atttacgctc tgttcctgtt aatcaacctc tggattacaa 2640
aatttgtgaa agattgactg atattcttaa ctatgttgct ccttttacgc tgtgtggata 2700
tgctgcttta tagcctctgt atctagctat tgcttcccgt acggctttcg ttttctcctc 2760
cttgtataaa tcctggttgc tgtctctttt agaggagttg tggcccgttg tccgtcaacg 2820
tggcgtggtg tgctctgtgt ttgctgacgc aacccccact ggctggggca ttgccaccac 2880
ctgtcaactc ctttctggga ctttcgcttt ccccctcccg atcgccacgg cagaactcat 2940
cgccgcctgc cttgcccgct gctggacagg ggctaggttg ctgggcactg ataattccgt 3000
ggtgttgtct gtgccttcta gttgccagcc atctgttgtt tgcccctccc ccgtgccttc 3060
cttgaccctg gaaggtgcca ctcccactgt cctttcctaa taaaatgagg aaattgcatc 3120
gcattgtctg agtaggtgtc attctattct ggggggtggg gtggggcagg acagcaaggg 3180
ggaggattgg gaagacaata gcaggcatgc tggggatgcg gtgggctcta tggctctaga 3240
gcatggctac gtagataagt agcatggcgg gttaatcatt aactacacct gcaggaggaa 3300
cccctagtga tggagttggc cactccctct ctgcgcgctc gctcgctcac tgaggccggg 3360
cgaccaaagg tcgcccgacg cccgggcggc ctcagtgagc gagcgagcgc gcagctgcct 3420
gcagg 3425
<210> 576
<211> 3117
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 576
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180
cgcgttaatc attaacgctt gtactttggt acagttaatc attaacgctt gtactttggt 240
acagttaatc attaacgctt gtactttggt acaatcgatg cgagaacttg tgcctccccg 300
tgttcctgct ctttgtccct ctgtcctact tagactaata tttgccttgg gtactgcaaa 360
caggaaatgg gggagggaca ggagtagggc ggagggtagt taagaatgtg gatccccgtc 420
tgtctgcaca tttcgtagag cgagtgttcc gatactctaa tctccctagg caaggttcat 480
atttgtgtag gttacttatt ctccttttgt tgactaagtc aataatcaga atcagcaggt 540
ttggagtcag cttggcaggg atcagcagcc tgggttggaa ggagggggta taaaagcccc 600
ttcaccagga gaagccgtca cacagatcca caagctcctg aagaggtaag ggtttaaggg 660
atggttggtt ggtggggtat taatgtttaa ttacctggag cacctgcctg aaatcacttt 720
ttttcaggtt gggtttaaac cgcagccacc atgtccacag ctgtgctgga gaaccctggc 780
ctgggcagaa agctgtctga ctttggccag gagacctcct acattgagga caactgcaac 840
cagaatggag ccatctccct gatcttctcc ctgaaggagg aggtgggagc cctggccaag 900
gtgctgagac tgtttgagga gaatgatgtg aacctgaccc acattgagtc cagaccctcc 960
agactgaaga aggatgagta tgagttcttc acccacctgg acaagagatc cctgcctgcc 1020
ctgaccaaca tcatcaagat cctgagacat gacattggag ccacagtgca tgagctgtcc 1080
agagacaaga agaaggacac agtgccctgg ttccccagaa ccatccagga gctggacaga 1140
tttgccaacc agatcctgtc ctatggagct gagctggatg ctgaccaccc tggcttcaag 1200
gaccctgtgt acagggccag aagaaagcag tttgctgaca ttgcctacaa ctacagacat 1260
ggccagccca tccccagagt ggagtacatg gaggaggaga agaagacctg gggcacagtg 1320
ttcaagaccc tgaagtccct gtacaagacc catgcctgct atgagtacaa ccacatcttc 1380
cccctgctgg agaagtactg tggcttccat gaggacaaca tcccccagct ggaggatgtg 1440
tcccagttcc tgcagacctg cacaggcttc agactgagac ctgtggctgg cctgctgtcc 1500
tccagagact tcctgggagg cctggccttc agagtgttcc actgcaccca gtacatcaga 1560
catggctcca agcccatgta cacccctgag cctgacatct gccatgagct gctgggccat 1620
gtgcccctgt tctctgacag atcctttgcc cagttctccc aggagattgg cctggcctcc 1680
ctgggagccc ctgatgagta cattgagaag ctggccacca tctactggtt cacagtggag 1740
tttggcctgt gcaagcaggg agactccatc aaggcctatg gagctggcct gctgtcctcc 1800
tttggagagc tgcagtactg cctgtctgag aagcccaagc tgctgcccct ggagctggag 1860
aagacagcca tccagaacta cacagtgaca gagttccagc ccctgtacta tgtggctgag 1920
tccttcaatg atgccaagga gaaggtcaga aactttgctg ccaccatccc cagacccttc 1980
tctgtgagat atgaccccta cacccagaga attgaggtgc tggacaacac ccagcagctg 2040
aagatcctgg ctgactccat caactctgag attggcatcc tgtgctctgc cctgcagaag 2100
atcaagtaaa ccttaattaa gagcatctta ccgccattta ttcccatatt tgttctgttt 2160
ttcttgattt gggtatacat ttaaatgtta ataaaacaaa atggtggggc aatcatttac 2220
atttttaggg atatgtaatt actagttcag gtgtattgcc acaagacaaa catgttaaga 2280
aactttcccg ttatttacgc tctgttcctg ttaatcaacc tctggattac aaaatttgtg 2340
aaagattgac tgatattctt aactatgttg ctccttttac gctgtgtgga tatgctgctt 2400
tatagcctct gtatctagct attgcttccc gtacggcttt cgttttctcc tccttgtata 2460
aatcctggtt gctgtctctt ttagaggagt tgtggcccgt tgtccgtcaa cgtggcgtgg 2520
tgtgctctgt gtttgctgac gcaaccccca ctggctgggg cattgccacc acctgtcaac 2580
tcctttctgg gactttcgct ttccccctcc cgatcgccac ggcagaactc atcgccgcct 2640
gccttgcccg ctgctggaca ggggctaggt tgctgggcac tgataattcc gtggtgttgt 2700
ctgtgccttc tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc 2760
tggaaggtgc cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc 2820
tgagtaggtg tcattctatt ctggggggtg gggtggggca ggacagcaag ggggaggatt 2880
gggaagacaa tagcaggcat gctggggatg cggtgggctc tatggctcta gagcatggct 2940
acgtagataa gtagcatggc gggttaatca ttaactacac ctgcaggagg aacccctagt 3000
gatggagttg gccactccct ctctgcgcgc tcgctcgctc actgaggccg ggcgaccaaa 3060
ggtcgcccga cgcccgggcg gcctcagtga gcgagcgagc gcgcagctgc ctgcagg 3117
<210> 577
<211> 2918
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 577
ctgaggccgc ccgggcaaag cccgggcgtc gggcgacctt tggtcgcccg gcctcagtga 60
gcgagcgagc gcgcagagag ggagtggcca actccatcac taggggttcc ttgtagttaa 120
tgattaaccc gccatgctac ttatcgcggc cgcgggggag gctgctggtg aatattaacc 180
aaggtcaccc cagttatcgg aggagcaaac aggggctaag tccacacgcg tggtaccgtc 240
tgtctgcaca tttcgtagag cgagtgttcc gatactctaa tctccctagg caaggttcat 300
atttgtgtag gttacttatt ctccttttgt tgactaagtc aataatcaga atcagcaggt 360
ttggagtcag cttggcaggg atcagcagcc tgggttggaa ggagggggta taaaagcccc 420
ttcaccagga gaagccgtca cacagatcca caagctcctg aagaggtaag ggtttaaggg 480
atggttggtt ggtggggtat taatgtttaa ttacctggag cacctgcctg aaatcacttt 540
ttttcaggtt ggtttaaacc gcagccacca tgagcaccgc cgtgctggaa aatcctggcc 600
tgggcagaaa gctgagcgac ttcggccaag agacaagcta catcgaggac aactgcaacc 660
agaacggcgc catcagcctg atcttcagcc tgaaagaaga agtgggcgcc ctggccaagg 720
tgctgagact gttcgaagag aacgacgtga acctgacaca catcgagagc agacccagca 780
gactgaagaa ggacgagtac gagttcttca cccacctgga caagcggagc ctgcctgctc 840
tgaccaacat catcaagatc ctgcggcacg acatcggcgc cacagtgcac gaactgagcc 900
gggacaagaa aaaggacacc gtgccatggt tccccagaac catccaagag ctggacagat 960
tcgccaacca gatcctgagc tatggcgccg agctggacgc tgatcaccct ggctttaagg 1020
accccgtgta ccgggccaga agaaagcagt ttgccgatat cgcctacaac taccggcacg 1080
gccagcctat tcctcgggtc gagtacatgg aagaggaaaa gaaaacctgg ggcaccgtgt 1140
tcaagaccct gaagtccctg tacaagaccc acgcctgcta cgagtacaac cacatcttcc 1200
cactgctcga aaagtactgc ggcttccacg aggacaatat ccctcagctt gaggacgtgt 1260
cccagttcct gcagacctgc accggcttta gactgaggcc agttgccgga ctgctgagca 1320
gcagagattt tctcggcggc ctggccttca gagtgttcca ctgtacccag tacatcagac 1380
acggcagcaa gcccatgtac acccctgagc ctgatatctg ccacgagctg ctgggacatg 1440
tgcccctgtt cagcgataga agcttcgccc agttcagcca agagatcgga ctggcttctc 1500
tgggagcccc tgacgagtac attgagaagc tggccaccat ctactggttc accgtggaat 1560
tcggcctgtg caagcagggc gacagcatca aagcttatgg cgctggcctg ctgtctagct 1620
tcggcgagct gcagtactgt ctgagcgaga agcctaagct gctgcccctg gaactggaaa 1680
agaccgccat ccagaactac accgtgaccg agttccagcc tctgtactac gtggccgaga 1740
gcttcaacga cgccaaagaa aaagtgcgga acttcgccgc caccattcct cggcctttca 1800
gcgtcagata cgacccctac acacagcgga tcgaggtgct ggacaacaca cagcagctga 1860
aaattctggc cgactccatc aacagcgaga tcggcatcct gtgcagcgcc ctgcagaaaa 1920
tcaagtgata gttaattaag agcatcttac cgccatttat tcccatattt gttctgtttt 1980
tcttgatttg ggtatacatt taaatgttaa taaaacaaaa tggtggggca atcatttaca 2040
tttttaggga tatgtaatta ctagttcagg tgtattgcca caagacaaac atgttaagaa 2100
actttcccgt tatttacgct ctgttcctgt taatcaacct ctggattaca aaatttgtga 2160
aagattgact gatattctta actatgttgc tccttttacg ctgtgtggat atgctgcttt 2220
atagcctctg tatctagcta ttgcttcccg tacggctttc gttttctcct ccttgtataa 2280
atcctggttg ctgtctcttt tagaggagtt gtggcccgtt gtccgtcaac gtggcgtggt 2340
gtgctctgtg tttgctgacg caacccccac tggctggggc attgccacca cctgtcaact 2400
cctttctggg actttcgctt tccccctccc gatcgccacg gcagaactca tcgccgcctg 2460
ccttgcccgc tgctggacag gggctaggtt gctgggcact gataattccg tggtgttgtc 2520
tgtgccttct agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct 2580
ggaaggtgcc actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct 2640
gagtaggtgt cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg 2700
ggaagacaat agcaggcatg ctggggatgc ggtgggctct atggctctag agcatggcta 2760
cgtagataag tagcatggcg ggttaatcat taactacacc tgcaggagga acccctagtg 2820
atggagttgg ccactccctc tctgcgcgct cgctcgctca actgaggccg cccgggcaaa 2880
gcccgggcgt cgggcgacct ttggtcgccc ggcctcag 2918
<210> 578
<211> 3174
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 578
ctgaggccgc ccgggcaaag cccgggcgtc gggcgacctt tggtcgcccg gcctcagtga 60
gcgagcgagc gcgcagagag ggagtggcca actccatcac taggggttcc ttgtagttaa 120
tgattaaccc gccatgctac ttatcgcggc cgcgggggag gctgctggta aacattaacc 180
aaggtcaccc cagttatcag aggagcaaac aggggcaaag tccaccgggg gaggctgctg 240
gtaaacatta accaaggtca ccccagttat cagaggagca aacaggggca aagtccaccg 300
ggggaggctg ctggtaaaca ttaaccaagg tcaccccagt tatcagagga gcaaacaggg 360
gcaaagtcca cggtacccac tgggaggatg ttgagtaaga tggaaaacta ctgatgaccc 420
ttgcagagac agagtattag gacatgtttg aacaggggcc gggcgatcag caggtagctc 480
tagaggatcc ccgtctgtct gcacatttcg tagagcgagt gttccgatac tctaatctcc 540
ctaggcaagg ttcatatttg tgtaggttac ttattctcct tttgttgact aagtcaataa 600
tcagaatcag caggtttgga gtcagcttgg cagggatcag cagcctgggt tggaaggagg 660
gggtataaaa gccccttcac caggagaagc cgtcacacag atccacaagc tcctgaagag 720
gtaagggttt aagggatggt tggttggtgg ggtattaatg tttaattacc tggagcacct 780
gcctgaaatc actttttttc aggttgggtt taaaccgcag ccaccatgag caccgccgtg 840
ctggaaaatc ctggcctggg cagaaagctg agcgacttcg gccaagagac aagctacatc 900
gaggacaact gcaaccagaa cggcgccatc agcctgatct tcagcctgaa agaagaagtg 960
ggcgccctgg ccaaggtgct gagactgttc gaagagaacg acgtgaacct gacacacatc 1020
gagagcagac ccagcagact gaagaaggac gagtacgagt tcttcaccca cctggacaag 1080
cggagcctgc ctgctctgac caacatcatc aagatcctgc ggcacgacat cggcgccaca 1140
gtgcacgaac tgagccggga caagaaaaag gacaccgtgc catggttccc cagaaccatc 1200
caagagctgg acagattcgc caaccagatc ctgagctatg gcgccgagct ggacgctgat 1260
caccctggct ttaaggaccc cgtgtaccgg gccagaagaa agcagtttgc cgatatcgcc 1320
tacaactacc ggcacggcca gcctattcct cgggtcgagt acatggaaga ggaaaagaaa 1380
acctggggca ccgtgttcaa gaccctgaag tccctgtaca agacccacgc ctgctacgag 1440
tacaaccaca tcttcccact gctcgaaaag tactgcggct tccacgagga caatatccct 1500
cagcttgagg acgtgtccca gttcctgcag acctgcaccg gctttagact gaggccagtt 1560
gccggactgc tgagcagcag agattttctc ggcggcctgg ccttcagagt gttccactgt 1620
acccagtaca tcagacacgg cagcaagccc atgtacaccc ctgagcctga tatctgccac 1680
gagctgctgg gacatgtgcc cctgttcagc gatagaagct tcgcccagtt cagccaagag 1740
atcggactgg cttctctggg agcccctgac gagtacattg agaagctggc caccatctac 1800
tggttcaccg tggaattcgg cctgtgcaag cagggcgaca gcatcaaagc ttatggcgct 1860
ggcctgctgt ctagcttcgg cgagctgcag tactgtctga gcgagaagcc taagctgctg 1920
cccctggaac tggaaaagac cgccatccag aactacaccg tgaccgagtt ccagcctctg 1980
tactacgtgg ccgagagctt caacgacgcc aaagaaaaag tgcggaactt cgccgccacc 2040
attcctcggc ctttcagcgt cagatacgac ccctacacac agcggatcga ggtgctggac 2100
aacacacagc agctgaaaat tctggccgac tccatcaaca gcgagatcgg catcctgtgc 2160
agcgccctgc agaaaatcaa gtgatagtta attaagagca tcttaccgcc atttattccc 2220
atatttgttc tgtttttctt gatttgggta tacatttaaa tgttaataaa acaaaatggt 2280
ggggcaatca tttacatttt tagggatatg taattactag ttcaggtgta ttgccacaag 2340
acaaacatgt taagaaactt tcccgttatt tacgctctgt tcctgttaat caacctctgg 2400
attacaaaat ttgtgaaaga ttgactgata ttcttaacta tgttgctcct tttacgctgt 2460
gtggatatgc tgctttatag cctctgtatc tagctattgc ttcccgtacg gctttcgttt 2520
tctcctcctt gtataaatcc tggttgctgt ctcttttaga ggagttgtgg cccgttgtcc 2580
gtcaacgtgg cgtggtgtgc tctgtgtttg ctgacgcaac ccccactggc tggggcattg 2640
ccaccacctg tcaactcctt tctgggactt tcgctttccc cctcccgatc gccacggcag 2700
aactcatcgc cgcctgcctt gcccgctgct ggacaggggc taggttgctg ggcactgata 2760
attccgtggt gttgtctgtg ccttctagtt gccagccatc tgttgtttgc ccctcccccg 2820
tgccttcctt gaccctggaa ggtgccactc ccactgtcct ttcctaataa aatgaggaaa 2880
ttgcatcgca ttgtctgagt aggtgtcatt ctattctggg gggtggggtg gggcaggaca 2940
gcaaggggga ggattgggaa gacaatagca ggcatgctgg ggatgcggtg ggctctatgg 3000
ctctagagca tggctacgta gataagtagc atggcgggtt aatcattaac tacacctgca 3060
ggaggaaccc ctagtgatgg agttggccac tccctctctg cgcgctcgct cgctcaactg 3120
aggccgcccg ggcaaagccc gggcgtcggg cgacctttgg tcgcccggcc tcag 3174
<210> 579
<211> 2918
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 579
ctgaggccgc ccgggcaaag cccgggcgtc gggcgacctt tggtcgcccg gcctcagtga 60
gcgagcgagc gcgcagagag ggagtggcca actccatcac taggggttcc ttgtagttaa 120
tgattaaccc gccatgctac ttatcgcggc cgcgggggag gctgctggta aacattaacc 180
aaggtcaccc cagttatcag aggagcaaac aggggcaaag tccacacgcg tggtaccgtc 240
tgtctgcaca tttcgtagag cgagtgttcc gatactctaa tctccctagg caaggttcat 300
atttgtgtag gttacttatt ctccttttgt tgactaagtc aataatcaga atcagcaggt 360
ttggagtcag cttggcaggg atcagcagcc tgggttggaa ggagggggta taaaagcccc 420
ttcaccagga gaagccgtca cacagatcca caagctcctg aagaggtaag ggtttaaggg 480
atggttggtt ggtggggtat taatgtttaa ttacctggag cacctgcctg aaatcacttt 540
ttttcaggtt ggtttaaacc gcagccacca tgagcaccgc cgtgctggaa aatcctggcc 600
tgggcagaaa gctgagcgac ttcggccaag agacaagcta catcgaggac aactgcaacc 660
agaacggcgc catcagcctg atcttcagcc tgaaagaaga agtgggcgcc ctggccaagg 720
tgctgagact gttcgaagag aacgacgtga acctgacaca catcgagagc agacccagca 780
gactgaagaa ggacgagtac gagttcttca cccacctgga caagcggagc ctgcctgctc 840
tgaccaacat catcaagatc ctgcggcacg acatcggcgc cacagtgcac gaactgagcc 900
gggacaagaa aaaggacacc gtgccatggt tccccagaac catccaagag ctggacagat 960
tcgccaacca gatcctgagc tatggcgccg agctggacgc tgatcaccct ggctttaagg 1020
accccgtgta ccgggccaga agaaagcagt ttgccgatat cgcctacaac taccggcacg 1080
gccagcctat tcctcgggtc gagtacatgg aagaggaaaa gaaaacctgg ggcaccgtgt 1140
tcaagaccct gaagtccctg tacaagaccc acgcctgcta cgagtacaac cacatcttcc 1200
cactgctcga aaagtactgc ggcttccacg aggacaatat ccctcagctt gaggacgtgt 1260
cccagttcct gcagacctgc accggcttta gactgaggcc agttgccgga ctgctgagca 1320
gcagagattt tctcggcggc ctggccttca gagtgttcca ctgtacccag tacatcagac 1380
acggcagcaa gcccatgtac acccctgagc ctgatatctg ccacgagctg ctgggacatg 1440
tgcccctgtt cagcgataga agcttcgccc agttcagcca agagatcgga ctggcttctc 1500
tgggagcccc tgacgagtac attgagaagc tggccaccat ctactggttc accgtggaat 1560
tcggcctgtg caagcagggc gacagcatca aagcttatgg cgctggcctg ctgtctagct 1620
tcggcgagct gcagtactgt ctgagcgaga agcctaagct gctgcccctg gaactggaaa 1680
agaccgccat ccagaactac accgtgaccg agttccagcc tctgtactac gtggccgaga 1740
gcttcaacga cgccaaagaa aaagtgcgga acttcgccgc caccattcct cggcctttca 1800
gcgtcagata cgacccctac acacagcgga tcgaggtgct ggacaacaca cagcagctga 1860
aaattctggc cgactccatc aacagcgaga tcggcatcct gtgcagcgcc ctgcagaaaa 1920
tcaagtgata gttaattaag agcatcttac cgccatttat tcccatattt gttctgtttt 1980
tcttgatttg ggtatacatt taaatgttaa taaaacaaaa tggtggggca atcatttaca 2040
tttttaggga tatgtaatta ctagttcagg tgtattgcca caagacaaac atgttaagaa 2100
actttcccgt tatttacgct ctgttcctgt taatcaacct ctggattaca aaatttgtga 2160
aagattgact gatattctta actatgttgc tccttttacg ctgtgtggat atgctgcttt 2220
atagcctctg tatctagcta ttgcttcccg tacggctttc gttttctcct ccttgtataa 2280
atcctggttg ctgtctcttt tagaggagtt gtggcccgtt gtccgtcaac gtggcgtggt 2340
gtgctctgtg tttgctgacg caacccccac tggctggggc attgccacca cctgtcaact 2400
cctttctggg actttcgctt tccccctccc gatcgccacg gcagaactca tcgccgcctg 2460
ccttgcccgc tgctggacag gggctaggtt gctgggcact gataattccg tggtgttgtc 2520
tgtgccttct agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct 2580
ggaaggtgcc actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct 2640
gagtaggtgt cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg 2700
ggaagacaat agcaggcatg ctggggatgc ggtgggctct atggctctag agcatggcta 2760
cgtagataag tagcatggcg ggttaatcat taactacacc tgcaggagga acccctagtg 2820
atggagttgg ccactccctc tctgcgcgct cgctcgctca actgaggccg cccgggcaaa 2880
gcccgggcgt cgggcgacct ttggtcgccc ggcctcag 2918
<210> 580
<211> 3069
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 580
ctgaggccgc ccgggcaaag cccgggcgtc gggcgacctt tggtcgcccg gcctcagtga 60
gcgagcgagc gcgcagagag ggagtggcca actccatcac taggggttcc ttgtagttaa 120
tgattaaccc gccatgctac ttatcgcggc cgcgttaatc attaacgctt gtactttggt 180
acagttaatc attaacgctt gtactttggt acagttaatc attaacgctt gtactttggt 240
acaatcgatg cgagaacttg tgcctccccg tgttcctgct ctttgtccct ctgtcctact 300
tagactaata tttgccttgg gtactgcaaa caggaaatgg gggagggaca ggagtagggc 360
ggagggtagt taagaatgtg gatccccgtc tgtctgcaca tttcgtagag cgagtgttcc 420
gatactctaa tctccctagg caaggttcat atttgtgtag gttacttatt ctccttttgt 480
tgactaagtc aataatcaga atcagcaggt ttggagtcag cttggcaggg atcagcagcc 540
tgggttggaa ggagggggta taaaagcccc ttcaccagga gaagccgtca cacagatcca 600
caagctcctg aagaggtaag ggtttaaggg atggttggtt ggtggggtat taatgtttaa 660
ttacctggag cacctgcctg aaatcacttt ttttcaggtt gggtttaaac cgcagccacc 720
atgagcaccg ccgtgctgga aaatcctggc ctgggcagaa agctgagcga cttcggccaa 780
gagacaagct acatcgagga caactgcaac cagaacggcg ccatcagcct gatcttcagc 840
ctgaaagaag aagtgggcgc cctggccaag gtgctgagac tgttcgaaga gaacgacgtg 900
aacctgacac acatcgagag cagacccagc agactgaaga aggacgagta cgagttcttc 960
acccacctgg acaagcggag cctgcctgct ctgaccaaca tcatcaagat cctgcggcac 1020
gacatcggcg ccacagtgca cgaactgagc cgggacaaga aaaaggacac cgtgccatgg 1080
ttccccagaa ccatccaaga gctggacaga ttcgccaacc agatcctgag ctatggcgcc 1140
gagctggacg ctgatcaccc tggctttaag gaccccgtgt accgggccag aagaaagcag 1200
tttgccgata tcgcctacaa ctaccggcac ggccagccta ttcctcgggt cgagtacatg 1260
gaagaggaaa agaaaacctg gggcaccgtg ttcaagaccc tgaagtccct gtacaagacc 1320
cacgcctgct acgagtacaa ccacatcttc ccactgctcg aaaagtactg cggcttccac 1380
gaggacaata tccctcagct tgaggacgtg tcccagttcc tgcagacctg caccggcttt 1440
agactgaggc cagttgccgg actgctgagc agcagagatt ttctcggcgg cctggccttc 1500
agagtgttcc actgtaccca gtacatcaga cacggcagca agcccatgta cacccctgag 1560
cctgatatct gccacgagct gctgggacat gtgcccctgt tcagcgatag aagcttcgcc 1620
cagttcagcc aagagatcgg actggcttct ctgggagccc ctgacgagta cattgagaag 1680
ctggccacca tctactggtt caccgtggaa ttcggcctgt gcaagcaggg cgacagcatc 1740
aaagcttatg gcgctggcct gctgtctagc ttcggcgagc tgcagtactg tctgagcgag 1800
aagcctaagc tgctgcccct ggaactggaa aagaccgcca tccagaacta caccgtgacc 1860
gagttccagc ctctgtacta cgtggccgag agcttcaacg acgccaaaga aaaagtgcgg 1920
aacttcgccg ccaccattcc tcggcctttc agcgtcagat acgaccccta cacacagcgg 1980
atcgaggtgc tggacaacac acagcagctg aaaattctgg ccgactccat caacagcgag 2040
atcggcatcc tgtgcagcgc cctgcagaaa atcaagtgat agttaattaa gagcatctta 2100
ccgccattta ttcccatatt tgttctgttt ttcttgattt gggtatacat ttaaatgtta 2160
ataaaacaaa atggtggggc aatcatttac atttttaggg atatgtaatt actagttcag 2220
gtgtattgcc acaagacaaa catgttaaga aactttcccg ttatttacgc tctgttcctg 2280
ttaatcaacc tctggattac aaaatttgtg aaagattgac tgatattctt aactatgttg 2340
ctccttttac gctgtgtgga tatgctgctt tatagcctct gtatctagct attgcttccc 2400
gtacggcttt cgttttctcc tccttgtata aatcctggtt gctgtctctt ttagaggagt 2460
tgtggcccgt tgtccgtcaa cgtggcgtgg tgtgctctgt gtttgctgac gcaaccccca 2520
ctggctgggg cattgccacc acctgtcaac tcctttctgg gactttcgct ttccccctcc 2580
cgatcgccac ggcagaactc atcgccgcct gccttgcccg ctgctggaca ggggctaggt 2640
tgctgggcac tgataattcc gtggtgttgt ctgtgccttc tagttgccag ccatctgttg 2700
tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc cactcccact gtcctttcct 2760
aataaaatga ggaaattgca tcgcattgtc tgagtaggtg tcattctatt ctggggggtg 2820
gggtggggca ggacagcaag ggggaggatt gggaagacaa tagcaggcat gctggggatg 2880
cggtgggctc tatggctcta gagcatggct acgtagataa gtagcatggc gggttaatca 2940
ttaactacac ctgcaggagg aacccctagt gatggagttg gccactccct ctctgcgcgc 3000
tcgctcgctc aactgaggcc gcccgggcaa agcccgggcg tcgggcgacc tttggtcgcc 3060
cggcctcag 3069
<210> 581
<211> 4060
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 581
ctgaggccgc ccgggcaaag cccgggcgtc gggcgacctt tggtcgcccg gcctcagtga 60
gcgagcgagc gcgcagagag ggagtggcca actccatcac taggggttcc ttgtagttaa 120
tgattaaccc gccatgctac ttatcgcggc cgcagcaaca gatcattcta tgggttaatc 180
attaacaaca ggttaggctt gtactttggt acattggctc ctagttaatc attaacttag 240
caatgtgctt gtactttggt acatagttac ctagttaatc attaacaaac agtatggctt 300
gtactttggt acaagcaaca gatcattcta tgggcgagaa cttgtgcctc cccgtgttcc 360
tgctctttgt ccctctgtcc tacttagact aatatttgcc ttgggtactg caaacaggaa 420
atgggggagg gacaggagta gggcggaggg tagcaattgg attctgcagt gagagcagag 480
ggccagctaa gtggtactct cccagagact gtctgactca cgccaccccc tccaccttgg 540
acacaggacg ctgtggtttc tgagccaggt acaatgactc ctttcggtaa gtgcagtgga 600
agctgtacac tgcccaggca aagcgtccgg gcagcgtagg cgggcgactc agatcccagc 660
cagtggactt agcccctgtt tgctcctccg ataactgggg tgaccttggt taatattcac 720
cagcagcctc ccccgttgcc cctctggatc cactgcttaa atacggacga ggacagggcc 780
ctgtctcctc agcttcaggc accaccactg acctgggaca gtgaatgttt aaaccgcagc 840
caccatgtcc acagctgtgc tggagaaccc tggcttgggc aggaaactct ctgactttgg 900
acaggtgagc cagggcagcc tgagctgctc agttagggga atttgggcct ccagagaaag 960
agatcccaag actgctggtg cttcctggtt tcataagctc agtaagaagt ctgaattggt 1020
tggaagctga tgagaatatc caggaagtca acagacaaat gtcctcaaca attgtttcta 1080
agtaggagaa catctgtcct gggtggcttt cacaggaatg aatgaccatt gctttagggg 1140
gttggggatc tggcctccag aactgccacc aattagctgt gtgtctttgg acaagttact 1200
gtccctctct gttgtctgtt tactcttctg tacactgaag gggttccaat ccaggtctta 1260
ggattcaaaa gcctgtgcat gttccatttt tagtactttc cacactgtat ttctcaatgt 1320
ctttctggga cattttataa atcatattat atcacctcta aggatctttc agtttgttat 1380
atatgtgtct attaagttag attgtgagct cctaaaagat aaagcattgt cttattcatc 1440
tttaaatttc tcagagccca aatagtgcct ggaacctagt agttgctcaa taaaaggtat 1500
tgaatttaca ggattgaatg gtgacatcaa tgaataattg aagattcctt aagctgataa 1560
ctgacccagt agcatcattg atcatttaat tgccctggac ttacttattt tccaccacac 1620
tacatatttc tgtatagaat atatatagct cattgtattg caagatttaa ctagaagaaa 1680
gagttcatgc ttgctttgtc catgtaggtt taacaggaat gaattgctaa actgtggaaa 1740
atgttttaaa caaatgcatc ttatcctgta ggaaacaagc tatattgaag acaactgcaa 1800
tcaaaatgga gccatctccc tgatcttctc cctgaaggag gaggtgggag ccctggccaa 1860
ggtgctgaga ctgtttgagg agaatgatgt gaacctgacc cacattgagt ccagaccctc 1920
cagactgaag aaggatgagt atgagttctt cacccacctg gacaagagat ccctgcctgc 1980
cctgaccaac atcatcaaga tcctgagaca tgacattgga gccacagtgc atgagctgtc 2040
cagagacaag aagaaggaca cagtgccctg gttccccaga accatccagg agctggacag 2100
atttgccaac cagatcctgt cctatggagc tgagctggat gctgaccacc ctggcttcaa 2160
ggaccctgtg tacagggcca gaagaaagca gtttgctgac attgcctaca actacagaca 2220
tggccagccc atccccagag tggagtacat ggaggaggag aagaagacct ggggcacagt 2280
gttcaagacc ctgaagtccc tgtacaagac ccatgcctgc tatgagtaca accacatctt 2340
ccccctgctg gagaagtact gtggcttcca tgaggacaac atcccccagc tggaggatgt 2400
gtcccagttc ctgcagacct gcacaggctt cagactgaga cctgtggctg gcctgctgtc 2460
ctccagagac ttcctgggag gcctggcctt cagagtgttc cactgcaccc agtacatcag 2520
acatggctcc aagcccatgt acacccctga gcctgacatc tgccatgagc tgctgggcca 2580
tgtgcccctg ttctctgaca gatcctttgc ccagttctcc caggagattg gcctggcctc 2640
cctgggagcc cctgatgagt acattgagaa gctggccacc atctactggt tcacagtgga 2700
gtttggcctg tgcaagcagg gagactccat caaggcctat ggagctggcc tgctgtcctc 2760
ctttggagag ctgcagtact gcctgtctga gaagcccaag ctgctgcccc tggagctgga 2820
gaagacagcc atccagaact acacagtgac agagttccag cccctgtact atgtggctga 2880
gtccttcaat gatgccaagg agaaggtcag aaactttgct gccaccatcc ccagaccctt 2940
ctctgtgaga tatgacccct acacccagag aattgaggtg ctggacaaca cccagcagct 3000
gaagatcctg gctgactcca tcaactctga gattggcatc ctgtgctctg ccctgcagaa 3060
gatcaagtaa accttaatta agagcatctt accgccattt attcccatat ttgttctgtt 3120
tttcttgatt tgggtataca tttaaatgtt aataaaacaa aatggtgggg caatcattta 3180
catttttagg gatatgtaat tactagttca ggtgtattgc cacaagacaa acatgttaag 3240
aaactttccc gttatttacg ctctgttcct gttaatcaac ctctggatta caaaatttgt 3300
gaaagattga ctgatattct taactatgtt gctcctttta cgctgtgtgg atatgctgct 3360
ttatagcctc tgtatctagc tattgcttcc cgtacggctt tcgttttctc ctccttgtat 3420
aaatcctggt tgctgtctct tttagaggag ttgtggcccg ttgtccgtca acgtggcgtg 3480
gtgtgctctg tgtttgctga cgcaaccccc actggctggg gcattgccac cacctgtcaa 3540
ctcctttctg ggactttcgc tttccccctc ccgatcgcca cggcagaact catcgccgcc 3600
tgccttgccc gctgctggac aggggctagg ttgctgggca ctgataattc cgtggtgttg 3660
tctgtgcctt ctagttgcca gccatctgtt gtttgcccct cccccgtgcc ttccttgacc 3720
ctggaaggtg ccactcccac tgtcctttcc taataaaatg aggaaattgc atcgcattgt 3780
ctgagtaggt gtcattctat tctggggggt ggggtggggc aggacagcaa gggggaggat 3840
tgggaagaca atagcaggca tgctggggat gcggtgggct ctatggctct agagcatggc 3900
tacgtagata agtagcatgg cgggttaatc attaactaca cctgcaggag gaacccctag 3960
tgatggagtt ggccactccc tctctgcgcg ctcgctcgct caactgaggc cgcccgggca 4020
aagcccgggc gtcgggcgac ctttggtcgc ccggcctcag 4060
<210> 582
<211> 4041
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 582
ctgaggccgc ccgggcaaag cccgggcgtc gggcgacctt tggtcgcccg gcctcagtga 60
gcgagcgagc gcgcagagag ggagtggcca actccatcac taggggttcc ttgtagttaa 120
tgattaaccc gccatgctac ttatcgcggc cgcgggggag gctgctggta aacattaacc 180
aaggtcaccc cagttatcag aggagcaaac aggggcaaag tccaccgggg gaggctgctg 240
gtaaacatta accaaggtca ccccagttat cagaggagca aacaggggca aagtccaccg 300
ggggaggctg ctggtaaaca ttaaccaagg tcaccccagt tatcagagga gcaaacaggg 360
gcaaagtcca cggtacccac tgggaggatg ttgagtaaga tggaaaacta ctgatgaccc 420
ttgcagagac agagtattag gacatgtttg aacaggggcc gggcgatcag caggtagctc 480
tagaggatcc ccgtctgtct gcacatttcg tagagcgagt gttccgatac tctaatctcc 540
ctaggcaagg ttcatatttg tgtaggttac ttattctcct tttgttgact aagtcaataa 600
tcagaatcag caggtttgga gtcagcttgg cagggatcag cagcctgggt tggaaggagg 660
gggtataaaa gccccttcac caggagaagc cgtcacacag atccacaagc tcctgaagag 720
gtaagggttt aagggatggt tggttggtgg ggtattaatg tttaattacc tggagcacct 780
gcctgaaatc actttttttc aggttgggtt taaaccgcag ccaccatgtc cacagctgtg 840
ctggagaacc ctggcttggg caggaaactc tctgactttg gacaggtgag ccagggcagc 900
ctgagctgct cagttagggg aatttgggcc tccagagaaa gagatcccaa gactgctggt 960
gcttcctggt ttcataagct cagtaagaag tctgaattgg ttggaagctg atgagaatat 1020
ccaggaagtc aacagacaaa tgtcctcaac aattgtttct aagtaggaga acatctgtcc 1080
tgggtggctt tcacaggaat gaatgaccat tgctttaggg ggttggggat ctggcctcca 1140
gaactgccac caattagctg tgtgtctttg gacaagttac tgtccctctc tgttgtctgt 1200
ttactcttct gtacactgaa ggggttccaa tccaggtctt aggattcaaa agcctgtgca 1260
tgttccattt ttagtacttt ccacactgta tttctcaatg tctttctggg acattttata 1320
aatcatatta tatcacctct aaggatcttt cagtttgtta tatatgtgtc tattaagtta 1380
gattgtgagc tcctaaaaga taaagcattg tcttattcat ctttaaattt ctcagagccc 1440
aaatagtgcc tggaacctag tagttgctca ataaaaggta ttgaatttac aggattgaat 1500
ggtgacatca atgaataatt gaagattcct taagctgata actgacccag tagcatcatt 1560
gatcatttaa ttgccctgga cttacttatt ttccaccaca ctacatattt ctgtatagaa 1620
tatatatagc tcattgtatt gcaagattta actagaagaa agagttcatg cttgctttgt 1680
ccatgtaggt ttaacaggaa tgaattgcta aactgtggaa aatgttttaa acaaatgcat 1740
cttatcctgt aggaaacaag ctatattgaa gacaactgca atcaaaatgg agccatctcc 1800
ctgatcttct ccctgaagga ggaggtggga gccctggcca aggtgctgag actgtttgag 1860
gagaatgatg tgaacctgac ccacattgag tccagaccct ccagactgaa gaaggatgag 1920
tatgagttct tcacccacct ggacaagaga tccctgcctg ccctgaccaa catcatcaag 1980
atcctgagac atgacattgg agccacagtg catgagctgt ccagagacaa gaagaaggac 2040
acagtgccct ggttccccag aaccatccag gagctggaca gatttgccaa ccagatcctg 2100
tcctatggag ctgagctgga tgctgaccac cctggcttca aggaccctgt gtacagggcc 2160
agaagaaagc agtttgctga cattgcctac aactacagac atggccagcc catccccaga 2220
gtggagtaca tggaggagga gaagaagacc tggggcacag tgttcaagac cctgaagtcc 2280
ctgtacaaga cccatgcctg ctatgagtac aaccacatct tccccctgct ggagaagtac 2340
tgtggcttcc atgaggacaa catcccccag ctggaggatg tgtcccagtt cctgcagacc 2400
tgcacaggct tcagactgag acctgtggct ggcctgctgt cctccagaga cttcctggga 2460
ggcctggcct tcagagtgtt ccactgcacc cagtacatca gacatggctc caagcccatg 2520
tacacccctg agcctgacat ctgccatgag ctgctgggcc atgtgcccct gttctctgac 2580
agatcctttg cccagttctc ccaggagatt ggcctggcct ccctgggagc ccctgatgag 2640
tacattgaga agctggccac catctactgg ttcacagtgg agtttggcct gtgcaagcag 2700
ggagactcca tcaaggccta tggagctggc ctgctgtcct cctttggaga gctgcagtac 2760
tgcctgtctg agaagcccaa gctgctgccc ctggagctgg agaagacagc catccagaac 2820
tacacagtga cagagttcca gcccctgtac tatgtggctg agtccttcaa tgatgccaag 2880
gagaaggtca gaaactttgc tgccaccatc cccagaccct tctctgtgag atatgacccc 2940
tacacccaga gaattgaggt gctggacaac acccagcagc tgaagatcct ggctgactcc 3000
atcaactctg agattggcat cctgtgctct gccctgcaga agatcaagta aaccttaatt 3060
aagagcatct taccgccatt tattcccata tttgttctgt ttttcttgat ttgggtatac 3120
atttaaatgt taataaaaca aaatggtggg gcaatcattt acatttttag ggatatgtaa 3180
ttactagttc aggtgtattg ccacaagaca aacatgttaa gaaactttcc cgttatttac 3240
gctctgttcc tgttaatcaa cctctggatt acaaaatttg tgaaagattg actgatattc 3300
ttaactatgt tgctcctttt acgctgtgtg gatatgctgc tttatagcct ctgtatctag 3360
ctattgcttc ccgtacggct ttcgttttct cctccttgta taaatcctgg ttgctgtctc 3420
ttttagagga gttgtggccc gttgtccgtc aacgtggcgt ggtgtgctct gtgtttgctg 3480
acgcaacccc cactggctgg ggcattgcca ccacctgtca actcctttct gggactttcg 3540
ctttccccct cccgatcgcc acggcagaac tcatcgccgc ctgccttgcc cgctgctgga 3600
caggggctag gttgctgggc actgataatt ccgtggtgtt gtctgtgcct tctagttgcc 3660
agccatctgt tgtttgcccc tcccccgtgc cttccttgac cctggaaggt gccactccca 3720
ctgtcctttc ctaataaaat gaggaaattg catcgcattg tctgagtagg tgtcattcta 3780
ttctgggggg tggggtgggg caggacagca agggggagga ttgggaagac aatagcaggc 3840
atgctgggga tgcggtgggc tctatggctc tagagcatgg ctacgtagat aagtagcatg 3900
gcgggttaat cattaactac acctgcagga ggaaccccta gtgatggagt tggccactcc 3960
ctctctgcgc gctcgctcgc tcaactgagg ccgcccgggc aaagcccggg cgtcgggcga 4020
cctttggtcg cccggcctca g 4041
<210> 583
<211> 3785
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 583
ctgaggccgc ccgggcaaag cccgggcgtc gggcgacctt tggtcgcccg gcctcagtga 60
gcgagcgagc gcgcagagag ggagtggcca actccatcac taggggttcc ttgtagttaa 120
tgattaaccc gccatgctac ttatcgcggc cgcgggggag gctgctggta aacattaacc 180
aaggtcaccc cagttatcag aggagcaaac aggggcaaag tccacacgcg tggtaccgtc 240
tgtctgcaca tttcgtagag cgagtgttcc gatactctaa tctccctagg caaggttcat 300
atttgtgtag gttacttatt ctccttttgt tgactaagtc aataatcaga atcagcaggt 360
ttggagtcag cttggcaggg atcagcagcc tgggttggaa ggagggggta taaaagcccc 420
ttcaccagga gaagccgtca cacagatcca caagctcctg aagaggtaag ggtttaaggg 480
atggttggtt ggtggggtat taatgtttaa ttacctggag cacctgcctg aaatcacttt 540
ttttcaggtt ggtttaaacc gcagccacca tgtccacagc tgtgctggag aaccctggct 600
tgggcaggaa actctctgac tttggacagg tgagccaggg cagcctgagc tgctcagtta 660
ggggaatttg ggcctccaga gaaagagatc ccaagactgc tggtgcttcc tggtttcata 720
agctcagtaa gaagtctgaa ttggttggaa gctgatgaga atatccagga agtcaacaga 780
caaatgtcct caacaattgt ttctaagtag gagaacatct gtcctgggtg gctttcacag 840
gaatgaatga ccattgcttt agggggttgg ggatctggcc tccagaactg ccaccaatta 900
gctgtgtgtc tttggacaag ttactgtccc tctctgttgt ctgtttactc ttctgtacac 960
tgaaggggtt ccaatccagg tcttaggatt caaaagcctg tgcatgttcc atttttagta 1020
ctttccacac tgtatttctc aatgtctttc tgggacattt tataaatcat attatatcac 1080
ctctaaggat ctttcagttt gttatatatg tgtctattaa gttagattgt gagctcctaa 1140
aagataaagc attgtcttat tcatctttaa atttctcaga gcccaaatag tgcctggaac 1200
ctagtagttg ctcaataaaa ggtattgaat ttacaggatt gaatggtgac atcaatgaat 1260
aattgaagat tccttaagct gataactgac ccagtagcat cattgatcat ttaattgccc 1320
tggacttact tattttccac cacactacat atttctgtat agaatatata tagctcattg 1380
tattgcaaga tttaactaga agaaagagtt catgcttgct ttgtccatgt aggtttaaca 1440
ggaatgaatt gctaaactgt ggaaaatgtt ttaaacaaat gcatcttatc ctgtaggaaa 1500
caagctatat tgaagacaac tgcaatcaaa atggagccat ctccctgatc ttctccctga 1560
aggaggaggt gggagccctg gccaaggtgc tgagactgtt tgaggagaat gatgtgaacc 1620
tgacccacat tgagtccaga ccctccagac tgaagaagga tgagtatgag ttcttcaccc 1680
acctggacaa gagatccctg cctgccctga ccaacatcat caagatcctg agacatgaca 1740
ttggagccac agtgcatgag ctgtccagag acaagaagaa ggacacagtg ccctggttcc 1800
ccagaaccat ccaggagctg gacagatttg ccaaccagat cctgtcctat ggagctgagc 1860
tggatgctga ccaccctggc ttcaaggacc ctgtgtacag ggccagaaga aagcagtttg 1920
ctgacattgc ctacaactac agacatggcc agcccatccc cagagtggag tacatggagg 1980
aggagaagaa gacctggggc acagtgttca agaccctgaa gtccctgtac aagacccatg 2040
cctgctatga gtacaaccac atcttccccc tgctggagaa gtactgtggc ttccatgagg 2100
acaacatccc ccagctggag gatgtgtccc agttcctgca gacctgcaca ggcttcagac 2160
tgagacctgt ggctggcctg ctgtcctcca gagacttcct gggaggcctg gccttcagag 2220
tgttccactg cacccagtac atcagacatg gctccaagcc catgtacacc cctgagcctg 2280
acatctgcca tgagctgctg ggccatgtgc ccctgttctc tgacagatcc tttgcccagt 2340
tctcccagga gattggcctg gcctccctgg gagcccctga tgagtacatt gagaagctgg 2400
ccaccatcta ctggttcaca gtggagtttg gcctgtgcaa gcagggagac tccatcaagg 2460
cctatggagc tggcctgctg tcctcctttg gagagctgca gtactgcctg tctgagaagc 2520
ccaagctgct gcccctggag ctggagaaga cagccatcca gaactacaca gtgacagagt 2580
tccagcccct gtactatgtg gctgagtcct tcaatgatgc caaggagaag gtcagaaact 2640
ttgctgccac catccccaga cccttctctg tgagatatga cccctacacc cagagaattg 2700
aggtgctgga caacacccag cagctgaaga tcctggctga ctccatcaac tctgagattg 2760
gcatcctgtg ctctgccctg cagaagatca agtaaacctt aattaagagc atcttaccgc 2820
catttattcc catatttgtt ctgtttttct tgatttgggt atacatttaa atgttaataa 2880
aacaaaatgg tggggcaatc atttacattt ttagggatat gtaattacta gttcaggtgt 2940
attgccacaa gacaaacatg ttaagaaact ttcccgttat ttacgctctg ttcctgttaa 3000
tcaacctctg gattacaaaa tttgtgaaag attgactgat attcttaact atgttgctcc 3060
ttttacgctg tgtggatatg ctgctttata gcctctgtat ctagctattg cttcccgtac 3120
ggctttcgtt ttctcctcct tgtataaatc ctggttgctg tctcttttag aggagttgtg 3180
gcccgttgtc cgtcaacgtg gcgtggtgtg ctctgtgttt gctgacgcaa cccccactgg 3240
ctggggcatt gccaccacct gtcaactcct ttctgggact ttcgctttcc ccctcccgat 3300
cgccacggca gaactcatcg ccgcctgcct tgcccgctgc tggacagggg ctaggttgct 3360
gggcactgat aattccgtgg tgttgtctgt gccttctagt tgccagccat ctgttgtttg 3420
cccctccccc gtgccttcct tgaccctgga aggtgccact cccactgtcc tttcctaata 3480
aaatgaggaa attgcatcgc attgtctgag taggtgtcat tctattctgg ggggtggggt 3540
ggggcaggac agcaaggggg aggattggga agacaatagc aggcatgctg gggatgcggt 3600
gggctctatg gctctagagc atggctacgt agataagtag catggcgggt taatcattaa 3660
ctacacctgc aggaggaacc cctagtgatg gagttggcca ctccctctct gcgcgctcgc 3720
tcgctcaact gaggccgccc gggcaaagcc cgggcgtcgg gcgacctttg gtcgcccggc 3780
ctcag 3785
<210> 584
<211> 4015
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 584
ctgaggccgc ccgggcaaag cccgggcgtc gggcgacctt tggtcgcccg gcctcagtga 60
gcgagcgagc gcgcagagag ggagtggcca actccatcac taggggttcc ttgtagttaa 120
tgattaaccc gccatgctac ttatcgcggc cgcagcaaca gatcattcta tgggttaatc 180
attaacaaca ggttaggtta atcattaact tggctcctag ttaatcatta acaaacagta 240
tggttaatca ttaacaaatt ctggggttaa tcattaacta gttacctagc gagaacttgt 300
gcctccccgt gttcctgctc tttgtccctc tgtcctactt agactaatat ttgccttggg 360
tactgcaaac aggaaatggg ggagggacag gagtagggcg gagggtagca attggattct 420
gcagtgagag cagagggcca gctaagtggt actctcccag agactgtctg actcacgcca 480
ccccctccac cttggacaca ggacgctgtg gtttctgagc caggtacaat gactcctttc 540
ggtaagtgca gtggaagctg tacactgccc aggcaaagcg tccgggcagc gtaggcgggc 600
gactcagatc ccagccagtg gacttagccc ctgtttgctc ctccgataac tggggtgacc 660
ttggttaata ttcaccagca gcctcccccg ttgcccctct ggatccactg cttaaatacg 720
gacgaggaca gggccctgtc tcctcagctt caggcaccac cactgacctg ggacagtgaa 780
tgtttaaacc gcagccacca tgtccacagc tgtgctggag aaccctggct tgggcaggaa 840
actctctgac tttggacagg tgagccaggg cagcctgagc tgctcagtta ggggaatttg 900
ggcctccaga gaaagagatc ccaagactgc tggtgcttcc tggtttcata agctcagtaa 960
gaagtctgaa ttggttggaa gctgatgaga atatccagga agtcaacaga caaatgtcct 1020
caacaattgt ttctaagtag gagaacatct gtcctgggtg gctttcacag gaatgaatga 1080
ccattgcttt agggggttgg ggatctggcc tccagaactg ccaccaatta gctgtgtgtc 1140
tttggacaag ttactgtccc tctctgttgt ctgtttactc ttctgtacac tgaaggggtt 1200
ccaatccagg tcttaggatt caaaagcctg tgcatgttcc atttttagta ctttccacac 1260
tgtatttctc aatgtctttc tgggacattt tataaatcat attatatcac ctctaaggat 1320
ctttcagttt gttatatatg tgtctattaa gttagattgt gagctcctaa aagataaagc 1380
attgtcttat tcatctttaa atttctcaga gcccaaatag tgcctggaac ctagtagttg 1440
ctcaataaaa ggtattgaat ttacaggatt gaatggtgac atcaatgaat aattgaagat 1500
tccttaagct gataactgac ccagtagcat cattgatcat ttaattgccc tggacttact 1560
tattttccac cacactacat atttctgtat agaatatata tagctcattg tattgcaaga 1620
tttaactaga agaaagagtt catgcttgct ttgtccatgt aggtttaaca ggaatgaatt 1680
gctaaactgt ggaaaatgtt ttaaacaaat gcatcttatc ctgtaggaaa caagctatat 1740
tgaagacaac tgcaatcaaa atggagccat ctccctgatc ttctccctga aggaggaggt 1800
gggagccctg gccaaggtgc tgagactgtt tgaggagaat gatgtgaacc tgacccacat 1860
tgagtccaga ccctccagac tgaagaagga tgagtatgag ttcttcaccc acctggacaa 1920
gagatccctg cctgccctga ccaacatcat caagatcctg agacatgaca ttggagccac 1980
agtgcatgag ctgtccagag acaagaagaa ggacacagtg ccctggttcc ccagaaccat 2040
ccaggagctg gacagatttg ccaaccagat cctgtcctat ggagctgagc tggatgctga 2100
ccaccctggc ttcaaggacc ctgtgtacag ggccagaaga aagcagtttg ctgacattgc 2160
ctacaactac agacatggcc agcccatccc cagagtggag tacatggagg aggagaagaa 2220
gacctggggc acagtgttca agaccctgaa gtccctgtac aagacccatg cctgctatga 2280
gtacaaccac atcttccccc tgctggagaa gtactgtggc ttccatgagg acaacatccc 2340
ccagctggag gatgtgtccc agttcctgca gacctgcaca ggcttcagac tgagacctgt 2400
ggctggcctg ctgtcctcca gagacttcct gggaggcctg gccttcagag tgttccactg 2460
cacccagtac atcagacatg gctccaagcc catgtacacc cctgagcctg acatctgcca 2520
tgagctgctg ggccatgtgc ccctgttctc tgacagatcc tttgcccagt tctcccagga 2580
gattggcctg gcctccctgg gagcccctga tgagtacatt gagaagctgg ccaccatcta 2640
ctggttcaca gtggagtttg gcctgtgcaa gcagggagac tccatcaagg cctatggagc 2700
tggcctgctg tcctcctttg gagagctgca gtactgcctg tctgagaagc ccaagctgct 2760
gcccctggag ctggagaaga cagccatcca gaactacaca gtgacagagt tccagcccct 2820
gtactatgtg gctgagtcct tcaatgatgc caaggagaag gtcagaaact ttgctgccac 2880
catccccaga cccttctctg tgagatatga cccctacacc cagagaattg aggtgctgga 2940
caacacccag cagctgaaga tcctggctga ctccatcaac tctgagattg gcatcctgtg 3000
ctctgccctg cagaagatca agtaaacctt aattaagagc atcttaccgc catttattcc 3060
catatttgtt ctgtttttct tgatttgggt atacatttaa atgttaataa aacaaaatgg 3120
tggggcaatc atttacattt ttagggatat gtaattacta gttcaggtgt attgccacaa 3180
gacaaacatg ttaagaaact ttcccgttat ttacgctctg ttcctgttaa tcaacctctg 3240
gattacaaaa tttgtgaaag attgactgat attcttaact atgttgctcc ttttacgctg 3300
tgtggatatg ctgctttata gcctctgtat ctagctattg cttcccgtac ggctttcgtt 3360
ttctcctcct tgtataaatc ctggttgctg tctcttttag aggagttgtg gcccgttgtc 3420
cgtcaacgtg gcgtggtgtg ctctgtgttt gctgacgcaa cccccactgg ctggggcatt 3480
gccaccacct gtcaactcct ttctgggact ttcgctttcc ccctcccgat cgccacggca 3540
gaactcatcg ccgcctgcct tgcccgctgc tggacagggg ctaggttgct gggcactgat 3600
aattccgtgg tgttgtctgt gccttctagt tgccagccat ctgttgtttg cccctccccc 3660
gtgccttcct tgaccctgga aggtgccact cccactgtcc tttcctaata aaatgaggaa 3720
attgcatcgc attgtctgag taggtgtcat tctattctgg ggggtggggt ggggcaggac 3780
agcaaggggg aggattggga agacaatagc aggcatgctg gggatgcggt gggctctatg 3840
gctctagagc atggctacgt agataagtag catggcgggt taatcattaa ctacacctgc 3900
aggaggaacc cctagtgatg gagttggcca ctccctctct gcgcgctcgc tcgctcaact 3960
gaggccgccc gggcaaagcc cgggcgtcgg gcgacctttg gtcgcccggc ctcag 4015
<210> 585
<211> 1362
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 585
atggccgctg tggtgctgga aaatggcgtg ctgagcagaa agctgagcga cttcggccaa 60
gagacaagct acatcgagga caacagcaac cagaacggcg ctgtgtccct gatcttcagc 120
ctgaaagaag aagtgggcgc cctggccaag gtgctgagac tgtttgagga aaacgagatc 180
aacctgacgc acatcgagag cagacccagc agactgaaca aggacgagta cgagttcttc 240
acctacctgg acaagagaag caagcccgtg ctgggcagca tcatcaagag cctgagaaac 300
gacatcggcg ccaccgtgca cgagctgagc agggacaaag aaaagaacac cgtgccatgg 360
ttccccagga ccatccaaga gctggacaga ttcgccaacc agatcctgtc ttacggcgcc 420
gagctggacg ctgatcaccc tggctttaag gaccccgtgt acagagccag aagaaagcag 480
ttcgccgata tcgcctacaa ctacagacac ggccagccta ttcctagagt cgagtacacc 540
gaggaagaga gaaagacctg gggcaccgtg ttcagaaccc tgaaggccct gtacaagacc 600
cacgcctgct acgagcacaa ccacatcttc ccactgctcg aaaagtactg cggcttccgc 660
gaggataaca tccctcagct tgaggacgtg tcccagttcc tgcagacctg cacaggcttc 720
agactgaggc cagttgctgg cctgctgtcc agcagagatt ttctcggcgg cctggccttc 780
agagtgttcc actgtaccca gtacatcagg cacggcagca agcccatgta cacccctgag 840
cctgacatct gccacgagct gctgggacat gtgcctctgt tcagcgacag aagcttcgcc 900
cagttcagcc aagagatcgg cctggctagt ctgggcgctc ctgatgagta catcgagaag 960
ctggccacca tctactggtt caccgtggaa ttcggcctgt gcaaagaggg cgacagcatc 1020
aaggcttatg gcgccggact gctgtctagc tttggcgagc tgcagtactg tctgagcgac 1080
aagcctaagc tgctgcccct ggaactggaa aagaccgcct gccaagagta cacagtgacc 1140
gagttccagc ctctgtacta cgtggccgag agcttcaacg acgccaaaga aaaagtgcgg 1200
accttcgccg ctacaatccc cagacctttc agcgtcagat acgaccccta cacacagcgc 1260
gtggaagtgc tggacaacac acagcagctg aagattctgg ccgactccat caacagcgaa 1320
gtgggcatcc tgtgtcacgc cctgcagaaa atcaagagct ga 1362
<210> 586
<211> 73
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 586
cgggggaggc tgctggtaaa cattaaccaa ggtcacccca gttatcagag gagcaaacag 60
gggcaaagtc cac 73
<210> 587
<211> 218
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 587
gggggaggct gctggtaaac attaaccaag gtcaccccag ttatcagagg agcaaacagg 60
ggcaaagtcc accgggggag gctgctggta aacattaacc aaggtcaccc cagttatcag 120
aggagcaaac aggggcaaag tccaccgggg gaggctgctg gtaaacatta accaaggtca 180
ccccagttat cagaggagca aacaggggca aagtccac 218
<210> 588
<211> 70
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 588
gggggaagct actggtgaat attaaccaag gtcacccagt tatcagggag caaacaggag 60
ctaagtccat 70
<210> 589
<211> 212
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 589
aggggaagct actggtgaat attaaccaag gtcacccagt tatcagggag caaacaggag 60
ctaagtccat agggggaagc tactggtgaa tattaaccaa ggtcacccag ttatcaggga 120
gcaaacagga gctaagtcca tagggggaag ctactggtga atattaacca aggtcaccca 180
gttatcaggg agcaaacagg agctaagtcc at 212
<210> 590
<211> 69
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 590
ggaggctgtt ggtgaatatt aaccaaggtc accccagtta tcggaggagc aaacaagggc 60
taagtccac 69
<210> 591
<211> 209
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 591
ggaggctgtt ggtgaatatt aaccaaggtc acctcagtta tcggaggagc aaacaagggc 60
taagtccacc ggaggctgtt ggtgaatatt aaccaaggtc acctcagtta tcggaggagc 120
aaacaagggc taagtccacc ggaggctgtt ggtgaatatt aaccaaggtc acctcagtta 180
tcggaggagc aaacaagggc taagtccac 209
<210> 592
<211> 211
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 592
aggaggctgt tggtgaatat taaccaaggt cacctcagtt atcagaggag caaacaaggg 60
ctaagtccac aggaggctgt tggtgaatat taaccaaggt cacctcagtt atcagaggag 120
caaacaaggg ctaagtccac aggaggctgt tggtgaatat taaccaaggt cacctcagtt 180
atcagaggag caaacaaggg ctaagtccac a 211
<210> 593
<211> 218
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 593
gggggaggct gctggtgaat attaaccaag gtcaccccag ttatcggagg agcaaacagg 60
ggctaagtcc acagggggag gctgctggtg aatattaacc aaggtcaccc cagttatcgg 120
aggagcaaac aggggctaag tccacagggg gaggctgctg gtgaatatta accaaggtca 180
ccccagttat cggaggagca aacaggggct aagtccac 218
<210> 594
<211> 354
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 594
aggggaagct actggtgaat attaaccaag gtcacccagt tatcagggag caaacaggag 60
ctaagtccat agggggaagc tactggtgaa tattaaccaa ggtcacccag ttatcaggga 120
gcaaacagga gctaagtcca tagggggaag ctactggtga atattaacca aggtcaccca 180
gttatcaggg agcaaacagg agctaagtcc atagggggaa gctactggtg aatattaacc 240
aaggtcaccc agttatcagg gagcaaacag gagctaagtc cataggggga agctactggt 300
gaatattaac caaggtcacc cagttatcag ggagcaaaca ggagctaagt ccat 354
<210> 595
<211> 349
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 595
ggaggctgtt ggtgaatatt aaccaaggtc acctcagtta tcggaggagc aaacaagggc 60
taagtccacc ggaggctgtt ggtgaatatt aaccaaggtc acctcagtta tcggaggagc 120
aaacaagggc taagtccacc ggaggctgtt ggtgaatatt aaccaaggtc acctcagtta 180
tcggaggagc aaacaagggc taagtccacc ggaggctgtt ggtgaatatt aaccaaggtc 240
acctcagtta tcggaggagc aaacaagggc taagtccacc ggaggctgtt ggtgaatatt 300
aaccaaggtc acctcagtta tcggaggagc aaacaagggc taagtccac 349
<210> 596
<211> 238
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 596
gggggaggct gctggtgaat attaaccaag gtcaccccag ttatcggagg agcaaacagg 60
ggctaagtcc accattctgc tttgggggag gctgctggtg aatattaacc aaggtcaccc 120
cagttatcgg aggagcaaac aggggctaag tccacttgat taagaagggg gaggctgctg 180
gtgaatatta accaaggtca ccccagttat cggaggagca aacaggggct aagtccac 238
<210> 597
<211> 276
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 597
gggggaggct gctggtgaat attaaccaag gtcaccccag ttatcggagg agcaaacagg 60
ggctaagtcc acatagaaga atttcttaca ttgtgtgaac ctgggggagg ctgctggtga 120
atattaacca aggtcacccc agttatcgga ggagcaaaca ggggctaagt ccacattgaa 180
gtgcaaagtc actaatatta agcaggggga ggctgctggt gaatattaac caaggtcacc 240
ccagttatcg gaggagcaaa caggggctaa gtccac 276
<210> 598
<211> 276
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 598
gggggaggct gctggtgaat attaaccaag gtcaccccag ttatcggagg agcaaacagg 60
ggctaagtcc acattaacta ttgggacttt ggttaacaac aagggggagg ctgctggtga 120
atattaacca aggtcacccc agttatcgga ggagcaaaca ggggctaagt ccaccagaga 180
cttattgttt acagctaact atctggggga ggctgctggt gaatattaac caaggtcacc 240
ccagttatcg gaggagcaaa caggggctaa gtccac 276
<210> 599
<211> 220
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 599
gggggaggct gctggtgaat attaaccaag gtcaccccag ttatcggagg agcaaacagg 60
ggctaagtcc acctggggga ggctgctggt gaatattaac caaggtcacc ccagttatcg 120
gaggagcaaa caggggctaa gtccaccagg gggaggctgc tggtgaatat taaccaaggt 180
caccccagtt atcggaggag caaacagggg ctaagtccac 220
<210> 600
<211> 220
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 600
gggggaggct gctggtgaat attaaccaag gtcaccccag ttatcggagg agcaaacagg 60
ggctaagtcc acctggggga ggctgctggt gaatattaac caaggtcacc ccagttatcg 120
gaggagcaaa caggggctaa gtccacttgg gggaggctgc tggtgaatat taaccaaggt 180
caccccagtt atcggaggag caaacagggg ctaagtccac 220
<210> 601
<211> 220
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 601
gggggaggct gctggtgaat attaaccaag gtcaccccag ttatcggagg agcaaacagg 60
ggctaagtcc acctggggga ggctgctggt gaatattaac caaggtcacc ccagttatcg 120
gaggagcaaa caggggctaa gtccacaagg gggaggctgc tggtgaatat taaccaaggt 180
caccccagtt atcggaggag caaacagggg ctaagtccac 220
<210> 602
<211> 556
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 602
aggggaagct actggtgaat attaaccaag gtcacccagt tatcagggag caaacaggag 60
ctaagtccat agggggaagc tactggtgaa tattaaccaa ggtcacccag ttatcaggga 120
gcaaacagga gctaagtcca tagggggaag ctactggtga atattaacca aggtcaccca 180
gttatcaggg agcaaacagg agctaagtcc atggtaccca ctgggaggat gttgagtaag 240
atggaaaact actgatgacc cttgcagaga cagagtatta ggacatgttt gaacaggggc 300
cgggcgatca gcaggtagct ctagaggatc cccgtctgtc tgcacatttc gtagagcgag 360
tgttccgata ctctaatctc cctaggcaag gttcatattt gtgtaggtta cttattctcc 420
ttttgttgac taagtcaata atcagaatca gcaggtttgg agtcagcttg gcagggatca 480
gcagcctggg ttggaaggag ggggtataaa agccccttca ccaggagaag ccgtcacaca 540
gatccacaag ctcctg 556
<210> 603
<211> 553
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 603
ggaggctgtt ggtgaatatt aaccaaggtc acctcagtta tcggaggagc aaacaagggc 60
taagtccacc ggaggctgtt ggtgaatatt aaccaaggtc acctcagtta tcggaggagc 120
aaacaagggc taagtccacc ggaggctgtt ggtgaatatt aaccaaggtc acctcagtta 180
tcggaggagc aaacaagggc taagtccacg gtacccactg ggaggatgtt gagtaagatg 240
gaaaactact gatgaccctt gcagagacag agtattagga catgtttgaa caggggccgg 300
gcgatcagca ggtagctcta gaggatcccc gtctgtctgc acatttcgta gagcgagtgt 360
tccgatactc taatctccct aggcaaggtt catatttgtg taggttactt attctccttt 420
tgttgactaa gtcaataatc agaatcagca ggtttggagt cagcttggca gggatcagca 480
gcctgggttg gaaggagggg gtataaaagc cccttcacca ggagaagccg tcacacagat 540
ccacaagctc ctg 553
<210> 604
<211> 1125
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 604
aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60
ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120
tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180
cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240
tccaacatcc acttgacccc ttggaatttc agtggagagg agcagaggtt gtcctggtgt 300
ggtttaggta gtgtgagagg gtccaggttc aaaaccactt gctgggtggg gagttgtcag 360
taagtggcta tgccccaacc ctgaagcctg tttccccatc tgtacaatgg aaatgataaa 420
gacccccatc tgatagggtt tttgtggcaa ataaacattt ggtttttttg ttttgttttg 480
ttttgttttt tgagatggag gtttgctctg tggcccaggc tggagtgcag tgacacaatc 540
tcatctcacc acaaccttcc cctgcctcag cctcccaagt agctgggatt acaagcatgt 600
gccaccacac ctggctaatt ttctattttt agtagagatg ggtttctcca tgttggtcag 660
cctcagcctc ccaagtaact gggattacag gcctgtgcca ccacacctgg ctaatttttt 720
ctatttttga cagggatggg gtttcaccat gttggtcagg ctggtctaga ggtactggat 780
cttgctacca gtggaacagc cactaaggat tctgcagtga gagcagaggg ccagctaagt 840
ggtactctcc cagagactgt ctgactcacg ccaccccctc caccttggac acaggacgct 900
gtggtttctg agccaggtac aatgactcct ttcggtaagt gcagtggaag ctgtacactg 960
cccaggcaaa gcgtccgggc agcgtaggcg ggcgactcag atcccagcca gtggacttag 1020
cccctgtttg ctcctccgat aactggggtg accttggtta atattcacca gcagcctccc 1080
ccgttgcccc tctggatcca ctgcttaaat acggacgagg acagg 1125
<210> 605
<211> 8
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 605
atcgatcg 8
<210> 606
<211> 8
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 606
cgatcgat 8
<210> 607
<211> 8
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 607
atcgatcg 8
<210> 608
<211> 8
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 608
atcgatcg 8
<210> 609
<400> 609
000
<210> 610
<400> 610
000
<210> 611
<400> 611
000
<210> 612
<400> 612
000
<210> 613
<400> 613
000
<210> 614
<400> 614
000
<210> 615
<400> 615
000
<210> 616
<400> 616
000
<210> 617
<400> 617
000
<210> 618
<400> 618
000
<210> 619
<400> 619
000
<210> 620
<400> 620
000
<210> 621
<400> 621
000
<210> 622
<400> 622
000
<210> 623
<400> 623
000
<210> 624
<400> 624
000
<210> 625
<400> 625
000
<210> 626
<400> 626
000
<210> 627
<400> 627
000
<210> 628
<400> 628
000
<210> 629
<400> 629
000
<210> 630
<400> 630
000
<210> 631
<400> 631
000
<210> 632
<400> 632
000
<210> 633
<400> 633
000
<210> 634
<400> 634
000
<210> 635
<400> 635
000
<210> 636
<400> 636
000
<210> 637
<400> 637
000
<210> 638
<400> 638
000
<210> 639
<400> 639
000
<210> 640
<400> 640
000
<210> 641
<400> 641
000
<210> 642
<400> 642
000
<210> 643
<400> 643
000
<210> 644
<400> 644
000
<210> 645
<400> 645
000
<210> 646
<400> 646
000
<210> 647
<400> 647
000
<210> 648
<400> 648
000
<210> 649
<400> 649
000
<210> 650
<400> 650
000
<210> 651
<400> 651
000
<210> 652
<400> 652
000
<210> 653
<400> 653
000
<210> 654
<400> 654
000
<210> 655
<400> 655
000
<210> 656
<400> 656
000
<210> 657
<400> 657
000
<210> 658
<400> 658
000
<210> 659
<400> 659
000
<210> 660
<400> 660
000
<210> 661
<400> 661
000
<210> 662
<400> 662
000
<210> 663
<400> 663
000
<210> 664
<400> 664
000
<210> 665
<400> 665
000
<210> 666
<400> 666
000
<210> 667
<400> 667
000
<210> 668
<400> 668
000
<210> 669
<400> 669
000
<210> 670
<400> 670
000
<210> 671
<400> 671
000
<210> 672
<400> 672
000
<210> 673
<400> 673
000
<210> 674
<400> 674
000
<210> 675
<400> 675
000
<210> 676
<400> 676
000
<210> 677
<400> 677
000
<210> 678
<400> 678
000
<210> 679
<400> 679
000
<210> 680
<400> 680
000
<210> 681
<400> 681
000
<210> 682
<400> 682
000
<210> 683
<400> 683
000
<210> 684
<400> 684
000
<210> 685
<400> 685
000
<210> 686
<400> 686
000
<210> 687
<400> 687
000
<210> 688
<400> 688
000
<210> 689
<400> 689
000
<210> 690
<400> 690
000
<210> 691
<400> 691
000
<210> 692
<400> 692
000
<210> 693
<400> 693
000
<210> 694
<400> 694
000
<210> 695
<400> 695
000
<210> 696
<400> 696
000
<210> 697
<400> 697
000
<210> 698
<400> 698
000
<210> 699
<400> 699
000
<210> 700
<400> 700
000
<210> 701
<400> 701
000
<210> 702
<400> 702
000
<210> 703
<400> 703
000
<210> 704
<400> 704
000
<210> 705
<400> 705
000
<210> 706
<400> 706
000
<210> 707
<400> 707
000
<210> 708
<400> 708
000
<210> 709
<400> 709
000
<210> 710
<400> 710
000
<210> 711
<400> 711
000
<210> 712
<400> 712
000
<210> 713
<400> 713
000
<210> 714
<400> 714
000
<210> 715
<400> 715
000
<210> 716
<400> 716
000
<210> 717
<400> 717
000
<210> 718
<400> 718
000
<210> 719
<400> 719
000
<210> 720
<400> 720
000
<210> 721
<400> 721
000
<210> 722
<400> 722
000
<210> 723
<400> 723
000
<210> 724
<400> 724
000
<210> 725
<400> 725
000
<210> 726
<400> 726
000
<210> 727
<400> 727
000
<210> 728
<400> 728
000
<210> 729
<400> 729
000
<210> 730
<400> 730
000
<210> 731
<400> 731
000
<210> 732
<400> 732
000
<210> 733
<400> 733
000
<210> 734
<400> 734
000
<210> 735
<400> 735
000
<210> 736
<400> 736
000
<210> 737
<400> 737
000
<210> 738
<400> 738
000
<210> 739
<400> 739
000
<210> 740
<400> 740
000
<210> 741
<400> 741
000
<210> 742
<400> 742
000
<210> 743
<400> 743
000
<210> 744
<400> 744
000
<210> 745
<400> 745
000
<210> 746
<400> 746
000
<210> 747
<400> 747
000
<210> 748
<400> 748
000
<210> 749
<400> 749
000
<210> 750
<400> 750
000
<210> 751
<400> 751
000
<210> 752
<400> 752
000
<210> 753
<400> 753
000
<210> 754
<400> 754
000
<210> 755
<400> 755
000
<210> 756
<400> 756
000
<210> 757
<400> 757
000
<210> 758
<400> 758
000
<210> 759
<400> 759
000
<210> 760
<400> 760
000
<210> 761
<400> 761
000
<210> 762
<400> 762
000
<210> 763
<400> 763
000
<210> 764
<400> 764
000
<210> 765
<400> 765
000
<210> 766
<400> 766
000
<210> 767
<400> 767
000
<210> 768
<400> 768
000
<210> 769
<400> 769
000
<210> 770
<400> 770
000
<210> 771
<400> 771
000
<210> 772
<400> 772
000
<210> 773
<400> 773
000
<210> 774
<400> 774
000
<210> 775
<400> 775
000
<210> 776
<400> 776
000
<210> 777
<400> 777
000
<210> 778
<400> 778
000
<210> 779
<400> 779
000
<210> 780
<400> 780
000
<210> 781
<400> 781
000
<210> 782
<400> 782
000
<210> 783
<400> 783
000
<210> 784
<400> 784
000
<210> 785
<400> 785
000
<210> 786
<400> 786
000
<210> 787
<400> 787
000
<210> 788
<400> 788
000
<210> 789
<400> 789
000
<210> 790
<400> 790
000
<210> 791
<400> 791
000
<210> 792
<400> 792
000
<210> 793
<400> 793
000
<210> 794
<400> 794
000
<210> 795
<400> 795
000
<210> 796
<400> 796
000
<210> 797
<400> 797
000
<210> 798
<400> 798
000
<210> 799
<400> 799
000
<210> 800
<400> 800
000
<210> 801
<400> 801
000
<210> 802
<400> 802
000
<210> 803
<400> 803
000
<210> 804
<400> 804
000
<210> 805
<400> 805
000
<210> 806
<400> 806
000
<210> 807
<400> 807
000
<210> 808
<400> 808
000
<210> 809
<400> 809
000
<210> 810
<400> 810
000
<210> 811
<400> 811
000
<210> 812
<400> 812
000
<210> 813
<400> 813
000
<210> 814
<400> 814
000
<210> 815
<400> 815
000
<210> 816
<400> 816
000
<210> 817
<400> 817
000
<210> 818
<400> 818
000
<210> 819
<400> 819
000
<210> 820
<400> 820
000
<210> 821
<400> 821
000
<210> 822
<400> 822
000
<210> 823
<400> 823
000
<210> 824
<400> 824
000
<210> 825
<400> 825
000
<210> 826
<400> 826
000
<210> 827
<400> 827
000
<210> 828
<400> 828
000
<210> 829
<400> 829
000
<210> 830
<400> 830
000
<210> 831
<400> 831
000
<210> 832
<400> 832
000
<210> 833
<400> 833
000
<210> 834
<400> 834
000
<210> 835
<400> 835
000
<210> 836
<400> 836
000
<210> 837
<400> 837
000
<210> 838
<400> 838
000
<210> 839
<400> 839
000
<210> 840
<400> 840
000
<210> 841
<400> 841
000
<210> 842
<400> 842
000
<210> 843
<400> 843
000
<210> 844
<400> 844
000
<210> 845
<400> 845
000
<210> 846
<400> 846
000
<210> 847
<400> 847
000
<210> 848
<400> 848
000
<210> 849
<400> 849
000
<210> 850
<400> 850
000
<210> 851
<400> 851
000
<210> 852
<400> 852
000
<210> 853
<400> 853
000
<210> 854
<400> 854
000
<210> 855
<400> 855
000
<210> 856
<400> 856
000
<210> 857
<400> 857
000
<210> 858
<400> 858
000
<210> 859
<400> 859
000
<210> 860
<400> 860
000
<210> 861
<400> 861
000
<210> 862
<400> 862
000
<210> 863
<400> 863
000
<210> 864
<400> 864
000
<210> 865
<400> 865
000
<210> 866
<400> 866
000
<210> 867
<400> 867
000
<210> 868
<400> 868
000
<210> 869
<400> 869
000
<210> 870
<400> 870
000
<210> 871
<400> 871
000
<210> 872
<400> 872
000
<210> 873
<400> 873
000
<210> 874
<400> 874
000
<210> 875
<400> 875
000
<210> 876
<400> 876
000
<210> 877
<400> 877
000
<210> 878
<400> 878
000
<210> 879
<400> 879
000
<210> 880
<400> 880
000
<210> 881
<400> 881
000
<210> 882
<400> 882
000
<210> 883
<400> 883
000
<210> 884
<400> 884
000
<210> 885
<400> 885
000
<210> 886
<400> 886
000
<210> 887
<400> 887
000
<210> 888
<400> 888
000
<210> 889
<400> 889
000
<210> 890
<400> 890
000
<210> 891
<400> 891
000
<210> 892
<400> 892
000
<210> 893
<400> 893
000
<210> 894
<400> 894
000
<210> 895
<400> 895
000
<210> 896
<400> 896
000
<210> 897
<400> 897
000
<210> 898
<400> 898
000
<210> 899
<400> 899
000
<210> 900
<400> 900
000
<210> 901
<400> 901
000
<210> 902
<400> 902
000
<210> 903
<400> 903
000
<210> 904
<400> 904
000
<210> 905
<400> 905
000
<210> 906
<400> 906
000
<210> 907
<400> 907
000
<210> 908
<400> 908
000
<210> 909
<400> 909
000
<210> 910
<400> 910
000
<210> 911
<400> 911
000
<210> 912
<400> 912
000
<210> 913
<400> 913
000
<210> 914
<400> 914
000
<210> 915
<400> 915
000
<210> 916
<400> 916
000
<210> 917
<400> 917
000
<210> 918
<400> 918
000
<210> 919
<400> 919
000
<210> 920
<400> 920
000
<210> 921
<400> 921
000
<210> 922
<400> 922
000
<210> 923
<400> 923
000
<210> 924
<400> 924
000
<210> 925
<400> 925
000
<210> 926
<400> 926
000
<210> 927
<400> 927
000
<210> 928
<400> 928
000
<210> 929
<400> 929
000
<210> 930
<400> 930
000
<210> 931
<400> 931
000
<210> 932
<400> 932
000
<210> 933
<400> 933
000
<210> 934
<400> 934
000
<210> 935
<400> 935
000
<210> 936
<400> 936
000
<210> 937
<400> 937
000
<210> 938
<400> 938
000
<210> 939
<400> 939
000
<210> 940
<400> 940
000
<210> 941
<400> 941
000
<210> 942
<400> 942
000
<210> 943
<400> 943
000
<210> 944
<400> 944
000
<210> 945
<400> 945
000
<210> 946
<400> 946
000
<210> 947
<400> 947
000
<210> 948
<400> 948
000
<210> 949
<400> 949
000
<210> 950
<400> 950
000
<210> 951
<400> 951
000
<210> 952
<400> 952
000
<210> 953
<400> 953
000
<210> 954
<400> 954
000
<210> 955
<400> 955
000
<210> 956
<400> 956
000
<210> 957
<400> 957
000
<210> 958
<400> 958
000
<210> 959
<400> 959
000
<210> 960
<400> 960
000
<210> 961
<400> 961
000
<210> 962
<400> 962
000
<210> 963
<400> 963
000
<210> 964
<400> 964
000
<210> 965
<400> 965
000
<210> 966
<400> 966
000
<210> 967
<400> 967
000
<210> 968
<400> 968
000
<210> 969
<400> 969
000
<210> 970
<400> 970
000
<210> 971
<400> 971
000
<210> 972
<400> 972
000
<210> 973
<400> 973
000
<210> 974
<400> 974
000
<210> 975
<400> 975
000
<210> 976
<400> 976
000
<210> 977
<400> 977
000
<210> 978
<400> 978
000
<210> 979
<400> 979
000
<210> 980
<400> 980
000
<210> 981
<400> 981
000
<210> 982
<400> 982
000
<210> 983
<400> 983
000
<210> 984
<400> 984
000
<210> 985
<400> 985
000
<210> 986
<400> 986
000
<210> 987
<400> 987
000
<210> 988
<400> 988
000
<210> 989
<400> 989
000
<210> 990
<400> 990
000
<210> 991
<400> 991
000
<210> 992
<400> 992
000
<210> 993
<400> 993
000
<210> 994
<400> 994
000
<210> 995
<400> 995
000
<210> 996
<400> 996
000
<210> 997
<400> 997
000
<210> 998
<400> 998
000
<210> 999
<400> 999
000
<210> 1000
<211> 92
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 1000
aagaggtaag ggtttaaggg atggttggtt ggtggggtat taatgtttaa ttacctggag 60
cacctgcctg aaatcacttt ttttcaggtt gg 92
<210> 1001
<211> 1125
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 1001
aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60
ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120
tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180
cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240
tccaacatcc actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt 300
ggtttaggta gtgtgagagg gtccgggttc aaaaccactt gctgggtggg gagtcgtcag 360
taagtggcta tgccccgacc ccgaagcctg tttccccatc tgtacaatgg aaatgataaa 420
gacgcccatc tgatagggtt tttgtggcaa ataaacattt ggtttttttg ttttgttttg 480
ttttgttttt tgagatggag gtttgctctg tggcccaggc tggagtgcag tgacacaatc 540
tcatctcacc acaaccttcc cctgcctcag cctcccaagt agctgggatt acaagcatgt 600
gccaccacac ctggctaatt ttctattttt agtagagatg ggtttctcca tgttggtcag 660
cctcagcctc ccaagtaact gggattacag gcctgtgcca ccacacctgg ctaatttttt 720
ctatttttga cagggatggg gtttcaccat gttggtcagg ctggtctaga ggtactggat 780
cttgctacca gtggaacagc cactaaggat tctgcagtga gagcagaggg ccagctaagt 840
ggtactctcc cagagactgt ctgactcacg ccaccccctc caccttggac acaggacgct 900
gtggtttctg agccaggtac aatgactcct ttcggtaagt gcagtggaag ctgtacactg 960
cccaggcaaa gcgtccgggc agcgtaggcg ggcgactcag atcccagcca gtggacttag 1020
cccctgtttg ctcctccgat aactggggtg accttggtta atattcacca gcagcctccc 1080
ccgttgcccc tctggatcca ctgcttaaat acggacgagg acagg 1125
<210> 1002
<211> 1125
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 1002
aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60
ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120
tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180
cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240
tccaacatcc actcgacccc ttggaatttc agtggagagg agcagaggtt gtcctggtgt 300
ggtttaggta gtgtgagagg gtccaggttc aaaaccactt gctgggtggg gagttgtcag 360
taagtggcta tgccccgacc ccgaagcctg tttccccatc tgtacaatgg aaatgataaa 420
gacgcccatc tgatagggtt tttgtggcaa ataaacattt ggtttttttg ttttgttttg 480
ttttgttttt tgagatggag gtttgctctg tcgcccaggc tggagtgcag tgacacaatc 540
tcatctcacc acaaccttcc cctgcctcag cctcccaagt agctgggatt acaagcatgt 600
gccaccacac ctggctaatt ttctattttt agtagagacg ggtttctcca tgttggtcag 660
cctcagcctc ccaagtaact gggattacag gcctgtgcca ccacacccgg ctaatttttt 720
ctatttttga cagggacggg gtttcaccat gttggtcagg ctggtctaga ggtactggat 780
cttgctacca gtggaacagc cactaaggat tctgcagtga gagcagaggg ccagctaagt 840
ggtactctcc cagagactgt ctgactcacg ccaccccctc caccttggac acaggacgct 900
gtggtttctg agccaggtac aatgactcct ttcggtaagt gcagtggaag ctgtacactg 960
cccaggcaaa gcgtccgggc agcgtaggcg ggcgactcag atcccagcca gtggacttag 1020
cccctgtttg ctcctccgat aactggggtg accttggtta atattcacca gcagcctccc 1080
ccgttgcccc tctggatcca ctgcttaaat acggacgagg acagg 1125
<210> 1003
<211> 1125
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 1003
aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60
ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120
tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180
cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240
tccaacatcc acttgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt 300
ggtttaggta gtgtgagagg gtccgggttc aaaaccactt gctgggtggg gagtcgtcag 360
taagtggcta tgccccaacc ctgaagcctg tttccccatc tgtacaatgg aaatgataaa 420
gacccccatc tgatagggtt tttgtggcaa ataaacattt ggtttttttg ttttgttttg 480
ttttgttttt tgagatggag gtttgctctg tcgcccaggc tggagtgcag tgacacaatc 540
tcatctcacc acaaccttcc cctgcctcag cctcccaagt agctgggatt acaagcatgt 600
gccaccacac ctggctaatt ttctattttt agtagagacg ggtttctcca tgttggtcag 660
cctcagcctc ccaagtaact gggattacag gcctgtgcca ccacacccgg ctaatttttt 720
ctatttttga cagggacggg gtttcaccat gttggtcagg ctggtctaga ggtactggat 780
cttgctacca gtggaacagc cactaaggat tctgcagtga gagcagaggg ccagctaagt 840
ggtactctcc cagagactgt ctgactcacg ccaccccctc caccttggac acaggacgct 900
gtggtttctg agccaggtac aatgactcct ttcggtaagt gcagtggaag ctgtacactg 960
cccaggcaaa gcgtccgggc agcgtaggcg ggcgactcag atcccagcca gtggacttag 1020
cccctgtttg ctcctccgat aactggggtg accttggtta atattcacca gcagcctccc 1080
ccgttgcccc tctggatcca ctgcttaaat acggacgagg acagg 1125
<210> 1004
<211> 1125
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 1004
aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60
ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120
tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180
cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240
tccaacatcc actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt 300
ggtttaggta gtgtgagagg gtccgggttc aaaaccactt gctgggtggg gagtcgtcag 360
taagtggcta tgccccgacc ccgaagcctg tttccccatc tgtacaatgg aaatgataaa 420
gacgcccatc tgatagggtt tttgtggcaa ataaacattt ggtttttttg ttttgttttg 480
ttttgttttt tgagatggag gtttgctctg tcgcccaggc tggagtgcag tgacacaatc 540
tcatctcacc acaaccttcc cctgcctcag cctcccaagt agctgggatt acaagcatgt 600
gccaccacac ctggctaatt ttctattttt agtagagacg ggtttctcca tgttggtcag 660
cctcagcctc ccaagtaact gggattacag gcctgtgcca ccacacccgg ctaatttttt 720
ctatttttga cagggacggg gtttcaccat gttggtcagg ctggtctaga ggtactggat 780
cttgctacca gtggaacagc cactaaggat tctgcagtga gagcagaggg ccagctaagt 840
ggtactctcc cagagactgt ctgactcatg ccaccccctc caccttggac acaggacact 900
gtggtttctg agccaggtac aatgactcct tttggtaagt gcagtggaag ctgtacactg 960
cccaggcaaa gtgtctgggc agcataggca ggtgactcag atcccagcca gtggacttag 1020
cccctgtttg ctcctctgat aactggggtg accttggtta atattcacca gcagcctccc 1080
ctgttgcccc tctggatcca ctgcttaaat acagacaagg acagg 1125
<210> 1005
<211> 1125
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 1005
aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60
ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120
tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180
cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240
tccaacatcc actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt 300
ggtttaggta gtgtgagagg gtccgggttc aaaaccactt gctgggtggg gagtcgtcag 360
taagtggcta tgccccgacc ccgaagcctg tttccccatc tgtacaatgg aaatgataaa 420
gacgcccatc tgatagggtt tttgtggcaa ataaacattt ggtttttttg ttttgttttg 480
ttttgttttt tgagatggag gtttgctctg tcgcccaggc tggagtgcag tgacacaatc 540
tcatctcacc acaaccttcc cctgcctcag cctcccaagt agctgggatt acaagcatgt 600
gccaccacac ctggctaatt ttctattttt agtagagacg ggtttctcca tgttggtcag 660
cctcagcctc ccaagtaact gggattacag gcctgtgcca ccacacccgg ctaatttttt 720
ctatttttga cagggacggg gtttcaccat gttggtcagg ctggtctaga ggtactggat 780
cttgctacca gtggaacagc cactaaggat tctgcagtga gagcagaggg ccagctaagt 840
ggtactctcc cagagactgt ctgactcatg ccaccccctc caccttggac acaggacact 900
gtggtttctg agccaggtac aatgactcct tttggtaagt gcagtggaag ctgtacactg 960
cccaggcaaa gtgtccgggc agcgtaggcg ggcgactcag atcccagcca gtggacttag 1020
cccctgtttg ctcctccgat aactggggtg accttggtta atattcacca gcagcctccc 1080
ccgttgcccc tctggatcca ctgcttaaat acggacgagg acagg 1125
<210> 1006
<211> 1125
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 1006
aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60
ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120
tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180
cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240
tccaacatcc actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt 300
ggtttaggta gtgtgagagg gtccgggttc aaaaccactt gctgggtggg gagtcgtcag 360
taagtggcta tgccccgacc ccgaagcctg tttccccatc tgtacaatgg aaatgataaa 420
gacgcccatc tgatagggtt tttgtggcaa ataaacattt ggtttttttg ttttgttttg 480
ttttgttttt tgagatggag gtttgctctg tcgcccaggc tggagtgcag tgacacaatc 540
tcatctcacc acaaccttcc cctgcctcag cctcccaagt agctgggatt acaagcatgt 600
gccaccacac ctggctaatt ttctattttt agtagagacg ggtttctcca tgttggtcag 660
cctcagcctc ccaagtaact gggattacag gcctgtgcca ccacacccgg ctaatttttt 720
ctatttttga cagggacggg gtttcaccat gttggtcagg ctggtctaga ggtactggat 780
cttgctacca gtggaacagc cactaaggat tctgcagtga gagcagaggg ccagctaagt 840
ggtactctcc cagagactgt ctgactcacg ccaccccctc caccttggac acaggacgct 900
gtggtttctg agccaggtac aatgactcct ttcggtaagt gcagtggaag ctgtacactg 960
cccaggcaaa gcgtccgggc agcgtaggcg ggcgactcag atcccagcca gtggacttag 1020
cccctgtttg ctcctctgat aactggggtg accttggtta atattcacca gcagcctccc 1080
ctgttgcccc tctggatcca ctgcttaaat acggacaagg acagg 1125
<210> 1007
<211> 1125
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 1007
aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60
ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120
tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180
cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240
tccaacatcc actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt 300
ggtttaggta gtgtgagagg gtccgggttc aaaaccactt gctgggtggg gagtcgtcag 360
taagtggcta tgccccgacc ccgaagcctg tttccccatc tgtacaatgg aaatgataaa 420
gacgcccatc tgatagggtt tttgtggcaa ataaacattt ggtttttttg ttttgttttg 480
ttttgttttt tgagatggag gtttgctctg tcgcccaggc tggagtgcag tgacacaatc 540
tcatctcacc acaaccttcc cctgcctcag cctcccaagt agctgggatt acaagcatgt 600
gccaccacac ctggctaatt ttctattttt agtagagacg ggtttctcca tgttggtcag 660
cctcagcctc ccaagtaact gggattacag gcctgtgcca ccacacccgg ctaatttttt 720
ctatttttga cagggacggg gtttcaccat gttggtcagg ctggtctaga ggtactggat 780
cttgctacca gtggaacagc cactaaggat tctgcagtga gagcagaggg ccagctaagt 840
ggtactctcc cagagactgt ctgactcacg ccaccccctc caccttggac acaggacgct 900
gtggtttctg agccaggtac aatgactcct ttcggtaagt gcagtggaag ctgtacactg 960
cccaggcaaa gcgtctgggc agcataggca ggcgactcag atcccagcca gtggacttag 1020
cccctgtttg ctcctccgat aactggggtg accttggtta atattcacca gcagcctccc 1080
ccgttgcccc tctggatcca ctgcttaaat acggacgagg acagg 1125
<210> 1008
<211> 1125
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 1008
aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60
ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120
tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180
cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240
tccaacatcc actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt 300
ggtttaggta gtgtgagagg gtccgggttc aaaaccactt gctgggtggg gagtcgtcag 360
taagtggcta tgccccgacc ccgaagcctg tttccccatc tgtacaatgg aaatgataaa 420
gacgcccatc tgatagggtt tttgtggcaa ataaacattt ggtttttttg ttttgttttg 480
ttttgttttt tgagatggag gtttgctctg tggcccaggc tggagtgcag tgacacaatc 540
tcatctcacc acaaccttcc cctgcctcag cctcccaagt agctgggatt acaagcatgt 600
gccaccacac ctggctaatt ttctattttt agtagagatg ggtttctcca tgttggtcag 660
cctcagcctc ccaagtaact gggattacag gcctgtgcca ccacacctgg ctaatttttt 720
ctatttttga cagggatggg gtttcaccat gttggtcagg ctggtctaga ggtactggat 780
cttgctacca gtggaacagc cactaaggat tctgcagtga gagcagaggg ccagctaagt 840
ggtactctcc cagagactgt ctgactcacg ccaccccctc caccttggac acaggacgct 900
gtggtttctg agccaggtac aatgactcct ttcggtaagt gcagtggaag ctgtacactg 960
cccaggcaaa gcgtccgggc agcgtaggcg ggcgactcag atcccagcca gtggacttag 1020
cccctgtttg ctcctctgat aactggggtg accttggtta atattcacca gcagcctccc 1080
ccgttgcccc tctggatcca ctgcttaaat acagacgagg acagg 1125
<210> 1009
<211> 103
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 1009
taacaaacac cattgtcaca ctccatcacc aaacaccatt gtcacactcc acgatcaaac 60
accattgtca cactccatca ccaaacacca ttgtcacact cca 103
<210> 1010
<211> 77
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 1010
tccataaagt aggaaacact acacgattcc ataaagtagg aaacactaca tcactccata 60
aagtaggaaa cactaca 77
<210> 1011
<211> 1359
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 1011
atgagcaccg ccgtgctgga aaatcctggc ctgggcagaa agctgagcga cttcggccaa 60
gagacaagct acatcgagga caactgcaac cagaacggcg ccatcagcct gatcttcagc 120
ctgaaagaag aagtgggcgc cctggccaag gtgctgagac tgttcgaaga gaacgacgtg 180
aacctgacac acatcgagag cgcgcccagc agactgaaga aggacgagta cgagttcttc 240
acccacctgg acaagcggag cctgcctgct ctgaccaaca tcatcaagat cctgcggcac 300
gacatcggcg ccacagtgca cgaactgagc cgggacaaga aaaaggacac cgtgccatgg 360
ttccccagaa ccatccaaga gctggacaga ttcgccaacc agatcctgag ctatggcgcc 420
gagctggacg ctgatcaccc tggctttaag gaccccgtgt accgggccag aagaaagcag 480
tttgccgata tcgcctacaa ctaccggcac ggccagccta ttcctcgggt cgagtacatg 540
gaagaggaaa agaaaacctg gggcaccgtg ttcaagaccc tgaagtccct gtacaagacc 600
cacgcctgct acgagtacaa ccacatcttc ccactgctcg aaaagtactg cggcttccac 660
gaggacaata tccctcagct tgaggacgtg tcccagttcc tgcagacctg caccggcttt 720
agactgaggc cagttgccgg actgctgagc agcagagatt ttctcggcgg cctggccttc 780
agagtgttcc actgtaccca gtacatcaga cacggcagca agcccatgta cacccctgag 840
cctgatatct gccacgagct gctgggacat gtgcccctgt tcagcgatag aagcttcgcc 900
cagttcagcc aagagatcgg actggcttct ctgggagccc ctgacgagta cattgagaag 960
ctggccacca tctactggtt caccgtggaa ttcggcctgt gcaagcaggg cgacagcatc 1020
aaagcttatg gcgctggcct gctgtctagc ttcggcgagc tgcagtactg tctgagcgag 1080
aagcctaagc tgctgcccct ggaactggaa aagaccgcca tccagaacta caccgtgacc 1140
gagttccagc ctctgtacta cgtggccgag agcttcaacg acgccaaaga aaaagtgcgg 1200
aacttcgccg ccaccattcc tcggcctttc agcgtcagat acgaccccta cacacagcgg 1260
atcgaggtgc tggacaacac acagcagctg aaaattctgg ccgactccat caacagcgag 1320
atcggcatcc tgtgcagcgc cctgcagaaa atcaagtga 1359
<210> 1012
<211> 1359
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 1012
atgtccaccg ccgtgctgga gaaccctggc ctgggcagaa agctgtctga ctttggccag 60
gagacctcct acatcgagga caactgcaac cagaatggag ccatctccct gatcttctcc 120
ctgaaggagg aggtgggagc cctggccaag gtgctgagac tgtttgagga gaatgatgtg 180
aacctgaccc acatcgagtc cagaccctcc agactgaaga aggatgagta tgagttcttc 240
acccacctgg acaagagatc cctgcctgcc ctgaccaaca tcatcaagat cctgagacac 300
gacattggag ccaccgtgca cgagctgtcc agagacaaga agaaggacac cgtgccctgg 360
ttccccagaa ccatccagga gctggacaga tttgccaacc agatcctgtc ctatggagcc 420
gagctggatg ccgaccaccc tggcttcaag gaccctgtgt acagagccag aagaaagcag 480
tttgccgaca ttgcctacaa ctacagacac ggccagccca tccccagagt ggagtacatg 540
gaggaggaga agaagacctg gggcaccgtg ttcaagaccc tgaagtccct gtacaagacc 600
cacgcctgct atgagtacaa ccacatcttc cccctgctgg agaagtactg tggcttccac 660
gaggacaaca tcccccagct ggaggatgtg tcccagttcc tgcagacctg caccggcttc 720
agactgagac ctgtggccgg cctgctgtcc tccagagact tcctgggagg cctggccttc 780
agagtgttcc actgcaccca gtacatcaga cacggctcca agcccatgta cacccctgag 840
cctgacatct gccacgagct gctgggccac gtgcccctgt tctctgacag atcctttgcc 900
cagttctccc aggagattgg cctggcctcc ctgggagccc ctgatgagta cattgagaag 960
ctggccacca tctactggtt caccgtggag tttggcctgt gcaagcaggg agactccatc 1020
aaggcctatg gagccggcct gctgtcctcc tttggagagc tgcagtactg cctgtctgag 1080
aagcccaagc tgctgcccct ggagctggag aagaccgcca tccagaacta caccgtgacc 1140
gagttccagc ccctgtacta tgtggccgag tccttcaatg atgccaagga gaaggtcaga 1200
aactttgccg ccaccatccc cagacccttc tctgtgagat atgaccccta cacccagaga 1260
atcgaggtgc tggacaacac ccagcagctg aagatcctgg ccgactccat caactctgag 1320
atcggcatcc tgtgctctgc cctgcagaag atcaagtaa 1359
<210> 1013
<211> 1359
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 1013
atgagcaccg ccgtgctgga aaaccccggt ctgggcagga agctgtccga ctttggccag 60
gagacctcct acatcgagga caactgcaac cagaacgggg ccatctccct gatcttctcc 120
ctgaaggagg aggtgggggc cctggccaag gtgctgaggc tgttcgagga gaacgacgtt 180
aacctgaccc acatcgagag ccggcccagc agactgaaga aggacgagta cgagttcttc 240
acccacctgg acaagagaag cctgcccgcc ctgaccaaca tcattaagat cctgaggcac 300
gacatcggag ccacagtgca tgagctctcc agagacaaga agaaggacac cgtgccctgg 360
ttcccccgca ccatccagga gctggacagg ttcgccaacc agatcctgag ctatggggcc 420
gagctggatg ccgaccaccc tggcttcaag gacccagtgt accgcgccag gcggaagcag 480
ttcgccgaca ttgcctacaa ttaccggcac ggccagccca tcccccgggt ggagtacatg 540
gaggaggaga agaagacctg ggggaccgtg ttcaagaccc tgaaaagcct gtacaagacc 600
cacgcctgct acgagtacaa ccacatcttc cccctgctgg agaagtactg tggattccac 660
gaggataaca tcccccagct ggaggatgtg tcccagttcc tgcagacatg cacaggcttt 720
aggctgaggc ctgtcgccgg cctcctgtcc agcagagact tcctgggcgg gctggccttc 780
cgcgtgttcc actgcaccca gtacatcagg cacggcagca agcccatgta caccccagag 840
cctgacatct gtcacgagct gctgggccac gtgcccctgt tctctgacag atcctttgca 900
cagttcagcc aggagatcgg cttggcctcc ctgggggccc ccgacgaata tatcgagaag 960
ctggccacca tctactggtt caccgtggag ttcggactgt gcaagcaagg agacagcatc 1020
aaggcctacg gcgctggcct gctgtccagc tttggagagc tgcagtactg cctgtctgag 1080
aagcccaagc tgctgccact ggagctggag aagaccgcca tccagaacta caccgtgaca 1140
gagttccagc ccctgtacta cgtggccgag agcttcaatg acgccaagga gaaggtgagg 1200
aacttcgctg ccaccatccc tcgccccttc agcgtgaggt atgaccccta cacccagaga 1260
atcgaggtgc tggacaacac ccagcagctg aagatcctgg ctgacagcat caacagcgag 1320
atcggcatcc tgtgctccgc cctgcagaag atcaagtaa 1359
<210> 1014
<211> 1359
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 1014
atgagcacag cagtactaga aaacccagga ttaggcagga agttgtctga ctttggccag 60
gagacctcct acattgaaga caactgcaac cagaatggtg ccatctcctt gatcttcagc 120
ctgaaggagg aggtgggagc tctggccaag gtgctgaggc tgtttgagga gaatgatgtg 180
aacctgaccc acattgagtc caggcccagt aggctgaaga aggatgagta tgagttcttc 240
acccacctgg acaagagatc cctgccagct ctgaccaaca tcatcaagat cctgagacat 300
gacattgggg ccacagtgca tgagctgagc agggacaaga agaaggacac agtgccctgg 360
ttccccagaa ccatccagga gctggacagg tttgccaacc agatcctgtc ctatggagct 420
gagctggatg cagaccaccc tggcttcaag gacccagtgt acagggccag aaggaagcag 480
tttgctgata ttgcctacaa ctacaggcat ggccagccca tcccaagggt ggagtacatg 540
gaggaggaga agaagacctg gggcacagtg ttcaagacac tgaagtccct gtacaagacc 600
catgcttgct atgagtataa ccacatcttc cctctcctgg agaaatactg tggcttccat 660
gaggacaaca tccctcagct ggaggatgtg agtcagttcc tgcagacatg cactggcttc 720
aggctgaggc ctgtggctgg actcctgagc agcagggact tcctgggagg cttggccttc 780
agggtgttcc actgcaccca gtatatcagg catggctcca agcctatgta caccccagag 840
cctgacatct gccatgagct gctggggcat gtgcccctgt tctctgacag gagctttgcc 900
cagttcagcc aggagattgg cctggcctcc ctgggggctc cagatgagta cattgagaag 960
ctggctacca tctactggtt tacagtggag tttgggctgt gcaagcaggg ggacagcatc 1020
aaggcctatg gggctgggct gctgtcctcc tttggagagc tgcagtactg cctgtctgag 1080
aagcccaagc tcctccccct ggagctggag aagactgcca tccagaacta cactgtgaca 1140
gagttccagc ccctgtacta tgtggctgag tccttcaatg atgccaagga gaaggtgagg 1200
aactttgctg ccaccatccc caggcccttc tcagtgagat atgaccccta cacccagagg 1260
attgaggtgc tggacaacac ccagcagctg aagatcctgg cagacagcat caactctgag 1320
attggaatcc tgtgctctgc cctgcagaag atcaagtaa 1359
<210> 1015
<211> 1588
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 1015
atgagtacag cagtgttaga gaatccaggc ctaggtagaa agctgtctga ctttggccag 60
gtgagccagg gcagcctgag ctgctcagtt aggggaattt gggcctccag agaaagagat 120
ctgaagactg ctggtgcttc ctggtttcat aagctcagta agaagtctga attcattgga 180
agctgatgat agaagaaaga gttcatgctt gctttgtcca tggaggttta acaggaatga 240
attgctaaac tgtggaaaat gttttaaaca aatgcatctt atcctgtagg agacctccta 300
cattgaggac aactgcaacc agaatggagc catcagcctg atcttcagcc tgaaggagga 360
ggtgggagcc ctggccaagg tgctgagact gtttgaggag aatgatgtga acctgaccca 420
cattgagtcc agaccctcca gactgaagaa ggatgagtat gagttcttca cccacctgga 480
caagagatcc ctgcctgctc tgaccaacat catcaagatc ctgagacatg atattggagc 540
cacagtgcat gagctgagca gggacaagaa gaaggacaca gtgccttggt tccccagaac 600
catccaggag ctggacaggt ttgccaacca gatcctgtcc tatggagctg agctggatgc 660
tgaccaccct ggatttaagg atcctgtgta cagggccaga aggaagcagt ttgctgacat 720
tgcctacaac tacaggcatg gccagcccat ccccagggtg gagtacatgg aggaggagaa 780
gaagacctgg ggcactgtgt tcaagaccct gaagagcctg tacaagaccc atgcctgcta 840
tgagtacaac cacatcttcc ccctgctgga gaagtactgt ggcttccatg aggacaacat 900
ccctcagctg gaggatgtgt cccagttcct gcagacctgc acaggcttca gactgagacc 960
tgtggctggc ctgctgtcta gcagagactt cctgggaggc ctggccttca gagtgttcca 1020
ctgcacccag tacatcagac atggaagcaa gcccatgtac acccctgagc cagacatctg 1080
ccatgagctg ctgggccatg tgcccctgtt ctctgataga tcctttgccc agttcagcca 1140
ggagattggc ctggccagcc tgggagcccc tgatgagtac attgagaagc tggccaccat 1200
ctactggttc acagtggagt ttggcctgtg caagcaggga gactccatca aggcctatgg 1260
agctggactg ctgtcctcct ttggagagct gcagtactgc ctgtctgaga agcccaagct 1320
gctgcccctg gagctggaga agacagccat ccagaactac acagtgacag agttccagcc 1380
cctgtactat gtggctgaga gcttcaatga tgccaaggag aaggtgagaa actttgctgc 1440
caccatcccc agacccttct ctgtgaggta tgacccctac acccagagga ttgaggtgct 1500
ggacaacacc cagcagctga agatcctggc tgactccatc aactctgaga ttggcatcct 1560
gtgctctgcc ctgcagaaga tcaagtaa 1588
<210> 1016
<400> 1016
000
<210> 1017
<400> 1017
000
<210> 1018
<211> 10
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 1018
gggactttcc 10
<210> 1019
<211> 11
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 1019
ggggactttc c 11
<210> 1020
<400> 1020
000
<210> 1021
<211> 1363
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 1021
atgtccactg cggtcctgga aaacccaggc ttgggcagga aactctctga ctttggacag 60
gaaacaagct atattgaaga caactgcaat caaaatggtg ccatatcact gatcttctca 120
ctcaaagaag aagttggtgc attggccaaa gtattgcgct tatttgagga gaatgatgta 180
aacctgaccc acattgaatc tagaccttct cgtttaaaga aagatgagta tgaatttttc 240
acccatttgg ataaacgtag cctgcctgct ctgacaaaca tcatcaagat cttgaggcat 300
gacattggtg ccactgtcca tgagctttca cgagataaga agaaagacac agtgccctgg 360
ttcccaagaa ccattcaaga gctggacaga tttgccaatc agattctcag ctatggagcg 420
gaactggatg ctgaccaccc tggttttaaa gatcctgtgt accgtgcaag acggaagcag 480
tttgctgaca ttgcctacaa ctaccgccat gggcagccca tccctcgagt ggaatacatg 540
gaggaagaaa agaaaacatg gggcacagtg ttcaagactc tgaagtcctt gtataaaacc 600
catgcttgct atgagtacaa tcacattttt ccacttcttg aaaagtactg tggcttccat 660
gaagataaca ttccccagct ggaagacgtt tctcagttcc tgcagacttg cactggtttc 720
cgcctccgac ctgtggctgg cctgctttcc tctcgggatt tcttgggtgg cctggccttc 780
cgagtcttcc actgcacaca gtacatcaga catggatcca agcccatgta tacccccgaa 840
cctgacatct gccatgagct gttgggacat gtgcccttgt tttcagatcg cagctttgcc 900
cagttttccc aggaaattgg ccttgcctct ctgggtgcac ctgatgaata cattgaaaag 960
ctcgccacaa tttactggtt tactgtggag tttgggctct gcaaacaagg agactccata 1020
aaggcatatg gtgctgggct cctgtcatcc tttggtgaat tacagtactg cttatcagag 1080
aagccaaagc ttctccccct ggagctggag aagacagcca tccaaaatta cactgtcacg 1140
gagttccagc ccctctatta cgtggcagag agttttaatg atgccaagga gaaagtaagg 1200
aactttgctg ccacaatacc tcggcccttc tcagttcgct acgacccata cacccaaagg 1260
attgaggtct tggacaatac ccagcagctt aagattttgg ctgattccat taacagtgaa 1320
attggaatcc tttgcagtgc cctccagaaa ataaagtaat taa 1363
<210> 1022
<211> 428
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 1022
atgagcaccg ccgtgctgga aaatcctggc ttgggcagga aactctctga ctttggacag 60
gtgagccacg gcagcctgag ctgctcagtt aggggaattt gggcctccag agaaagagat 120
ccgaagactg ctggtgcttc ctggtttcat aagctcagta agaagtctga attcgttgga 180
agctgatgat agaagaaaga gttcatgctt gctttgtcca tggaggttta acaggaatga 240
attgctaaac tgtggaaaat gttttaaaca aatgcatctt atcctgtagg aaacaagcta 300
tattgaagac aactgcaatc aaaacggcgc catcagcctg atcttcagcc tgaaagaaga 360
agtgggcgcc ctggccaagg tgctgagact gttcgaagag aacgacgtga acctgacaca 420
catcgaga 428
<210> 1023
<211> 186
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 1023
atgagcaccg ccgtgctgga aaatcctggc ctgggcagaa agctgagcga cttcggccag 60
gtgagccagg gcagcctgag ctgctcagtt aggggaattt gggcctccag agaaagagat 120
cccaagactg ctggtgcttc ctggtttcat aagctcagta agaagtctga attggttgga 180
agctga 186
<210> 1024
<211> 186
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 1024
agttcatgct tgctttgtcc atgtaggttt aacaggaatg aattgctaaa ctgtggaaaa 60
tgttttaaac aaatgcatct tatcctgtag gagacaagct acatcgagga caactgcaac 120
cagaacggcg ccatcagcct gatcttcagc ctgaaagaag aagtgggcgc cctggccaag 180
gtgctg 186
<210> 1025
<211> 450
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 1025
Met Ser Thr Ala Val Leu Glu Asn Pro Gly Leu Gly Arg Lys Leu Ser
1 5 10 15
Asp Phe Gly Gln Glu Thr Ser Tyr Ile Glu Asp Asn Cys Asn Gln Asn
20 25 30
Gly Ala Ile Ser Leu Ile Phe Ser Leu Lys Glu Glu Val Gly Ala Leu
35 40 45
Ala Lys Val Leu Arg Leu Phe Glu Glu Asn Asp Val Asn Leu Thr His
50 55 60
Ile Glu Ser Arg Pro Ser Arg Leu Lys Lys Asp Glu Tyr Glu Phe Phe
65 70 75 80
Thr His Leu Asp Lys Arg Ser Leu Pro Ala Leu Thr Asn Ile Ile Lys
85 90 95
Ile Leu Arg His Asp Ile Gly Ala Thr Val His Glu Leu Ser Arg Asp
100 105 110
Lys Lys Lys Asp Thr Val Pro Trp Phe Pro Arg Thr Ile Gln Glu Leu
115 120 125
Asp Arg Phe Ala Asn Gln Ile Leu Ser Tyr Gly Ala Glu Leu Asp Ala
130 135 140
Asp His Pro Gly Phe Lys Asp Pro Val Tyr Arg Ala Arg Arg Lys Gln
145 150 155 160
Phe Ala Asp Ile Ala Tyr Asn Tyr Arg His Gly Gln Pro Ile Pro Arg
165 170 175
Val Glu Tyr Met Glu Glu Glu Lys Lys Thr Trp Gly Thr Val Phe Lys
180 185 190
Thr Leu Lys Ser Leu Tyr Lys Thr His Ala Cys Tyr Glu Tyr Asn His
195 200 205
Ile Phe Pro Leu Leu Glu Lys Tyr Cys Gly Phe His Glu Asp Asn Ile
210 215 220
Pro Gln Leu Glu Asp Val Ser Gln Phe Leu Gln Thr Cys Thr Gly Phe
225 230 235 240
Arg Leu Arg Pro Val Ala Gly Leu Leu Ser Ser Arg Asp Phe Leu Gly
245 250 255
Gly Leu Ala Phe Arg Val Phe His Cys Thr Gln Tyr Ile Arg His Gly
260 265 270
Ser Lys Pro Met Tyr Thr Pro Glu Pro Asp Ile Cys His Glu Leu Leu
275 280 285
Gly His Val Pro Leu Phe Ser Asp Arg Ser Phe Ala Gln Phe Ser Gln
290 295 300
Glu Ile Gly Leu Ala Ser Leu Gly Ala Pro Asp Glu Tyr Ile Glu Lys
305 310 315 320
Leu Ala Thr Ile Tyr Trp Phe Thr Val Glu Phe Gly Leu Cys Lys Gln
325 330 335
Gly Asp Ser Ile Lys Ala Tyr Gly Ala Gly Leu Leu Ser Ser Phe Gly
340 345 350
Glu Leu Gln Tyr Cys Leu Ser Glu Lys Pro Lys Leu Leu Pro Leu Glu
355 360 365
Leu Glu Lys Thr Ala Ile Gln Asn Tyr Thr Val Thr Glu Phe Gln Pro
370 375 380
Leu Tyr Tyr Val Ala Glu Ser Phe Asn Asp Ala Lys Glu Lys Val Arg
385 390 395 400
Asn Phe Ala Ala Thr Ile Pro Arg Pro Phe Ser Val Arg Tyr Asp Pro
405 410 415
Tyr Thr Gln Arg Ile Glu Val Leu Asp Asn Thr Gln Gln Leu Lys Ile
420 425 430
Leu Ala Asp Ser Ile Asn Ser Glu Ile Gly Ile Leu Cys Ser Ala Leu
435 440 445
Gln Lys
450
<210> 1026
<211> 91
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 1026
aagaggtaag ggtttaaggg atggttggtt ggtggggtat taatgtttaa ttacctggag 60
cacctgcctg aaatcacttt ttttcaggtt g 91
Claims (86)
- 폐쇄형 DNA(ceDNA) 벡터로서,
적어도 하나의 페닐알라닌 히드록실라아제(PAH: phenylalanine hydroxylase) 단백질을 인코딩하는 적어도 하나의 핵산 서열(여기서, 적어도 하나의 핵산 서열은 표 1A에 열거된 서열 중 임의의 것과 적어도 90% 동일성을 갖는 서열에서 선택되고, 적어도 하나의 핵산 서열은 코돈 최적화되며, 적어도 하나의 핵산 서열은 플랭킹 역말단반복서열(ITR: inverted terminal repeat) 사이에 위치함)과,
적어도 하나의 PAH 단백질을 인코딩하는 적어도 하나의 뉴클레오타이드 서열에 작동적으로 연결된 프로모터(여기서, 프로모터는 VD 프로모터, 인간 알파 1-항트립신(hAAT) 프로모터(hAAT(979) 프로모터 및 CpGmin_hAAT 프로모터 포함) 및 트랜스티레틴(TTR: transthyretin) 간(liver) 특이적 프로모터로 이루어지는 군에서 선택됨)를 포함하는 ceDNA 벡터. - 제1항에 있어서, 적어도 하나의 PAH 단백질을 인코딩하는 적어도 하나의 핵산 서열이 표 1A에 제시된 서열 중 어느 하나와 적어도 95% 동일성을 갖는 서열에서 선택되는, ceDNA 벡터.
- 폐쇄형 DNA(ceDNA) 벡터로서,
적어도 하나의 PAH 단백질을 인코딩하는 핵산 서열(여기서, 핵산 서열은 표 1A에 열거된 서열 중 임의의 것과 적어도 95% 동일성을 갖는 서열에서 선택되고, 적어도 하나의 핵산 서열은 플랭킹 역말단반복서열(ITR) 사이에 위치함)과,
적어도 하나의 PAH 단백질을 인코딩하는 핵산 서열에 작동적으로 연결된 프로모터(여기서, 프로모터는 VD 프로모터, 인간 알파 1-항트립신(hAAT) 프로모터 및 트랜스티레틴(TTR) 간 특이적 프로모터로 이루어지는 군에서 선택됨)를 포함하는 ceDNA 벡터. - 폐쇄형 DNA(ceDNA) 벡터로서,
적어도 하나의 PAH 단백질을 인코딩하는 핵산 서열(여기서, 핵산 서열은 표 1A에 열거된 서열 중 임의의 것과 적어도 96% 동일성을 갖는 서열에서 선택되고, 적어도 하나의 핵산 서열은 플랭킹 역말단반복서열(ITR) 사이에 위치함)과,
적어도 하나의 PAH 단백질을 인코딩하는 핵산 서열에 작동적으로 연결된 프로모터(여기서, 프로모터는 VD 프로모터, 인간 알파 1-항트립신(hAAT) 프로모터 및 트랜스티레틴(TTR) 간 특이적 프로모터로 이루어지는 군에서 선택됨)를 포함하는 ceDNA 벡터. - 폐쇄형 DNA(ceDNA) 벡터로서,
적어도 하나의 PAH 단백질을 인코딩하는 핵산 서열(여기서, 핵산 서열은 표 1A에 열거된 서열 중 임의의 것과 적어도 97% 동일성을 갖는 서열에서 선택되고, 적어도 하나의 핵산 서열은 플랭킹 역말단반복서열(ITR) 사이에 위치함)과,
적어도 하나의 PAH 단백질을 인코딩하는 핵산 서열에 작동적으로 연결된 프로모터(여기서, 프로모터는 VD 프로모터, 인간 알파 1-항트립신(hAAT) 프로모터 및 트랜스티레틴(TTR) 간 특이적 프로모터로 이루어지는 군에서 선택됨)를 포함하는 ceDNA 벡터. - 폐쇄형 DNA(ceDNA) 벡터로서,
적어도 하나의 PAH 단백질을 인코딩하는 핵산 서열(여기서, 핵산 서열은 표 1A에 열거된 서열 중 임의의 것과 적어도 98% 동일성을 갖는 서열에서 선택되고, 적어도 하나의 핵산 서열은 플랭킹 역말단반복서열(ITR) 사이에 위치함)과,
적어도 하나의 PAH 단백질을 인코딩하는 핵산 서열에 작동적으로 연결된 프로모터(여기서, 프로모터는 VD 프로모터, 인간 알파 1-항트립신(hAAT) 프로모터 및 트랜스티레틴(TTR) 간 특이적 프로모터로 이루어지는 군에서 선택됨)를 포함하는 ceDNA 벡터. - 폐쇄형 DNA(ceDNA) 벡터로서,
적어도 하나의 PAH 단백질을 인코딩하는 핵산 서열(여기서, 핵산 서열은 표 1A에 열거된 서열 중 임의의 것과 적어도 99% 동일성을 갖는 서열에서 선택되고, 적어도 하나의 핵산 서열은 플랭킹 역말단반복서열(ITR) 사이에 위치함)과,
적어도 하나의 PAH 단백질을 인코딩하는 핵산 서열에 작동적으로 연결된 프로모터(여기서, 프로모터는 VD 프로모터, 인간 알파 1-항트립신(hAAT) 프로모터 및 트랜스티레틴(TTR) 간 특이적 프로모터로 이루어지는 군에서 선택됨)를 포함하는 ceDNA 벡터. - 제1항 내지 제7항 중 어느 한 항에 있어서, 적어도 하나의 PAH 단백질을 인코딩하는 적어도 하나의 핵산 서열이 서열번호 382로 제시된 서열과 적어도 98% 동일성을 갖는 서열인, ceDNA 벡터.
- 제1항 내지 제7항 중 어느 한 항에 있어서, 적어도 하나의 PAH 단백질을 인코딩하는 적어도 하나의 핵산 서열이 서열번호 382로 제시된 서열과 적어도 99% 동일성을 갖는 서열인, ceDNA 벡터.
- 제1항 내지 제7항 중 어느 한 항에 있어서, 적어도 하나의 PAH 단백질을 인코딩하는 적어도 하나의 핵산 서열이 서열번호 382로 제시된 서열인, ceDNA 벡터.
- 제1항 내지 제7항 중 어느 한 항에 있어서, 적어도 하나의 PAH 단백질을 인코딩하는 적어도 하나의 핵산 서열이 서열번호 425로 제시된 서열과 적어도 99% 동일성을 갖는 서열인, ceDNA 벡터.
- 제1항 내지 제7항 중 어느 한 항에 있어서, 적어도 하나의 PAH 단백질을 인코딩하는 적어도 하나의 핵산 서열이 서열번호 425로 제시된 서열인, ceDNA 벡터.
- 제1항 내지 제7항 중 어느 한 항에 있어서, 적어도 하나의 PAH 단백질을 인코딩하는 적어도 하나의 핵산 서열이 서열번호 431로 제시된 서열과 적어도 99% 동일성을 갖는 서열인, ceDNA 벡터.
- 제1항 내지 제7항 중 어느 한 항에 있어서, 적어도 하나의 PAH 단백질을 인코딩하는 적어도 하나의 핵산 서열이 서열번호 431로 제시된 서열인, ceDNA 벡터.
- 제1항 내지 제7항 중 어느 한 항에 있어서, 적어도 하나의 PAH 단백질을 인코딩하는 적어도 하나의 핵산 서열이 서열번호 435로 제시된 서열과 적어도 99% 동일성을 갖는 서열인, ceDNA 벡터.
- 제1항 내지 제7항 중 어느 한 항에 있어서, 적어도 하나의 PAH 단백질을 인코딩하는 적어도 하나의 핵산 서열이 서열번호 435로 제시된 서열인, ceDNA 벡터.
- 제1항 내지 제7항 중 어느 한 항에 있어서, 프로모터가 서열번호 191과 적어도 85% 동일성을 갖는 핵산 서열을 포함하는, ceDNA 벡터.
- 제1항 내지 제7항 중 어느 한 항에 있어서, 프로모터가 서열번호 443과 적어도 98% 동일성을 갖는 핵산 서열을 포함하는, ceDNA 벡터.
- 제1항 내지 제7항 중 어느 한 항에 있어서, 프로모터가 서열번호 444와 적어도 99% 동일성을 갖는 핵산 서열을 포함하는, ceDNA 벡터.
- 제1항 내지 제7항 중 어느 한 항에 있어서, 프로모터가 서열번호 445와 적어도 99% 동일성을 갖는 핵산 서열을 포함하는, ceDNA 벡터.
- 제1항 내지 제7항 중 어느 한 항에 있어서, 프로모터가 서열번호 446과 적어도 99% 동일성을 갖는 핵산 서열을 포함하는, ceDNA 벡터.
- 제1항 내지 제7항 중 어느 한 항에 있어서, 프로모터가 서열번호 447과 적어도 96% 동일성을 갖는 핵산 서열을 포함하는, ceDNA 벡터.
- 제1항 내지 제22항 중 어느 한 항에 있어서, 인핸서를 추가로 포함하는 ceDNA 벡터.
- 제23항에 있어서, 인핸서가 세르핀 인핸서, 3xHNF1-4_ProEnh_10mer 및 5xHNF1_ProEnh_10mer로 이루어지는 군에서 선택되는, ceDNA 벡터.
- 제23항에 있어서, 인핸서가 서열번호 450과 적어도 85% 동일성을 갖는 핵산 서열을 포함하는, ceDNA 벡터.
- 제23항에 있어서, 인핸서가 서열번호 586과 적어도 85% 동일성을 갖는 핵산 서열을 포함하는, ceDNA 벡터.
- 제23항에 있어서, 인핸서가 서열번호 587과 적어도 85% 동일성을 갖는 핵산 서열을 포함하는, ceDNA 벡터.
- 제1항 내지 제7항 중 어느 한 항에 있어서, 프로모터가 서열번호 462와 적어도 85% 동일성을 갖는 핵산 서열을 포함하는 프로모터 세트인, ceDNA 벡터.
- 제1항 내지 제7항 중 어느 한 항에 있어서, 프로모터가 서열번호 467과 적어도 85% 동일성을 갖는 핵산 서열을 포함하는 프로모터 세트인, ceDNA 벡터.
- 제1항 내지 제7항 중 어느 한 항에 있어서, 프로모터가 서열번호 470과 적어도 85% 동일성을 갖는 핵산 서열을 포함하는 프로모터 세트인, ceDNA 벡터.
- 제1항 내지 제7항 중 어느 한 항에 있어서, 프로모터가 서열번호 470과 적어도 90% 동일성을 갖는 핵산 서열을 포함하는 프로모터 세트인, ceDNA 벡터.
- 제1항 내지 제7항 중 어느 한 항에 있어서, 프로모터가 서열번호 470과 적어도 95% 동일성을 갖는 핵산 서열을 포함하는 프로모터 세트인, ceDNA 벡터.
- 제1항 내지 제32항 중 어느 한 항에 있어서, 하나 이상의 인트론을 추가로 포함하는 ceDNA 벡터.
- 제33항에 있어서, 하나 이상의 인트론이 미세생쥐바이러스(MVM: minute virus of mice)인, ceDNA 벡터.
- 제1항 내지 제34항 중 어느 한 항에 있어서, 3' 미번역 영역(3' UTR)을 포함하는 ceDNA 벡터.
- 제1항 내지 제35항 중 어느 한 항에 있어서, 적어도 하나의 polyA 서열을 포함하는 ceDNA 벡터.
- 제1항 내지 제7항 중 어느 한 항에 있어서, VD 프로모터가 SERP 인핸서를 포함하는, ceDNA 벡터.
- 제1항 내지 제7항 중 어느 한 항에 있어서, VD 프로모터가 3xSERP 인핸서를 포함하는, ceDNA 벡터.
- 제1항 내지 제7항 중 어느 한 항에 있어서, 프로모터가 TTR 간 프로모터이고, ceDNA가 MVM 인트론을 추가로 포함하는, ceDNA 벡터.
- 제1항 내지 제39항 중 어느 한 항에 있어서, 서열번호 194, 서열번호 195, 서열번호 196, 서열번호 197, 서열번호 198, 서열번호 199, 서열번호 200, 서열번호 201, 서열번호 202, 서열번호 203, 서열번호 204, 서열번호 205, 서열번호 206, 서열번호 207, 서열번호 208, 서열번호 209, 서열번호 210, 서열번호 211, 서열번호 212, 서열번호 213, 서열번호 541, 서열번호 542, 서열번호 543, 서열번호 544, 서열번호 545, 서열번호 546, 서열번호 547, 서열번호 548, 서열번호 549, 서열번호 550, 서열번호 551, 서열번호 552, 서열번호 553, 서열번호 554, 서열번호 555, 서열번호 556, 서열번호 557, 서열번호 558, 서열번호 559, 서열번호 560, 서열번호 561, 서열번호 562, 서열번호 563, 서열번호 564, 서열번호 565, 서열번호 566, 서열번호 567, 서열번호 570, 서열번호 571, 서열번호 572, 서열번호 573, 서열번호 574, 서열번호 575, 서열번호 576, 서열번호 577, 서열번호 578, 서열번호 579, 서열번호 580, 서열번호 581, 서열번호 582, 서열번호 583 및 서열번호 584로 이루어지는 군에서 선택되는 핵산 서열과 적어도 90% 동일한 핵산 서열을 포함하는 ceDNA 벡터.
- 제1항 내지 제40항 중 어느 한 항에 있어서, 적어도 하나의 핵산 서열이 PAH에 대한 cDNA인, ceDNA 벡터.
- 제1항 내지 제41항 중 어느 한 항에 있어서, 적어도 하나의 ITR이 기능성 말단 분해 부위(TRS)와 Rep 결합 부위를 포함하는, ceDNA 벡터.
- 제1항 내지 제42항 중 어느 한 항에 있어서, ITR 중 하나 또는 둘 모두가 파르보바이러스(parvovirus), 데펜도바이러스(dependovirus) 및 아데노연관바이러스(AAV: adeno-associated virus)에서 선택되는 바이러스에서 유래한 것인, ceDNA 벡터.
- 제1항 내지 제43항 중 어느 한 항에 있어서, 플랭킹 ITR이 대칭 또는 비대칭인, ceDNA 벡터.
- 제44항에 있어서, 플랭킹 ITR이 대칭 또는 실질적으로 대칭인, ceDNA 벡터.
- 제45항에 있어서, 플랭킹 ITR이 비대칭인, ceDNA 벡터.
- 제1항 내지 제46항 중 어느 한 항에 있어서, ITR 중 하나 또는 둘 모두가 야생형이거나, 두 개의 ITR이 모두 야생형인, ceDNA 벡터.
- 제1항 내지 제47항 중 어느 한 항에 있어서, 두 개의 ITR이 모두 동일한 AAV의 야생형인, ceDNA 벡터.
- 제48항에 있어서, 두 개의 ITR이 모두 AAV2의 야생형인, ceDNA 벡터.
- 제1항 내지 제49항 중 어느 한 항에 있어서, 플랭킹 ITR이 상이한 바이러스 혈청형에서 유래한 것인, ceDNA 벡터.
- 제1항 내지 제50항 중 어느 한 항에 있어서, 플랭킹 ITR이 표 2에 제시된 한 쌍의 바이러스 혈청형에서 유래한 것인, ceDNA 벡터.
- 제1항 내지 제51항 중 어느 한 항에 있어서, ITR 중 하나 또는 둘 모두가 표 3, 표 5A, 표 5B 또는 표 6의 서열에서 선택되는 서열을 포함하는, ceDNA 벡터.
- 제1항 내지 제52항 중 어느 한 항에 있어서, ITR 중 적어도 하나가 ITR의 전반적인 3차원 입체형태에 영향을 미치는 결실, 부가 또는 치환에 의해 야생형 AAV ITR 서열로부터 변경된 것인, ceDNA 벡터.
- 제1항 내지 제53항 중 어느 한 항에 있어서, ITR 중 하나 또는 둘 모두가 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11 및 AAV12에서 선택되는 AAV 혈청형에서 유도된 것인, ceDNA 벡터.
- 제1항 내지 제54항 중 어느 한 항에 있어서, ITR 중 하나 또는 둘 모두가 합성인, ceDNA 벡터.
- 제1항 내지 제55항 중 어느 한 항에 있어서, ITR 중 하나 또는 둘 모두가 야생형 ITR이 아니거나, 두 개의 ITR이 모두 야생형이 아닌, ceDNA 벡터.
- 제1항 내지 제56항 중 어느 한 항에 있어서, ITR 중 하나 또는 둘 모두가 A, A', B, B', C, C', D 및 D'에서 선택되는 ITR 영역 중 적어도 하나에서 결실, 삽입 및/또는 치환에 의해 변형된 것인, ceDNA 벡터.
- 제57항에 있어서, 결실, 삽입 및/또는 치환이 통상적으로 A, A', B, B' C 또는 C' 영역으로 형성된 스템-루프 구조(stem-loop structure)의 전부 또는 일부의 결실을 초래하는, ceDNA 벡터.
- 제1항 내지 제58항 중 어느 한 항에 있어서, ITR 중 하나 또는 둘 모두가 통상적으로 B 및 B' 영역으로 형성된 스템-루프 구조의 전부 또는 일부의 결실을 초래하는 결실, 삽입 및/또는 치환에 의해 변형된 것인, ceDNA 벡터.
- 제1항 내지 제59항 중 어느 한 항에 있어서, ITR 중 하나 또는 둘 모두가 통상적으로 C 및 C' 영역으로 형성된 스템-루프 구조의 전부 또는 일부의 결실을 초래하는 결실, 삽입 및/또는 치환에 의해 변형된 것인, ceDNA 벡터.
- 제1항 내지 제60항 중 어느 한 항에 있어서, ITR 중 하나 또는 둘 모두가 통상적으로 B 및 B' 영역으로 형성된 스템-루프 구조의 일부 및/또는 통상적으로 C 및 C' 영역으로 형성된 스템-루프 구조 일부의 결실을 초래하는 결실, 삽입 및/또는 치환에 의해 변형된 것인, ceDNA 벡터.
- 제1항 내지 제61항 중 어느 한 항에 있어서, ITR 중 하나 또는 둘 모두가 통상적으로 B 및 B' 영역으로 형성된 제1 스템-루프 구조와 C 및 C' 영역으로 형성된 제2 스템-루프 구조를 포함하는 영역에 단일 스템-루프 구조를 포함하는, ceDNA 벡터.
- 제1항 내지 제62항 중 어느 한 항에 있어서, ITR 중 하나 또는 둘 모두가 통상적으로 B 및 B' 영역으로 형성된 제1 스템-루프 구조와 C 및 C' 영역으로 형성된 제2 스템-루프 구조를 포함하는 영역에 단일 스템과 2개의 루프를 포함하는, ceDNA 벡터.
- 제1항 내지 제63항 중 어느 한 항에 있어서, ITR 중 하나 또는 둘 모두가 통상적으로 B 및 B' 영역으로 형성된 제1 스템-루프 구조와 C 및 C' 영역으로 형성된 제2 스템-루프 구조를 포함하는 영역에 단일 스템과 단일 루프를 포함하는, ceDNA 벡터.
- 제1항 내지 제64항 중 어느 한 항에 있어서, ITR이 서로에 대해 역전될 때, 두 개의 ITR이 모두 전반적인 3차원 대칭을 이루는 방식으로 변경되는, ceDNA 벡터.
- 제1항 내지 제65항 중 어느 한 항에 있어서, 서열번호 382, 서열번호 383, 서열번호 384, 서열번호 385 또는 서열번호 386과 적어도 90% 동일한 핵산 서열을 포함하는 ceDNA 벡터.
- 제1항 내지 제65항 중 어느 한 항에 있어서, 서열번호 382, 서열번호 383, 서열번호 384, 서열번호 385 또는 서열번호 386과 적어도 95% 동일한 핵산 서열을 포함하는 ceDNA 벡터.
- 제1항 내지 제65항 중 어느 한 항에 있어서, 서열번호 382, 서열번호 383, 서열번호 384, 서열번호 385 또는 서열번호 386과 적어도 96% 동일한 핵산 서열을 포함하는 ceDNA 벡터.
- 제1항 내지 제65항 중 어느 한 항에 있어서, 서열번호 382, 서열번호 383, 서열번호 384, 서열번호 385 또는 서열번호 386과 적어도 97% 동일한 핵산 서열을 포함하는 ceDNA 벡터.
- 제1항 내지 제65항 중 어느 한 항에 있어서, 서열번호 382, 서열번호 383, 서열번호 384, 서열번호 385 또는 서열번호 386과 적어도 98% 동일한 핵산 서열을 포함하는 ceDNA 벡터.
- 제1항 내지 제65항 중 어느 한 항에 있어서, 서열번호 382, 서열번호 383, 서열번호 384, 서열번호 385 또는 서열번호 386과 적어도 99% 동일한 핵산 서열을 포함하는 ceDNA 벡터.
- 세포를 제1항 내지 제71항 중 어느 한 항의 ceDNA 벡터와 접촉시키는 단계를 포함하는, 세포에서 PAH 단백질을 발현시키는 방법.
- 제72항에 있어서, 세포가 광수용체 세포 또는 망막색소상피(RPE: retinal pigment epithelial) 세포인, 방법.
- 제72항 또는 제73항에 있어서, 세포가 시험관내 또는 생체내에 존재하는, 방법.
- 제1항 내지 제71항 중 어느 한 항의 ceDNA 벡터를 페닐케톤뇨증(PKU)을 앓고 있는 대상에게 투여하는 단계를 포함하는, 페닐케톤뇨증(PKU)을 앓고 있는 대상을 치료하는 방법.
- 제75항에 있어서, 적어도 하나의 PAH 단백질을 인코딩하는 적어도 하나의 핵산 서열이 표 1A에 제시된 서열 중 임의의 것과 적어도 90% 동일성을 갖는 서열에서 선택되는, 방법.
- 제72항 내지 제76항 중 어느 한 항에 있어서, 대상이 투여 전 대상의 혈청 페닐알라닌 수준과 비교하여 혈청 페닐알라닌 수준의 적어도 약 50% 감소를 나타내는, 방법.
- 제72항 내지 제77항 중 어느 한 항에 있어서, 대상이 투여 전 PAH 활성 수준과 비교하여 투여 후 PAH 활성의 적어도 약 10%의 증가를 나타내는, 방법.
- 제72항 내지 제78항 중 어느 한 항에 있어서, ceDNA 벡터가 지질 나노입자로 제형화된 것인, 방법.
- 제72항 내지 제79항 중 어느 한 항에 있어서, ceDNA 벡터가 정맥내로 투여되는, 방법.
- 제72항 내지 제79항 중 어느 한 항에 있어서, ceDNA 벡터가 근육내로 투여되는, 방법.
- 제72항 내지 제79항 중 어느 한 항에 있어서, ceDNA 벡터가 주입을 통해 투여되는, 방법.
- 제1항 내지 제71항 중 어느 한 항의 ceDNA 벡터를 포함하는 약학적 조성물.
- 제1항 내지 제71항 중 어느 한 항의 ceDNA 벡터와 지질을 포함하는 조성물.
- 제84항에 있어서, 지질이 지질 나노입자(LNP)인, 조성물.
- 제1항 내지 제71항 중 어느 한 항의 ceDNA 벡터, 제83항의 약학적 조성물, 또는 제84항 또는 제85항의 조성물을 포함하는 키트.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063078954P | 2020-09-16 | 2020-09-16 | |
US63/078,954 | 2020-09-16 | ||
PCT/US2021/050695 WO2022061000A1 (en) | 2020-09-16 | 2021-09-16 | Closed-ended dna vectors and uses thereof for expressing phenylalanine hydroxylase (pah) |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230066615A true KR20230066615A (ko) | 2023-05-16 |
Family
ID=80775707
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237012572A KR20230066615A (ko) | 2020-09-16 | 2021-09-16 | 폐쇄형 dna 벡터 및 페닐알라닌 히드록실라아제(pah) 발현을 위한 이의 용도 |
Country Status (10)
Country | Link |
---|---|
US (1) | US20240026374A1 (ko) |
EP (1) | EP4214309A1 (ko) |
JP (1) | JP2023542131A (ko) |
KR (1) | KR20230066615A (ko) |
CN (1) | CN116507730A (ko) |
AU (1) | AU2021345187A1 (ko) |
CA (1) | CA3191765A1 (ko) |
IL (1) | IL301196A (ko) |
MX (1) | MX2023003019A (ko) |
WO (1) | WO2022061000A1 (ko) |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3270944B1 (en) * | 2015-03-17 | 2019-10-23 | Vrije Universiteit Brussel | Optimized liver-specific expression systems for fviii and fix |
US11382941B2 (en) * | 2016-12-30 | 2022-07-12 | The Trustees Of The University Of Pennsylvania | Gene therapy for treating Phenylketonuria |
CN111132699A (zh) * | 2017-09-08 | 2020-05-08 | 世代生物公司 | 修饰的封闭端dna(cedna) |
CA3133330A1 (en) * | 2019-03-13 | 2020-09-17 | Generation Bio Co. | Non-viral dna vectors and uses thereof for expressing phenylalanine hydroxylase (pah) therapeutics |
BR112021024124A2 (pt) * | 2019-05-31 | 2022-01-11 | American Gene Tech Int Inc | Expressão otimizada de fenilalanina hidroxilase |
-
2021
- 2021-09-16 CA CA3191765A patent/CA3191765A1/en active Pending
- 2021-09-16 JP JP2023517283A patent/JP2023542131A/ja active Pending
- 2021-09-16 MX MX2023003019A patent/MX2023003019A/es unknown
- 2021-09-16 AU AU2021345187A patent/AU2021345187A1/en active Pending
- 2021-09-16 EP EP21870225.6A patent/EP4214309A1/en active Pending
- 2021-09-16 WO PCT/US2021/050695 patent/WO2022061000A1/en active Application Filing
- 2021-09-16 CN CN202180076781.0A patent/CN116507730A/zh active Pending
- 2021-09-16 IL IL301196A patent/IL301196A/en unknown
- 2021-09-16 KR KR1020237012572A patent/KR20230066615A/ko unknown
- 2021-09-16 US US18/025,926 patent/US20240026374A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
AU2021345187A1 (en) | 2023-04-06 |
IL301196A (en) | 2023-05-01 |
EP4214309A1 (en) | 2023-07-26 |
JP2023542131A (ja) | 2023-10-05 |
CN116507730A (zh) | 2023-07-28 |
CA3191765A1 (en) | 2022-03-24 |
MX2023003019A (es) | 2023-05-08 |
US20240026374A1 (en) | 2024-01-25 |
WO2022061000A1 (en) | 2022-03-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102482890B1 (ko) | 아포지질단백질 (a) 발현을 조절하는 조성물 및 방법 | |
CA2909733C (en) | Effective delivery of large genes by dual aav vectors | |
US8404658B2 (en) | RNA interference for the treatment of heart failure | |
JP7416451B2 (ja) | CRISPR-Casによる標的化された核内RNA切断及びポリアデニル化 | |
JP2019519221A (ja) | 加齢関連疾患及び症状の遺伝子治療法 | |
BR112014004895B1 (pt) | Oligonucleotídeos antissentido para o tratamento de amaurose congênita de leber | |
KR20210149702A (ko) | 비바이러스성 dna 벡터 및 페닐알라닌 히드록실라아제(pah) 치료제 발현을 위한 이의 용도 | |
KR20210119416A (ko) | 폐쇄-말단 dna (cedna), 및 유전자 또는 핵산 치료 관련 면역 반응을 감소시키는 방법에서의 이의 용도 | |
CN111818942A (zh) | 非病毒dna载体以及其用于产生抗体和融合蛋白的用途 | |
KR20210133993A (ko) | Rho-연관 상염색체-우성 망막색소변성증(adrp)을 치료하기 위한 crispr/rna-가이드 뉴클레아제-관련 방법 및 조성물 | |
KR20210127935A (ko) | 폐쇄형 DNA(ceDNA) 생산에서의 Rep 단백질 활성의 변형 | |
KR20200124250A (ko) | 폐쇄-말단 dna (cedna) 벡터를 사용한 이식유전자의 제어된 발현 | |
CN112639108A (zh) | 治疗非综合征性感觉神经性听力损失的方法 | |
CN116113697A (zh) | 用于治疗癫痫的方法和组合物 | |
KR20230003477A (ko) | 비-바이러스성 dna 벡터 및 인자 ix 치료제 발현을 위한 이의 용도 | |
KR20230129162A (ko) | 제1형 근긴장성 이영양증을 치료하기 위한 rna 표적화조성물 및 방법 | |
CN113874513A (zh) | 非病毒dna载体及其用于表达fviii治疗剂的用途 | |
KR20220007601A (ko) | 치료제 투여를 위한 조성물 및 방법 | |
KR20230003478A (ko) | 비-바이러스성 dna 벡터 및 고셰 치료제 발현을 위한 이의 용도 | |
KR20230066615A (ko) | 폐쇄형 dna 벡터 및 페닐알라닌 히드록실라아제(pah) 발현을 위한 이의 용도 | |
RU2814137C2 (ru) | Невирусные днк-векторы и варианты их применения для экспрессии терапевтического средства на основе фенилаланингидроксилазы (pah) | |
RU2812850C2 (ru) | Модуляция активности rep белка при получении днк с замкнутыми концами (зкднк) | |
CN113755524B (zh) | 用于治疗脊髓性肌萎缩的腺相关病毒载体及其用途 | |
KR20230066453A (ko) | 비바이러스성 dna 벡터 및 fviii 치료제 발현을 위한 이의 용도 | |
RU2811724C2 (ru) | РЕДАКТИРОВАНИЕ ГЕНОВ С ИСПОЛЬЗОВАНИЕМ МОДИФИЦИРОВАННОЙ ДНК С ЗАМКНУТЫМИ КОНЦАМИ (зкДНК) |