KR20230015914A - 캡핑 화합물, 조성물 및 이의 사용 방법 - Google Patents
캡핑 화합물, 조성물 및 이의 사용 방법 Download PDFInfo
- Publication number
- KR20230015914A KR20230015914A KR1020227040442A KR20227040442A KR20230015914A KR 20230015914 A KR20230015914 A KR 20230015914A KR 1020227040442 A KR1020227040442 A KR 1020227040442A KR 20227040442 A KR20227040442 A KR 20227040442A KR 20230015914 A KR20230015914 A KR 20230015914A
- Authority
- KR
- South Korea
- Prior art keywords
- sequence
- nucleic acid
- acid sequence
- encoding nucleic
- epitope
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 265
- 239000000203 mixture Substances 0.000 title claims abstract description 190
- 150000001875 compounds Chemical class 0.000 title claims description 71
- 125000003729 nucleotide group Chemical group 0.000 claims abstract description 289
- 239000002773 nucleotide Substances 0.000 claims abstract description 255
- 229960005486 vaccine Drugs 0.000 claims abstract description 47
- 150000007523 nucleic acids Chemical group 0.000 claims description 506
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 400
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 267
- 108091007433 antigens Proteins 0.000 claims description 162
- 102000036639 antigens Human genes 0.000 claims description 162
- 239000000427 antigen Substances 0.000 claims description 161
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 161
- 239000013598 vector Substances 0.000 claims description 127
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 109
- 230000014509 gene expression Effects 0.000 claims description 106
- 102000043129 MHC class I family Human genes 0.000 claims description 99
- 108091054437 MHC class I family Proteins 0.000 claims description 99
- 210000004027 cell Anatomy 0.000 claims description 97
- 239000002777 nucleoside Substances 0.000 claims description 96
- 150000003833 nucleoside derivatives Chemical class 0.000 claims description 93
- 108091034057 RNA (poly(A)) Proteins 0.000 claims description 86
- 108091054438 MHC class II family Proteins 0.000 claims description 85
- 241000700605 Viruses Species 0.000 claims description 83
- 102000043131 MHC class II family Human genes 0.000 claims description 82
- 208000015181 infectious disease Diseases 0.000 claims description 81
- 235000001014 amino acid Nutrition 0.000 claims description 74
- 108090000623 proteins and genes Proteins 0.000 claims description 70
- 235000000346 sugar Nutrition 0.000 claims description 69
- 108091027544 Subgenomic mRNA Proteins 0.000 claims description 66
- 229920001184 polypeptide Polymers 0.000 claims description 66
- 206010028980 Neoplasm Diseases 0.000 claims description 60
- 108091034117 Oligonucleotide Proteins 0.000 claims description 59
- 150000001413 amino acids Chemical class 0.000 claims description 59
- 230000000977 initiatory effect Effects 0.000 claims description 58
- 241000710929 Alphavirus Species 0.000 claims description 55
- 244000052769 pathogen Species 0.000 claims description 53
- 102000004169 proteins and genes Human genes 0.000 claims description 50
- 235000018102 proteins Nutrition 0.000 claims description 48
- 208000035473 Communicable disease Diseases 0.000 claims description 46
- 238000013518 transcription Methods 0.000 claims description 46
- 230000035897 transcription Effects 0.000 claims description 46
- 150000003839 salts Chemical class 0.000 claims description 43
- 108020004414 DNA Proteins 0.000 claims description 42
- 108091033319 polynucleotide Proteins 0.000 claims description 39
- 102000040430 polynucleotide Human genes 0.000 claims description 39
- 239000002157 polynucleotide Substances 0.000 claims description 39
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 claims description 36
- 230000004048 modification Effects 0.000 claims description 35
- 238000012986 modification Methods 0.000 claims description 35
- 125000000548 ribosyl group Chemical group C1([C@H](O)[C@H](O)[C@H](O1)CO)* 0.000 claims description 34
- 241000710959 Venezuelan equine encephalitis virus Species 0.000 claims description 33
- 241001493065 dsRNA viruses Species 0.000 claims description 33
- 238000012163 sequencing technique Methods 0.000 claims description 33
- 150000002632 lipids Chemical class 0.000 claims description 32
- 108020004999 messenger RNA Proteins 0.000 claims description 31
- 210000004881 tumor cell Anatomy 0.000 claims description 29
- 241000282414 Homo sapiens Species 0.000 claims description 26
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 claims description 26
- 150000003838 adenosines Chemical class 0.000 claims description 26
- 201000011510 cancer Diseases 0.000 claims description 26
- 239000002671 adjuvant Substances 0.000 claims description 24
- 230000028993 immune response Effects 0.000 claims description 24
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 claims description 23
- 210000003719 b-lymphocyte Anatomy 0.000 claims description 23
- -1 amino lipid Chemical class 0.000 claims description 22
- 230000001717 pathogenic effect Effects 0.000 claims description 21
- 230000004936 stimulating effect Effects 0.000 claims description 21
- 239000012634 fragment Substances 0.000 claims description 20
- 229910052736 halogen Inorganic materials 0.000 claims description 20
- 150000002367 halogens Chemical class 0.000 claims description 20
- 238000007918 intramuscular administration Methods 0.000 claims description 19
- 210000000612 antigen-presenting cell Anatomy 0.000 claims description 18
- 230000036755 cellular response Effects 0.000 claims description 18
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 claims description 18
- 210000004443 dendritic cell Anatomy 0.000 claims description 18
- 230000001404 mediated effect Effects 0.000 claims description 18
- 210000001519 tissue Anatomy 0.000 claims description 18
- 108700028369 Alleles Proteins 0.000 claims description 17
- 206010066919 Epidemic polyarthritis Diseases 0.000 claims description 17
- 206010037660 Pyrexia Diseases 0.000 claims description 17
- 241000710942 Ross River virus Species 0.000 claims description 17
- 241000710960 Sindbis virus Species 0.000 claims description 17
- 210000001744 T-lymphocyte Anatomy 0.000 claims description 17
- 108090000848 Ubiquitin Proteins 0.000 claims description 17
- 102000044159 Ubiquitin Human genes 0.000 claims description 17
- 230000027455 binding Effects 0.000 claims description 17
- 229910052739 hydrogen Inorganic materials 0.000 claims description 17
- 239000001257 hydrogen Substances 0.000 claims description 17
- 241000178568 Aura virus Species 0.000 claims description 16
- 241000608292 Mayaro virus Species 0.000 claims description 16
- 101710172711 Structural protein Proteins 0.000 claims description 16
- 230000001965 increasing effect Effects 0.000 claims description 16
- 238000012217 deletion Methods 0.000 claims description 15
- 230000037430 deletion Effects 0.000 claims description 15
- 102000039446 nucleic acids Human genes 0.000 claims description 15
- 108020004707 nucleic acids Proteins 0.000 claims description 15
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 claims description 14
- 238000004519 manufacturing process Methods 0.000 claims description 14
- 230000008685 targeting Effects 0.000 claims description 14
- 229930024421 Adenine Natural products 0.000 claims description 13
- 108700039691 Genetic Promoter Regions Proteins 0.000 claims description 13
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 claims description 13
- 102000004245 Proteasome Endopeptidase Complex Human genes 0.000 claims description 13
- 108090000708 Proteasome Endopeptidase Complex Proteins 0.000 claims description 13
- 229960000643 adenine Drugs 0.000 claims description 13
- 230000003321 amplification Effects 0.000 claims description 13
- 230000001580 bacterial effect Effects 0.000 claims description 13
- 208000002154 non-small cell lung carcinoma Diseases 0.000 claims description 13
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 13
- 229910052760 oxygen Inorganic materials 0.000 claims description 13
- 244000045947 parasite Species 0.000 claims description 13
- 238000007920 subcutaneous administration Methods 0.000 claims description 13
- 229960000814 tetanus toxoid Drugs 0.000 claims description 13
- 208000029729 tumor suppressor gene on chromosome 11 Diseases 0.000 claims description 13
- 229940035893 uracil Drugs 0.000 claims description 13
- 101710094648 Coat protein Proteins 0.000 claims description 12
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 claims description 12
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 claims description 12
- 102000014944 Lysosome-Associated Membrane Glycoproteins Human genes 0.000 claims description 12
- 108010064171 Lysosome-Associated Membrane Glycoproteins Proteins 0.000 claims description 12
- 230000004075 alteration Effects 0.000 claims description 12
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 claims description 12
- 238000000338 in vitro Methods 0.000 claims description 12
- 229910052757 nitrogen Inorganic materials 0.000 claims description 12
- 238000006467 substitution reaction Methods 0.000 claims description 12
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 claims description 12
- 229940045145 uridine Drugs 0.000 claims description 12
- 102000004127 Cytokines Human genes 0.000 claims description 11
- 108090000695 Cytokines Proteins 0.000 claims description 11
- 230000003053 immunization Effects 0.000 claims description 11
- 229910052717 sulfur Inorganic materials 0.000 claims description 11
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 claims description 10
- 229910052731 fluorine Inorganic materials 0.000 claims description 10
- 238000001990 intravenous administration Methods 0.000 claims description 10
- 239000002105 nanoparticle Substances 0.000 claims description 10
- 230000008569 process Effects 0.000 claims description 10
- PXGOKWXKJXAPGV-UHFFFAOYSA-N Fluorine Chemical compound FF PXGOKWXKJXAPGV-UHFFFAOYSA-N 0.000 claims description 9
- NRLNQCOGCKAESA-KWXKLSQISA-N [(6z,9z,28z,31z)-heptatriaconta-6,9,28,31-tetraen-19-yl] 4-(dimethylamino)butanoate Chemical compound CCCCC\C=C/C\C=C/CCCCCCCCC(OC(=O)CCCN(C)C)CCCCCCCC\C=C/C\C=C/CCCCC NRLNQCOGCKAESA-KWXKLSQISA-N 0.000 claims description 9
- 125000000539 amino acid group Chemical group 0.000 claims description 9
- 210000000234 capsid Anatomy 0.000 claims description 9
- 235000012000 cholesterol Nutrition 0.000 claims description 9
- 239000011737 fluorine Substances 0.000 claims description 9
- 230000002538 fungal effect Effects 0.000 claims description 9
- 230000001939 inductive effect Effects 0.000 claims description 9
- 201000008129 pancreatic ductal adenocarcinoma Diseases 0.000 claims description 9
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 claims description 9
- 238000012545 processing Methods 0.000 claims description 9
- 230000002829 reductive effect Effects 0.000 claims description 9
- 239000001226 triphosphate Substances 0.000 claims description 9
- 108010019670 Chimeric Antigen Receptors Proteins 0.000 claims description 8
- 229940123611 Genome editing Drugs 0.000 claims description 8
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 claims description 8
- 108700026244 Open Reading Frames Proteins 0.000 claims description 8
- 108010001267 Protein Subunits Proteins 0.000 claims description 8
- 102000002067 Protein Subunits Human genes 0.000 claims description 8
- 238000012228 RNA interference-mediated gene silencing Methods 0.000 claims description 8
- 208000036142 Viral infection Diseases 0.000 claims description 8
- 235000004279 alanine Nutrition 0.000 claims description 8
- 230000009368 gene silencing by RNA Effects 0.000 claims description 8
- 238000010362 genome editing Methods 0.000 claims description 8
- 238000004949 mass spectrometry Methods 0.000 claims description 8
- 238000007481 next generation sequencing Methods 0.000 claims description 8
- 230000032258 transport Effects 0.000 claims description 8
- 108020003589 5' Untranslated Regions Proteins 0.000 claims description 7
- 239000002126 C01EB10 - Adenosine Substances 0.000 claims description 7
- 206010009944 Colon cancer Diseases 0.000 claims description 7
- 108700009124 Transcription Initiation Site Proteins 0.000 claims description 7
- 229960005305 adenosine Drugs 0.000 claims description 7
- 108020001580 protein domains Proteins 0.000 claims description 7
- 230000009385 viral infection Effects 0.000 claims description 7
- 201000005505 Measles Diseases 0.000 claims description 6
- 230000006472 autoimmune response Effects 0.000 claims description 6
- 201000006972 gastroesophageal adenocarcinoma Diseases 0.000 claims description 6
- 238000003780 insertion Methods 0.000 claims description 6
- 230000037431 insertion Effects 0.000 claims description 6
- 238000007913 intrathecal administration Methods 0.000 claims description 6
- 150000008105 phosphatidylcholines Chemical class 0.000 claims description 6
- 235000011178 triphosphate Nutrition 0.000 claims description 6
- 241000710831 Flavivirus Species 0.000 claims description 5
- 206010017533 Fungal infection Diseases 0.000 claims description 5
- 101710128560 Initiator protein NS1 Proteins 0.000 claims description 5
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 claims description 5
- 241000712079 Measles morbillivirus Species 0.000 claims description 5
- 101710144127 Non-structural protein 1 Proteins 0.000 claims description 5
- 101710163270 Nuclease Proteins 0.000 claims description 5
- 101800001758 RNA-directed RNA polymerase nsP4 Proteins 0.000 claims description 5
- 108091008874 T cell receptors Proteins 0.000 claims description 5
- 102000016266 T-Cell Antigen Receptors Human genes 0.000 claims description 5
- 238000013459 approach Methods 0.000 claims description 5
- 230000005847 immunogenicity Effects 0.000 claims description 5
- 201000001441 melanoma Diseases 0.000 claims description 5
- 230000008488 polyadenylation Effects 0.000 claims description 5
- 230000037452 priming Effects 0.000 claims description 5
- 208000031261 Acute myeloid leukaemia Diseases 0.000 claims description 4
- 208000010839 B-cell chronic lymphocytic leukemia Diseases 0.000 claims description 4
- 208000003950 B-cell lymphoma Diseases 0.000 claims description 4
- 208000032791 BCR-ABL1 positive chronic myelogenous leukemia Diseases 0.000 claims description 4
- 206010005003 Bladder cancer Diseases 0.000 claims description 4
- 208000003174 Brain Neoplasms Diseases 0.000 claims description 4
- 206010006187 Breast cancer Diseases 0.000 claims description 4
- 208000026310 Breast neoplasm Diseases 0.000 claims description 4
- 208000010833 Chronic myeloid leukaemia Diseases 0.000 claims description 4
- 108091035707 Consensus sequence Proteins 0.000 claims description 4
- 208000008839 Kidney Neoplasms Diseases 0.000 claims description 4
- 206010058467 Lung neoplasm malignant Diseases 0.000 claims description 4
- 208000031422 Lymphocytic Chronic B-Cell Leukemia Diseases 0.000 claims description 4
- 208000033761 Myelogenous Chronic BCR-ABL Positive Leukemia Diseases 0.000 claims description 4
- 208000033776 Myeloid Acute Leukemia Diseases 0.000 claims description 4
- 125000001429 N-terminal alpha-amino-acid group Chemical group 0.000 claims description 4
- 206010033128 Ovarian cancer Diseases 0.000 claims description 4
- 206010061535 Ovarian neoplasm Diseases 0.000 claims description 4
- 241000282577 Pan troglodytes Species 0.000 claims description 4
- 206010061902 Pancreatic neoplasm Diseases 0.000 claims description 4
- 206010060862 Prostate cancer Diseases 0.000 claims description 4
- 208000000236 Prostatic Neoplasms Diseases 0.000 claims description 4
- 108010076504 Protein Sorting Signals Proteins 0.000 claims description 4
- 206010038389 Renal cancer Diseases 0.000 claims description 4
- 101100273253 Rhizopus niveus RNAP gene Proteins 0.000 claims description 4
- 206010041067 Small cell lung cancer Diseases 0.000 claims description 4
- 208000005718 Stomach Neoplasms Diseases 0.000 claims description 4
- 208000000389 T-cell leukemia Diseases 0.000 claims description 4
- 208000024313 Testicular Neoplasms Diseases 0.000 claims description 4
- 206010057644 Testis cancer Diseases 0.000 claims description 4
- 208000007097 Urinary Bladder Neoplasms Diseases 0.000 claims description 4
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 claims description 4
- 208000032852 chronic lymphocytic leukemia Diseases 0.000 claims description 4
- 208000029742 colonic neoplasm Diseases 0.000 claims description 4
- 206010017758 gastric cancer Diseases 0.000 claims description 4
- 125000003630 glycyl group Chemical group [H]N([H])C([H])([H])C(*)=O 0.000 claims description 4
- 201000010536 head and neck cancer Diseases 0.000 claims description 4
- 208000014829 head and neck neoplasm Diseases 0.000 claims description 4
- 230000005764 inhibitory process Effects 0.000 claims description 4
- 201000010982 kidney cancer Diseases 0.000 claims description 4
- 201000005202 lung cancer Diseases 0.000 claims description 4
- 208000020816 lung neoplasm Diseases 0.000 claims description 4
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 claims description 4
- 210000004962 mammalian cell Anatomy 0.000 claims description 4
- 201000002528 pancreatic cancer Diseases 0.000 claims description 4
- 208000008443 pancreatic carcinoma Diseases 0.000 claims description 4
- 230000002093 peripheral effect Effects 0.000 claims description 4
- 208000000587 small cell lung carcinoma Diseases 0.000 claims description 4
- 201000011549 stomach cancer Diseases 0.000 claims description 4
- 201000003120 testicular cancer Diseases 0.000 claims description 4
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 claims description 4
- 235000002374 tyrosine Nutrition 0.000 claims description 4
- 201000005112 urinary bladder cancer Diseases 0.000 claims description 4
- 125000001433 C-terminal amino-acid group Chemical group 0.000 claims description 3
- 208000001333 Colorectal Neoplasms Diseases 0.000 claims description 3
- 108010065805 Interleukin-12 Proteins 0.000 claims description 3
- 108091092878 Microsatellite Proteins 0.000 claims description 3
- 208000031888 Mycoses Diseases 0.000 claims description 3
- 230000003362 replicative effect Effects 0.000 claims description 3
- 208000035143 Bacterial infection Diseases 0.000 claims description 2
- 208000031886 HIV Infections Diseases 0.000 claims description 2
- 208000037357 HIV infectious disease Diseases 0.000 claims description 2
- 108090000172 Interleukin-15 Proteins 0.000 claims description 2
- 108010002586 Interleukin-7 Proteins 0.000 claims description 2
- 208000022362 bacterial infectious disease Diseases 0.000 claims description 2
- 208000033519 human immunodeficiency virus infectious disease Diseases 0.000 claims description 2
- 108010074108 interleukin-21 Proteins 0.000 claims description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 2
- ZMANZCXQSJIPKH-UHFFFAOYSA-N Triethylamine Chemical compound CCN(CC)CC ZMANZCXQSJIPKH-UHFFFAOYSA-N 0.000 claims 3
- 108010044091 Globulins Proteins 0.000 claims 2
- 102000006395 Globulins Human genes 0.000 claims 2
- 108091036066 Three prime untranslated region Proteins 0.000 claims 2
- WTJKGGKOPKCXLL-RRHRGVEJSA-N phosphatidylcholine Chemical compound CCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCCCCCCC=CCCCCCCCC WTJKGGKOPKCXLL-RRHRGVEJSA-N 0.000 claims 2
- QAEDZJGFFMLHHQ-UHFFFAOYSA-N trifluoroacetic anhydride Chemical compound FC(F)(F)C(=O)OC(=O)C(F)(F)F QAEDZJGFFMLHHQ-UHFFFAOYSA-N 0.000 claims 2
- 108700026220 vif Genes Proteins 0.000 claims 2
- MCTWTZJPVLRJOU-UHFFFAOYSA-N 1-methyl-1H-imidazole Chemical compound CN1C=CN=C1 MCTWTZJPVLRJOU-UHFFFAOYSA-N 0.000 claims 1
- 208000024893 Acute lymphoblastic leukemia Diseases 0.000 claims 1
- 208000014697 Acute lymphocytic leukaemia Diseases 0.000 claims 1
- 108010002350 Interleukin-2 Proteins 0.000 claims 1
- 208000006664 Precursor Cell Lymphoblastic Leukemia-Lymphoma Diseases 0.000 claims 1
- KGNDCEVUMONOKF-UGPLYTSKSA-N benzyl n-[(2r)-1-[(2s,4r)-2-[[(2s)-6-amino-1-(1,3-benzoxazol-2-yl)-1,1-dihydroxyhexan-2-yl]carbamoyl]-4-[(4-methylphenyl)methoxy]pyrrolidin-1-yl]-1-oxo-4-phenylbutan-2-yl]carbamate Chemical compound C1=CC(C)=CC=C1CO[C@H]1CN(C(=O)[C@@H](CCC=2C=CC=CC=2)NC(=O)OCC=2C=CC=CC=2)[C@H](C(=O)N[C@@H](CCCCN)C(O)(O)C=2OC3=CC=CC=C3N=2)C1 KGNDCEVUMONOKF-UGPLYTSKSA-N 0.000 claims 1
- 229940125833 compound 23 Drugs 0.000 claims 1
- 244000145841 kine Species 0.000 claims 1
- LMBFAGIMSUYTBN-MPZNNTNKSA-N teixobactin Chemical compound C([C@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)N[C@H](CCC(N)=O)C(=O)N[C@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)N[C@H]1C(N[C@@H](C)C(=O)N[C@@H](C[C@@H]2NC(=N)NC2)C(=O)N[C@H](C(=O)O[C@H]1C)[C@@H](C)CC)=O)NC)C1=CC=CC=C1 LMBFAGIMSUYTBN-MPZNNTNKSA-N 0.000 claims 1
- 125000005647 linker group Chemical group 0.000 description 88
- 235000002639 sodium chloride Nutrition 0.000 description 34
- 239000013615 primer Substances 0.000 description 29
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 23
- 230000000890 antigenic effect Effects 0.000 description 21
- 125000001931 aliphatic group Chemical group 0.000 description 18
- 125000003118 aryl group Chemical group 0.000 description 18
- IJGRMHOSHXDMSA-UHFFFAOYSA-N nitrogen Substances N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 18
- 230000015572 biosynthetic process Effects 0.000 description 17
- 239000013604 expression vector Substances 0.000 description 17
- 238000003786 synthesis reaction Methods 0.000 description 16
- 230000005867 T cell response Effects 0.000 description 15
- 229920006395 saturated elastomer Polymers 0.000 description 14
- 125000001424 substituent group Chemical group 0.000 description 14
- 201000010099 disease Diseases 0.000 description 12
- 230000002163 immunogen Effects 0.000 description 12
- 239000002585 base Substances 0.000 description 11
- 241000725303 Human immunodeficiency virus Species 0.000 description 10
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical group [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 10
- 208000035475 disorder Diseases 0.000 description 10
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 10
- 239000001301 oxygen Chemical group 0.000 description 10
- 229920001223 polyethylene glycol Polymers 0.000 description 10
- 230000003612 virological effect Effects 0.000 description 10
- 239000003155 DNA primer Substances 0.000 description 9
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical group C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 9
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical group [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 9
- 210000001151 cytotoxic T lymphocyte Anatomy 0.000 description 9
- 125000005842 heteroatom Chemical group 0.000 description 9
- 238000002649 immunization Methods 0.000 description 9
- 230000004044 response Effects 0.000 description 9
- 208000024891 symptom Diseases 0.000 description 9
- 241000701022 Cytomegalovirus Species 0.000 description 8
- 239000002202 Polyethylene glycol Substances 0.000 description 8
- 238000006243 chemical reaction Methods 0.000 description 8
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 8
- 239000003814 drug Substances 0.000 description 8
- 230000002458 infectious effect Effects 0.000 description 8
- 210000002966 serum Anatomy 0.000 description 8
- 125000006850 spacer group Chemical group 0.000 description 8
- 239000011593 sulfur Chemical group 0.000 description 8
- 241000711573 Coronaviridae Species 0.000 description 7
- 241000282412 Homo Species 0.000 description 7
- 241000713311 Simian immunodeficiency virus Species 0.000 description 7
- 125000000217 alkyl group Chemical group 0.000 description 7
- 230000008901 benefit Effects 0.000 description 7
- 238000003776 cleavage reaction Methods 0.000 description 7
- 230000001105 regulatory effect Effects 0.000 description 7
- 230000007017 scission Effects 0.000 description 7
- 239000013545 self-assembled monolayer Substances 0.000 description 7
- 229940124597 therapeutic agent Drugs 0.000 description 7
- 238000011282 treatment Methods 0.000 description 7
- 239000003981 vehicle Substances 0.000 description 7
- 239000013603 viral vector Substances 0.000 description 7
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 210000002443 helper t lymphocyte Anatomy 0.000 description 6
- 238000009396 hybridization Methods 0.000 description 6
- 230000036039 immunity Effects 0.000 description 6
- 230000001976 improved effect Effects 0.000 description 6
- 230000000670 limiting effect Effects 0.000 description 6
- 239000000463 material Substances 0.000 description 6
- 230000035772 mutation Effects 0.000 description 6
- 230000007935 neutral effect Effects 0.000 description 6
- 238000005457 optimization Methods 0.000 description 6
- 239000002245 particle Substances 0.000 description 6
- 230000010076 replication Effects 0.000 description 6
- 239000000126 substance Substances 0.000 description 6
- 108010017213 Granulocyte-Macrophage Colony-Stimulating Factor Proteins 0.000 description 5
- 102100039620 Granulocyte-macrophage colony-stimulating factor Human genes 0.000 description 5
- 241000713666 Lentivirus Species 0.000 description 5
- 230000006819 RNA synthesis Effects 0.000 description 5
- 241000725643 Respiratory syncytial virus Species 0.000 description 5
- 206010046865 Vaccinia virus infection Diseases 0.000 description 5
- 229910052799 carbon Inorganic materials 0.000 description 5
- 238000013461 design Methods 0.000 description 5
- 125000005843 halogen group Chemical group 0.000 description 5
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 5
- 230000001124 posttranscriptional effect Effects 0.000 description 5
- 238000013519 translation Methods 0.000 description 5
- 208000007089 vaccinia Diseases 0.000 description 5
- 108020005345 3' Untranslated Regions Proteins 0.000 description 4
- 241001678559 COVID-19 virus Species 0.000 description 4
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 4
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 4
- 241000282324 Felis Species 0.000 description 4
- 108010058643 Fungal Proteins Proteins 0.000 description 4
- 241000711549 Hepacivirus C Species 0.000 description 4
- 241000701806 Human papillomavirus Species 0.000 description 4
- 108060003951 Immunoglobulin Proteins 0.000 description 4
- 101800000324 Immunoglobulin A1 protease translocator Proteins 0.000 description 4
- MUBZPKHOEPUJKR-UHFFFAOYSA-N Oxalic acid Chemical compound OC(=O)C(O)=O MUBZPKHOEPUJKR-UHFFFAOYSA-N 0.000 description 4
- 241000272534 Struthio camelus Species 0.000 description 4
- 102000002689 Toll-like receptor Human genes 0.000 description 4
- 108020000411 Toll-like receptor Proteins 0.000 description 4
- 125000003275 alpha amino acid group Chemical group 0.000 description 4
- 125000004432 carbon atom Chemical group C* 0.000 description 4
- JJWKPURADFRFRB-UHFFFAOYSA-N carbonyl sulfide Chemical compound O=C=S JJWKPURADFRFRB-UHFFFAOYSA-N 0.000 description 4
- 239000003795 chemical substances by application Substances 0.000 description 4
- 230000000295 complement effect Effects 0.000 description 4
- 125000000753 cycloalkyl group Chemical group 0.000 description 4
- 210000000805 cytoplasm Anatomy 0.000 description 4
- 229940104302 cytosine Drugs 0.000 description 4
- 231100000135 cytotoxicity Toxicity 0.000 description 4
- 230000003013 cytotoxicity Effects 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 238000009472 formulation Methods 0.000 description 4
- 229940029575 guanosine Drugs 0.000 description 4
- 150000002431 hydrogen Chemical class 0.000 description 4
- 102000018358 immunoglobulin Human genes 0.000 description 4
- QJGQUHMNIGDVPM-UHFFFAOYSA-N nitrogen group Chemical group [N] QJGQUHMNIGDVPM-UHFFFAOYSA-N 0.000 description 4
- 238000002360 preparation method Methods 0.000 description 4
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 4
- VZCYOOQTPOCHFL-UHFFFAOYSA-N trans-butenedioic acid Natural products OC(=O)C=CC(O)=O VZCYOOQTPOCHFL-UHFFFAOYSA-N 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 241000701161 unidentified adenovirus Species 0.000 description 4
- 210000002845 virion Anatomy 0.000 description 4
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 3
- 241000894006 Bacteria Species 0.000 description 3
- 102000004506 Blood Proteins Human genes 0.000 description 3
- 108010017384 Blood Proteins Proteins 0.000 description 3
- 108090000565 Capsid Proteins Proteins 0.000 description 3
- 108091026890 Coding region Proteins 0.000 description 3
- 108020004705 Codon Proteins 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 3
- 102000004961 Furin Human genes 0.000 description 3
- 108090001126 Furin Proteins 0.000 description 3
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 3
- 241000700721 Hepatitis B virus Species 0.000 description 3
- 102000018713 Histocompatibility Antigens Class II Human genes 0.000 description 3
- 108091092195 Intron Proteins 0.000 description 3
- VQAYFKKCNSOZKM-IOSLPCCCSA-N N(6)-methyladenosine Chemical compound C1=NC=2C(NC)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O VQAYFKKCNSOZKM-IOSLPCCCSA-N 0.000 description 3
- VQAYFKKCNSOZKM-UHFFFAOYSA-N NSC 29409 Natural products C1=NC=2C(NC)=NC=NC=2N1C1OC(CO)C(O)C1O VQAYFKKCNSOZKM-UHFFFAOYSA-N 0.000 description 3
- 101800000515 Non-structural protein 3 Proteins 0.000 description 3
- 241000712464 Orthomyxoviridae Species 0.000 description 3
- 229910019142 PO4 Inorganic materials 0.000 description 3
- OFOBLEOULBTSOW-UHFFFAOYSA-N Propanedioic acid Natural products OC(=O)CC(O)=O OFOBLEOULBTSOW-UHFFFAOYSA-N 0.000 description 3
- 101800000980 Protease nsP2 Proteins 0.000 description 3
- 101710149951 Protein Tat Proteins 0.000 description 3
- 108091007415 Small Cajal body-specific RNA Proteins 0.000 description 3
- 102000039471 Small Nuclear RNA Human genes 0.000 description 3
- 108020003224 Small Nucleolar RNA Proteins 0.000 description 3
- 102000042773 Small Nucleolar RNA Human genes 0.000 description 3
- 108020000999 Viral RNA Proteins 0.000 description 3
- 239000002253 acid Substances 0.000 description 3
- 229910052784 alkaline earth metal Inorganic materials 0.000 description 3
- 125000002947 alkylene group Chemical group 0.000 description 3
- 125000004429 atom Chemical group 0.000 description 3
- 125000002619 bicyclic group Chemical group 0.000 description 3
- 239000000969 carrier Substances 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 3
- 125000002091 cationic group Chemical group 0.000 description 3
- KRKNYBCHXYNGOX-UHFFFAOYSA-N citric acid Chemical compound OC(=O)CC(O)(C(O)=O)CC(O)=O KRKNYBCHXYNGOX-UHFFFAOYSA-N 0.000 description 3
- 238000010367 cloning Methods 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 239000003937 drug carrier Substances 0.000 description 3
- 239000003925 fat Substances 0.000 description 3
- 230000001900 immune effect Effects 0.000 description 3
- 206010022000 influenza Diseases 0.000 description 3
- VZCYOOQTPOCHFL-UPHRSURJSA-N maleic acid Chemical compound OC(=O)\C=C/C(O)=O VZCYOOQTPOCHFL-UPHRSURJSA-N 0.000 description 3
- 239000012528 membrane Substances 0.000 description 3
- 125000002950 monocyclic group Chemical group 0.000 description 3
- 239000002086 nanomaterial Substances 0.000 description 3
- 231100000252 nontoxic Toxicity 0.000 description 3
- 230000003000 nontoxic effect Effects 0.000 description 3
- 125000003835 nucleoside group Chemical group 0.000 description 3
- 235000021317 phosphate Nutrition 0.000 description 3
- 239000000047 product Substances 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 108091029842 small nuclear ribonucleic acid Proteins 0.000 description 3
- 230000000638 stimulation Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000001225 therapeutic effect Effects 0.000 description 3
- 230000014616 translation Effects 0.000 description 3
- 201000008827 tuberculosis Diseases 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- DRHZYJAUECRAJM-DWSYSWFDSA-N (2s,3s,4s,5r,6r)-6-[[(3s,4s,4ar,6ar,6bs,8r,8ar,12as,14ar,14br)-8a-[(2s,3r,4s,5r,6r)-3-[(2s,3r,4s,5r,6s)-5-[(2s,3r,4s,5r)-4-[(2s,3r,4r)-3,4-dihydroxy-4-(hydroxymethyl)oxolan-2-yl]oxy-3,5-dihydroxyoxan-2-yl]oxy-3,4-dihydroxy-6-methyloxan-2-yl]oxy-5-[(3s,5s, Chemical compound O([C@H]1[C@H](O)[C@H](O[C@H]([C@@H]1O[C@H]1[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO)O1)O)O[C@H]1CC[C@]2(C)[C@H]3CC=C4[C@@H]5CC(C)(C)CC[C@@]5([C@@H](C[C@@]4(C)[C@]3(C)CC[C@H]2[C@@]1(C=O)C)O)C(=O)O[C@@H]1O[C@H](C)[C@@H]([C@@H]([C@H]1O[C@H]1[C@@H]([C@H](O)[C@@H](O[C@H]2[C@@H]([C@@H](O[C@H]3[C@@H]([C@@](O)(CO)CO3)O)[C@H](O)CO2)O)[C@H](C)O1)O)O)OC(=O)C[C@@H](O)C[C@H](OC(=O)C[C@@H](O)C[C@@H]([C@@H](C)CC)O[C@H]1[C@@H]([C@@H](O)[C@H](CO)O1)O)[C@@H](C)CC)C(O)=O)[C@@H]1OC[C@@H](O)[C@H](O)[C@H]1O DRHZYJAUECRAJM-DWSYSWFDSA-N 0.000 description 2
- LKKMLIBUAXYLOY-UHFFFAOYSA-N 3-Amino-1-methyl-5H-pyrido[4,3-b]indole Chemical compound N1C2=CC=CC=C2C2=C1C=C(N)N=C2C LKKMLIBUAXYLOY-UHFFFAOYSA-N 0.000 description 2
- OGHAROSJZRTIOK-KQYNXXCUSA-O 7-methylguanosine Chemical class C1=2N=C(N)NC(=O)C=2[N+](C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OGHAROSJZRTIOK-KQYNXXCUSA-O 0.000 description 2
- 206010069754 Acquired gene mutation Diseases 0.000 description 2
- QGZKDVFQNNGYKY-UHFFFAOYSA-O Ammonium Chemical compound [NH4+] QGZKDVFQNNGYKY-UHFFFAOYSA-O 0.000 description 2
- 241000272478 Aquila Species 0.000 description 2
- 241000304886 Bacilli Species 0.000 description 2
- 241000193738 Bacillus anthracis Species 0.000 description 2
- 241000282472 Canis lupus familiaris Species 0.000 description 2
- 239000004215 Carbon black (E152) Substances 0.000 description 2
- 102100023321 Ceruloplasmin Human genes 0.000 description 2
- 241000242722 Cestoda Species 0.000 description 2
- 241001502567 Chikungunya virus Species 0.000 description 2
- 241000186227 Corynebacterium diphtheriae Species 0.000 description 2
- 241000725619 Dengue virus Species 0.000 description 2
- FEWJPZIEWOKRBE-JCYAYHJZSA-N Dextrotartaric acid Chemical compound OC(=O)[C@H](O)[C@@H](O)C(O)=O FEWJPZIEWOKRBE-JCYAYHJZSA-N 0.000 description 2
- 208000006825 Eastern Equine Encephalomyelitis Diseases 0.000 description 2
- 201000005804 Eastern equine encephalitis Diseases 0.000 description 2
- 201000011001 Ebola Hemorrhagic Fever Diseases 0.000 description 2
- 206010014587 Encephalitis eastern equine Diseases 0.000 description 2
- 208000004232 Enteritis Diseases 0.000 description 2
- 241000709661 Enterovirus Species 0.000 description 2
- 241000713800 Feline immunodeficiency virus Species 0.000 description 2
- 241000282326 Felis catus Species 0.000 description 2
- 241000287828 Gallus gallus Species 0.000 description 2
- 208000005577 Gastroenteritis Diseases 0.000 description 2
- 102000003886 Glycoproteins Human genes 0.000 description 2
- 108090000288 Glycoproteins Proteins 0.000 description 2
- 206010018691 Granuloma Diseases 0.000 description 2
- 108091006905 Human Serum Albumin Proteins 0.000 description 2
- 102000008100 Human Serum Albumin Human genes 0.000 description 2
- VEXZGXHMUGYJMC-UHFFFAOYSA-N Hydrochloric acid Chemical compound Cl VEXZGXHMUGYJMC-UHFFFAOYSA-N 0.000 description 2
- 101150106931 IFNG gene Proteins 0.000 description 2
- 101710125507 Integrase/recombinase Proteins 0.000 description 2
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 description 2
- 206010025323 Lymphomas Diseases 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- 241000588655 Moraxella catarrhalis Species 0.000 description 2
- 241000588650 Neisseria meningitidis Species 0.000 description 2
- 102000035195 Peptidases Human genes 0.000 description 2
- 108091005804 Peptidases Proteins 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 2
- 241000709664 Picornaviridae Species 0.000 description 2
- 241000233872 Pneumocystis carinii Species 0.000 description 2
- 101710185720 Putative ethidium bromide resistance protein Proteins 0.000 description 2
- 101150006932 RTN1 gene Proteins 0.000 description 2
- 241000702263 Reovirus sp. Species 0.000 description 2
- 241000293871 Salmonella enterica subsp. enterica serovar Typhi Species 0.000 description 2
- 241000293869 Salmonella enterica subsp. enterica serovar Typhimurium Species 0.000 description 2
- 201000003176 Severe Acute Respiratory Syndrome Diseases 0.000 description 2
- 241000607768 Shigella Species 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 241001478880 Streptobacillus moniliformis Species 0.000 description 2
- QAOWNCQODCNURD-UHFFFAOYSA-N Sulfuric acid Chemical compound OS(O)(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-N 0.000 description 2
- 241000282898 Sus scrofa Species 0.000 description 2
- 241000223997 Toxoplasma gondii Species 0.000 description 2
- 108020004566 Transfer RNA Proteins 0.000 description 2
- 108091032917 Transfer-messenger RNA Proteins 0.000 description 2
- 241000711975 Vesicular stomatitis virus Species 0.000 description 2
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 2
- 241000606834 [Haemophilus] ducreyi Species 0.000 description 2
- 150000007513 acids Chemical class 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 230000001154 acute effect Effects 0.000 description 2
- 125000003342 alkenyl group Chemical group 0.000 description 2
- 125000000129 anionic group Chemical group 0.000 description 2
- 230000002238 attenuated effect Effects 0.000 description 2
- 230000004071 biological effect Effects 0.000 description 2
- 239000012472 biological sample Substances 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 239000006227 byproduct Substances 0.000 description 2
- 125000003636 chemical group Chemical group 0.000 description 2
- 108091036078 conserved sequence Proteins 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- ZUOUZKKEUPVFJK-UHFFFAOYSA-N diphenyl Chemical compound C1=CC=CC=C1C1=CC=CC=C1 ZUOUZKKEUPVFJK-UHFFFAOYSA-N 0.000 description 2
- 206010013023 diphtheria Diseases 0.000 description 2
- MOTZDAYCYVMXPC-UHFFFAOYSA-N dodecyl hydrogen sulfate Chemical compound CCCCCCCCCCCCOS(O)(=O)=O MOTZDAYCYVMXPC-UHFFFAOYSA-N 0.000 description 2
- 229940043264 dodecyl sulfate Drugs 0.000 description 2
- 230000008030 elimination Effects 0.000 description 2
- 238000003379 elimination reaction Methods 0.000 description 2
- 238000005538 encapsulation Methods 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 108010078428 env Gene Products Proteins 0.000 description 2
- 208000024386 fungal infectious disease Diseases 0.000 description 2
- 108020001507 fusion proteins Proteins 0.000 description 2
- 102000037865 fusion proteins Human genes 0.000 description 2
- 238000001476 gene delivery Methods 0.000 description 2
- 125000005456 glyceride group Chemical group 0.000 description 2
- IPCSVZSSVZVIGE-UHFFFAOYSA-N hexadecanoic acid Chemical compound CCCCCCCCCCCCCCCC(O)=O IPCSVZSSVZVIGE-UHFFFAOYSA-N 0.000 description 2
- 229930195733 hydrocarbon Natural products 0.000 description 2
- 239000000568 immunological adjuvant Substances 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- 229910052738 indium Inorganic materials 0.000 description 2
- 239000003999 initiator Substances 0.000 description 2
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 2
- 230000003834 intracellular effect Effects 0.000 description 2
- 230000000155 isotopic effect Effects 0.000 description 2
- 208000032839 leukemia Diseases 0.000 description 2
- 201000004792 malaria Diseases 0.000 description 2
- 230000035800 maturation Effects 0.000 description 2
- 238000007069 methylation reaction Methods 0.000 description 2
- 150000007522 mineralic acids Chemical class 0.000 description 2
- 238000001823 molecular biology technique Methods 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 230000003472 neutralizing effect Effects 0.000 description 2
- 150000007524 organic acids Chemical class 0.000 description 2
- 235000005985 organic acids Nutrition 0.000 description 2
- 238000010647 peptide synthesis reaction Methods 0.000 description 2
- VLTRZXGMWDSKGL-UHFFFAOYSA-N perchloric acid Chemical compound OCl(=O)(=O)=O VLTRZXGMWDSKGL-UHFFFAOYSA-N 0.000 description 2
- 239000008194 pharmaceutical composition Substances 0.000 description 2
- 230000000144 pharmacologic effect Effects 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 2
- 239000010452 phosphate Substances 0.000 description 2
- 239000013612 plasmid Substances 0.000 description 2
- 238000003752 polymerase chain reaction Methods 0.000 description 2
- 102000005962 receptors Human genes 0.000 description 2
- 108020003175 receptors Proteins 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 229950010550 resiquimod Drugs 0.000 description 2
- BXNMTOQRYBFHNZ-UHFFFAOYSA-N resiquimod Chemical compound C1=CC=CC2=C(N(C(COCC)=N3)CC(C)(C)O)C3=C(N)N=C21 BXNMTOQRYBFHNZ-UHFFFAOYSA-N 0.000 description 2
- 230000000241 respiratory effect Effects 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 108020004418 ribosomal RNA Proteins 0.000 description 2
- BNRNXUUZRGQAQC-UHFFFAOYSA-N sildenafil Chemical compound CCCC1=NN(C)C(C(N2)=O)=C1N=C2C(C(=CC=1)OCC)=CC=1S(=O)(=O)N1CCN(C)CC1 BNRNXUUZRGQAQC-UHFFFAOYSA-N 0.000 description 2
- 230000037439 somatic mutation Effects 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- KDYFGRWQOYBRFD-UHFFFAOYSA-N succinic acid Chemical compound OC(=O)CCC(O)=O KDYFGRWQOYBRFD-UHFFFAOYSA-N 0.000 description 2
- 208000006379 syphilis Diseases 0.000 description 2
- 229940113082 thymine Drugs 0.000 description 2
- 230000005026 transcription initiation Effects 0.000 description 2
- 230000002103 transcriptional effect Effects 0.000 description 2
- 101150079396 trpC2 gene Proteins 0.000 description 2
- 229940023147 viral vector vaccine Drugs 0.000 description 2
- 239000001993 wax Substances 0.000 description 2
- LSPHULWDVZXLIL-UHFFFAOYSA-N (+/-)-Camphoric acid Chemical class CC1(C)C(C(O)=O)CCC1(C)C(O)=O LSPHULWDVZXLIL-UHFFFAOYSA-N 0.000 description 1
- FYGDTMLNYKFZSV-URKRLVJHSA-N (2s,3r,4s,5s,6r)-2-[(2r,4r,5r,6s)-4,5-dihydroxy-2-(hydroxymethyl)-6-[(2r,4r,5r,6s)-4,5,6-trihydroxy-2-(hydroxymethyl)oxan-3-yl]oxyoxan-3-yl]oxy-6-(hydroxymethyl)oxane-3,4,5-triol Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1OC1[C@@H](CO)O[C@@H](OC2[C@H](O[C@H](O)[C@H](O)[C@H]2O)CO)[C@H](O)[C@H]1O FYGDTMLNYKFZSV-URKRLVJHSA-N 0.000 description 1
- MZOFCQQQCNRIBI-VMXHOPILSA-N (3s)-4-[[(2s)-1-[[(2s)-1-[[(1s)-1-carboxy-2-hydroxyethyl]amino]-4-methyl-1-oxopentan-2-yl]amino]-5-(diaminomethylideneamino)-1-oxopentan-2-yl]amino]-3-[[2-[[(2s)-2,6-diaminohexanoyl]amino]acetyl]amino]-4-oxobutanoic acid Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN MZOFCQQQCNRIBI-VMXHOPILSA-N 0.000 description 1
- 125000006677 (C1-C3) haloalkoxy group Chemical group 0.000 description 1
- 125000004178 (C1-C4) alkyl group Chemical group 0.000 description 1
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 1
- IIZPXYDJLKNOIY-JXPKJXOSSA-N 1-palmitoyl-2-arachidonoyl-sn-glycero-3-phosphocholine Chemical compound CCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCC\C=C/C\C=C/C\C=C/C\C=C/CCCCC IIZPXYDJLKNOIY-JXPKJXOSSA-N 0.000 description 1
- 101800001779 2'-O-methyltransferase Proteins 0.000 description 1
- CHHHXKFHOYLYRE-UHFFFAOYSA-M 2,4-Hexadienoic acid, potassium salt (1:1), (2E,4E)- Chemical compound [K+].CC=CC=CC([O-])=O CHHHXKFHOYLYRE-UHFFFAOYSA-M 0.000 description 1
- KRQUFUKTQHISJB-YYADALCUSA-N 2-[(E)-N-[2-(4-chlorophenoxy)propoxy]-C-propylcarbonimidoyl]-3-hydroxy-5-(thian-3-yl)cyclohex-2-en-1-one Chemical compound CCC\C(=N/OCC(C)OC1=CC=C(Cl)C=C1)C1=C(O)CC(CC1=O)C1CCCSC1 KRQUFUKTQHISJB-YYADALCUSA-N 0.000 description 1
- IOJUJUOXKXMJNF-UHFFFAOYSA-N 2-acetyloxybenzoic acid [3-(nitrooxymethyl)phenyl] ester Chemical compound CC(=O)OC1=CC=CC=C1C(=O)OC1=CC=CC(CO[N+]([O-])=O)=C1 IOJUJUOXKXMJNF-UHFFFAOYSA-N 0.000 description 1
- LBLYYCQCTBFVLH-UHFFFAOYSA-M 2-methylbenzenesulfonate Chemical compound CC1=CC=CC=C1S([O-])(=O)=O LBLYYCQCTBFVLH-UHFFFAOYSA-M 0.000 description 1
- 229940080296 2-naphthalenesulfonate Drugs 0.000 description 1
- BMYNFMYTOJXKLE-UHFFFAOYSA-N 3-azaniumyl-2-hydroxypropanoate Chemical compound NCC(O)C(O)=O BMYNFMYTOJXKLE-UHFFFAOYSA-N 0.000 description 1
- XMIIGOLPHOKFCH-UHFFFAOYSA-M 3-phenylpropionate Chemical compound [O-]C(=O)CCC1=CC=CC=C1 XMIIGOLPHOKFCH-UHFFFAOYSA-M 0.000 description 1
- XXJWYDDUDKYVKI-UHFFFAOYSA-N 4-[(4-fluoro-2-methyl-1H-indol-5-yl)oxy]-6-methoxy-7-[3-(1-pyrrolidinyl)propoxy]quinazoline Chemical compound COC1=CC2=C(OC=3C(=C4C=C(C)NC4=CC=3)F)N=CN=C2C=C1OCCCN1CCCC1 XXJWYDDUDKYVKI-UHFFFAOYSA-N 0.000 description 1
- 208000030507 AIDS Diseases 0.000 description 1
- 108020005176 AU Rich Elements Proteins 0.000 description 1
- 241000606748 Actinobacillus pleuropneumoniae Species 0.000 description 1
- ZKHQWZAMYRWXGA-KQYNXXCUSA-N Adenosine triphosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O ZKHQWZAMYRWXGA-KQYNXXCUSA-N 0.000 description 1
- 206010067484 Adverse reaction Diseases 0.000 description 1
- 241000700587 Alphaherpesvirinae Species 0.000 description 1
- 208000004881 Amebiasis Diseases 0.000 description 1
- 206010001980 Amoebiasis Diseases 0.000 description 1
- 241000726096 Aratinga Species 0.000 description 1
- 241000712891 Arenavirus Species 0.000 description 1
- 241000244186 Ascaris Species 0.000 description 1
- 201000002909 Aspergillosis Diseases 0.000 description 1
- 208000036641 Aspergillus infections Diseases 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 241000711404 Avian avulavirus 1 Species 0.000 description 1
- 241000700663 Avipoxvirus Species 0.000 description 1
- 108020000946 Bacterial DNA Proteins 0.000 description 1
- 108020004513 Bacterial RNA Proteins 0.000 description 1
- 206010044583 Bartonella Infections Diseases 0.000 description 1
- 229920002498 Beta-glucan Polymers 0.000 description 1
- 241000335423 Blastomyces Species 0.000 description 1
- 206010005098 Blastomycosis Diseases 0.000 description 1
- 241000588832 Bordetella pertussis Species 0.000 description 1
- 241000589968 Borrelia Species 0.000 description 1
- 241000589969 Borreliella burgdorferi Species 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 1
- 241000712005 Bovine respirovirus 3 Species 0.000 description 1
- 241000589562 Brucella Species 0.000 description 1
- 206010069748 Burkholderia pseudomallei infection Diseases 0.000 description 1
- 208000011691 Burkitt lymphomas Diseases 0.000 description 1
- 210000001266 CD8-positive T-lymphocyte Anatomy 0.000 description 1
- 208000025721 COVID-19 Diseases 0.000 description 1
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 1
- 208000008889 California Encephalitis Diseases 0.000 description 1
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 1
- 241000222122 Candida albicans Species 0.000 description 1
- 206010007134 Candida infections Diseases 0.000 description 1
- 241000711506 Canine coronavirus Species 0.000 description 1
- 241000701931 Canine parvovirus Species 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 102000014914 Carrier Proteins Human genes 0.000 description 1
- 108010078791 Carrier Proteins Proteins 0.000 description 1
- 102000005600 Cathepsins Human genes 0.000 description 1
- 108010084457 Cathepsins Proteins 0.000 description 1
- 201000009182 Chikungunya Diseases 0.000 description 1
- 208000007190 Chlamydia Infections Diseases 0.000 description 1
- 241001647372 Chlamydia pneumoniae Species 0.000 description 1
- 241001647378 Chlamydia psittaci Species 0.000 description 1
- 241000606153 Chlamydia trachomatis Species 0.000 description 1
- 206010008631 Cholera Diseases 0.000 description 1
- 241000193403 Clostridium Species 0.000 description 1
- 241000193449 Clostridium tetani Species 0.000 description 1
- 241000223205 Coccidioides immitis Species 0.000 description 1
- 108700010070 Codon Usage Proteins 0.000 description 1
- 108010071942 Colony-Stimulating Factors Proteins 0.000 description 1
- 102000007644 Colony-Stimulating Factors Human genes 0.000 description 1
- 208000009802 Colorado tick fever Diseases 0.000 description 1
- 101710139375 Corneodesmosin Proteins 0.000 description 1
- 241000186216 Corynebacterium Species 0.000 description 1
- 241000709687 Coxsackievirus Species 0.000 description 1
- 241001337994 Cryptococcus <scale insect> Species 0.000 description 1
- 241000223935 Cryptosporidium Species 0.000 description 1
- CMSMOCZEIVJLDB-UHFFFAOYSA-N Cyclophosphamide Chemical compound ClCCN(CCCl)P1(=O)NCCCO1 CMSMOCZEIVJLDB-UHFFFAOYSA-N 0.000 description 1
- 206010011732 Cyst Diseases 0.000 description 1
- PCDQPRRSZKQHHS-CCXZUQQUSA-N Cytarabine Triphosphate Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 PCDQPRRSZKQHHS-CCXZUQQUSA-N 0.000 description 1
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 1
- 150000008574 D-amino acids Chemical class 0.000 description 1
- RGHNJXZEOKUKBD-SQOUGZDYSA-M D-gluconate Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@@H](O)C([O-])=O RGHNJXZEOKUKBD-SQOUGZDYSA-M 0.000 description 1
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 1
- YVGGHNCTFXOJCH-UHFFFAOYSA-N DDT Chemical compound C1=CC(Cl)=CC=C1C(C(Cl)(Cl)Cl)C1=CC=C(Cl)C=C1 YVGGHNCTFXOJCH-UHFFFAOYSA-N 0.000 description 1
- 208000001490 Dengue Diseases 0.000 description 1
- 206010012310 Dengue fever Diseases 0.000 description 1
- 241000710829 Dengue virus group Species 0.000 description 1
- 206010012504 Dermatophytosis Diseases 0.000 description 1
- YZCKVEUIGOORGS-OUBTZVSYSA-N Deuterium Chemical compound [2H] YZCKVEUIGOORGS-OUBTZVSYSA-N 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 208000000655 Distemper Diseases 0.000 description 1
- 101150029662 E1 gene Proteins 0.000 description 1
- 101150005585 E3 gene Proteins 0.000 description 1
- 241001115402 Ebolavirus Species 0.000 description 1
- 241001466953 Echovirus Species 0.000 description 1
- 241000588877 Eikenella Species 0.000 description 1
- 206010014596 Encephalitis Japanese B Diseases 0.000 description 1
- 206010014584 Encephalitis california Diseases 0.000 description 1
- 206010014611 Encephalitis venezuelan equine Diseases 0.000 description 1
- 206010014614 Encephalitis western equine Diseases 0.000 description 1
- 206010053025 Endemic syphilis Diseases 0.000 description 1
- 241000588921 Enterobacteriaceae Species 0.000 description 1
- 241000194032 Enterococcus faecalis Species 0.000 description 1
- 241000991587 Enterovirus C Species 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 208000000832 Equine Encephalomyelitis Diseases 0.000 description 1
- 241000710803 Equine arteritis virus Species 0.000 description 1
- 241000713730 Equine infectious anemia virus Species 0.000 description 1
- 241000186810 Erysipelothrix rhusiopathiae Species 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- 241000725579 Feline coronavirus Species 0.000 description 1
- 241000714165 Feline leukemia virus Species 0.000 description 1
- 241000701925 Feline parvovirus Species 0.000 description 1
- 201000006353 Filariasis Diseases 0.000 description 1
- 241000710781 Flaviviridae Species 0.000 description 1
- 208000007212 Foot-and-Mouth Disease Diseases 0.000 description 1
- 241000710198 Foot-and-mouth disease virus Species 0.000 description 1
- BDAGIHXWWSANSR-UHFFFAOYSA-M Formate Chemical compound [O-]C=O BDAGIHXWWSANSR-UHFFFAOYSA-M 0.000 description 1
- 241000231322 Fort Morgan virus Species 0.000 description 1
- 208000000666 Fowlpox Diseases 0.000 description 1
- VZCYOOQTPOCHFL-OWOJBTEDSA-N Fumaric acid Chemical compound OC(=O)\C=C\C(O)=O VZCYOOQTPOCHFL-OWOJBTEDSA-N 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 108091006027 G proteins Proteins 0.000 description 1
- 102000030782 GTP binding Human genes 0.000 description 1
- 108091000058 GTP-Binding Proteins 0.000 description 1
- 101710177291 Gag polyprotein Proteins 0.000 description 1
- 241000701047 Gallid alphaherpesvirus 2 Species 0.000 description 1
- 241000701046 Gammaherpesvirinae Species 0.000 description 1
- 241000224466 Giardia Species 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 206010018612 Gonorrhoea Diseases 0.000 description 1
- 108060003393 Granulin Proteins 0.000 description 1
- 102000004457 Granulocyte-Macrophage Colony-Stimulating Factor Human genes 0.000 description 1
- 206010018693 Granuloma inguinale Diseases 0.000 description 1
- XKMLYUALXHKNFT-UUOKFMHZSA-N Guanosine-5'-triphosphate Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O XKMLYUALXHKNFT-UUOKFMHZSA-N 0.000 description 1
- 241000606790 Haemophilus Species 0.000 description 1
- 241000606768 Haemophilus influenzae Species 0.000 description 1
- 206010061192 Haemorrhagic fever Diseases 0.000 description 1
- 241000590002 Helicobacter pylori Species 0.000 description 1
- 208000005176 Hepatitis C Diseases 0.000 description 1
- 208000005331 Hepatitis D Diseases 0.000 description 1
- 241000709721 Hepatovirus A Species 0.000 description 1
- 208000007514 Herpes zoster Diseases 0.000 description 1
- 241000700586 Herpesviridae Species 0.000 description 1
- 241000606831 Histophilus somni Species 0.000 description 1
- 241000228402 Histoplasma Species 0.000 description 1
- 201000002563 Histoplasmosis Diseases 0.000 description 1
- 101000899111 Homo sapiens Hemoglobin subunit beta Proteins 0.000 description 1
- 101000800133 Homo sapiens Thyroglobulin Proteins 0.000 description 1
- 241000598171 Human adenovirus sp. Species 0.000 description 1
- 241001207270 Human enterovirus Species 0.000 description 1
- 241000713772 Human immunodeficiency virus 1 Species 0.000 description 1
- 241000726041 Human respirovirus 1 Species 0.000 description 1
- 241000712003 Human respirovirus 3 Species 0.000 description 1
- 241001559187 Human rubulavirus 2 Species 0.000 description 1
- 241001559186 Human rubulavirus 4 Species 0.000 description 1
- 206010020751 Hypersensitivity Diseases 0.000 description 1
- 201000001916 Hypochondriasis Diseases 0.000 description 1
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 1
- 241000711450 Infectious bronchitis virus Species 0.000 description 1
- 108090001061 Insulin Proteins 0.000 description 1
- 102100023915 Insulin Human genes 0.000 description 1
- 102100034353 Integrase Human genes 0.000 description 1
- 108010002352 Interleukin-1 Proteins 0.000 description 1
- 108090000978 Interleukin-4 Proteins 0.000 description 1
- 201000005807 Japanese encephalitis Diseases 0.000 description 1
- 241000710843 Japanese encephalitis virus group Species 0.000 description 1
- 241000710912 Kunjin virus Species 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- 239000002147 L01XE04 - Sunitinib Substances 0.000 description 1
- 239000003798 L01XE11 - Pazopanib Substances 0.000 description 1
- 201000009908 La Crosse encephalitis Diseases 0.000 description 1
- JVTAAEKCZFNVCJ-UHFFFAOYSA-M Lactate Chemical compound CC(O)C([O-])=O JVTAAEKCZFNVCJ-UHFFFAOYSA-M 0.000 description 1
- 206010023927 Lassa fever Diseases 0.000 description 1
- 241000222732 Leishmania major Species 0.000 description 1
- 208000004554 Leishmaniasis Diseases 0.000 description 1
- 206010024229 Leprosy Diseases 0.000 description 1
- 241000589929 Leptospira interrogans Species 0.000 description 1
- 206010024238 Leptospirosis Diseases 0.000 description 1
- 108090001030 Lipoproteins Proteins 0.000 description 1
- 102000004895 Lipoproteins Human genes 0.000 description 1
- 241000186779 Listeria monocytogenes Species 0.000 description 1
- WHXSMMKQMYFTQS-UHFFFAOYSA-N Lithium Chemical compound [Li] WHXSMMKQMYFTQS-UHFFFAOYSA-N 0.000 description 1
- 208000016604 Lyme disease Diseases 0.000 description 1
- 241000701043 Lymphocryptovirus Species 0.000 description 1
- 241000711828 Lyssavirus Species 0.000 description 1
- 241000282567 Macaca fascicularis Species 0.000 description 1
- 241000282560 Macaca mulatta Species 0.000 description 1
- FYYHWMGAXLPEAU-UHFFFAOYSA-N Magnesium Chemical compound [Mg] FYYHWMGAXLPEAU-UHFFFAOYSA-N 0.000 description 1
- 101710125418 Major capsid protein Proteins 0.000 description 1
- OFOBLEOULBTSOW-UHFFFAOYSA-L Malonate Chemical compound [O-]C(=O)CC([O-])=O OFOBLEOULBTSOW-UHFFFAOYSA-L 0.000 description 1
- 241001293418 Mannheimia haemolytica Species 0.000 description 1
- 241001372913 Maraba virus Species 0.000 description 1
- 241001115401 Marburgvirus Species 0.000 description 1
- 241000283923 Marmota monax Species 0.000 description 1
- 101710085938 Matrix protein Proteins 0.000 description 1
- 101710127721 Membrane protein Proteins 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- AFVFQIVMOAPDHO-UHFFFAOYSA-N Methanesulfonic acid Chemical compound CS(O)(=O)=O AFVFQIVMOAPDHO-UHFFFAOYSA-N 0.000 description 1
- 241001460074 Microsporum distortum Species 0.000 description 1
- 241000588621 Moraxella Species 0.000 description 1
- 241000712045 Morbillivirus Species 0.000 description 1
- 241000711386 Mumps virus Species 0.000 description 1
- 241000701034 Muromegalovirus Species 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 241000186359 Mycobacterium Species 0.000 description 1
- 241000186367 Mycobacterium avium Species 0.000 description 1
- 241000186364 Mycobacterium intracellulare Species 0.000 description 1
- 241000187479 Mycobacterium tuberculosis Species 0.000 description 1
- 241000204031 Mycoplasma Species 0.000 description 1
- 241000204022 Mycoplasma gallisepticum Species 0.000 description 1
- 241000202934 Mycoplasma pneumoniae Species 0.000 description 1
- GUVMFDICMFQHSZ-UHFFFAOYSA-N N-(1-aminoethenyl)-1-[4-[[5-(4-amino-5-methyl-2-oxopyrimidin-1-yl)-3-[[5-(4-amino-5-methyl-2-oxopyrimidin-1-yl)-3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(4-amino-5-methyl-2-oxopyrimidin-1-yl)-3-[[5-(4-amino-5-methyl-2-oxopyrimidin-1-yl)-3-[[5-(4-amino-5-methyl-2-oxopyrimidin-1-yl)-3-[[5-(4-amino-5-methyl-2-oxopyrimidin-1-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[hydroxy-[[3-[hydroxy-[[3-hydroxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy]phosphinothioyl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy]phosphinothioyl]oxyoxolan-2-yl]methoxy-hydroxyphosphinothioyl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphinothioyl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphinothioyl]oxyoxolan-2-yl]methoxy-hydroxyphosphinothioyl]oxyoxolan-2-yl]methoxy-hydroxyphosphinothioyl]oxyoxolan-2-yl]methoxy-hydroxyphosphinothioyl]oxyoxolan-2-yl]methoxy-hydroxyphosphinothioyl]oxyoxolan-2-yl]methoxy-hydroxyphosphinothioyl]oxy-5-(2-amino-6-oxo-1H-purin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphinothioyl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphinothioyl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphinothioyl]oxy-5-(2-amino-6-oxo-1H-purin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphinothioyl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphinothioyl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphinothioyl]oxyoxolan-2-yl]methoxy-hydroxyphosphinothioyl]oxyoxolan-2-yl]methoxy-hydroxyphosphinothioyl]oxy-5-[[[2-[[[2-[[[5-(2-amino-6-oxo-1H-purin-9-yl)-2-[[[5-(4-amino-2-oxopyrimidin-1-yl)-2-[[hydroxy-[2-(hydroxymethyl)-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-3-yl]oxyphosphinothioyl]oxymethyl]oxolan-3-yl]oxy-hydroxyphosphinothioyl]oxymethyl]oxolan-3-yl]oxy-hydroxyphosphinothioyl]oxymethyl]-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-3-yl]oxy-hydroxyphosphinothioyl]oxymethyl]-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-3-yl]oxy-hydroxyphosphinothioyl]oxymethyl]oxolan-2-yl]-5-methylimidazole-4-carboxamide Chemical compound CC1=C(C(=O)NC(N)=C)N=CN1C1OC(COP(O)(=S)OC2C(OC(C2)N2C(N=C(N)C=C2)=O)COP(O)(=S)OC2C(OC(C2)N2C(NC(=O)C(C)=C2)=O)COP(O)(=S)OC2C(OC(C2)N2C3=C(C(NC(N)=N3)=O)N=C2)COP(O)(=S)OC2C(OC(C2)N2C(N=C(N)C=C2)=O)COP(O)(=S)OC2C(OC(C2)N2C(NC(=O)C(C)=C2)=O)CO)C(OP(O)(=S)OCC2C(CC(O2)N2C(N=C(N)C(C)=C2)=O)OP(O)(=S)OCC2C(CC(O2)N2C(N=C(N)C(C)=C2)=O)OP(O)(=S)OCC2C(CC(O2)N2C(NC(=O)C(C)=C2)=O)OP(O)(=S)OCC2C(CC(O2)N2C(NC(=O)C(C)=C2)=O)OP(O)(=S)OCC2C(CC(O2)N2C3=C(C(NC(N)=N3)=O)N=C2)OP(O)(=S)OCC2C(CC(O2)N2C(NC(=O)C(C)=C2)=O)OP(O)(=S)OCC2C(CC(O2)N2C(N=C(N)C=C2)=O)OP(O)(=S)OCC2C(CC(O2)N2C3=C(C(NC(N)=N3)=O)N=C2)OP(O)(=S)OCC2C(CC(O2)N2C(N=C(N)C(C)=C2)=O)OP(O)(=S)OCC2C(CC(O2)N2C(N=C(N)C(C)=C2)=O)OP(O)(=S)OCC2C(CC(O2)N2C(N=C(N)C(C)=C2)=O)OP(O)(=S)OCC2C(CC(O2)N2C(N=C(N)C(C)=C2)=O)OP(O)(=S)OCC2C(CC(O2)N2C3=C(C(NC(N)=N3)=O)N=C2)OP(O)(=S)OCC2C(CC(O2)N2C(NC(=O)C(C)=C2)=O)OP(O)(=S)OCC2C(CC(O2)N2C(N=C(N)C=C2)=O)OP(O)(=S)OCC2C(CC(O2)N2C3=C(C(NC(N)=N3)=O)N=C2)OP(O)(=S)OCC2C(CC(O2)N2C(NC(=O)C(C)=C2)=O)OP(O)(=S)OCC2C(CC(O2)N2C(NC(=O)C(C)=C2)=O)O)C1 GUVMFDICMFQHSZ-UHFFFAOYSA-N 0.000 description 1
- 108010084333 N-palmitoyl-S-(2,3-bis(palmitoyloxy)propyl)cysteinyl-seryl-lysyl-lysyl-lysyl-lysine Proteins 0.000 description 1
- 229910002651 NO3 Inorganic materials 0.000 description 1
- 208000006007 Nairobi Sheep Disease Diseases 0.000 description 1
- 241000588652 Neisseria gonorrhoeae Species 0.000 description 1
- 241000244206 Nematoda Species 0.000 description 1
- PVNIIMVLHYAWGP-UHFFFAOYSA-N Niacin Chemical compound OC(=O)C1=CC=CN=C1 PVNIIMVLHYAWGP-UHFFFAOYSA-N 0.000 description 1
- NHNBFGGVMKEFGY-UHFFFAOYSA-N Nitrate Chemical compound [O-][N+]([O-])=O NHNBFGGVMKEFGY-UHFFFAOYSA-N 0.000 description 1
- 108010066154 Nuclear Export Signals Proteins 0.000 description 1
- 108020005497 Nuclear hormone receptor Proteins 0.000 description 1
- 108090001074 Nucleocapsid Proteins Proteins 0.000 description 1
- 101710141454 Nucleoprotein Proteins 0.000 description 1
- SUHOOTKUPISOBE-UHFFFAOYSA-N O-phosphoethanolamine Chemical class NCCOP(O)(O)=O SUHOOTKUPISOBE-UHFFFAOYSA-N 0.000 description 1
- 241000702259 Orbivirus Species 0.000 description 1
- 241000713112 Orthobunyavirus Species 0.000 description 1
- 241000150452 Orthohantavirus Species 0.000 description 1
- 241000150218 Orthonairovirus Species 0.000 description 1
- 241000700629 Orthopoxvirus Species 0.000 description 1
- 108010058846 Ovalbumin Proteins 0.000 description 1
- 235000021314 Palmitic acid Nutrition 0.000 description 1
- 241001631646 Papillomaviridae Species 0.000 description 1
- 206010033767 Paracoccidioides infections Diseases 0.000 description 1
- 201000000301 Paracoccidioidomycosis Diseases 0.000 description 1
- 241000700639 Parapoxvirus Species 0.000 description 1
- 208000030852 Parasitic disease Diseases 0.000 description 1
- 241000606860 Pasteurella Species 0.000 description 1
- 241000606856 Pasteurella multocida Species 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 241000150350 Peribunyaviridae Species 0.000 description 1
- 208000004842 Pinta Diseases 0.000 description 1
- 241001505332 Polyomavirus sp. Species 0.000 description 1
- 241000156302 Porcine hemagglutinating encephalomyelitis virus Species 0.000 description 1
- 241000702619 Porcine parvovirus Species 0.000 description 1
- ZLMJMSJWJFRBEC-UHFFFAOYSA-N Potassium Chemical compound [K] ZLMJMSJWJFRBEC-UHFFFAOYSA-N 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- XBDQKXXYIPTUBI-UHFFFAOYSA-M Propionate Chemical compound CCC([O-])=O XBDQKXXYIPTUBI-UHFFFAOYSA-M 0.000 description 1
- 102000007327 Protamines Human genes 0.000 description 1
- 108010007568 Protamines Proteins 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 101710192141 Protein Nef Proteins 0.000 description 1
- 101710150344 Protein Rev Proteins 0.000 description 1
- 229940096437 Protein S Drugs 0.000 description 1
- 101710149136 Protein Vpr Proteins 0.000 description 1
- 241000588770 Proteus mirabilis Species 0.000 description 1
- 241000588767 Proteus vulgaris Species 0.000 description 1
- 241000125945 Protoparvovirus Species 0.000 description 1
- 241000589516 Pseudomonas Species 0.000 description 1
- 206010037688 Q fever Diseases 0.000 description 1
- 230000004570 RNA-binding Effects 0.000 description 1
- 206010037742 Rabies Diseases 0.000 description 1
- 241000711798 Rabies lyssavirus Species 0.000 description 1
- 206010051497 Rhinotracheitis Diseases 0.000 description 1
- 241000606723 Rickettsia akari Species 0.000 description 1
- 241000606651 Rickettsiales Species 0.000 description 1
- 201000004282 Rickettsialpox Diseases 0.000 description 1
- 208000000705 Rift Valley Fever Diseases 0.000 description 1
- 206010039207 Rocky Mountain Spotted Fever Diseases 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- 239000006146 Roswell Park Memorial Institute medium Substances 0.000 description 1
- 241000702670 Rotavirus Species 0.000 description 1
- 241000714474 Rous sarcoma virus Species 0.000 description 1
- 241000710799 Rubella virus Species 0.000 description 1
- 241000710801 Rubivirus Species 0.000 description 1
- 240000007651 Rubus glaucus Species 0.000 description 1
- 235000011034 Rubus glaucus Nutrition 0.000 description 1
- 235000009122 Rubus idaeus Nutrition 0.000 description 1
- MEFKEPWMEQBLKI-AIRLBKTGSA-N S-adenosyl-L-methioninate Chemical compound O[C@@H]1[C@H](O)[C@@H](C[S+](CC[C@H](N)C([O-])=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 MEFKEPWMEQBLKI-AIRLBKTGSA-N 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 241000607142 Salmonella Species 0.000 description 1
- 241001138501 Salmonella enterica Species 0.000 description 1
- 241000242678 Schistosoma Species 0.000 description 1
- 241000710961 Semliki Forest virus Species 0.000 description 1
- 229920002684 Sepharose Polymers 0.000 description 1
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 1
- 241000700584 Simplexvirus Species 0.000 description 1
- 108010003723 Single-Domain Antibodies Proteins 0.000 description 1
- 101710198474 Spike protein Proteins 0.000 description 1
- 241000605008 Spirillum Species 0.000 description 1
- 206010041736 Sporotrichosis Diseases 0.000 description 1
- 206010041896 St. Louis Encephalitis Diseases 0.000 description 1
- 241000710888 St. Louis encephalitis virus Species 0.000 description 1
- 241000191940 Staphylococcus Species 0.000 description 1
- 241000191967 Staphylococcus aureus Species 0.000 description 1
- 108091081024 Start codon Proteins 0.000 description 1
- 229930182558 Sterol Natural products 0.000 description 1
- 241000193985 Streptococcus agalactiae Species 0.000 description 1
- 241000193998 Streptococcus pneumoniae Species 0.000 description 1
- 241000193996 Streptococcus pyogenes Species 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 241000700568 Suipoxvirus Species 0.000 description 1
- QAOWNCQODCNURD-UHFFFAOYSA-L Sulfate Chemical compound [O-]S([O-])(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-L 0.000 description 1
- FEWJPZIEWOKRBE-UHFFFAOYSA-N Tartaric acid Natural products [H+].[H+].[O-]C(=O)C(O)C(O)C([O-])=O FEWJPZIEWOKRBE-UHFFFAOYSA-N 0.000 description 1
- 206010043376 Tetanus Diseases 0.000 description 1
- ZMZDMBWJUHKJPS-UHFFFAOYSA-M Thiocyanate anion Chemical compound [S-]C#N ZMZDMBWJUHKJPS-UHFFFAOYSA-M 0.000 description 1
- 102000009843 Thyroglobulin Human genes 0.000 description 1
- 208000002474 Tinea Diseases 0.000 description 1
- 241000710924 Togaviridae Species 0.000 description 1
- 241000223996 Toxoplasma Species 0.000 description 1
- 108090000901 Transferrin Proteins 0.000 description 1
- 102000004338 Transferrin Human genes 0.000 description 1
- 101800001690 Transmembrane protein gp41 Proteins 0.000 description 1
- 241000711484 Transmissible gastroenteritis virus Species 0.000 description 1
- 241000242541 Trematoda Species 0.000 description 1
- 241000589886 Treponema Species 0.000 description 1
- 241000224526 Trichomonas Species 0.000 description 1
- 241001489151 Trichuris Species 0.000 description 1
- YZCKVEUIGOORGS-NJFSPNSNSA-N Tritium Chemical compound [3H] YZCKVEUIGOORGS-NJFSPNSNSA-N 0.000 description 1
- 208000034784 Tularaemia Diseases 0.000 description 1
- 108060008682 Tumor Necrosis Factor Proteins 0.000 description 1
- 102000000852 Tumor Necrosis Factor-alpha Human genes 0.000 description 1
- PGAVKCOVUIYSFO-XVFCMESISA-N UTP Chemical compound O[C@@H]1[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O[C@H]1N1C(=O)NC(=O)C=C1 PGAVKCOVUIYSFO-XVFCMESISA-N 0.000 description 1
- SECKRCOLJRRGGV-UHFFFAOYSA-N Vardenafil Chemical compound CCCC1=NC(C)=C(C(N=2)=O)N1NC=2C(C(=CC=1)OCC)=CC=1S(=O)(=O)N1CCN(CC)CC1 SECKRCOLJRRGGV-UHFFFAOYSA-N 0.000 description 1
- 241000701067 Varicellovirus Species 0.000 description 1
- 241000700647 Variola virus Species 0.000 description 1
- 102000005789 Vascular Endothelial Growth Factors Human genes 0.000 description 1
- 108010019530 Vascular Endothelial Growth Factors Proteins 0.000 description 1
- 208000002687 Venezuelan Equine Encephalomyelitis Diseases 0.000 description 1
- 201000009145 Venezuelan equine encephalitis Diseases 0.000 description 1
- 241000607626 Vibrio cholerae Species 0.000 description 1
- 101710201961 Virion infectivity factor Proteins 0.000 description 1
- 208000005466 Western Equine Encephalomyelitis Diseases 0.000 description 1
- 201000005806 Western equine encephalitis Diseases 0.000 description 1
- 241000710951 Western equine encephalitis virus Species 0.000 description 1
- 101000756604 Xenopus laevis Actin, cytoplasmic 1 Proteins 0.000 description 1
- 208000003152 Yellow Fever Diseases 0.000 description 1
- 241000120645 Yellow fever virus group Species 0.000 description 1
- 241000607734 Yersinia <bacteria> Species 0.000 description 1
- 206010061418 Zygomycosis Diseases 0.000 description 1
- HPFVBGJFAYZEBE-XNBTXCQYSA-N [(8r,9s,10r,13s,14s)-10,13-dimethyl-3-oxo-1,2,6,7,8,9,11,12,14,15,16,17-dodecahydrocyclopenta[a]phenanthren-17-yl] 3-cyclopentylpropanoate Chemical compound C([C@H]1[C@H]2[C@@H]([C@]3(CCC(=O)C=C3CC2)C)CC[C@@]11C)CC1OC(=O)CCC1CCCC1 HPFVBGJFAYZEBE-XNBTXCQYSA-N 0.000 description 1
- DPXJVFZANSGRMM-UHFFFAOYSA-N acetic acid;2,3,4,5,6-pentahydroxyhexanal;sodium Chemical compound [Na].CC(O)=O.OCC(O)C(O)C(O)C(O)C=O DPXJVFZANSGRMM-UHFFFAOYSA-N 0.000 description 1
- 201000007691 actinomycosis Diseases 0.000 description 1
- 208000012873 acute gastroenteritis Diseases 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 229960001570 ademetionine Drugs 0.000 description 1
- WNLRTRBMVRJNCN-UHFFFAOYSA-N adipic acid Chemical class OC(=O)CCCCC(O)=O WNLRTRBMVRJNCN-UHFFFAOYSA-N 0.000 description 1
- 208000014619 adult acute lymphoblastic leukemia Diseases 0.000 description 1
- 230000006838 adverse reaction Effects 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 229920000615 alginic acid Polymers 0.000 description 1
- 235000010443 alginic acid Nutrition 0.000 description 1
- 239000003513 alkali Substances 0.000 description 1
- 229910052783 alkali metal Inorganic materials 0.000 description 1
- 150000001340 alkali metals Chemical class 0.000 description 1
- 150000001342 alkaline earth metals Chemical class 0.000 description 1
- 150000008055 alkyl aryl sulfonates Chemical class 0.000 description 1
- 229940045714 alkyl sulfonate alkylating agent Drugs 0.000 description 1
- 150000008052 alkyl sulfonates Chemical class 0.000 description 1
- 125000000304 alkynyl group Chemical group 0.000 description 1
- AWUCVROLDVIAJX-UHFFFAOYSA-N alpha-glycerophosphate Natural products OCC(O)COP(O)(O)=O AWUCVROLDVIAJX-UHFFFAOYSA-N 0.000 description 1
- 229940037003 alum Drugs 0.000 description 1
- AZDRQVAHHNSJOQ-UHFFFAOYSA-N alumane Chemical class [AlH3] AZDRQVAHHNSJOQ-UHFFFAOYSA-N 0.000 description 1
- PNEYBMLMFCGWSK-UHFFFAOYSA-N aluminium oxide Inorganic materials [O-2].[O-2].[O-2].[Al+3].[Al+3] PNEYBMLMFCGWSK-UHFFFAOYSA-N 0.000 description 1
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 1
- CEGOLXSVJUTHNZ-UHFFFAOYSA-K aluminium tristearate Chemical compound [Al+3].CCCCCCCCCCCCCCCCCC([O-])=O.CCCCCCCCCCCCCCCCCC([O-])=O.CCCCCCCCCCCCCCCCCC([O-])=O CEGOLXSVJUTHNZ-UHFFFAOYSA-K 0.000 description 1
- 229940063655 aluminum stearate Drugs 0.000 description 1
- 125000003277 amino group Chemical group 0.000 description 1
- 108010038083 amyloid fibril protein AS-SAM Proteins 0.000 description 1
- 208000005028 anomia Diseases 0.000 description 1
- 230000005875 antibody response Effects 0.000 description 1
- 230000030741 antigen processing and presentation Effects 0.000 description 1
- 125000003710 aryl alkyl group Chemical group 0.000 description 1
- 125000005160 aryl oxy alkyl group Chemical group 0.000 description 1
- 235000010323 ascorbic acid Nutrition 0.000 description 1
- 125000003289 ascorbyl group Chemical class [H]O[C@@]([H])(C([H])([H])O*)[C@@]1([H])OC(=O)C(O*)=C1O* 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-L aspartate group Chemical class N[C@@H](CC(=O)[O-])C(=O)[O-] CKLJMWTZIZZHCS-REOHCLBHSA-L 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 201000008680 babesiosis Diseases 0.000 description 1
- 244000052616 bacterial pathogen Species 0.000 description 1
- 206010004145 bartonellosis Diseases 0.000 description 1
- SRSXLGNVWSONIS-UHFFFAOYSA-N benzenesulfonic acid Chemical class OS(=O)(=O)C1=CC=CC=C1 SRSXLGNVWSONIS-UHFFFAOYSA-N 0.000 description 1
- 150000001558 benzoic acid derivatives Chemical class 0.000 description 1
- 125000000649 benzylidene group Chemical group [H]C(=[*])C1=C([H])C([H])=C([H])C([H])=C1[H] 0.000 description 1
- XMIIGOLPHOKFCH-UHFFFAOYSA-N beta-phenylpropanoic acid Natural products OC(=O)CCC1=CC=CC=C1 XMIIGOLPHOKFCH-UHFFFAOYSA-N 0.000 description 1
- 229960000397 bevacizumab Drugs 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000008512 biological response Effects 0.000 description 1
- 238000001574 biopsy Methods 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 239000004305 biphenyl Substances 0.000 description 1
- 235000010290 biphenyl Nutrition 0.000 description 1
- QAOWNCQODCNURD-UHFFFAOYSA-M bisulphate group Chemical group S([O-])(O)(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-M 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 208000003836 bluetongue Diseases 0.000 description 1
- 150000001642 boronic acid derivatives Chemical class 0.000 description 1
- 229940098773 bovine serum albumin Drugs 0.000 description 1
- 229910052794 bromium Inorganic materials 0.000 description 1
- 150000004648 butanoic acid derivatives Chemical class 0.000 description 1
- 125000000484 butyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 229910052791 calcium Inorganic materials 0.000 description 1
- 239000011575 calcium Substances 0.000 description 1
- FATUQANACHZLRT-KMRXSBRUSA-L calcium glucoheptonate Chemical compound [Ca+2].OC[C@@H](O)[C@@H](O)[C@H](O)[C@@H](O)C(O)C([O-])=O.OC[C@@H](O)[C@@H](O)[C@H](O)[C@@H](O)C(O)C([O-])=O FATUQANACHZLRT-KMRXSBRUSA-L 0.000 description 1
- MIOPJNTWMNEORI-UHFFFAOYSA-N camphorsulfonic acid Chemical class C1CC2(CS(O)(=O)=O)C(=O)CC1C2(C)C MIOPJNTWMNEORI-UHFFFAOYSA-N 0.000 description 1
- 201000003984 candidiasis Diseases 0.000 description 1
- 208000014058 canine distemper Diseases 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 239000001768 carboxy methyl cellulose Substances 0.000 description 1
- 150000007942 carboxylates Chemical class 0.000 description 1
- 229960002412 cediranib Drugs 0.000 description 1
- 229940047495 celebrex Drugs 0.000 description 1
- RZEKVGVHFLEQIL-UHFFFAOYSA-N celecoxib Chemical compound C1=CC(C)=CC=C1C1=CC(C(F)(F)F)=NN1C1=CC=C(S(N)(=O)=O)C=C1 RZEKVGVHFLEQIL-UHFFFAOYSA-N 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000012292 cell migration Effects 0.000 description 1
- 230000004663 cell proliferation Effects 0.000 description 1
- 210000002421 cell wall Anatomy 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 229940038705 chlamydia trachomatis Drugs 0.000 description 1
- 229910052801 chlorine Inorganic materials 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 150000001860 citric acid derivatives Chemical class 0.000 description 1
- 238000012761 co-transfection Methods 0.000 description 1
- 201000003486 coccidioidomycosis Diseases 0.000 description 1
- 239000008119 colloidal silica Substances 0.000 description 1
- 229940047120 colony stimulating factors Drugs 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 125000000392 cycloalkenyl group Chemical group 0.000 description 1
- 229960004397 cyclophosphamide Drugs 0.000 description 1
- 208000031513 cyst Diseases 0.000 description 1
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 1
- 230000007402 cytotoxic response Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000002716 delivery method Methods 0.000 description 1
- 208000025729 dengue disease Diseases 0.000 description 1
- 108010017271 denileukin diftitox Proteins 0.000 description 1
- 230000000368 destabilizing effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 229910052805 deuterium Inorganic materials 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 235000014113 dietary fatty acids Nutrition 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- GXGAKHNRMVGRPK-UHFFFAOYSA-N dimagnesium;dioxido-bis[[oxido(oxo)silyl]oxy]silane Chemical compound [Mg+2].[Mg+2].[O-][Si](=O)O[Si]([O-])([O-])O[Si]([O-])=O GXGAKHNRMVGRPK-UHFFFAOYSA-N 0.000 description 1
- 229960003983 diphtheria toxoid Drugs 0.000 description 1
- ZPWVASYFFYYZEW-UHFFFAOYSA-L dipotassium hydrogen phosphate Chemical compound [K+].[K+].OP([O-])([O-])=O ZPWVASYFFYYZEW-UHFFFAOYSA-L 0.000 description 1
- 229910000396 dipotassium phosphate Inorganic materials 0.000 description 1
- 235000019797 dipotassium phosphate Nutrition 0.000 description 1
- 231100000676 disease causative agent Toxicity 0.000 description 1
- BNIILDVGGAEEIG-UHFFFAOYSA-L disodium hydrogen phosphate Chemical compound [Na+].[Na+].OP([O-])([O-])=O BNIILDVGGAEEIG-UHFFFAOYSA-L 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- POULHZVOKOAJMA-UHFFFAOYSA-M dodecanoate Chemical compound CCCCCCCCCCCC([O-])=O POULHZVOKOAJMA-UHFFFAOYSA-M 0.000 description 1
- 230000037437 driver mutation Effects 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 229940056913 eftilagimod alfa Drugs 0.000 description 1
- 239000003792 electrolyte Substances 0.000 description 1
- 206010014599 encephalitis Diseases 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 208000028104 epidemic louse-borne typhus Diseases 0.000 description 1
- CCIVGXIOQKPBKL-UHFFFAOYSA-M ethanesulfonate Chemical compound CCS([O-])(=O)=O CCIVGXIOQKPBKL-UHFFFAOYSA-M 0.000 description 1
- BEFDCLMNVWHSGT-UHFFFAOYSA-N ethenylcyclopentane Chemical compound C=CC1CCCC1 BEFDCLMNVWHSGT-UHFFFAOYSA-N 0.000 description 1
- 125000001495 ethyl group Chemical group [H]C([H])([H])C([H])([H])* 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 229930195729 fatty acid Natural products 0.000 description 1
- 239000000194 fatty acid Substances 0.000 description 1
- 150000004665 fatty acids Chemical class 0.000 description 1
- 210000003608 fece Anatomy 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 239000007850 fluorescent dye Substances 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 244000053095 fungal pathogen Species 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 210000004392 genitalia Anatomy 0.000 description 1
- 201000006592 giardiasis Diseases 0.000 description 1
- 229940050410 gluconate Drugs 0.000 description 1
- 150000004676 glycans Chemical class 0.000 description 1
- 229960002449 glycine Drugs 0.000 description 1
- 208000001786 gonorrhea Diseases 0.000 description 1
- 229940047650 haemophilus influenzae Drugs 0.000 description 1
- 150000004820 halides Chemical class 0.000 description 1
- 125000001188 haloalkyl group Chemical group 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 229940037467 helicobacter pylori Drugs 0.000 description 1
- 244000000013 helminth Species 0.000 description 1
- 208000006454 hepatitis Diseases 0.000 description 1
- 231100000283 hepatitis Toxicity 0.000 description 1
- 208000029570 hepatitis D virus infection Diseases 0.000 description 1
- MNWFXJYAOYHMED-UHFFFAOYSA-N heptanoic acid Chemical compound CCCCCCC(O)=O MNWFXJYAOYHMED-UHFFFAOYSA-N 0.000 description 1
- 125000001072 heteroaryl group Chemical group 0.000 description 1
- IPCSVZSSVZVIGE-UHFFFAOYSA-M hexadecanoate Chemical compound CCCCCCCCCCCCCCCC([O-])=O IPCSVZSSVZVIGE-UHFFFAOYSA-M 0.000 description 1
- FUZZWVXGSFPDMH-UHFFFAOYSA-N hexanoic acid Chemical compound CCCCCC(O)=O FUZZWVXGSFPDMH-UHFFFAOYSA-N 0.000 description 1
- 229940088597 hormone Drugs 0.000 description 1
- 239000005556 hormone Substances 0.000 description 1
- 230000004727 humoral immunity Effects 0.000 description 1
- 150000002430 hydrocarbons Chemical group 0.000 description 1
- 125000004435 hydrogen atom Chemical group [H]* 0.000 description 1
- XMBWDFGMSWQBCA-UHFFFAOYSA-N hydrogen iodide Chemical compound I XMBWDFGMSWQBCA-UHFFFAOYSA-N 0.000 description 1
- ZMZDMBWJUHKJPS-UHFFFAOYSA-N hydrogen thiocyanate Natural products SC#N ZMZDMBWJUHKJPS-UHFFFAOYSA-N 0.000 description 1
- 125000001165 hydrophobic group Chemical group 0.000 description 1
- 150000004679 hydroxides Chemical class 0.000 description 1
- 229960002751 imiquimod Drugs 0.000 description 1
- DOUYETYNHWVLEO-UHFFFAOYSA-N imiquimod Chemical compound C1=CC=CC2=C3N(CC(C)C)C=NC3=C(N)N=C21 DOUYETYNHWVLEO-UHFFFAOYSA-N 0.000 description 1
- 210000002865 immune cell Anatomy 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 230000001571 immunoadjuvant effect Effects 0.000 description 1
- 229940072221 immunoglobulins Drugs 0.000 description 1
- 230000003308 immunostimulating effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 125000003392 indanyl group Chemical group C1(CCC2=CC=CC=C12)* 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 229940125396 insulin Drugs 0.000 description 1
- 238000005342 ion exchange Methods 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 229960005386 ipilimumab Drugs 0.000 description 1
- 230000007794 irritation Effects 0.000 description 1
- SUMDYPCJJOFFON-UHFFFAOYSA-N isethionic acid Chemical compound OCCS(O)(=O)=O SUMDYPCJJOFFON-UHFFFAOYSA-N 0.000 description 1
- 125000000959 isobutyl group Chemical group [H]C([H])([H])C([H])(C([H])([H])[H])C([H])([H])* 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 125000001449 isopropyl group Chemical group [H]C([H])([H])C([H])(*)C([H])([H])[H] 0.000 description 1
- 108010045069 keyhole-limpet hemocyanin Proteins 0.000 description 1
- 229940001447 lactate Drugs 0.000 description 1
- 229940099584 lactobionate Drugs 0.000 description 1
- JYTUSYBCFIZPBE-AMTLMPIISA-N lactobionic acid Chemical compound OC(=O)[C@H](O)[C@@H](O)[C@@H]([C@H](O)CO)O[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O JYTUSYBCFIZPBE-AMTLMPIISA-N 0.000 description 1
- 229940070765 laurate Drugs 0.000 description 1
- 229940067606 lecithin Drugs 0.000 description 1
- 239000000787 lecithin Substances 0.000 description 1
- 235000010445 lecithin Nutrition 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 230000029226 lipidation Effects 0.000 description 1
- 229910052744 lithium Inorganic materials 0.000 description 1
- 210000004698 lymphocyte Anatomy 0.000 description 1
- 210000003563 lymphoid tissue Anatomy 0.000 description 1
- 230000002132 lysosomal effect Effects 0.000 description 1
- 229910052749 magnesium Inorganic materials 0.000 description 1
- 239000011777 magnesium Substances 0.000 description 1
- 239000000391 magnesium silicate Substances 0.000 description 1
- 229940099273 magnesium trisilicate Drugs 0.000 description 1
- 229910000386 magnesium trisilicate Inorganic materials 0.000 description 1
- 235000019793 magnesium trisilicate Nutrition 0.000 description 1
- 239000011976 maleic acid Substances 0.000 description 1
- 230000003211 malignant effect Effects 0.000 description 1
- 201000004015 melioidosis Diseases 0.000 description 1
- 210000001806 memory b lymphocyte Anatomy 0.000 description 1
- 210000003071 memory t lymphocyte Anatomy 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 239000011859 microparticle Substances 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 230000009149 molecular binding Effects 0.000 description 1
- 238000009126 molecular therapy Methods 0.000 description 1
- 229940035032 monophosphoryl lipid a Drugs 0.000 description 1
- 201000007524 mucormycosis Diseases 0.000 description 1
- 230000007498 myristoylation Effects 0.000 description 1
- WQEPLUUGTLDZJY-UHFFFAOYSA-N n-Pentadecanoic acid Natural products CCCCCCCCCCCCCCC(O)=O WQEPLUUGTLDZJY-UHFFFAOYSA-N 0.000 description 1
- KVBGVZZKJNLNJU-UHFFFAOYSA-M naphthalene-2-sulfonate Chemical compound C1=CC=CC2=CC(S(=O)(=O)[O-])=CC=C21 KVBGVZZKJNLNJU-UHFFFAOYSA-M 0.000 description 1
- 125000001624 naphthyl group Chemical group 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 230000009826 neoplastic cell growth Effects 0.000 description 1
- 235000001968 nicotinic acid Nutrition 0.000 description 1
- 239000011664 nicotinic acid Substances 0.000 description 1
- 150000002823 nitrates Chemical class 0.000 description 1
- 125000006574 non-aromatic ring group Chemical group 0.000 description 1
- 230000030147 nuclear export Effects 0.000 description 1
- QIQXTHQIDYTFRH-UHFFFAOYSA-N octadecanoic acid Chemical compound CCCCCCCCCCCCCCCCCC(O)=O QIQXTHQIDYTFRH-UHFFFAOYSA-N 0.000 description 1
- 230000009437 off-target effect Effects 0.000 description 1
- 239000003921 oil Substances 0.000 description 1
- 229940049964 oleate Drugs 0.000 description 1
- ZQPPMHVWECSIRJ-KTKRTIGZSA-N oleic acid Chemical compound CCCCCCCC\C=C/CCCCCCCC(O)=O ZQPPMHVWECSIRJ-KTKRTIGZSA-N 0.000 description 1
- 229940100027 ontak Drugs 0.000 description 1
- 229940092253 ovalbumin Drugs 0.000 description 1
- 235000006408 oxalic acid Nutrition 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 230000026792 palmitoylation Effects 0.000 description 1
- 208000003154 papilloma Diseases 0.000 description 1
- 230000003071 parasitic effect Effects 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 229940051027 pasteurella multocida Drugs 0.000 description 1
- 229960000639 pazopanib Drugs 0.000 description 1
- CUIHSIWYWATEQL-UHFFFAOYSA-N pazopanib Chemical compound C1=CC2=C(C)N(C)N=C2C=C1N(C)C(N=1)=CC=NC=1NC1=CC=C(C)C(S(N)(=O)=O)=C1 CUIHSIWYWATEQL-UHFFFAOYSA-N 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- 210000005259 peripheral blood Anatomy 0.000 description 1
- 239000011886 peripheral blood Substances 0.000 description 1
- 206010034674 peritonitis Diseases 0.000 description 1
- JRKICGRDRMAZLK-UHFFFAOYSA-L peroxydisulfate Chemical compound [O-]S(=O)(=O)OOS([O-])(=O)=O JRKICGRDRMAZLK-UHFFFAOYSA-L 0.000 description 1
- 230000002399 phagocytotic effect Effects 0.000 description 1
- 239000000546 pharmaceutical excipient Substances 0.000 description 1
- 125000004934 phenanthridinyl group Chemical group C1(=CC=CC2=NC=C3C=CC=CC3=C12)* 0.000 description 1
- 238000002205 phenol-chloroform extraction Methods 0.000 description 1
- 125000001997 phenyl group Chemical group [H]C1=C([H])C([H])=C(*)C([H])=C1[H] 0.000 description 1
- 125000002525 phosphocholine group Chemical class OP(=O)(OCC[N+](C)(C)C)O* 0.000 description 1
- 150000004713 phosphodiesters Chemical class 0.000 description 1
- 150000003904 phospholipids Chemical class 0.000 description 1
- 150000003013 phosphoric acid derivatives Chemical class 0.000 description 1
- 125000005545 phthalimidyl group Chemical group 0.000 description 1
- 230000004962 physiological condition Effects 0.000 description 1
- 208000011079 pinta disease Diseases 0.000 description 1
- 229950010765 pivalate Drugs 0.000 description 1
- IUGYQRQAERSCNH-UHFFFAOYSA-N pivalic acid Chemical compound CC(C)(C)C(O)=O IUGYQRQAERSCNH-UHFFFAOYSA-N 0.000 description 1
- 231100000572 poisoning Toxicity 0.000 description 1
- 230000000607 poisoning effect Effects 0.000 description 1
- 229920000058 polyacrylate Polymers 0.000 description 1
- 229940115272 polyinosinic:polycytidylic acid Drugs 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 239000001267 polyvinylpyrrolidone Substances 0.000 description 1
- 229920000036 polyvinylpyrrolidone Polymers 0.000 description 1
- 235000013855 polyvinylpyrrolidone Nutrition 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- 230000001323 posttranslational effect Effects 0.000 description 1
- 229910052700 potassium Inorganic materials 0.000 description 1
- 239000011591 potassium Substances 0.000 description 1
- 239000004302 potassium sorbate Substances 0.000 description 1
- 235000010241 potassium sorbate Nutrition 0.000 description 1
- 229940069338 potassium sorbate Drugs 0.000 description 1
- 230000003389 potentiating effect Effects 0.000 description 1
- 244000144977 poultry Species 0.000 description 1
- 230000002028 premature Effects 0.000 description 1
- 230000013823 prenylation Effects 0.000 description 1
- 125000001436 propyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- 229950008679 protamine sulfate Drugs 0.000 description 1
- 235000019833 protease Nutrition 0.000 description 1
- 235000019419 proteases Nutrition 0.000 description 1
- 229940007042 proteus vulgaris Drugs 0.000 description 1
- 208000009305 pseudorabies Diseases 0.000 description 1
- 125000001453 quaternary ammonium group Chemical group 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 208000023504 respiratory system disease Diseases 0.000 description 1
- 230000001177 retroviral effect Effects 0.000 description 1
- 238000004007 reversed phase HPLC Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000002342 ribonucleoside Substances 0.000 description 1
- 238000009666 routine test Methods 0.000 description 1
- 102220289632 rs33941849 Human genes 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 239000000523 sample Substances 0.000 description 1
- 229930182490 saponin Natural products 0.000 description 1
- 235000017709 saponins Nutrition 0.000 description 1
- 150000007949 saponins Chemical class 0.000 description 1
- 108010038379 sargramostim Proteins 0.000 description 1
- 229960002530 sargramostim Drugs 0.000 description 1
- 201000004409 schistosomiasis Diseases 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 210000000582 semen Anatomy 0.000 description 1
- 229960003310 sildenafil Drugs 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- AWUCVROLDVIAJX-GSVOUGTGSA-N sn-glycerol 3-phosphate Chemical compound OC[C@@H](O)COP(O)(O)=O AWUCVROLDVIAJX-GSVOUGTGSA-N 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- 235000019812 sodium carboxymethyl cellulose Nutrition 0.000 description 1
- 229920001027 sodium carboxymethylcellulose Polymers 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 239000007790 solid phase Substances 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 239000004334 sorbic acid Substances 0.000 description 1
- 235000010199 sorbic acid Nutrition 0.000 description 1
- 229940075582 sorbic acid Drugs 0.000 description 1
- 210000004988 splenocyte Anatomy 0.000 description 1
- 210000003046 sporozoite Anatomy 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 150000003432 sterols Chemical class 0.000 description 1
- 235000003702 sterols Nutrition 0.000 description 1
- 229940031000 streptococcus pneumoniae Drugs 0.000 description 1
- KDYFGRWQOYBRFD-UHFFFAOYSA-L succinate(2-) Chemical compound [O-]C(=O)CCC([O-])=O KDYFGRWQOYBRFD-UHFFFAOYSA-L 0.000 description 1
- 239000001384 succinic acid Substances 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 150000003467 sulfuric acid derivatives Chemical class 0.000 description 1
- 229960001796 sunitinib Drugs 0.000 description 1
- WINHZLLDWRZWRT-ATVHPVEESA-N sunitinib Chemical compound CCN(CC)CCNC(=O)C1=C(C)NC(\C=C/2C3=CC(F)=CC=C3NC\2=O)=C1C WINHZLLDWRZWRT-ATVHPVEESA-N 0.000 description 1
- 208000011580 syndromic disease Diseases 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 229960000835 tadalafil Drugs 0.000 description 1
- IEHKWSGCTWLXFU-IIBYNOLFSA-N tadalafil Chemical compound C1=C2OCOC2=CC([C@@H]2C3=C([C]4C=CC=CC4=N3)C[C@H]3N2C(=O)CN(C3=O)C)=C1 IEHKWSGCTWLXFU-IIBYNOLFSA-N 0.000 description 1
- 239000011975 tartaric acid Substances 0.000 description 1
- 235000002906 tartaric acid Nutrition 0.000 description 1
- 229940095064 tartrate Drugs 0.000 description 1
- 210000001138 tear Anatomy 0.000 description 1
- 125000000999 tert-butyl group Chemical group [H]C([H])([H])C(*)(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- 125000001712 tetrahydronaphthyl group Chemical group C1(CCCC2=CC=CC=C12)* 0.000 description 1
- 229960002175 thyroglobulin Drugs 0.000 description 1
- 241001147422 tick-borne encephalitis virus group Species 0.000 description 1
- 239000003104 tissue culture media Substances 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 239000003053 toxin Substances 0.000 description 1
- 231100000765 toxin Toxicity 0.000 description 1
- 108700012359 toxins Proteins 0.000 description 1
- 239000012581 transferrin Substances 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- 229950007217 tremelimumab Drugs 0.000 description 1
- 208000003982 trichinellosis Diseases 0.000 description 1
- YNJBWRMUSHSURL-UHFFFAOYSA-N trichloroacetic acid Chemical compound OC(=O)C(Cl)(Cl)Cl YNJBWRMUSHSURL-UHFFFAOYSA-N 0.000 description 1
- 229960004319 trichloroacetic acid Drugs 0.000 description 1
- 229910052722 tritium Inorganic materials 0.000 description 1
- 201000002311 trypanosomiasis Diseases 0.000 description 1
- 230000037455 tumor specific immune response Effects 0.000 description 1
- 206010061393 typhus Diseases 0.000 description 1
- 241000724775 unclassified viruses Species 0.000 description 1
- ZDPHROOEEOARMN-UHFFFAOYSA-N undecanoic acid Chemical compound CCCCCCCCCCC(O)=O ZDPHROOEEOARMN-UHFFFAOYSA-N 0.000 description 1
- 241001148471 unidentified anaerobic bacterium Species 0.000 description 1
- 241000712461 unidentified influenza virus Species 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 229950010342 uridine triphosphate Drugs 0.000 description 1
- PGAVKCOVUIYSFO-UHFFFAOYSA-N uridine-triphosphate Natural products OC1C(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)OC1N1C(=O)NC(=O)C=C1 PGAVKCOVUIYSFO-UHFFFAOYSA-N 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- NQPDZGIKBAWPEJ-UHFFFAOYSA-N valeric acid Chemical class CCCCC(O)=O NQPDZGIKBAWPEJ-UHFFFAOYSA-N 0.000 description 1
- 229960002381 vardenafil Drugs 0.000 description 1
- 235000013311 vegetables Nutrition 0.000 description 1
- 229940118696 vibrio cholerae Drugs 0.000 description 1
- 239000000277 virosome Substances 0.000 description 1
- 239000011782 vitamin Substances 0.000 description 1
- 235000013343 vitamin Nutrition 0.000 description 1
- 229940088594 vitamin Drugs 0.000 description 1
- 229930003231 vitamin Natural products 0.000 description 1
- 101150040614 vpx gene Proteins 0.000 description 1
- 210000002268 wool Anatomy 0.000 description 1
- 150000003751 zinc Chemical class 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07H—SUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
- C07H21/00—Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07H—SUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
- C07H21/00—Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
- C07H21/02—Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids with ribosyl as saccharide radical
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K31/00—Medicinal preparations containing organic active ingredients
- A61K31/70—Carbohydrates; Sugars; Derivatives thereof
- A61K31/7088—Compounds having three or more nucleosides or nucleotides
- A61K31/713—Double-stranded nucleic acids or oligonucleotides
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/12—Viral antigens
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K47/00—Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
- A61K47/50—Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates
- A61K47/51—Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent
- A61K47/54—Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being an organic compound
- A61K47/549—Sugars, nucleosides, nucleotides or nucleic acids
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P35/00—Antineoplastic agents
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P37/00—Drugs for immunological or allergic disorders
- A61P37/02—Immunomodulators
- A61P37/04—Immunostimulants
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07H—SUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
- C07H1/00—Processes for the preparation of sugar derivatives
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07H—SUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
- C07H1/00—Processes for the preparation of sugar derivatives
- C07H1/02—Phosphorylation
- C07H1/04—Introducing polyphosphoric acid radicals
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/51—Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
- A61K2039/53—DNA (RNA) vaccination
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/60—Medicinal preparations containing antigens or antibodies characteristics by the carrier linked to the antigen
- A61K2039/6018—Lipids, e.g. in lipopeptides
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2770/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
- C12N2770/00011—Details
- C12N2770/36011—Togaviridae
- C12N2770/36111—Alphavirus, e.g. Sindbis virus, VEE, EEE, WEE, Semliki
- C12N2770/36134—Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2770/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
- C12N2770/00011—Details
- C12N2770/36011—Togaviridae
- C12N2770/36111—Alphavirus, e.g. Sindbis virus, VEE, EEE, WEE, Semliki
- C12N2770/36141—Use of virus, viral particle or viral elements as a vector
- C12N2770/36143—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2770/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
- C12N2770/00011—Details
- C12N2770/36011—Togaviridae
- C12N2770/36111—Alphavirus, e.g. Sindbis virus, VEE, EEE, WEE, Semliki
- C12N2770/36151—Methods of production or purification of viral material
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2770/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
- C12N2770/00011—Details
- C12N2770/36011—Togaviridae
- C12N2770/36111—Alphavirus, e.g. Sindbis virus, VEE, EEE, WEE, Semliki
- C12N2770/36171—Demonstrated in vivo effect
Landscapes
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Biochemistry (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Biotechnology (AREA)
- Immunology (AREA)
- Public Health (AREA)
- Medicinal Chemistry (AREA)
- Pharmacology & Pharmacy (AREA)
- Animal Behavior & Ethology (AREA)
- Veterinary Medicine (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Epidemiology (AREA)
- Zoology (AREA)
- General Engineering & Computer Science (AREA)
- Virology (AREA)
- Wood Science & Technology (AREA)
- Biomedical Technology (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Mycology (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Peptides Or Proteins (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Saccharide Compounds (AREA)
- Medicinal Preparation (AREA)
Abstract
본 개시내용은, 무엇보다도, RNA 뉴클레오티드에 대한 5' 캡으로서 유용한 비천연 뉴클레오티드를 포함한다. 본 개시내용은 또한, 무엇보다도, 5' 캡으로서 비천연 뉴클레오티드를 포함하는 전달 및 백신 RNA 뉴클레오티드 조성물을 사용하는 조성물 및 방법을 포함한다.
Description
관련 출원에 대한 상호 참조
본 출원은 2020년 4월 21일 출원된 미국 가출원 번호 63/013,456 및 2020년 5월 5일 출원된 63/020,473의 이익을 주장하며, 각각은 모든 목적을 위해 그 전문이 본원에 참조로 포함된다.
서열 목록
본 출원은 ASCII 형식으로 전자적으로 제출된 서열 목록을 함유하며 그 전체가 본원에 참조로 포함된다. 2021년 4월 21일 생성된 상기 ASCII 사본의 명칭은 GSO_088WO_ sequencelisting.txt이고 크기는 422,240 바이트이다.
치료 적용을 위한 생리학적으로 중요한 단백질을 암호화하는 메신저 RNA(mRNA)는 유전 물질을 전달하기 위해 DNA-기반 플라스미드 및 바이러스 벡터에 비해 상당한 장점을 보인 바 있다. 각각의 활성 mRNA 분자에 존재하는 여러 구조적 요소는 암호화된 단백질을 효율적으로 번역하는 데 활용된다. 이러한 요소 중 하나는 mRNA의 5'-단부 상의 캡(Cap) 구조이며, 이는 모든 진핵생물 유기체(및 일부 바이러스)에 존재한다. 자연 발생 캡 구조는 구아닌 염기의 위치 N7에서 메틸화된 리보-구아노신 잔기를 포함한다. 이 7-메틸구아노신(7mG)은 mRNA 분자의 5'-단부에서 5'-을 통해 5'-트리포스페이트 쇄에 연결된다. 5'-단부 상의 7mGppp 단편의 존재는 mRNA 성숙에 필수적이며, 이는 mRNA를 엑소뉴클레아제에 의한 분해로부터 보호하고, 핵에서 세포질로 mRNA의 수송을 용이하게 하고, 번역 개시 복합체의 조립에서 핵심 역할을 한다.
(a) 통상적인 방법보다 덜 힘들고, (b) 전사 동안 양방향 개시를 제거하거나 또는 감소시키고, (c) 더 높은 mRNA 수율을 초래하고, (d) 현재 방법과 비교하여 (e) 상이한 5'-서열 갖는 이질적 생성물의 생산을 감소시키고 (f) 캡 1 및 캡 2 구조를 합성된 mRNA에 혼입하도록 추가 효소적 반응이 필요하지 않은 mRNA의 대규모 합성을 허용하는 조성물 및 방법에 대한 산업계의 요구가 있다. 또한 형광 염료, 방사성동위원소, 질량 태그 및/또는 분자의 5' 단부에 또는 근처에 비오틴과 같은 분자 결합 쌍의 하나의 파트너와 같은 특정 변형 및/또는 친화성 태그를 운반하는, 변형되고/되거나 비자연적인 뉴클레오시드를 함유하는 다양한 mRNA의 합성에 대한 요구가 있다.
본 개시내용은, 무엇보다도, 화학식 (I)의 화합물:
또는 이의 약제학적으로 허용되는 염을 포함한다. 추가로, 본 개시내용은, 무엇보다도, 약제학적 조성물, 화학식 (I)의 화합물의 사용 방법 및 제조 방법을 포함한다.
화학식 (I)의 화합물:
또는 이의 약제학적으로 허용되는 염이 본원에 제공된다:
상기 식에서
R1은 뉴클레오시드이고;
R2는 뉴클레오시드이고;
R3은 할로겐, 임의적으로 치환된 C1-C3 알킬, 또는 치환된 C1-C3 알콕시이고;
R4는 수소 또는 임의적으로 치환된 C1-C3 지방족이고;
R5는 수소 또는 임의적으로 치환된 C1-C3 지방족이고;
각각의 X는 독립적으로 O 또는 S이고,
임의적으로, 상기 화합물은 화학식 (I-1)의 화합물:
또는 이의 약제학적으로 허용되는 염이다.
일부 측면에서, R1은 아데닌이다. 일부 측면에서, R1은 N6-메틸화된 아데닌이다. 일부 측면에서, R2는 우라실이다. 일부 측면에서, R3은 플루오린, -CF3, -OCF3 및 -OCH2CH2OCH3으로 이루어진 군으로부터 선택된다. 일부 측면에서, 화합물은 하기로 이루어진 군:
및 이의 약제학적으로 허용되는 염으로부터 선택된다.
또한 RNA 올리고뉴클레오티드를 이를 필요로 하는 환자에게 투여하는 단계를 포함하는, 면역 반응을 자극하는 방법이 본원에 제공되며, 임의적으로 상기 면역 반응은 암을 치료하고, 상기 RNA 올리고뉴클레오티드는 본원에 기재된 화합물 중 임의의 것을 포함한다. 일부 측면에서, 암은 폐암, 흑색종, 유방암, 난소암, 전립선암, 신장암, 위암, 결장암, 고환암, 두경부암, 췌장암, 방광암, 뇌암, B-세포 림프종, 급성 골수성 백혈병, 성인 급성 림프모구성 백혈병, 만성 골수성 백혈병, 만성 림프구성 백혈병, T 세포 림프구성 백혈병, 비소세포 폐암, 및 소세포 폐암으로 이루어진 군으로부터 선택된다. 일부 측면에서, 암은 고형 종양이다. 일부 측면에서, 암은 MSS-CRC, NSCLC, 및 PDA로 이루어진 군으로부터 선택된다. 일부 측면에서, 암은 미세부수체 안정성-대장암(MSS-CRC), 비소세포 폐암(NSCLC), 췌장 도관 선암종(PDA), 및 위식도 선암종(GEA)으로 이루어진 군으로부터 선택된다.
또한 RNA 올리고뉴클레오티드를 이를 필요로 하는 환자에게 투여하는 단계를 포함하는, 감염의 면역화 또는 치료 방법이 본원에 제공되며, 상기 RNA 올리고뉴클레오티드는 본원에 기재된 화합물 중 임의의 것을 포함한다. 일부 측면에서, 감염은 진균 감염이다. 일부 측면에서, 감염은 바이러스 감염이다. 일부 측면에서, 바이러스 감염은 HIV 감염이다.
또한 개시 캡핑된 올리고뉴클레오티드 프라이머 및 DNA 주형을 포함하는 복합체가 본원에 제공되며, 상기 개시 캡핑된 올리고뉴클레오티드 프라이머는 본원에 기재된 화합물 중 임의의 것을 포함하고, 상기 DNA 주형은 뉴클레오티드 위치 + 1에서 첫번째 뉴클레오티드 및 뉴클레오티드 위치 +2에서 두번째 뉴클레오티드를 갖는 전사 시작 부위를 포함하는 프로모터 영역을 포함하고; 상기 개시 캡핑된 올리고뉴클레오티드 프라이머는 적어도 뉴클레오티드 위치 +1 및 +2에서 DNA 주형에 혼성화된다.
또한 자기-증폭 발현 시스템이 본원에 제공되며,
상기 자기-증폭 발현 시스템은 자기-증폭 백본을 포함하고,
상기 자기-증폭 백본은 자기-복제 RNA 바이러스의 하나 이상의 폴리뉴클레오티드 서열을 포함하고;
상기 자기-증폭 발현 시스템은 핵산 서열을 포함하고,
상기 각각의 요소는 5'에서 3'으로 연결되며, 하기 화학식으로 기재된다:
m7G-ppp-N1-N2-NV
상기 식에서
m7G는 7-메틸구아닐레이트(m7G) 캡이고,
ppp는 트리포스페이트 가교이고,
N1은 자기-복제 RNA 바이러스의 첫번째 내인성 5' 뉴클레오티드에 상응하는 자기-증폭 백본의 첫번째 뉴클레오티드이고,
N2는 자기-복제 RNA 바이러스의 두번째 내인성 5' 뉴클레오티드에 상응하는 자기-증폭 백본의 두번째 뉴클레오티드이고,
NV는 (1) 자기-증폭 백본의 하나 이상의 추가의 핵산 서열, 및 (2) 전달을 위한 적어도 하나의 외인성 핵산 서열을 포함하는 카세트를 포함하고, 임의적으로 상기 적어도 하나의 외인성 핵산 서열은 폴리펩티드-암호화 핵산 서열을 포함하고, 임의적으로 상기 폴리펩티드-암호화 핵산 서열은 항원-암호화 핵산 서열이고, 상기 카세트는 자기-증폭 백본에 작동가능하게 연결되거나 또는 작동가능하게 삽입된다.
일부 측면에서, 자기-증폭 발현 시스템의 전달을 위한 조성물은 다음을 포함한다: (A) 다음을 포함하는 하나 이상의 자기-증폭 mRNA(SAM) 벡터를 포함하는 자기-증폭 발현 시스템: (a) (i) 적어도 하나의 프로모터 뉴클레오티드 서열, (ii) 적어도 하나의 폴리아데닐화(폴리(A)) 서열을 포함하는 자기-증폭 백본, 및 (b) 임의적으로 (i) a. 임의적으로 (1) 야생형 핵산 서열에 의해 암호화된 상응하는 펩티드 서열과 구별되는 암호화된 에피토프 서열을 만드는 적어도 하나의 변경, 또는 (2) 병원체-유래 펩티드, 바이러스-유래 펩티드, 박테리아-유래 펩티드, 진균-유래 펩티드, 및 기생충-유래 펩티드로 이루어진 군으로부터 선택된 감염성 질환 유기체 펩티드를 암호화하는 핵산 서열을 포함하는, 에피토프-암호화 핵산 서열, b. 임의적으로 5' 링커 서열, 및 c. 임의적으로 3' 링커 서열을 포함하는, 적어도 하나의 항원-암호화 핵산 서열; (ii) 적어도 하나의 항원-암호화 핵산 서열에 작동가능하게 연결된 제2 프로모터 뉴클레오티드 서열; 또는 (iii) 임의적으로, 천연 폴리(A) 서열 또는 자기-복제 RNA 바이러스에 대한 외인성 폴리(A) 서열인 적어도 하나의 제2 폴리(A) 서열 중 하나 이상을 포함하는, 카세트; 및 (B) 임의적으로, 자기-증폭 발현 시스템을 캡슐화하는 지질-나노입자(LNP).
일부 측면에서, 자기-증폭 발현 시스템의 전달을 위한 조성물은 다음을 포함한다: (A) 다음을 포함하는 하나 이상의 자기-증폭 mRNA(SAM) 벡터를 포함하는 자기-증폭 발현 시스템: (a) 서열번호: 6에 제시된 핵산 서열을 포함하는 자기-증폭 백본으로, 상기 자기-증폭 백본 서열은 서브게놈 프로모터 뉴클레오티드 서열 및 폴리(A) 서열을 포함하고, 상기 서브게놈 프로모터 서열은 자기-복제 RNA 바이러스에 내인성이고, 상기 폴리(A) 서열은 자기-복제 RNA 바이러스 백본에 내인성인 것; 및 (b) 서브게놈 프로모터 뉴클레오티드 서열과 폴리(A) 서열 사이에 통합되고, 서브게놈 프로모터 뉴클레오티드 서열에 작동가능하게 연결되고, 임의적으로 a. 임의적으로 (1) 야생형 핵산 서열에 의해 암호화된 상응하는 펩티드 서열과 구별되는 암호화된 에피토프 서열을 만드는 적어도 하나의 변경, 또는 (2) 병원체-유래 펩티드, 바이러스-유래 펩티드, 박테리아-유래 펩티드, 진균-유래 펩티드, 및 기생충-유래 펩티드로 이루어진 군으로부터 선택된 감염성 질환 유기체 펩티드를 암호화하는 핵산 서열을 포함하는, 에피토프-암호화 핵산 서열, b. 임의적으로 5' 링커 서열, 및 c. 임의적으로 3' 링커 서열을 포함하는 적어도 하나의 항원-암호화 핵산 서열을 포함하는, 카세트; 및 (B) 임의적으로, 자기-증폭 발현 시스템을 캡슐화하는 지질-나노입자(LNP).
일부 측면에서, N1은 변형된 뉴클레오티드이고, 임의적으로 상기 변형된 뉴클레오티드는 변형된 당, 변형된 뉴클레오시드, 뉴클레오시드 유사체, 또는 이의 조합으로 이루어진 군으로부터 선택된 변형을 포함하고, 임의적으로 상기 변형된 당은 변형된 리보스이다. 일부 측면에서, N1은 변형된 아데노신이다. 일부 측면에서, N1은 N6-메틸아데노신 2'-OH-메틸화이다. 일부 측면에서, N2는 변형된 뉴클레오티드이고, 임의적으로 상기 변형된 뉴클레오티드는 변형된 당, 변형된 뉴클레오시드, 뉴클레오시드 유사체, 또는 이의 조합으로 이루어진 군으로부터 선택된 변형을 포함하고, 임의적으로 상기 변형된 당은 변형된 리보스이다. 일부 측면에서, N1 및 N2는 변형된 뉴클레오티드이고, 임의적으로 상기 변형된 뉴클레오티드는 각각 독립적으로 변형된 당, 변형된 뉴클레오시드, 뉴클레오시드 유사체, 또는 이의 조합으로 이루어진 군으로부터 선택된 변형을 포함하고, 임의적으로 상기 변형된 당은 변형된 리보스이다. 일부 측면에서, N1은 아데노신 또는 변형된 아데노신이고, 임의적으로 상기 변형된 아데노신은 변형된 당, 변형된 뉴클레오시드, 뉴클레오시드 유사체, 또는 이의 조합으로 이루어진 군으로부터 선택된 변형을 포함하고, 임의적으로 상기 변형된 당은 변형된 리보스이다. 일부 측면에서, N2는 우리딘 또는 변형된 우리딘이고, 임의적으로 상기 변형된 우리딘은 변형된 당, 변형된 뉴클레오시드, 뉴클레오시드 유사체, 또는 이의 조합으로 이루어진 군으로부터 선택된 변형을 포함하고, 임의적으로 상기 변형된 당은 변형된 리보스이다. 일부 측면에서, N1은 변형된 아데노신이고, 임의적으로 상기 변형된 아데노신은 변형된 당, 변형된 뉴클레오시드, 뉴클레오시드 유사체, 또는 이의 조합으로 이루어진 군으로부터 선택된 변형을 포함하고, 임의적으로 상기 변형된 당은 변형된 리보스이고, N2는 우리딘이다.
일부 측면에서, m7G-ppp-N1-N2는 화학식 (I-1):
또는 이의 약제학적으로 허용되는 염으로 표현되며, 상기 식에서 R1은 뉴클레오시드이고, 임의적으로 상기 R1은 아데닌이고, 임의적으로 상기 R1은 N6-메틸화된 아데닌이고; R2는 뉴클레오시드이고, 임의적으로 상기 R2는 우라실이고; R3은 할로겐, 임의적으로 치환된 C1-C3 알킬, 또는 치환된 C1-C3 알콕시이다. 일부 측면에서, R3은 플루오린, -CF3, -OCF3 및 -OCH2CH2OCH3으로 이루어진 군으로부터 선택된다
일부 측면에서, m7G-ppp-N1-N2는 하기로 이루어진 군으로부터 선택된 화학식:
및 이의 약제학적으로 허용되는 염으로 표현된다.
일부 측면에서, 자기-증폭 발현 시스템은 시험관내 전사에 의해 생산된다. 일부 측면에서, 시험관내 전사 과정은 본원에 기재된 m7G-ppp-N1-N2 중 임의의 것을 포함하는 개시 캡핑된 올리고뉴클레오티드의 사용을 포함한다.
또한 개시 캡핑된 올리고뉴클레오티드 프라이머 및 DNA 주형을 포함하는 복합체가 본원에 제공되며, 상기 개시 캡핑된 올리고뉴클레오티드 프라이머는 본원에 기재된 화학식 m7G-ppp-N1-N2를 갖는 임의의 화합물을 포함하고, 상기 DNA 주형은 5'에서 3'으로 (A) 뉴클레오티드 위치 + 1에서 첫번째 뉴클레오티드 및 뉴클레오티드 위치 +2에서 두번째 뉴클레오티드를 갖는 전사 시작 부위를 포함하는 RNA 전사 프로모터 영역, 및 (B) RNA 전사 프로모터 영역에 작동가능하게 연결된 본원에 기재된 화학식 N1-N2-NV를 갖는 임의의 서열을 포함하는 서열을 포함한다.
일부 측면에서, RNA 전사 프로모터 영역은 임의적으로 뉴클레오티드 서열 TAATACGACTCACTATA 또는 TAATACGACTCACTATT인 T7 프로모터 서열, 임의적으로 뉴클레오티드 서열 ATTTAGGTGACACTATA인, SP6 프로모터 서열, 또는 임의적으로 뉴클레오티드 서열 AATTAGGGCACACTATA인 K11 RNAP 프로모터 서열을 포함한다. 일부 측면에서, DNA 주형은 서열번호: 57에 제시된 서열을 포함하고, 카세트는 서열번호: 3 또는 서열번호: 5의 서열에 제시된 바와 같은 염기쌍 7544와 11175 사이의 결실을 대체하기 위해 서열번호: 6의 서열에 제시된 바와 같은 위치 7544에 삽입된다.
일부 측면에서, 자기-증폭 발현 시스템의 전달을 위한 조성물에서 카세트의 각각의 요소의 정렬된 순서는 5'에서 3'으로, 하기를 포함하는 화학식으로 기재된다:
Pa-(L5b-Nc-L3d)X-(G5e-Uf)Y-G3g
상기 식에서 P는 제2 프로모터 뉴클레오티드 서열을 포함하고, 여기서 a = 0 또는 1이고, N은 에피토프-암호화 핵산 서열 중 하나를 포함하고, 상기 에피토프-암호화 핵산 서열은 MHC 클래스 I 에피토프-암호화 핵산 서열을 포함하고, 여기서 c = 1이고, L5는 5' 링커 서열을 포함하고, 여기서 b = 0 또는 1이고, L3은 3' 링커 서열을 포함하고, 여기서 d = 0 또는 1이고, G5는 GPGPG 아미노산 링커를 암호화하는 적어도 하나의 핵산 서열 중 하나를 포함하고, 여기서 e = 0 또는 1이고, G3은 GPGPG 아미노산 링커를 암호화하는 적어도 하나의 핵산 서열 중 하나를 포함하고, 여기서 g = 0 또는 1이고, U는 적어도 하나의 MHC 클래스 II 에피토프-암호화 핵산 서열 중 하나를 포함하고, 여기서 f = 1이고, X = 1 내지 400이며, 여기서 각각의 X에 대해 상응하는 Nc는 MHC 클래스 I 에피토프-암호화 핵산 서열이고, Y = 0, 1, 또는 2이며, 여기서 각각의 Y에 대해 상응하는 Uf는 MHC 클래스 II 에피토프-암호화 핵산 서열이다.
일부 측면에서, 각각의 X에 대해 상응하는 Nc는 별개의 MHC 클래스 I 에피토프-암호화 핵산 서열이다. 일부 측면에서, 각각의 Y에 대해 상응하는 Uf는 별개의 MHC 클래스 II 에피토프-암호화 핵산 서열이다. 일부 측면에서, a = 0, b = 1, d = 1, e = 1, g = 1, h = 1, X = 10, Y = 2이고, 적어도 하나의 프로모터 뉴클레오티드 서열은 자기-증폭 백본에 의해 제공되는 단일 서브게놈 프로모터 뉴클레오티드 서열이고, 적어도 하나의 폴리아데닐화 폴리(A) 서열은 자기-증폭 백본에 의해 제공되는 적어도 80개의 연속 A 뉴클레오티드의 폴리(A) 서열이고, 카세트는 서브게놈 프로모터 뉴클레오티드 서열과 폴리(A) 서열 사이에 통합되고, 상기 카세트는 서브게놈 프로모터 뉴클레오티드 서열 및 폴리(A) 서열에 작동가능하게 연결되고, 각각의 N은 7-15개 아미노산 길이의 MHC 클래스 I 에피토프를 암호화하고, L5는 MHC I 에피토프의 천연 N-말단 아미노산 서열을 암호화하는 천연 5' 링커 서열이고, 상기 5' 링커 서열은 적어도 3개 아미노산 길이인 펩티드를 암호화하고, L3은 MHC I 에피토프의 천연 C-말단 아미노산 서열을 암호화하는 천연 3' 링커 서열이고, 상기 3' 링커 서열은 적어도 3개 아미노산 길이인 펩티드를 암호화하고, U는 각각의 PADRE 클래스 II 서열 및 파상풍 톡소이드 MHC 클래스 II 서열이고, 자기-증폭 백본은 서열번호: 6에 제시된 서열이고, 각각의 MHC 클래스 I 에피토프-암호화 핵산 서열은 13 내지 25개 아미노산 길이인 폴리펩티드를 암호화한다.
일부 측면에서, 전달을 위한 적어도 하나의 외인성 핵산 서열은 폴리펩티드-암호화 핵산 서열을 포함한다. 일부 측면에서, 폴리펩티드-암호화 핵산 서열은 항원-암호화 핵산 서열을 암호화한다. 일부 측면에서, 항원-암호화 핵산 서열은 MHC 클래스 I 에피토프, MHC 클래스 II 에피토프, B 세포 반응을 자극할 수 있는 에피토프, 또는 이의 조합을 포함한다. 일부 측면에서, 항원-암호화 핵산 서열은 전장 단백질, 단백질 서브유닛, 단백질 도메인, 또는 이의 조합을 암호화하는 서열을 포함한다. 일부 측면에서, 폴리펩티드-암호화 핵산 서열은 전장 단백질 또는 이의 기능적 부분을 암호화한다. 일부 측면에서, 전장 단백질 또는 이의 기능적 부분은 항체, 사이토카인, 키메라 항원 수용체(CAR), T-세포 수용체, 및 게놈-편집 시스템 뉴클레아제로 이루어진 군으로부터 선택된다.
일부 측면에서, 전달을 위한 적어도 하나의 외인성 핵산 서열은 비코딩 핵산 서열을 포함하는 적어도 하나의 핵산 서열을 포함한다. 일부 측면에서, 비코딩 핵산 서열은 RNA 간섭(RNAi) 폴리뉴클레오티드 또는 게놈-편집 시스템 폴리뉴클레오티드이다.
일부 측면에서, LNP는 이온화가능한 아미노 지질, 양이온성 지질, 포스파티딜콜린, 콜레스테롤, PEG-기반 코트 지질, 또는 이의 조합으로 이루어진 군으로부터 선택된 지질을 포함한다. 일부 측면에서, LNP는 이온화가능한 아미노 지질, 포스파티딜콜린, 콜레스테롤, 및 PEG-기반 코트 지질을 포함한다. 일부 측면에서, 이온화가능한 아미노 지질은 MC3-유사(디리놀레일메틸-4-디메틸아미노부티레이트) 분자를 포함한다. 일부 측면에서, LNP-캡슐화된 발현 시스템은 약 100nm의 직경을 갖는다. 일부 측면에서, LNP-캡슐화된 발현 시스템은 60 내지 140nm의 직경을 갖는다.
일부 측면에서, 자기-증폭 발현 시스템의 전달을 위한 조성물은 근육내(IM), 피내(ID), 피하(SC), 유리체내(IVT), 척추강내, 또는 정맥내(IV) 투여를 위해 제형화된다. 일부 측면에서, 자기-증폭 발현 시스템의 전달을 위한 조성물은 근육내(IM) 투여를 위해 제형화된다.
일부 측면에서, 카세트는 적어도 하나의 프로모터 뉴클레오티드 서열과 적어도 하나의 폴리(A) 서열 사이에 통합된다. 일부 측면에서, 적어도 하나의 프로모터 뉴클레오티드 서열은 카세트에 작동가능하게 연결된다.
일부 측면에서, 하나 이상의 SAM 벡터는 하나 이상의 양성-가닥 RNA 벡터를 포함한다. 일부 측면에서, 하나 이상의 SAM 벡터는 하나 이상의 음성-가닥 RNA 벡터를 포함한다. 일부 측면에서, 하나 이상의 음성-가닥 RNA 벡터는 홍역 바이러스 또는 랍도바이러스의 적어도 하나의 폴리뉴클레오티드 서열을 포함한다.
일부 측면에서, 하나 이상의 SAM 벡터는 포유류 세포 내에서 자기-증폭된다. 일부 측면에서, 자기-복제 RNA 바이러스는 알파바이러스; 플라비바이러스, 홍역, 및 랍도바이러스로 이루어진 군으로부터 선택된다.
일부 측면에서, 자기-증폭 백본은 알파바이러스의 적어도 하나의 폴리뉴클레오티드 서열을 포함하고, 임의적으로 상기 알파바이러스는 아우라(Aura) 바이러스, 포트 모간(Fort Morgan) 바이러스, 베네수엘라 말 뇌염 바이러스, 로스 리버(Ross River) 바이러스, 셈리키 삼림열(Semliki Forest) 바이러스, 신드비스(Sindbis) 바이러스, 및 마야로(Mayaro) 바이러스로 이루어진 군으로부터 선택된다. 일부 측면에서, 자기-증폭 백본은 베네수엘라 말 뇌염 바이러스의 적어도 하나의 뉴클레오티드 서열을 포함한다. 일부 측면에서, 자기-증폭 백본은 아우라 바이러스, 포트 모간 바이러스, 베네수엘라 말 뇌염 바이러스, 로스 리버 바이러스, 셈리키 삼림열 바이러스, 신드비스 바이러스, 또는 마야로 바이러스의 뉴클레오티드 서열에 의해 암호화된 적어도 비구조적 단백질-매개 증폭을 위한 서열, 서브게놈 프로모터 서열, 폴리(A) 서열, 비구조적 단백질 1(nsP1) 유전자, nsP2 유전자, nsP3 유전자, 및 nsP4 유전자를 포함한다. 일부 측면에서, 자기-증폭 백본은 아우라 바이러스, 포트 모간 바이러스, 베네수엘라 말 뇌염 바이러스, 로스 리버 바이러스, 셈리키 삼림열 바이러스, 신드비스 바이러스, 또는 마야로 바이러스의 뉴클레오티드 서열에 의해 암호화된 적어도 비구조적 단백질-매개 증폭을 위한 서열, 서브게놈 프로모터 서열, 및 폴리(A) 서열을 포함한다. 일부 측면에서, 비구조적 단백질-매개 증폭을 위한 서열은 알파바이러스 5' UTR, 51-nt CSE, 24-nt CSE, 26S 서브게놈 프로모터 서열, 19-nt CSE, 알파바이러스 3' UTR, 또는 이의 조합으로 이루어진 군으로부터 선택된다. 일부 측면에서, 자기-증폭 백본은 구조적 비리온 단백질 캡시드, E2 및 E1을 암호화하지 않으며, 임의적으로 상기 E1은 전장 E1이거나, 또는 구조적 비리온 단백질 캡시드, E3, E2, 6K를 암호화하지 않는다. 일부 측면에서, 카세트는 아우라 바이러스, 포트 모간 바이러스, 베네수엘라 말 뇌염 바이러스, 로스 리버 바이러스, 셈리키 삼림열 바이러스, 신드비스 바이러스, 또는 마야로 바이러스의 폴리뉴클레오티드 서열 내에서 구조적 비리온 단백질 대신에 삽입된다. 일부 측면에서, 베네수엘라 말 뇌염 바이러스는 서열번호: 3 또는 서열번호: 5의 서열을 포함한다. 일부 측면에서, 베네수엘라 말 뇌염 바이러스는 염기쌍 7544와 11175 사이의 결실을 추가로 포함하는 서열번호: 3 또는 서열번호: 5의 서열을 포함한다. 일부 측면에서, 자기-증폭 백본은 서열번호: 6 또는 서열번호: 7에 제시된 서열을 포함한다. 일부 측면에서, 카세트는 서열번호: 3 또는 서열번호: 5의 서열에 제시된 바와 같은 염기쌍 7544와 11175 사이의 결실을 대체하기 위해 위치 7544에 삽입된다. 일부 측면에서, 카세트의 삽입은 nsP1-4 유전자 및 적어도 하나의 핵산 서열을 포함하는 폴리시스트로닉 RNA의 전사를 제공하며, 상기 nsP1-4 유전자 및 적어도 하나의 핵산 서열은 별도의 오픈 리딩 프레임에 있다.
일부 측면에서, 적어도 하나의 프로모터 뉴클레오티드 서열은 자기-복제 RNA 바이러스에 의해 암호화된 천연("내인성"으로도 지칭됨) 프로모터 뉴클레오티드 서열이며, 임의적으로 상기 천연 프로모터 뉴클레오티드 서열은 서브게놈 프로모터 뉴클레오티드 서열이다. 일부 측면에서, 적어도 하나의 프로모터 뉴클레오티드 서열은 외인성 RNA 프로모터이다. 일부 측면에서, 제2 프로모터 뉴클레오티드 서열은 서브게놈 프로모터 뉴클레오티드 서열이다. 일부 측면에서, 제2 프로모터 뉴클레오티드 서열은 다중 서브게놈 프로모터 뉴클레오티드 서열을 포함하고, 상기 각각의 서브게놈 프로모터 뉴클레오티드 서열은 별도의 오픈 리딩 프레임 중 하나 이상의 전사를 제공한다.
일부 측면에서, 하나 이상의 SAM 벡터는 각각 적어도 300nt 크기이다. 일부 측면에서, 하나 이상의 SAM 벡터는 각각 적어도 1kb 크기이다. 일부 측면에서, 하나 이상의 SAM 벡터는 각각 2kb 크기이다. 일부 측면에서, SAM 벡터는 각각 5kb 미만의 크기이다.
일부 측면에서, 적어도 하나의 항원-암호화 핵산 서열은 2개 이상의 항원-암호화 핵산 서열을 포함한다. 일부 측면에서, 각각의 항원-암호화 핵산 서열은 서로 직접적으로 연결된다.
일부 측면에서, 각각의 항원-암호화 핵산 서열은 링커를 암호화하는 핵산 서열과 별개의 항원-암호화 핵산 서열에 연결된다. 일부 측면에서, 링커는 2개의 MHC 클래스 I 에피토프-암호화 핵산 서열 또는 MHC 클래스 I 에피토프-암호화 핵산 서열을 MHC 클래스 II 에피토프-암호화 핵산 서열에 연결한다. 일부 측면에서, 링커는 (1) 적어도 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개 잔기 길이의 연속 글리신 잔기; (2) 적어도 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개 잔기 길이의 연속 알라닌 잔기; (3) 2개의 아르기닌 잔기(RR); (4) 알라닌, 알라닌, 티로신(AAY); (5) 포유류 프로테아좀에 의해 효율적으로 처리되는 적어도 2, 3, 4, 5, 6, 7, 8 , 9, 또는 10개 아미노산 잔기 길이의 공통 서열 및 (6) 기원의 동족 단백질로부터 유래되고 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 또는 2-20개 아미노산 잔기 길이인 항원 옆에 있는 하나 이상의 천연 서열로 이루어진 군으로부터 선택된다. 일부 측면에서, 링커는 2개의 MHC 클래스 II 에피토프-암호화 핵산 서열 또는 MHC 클래스 II 서열을 MHC 클래스 I 에피토프-암호화 핵산 서열에 연결한다. 일부 측면에서, 링커는 서열 GPGPG를 포함한다.
일부 측면에서, 항원-암호화 핵산 서열은 에피토프-암호화 핵산 서열의 발현, 안정성, 세포 교류, 처리 및 제시, 및/또는 면역원성을 향상시키는 별도의 또는 연속 서열에 작동가능하게 또는 직접적으로 연결된다. 일부 측면에서, 별도의 또는 연속 서열은 유비퀴틴 서열, 프로테아좀 표적화를 증가시키도록 변형된 유비퀴틴 서열(예를 들어, 유비퀴틴 서열은 위치 76에 Gly에서 Ala로의 치환을 함유함), 면역글로불린 신호 서열(예를 들어, IgK), 주요 조직적합성 클래스 I 서열, 리소좀-연관 막 단백질(LAMP)-1, 인간 수지상 세포 리소좀-연관 막 단백질, 및 주요 조직적합성 클래스 II 서열 중 적어도 하나를 포함하며; 임의적으로 상기 프로테아좀 표적화를 증가시키도록 변형된 유비퀴틴 서열은 A76이다.
일부 측면에서, 적어도 하나의 항원-암호화 핵산 서열은 적어도 2-10개, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개의 항원-암호화 핵산 서열을 포함하고, 임의적으로 상기 각각의 항원-암호화 핵산 서열은 별개의 항원-암호화 핵산 서열을 암호화한다. 일부 측면에서, 적어도 하나의 항원-암호화 핵산 서열은 적어도 11-20개, 15-20개, 11-100개, 11-200개, 11-300개, 11-400개, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20개 또는 최대 400개의 항원-암호화 핵산 서열을 포함하고, 임의적으로 상기 각각의 항원-암호화 핵산 서열은 별개의 항원-암호화 핵산 서열을 암호화한다. 일부 측면에서, 적어도 하나의 항원-암호화 핵산 서열은 적어도 11-20개, 15-20개, 11-100개, 11-200개, 11-300개, 11-400개, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20개 또는 최대 400개의 항원-암호화 핵산 서열을 포함한다. 일부 측면에서, 적어도 하나의 항원-암호화 핵산 서열은 적어도 2-400개의 항원-암호화 핵산 서열을 포함하고 상기 항원-암호화 핵산 서열 중 적어도 2개는 세포 표면 상의 MHC 클래스 I에 의해 제시되는 에피토프 서열 또는 이의 부분을 암호화한다. 일부 측면에서, 각각의 항원-암호화 핵산 서열은 독립적으로 적어도 2-10개, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개의 에피토프-암호화 핵산 서열을 포함하고, 임의적으로 상기 각각의 에피토프-암호화 핵산 서열은 별개의 에피토프-암호화 핵산 서열을 암호화한다. 일부 측면에서, 각각의 항원-암호화 핵산 서열은 독립적으로 적어도 11-20개, 15-20개, 11-100개, 11-200개, 11-300개, 11-400개, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20개 또는 최대 400개의 에피토프-암호화 핵산 서열을 포함하고, 임의적으로 상기 각각의 에피토프-암호화 핵산 서열은 별개의 에피토프-암호화 핵산 서열을 암호화한다. 일부 측면에서, 각각의 항원-암호화 핵산 서열은 독립적으로 적어도 11-20개, 15-20개, 11-100개, 11-200개, 11-300개, 11-400개, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20개 또는 최대 400개의 에피토프-암호화 핵산 서열을 포함한다. 일부 측면에서, 각각의 항원-암호화 핵산 서열은 독립적으로 적어도 2-400개의 에피토프-암호화 핵산 서열을 포함하고 상기 에피토프-암호화 핵산 서열 중 적어도 2개는 세포 표면 상의 MHC 클래스 I에 의해 제시되는 에피토프 서열 또는 이의 부분을 암호화한다.
일부 측면에서, MHC 클래스 I 에피토프 중 적어도 2개는 세포 표면, 임의적으로 종양 세포 표면 또는 감염된 세포 표면 상의 MHC 클래스 I에 의해 제시된다.
일부 측면에서, 에피토프-암호화 핵산 서열은 적어도 하나의 MHC 클래스 I 에피토프-암호화 핵산 서열을 포함하고, 상기 각각의 항원-암호화 핵산 서열은 8 내지 35개 아미노산 길이, 임의적으로 9-17개, 9-25개, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34 또는 35개 아미노산 길이의 폴리펩티드 서열을 암호화한다.
일부 측면에서, 적어도 하나의 MHC 클래스 II 에피토프-암호화 핵산 서열이 존재한다. 일부 측면에서, 적어도 하나의 MHC 클래스 II 에피토프-암호화 핵산 서열이 존재하고 야생형 핵산 서열에 의해 암호화된 상응하는 펩티드 서열과 구별되는 암호화된 에피토프 서열을 만드는 적어도 하나의 변경을 포함하는 적어도 하나의 MHC 클래스 II 에피토프-암호화 핵산 서열을 포함한다.
일부 측면에서, 에피토프-암호화 핵산 서열은 MHC 클래스 II 에피토프-암호화 핵산 서열을 포함하고 상기 각각의 항원-암호화 핵산 서열은 12-20개, 12, 13, 14, 15, 16, 17, 18, 19, 20개, 또는 20-40개 아미노산 길이인 폴리펩티드 서열을 암호화한다. 일부 측면에서, 에피토프-암호화 핵산 서열은 MHC 클래스 II 에피토프-암호화 핵산 서열을 포함하고, 상기 적어도 하나의 MHC 클래스 II 에피토프-암호화 핵산 서열이 존재하고, 상기 적어도 하나의 MHC 클래스 II 에피토프-암호화 핵산 서열은 적어도 하나의 범용 MHC 클래스 II 에피토프-암호화 핵산 서열을 포함하고, 임의적으로 상기 적어도 하나의 범용 서열은 파상풍 톡소이드 및 PADRE 중 적어도 하나를 포함한다.
일부 측면에서, 적어도 하나의 프로모터 뉴클레오티드 서열 또는 제2 프로모터 뉴클레오티드 서열은 유도성이다. 일부 측면에서, 적어도 하나의 프로모터 뉴클레오티드 서열 또는 제2 프로모터 뉴클레오티드 서열은 비유도성이다. 일부 측면에서, 적어도 하나의 폴리(A) 서열은 자기-복제 바이러스에 고유한 폴리(A) 서열을 포함한다. 일부 측면에서, 적어도 하나의 폴리(A) 서열은 자기-복제 바이러스에 외인성인 폴리(A) 서열을 포함한다. 일부 측면에서, 적어도 하나의 폴리(A) 서열은 적어도 하나의 핵산 서열 중 적어도 하나에 작동가능하게 연결된다. 일부 측면에서, 적어도 하나의 폴리(A) 서열은 적어도 20개, 적어도 30개, 적어도 40개, 적어도 50개, 적어도 60개, 적어도 70개, 적어도 80개, 적어도 90개, 적어도 100개, 적어도 110개, 또는 적어도 120개의 연속 A 뉴클레오티드이다. 일부 측면에서, 적어도 하나의 폴리(A) 서열은 적어도 80개의 연속 A 뉴클레오티드이다.
일부 측면에서, 에피토프-암호화 핵산 서열은 MHC 클래스 I 에피토프-암호화 핵산 서열을 포함하고, 상기 MHC 클래스 I 에피토프-암호화 핵산 서열은 (a) 종양, 감염된 세포, 또는 감염성 질환 유기체로부터 엑솜, 전사체, 또는 전체 게놈 뉴클레오티드 서열분석 데이터 중 적어도 하나를 수득하는 단계로, 상기 뉴클레오티드 서열분석 데이터는 각각의 에피토프 세트의 펩티드 서열을 나타내는 데이터를 수득하는 데 사용되는 것인, 단계; (b) 각각의 에피토프의 펩티드 서열을 제시 모델에 입력하여 각각의 에피토프가 세포 표면, 임의적으로 종양 세포 표면 또는 감염된 세포 표면 상의 MHC 대립유전자 중 하나 이상에 의해 제시되는, 적어도 수신된 질량 분광법 데이터에 기반하여 식별된 수치 가능성 세트를 생성하는 단계; 및 (c) 수치 가능성 세트에 기반한 에피토프 세트의 서브세트를 선택하여 MHC 클래스 I 에피토프-암호화 핵산 서열을 생성하는 데 사용되는 선택된 에피토프 세트를 생성하는 단계를 수행함으로써 선택된다.
일부 측면에서, 각각의 MHC 클래스 I 에피토프-암호화 핵산 서열은 (a) 종양, 감염된 세포, 또는 감염성 질환 유기체로부터 엑솜, 전사체, 또는 전체 게놈 뉴클레오티드 서열분석 데이터 중 적어도 하나를 수득하는 단계로, 상기 뉴클레오티드 서열분석 데이터는 각각의 에피토프 세트의 펩티드 서열을 나타내는 데이터를 수득하는 데 사용되는 것인, 단계; (b) 각각의 에피토프의 펩티드 서열을 제시 모델에 입력하여 세포 표면, 임의적으로 종양 세포 표면 또는 감염된 세포 표면 상의 MHC 대립유전자 중 하나 이상에 의해 제시되는, 적어도 수신된 질량 분광법 데이터에 기반하여 식별된 수치 가능성 세트를 생성하는 단계; 및 (c) 수치 가능성 세트에 기반한 에피토프 세트의 서브세트를 선택하여 적어도 20개의 MHC 클래스 I 에피토프-암호화 핵산 서열을 생성하는 데 사용되는 선택된 에피토프 세트를 생성하는 단계를 수행함으로써 선택된다. 일부 측면에서, 선택된 에피토프 세트의 수는 2-20이다.
일부 측면에서, 제시 모델은 다음 사이의 의존성을 나타낸다: (a) 펩티드 서열의 특정 위치에서 MHC 대립유전자 중 특정한 하나 및 특정 아미노산의 쌍의 존재; 및 (b) 상기 쌍의 MHC 대립유전자 중 특정한 하나에 의한, 특정 위치에 특정 아미노산을 포함하는 이러한 펩티드 서열의 세포 표면, 임의적으로 종양 세포 표면 또는 감염된 세포 표면 상의 제시 가능성. 일부 측면에서, 선택된 에피토프 세트를 선택하는 단계는 제시 모델에 기반한 선택되지 않은 에피토프에 비해, 세포 표면, 임의적으로 종양 세포 표면 또는 감염된 세포 표면 상에 제시될 가능성이 증가된 에피토프를 선택하는 것을 포함한다. 일부 측면에서, 선택된 에피토프 세트를 선택하는 단계는 제시 모델에 기반한 선택되지 않은 에피토프에 비해 대상체에서 종양-특이적 또는 감염성 질환 유기체-특이적 면역 반응을 자극할 수 있는 가능성이 증가된 에피토프를 선택하는 것을 포함한다. 일부 측면에서, 선택된 에피토프 세트를 선택하는 단계는 제시 모델에 기반한 선택되지 않은 에피토프에 비해 전문 항원 제시 세포(APC)에 의해 미처리() T 세포에 제시될 수 있는 가능성이 증가된 에피토프를 선택하는 것을 포함하고, 임의적으로 상기 APC는 수지상 세포(DC)이다. 일부 측면에서, 선택된 에피토프 세트를 선택하는 단계는 제시 모델에 기반한 선택되지 않은 에피토프에 비해 중추 또는 말초 관용을 통해 억제를 겪을 가능성이 감소된 에피토프를 선택하는 것을 포함한다. 일부 측면에서, 선택된 에피토프 세트를 선택하는 것은 제시 모델에 기반한 선택되지 않은 에피토프에 비해 대상체에서 정상 조직에 대한 자가면역 반응을 자극할 수 있는 가능성이 감소된 에피토프를 선택하는 것을 포함한다. 일부 측면에서, 엑솜 또는 전사체 뉴클레오티드 서열분석 데이터는 종양 세포 또는 조직, 감염된 세포, 또는 감염성 질환 유기체 상에서 서열분석을 수행함으로써 수득된다. 일부 측면에서, 서열분석은 차세대 서열분석(NGS) 또는 임의의 대규모 병렬 서열분석 접근법이다.
또한 자기-증폭 발현 시스템을 생산하는 방법이 본원에 제공되며, 상기 방법은 a) DNA 주형을 제공하는 단계로, 상기 각각의 요소는 5'에서 3'으로 연결되며, 화학식: P-N1-N2-NV로 기재되되, 여기서, P는 뉴클레오티드 위치 + 1에서 첫번째 뉴클레오티드 및 뉴클레오티드 위치 +2에서 두번째 뉴클레오티드를 갖는 전사 시작 부위를 포함하는 RNA 전사 프로모터 영역을 포함하고, N1은 자기-복제 RNA 바이러스의 첫번째 내인성 5' 뉴클레오티드에 상응하는 자기-증폭 백본의 첫번째 뉴클레오티드이고, N2는 자기-복제 RNA 바이러스의 두번째 내인성 5' 뉴클레오티드에 상응하는 자기-증폭 백본의 두번째 뉴클레오티드이고, NV는 (1) 자기-증폭 백본의 하나 이상의 추가의 핵산 서열, 및 (2) 전달을 위한 적어도 하나의 외인성 핵산 서열을 포함하는 카세트를 포함하고, 임의적으로 상기 적어도 하나의 외인성 핵산 서열은 폴리펩티드-암호화 핵산 서열을 포함하고, 임의적으로 상기 폴리펩티드-암호화 핵산 서열은 항원-암호화 핵산 서열이고, 상기 카세트는 자기-증폭 백본에 작동가능하게 연결되거나 또는 작동가능하게 삽입되는 것인, 단계; b) 핵산 서열을 포함하는 개시 캡핑된 올리고뉴클레오티드 프라이머를 제공하는 단계로, 상기 각각의 요소는 5'에서 3'으로 연결되며, 화학식 m7G-ppp-N1'-N2'로 기재되되, 여기서 m7G는 7-메틸구아닐레이트(m7G) 캡이고, ppp는 트리포스페이트 가교이고, N1'은 DNA 주형의 N1에 상응하는 뉴클레오티드이고, N2'은 DNA 주형의 N2에 상응하는 뉴클레오티드인, 단계, 및 c) RNA 전사 프로모터 영역으로부터 전사를 개시할 수 있는 RNA 폴리머라제를 제공하는 단계 d) 핵산 서열을 포함하는 자기-증폭 발현 시스템을 생산하기에 충분한 조건 하에 DNA 주형, 개시 캡핑된 올리고뉴클레오티드 프라이머, 및 RNA 폴리머라제 폴리머라제를 접촉시키는 단계로서, 상기 각각의 요소는 5'에서 3'으로 연결되며, 화학식 m7G-ppp-N1'-N2'-NV로 기재되는 것인, 단계를 포함한다.
일부 측면에서, RNA 전사 프로모터 영역은 임의적으로 뉴클레오티드 서열 TAATACGACTCACTATA 또는 TAATACGACTCACTATT인 T7 프로모터 서열, 임의적으로 뉴클레오티드 서열 ATTTAGGTGACACTATA인 SP6 프로모터 서열, 또는 임의적으로 뉴클레오티드 서열 AATTAGGGCACACTATA인 K11 RNAP 프로모터 서열을 포함한다. 일부 측면에서, DNA 주형은 서열번호: 57에 제시된 서열을 포함하고, 카세트는 서열번호: 3 또는 서열번호: 5의 서열에 제시된 바와 같은 염기쌍 7544와 11175 사이의 결실을 대체하기 위해 서열번호: 6의 서열에 제시된 바와 같은 위치 7544에 삽입된다.
일부 측면에서, N1'은 변형된 뉴클레오티드이고, 임의적으로 상기 변형된 뉴클레오티드는 변형된 당, 변형된 뉴클레오시드, 뉴클레오시드 유사체, 또는 이의 조합으로 이루어진 군으로부터 선택된 변형을 포함하고, 임의적으로 상기 변형된 당은 변형된 리보스이다. 일부 측면에서, N2'은 변형된 뉴클레오티드이고, 임의적으로 상기 변형된 뉴클레오티드는 변형된 당, 변형된 뉴클레오시드, 뉴클레오시드 유사체, 또는 이의 조합으로 이루어진 군으로부터 선택된 변형을 포함하고, 임의적으로 상기 변형된 당은 변형된 리보스이다. 일부 측면에서, N1'은 아데노신 또는 변형된 아데노신이고, 임의적으로 상기 변형된 아데노신은 변형된 당, 변형된 뉴클레오시드, 뉴클레오시드 유사체, 또는 이의 조합으로 이루어진 군으로부터 선택된 변형을 포함하고, 임의적으로 상기 변형된 당은 변형된 리보스이다. 일부 측면에서, N2'은 우리딘 또는 변형된 우리딘이고, 임의적으로 상기 변형된 우리딘은 변형된 당, 변형된 뉴클레오시드, 뉴클레오시드 유사체, 또는 이의 조합으로 이루어진 군으로부터 선택된 변형을 포함하고, 임의적으로 상기 변형된 당은 변형된 리보스이다. 일부 측면에서, N1'은 변형된 아데노신이고, 임의적으로 상기 변형된 아데노신은 변형된 당, 변형된 뉴클레오시드, 뉴클레오시드 유사체, 또는 이의 조합으로 이루어진 군으로부터 선택된 변형을 포함하고, 임의적으로 상기 변형된 당은 변형된 리보스이고, N2'은 우리딘이다.
일부 측면에서, 개시 캡핑된 올리고뉴클레오티드 프라이머는 화학식 (I-1):
또는 이의 약제학적으로 허용되는 염으로 표현되며, 상기 식에서 R1은 뉴클레오시드이고, 임의적으로 상기 R1은 아데닌이고, 임의적으로 상기 R1은 N6-메틸화된 아데닌이고; R2는 뉴클레오시드이고, 임의적으로 상기 R2는 우라실이고; R3은 할로겐, 임의적으로 치환된 C1-C3 알킬, 또는 치환된 C1-C3 알콕시이다.
일부 측면에서, R3은 플루오린, -CF3, -OCF3 및 -OCH2CH2OCH3으로 이루어진 군으로부터 선택된다. 일부 측면에서, 개시 캡핑된 올리고뉴클레오티드 프라이머는 하기로 이루어진 군으로부터 선택된 화학식:
및 이의 약제학적으로 허용되는 염으로 표현된다.
또한 대상체에서 면역 반응을 자극하는 방법이 본원에 제공되며, 상기 방법은 자기-증폭 발현 시스템의 전달을 위한 조성물을 대상체에게 투여하는 단계를 포함하고, 상기 자기-증폭 발현 시스템은 자기-증폭 백본을 포함하고, 상기 자기-증폭 백본은 자기-복제 RNA 바이러스의 하나 이상의 폴리뉴클레오티드 서열을 포함하고; 상기 자기-증폭 발현 시스템은 핵산 서열을 포함하고, 상기 각각의 요소는 5'에서 3'으로 연결되며, 화학식 m7G-ppp-N1-N2-NV로 기재되되, 여기서 m7G는 7-메틸구아닐레이트(m7G) 캡이고, ppp는 트리포스페이트 가교이고, N1은 자기-복제 RNA 바이러스의 첫번째 내인성 5' 뉴클레오티드에 상응하는 자기-증폭 백본의 첫번째 뉴클레오티드이고, N2는 자기-복제 RNA 바이러스의 두번째 내인성 5' 뉴클레오티드에 상응하는 자기-증폭 백본의 두번째 뉴클레오티드이고, NV는 (1) 자기-증폭 백본의 하나 이상의 추가의 핵산 서열, 및 (2) 전달을 위한 적어도 하나의 외인성 핵산 서열을 포함하는 카세트를 포함하고, 임의적으로 상기 적어도 하나의 외인성 핵산 서열은 폴리펩티드-암호화 핵산 서열을 포함하고, 임의적으로 상기 폴리펩티드-암호화 핵산 서열은 항원-암호화 핵산 서열이고, 상기 카세트는 자기-증폭 백본에 작동가능하게 연결되거나 또는 작동가능하게 삽입된다.
일부 측면에서, 자기-증폭 발현 시스템의 전달을 위한 조성물은 다음을 포함한다: (A) 다음을 포함하는 하나 이상의 자기-증폭 mRNA(SAM) 벡터를 포함하는 자기-증폭 발현 시스템: (a) (i) 적어도 하나의 프로모터 뉴클레오티드 서열, (ii) 적어도 하나의 폴리아데닐화(폴리(A)) 서열을 포함하는, 자기-증폭 백본, 및 (b) 임의적으로 (i) a. 임의적으로 (1) 야생형 핵산 서열에 의해 암호화된 상응하는 펩티드 서열과 구별되는 암호화된 에피토프 서열을 만드는 적어도 하나의 변경, 또는 (2) 병원체-유래 펩티드, 바이러스-유래 펩티드, 박테리아-유래 펩티드, 진균-유래 펩티드, 및 기생충-유래 펩티드로 이루어진 군으로부터 선택된 감염성 질환 유기체 펩티드를 암호화하는 핵산 서열을 포함하는, 에피토프-암호화 핵산 서열, b. 임의적으로 5' 링커 서열, 및 c. 임의적으로 3' 링커 서열을 포함하는, 적어도 하나의 항원-암호화 핵산 서열; (ii) 적어도 하나의 항원-암호화 핵산 서열에 작동가능하게 연결된 제2 프로모터 뉴클레오티드 서열; 또는 (iii) 임의적으로, 자기-복제 RNA 바이러스에 대한 천연 폴리(A) 서열 또는 외인성 폴리(A) 서열인 적어도 하나의 제2 폴리(A) 서열 중 하나 이상을 포함하는, 카세트; 및 (B) 임의적으로, 자기-증폭 발현 시스템을 캡슐화하는 지질-나노입자(LNP).
일부 측면에서, 자기-증폭 발현 시스템의 전달을 위한 조성물은 다음을 포함한다: (A) 다음을 포함하는 하나 이상의 자기-증폭 mRNA(SAM) 벡터를 포함하는 자기-증폭 발현 시스템: (a) 서열번호: 6에 제시된 핵산 서열을 포함하는 자기-증폭 백본으로, 상기 자기-증폭 백본 서열은 서브게놈 프로모터 뉴클레오티드 서열 및 폴리(A) 서열을 포함하고, 상기 서브게놈 프로모터 서열은 자기-복제 RNA 바이러스에 내인성이고, 상기 폴리(A) 서열은 자기-증폭 백본에 내인성인 것; 및 (b) 서브게놈 프로모터 뉴클레오티드 서열과 폴리(A) 서열 사이에 통합되고, 서브게놈 프로모터 뉴클레오티드 서열에 작동가능하게 연결되고, 임의적으로 a. 임의적으로 (1) 야생형 핵산 서열에 의해 암호화된 상응하는 펩티드 서열과 구별되는 암호화된 에피토프 서열을 만드는 적어도 하나의 변경, 또는 (2) 병원체-유래 펩티드, 바이러스-유래 펩티드, 박테리아-유래 펩티드, 진균-유래 펩티드, 및 기생충-유래 펩티드로 이루어진 군으로부터 선택된 감염성 질환 유기체 펩티드를 암호화하는 핵산을 포함하는, 에피토프-암호화 핵산 서열, b. 임의적으로 5' 링커 서열, 및 c. 임의적으로 3' 링커 서열을 포함하는, 적어도 하나의 항원-암호화 핵산 서열을 포함하는, 카세트; 및 (B) 임의적으로, 자기-증폭 발현 시스템을 캡슐화하는 지질-나노입자(LNP).
일부 측면에서, N1은 변형된 뉴클레오티드이고, 임의적으로 상기 변형된 뉴클레오티드는 변형된 당, 변형된 뉴클레오시드, 뉴클레오시드 유사체, 또는 이의 조합으로 이루어진 군으로부터 선택된 변형을 포함하고, 임의적으로 상기 변형된 당은 변형된 리보스이다. 일부 측면에서, N2는 변형된 뉴클레오티드이고, 임의적으로 상기 변형된 뉴클레오티드는 변형된 당, 변형된 뉴클레오시드, 뉴클레오시드 유사체, 또는 이의 조합으로 이루어진 군으로부터 선택된 변형을 포함하고, 임의적으로 상기 변형된 당은 변형된 리보스이다. 일부 측면에서, N1 및 N2는 변형된 뉴클레오티드이고, 임의적으로 상기 변형된 뉴클레오티드는 각각 독립적으로 변형된 당, 변형된 뉴클레오시드, 뉴클레오시드 유사체, 또는 이의 조합으로 이루어진 군으로부터 선택된 변형을 포함하고, 임의적으로 상기 변형된 당은 변형된 리보스이다. 일부 측면에서, N1은 아데노신 또는 변형된 아데노신이고, 임의적으로 상기 변형된 아데노신은 변형된 당, 변형된 뉴클레오시드, 뉴클레오시드 유사체, 또는 이의 조합으로 이루어진 군으로부터 선택된 변형을 포함하고, 임의적으로 상기 변형된 당은 변형된 리보스이다. 일부 측면에서, N2는 우리딘 또는 변형된 우리딘이고, 임의적으로 상기 변형된 우리딘은 변형된 당, 변형된 뉴클레오시드, 뉴클레오시드 유사체, 또는 이의 조합으로 이루어진 군으로부터 선택된 변형을 포함하고, 임의적으로 상기 변형된 당은 변형된 리보스이다. 일부 측면에서, N1은 변형된 아데노신이고, 임의적으로 상기 변형된 아데노신은 변형된 당, 변형된 뉴클레오시드, 뉴클레오시드 유사체, 또는 이의 조합으로 이루어진 군으로부터 선택된 변형을 포함하고, 임의적으로 상기 변형된 당은 변형된 리보스이고, N2는 우리딘이다.
일부 측면에서, m7G-ppp-N1-N2 는 화학식 (I-1):
또는 이의 약제학적으로 허용되는 염으로 표현되며, 상기 식에서 R1은 뉴클레오시드이고, 임의적으로 상기 R1은 아데닌이고, 임의적으로 R1은 N6-메틸화된 아데닌이고; R2는 뉴클레오시드이고, 임의적으로 R2는 우라실이고; R3은 할로겐 또는 치환된 C1-C3 알콕시이다.
일부 측면에서, R3은 플루오린, -CF3, -OCF3 및 -OCH2CH2OCH3으로 이루어진 군으로부터 선택된다. 일부 측면에서, m7G-ppp-N1-N2는 하기로 이루어진 군으로부터 선택된 화학식:
및 이의 약제학적으로 허용되는 염으로 표현된다.
일부 측면에서, 자기-증폭 발현 시스템은 시험관내 전사에 의해 생산된다. 일부 측면에서, 시험관내 전사 과정은 본원에 기재된 m7G-ppp-N1-N2 조성물 중 임의의 하나를 포함하는 개시 캡핑된 올리고뉴클레오티드의 사용을 포함한다. 일부 측면에서, 자기-증폭 발현 시스템의 전달을 위한 조성물에서 카세트의 각각의 요소의 정렬된 순서는 5'에서 3'으로, Pa-(L5b-Nc-L3d)X-(G5e-Uf)Y-G3g를 포함하는 화학식으로 기재되며, 상기 식에서 P는 제2 프로모터 뉴클레오티드 서열을 포함하고, 여기서 a = 0 또는 1이고, N은 에피토프-암호화 핵산 서열 중 하나를 포함하고, 상기 에피토프-암호화 핵산 서열은 MHC 클래스 I 에피토프-암호화 핵산 서열을 포함하고, 여기서 c = 1이고, L5는 5' 링커 서열을 포함하고, 여기서 b = 0 또는 1이고, L3은 3' 링커 서열을 포함하고, 여기서 d = 0 또는 1이고, G5는 GPGPG 아미노산 링커를 암호화하는 적어도 하나의 핵산 서열 중 하나를 포함하고, 여기서 e = 0 또는 1이고, G3은 GPGPG 아미노산 링커를 암호화하는 적어도 하나의 핵산 서열 중 하나를 포함하고, 여기서 g = 0 또는 1이고, U는 적어도 하나의 MHC 클래스 II 에피토프-암호화 핵산 서열 중 하나를 포함하고, 여기서 f = 1이고, X = 1 내지 400이며, 여기서 각각의 X에 대해 상응하는 Nc는 MHC 클래스 I 에피토프-암호화 핵산 서열이고, Y = 0, 1, 또는 2이며, 여기서 각각의 Y에 대해 상응하는 Uf는 MHC 클래스 II 에피토프-암호화 핵산 서열이다.
일부 측면에서, 각각의 X에 대해 상응하는 Nc는 별개의 MHC 클래스 I 에피토프-암호화 핵산 서열이다. 일부 측면에서, 각각의 Y에 대해 상응하는 Uf는 별개의 MHC 클래스 II 에피토프-암호화 핵산 서열이다. 일부 측면에서, a = 0, b = 1, d = 1, e = 1, g = 1, h = 1, X = 10, Y = 2이고, 적어도 하나의 프로모터 뉴클레오티드 서열은 자기-증폭 백본에 의해 제공되는 단일 서브게놈 프로모터 뉴클레오티드 서열이고, 적어도 하나의 폴리아데닐화 폴리(A) 서열은 자기-증폭 백본에 의해 제공되는 적어도 80개의 연속 A 뉴클레오티드의 폴리(A) 서열이고, 카세트는 서브게놈 프로모터 뉴클레오티드 서열과 폴리(A) 서열 사이에 통합되고, 상기 카세트는 서브게놈 프로모터 뉴클레오티드 서열 및 폴리(A) 서열에 작동가능하게 연결되고, 각각의 N은 7-15 아미노산 길이의 MHC 클래스 I 에피토프를 암호화하고, L5는 MHC I 에피토프의 천연 N-말단 아미노산 서열을 암호화하는 천연 5' 링커 서열이고, 상기 5' 링커 서열은 적어도 3개 아미노산 길이인 펩티드를 암호화하고, L3은 MHC I 에피토프의 천연 C-말단 아미노산 서열을 암호화하는 천연 3' 링커 서열이고, 상기 3' 링커 서열은 적어도 3개 아미노산 길이인 펩티드를 암호화하고, U는 각각의 PADRE 클래스 II 서열 및 파상풍 톡소이드 MHC 클래스 II 서열이고, 자기-증폭 백본은 서열번호: 6에 제시된 서열이고, 각각의 MHC 클래스 I 에피토프-암호화 핵산 서열은 13 내지 25개 아미노산 길이인 폴리펩티드를 암호화한다.
일부 측면에서, 전달을 위한 적어도 하나의 외인성 핵산 서열은 폴리펩티드-암호화 핵산 서열을 포함한다. 일부 측면에서, 폴리펩티드-암호화 핵산 서열은 항원-암호화 핵산 서열을 암호화한다. 일부 측면에서, 항원-암호화 핵산 서열은 MHC 클래스 I 에피토프, MHC 클래스 II 에피토프, B 세포 반응을 자극할 수 있는 에피토프, 또는 이의 조합을 포함한다. 일부 측면에서, 항원-암호화 핵산 서열은 전장 단백질, 단백질 서브유닛, 단백질 도메인, 또는 이의 조합을 암호화하는 서열을 포함한다. 일부 측면에서, 폴리펩티드-암호화 핵산 서열은 전장 단백질 또는 이의 기능적 부분을 암호화한다. 일부 측면에서, 전장 단백질 또는 이의 기능적 부분은 항체, 사이토카인, 키메라 항원 수용체(CAR), T-세포 수용체, 및 게놈-편집 시스템 뉴클레아제로 이루어진 군으로부터 선택된다.
일부 측면에서, 전달을 위한 적어도 하나의 외인성 핵산 서열은 비코딩 핵산 서열을 포함하는 적어도 하나의 핵산 서열을 포함한다. 일부 측면에서, 비코딩 핵산 서열은 RNA 간섭(RNAi) 폴리뉴클레오티드 또는 게놈-편집 시스템 폴리뉴클레오티드이다.
일부 측면에서, LNP는 이온화가능한 아미노 지질, 포스파티딜콜린, 콜레스테롤, PEG-기반 코트 지질, 또는 이의 조합으로 이루어진 군으로부터 선택된 지질을 포함한다. 일부 측면에서, LNP는 이온화가능한 아미노 지질, 포스파티딜콜린, 콜레스테롤, 및 PEG-기반 코트 지질을 포함한다. 일부 측면에서, 이온화가능한 아미노 지질은 MC3-유사(디리놀레일메틸-4-디메틸아미노부티레이트) 분자를 포함한다. 일부 측면에서, LNP-캡슐화된 발현 시스템은 약 100nm의 직경을 갖는다. 일부 측면에서, LNP-캡슐화된 발현 시스템은 60 내지 140nm의 직경을 갖는다.
일부 측면에서, 자기-증폭 발현 시스템의 전달을 위한 조성물은 근육내(IM), 피내(ID), 피하(SC), 유리체내(IVT), 척추강내, 또는 정맥내(IV) 투여를 위해 제형화된다. 일부 측면에서, 자기-증폭 발현 시스템의 전달을 위한 조성물은 근육내(IM) 투여를 위해 투여된다.
일부 측면에서, 카세트는 적어도 하나의 프로모터 클레오티드 서열과 적어도 하나의 폴리(A) 서열 사이에 통합된다. 일부 측면에서, 적어도 하나의 프로모터 뉴클레오티드 서열은 카세트에 작동가능하게 연결된다.
일부 측면에서, 하나 이상의 SAM 벡터는 하나 이상의 양성-가닥 RNA 벡터를 포함한다. 일부 측면에서, 하나 이상의 SAM 벡터는 하나 이상의 음성-가닥 RNA 벡터를 포함한다. 일부 측면에서, 하나 이상의 음성-가닥 RNA 벡터는 홍역 바이러스 또는 랍도바이러스의 적어도 하나의 폴리뉴클레오티드 서열을 포함한다.
일부 측면에서, 하나 이상의 SAM 벡터는 포유류 세포 내에서 자기-증폭된다. 일부 측면에서, 자기-증폭 백본은 알파바이러스; 플라비바이러스, 홍역, 및 랍도바이러스로 이루어진 군으로부터 선택된 자기-복제 RNA 바이러스의 적어도 하나의 폴리뉴클레오티드 서열을 포함한다.
일부 측면에서, 자기-증폭 백본은 알파바이러스의 적어도 하나의 폴리뉴클레오티드 서열을 포함하고, 임의적으로 상기 알파바이러스는 아우라 바이러스, 포트 모간 바이러스, 베네수엘라 말 뇌염 바이러스, 로스 리버 바이러스, 셈리키 삼림열 바이러스, 신드비스 바이러스, 및 마야로 바이러스로 이루어진 군으로부터 선택된다. 일부 측면에서, 자기-증폭 백본은 베네수엘라 말 뇌염 바이러스의 적어도 하나의 뉴클레오티드 서열을 포함한다. 일부 측면에서, 자기-증폭 백본은 아우라 바이러스, 포트 모간 바이러스, 베네수엘라 말 뇌염 바이러스, 로스 리버 바이러스, 셈리키 삼림열 바이러스, 신드비스 바이러스, 또는 마야로 바이러스의 뉴클레오티드 서열에 의해 암호화된 적어도 비구조적 단백질-매개 증폭을 위한 서열, 서브게놈 프로모터 서열, 폴리(A) 서열, 비구조적 단백질 1(nsP1) 유전자, nsP2 유전자, nsP3 유전자, 및 nsP4 유전자를 포함한다. 일부 측면에서, 자기-증폭 백본은 아우라 바이러스, 포트 모간 바이러스, 베네수엘라 말 뇌염 바이러스, 로스 리버 바이러스, 셈리키 삼림열 바이러스, 신드비스 바이러스, 또는 마야로 바이러스의 뉴클레오티드 서열에 의해 암호화된 적어도 비구조적 단백질-매개 증폭을 위한 서열, 서브게놈 프로모터 서열, 및 폴리(A) 서열을 포함한다. 일부 측면에서, 비구조적 단백질-매개 증폭을 위한 서열은 알파바이러스 5' UTR, 51-nt CSE, 24-nt CSE, 26S 서브게놈 프로모터 서열, 19-nt CSE, 알파바이러스 3' UTR, 또는 이의 조합으로 이루어진 군으로부터 선택된다. 일부 측면에서, 자기-증폭 백본은 구조적 비리온 단백질 캡시드, E2 및 E1을 암호화하지 않으며, 임의적으로 상기 E1은 전장 E1이거나, 또는 구조적 비리온 단백질 캡시드, E3, E2, 6K를 암호화하지 않는다. 일부 측면에서, 카세트는 아우라 바이러스, 포트 모간 바이러스, 베네수엘라 말 뇌염 바이러스, 로스 리버 바이러스, 셈리키 삼림열 바이러스, 신드비스 바이러스, 또는 마야로 바이러스의 폴리뉴클레오티드 서열 내에서 구조적 비리온 단백질 대신에 삽입된다. 일부 측면에서, 베네수엘라 말 뇌염 바이러스는 서열번호: 3 또는 서열번호: 5의 서열을 포함한다. 일부 측면에서, 베네수엘라 말 뇌염 바이러스는 염기쌍 7544와 11175 사이의 결실을 추가로 포함하는 서열번호: 3 또는 서열번호: 5의 서열을 포함한다. 일부 측면에서, 자기-증폭 백본은 서열번호: 6 또는 서열번호: 7에 제시된 서열을 포함한다. 일부 측면에서, 카세트는 서열번호: 3 또는 서열번호: 5의 서열에 제시된 바와 같은 염기쌍 7544와 11175 사이의 결실을 대체하기 위해 위치 7544에 삽입된다. 일부 측면에서, 카세트의 삽입은 nsP1-4 유전자 및 적어도 하나의 핵산 서열을 포함하는 폴리시스트로닉 RNA의 전사를 제공하며, 상기 nsP1-4 유전자 및 적어도 하나의 핵산 서열은 별도의 오픈 리딩 프레임에 있다.
일부 측면에서, 적어도 하나의 프로모터 뉴클레오티드 서열은 자기-증폭 백본에 의해 암호화된 천연 프로모터 뉴클레오티드 서열이며, 임의적으로 상기 천연 프로모터 뉴클레오티드 서열은 서브게놈 프로모터 뉴클레오티드 서열이다. 일부 측면에서, 적어도 하나의 프로모터 뉴클레오티드 서열은 외인성 RNA 프로모터이다. 일부 측면에서, 제2 프로모터 뉴클레오티드 서열은 서브게놈 프로모터 뉴클레오티드 서열이다. 일부 측면에서, 제2 프로모터 뉴클레오티드 서열은 다중 서브게놈 프로모터 뉴클레오티드 서열을 포함하고, 상기 각각의 서브게놈 프로모터 뉴클레오티드 서열은 별도의 오픈 리딩 프레임 중 하나 이상의 전사를 제공한다.
일부 측면에서, 하나 이상의 SAM 벡터는 각각 적어도 300nt 크기이다. 일부 측면에서, 하나 이상의 SAM 벡터는 각각 적어도 1kb 크기이다. 일부 측면에서, 하나 이상의 SAM 벡터는 각각 2kb 크기이다. 일부 측면에서, 하나 이상의 SAM 벡터는 각각 5kb 미만의 크기이다.
일부 측면에서, 적어도 하나의 항원-암호화 핵산 서열은 2개 이상의 항원-암호화 핵산 서열을 포함한다. 일부 측면에서, 각각의 항원-암호화 핵산 서열은 서로 직접적으로 연결된다. 일부 측면에서, 각각의 항원-암호화 핵산 서열은 링커를 암호화하는 핵산 서열과 별개의 항원-암호화 핵산 서열에 연결된다. 일부 측면에서, 링커는 2개의 MHC 클래스 I 에피토프-암호화 핵산 서열 또는 MHC 클래스 I 에피토프-암호화 핵산 서열을 MHC 클래스 II 에피토프-암호화 핵산 서열에 연결한다. 일부 측면에서, 링커는 (1) 적어도 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개 잔기 길이의 연속 글리신 잔기; (2) 적어도 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개 잔기 길이의 연속 알라닌 잔기; (3) 2개의 아르기닌 잔기(RR); (4) 알라닌, 알라닌, 티로신(AAY); (5) 포유류 프로테아좀에 의해 효율적으로 처리되는 적어도 2, 3, 4, 5, 6, 7, 8 , 9, 또는 10개 아미노산 잔기 길이의 공통 서열; 및 (6) 기원의 동족 단백질로부터 유래되고 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20개, 또는 2-20개 아미노산 잔기 길이인 항원 옆에 있는 하나 이상의 천연 서열로 이루어진 군으로부터 선택된다. 일부 측면에서, 링커는 2개의 MHC 클래스 II 에피토프-암호화 핵산 서열 또는 MHC 클래스 II 서열을 MHC 클래스 I 에피토프-암호화 핵산 서열에 연결한다. 일부 측면에서, 링커는 서열 GPGPG를 포함한다.
일부 측면에서, 항원-암호화 핵산 서열은 에피토프-암호화 핵산 서열의 발현, 안정성, 세포 교류, 처리 및 제시, 및/또는 면역원성을 향상시키는 별도의 또는 연속 서열에 작동가능하게 또는 직접적으로 연결된다. 일부 측면에서, 별도의 또는 연속 서열은 유비퀴틴 서열, 프로테아좀 표적화를 증가시키도록 변형된 유비퀴틴 서열(예를 들어, 유비퀴틴 서열은 위치 76에 Gly에서 Ala로의 치환을 함유함), 면역글로불린 신호 서열(예를 들어, IgK), 주요 조직적합성 클래스 I 서열, 리소좀-연관 막 단백질(LAMP)-1, 인간 수지상 세포 리소좀-연관 막 단백질, 및 주요 조직적합성 클래스 II 서열 중 적어도 하나를 포함하며; 임의적으로 상기 프로테아좀 표적화를 증가시키도록 변형된 유비퀴틴 서열은 A76이다.
일부 측면에서, 적어도 하나의 항원-암호화 핵산 서열은 적어도 2-10개, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개의 항원-암호화 핵산 서열을 포함하고, 임의적으로 상기 각각의 항원-암호화 핵산 서열은 별개의 항원-암호화 핵산 서열을 암호화한다. 일부 측면에서, 적어도 하나의 항원-암호화 핵산 서열은 적어도 11-20개, 15-20개, 11-100개, 11-200개, 11-300개, 11-400개, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20개 또는 최대 400개의 항원-암호화 핵산 서열을 포함하고, 임의적으로 상기 각각의 항원-암호화 핵산 서열은 별개의 항원-암호화 핵산 서열을 암호화한다. 일부 측면에서, 적어도 하나의 항원-암호화 핵산 서열은 적어도 11-20개, 15-20개, 11-100개, 11-200개, 11-300개, 11-400개, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20개 또는 최대 400개의 항원-암호화 핵산 서열을 포함한다. 일부 측면에서, 적어도 하나의 항원-암호화 핵산 서열은 적어도 2-400개의 항원-암호화 핵산 서열을 포함하고 상기 항원-암호화 핵산 서열 중 적어도 2개는 세포 표면 상의 MHC 클래스 I에 의해 제시되는 에피토프 서열 또는 이의 부분을 암호화한다. 일부 측면에서, 각각의 항원-암호화 핵산 서열은 독립적으로 적어도 2-10개, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개의 에피토프-암호화 핵산 서열을 포함하고, 임의적으로 상기 각각의 에피토프-암호화 핵산 서열은 별개의 에피토프-암호화 핵산 서열을 암호화한다. 일부 측면에서, 각각의 항원-암호화 핵산 서열은 독립적으로 적어도 11-20개, 15-20개, 11-100개, 11-200개, 11-300개, 11-400개, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20개 또는 최대 400개의 에피토프-암호화 핵산 서열을 포함하고, 임의적으로 상기 각각의 에피토프-암호화 핵산 서열은 별개의 에피토프-암호화 핵산 서열을 암호화한다. 일부 측면에서, 각각의 항원-암호화 핵산 서열은 독립적으로 적어도 11-20개, 15-20개, 11-100개, 11-200개, 11-300개, 11-400개, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20개 또는 최대 400개의 에피토프-암호화 핵산 서열을 포함한다. 일부 측면에서, 각각의 항원-암호화 핵산 서열은 독립적으로 적어도 2-400개의 에피토프-암호화 핵산 서열을 포함하고 상기 에피토프-암호화 핵산 서열 중 적어도 2개는 세포 표면 상의 MHC 클래스 I에 의해 제시되는 에피토프 서열 또는 이의 부분을 암호화한다. 일부 측면에서, MHC 클래스 I 에피토프 중 적어도 2개는 세포 표면, 임의적으로 종양 세포 표면 또는 감염된 세포 표면 상의 MHC 클래스 I에 의해 제시된다.
일부 측면에서, 에피토프-암호화 핵산 서열은 적어도 하나의 MHC 클래스 I 에피토프-암호화 핵산 서열을 포함하고, 상기 각각의 항원-암호화 핵산 서열은 8 내지 35개 아미노산 길이, 임의적으로 9-17개, 9-25개, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34 또는 35개 아미노산 길이의 폴리펩티드 서열을 암호화한다.
일부 측면에서, 적어도 하나의 MHC 클래스 II 에피토프-암호화 핵산 서열이 존재한다. 일부 측면에서, 적어도 하나의 MHC 클래스 II 에피토프-암호화 핵산 서열이 존재하고 야생형 핵산 서열에 의해 암호화된 상응하는 펩티드 서열과 구별되는 암호화된 에피토프 서열을 만드는 적어도 하나의 변경을 포함하는 적어도 하나의 MHC 클래스 II 에피토프-암호화 핵산 서열을 포함한다.
일부 측면에서, 에피토프-암호화 핵산 서열은 MHC 클래스 II 에피토프-암호화 핵산 서열을 포함하고 상기 각각의 항원-암호화 핵산 서열은 12-20개, 12, 13, 14, 15, 16, 17, 18, 19, 20, 또는 20-40개 아미노산 길이인 폴리펩티드 서열을 암호화한다. 일부 측면에서, 에피토프-암호화 핵산 서열은 MHC 클래스 II 에피토프-암호화 핵산 서열을 포함하고, 상기 적어도 하나의 MHC 클래스 II 에피토프-암호화 핵산 서열이 존재하고, 상기 적어도 하나의 MHC 클래스 II 에피토프-암호화 핵산 서열은 적어도 하나의 범용 MHC 클래스 II 에피토프-암호화 핵산 서열을 포함하고, 임의적으로 상기 적어도 하나의 범용 서열은 파상풍 톡소이드 및 PADRE 중 적어도 하나를 포함한다.
일부 측면에서, 적어도 하나의 프로모터 뉴클레오티드 서열 또는 제2 프로모터 뉴클레오티드 서열은 유도성이다. 일부 측면에서, 적어도 하나의 프로모터 뉴클레오티드 서열 또는 제2 프로모터 뉴클레오티드 서열은 비유도성이다.
일부 측면에서, 적어도 하나의 폴리(A) 서열은 자기-복제 RNA에 고유한 폴리(A) 서열을 포함한다. 일부 측면에서, 적어도 하나의 폴리(A) 서열은 자기-복제 RNA에 외인성인 폴리(A) 서열을 포함한다. 일부 측면에서, 적어도 하나의 폴리(A) 서열은 적어도 하나의 핵산 서열 중 적어도 하나에 작동가능하게 연결된다. 일부 측면에서, 적어도 하나의 폴리(A) 서열은 적어도 20개, 적어도 30개, 적어도 40개, 적어도 50개, 적어도 60개, 적어도 70개, 적어도 80개, 적어도 90개, 적어도 100개, 적어도 110개, 또는 적어도 120개의 연속 A 뉴클레오티드이다. 일부 측면에서, 적어도 하나의 폴리(A) 서열은 적어도 80개의 연속 A 뉴클레오티드이다. 일부 측면에서, 적어도 하나의 폴리(A) 서열은 적어도 100개의 연속 A 뉴클레오티드이다
일부 측면에서, 에피토프-암호화 핵산 서열은 MHC 클래스 I 에피토프-암호화 핵산 서열을 포함하고, 상기 MHC 클래스 I 에피토프-암호화 핵산 서열은 (a) 종양, 감염된 세포, 또는 감염성 질환 유기체로부터 엑솜, 전사체, 또는 전체 게놈 뉴클레오티드 서열분석 데이터 중 적어도 하나를 수득하는 단계로, 상기 뉴클레오티드 서열분석 데이터는 각각의 에피토프 세트의 펩티드 서열을 나타내는 데이터를 수득하는 데 사용되는 것인, 단계; (b) 각각의 에피토프의 펩티드 서열을 제시 모델에 입력하여 각각의 에피토프가 세포 표면, 임의적으로 종양 세포 표면 또는 감염된 세포 표면 상의 MHC 대립유전자 중 하나 이상에 의해 제시되는, 적어도 수신된 질량 분광법 데이터에 기반하여 식별된 수치 가능성 세트를 생성하는 단계; 및 (c) 수치 가능성 세트에 기반한 에피토프 세트의 서브세트를 선택하여 MHC 클래스 I 에피토프-암호화 핵산 서열을 생성하는 데 사용되는 선택된 에피토프 세트를 생성하는 단계를 수행함으로써 선택된다.
일부 측면에서, 각각의 MHC 클래스 I 에피토프-암호화 핵산 서열은 (a) 종양, 감염된 세포, 또는 감염성 질환 유기체로부터 엑솜, 전사체, 또는 전체 게놈 뉴클레오티드 서열분석 데이터 중 적어도 하나를 수득하는 단계로, 상기 뉴클레오티드 서열분석 데이터는 각각의 에피토프 세트의 펩티드 서열을 나타내는 데이터를 수득하는 데 사용되는 것인, 단계; (b) 각각의 에피토프의 펩티드 서열을 제시 모델에 입력하여 각각의 에피토프가 세포 표면, 임의적으로 종양 세포 표면 또는 감염된 세포 표면 상의 MHC 대립유전자 중 하나 이상에 의해 제시되는, 적어도 수신된 질량 분광법 데이터에 기반하여 식별된 수치 가능성 세트를 생성하는 단계; 및 (c) 수치 가능성 세트에 기반한 에피토프 세트의 서브세트를 선택하여 적어도 20개의 MHC 클래스 I 에피토프-암호화 핵산 서열을 생성하는 데 사용되는 선택된 에피토프 세트를 생성하는 단계를 수행함으로써 선택된다. 일부 측면에서, 선택된 에피토프 세트의 수는 2-20이다. 일부 측면에서, 제시 모델은 다음 사이의 의존성을 나타낸다: (a) 펩티드 서열의 특정 위치에서 MHC 대립유전자 중 특정한 하나 및 특정 아미노산의 쌍의 존재; 및 (b) 상기 쌍의 MHC 대립유전자 중 특정한 하나에 의한, 특정 위치에서 특정 아미노산을 포함하는 이러한 펩티드 서열의 세포 표면, 임의적으로 종양 세포 표면 또는 감염된 세포 표면 상의 제시 가능성. 일부 측면에서, 선택된 에피토프 세트를 선택하는 단계는 제시 모델에 기반한 선택되지 않은 에피토프에 비해, 세포 표면, 임의적으로 종양 세포 표면 또는 감염된 세포 표면 상에 제시될 가능성이 증가된 에피토프를 선택하는 것을 포함한다. 일부 측면에서, 선택된 에피토프 세트를 선택하는 단계는 제시 모델에 기반한 선택되지 않은 에피토프에 비해 대상체에서 종양-특이적 또는 감염성 질환 유기체-특이적 면역 반응을 자극할 수 있는 가능성이 증가된 에피토프를 선택하는 것을 포함한다. 일부 측면에서, 선택된 에피토프 세트를 선택하는 단계는 제시 모델에 기반한 선택되지 않은 에피토프에 비해 전문 항원 제시 세포(APC)에 의해 미처리 T 세포에 제시될 수 있는 가능성이 증가된 에피토프를 선택하는 것을 포함하고, 임의적으로 상기 APC는 수지상 세포(DC)이다. 일부 측면에서, 선택된 에피토프 세트를 선택하는 단계는 제시 모델에 기반한 선택되지 않은 에피토프에 비해 중추 또는 말초 관용을 통해 억제를 겪을 가능성이 감소된 에피토프를 선택하는 것을 포함한다. 일부 측면에서, 선택된 에피토프 세트를 선택하는 단계는 제시 모델에 기반한 선택되지 않은 에피토프에 비해 대상체에서 정상 조직에 대한 자가면역 반응을 자극할 수 있는 가능성이 감소된 에피토프를 선택하는 것을 포함한다. 일부 측면에서, 엑솜 또는 전사체 뉴클레오티드 서열분석 데이터는 종양 세포 또는 조직, 감염된 세포, 또는 감염성 질환 유기체 상에서 서열분석을 수행함으로써 수득된다. 일부 측면에서, 서열분석은 차세대 서열분석(NGS) 또는 임의의 대규모 병렬 서열분석 접근법이다.
일부 측면에서, 자기-증폭 발현 시스템의 전달을 위한 조성물은 프라이밍 백신으로서 투여된다. 일부 측면에서, 상기 방법은 제2 조성물을 투여하는 단계를 추가로 포함하고, 임의적으로 상기 제2 조성물은 백신 조성물이다. 일부 측면에서, 제2 조성물은 자기-증폭 발현 시스템의 전달을 위한 조성물 전에 투여된다. 일부 측면에서, 제2 조성물은 자기-증폭 발현 시스템의 전달을 위한 조성물의 투여 이후에 투여된다. 일부 측면에서, 제2 조성물은 자기-증폭 발현 시스템의 전달을 위한 조성물과 동일하다. 일부 측면에서, 제2 조성물은 자기-증폭 발현 시스템의 전달을 위한 조성물과 상이하다. 일부 측면에서, 제2 조성물은 자기-증폭 발현 시스템의 카세트를 포함하고, 임의적으로 상기 제2 조성물은 자기-증폭 발현 시스템의 카세트를 암호화하는 침팬지 아데노바이러스 벡터를 포함한다. 일부 측면에서, 2개 이상의 제2 조성물이 투여되며, 임의적으로 상기 자기-증폭 발현 시스템의 전달을 위한 조성물은 프라이밍 백신으로서 투여된다.
일부 측면에서, 자기-증폭 발현 시스템의 전달을 위한 조성물은 근육내(IM), 피내(ID), 피하(SC), 유리체(IVT), 척추강내, 또는 정맥내(IV) 투여된다. 일부 측면에서, 상기 방법은 면역 조절제를 투여하는 단계를 추가로 포함하고, 임의적으로 상기 면역 조절제는 항-CTLA4 항체 또는 이의 항원-결합 단편, 항-PD-1 항체 또는 이의 항원-결합 단편, 항-PD-L1 항체 또는 이의 항원-결합 단편, 항-4-1BB 항체 또는 이의 항원-결합 단편, 항-OX-40 항체 또는 이의 항원-결합 단편, 또는 사이토카인이며, 임의적으로 상기 사이토카인은 IL-2, IL-7, IL-12, IL-15, 또는 IL-21 중 적어도 하나 또는 이의 변이체이다. 일부 측면에서, 상기 방법은 애쥬번트를 투여하는 단계를 추가로 포함한다.
본 발명의 이들 및 다른 특성, 측면, 및 장점은 하기 설명, 및 첨부된 도면과 관련하여 더 잘 이해될 것이다.
도면(도) 1은 표준 T7 프로모터 또는 변형된("최소") T7 프로모터를 사용한 SAM 벡터의 전사를 예시한다.
도 2는 대표적인 AU-SAM 벡터의 개략도를 제공한다.
도 3은 트리뉴클레오티드 m7G-ppp-A-U 캡 유사체 또는 디뉴클레오티드 m7G-ppp-A 캡 유사체를 사용하여 IVT에 의해 생산된 캡핑된 AU-SAM RNA 수율을 보여준다.
도 4는 10 ug의 명시된 SAM-LNP로 면역화된 Balb/c 마우스(n = 그룹 당 8) 및 면역화후 12일에 단리된 비장세포를 보여준다. 항원-특이적 T-세포의 수는 AH1-A5 항원(SPSYAYHQF)으로 6-시간 자극 후, IFNg에 대한 세포내 사이토카인 염색에 의해 측정되었다. 데이터는 CD8+ 세포의 퍼센트로서 IFNg+ 세포로 제시되며, 음성 대조군 펩티드가 있는 배경 신호는 뺀다. 막대는 중앙값을 나타낸다.
도 5는 AU-SAM 연구 아암(arm) 세부사항(상단 패널) 및 사용된 모델 항원(하단 패널)을 예시한다.
도 6은 AU-SAM으로 면역화(프라임/부스트) 후 6개의 Mamu-A*01 각각에 대한 항원-특이적 면역 반응의 시간 경과를 보여준다.
도 7은 AU-SAM으로 면역화(프라임/부스트) 후 6개의 Mamu-A*01 각각에 대한 항원-특이적 면역 반응의 시간 경과를 보여준다.
도면(도) 1은 표준 T7 프로모터 또는 변형된("최소") T7 프로모터를 사용한 SAM 벡터의 전사를 예시한다.
도 2는 대표적인 AU-SAM 벡터의 개략도를 제공한다.
도 3은 트리뉴클레오티드 m7G-ppp-A-U 캡 유사체 또는 디뉴클레오티드 m7G-ppp-A 캡 유사체를 사용하여 IVT에 의해 생산된 캡핑된 AU-SAM RNA 수율을 보여준다.
도 4는 10 ug의 명시된 SAM-LNP로 면역화된 Balb/c 마우스(n = 그룹 당 8) 및 면역화후 12일에 단리된 비장세포를 보여준다. 항원-특이적 T-세포의 수는 AH1-A5 항원(SPSYAYHQF)으로 6-시간 자극 후, IFNg에 대한 세포내 사이토카인 염색에 의해 측정되었다. 데이터는 CD8+ 세포의 퍼센트로서 IFNg+ 세포로 제시되며, 음성 대조군 펩티드가 있는 배경 신호는 뺀다. 막대는 중앙값을 나타낸다.
도 5는 AU-SAM 연구 아암(arm) 세부사항(상단 패널) 및 사용된 모델 항원(하단 패널)을 예시한다.
도 6은 AU-SAM으로 면역화(프라임/부스트) 후 6개의 Mamu-A*01 각각에 대한 항원-특이적 면역 반응의 시간 경과를 보여준다.
도 7은 AU-SAM으로 면역화(프라임/부스트) 후 6개의 Mamu-A*01 각각에 대한 항원-특이적 면역 반응의 시간 경과를 보여준다.
일부 구현예에서, 본 개시내용은 화학식 (I)의 화합물:
또는 이의 약제학적으로 허용되는 염을 포함한다:
상기 식에서
R1은 뉴클레오시드이고;
R2는 뉴클레오시드이고;
R3은 할로겐 임의적으로 치환된 C1-C3 알킬, 또는 치환된 C1-C3 알콕시이고.
R4는 수소 또는 임의적으로 치환된 C1-C3 지방족이고;
R5는 수소 또는 임의적으로 치환된 C1-C3 지방족이고;
각각의 X는 독립적으로 O 또는 S이다.
일부 구현예에서, 본 개시내용은 화학식 (I-1)의 화합물:
또는 이의 약제학적으로 허용되는 염을 포함하고, 상기 식에서 R1, R2 및 R3은 상기 정의되고 본원의 부류 및 하위부류에 기재된다.
일부 구현예에서, 본 개시내용은 화학식 (I-2)의 화합물:
또는 이의 약제학적으로 허용되는 염을 포함하고, 상기 식에서 R1 및 R2는 상기 정의되고 본원의 부류 및 하위부류에 기재된다.
일부 구현예에서, 본 개시내용은 화학식 (I-3)의 화합물:
또는 이의 약제학적으로 허용되는 염을 포함하고, 상기 식에서 R1 및 R2는 상기 정의되고 본원의 부류 및 하위부류에 기재된다.
일부 구현예에서, 본 개시내용은 화학식 (I-4)의 화합물:
또는 이의 약제학적으로 허용되는 염을 포함하고, 상기 식에서 R1 및 R2는 상기 정의되고 본원의 부류 및 하위부류에 기재된다.
일부 구현예에서, 본 개시내용은 화학식 (I-5)의 화합물:
또는 이의 약제학적으로 허용되는 염을 포함하고, 상기 식에서 R1 및 R2는 상기 정의되고 본원의 부류 및 하위부류에 기재된다.
일부 구현예에서, 본 개시내용은 화학식 (II)의 화합물:
또는 이의 약제학적으로 허용되는 염을 포함하고, 상기 식에서 R1, R2, R3 및 X는 상기 정의되고 본원의 부류 및 하위부류에 기재된다.
일부 구현예에서, 본 개시내용은 화학식 (II-1)의 화합물:
또는 이의 약제학적으로 허용되는 염을 포함하고, 상기 식에서 R1, R2, 및 R3은 상기 정의되고 본원의 부류 및 하위부류에 기재된다.
일부 구현예에서, 본 개시내용은 화학식 (II-2)의 화합물:
또는 이의 약제학적으로 허용되는 염을 포함하고, 상기 식에서 R3은 상기 정의되고 본원의 부류 및 하위부류에 기재된다.
일부 구현예에서, R1은 아데닌, 우라실, 구아닌 및 시토신으로 이루어진 군으로부터 선택된다. 일부 구현예에서, R1은 아데닌이다. 일부 구현예에서, R1은 N6-메틸화된 아데닌이다. 일부 구현예에서, R1은 우라실이다. 일부 구현예에서, R1은 구아닌이다. 일부 구현예에서, R1은 시토신이다. 일부 구현예에서, R1은 티민이다.
일부 구현예에서, R2는 아데닌, 우라실, 구아닌 및 시토신으로 이루어진 군으로부터 선택된다. 일부 구현예에서, R2는 아데닌이다. 일부 구현예에서, R2는 우라실이다. 일부 구현예에서, R2는 구아닌이다. 일부 구현예에서, R2는 시토신이다. 일부 구현예에서, R2는 티민이다.
일부 구현예에서, R3은 할로겐, 임의적으로 치환된 C1-C3 알킬, 또는 치환된 C1-C3 알콕시이다. 일부 구현예에서, R3은 할로겐이다. 일부 구현예에서, R3은 F이다. 일부 구현예에서, R3은 임의적으로 치환된 C1-C3 알킬이다. 일부 구현예에서, R3은 -CF3이다. 일부 구현예에서, R3은 치환된 C1-C3 알콕시이다. 일부 구현예에서, R3은 C1-C3 할로알콕시이다. 일부 구현예에서, R3은 -OCF3이다. 일부 구현예에서, R3은 C1-C3 알콕시로 치환된 C1-C3 알콕시이다. 일부 구현예에서, R3은 -OCH2CH2OCH3이다.
일부 구현예에서, R4는 수소 또는 임의적으로 치환된 C1-C3 지방족이다. 일부 구현예에서, R4는 수소이다. 일부 구현예에서, R4는 임의적으로 치환된 C1-C3 지방족이다. 일부 구현예에서, R4는 수소 또는 임의적으로 치환된 메틸이다. 일부 구현예에서, R4는 메틸이다.
일부 구현예에서, R5는 수소 또는 임의적으로 치환된 C1-C3 지방족이다. 일부 구현예에서, R5는 수소이다. 일부 구현예에서, R5는 임의적으로 치환된 C1-C3 지방족이다. 일부 구현예에서, R5는 수소 또는 임의적으로 치환된 메틸이다. 일부 구현예에서, R5는 메틸이다.
일부 구현예에서, 본 개시내용은 하기로 이루어진 군으로부터 선택된 화합물:
또는 이의 약제학적으로 허용되는 염을 포함한다.
일부 구현예에서, 본 개시내용은 하기를 포함하는 화합물:
또는 이의 약제학적으로 허용되는 염을 포함한다.
정의
본원에 사용된 바와 같은 용어 "지방족" 또는 "지방족 기"는 완전히 포화되거나 또는 하나 이상의 불포화 단위를 함유하는 직쇄(즉, 비분지형) 또는 분지형, 치환 또는 비치환된 탄화수소 쇄, 또는 완전히 포화되거나 또는 하나 이상의 불포화 단위를 함유하지만, 방향족이 아니며, 분자의 나머지에 단일 부착점을 갖는 일환형 탄화수소 또는 이환형 탄화수소를 의미한다(본원에서 "카보사이클" "사이클로지방족" 또는 사이클로알킬"로도 지칭됨). 달리 명시되지 않는 한, 지방족 기는 1-6개의 지방족 탄소 원자를 함유한다. 일부 구현예에서, 지방족 기는 1-5개의 지방족 탄소 원자를 함유한다. 다른 구현예에서, 지방족 기는 1-4개의 지방족 탄소 원자를 함유한다. 또한 다른 구현예에서, 지방족 기는 1-3개의 지방족 탄소 원자를 함유하고, 또한 다른 구현예에서, 지방족 기는 1-2개의 지방족 탄소 원자를 함유한다. 일부 구현예에서, "사이클로지방족"(또는 "카보사이클" 또는 "사이클로알킬")은 완전히 포화되거나 또는 하나 이상의 불포화 단위를 함유하지만, 방향족이 아니며, 분자의 나머지에 단일 부착점을 갖는 일환형 C3-C6 탄화수소를 지칭한다. 적합한 지방족 기는 선형 또는 분지형, 치환 또는 비치환된 알킬, 알케닐, 알키닐 기 및 (사이클로알킬)알킬, (사이클로알케닐)알킬 또는 (사이클로알킬)알케닐과 같은 이의 하이브리드를 포함하나 이에 제한되지 않는다.
용어 "할로지방족"은 하나 이상의 할로겐 원자로 치환된 지방족 기를 지칭한다.
용어 "알킬"은 직쇄형 또는 분지형 알킬 기를 지칭한다. 예시적인 알킬 기는 메틸, 에틸, 프로필, 이소프로필, 부틸, 이소부틸, 및 tert-부틸이다.
용어 "할로알킬"은 하나 이상의 할로겐 원자로 치환된 직쇄형 또는 분지형 알킬 기를 지칭한다.
용어 "할로겐"은 F, Cl, Br, 또는 I를 의미한다.
단독으로 또는 "아르알킬", "아르알콕시", 또는 "아릴옥시알킬"에서와 같이 더 큰 모이어티의 일부로서 사용되는 용어 "아릴"은 총 5 내지 14개의 고리 원을 갖는 일환형 및 이환형 고리 시스템을 지칭하며, 상기 시스템에서 적어도 하나의 고리는 방향족이고 상기 시스템에서 각각의 고리는 3 내지 7개의 고리 원을 함유한다. 용어 "아릴"은 용어 "아릴 고리"와 상호교환가능하게 사용될 수 있다. 본 개시내용의 특정 구현예에서, "아릴"은 페닐, 비페닐, 나프틸, 안트라실 등을 포함하나 이에 제한되지 않는 방향족 고리 시스템을 지칭하며, 이는 하나 이상의 치환기를 보유할 수 있다. 또한 용어 "아릴"의 범위 내에는, 본원에 사용된 바와 같이, 인다닐, 프탈리미딜, 나프티미딜, 페난트리디닐, 또는 테트라하이드로나프틸 등과 같은, 방향족 고리가 하나 이상의 비-방향족 고리에 융합된 기가 포함된다.
본원에 사용된 바와 같이, 용어 "부분적으로 불포화된"은 적어도 하나의 이중 또는 삼중 결합을 포함하는 고리 모이어티를 지칭한다. 용어 "부분적으로 불포화된"은 다중 불포화 부위를 갖는 고리를 포함하는 것으로 의도되지만, 본원에 정의된 바와 같이, 아릴 또는 헤테로아릴 모이어티를 포함하는 것으로 의도되지 않는다.
본원에 사용된 바와 같이, 본 개시내용의 화합물은 "임의적으로 치환된" 모이어티를 함유할 수 있다. 일반적으로, 용어 "치환된"은, 용어 "임의적으로"가 선행되든 아니든, 지정된 모이어티의 하나 이상의 수소가 적합한 치환기로 대체됨을 의미한다. 달리 나타내지 않는 한, "임의적으로 치환된" 기는 기의 각각의 치환가능한 위치에 적합한 치환기를 가질 수 있고, 임의의 주어진 구조에서 하나 초과의 위치가 명시된 기로부터 선택된 하나 초과의 치환기로 치환될 수 있는 경우, 치환기는 모든 위치에서 동일하거나 또는 상이할 수 있다. 본 개시내용에 의해 예상되는 치환기의 조합은 바람직하게는 안정하거나 또는 화학적으로 실현가능한 화합물의 형성을 초래하는 것들이다. 본원에 사용된 바와 같은 용어 "안정한"은 생산, 검출, 및, 특정 구현예에서, 본원에 개시된 목적 중 하나 이상을 위한 회수, 정제, 및 사용을 가능하게 하는 조건에 적용된 경우 실질적으로 변경되지 않는 화합물을 지칭한다.
"임의적으로 치환된" 기의 치환가능한 탄소 원자 상의 적합한 1가 치환기는 독립적으로 할로겐; -(CH2)0-4R°; -(CH2)0-4OR°; -O(CH2)0-4R°, -O-(CH2)0-4C(O)OR°; -(CH2)0-4CH(OR°)2; -(CH2)0-4SR°; R°으로 치환될 수 있는 -(CH2)0-4Ph; R°으로 치환될 수 있는 -(CH2)0-4O(CH2)0-1Ph; R°으로 치환될 수 있는 -CH=CHPh; R°으로 치환될 수 있-(CH2)0-4O(CH2)0-1-피리딜; -NO2; -CN; -N3; -(CH2)0-4N(R°)2; -(CH2)0-4N(R°)C(O)R°; -N(R°)C(S)R°; -(CH2)0-4N(R°)C(O)NR° 2; -N(R°)C(S)NR° 2; -(CH2)0-4N(R°)C(O)OR°; -N(R°)N(R°)C(O)R°; -N(R°)N(R°)C(O)NR° 2; -N(R°)N(R°)C(O)OR°; -(CH2)0-4C(O)R°; -C(S)R°; -(CH2)0-4C(O)OR°; -(CH2)0-4C(O)SR°; -(CH2)0-4C(O)OSiR° 3; -(CH2)0-4OC(O)R°; -OC(O)(CH2)0-4SR°, SC(S)SR°; -(CH2)0-4SC(O)R°; -(CH2)0-4C(O)NR° 2; -C(S)NR° 2; -C(S)SR°; -SC(S)SR°, -(CH2)0-4OC(O)NR° 2; -C(O)N(OR°)R°; -C(O)C(O)R°; -C(O)CH2C(O)R°; -C(NOR°)R°; -(CH2)0-4SSR°; -(CH2)0-4S(O)2R°; -(CH2)0-4S(O)2OR°; -(CH2)0-4OS(O)2R°; -S(O)2NR° 2; -(CH2)0-4S(O)R°; -N(R°)S(O)2NR° 2; -N(R°)S(O)2R°; -N(OR°)R°; -C(NH)NR° 2; -P(O)2R°; -P(O)R° 2; -OP(O)R° 2; -OP(O)(OR°)2; SiR° 3; -(C1-4 직쇄형 또는 분지형 알킬렌)O-N(R°)2; 또는 -(C1-4 직쇄형 또는 분지형 알킬렌)C(O)O-N(R°)2이며, 상기 각각의 R°은 하기 정의된 바와 같이 치환될 수 있고 독립적으로 수소, C1-6 지방족, -CH2Ph, -O(CH2)0-1Ph, -CH2-(5-6 원 헤테로아릴 고리), 또는 질소, 산소, 또는 황으로부터 독립적으로 선택된 0-4개의 헤테로원자를 갖는 5-6-원 포화, 부분적으로 불포화, 또는 아릴 고리이거나 또는, 상기 정의에도 불구하고, 2개의 독립적으로 존재하는 R°은, 그들의 개입 원자(들)와 함께, 질소, 산소, 또는 황으로부터 독립적으로 선택된 0-4개의 헤테로원자를 갖는 3-12-원 포화, 부분적으로 불포화, 또는 아릴 일환형 또는 이환형 고리를 형성하며, 이는 하기 정의된 바와 같이 치환될 수 있다.
R° 상의 적합한 1가 치환기(또는 2개의 독립적으로 존재하는 R°을 그들의 개입 원자 함께 취함으로써 형성된 고리)는 독립적으로 할로겐, -(CH2)0-2R, -(할로R), -(CH2)0-2OH, -(CH2)0-2OR, -(CH2)0-2CH(OR)2; -O(할로R), -CN, -N3, -(CH2)0-2C(O)R, -(CH2)0-2C(O)OH, -(CH2)0-2C(O)OR, -(CH2)0-2SR, -(CH2)0-2SH, -(CH2)0-2NH2, -(CH2)0-2NHR, -(CH2)0-2NR 2, -NO2, -SiR 3, -OSiR 3, -C(O)SR, -(C1-4 직쇄형 또는 분지형 알킬렌)C(O)OR, 또는 -SSR이며, 상기 각각의 R은 비치환되거나 또는 "할로"가 선행되는 경우 하나 이상의 할로겐으로만 치환되고, C1-4 지방족, -CH2Ph, -O(CH2)0-1Ph, 또는 질소, 산소, 또는 황으로부터 독립적으로 선택된 0-4개의 헤테로원자를 갖는 5-6-원 포화, 부분적으로 불포화, 또는 아릴 고리로부터 독립적으로 선택된다. R°의 포화된 탄소 원자 상의 적합한 2가 치환기는 =O 및 =S를 포함한다.
"임의적으로 치환된" 기의 포화된 탄소 원자 상의 적합한 2가 치환기는 다음을 포함한다: =O, =S, =NNR*2, =NNHC(O)R*, =NNHC(O)OR*, =NNHS(O)2R*, =NR*, =NOR*, -O(C(R*2))2-3O-, 또는 -S(C(R*2))2-3S-, 상기 각각의 독립적으로 존재하는 R*는 수소, 하기 정의된 바와 같이 치환될 수 있는 C1-6 지방족, 또는 질소, 산소, 또는 황으로부터 독립적으로 선택된 0-4개의 헤테로원자를 갖는 비치환된 5-6-원 포화, 부분적으로 불포화, 또는 아릴 고리로부터 선택된다. "임의적으로 치환된" 기의 인근의 치환가능한 탄소에 결합되는 적합한 2가 치환기는 -O(CR*2)2-3O-를 포함하고, 상기 각각의 독립적으로 존재하는 R*는 수소, 하기 정의된 바와 같이 치환될 수 있는 C1-6 지방족, 또는 질소, 산소, 또는 황으로부터 독립적으로 선택된 0-4개의 헤테로원자를 갖는 비치환된 5-6-원 포화, 부분적으로 불포화, 또는 아릴 고리로부터 선택된다.
R*의 지방족 기 상의 적합한 치환기는 할로겐, -R, -(할로R), -OH, -OR, -O(할로R), -CN, -C(O)OH, -C(O)OR, -NH2, -NHR, -NR 2, 또는 -NO2를 포함하고, 상기 각각의 R은 비치환되거나 또는 "할로"가 선행되는 경우 하나 이상의 할로겐으로만 치환되고, 독립적으로 C1-4 지방족, -CH2Ph, -O(CH2)0-1Ph, 또는 질소, 산소, 또는 황으로부터 독립적으로 선택된 0-4개의 헤테로원자를 갖는 5-6-원 포화, 부분적으로 불포화, 또는 아릴 고리이다.
"임의적으로 치환된" 기의 치환가능한 질소 상의 적합한 치환기는 -R†, -NR† 2, -C(O)R†, -C(O)OR†, -C(O)C(O)R†, -C(O)CH2C(O)R†, -S(O)2R†, -S(O)2NR† 2, -C(S)N0† 2, -C(NH)NR† 2, 또는 -N(R†)S(O)2R†를 포함하며; 상기 각각의 R†는 독립적으로 수소, 하기 정의된 바와 같이 치환될 수 있는 C1-6 지방족, 비치환된 -OPh, 또는 질소, 산소, 또는 황으로부터 독립적으로 선택된 0-4개의 헤테로원자를 갖는 비치환된 5-6-원 포화, 부분적으로 불포화, 또는 아릴 고리이거나, 또는, 상기 정의에도 불구하고, 2개의 독립적으로 존재하는 R†는, 그들의 개입 원자(들)와 함께 질소, 산소, 또는 황으로부터 독립적으로 선택된 0-4개의 헤테로원자를 갖는 비치환된 3-12-원 포화, 부분적으로 불포화, 또는 아릴 일환형 또는 이환형 고리를 형성한다.
R†의 지방족 기 상의 적합한 치환기는 독립적으로 할로겐, -R, -(할로R), -OH, -OR, -O(할로R), -CN, -C(O)OH, -C(O)OR, -NH2, -NHR, -NR 2, 또는 -NO2이며, 상기 각각의 R은 비치환되거나 또는 "할로"가 선행되는 경우 하나 이상의 할로겐으로만 치환되고, 독립적으로 C1-4 지방족, -CH2Ph, -O(CH2)0-1Ph, 또는 질소, 산소, 또는 황으로부터 독립적으로 선택된 0-4개의 헤테로원자를 갖는 5-6-원 포화, 부분적으로 불포화, 또는 아릴 고리이다.
본원에 사용된 바와 같이, 용어 "약제학적으로 허용되는 염"은 건전한 의학적 판단의 범위 내에서, 과도한 독성, 자극, 알레르기 반응 등 없이 인간 및 하등 동물의 조직과 접촉하여 하용하기에 적합하고, 합리적인 이익/위험 비율에 상응하는 염을 지칭한다. 약제학적으로 허용되는 염은 당업계에 잘 알려져 있다. 예를 들어, S. M. Berge 등은 본원에 참조로 포함된 J. Pharmaceutical Sciences, 1977, 66, 1-19에 약제학적으로 허용되는 염을 상세히 기재한다. 본 개시내용의 화합물의 약제학적으로 허용되는 염은 적합한 무기 및 유기 산 및 염기로부터 유래된 것들을 포함한다. 약제학적으로 허용되는, 무독성 산 부가 염의 예는 염산, 브롬화수소산, 인산, 황산 및 과염소산과 같은 무기 산 또는 아세트산, 옥살산, 말레산, 타르타르산, 시트르산, 숙신산 또는 말론산과 같은 유기 산으로 또는 이온 교환과 같은 당업계에서 사용되는 다른 방법을 사용함으로써 형성된 아미노 기의 염이다. 다른 약제학적으로 허용되는 염은 아디페이트, 알기네이트, 아스코르베이트, 아스파르테이트, 벤젠술포네이트, 벤조에이트, 비술페이트, 보레이트, 부티레이트, 캄포레이트, 캄포르술포네이트, 시트레이트, 사이클로펜탄프로피오네이트, 디글루코네이트, 도데실술페이트, 에탄술포네이트, 포르메이트, 푸마레이트, 글루코헵토네이트, 글리세로포스페이트, 글루코네이트, 헤미술페이트, 헵타노에이트, 헥사노에이트, 하이드로요오다이드, 2-하이드록시-에탄술포네이트, 락토비오네이트, 락테이트, 라우레이트, 라우릴 술페이트, 말레이트, 말레에이트, 말로네이트, 메탄술포네이트, 2-나프탈렌술포네이트, 니코티네이트, 니트레이트, 올레에이트, 옥살레이트, 팔미테이트, 파모에이트, 펙티네이트, 퍼술페이트, 3-페닐프로피오네이트, 포스페이트, 피발레이트, 프로피오네이트, 스테아레이트, 숙시네이트, 술페이트, 타르트레이트, 티오시아네이트, p-톨루엔술포네이트, 운데카노에이트, 발레레이트 염 등을 포함한다.
적절한 염기로부터 유래된 염은 알칼리 금속, 알칼리 토 금속, 암모늄 및 N(C1-4알킬)4 염을 포함한다. 대표적인 알칼리 또는 알칼리 토 금속 염은 나트륨, 리튬, 칼륨, 칼슘, 마그네슘 등을 포함한다. 추가의 약제학적으로 허용되는 염은 적절한 경우, 무독성 암모늄, 4차 암모늄, 및 할라이드, 하이드록사이드, 카르복실레이트, 술페이트, 포스페이트, 니트레이트, 저급 알킬 술포네이트 및 아릴 술포네이트와 같은 반대이온을 사용하여 형성된 아민 양이온을 포함한다.
본원의 변수에 대한 임의의 정의에서 화학 그룹 목록의 인용은 임의의 단일 그룹 또는 나열된 그룹의 조합으로서 해당 변수의 정의를 포함한다. 본원의 변수에 대한 구현예의 인용은 임의의 단일 구현예로서 또는 임의의 다른 구현예 또는 이의 부분과 조합하여 해당 구현예를 포함한다.
본원에 사용된 바와 같은 용어 "생물학적 샘플"은 세포 배양물 또는 이의 추출물; 포유동물로부터 수득된 생검 물질 또는 이의 추출물; 및 혈액, 타액, 소변, 대변, 정액, 눈물, 또는 다른 유체 또는 이의 추출물을 포함하나 제한되지 않는다.
본원에 사용된 바와 같이, "치료적 유효량"은 원하는 생물학적 반응을 자극하는 물질(예를 들어, 치료제, 조성물, 및/또는 제형)의 양을 의미한다. 일부 구현예에서, 물질의 치료적 유효량은 질환, 장애, 및/또는 병태를 앓고 있거나 또는 이에 취약한 대상체에게 투약 레지멘의 일부로서 투여될 때, 질환, 장애, 및/또는 병태를 치료, 진단, 예방하고/하거나, 이의 발병을 지연시키기에 충분한 양이다. 당업자에 의해 이해되는 바와 같이, 물질의 유효량은 원하는 생물학적 종료점, 전달될 물질, 표적 세포 또는 조직 등과 같은 이러한 인자에 따라 달라질 수 있다. 예를 들어, 질환, 장애, 및/또는 병태를 치료하기 위해 제형에 제공된 화합물의 유효량은 질환, 장애, 및/또는 병태의 하나 이상의 증상 또는 특징을 완화, 개선, 경감, 억제, 예방하고/하거나, 이의 발병을 지연시키고/시키거나, 이의 중증도를 감소시키고/시키거나, 이의 발병률을 감소시키는 양이다. 일부 구현예에서, "치료적 유효량"은 질환 또는 장애의 하나 이상의 증상을 치료하기에 충분한 제공된 화합물, 또는 제공된 화합물을 함유하는 조성물의 적어도 최소량이다.
질환, 장애, 및 병태는 본원에서 상호교환가능하게 사용된다.
본원에 사용된 바와 같이, 용어 "치료," "치료하다," 및 "치료하는"은 본원에 기재된 바와 같은 장애 또는 병태, 또는 장애 또는 병태의 하나 이상의 증상을 부분적으로 또는 완전히 완화, 억제하고/하거나, 이의 발병을 지연시키고/시키거나, 예방, 개선 및/또는 경감시키는 것을 지칭한다. 일부 구현예에서, 치료는 하나 이상의 증상이 발생한 후 투여될 수 있다. 일부 구현예에서, 용어 "치료하는"은 질환 또는 장애의 진행을 방지하거나 또는 정지시키는 것을 포함한다. 다른 구현예에서, 치료는 증상의 부재 하에 투여될 수 있다. 예를 들어, 치료는 증상의 발병 이전에 (예를 들어, 증상의 병력에 비추어 및/또는 유전적 또는 다른 감수성 요인에 비추어) 감수성이 예민한 개체에게 투여될 수 있다. 치료는 예를 들어, 재발을 예방하거나 또는 지연시키기 위해 증상이 해결된 후에도 계속될 수 있다. 따라서, 일부 구현예에서, 용어 "치료하는"은 질환 또는 장애의 재발 또는 되풀이를 방지하는 것을 포함한다.
투여가 고려되는 "대상체"는 인간(즉, 임의의 연령 그룹의 남성 또는 여성, 예를 들어, 소아 대상체(예를 들어, 유아, 아동, 청소년) 또는 성인 대상체(예를 들어, 청년, 중년 또는 노년)) 및/또는 비인간 동물, 예를 들어, 포유동물 예컨대 영장류(예를 들어, 시노몰구스 원숭이, 레서스 원숭이), 소, 돼지, 말, 양, 염소, 설치류, 고양이, 및/또는 개를 포함하나 이에 제한되지 않는다. 특정 구현예에서, 대상체는 인간이다. 특정 구현예에서, 대상체는 비인간 동물이다. 용어 "환자," 및 "대상체"는 본원에서 상호교환가능하게 사용된다.
용어 "약제학적으로 허용되는 담체, 애쥬번트(adjuvant), 또는 비히클"은 제형화되는 화합물(들)의 약리학적 활성을 파괴하지 않는 무독성 담체, 애쥬번트, 또는 비히클을 지칭한다. 본원에 개시된 화합물의 조성물에 사용될 수 있는 약제학적으로 허용되는 담체, 애쥬번트 또는 비히클은 이온 교환기, 알루미나, 알루미늄 스테아레이트, 레시틴, 혈청 단백질, 예컨대 인간 혈청 알부민, 완충 물질 예컨대 포스페이트, 글리신, 소르브산, 칼륨 소르베이트, 포화된 식물성 지방산의 부분 글리세리드 혼합물, 물, 염 또는 전해질, 예컨대 프로타민 술페이트, 이나트륨 수소 포스페이트, 칼륨 수소 포스페이트, 나트륨 클로라이드, 아연 염, 콜로이드성 실리카, 마그네슘 트리실리케이트, 폴리비닐 피롤리돈, 셀룰로스계 물질, 폴리에틸렌 글리콜, 나트륨 카르복시메틸셀룰로스, 폴리아크릴레이트, 왁스, 폴리에틸렌-폴리옥시프로필렌-블록 중합체, 폴리에틸렌 글리콜 및 양모 지방을 포함하나 이에 제한되지 않는다.
대안적인 구현예
대안적인 구현예에서, 본원에 기재된 화합물은 또한 하나 이상의 동위원소 치환을 포함할 수 있다. 예를 들어, 수소는 2H(D 또는 중수소) 또는 3H(T 또는 삼중수소)일 수 있고; 탄소는 예를 들어, 13C 또는 14C일 수 있고; 산소는 예를 들어, 18O일 수 있고; 질소는 예를 들어, 15N 등일 수 있다. 다른 구현예에서, 특정 동위원소(예를 들어, 3H, 13C, 14C, 18O, 또는 15N)는 화합물의 특정 부위를 차지하는 원소의 전체 동위원소 존재비의 적어도 1%, 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 99%, 또는 적어도 99.9%를 나타낼 수 있다.
약제학적 조성물
일부 구현예에서, 본 개시내용은 화학식 (I)의 화합물 및 약제학적으로 허용되는 담체, 애쥬번트, 또는 비히클을 포함하는 조성물을 제공한다. 본 개시내용의 화합물은 바람직하게는 투여의 용이성 및 투여량의 균일성을 위해 투여량 단위 형태로 제형화된다.
본 개시내용의 화합물을 사용하는 방법 - RNA 올리고뉴클레오티드의 합성
일부 구현예에서, 화학식 (I)의 화합물은 5'-캡핑된 RNA의 제조에 유용할 수 있다. 5'-캡핑된 RNA의 제조를 위해 본원에서 고려되는 방법 및 조성물은 mRNA, 작은 핵 RNA(snRNA), 작은 핵소체 RNA(snoRNA), 작은 카잘체-특이적 RNA(scaRNA)를 포함하나 이에 제한되지 않는다. 일부 구현예에서, 방법은 캡 함유 올리고뉴클레오티드 프라이머, 뉴클레오시드 5'-트리포스페이트(NTP) 및 RNA의 DNA-주형 및 프로모터-제어 합성을 위한 RNA 폴리머라제의 사용을 수반한다. 특정 측면에서, 방법은 RNA 합성, 특히 캡핑된 mRNA의 합성에서 유용성을 제공하는 개시 캡핑된 올리고뉴클레오티드 프라이머를 사용한다.
일부 구현예에서, 화학식 (I)의 화합물은 분자의 5'-단부 또는 근처에서 변형을 수반하는 mRNA, snRNA, snoRNA, scaRNA, 전달 RNA(tRNA), 리보솜 RNA(rRNA), 및 전달-메신저 RNA(tmRNA)를 포함하나 이에 제한되지 않는 RNA의 제조를 위한 방법에 유용할 수 있다. 일부 구현예에서, 방법은 캡이 있거나 없는 개시 올리고뉴클레오티드 프라이머, 뉴클레오시드 '-트리포스페이트(NTP) 및 RNA의 DNA-주형 및 프로모터-제어 합성을 위한 RNA 폴리머라제의 사용을 수반한다. 특정 측면에서, 방법은 RNA 합성; 특히 5'-변형된 RNA의 합성에서 유용성을 제공하는 구조적 변형을 수반하는 변형된 개시 올리고뉴클레오티드 프라이머를 사용한다.
개시 캡핑된 올리고뉴클레오티드 프라이머는 프라이머의 3'-단부에 뉴클레오티드 단위를 첨가함으로써 DNA 주형 상에서 RNA의 RNA 폴리머라제 매개 합성 개시를 가능하게 하는 개방 3'-OH 기를 갖는다. 개시 캡핑된 올리고뉴클레오티드 프라이머는 전사 개시 부위에서 주형 DNA 서열에 실질적으로 상보적이며(즉, 개시 부위는 프로모터 서열의 3'-말단에 더 가깝게 위치하고 프로모터 서열과 중첩할 수 있음), 특정 구현예에서, 개시 캡핑된 올리고뉴클레오티드 프라이머는 프라이머의 3'-단부에서 시작하여 주로 한 방향("정방향")으로 RNA 합성을 지시한다. 특정 측면 및 구현예에서, 개시 캡핑된 올리고뉴클레오티드 프라이머는 RNA 합성의 개시를 위해 임의의 뉴클레오시드 5'-트리포스페이트를 능가하여, 개시 캡핑된 올리고뉴클레오티드 프라이머로 시작하는 RNA의 생산을 최대화하고 5'-트리포스페이트-뉴클레오시드(전형적으로 GTP)로 시작하는 RNA의 생산을 최소화한다.
본 개시내용의 개시 캡핑된 올리고뉴클레오티드 프라이머는 개시 부위에서 DNA 주형 상의 서열에 상보적일 수 있는 혼성화 서열을 갖는다. 혼성화 서열의 존재는 개시 캡핑된 올리고뉴클레오티드 프라이머가 단지 원하는 배향(즉, "정방향" 배향)으로 개시 부위에서 DNA 주형의 상보적 서열과 주로 정렬하게 한다. 정방향 배향에서, RNA 전사체는 도립된 구아노신 잔기(즉, 7mG(5')ppp(5') N...)로 시작한다. 부정확한 "역" 배향에 비해 DNA 주형 상의 프라이머 정렬의 정방향 배향의 우세는 혼성화 복합체의 열역학에 의해 유지된다. 후자는 개시 캡핑된 올리고뉴클레오티드 프라이머의 혼성화 서열의 길이 및 DNA 주형과의 혼성화에 수반된 염기의 정체성에 의해 결정된다. 원하는 정방향 배향으로 혼성화는 또한 DNA 주형 및 개시 캡핑된 올리고뉴클레오티드 프라이머가 시험관내 전사 동안 혼성화 또는 사용되는 온도 및 반응 조건에 따라 달라질 수 있다.
본 개시내용의 개시 캡핑된 올리고뉴클레오티드 프라이머는 표준 GTP, ATP, CTP 또는 UTP를 사용한 개시의 효능과 비교하여 전사 개시의 효능을 향상시킨다. 일부 구현예에서, 전사 개시는 RNA의 합성이 개시 캡핑된 올리고뉴클레오티드 프라이머로부터 주로 시작하고 전사 혼합물의 임의의 NTP로부터 시작하지 않는 경우 향상된 것으로 간주된다. 향상된 전사 개시 효율은 더 높은 RNA 전사체 수율을 초래한다. 향상된 전사 개시 효율은 개시 캡핑 프라이머가 없는 통상적인 방법으로의 RNA 합성에 비해 약 10%, 약 20%, 약 40%, 약 60%, 약 80%, 약 90%, 약 100%, 약 150%, 약 200% 또는 약 500%로 증가될 수 있다. 특정 구현예에서 "개시 캡핑된 올리고뉴클레오티드 프라이머"는 전사 개시를 위한 임의의 NTP(GTP 포함)를 능가한다. 당업자는 개시 캡핑된 올리고뉴클레오티드 프라이머의 기질 활성 및 효능 수준을 용이하게 결정할 수 있다. 기질 효능을 결정하는 방법의 한 가지 예는 실시예 13에 예시되어 있다). 특정 구현예에서, 개시는 NTP보다 캡핑 올리고뉴클레오티드 프라이머로부터 발생하며, 이는 전사된 mRNA의 더 높은 캡핑 수준을 초래한다.
일부 측면에서, 치환 또는 변형을 갖는 개시 캡핑된 올리고뉴클레오티드 프라이머를 활용하여 RNA를 합성하는 방법이 제공된다. 일부 측면에서, 개시 캡핑된 올리고뉴클레오티드 프라이머의 치환 및 변형은 RNA의 합성을 실질적으로 손상시키지 않는다. 일상적인 테스트 합성은 바람직한 합성 결과가 변형된 개시 캡핑된 올리고뉴클레오티드 프라이머로 수득될 수 있는지 여부를 결정하기 위해 사전 형성될 수 있다. 당업자 바람직한 결과가 수득될 수 있는지 여부를 결정하기 위해 이러한 일상적인 실험을 수행할 수 있다. 개시 캡핑된 올리고뉴클레오티드 프라이머의 치환 또는 변형은 예를 들어, 하나 이상의 변형된 뉴클레오시드 염기, 하나 이상의 변형된 당, 하나 이상의 변형된 뉴클레오티드간 결합 및/또는 하나 이상의 변형된 트리포스페이트 가교를 포함한다.
본원에 제공된 방법 및 조성물의 하나 이상의 변형 그룹을 포함할 수 있는, 변형된 개시 캡핑된 올리고뉴클레오티드 프라이머는 개방 3'-OH 기에 NTP를 혼입함으로써 DNA 주형 상의 RNA 폴리머라제에 의해 확장될 수 있다. 개시 캡핑된 올리고뉴클레오티드 프라이머는 천연 RNA 및 DNA 뉴클레오시드, 변형된 뉴클레오시드 또는 뉴클레오시드 유사체를 포함할 수 있다. 개시 캡핑된 올리고뉴클레오티드 프라이머는 천연 뉴클레오티드간 포스포디에스테르 결합 또는 이의 변형, 또는 이의 조합을 함유할 수 있다.
본 개시내용의 화합물을 사용하는 방법 -치료 방법
일부 구현예에서, 본 개시내용은 RNA 올리고뉴클레오티드를 환자에게 투여하는 단계를 포함하는, 상기 환자에서 암의 중증도를 치료하거나 또는 경감시키는 방법이 제공되며, 상기 RNA 올리고뉴클레오티드는 화학식 (I)의 화합물을 포함한다.
일부 구현예에서, 본 개시내용의 방법에 따른 화합물 및 조성물은 암의 중증도를 치료하거나 또는 경감시키기에 효과적인 임의의 투여량 및 임의의 투여 경로를 사용하여 투여될 수 있다. 일부 구현예에서, 암은 폐암, 흑색종, 유방암, 난소암, 전립선암, 신장암, 위암, 결장암, 고환암, 두경부암, 췌장암, 방광암, 뇌암, B-세포 림프종, 급성 골수성 백혈병, 성인 급성 림프모구성 백혈병, 만성 골수성 백혈병, 만성 림프구성 백혈병, T 세포 림프구성 백혈병, 비소세포 폐암, 및 소세포 폐암으로 이루어진 군으로부터 선택된다.
일부 구현예에서, 암은 고형 종양이다. 일부 구현예에서, 암은 미세부수체 안정성-대장암(MSS-CRC), 비소세포 폐암(NSCLC), 췌장 도관 선암종(PDA), 및 위식도 선암종(GEA)으로 이루어진 군으로부터 선택된다. 일부 구현예에서, 암은 MSS-CRC, NSCLC, 및 PDA로 이루어진 군으로부터 선택된다.
일부 구현예에서, 본 개시내용의 화학식 (I)의 화합물을 포함하는 RNA 올리고뉴클레오티드는 폐암, 흑색종, 유방암, 난소암, 전립선암, 신장암, 위암, 결장암, 고환암, 두경부암, 췌장암, 방광암, 뇌암, B-세포 림프종, 급성 골수성 백혈병, 성인 급성 림프모구성 백혈병, 만성 골수성 백혈병, 만성 림프구성 백혈병, T 세포 림프구성 백혈병, 비소세포 폐암, 및 소세포 폐암으로 이루어진 구능로부터 선택된 암에 걸린 환자에게 투여된다.
일부 구현예에서, 화학식 (I)의 화합물을 포함하는 RNA 올리고뉴클레오티드는 감염된 환자에게 투여된다. 일부 구현예에서, 감염은 바이러스 감염, 진균, 또는 박테리아 감염이다. 일부 구현예에서, 감염은 바이러스 감염이다. 일부 구현예에서, 바이러스 감염은 바이러스에 의한 감염이며, 상기 바이러스는 HIV이다. 일부 구현예에서, 화학식 (I)의 화합물을 포함하는 RNA 올리고뉴클레오티드는 AIDS 환자에게 투여된다. 일부 구현예에서, 바이러스 감염은 바이러스에 의한 감염이며, 상기 바이러스는 코로나바이러스이다. 일부 구현예에서, 화학식 (I)의 화합물을 포함하는 RNA 올리고뉴클레오티드는 COVID-19 환자에게 투여된다.
일부 구현예에서, 본 개시내용은 생물학적 샘플을 화학식 (I)의 화합물을 포함하는 RNA 올리고뉴클레오티드와 접촉시키는 방법에 관한 것이다.
일부 구현예에서, 하나 이상의 추가의 치료제는 또한 화학식 (I)의 화합물을 포함하는 RNA 올리고뉴클레오티드와 조합하여 투여될 수 있다. 일부 구현예에서, 화학식 (I)의 화합물을 포함하는 RNA 올리고뉴클레오티드 및 하나 이상의 추가의 치료제는 다중 투여량 레지멘의 일부로서 투여될 수 있다. 일부 구현예에서 화학식 (I)의 화합물을 포함하는 RNA 올리고뉴클레오티드 및 하나 이상의 추가의 치료제는 동시에, 순차적으로 또는 일정 기간 이내에 투여될 수 있으며 투여될 수 있다. 일부 구현예에서, 화학식 (I)의 화합물을 포함하는 RNA 올리고뉴클레오티드 및 하나 이상의 추가의 치료제는 서로 5시간 이내에 투여될 수 있다. 일부 구현예에서, 화학식 (I)의 화합물을 포함하는 RNA 올리고뉴클레오티드 및 하나 이상의 추가의 치료제는 서로 24시간 이내에 투여될 수 있다. 일부 구현예에서, 화학식 (I)의 화합물을 포함하는 RNA 올리고뉴클레오티드 및 하나 이상의 추가의 치료제는 서로 1주 이내에 투여될 수 있다.
자기-증폭 mRNA 벡터
일반적으로, 모든 자기-증폭 mRNA(SAM) 벡터는 자기-복제 바이러스로부터 유래된 자기-증폭 백본을 함유한다. 용어 "자기-증폭 백본"은 바이러스 게놈의 자기-복제를 가능하게 하는 자기-복제 바이러스의 최소 서열(들)을 지칭한다. 예를 들어, 알파바이러스의 자기-복제를 가능하게 하는 최소 서열은 비구조적 단백질-매개 증폭을 위한 보존된 서열(예를 들어, 비구조적 단백질 1(nsP1) 유전자, nsP2 유전자, nsP3 유전자, nsP4 유전자, 및/또는 폴리A 서열)을 포함할 수 있다. 자기-증폭 백본는 또한 서브게놈 바이러스 RNA(예를 들어, 알파바이러스의 경우 26S 프로모터 요소와 같은 서브게놈 프로모터)의 발현을 위한 서열을 포함할 수 있다. SAM 벡터는 양성-센스 RNA 폴리뉴클레오티드 또는 음성-센스 RNA 폴리뉴클레오티드, 예컨대 양성-센스 또는 음성-센스 자기-복제 바이러스로부터 유래된 백본이 있는 벡터일 수 있다. 자기-복제 바이러스는 알파바이러스, 플라비바이러스(예를 들어, 쿤진(kunjin) 바이러스), 홍역 바이러스, 및 랍도바이러스(예를 들어, 공수병 바이러스 및 수포성 구내염 바이러스)를 포함하나 이에 제한되지 않는다. 자기-복제 바이러스로부터 유래된 SAM 벡터 시스템의 예는 Lundstrom (Molecules. 2018 Dec 13;23(12). pii: E3310. doi: 10.3390/molecules23123310)에 더 상세히 기재되어 있으며, 모든 목적을 위해 본원에 참조로 포함된다.
시험관내에서 자기-증폭 생산
RNA 생산을 위해 당업계에 잘 알려진 편리한 기술은 시험관내 전사(IVT)이다. 이 기술에서, 원하는 벡터의 DNA 주형은 먼저 클로닝, 제한 소화, 결찰, 유전자 합성(예를 들어, 화학적 및/또는 효소적 합성), 및 폴리머라제 연쇄 반응(PCR)과 같은 표준 분자 생물학 기술을 포함하여 당업자에게 잘 알려진 기술에 의해 생산된다.
DNA 주형은 RNA(예를 들어, SAM)로 전사되기를 원하는 서열의 5' 단부에 RNA 폴리머라제 프로모터를 함유한다. 프로모터는 T3, T7, SP6, 또는 K11과 같은 박테리오파지 폴리머라제 프로모터를 포함하나 이에 제한되지 않는다. 선택된 특이적 RNA 폴리머라제 프로모터 서열에 따라, 원하는 서열에 더하여 추가의 5' 뉴클레오티드가 전사될 수 있다. 예를 들어, 표준 T7 프로모터는 서열 TAATACGACTCACTATAGG로 지칭될 수 있으며, 여기서 원하는 서열 N의 생산을 위해 DNA 주형 TAATACGACTCACTATAGGNV를 사용하는 IVT 반응은 mRNA 서열 GG-NV를 초래할 것이다. 일반적으로, 그리고 이론에 얽매이기를 원하지 않고, T7 폴리머라제는 구아노신으로 시작하는 RNA 전사체를 보다 효율적으로 전사한다. 그러나, 추가의 5' 뉴클레오티드는 바람직하지 않을 수 있고/있거나 또는 해로울 수 있다. 따라서, DNA 주형에 함유된 RNA 폴리머라제 프로모터는 원하는 서열의 5' 뉴클레오티드만을 함유하는 전사체를 초래하는 서열, 예를 들어, 자기-복제 바이러스의 천연 게놈 서열을 지칭하는, SAM 벡터가 유래된 자기-복제 바이러스의 내인성("천연" 또는 "게놈"으로도 지칭됨) 5' 서열을 갖는 SAM일 수 있다(예를 들어, "AU-SAM"으로도 지칭되는 내인성 5' VEEV 뉴클레오티드를 가짐). 예를 들어, 최소 T7 프로모터는 서열 TAATACGACTCACTATA(5'-3'으로 배향됨; φ6.5 T7 프로모터)로 지칭될 수 있으며, 여기서 원하는 서열 N의 생산을 위해 DNA 주형 TAATACGACTCACTATAN1N2NV를 사용하는 IVT 반응은 mRNA 서열 N1N2NV를 초래할 것이다. 대안적인 최소 T7 프로모터는 서열 TAATACGACTCACTATT(5'-3'으로 배향됨; φ2.5 T7 프로모터)로 지칭될 수 있다. 마찬가지로, 서열 ATTTAGGTGACACTATA로 지칭되는 최소 SP6 프로모터는 추가의 5' 뉴클레오티드 없이 전사체를 생성하는 데 사용될 수 있다. 마찬가지로, 서열 AATTAGGGCACACTATA로 지칭되는 최소 K11 프로모터는 추가의 5' 뉴클레오티드 없이 전사체를 생성하는 데 사용될 수 있다. 전형적인 IVT 반응에서, DNA 주형은 적절한 RNA 폴리머라제 효소, 완충제, 및 뉴클레오티드(NTP)와 함께 인큐베이션된다.
생성된 RNA 폴리뉴클레오티드는 임의적으로 7-메틸구아노신과 같은 5' 캡 구조 또는 관련된 구조의 첨가, 및 임의적으로 폴리아데닐화(폴리A) 꼬리를 포함하도록 3' 단부를 변형시키는 것을 포함하나 이에 제한되지 않고 추가로 변형될 수 있다. 변형된 IVT 반응에서, RNA는 IVT 동안 캡 유사체의 첨가를 통해 공동 전사적으로 5' 캡 구조로 캡핑된다. 캡 유사체는 디뉴클레오티드(m7G-ppp-N) 캡 유사체 또는 트리뉴클레오티드(m7G-ppp-N1-N2) 캡 유사체를 포함할 수 있으며, 여기서 N은 뉴클레오티드 또는 변형된 뉴클레오티드(예를 들어, 아데노신, 구아노신, 시티딘, 및 우라딘을 포함하나 이에 제한되지 않는 리보뉴클레오시드)를 나타낸다. 변형된 뉴클레오티드는 N6-메틸아데노신 2'-OH-메틸화와 같은 변형된 아데노신을 포함할 수 있다. 트리뉴클레오티드(m7G-ppp-N1-N2) 캡 유사체를 포함하는 예시적인 비제한적인 예에서, N1은 N6-메틸아데노신 2'-OH-메틸화일 수 있다. 캡 유사체는 본원에 기재된 구조 또는 화학식 중 임의의 것을 포함할 수 있다. 예시적인 캡 유사체 및 IVT 반응에서 그들의 용도는 또한 미국 특허 번호 10,519,189에 더 상세하게 기재되어 있으며, 모든 목적을 위해 본원에 참조로 포함된다. 논의된 바와 같이, T7 폴리머라제는 구아노신으로 시작하는 RNA 전사체를 보다 효율적으로 전사한다. 구아노신으로 시작하지 않는 주형에서 전사 효율을 개선하기 위해, 트리뉴클레오티드 캡 유사체(m7G-ppp-N-N)가 사용될 수 있다. 트리뉴클레오티드 캡 유사체는 디뉴클레오티드 캡 유사체(m7G-ppp-N)를 사용하는 IVT 반응에 비해 전사 효율을 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20-배 또는 그 이상 증가시킬 수 있다.
5' 캡 구조는 또한 mRNA 2'-O-메틸트랜스퍼라제 및 S-아데노실 메티오닌을 함유하는 백시니아 캡핑 시스템(예를 들어, NEB 카탈로그 번호 M2080)을 사용하는 것과 같이, 전사 후 첨가될 수 있다.
그런 다음 RNA는 페놀- 클로로포름 추출 또는 칼럼 정제(예를 들어, 크로마토그래피-기반 정제)와 같이 당업계에 잘 알려진 기술을 사용하여 정제될 수 있다.
알파바이러스 생물학
알파바이러스는 토가비리다에(Togaviridae) 과의 구성원이며, 양성-센스 단일 가닥 RNA 바이러스이다. 구성원은 전형적으로 신드비스, 로스 리버, 마야로, 치쿤구니야, 및 셈리키 삼림열 바이러스과 같은 구세계, 또는 동부 말 뇌염, 아우라, 포트 모간, 또는 베네수엘라 말 뇌염 바이러스와 같은 신세계 및 그의 파생 균주 TC-83으로 분류된다(Strauss Microbrial Review 1994). 천연 알파바이러스 게놈은 전형적으로 약 12kb 길이이며, 처음 2/3은 바이러스 게놈의 자기-복제를 위한 RNA 복제 복합체를 형성하는 비구조적 단백질(nsP)을 암호화하는 유전자를 함유하고, 마지막 1/3은 비리온 생산을 위한 구조적 단백질을 암호화하는 서브게놈 발현 카세트를 함유한다(Frolov RNA 2001).
알파바이러스의 모델 수명주기는 여러 별개의 단계를 수반한다(Strauss Microbrial Review 1994, Jose Future Microbiol 2009). 숙주 세포에 바이러스를 부착한 후, 비리온은 식균작용 구획 내의 막과 융합하여 궁극적으로 게놈 RNA를 세포질로 방출한다. 플러스-가닥 배향에 있고 5' 메틸구아닐레이트 캡 및 3' 폴리A 꼬리를 포함하는 게놈 RNA는 복제 복합체를 형성하는 비구조적 단백질 nsP1-4를 생산하도록 번역된다. 감염 초기에, 이어서 플러스-가닥은 복합체에 의해 마이너스 가닥 주형으로 복제된다. 현재 모델에서, 복제 복합체는 감염이 진행됨에 따라 추가로 처리되며, 생성된 처리된 복합체는 마이너스-가닥을 전장 양성-가닥 게놈 RNA, 뿐만 아니라 구조적 유전자를 함유하는 26S 서브게놈 양성-가닥 RNA 둘 다로 전사하도록 전환된다. 알파바이러스의 여러 보존된 서열 요소(CSE)는 마이너스-가닥 주형으로부터 플러스-가닥 RNA의 복제에서 5' UTR의 보체, 게놈 주형으로부터 마이너스-가닥 합성의 복제에서 51-nt CSE, 마이너스-가닥으로부터 서브게놈 RNA의 전사에서 nsP와 26S RNA 사이의 접합 영역에서 24-nt CSE, 및 플러스-가닥 주형으로부터 마이너스-가닥 합성에서 3' 19-nt CSE를 포함하는 다양한 RNA 복제 단계에서 잠재적으로 역할을 하는 것으로 식별되었다.
다양한 RNA 종의 복제 후, 이어서 바이러스 입자는 전형적으로 바이러스의 자연적 수명주기에서 조립된다. 26S RNA는 번역되고 생성된 단백질은 캡시드 단백질, 당단백질 E1 및 E2, 및 2개의 작은 폴리펩티드 E3 및 6K를 포함하는 구조적 단백질을 생산하도록 추가로 처리된다(Strauss 1994). 바이러스 RNA의 캡슐화가 발생하며, 일반적으로 게놈 RNA에만 특이적인 캡시드 단백질이 패키징된 후, 비리온 조립되고 막 표면에서 출아된다.
알파바이러스 전달 벡터
알파바이러스(알파바이러스 서열, 특징, 및 다른 요소 포함)는 알파바이러스-기반 전달 벡터(알파바이러스 벡터, 알파바이러스 바이러스 벡터, 알파바이러스 백신 벡터, 자기-복제 RNA(srRNA) 벡터, 또는 자기-증폭 mRNA(SAM) 벡터로도 지칭됨)를 생성하는 데 사용될 수 있다. 알파바이러스는 이전에 발현 벡터 시스템으로서 사용하기 위해 조작되었다(Pushko 1997, Rheme 2004). 알파바이러스는 특히 이종 항원 발현이 바람직할 수 있는 백신 설정에서 여러 장점을 제공한다. 숙주 세포질에서 자기-복제하는 능력으로 인해, 알파바이러스 벡터는 일반적으로 높은 수준의 이종 항원 생산을 초래하는 세포 내에서 발현 카세트의 높은 카피 수를 생산할 수 있다. 추가로, 벡터는 일반적으로 일시적이며, 개선된 생물안전성 뿐만 아니라 벡터에 대한 면역학적 관용 유도의 감소를 초래한다. 일반적으도 대중은 또한 인간 아데노바이러스와 같은 다른 표준 바이러스 벡터와 비교하여 알파바이러스 벡터에 대한 기존 면역이 결여되어 있다. 알파바이러스 기반 벡터는 또한 일반적으로 감염된 세포에 대한 세포독성 반응을 초래한다. 세포독성은 어느 정도까지 발현된 이종 항원에 대한 면역 반응을 적절하게 자극하는 백신 설정에서 중요할 수 있다. 그러나, 원하는 세포독성 정도는 균형 작용일 수 있으며, 따라서 VEEV의 TC-83 균주를 포함하는 여러 약독화 알파바이러스가 개발되었다. 따라서, 본원에 기재된 항원 발현 벡터의 예는 높은 수준의 항원 발현을 가능하게 하고, 항원에 대한 강력한 면역 반응을 자극하고, 벡터 자체에 대한 면역 반응을 자극하지 않고, 안전한 방식으로 사용될 수 있는 알파바이러스 벡본을 활용할 수 있다. 또한, 항원 발현 카세트는 VEEV 또는 그의 약독화 유도체 TC-83으로부터 유래된 서열을 포함하나 이에 제한되지 않는 벡터가 사용하는 알파바이러스 서열의 최적화를 통해 상이한 수준의 면역 반응을 자극하도록 설계될 수 있다.
여러 발현 벡터 설계 전략은 알파바이러스 서열을 사용하여 조작되었다(Pushko 1997). 한 가지 전략에서, 알파바이러스 벡터 설계는 구조적 단백질 유전자의 하류에 있는 26S 프로모터 서열 요소의 두번째 카피를 삽입한 후, 이종 유전자를 삽입하는 것을 포함한다(Frolov 1993). 따라서, 천연 비구조적 및 구조적 단백질에 더하여, 이종 단백질을 발현하는 추가의 서브게놈 RNA가 생산된다. 이 시스템에서, 감염성 비리온의 생산을 위한 모든 요소가 존재하고, 따라서, 감염되지 않은 세포에서 발현 벡터의 반복된 감염이 발생할 수 있다.
또 다른 발현 벡터 설계는 헬퍼 바이러스 시스템의 사용으로 이루어진다(Pushko 1997). 이 전략에서, 구조적 단백질은 이종 유전자로 대체된다. 따라서, 여전히 온전한 비구조적 유전자에 의해 매개되는 바이러스 RNA의 자기-복제 후, 26S 서브게놈 RNA는 이종 단백질의 발현을 제공한다. 전통적으로, 구조적 단백질을 발현하는 추가의 벡터는 이어서 세포주의 공동 형질감염에 의한 것과 같이 트랜스로 공급되어, 감염성 바이러스를 생산한다. 시스템은 USPN 8,093,021에 상세하게 기재되어 있으며, 모든 목적을 위해 그 전문이 본원에 참조로 포함된다. 헬퍼 벡터 시스템은 감염성 입자를 형성할 가능성을 제한하는 이점을 제공하며, 따라서, 생물안전성을 개선시킨다. 또한, 헬퍼 벡터 시스템은 총 벡터 길이를 감소시켜, 잠재적으로 복제 및 발현 효율을 개선시킨다. 따라서, 본원에 기재된 항원 발현 벡터의 예는 구조적 단백질이 항원 카세트에 의해 대체된 알파바이러스 백본을 활용할 수 있으며, 생성된 벡터는 생물안전성 문제를 감소시키면서, 동시에 전반적인 발현 벡터 크기의 감소로 인해 효율적인 발현을 촉진한다.
지질 나노입자(LNP)를 통한 전달
백신 벡터 설계에서 고려해야 할 중요한 측면은 벡터 자체에 대한 면역이다(Riley 2017). 이는 특정 인간 아데노바이러스 시스템을 사용하는 것과 같이, 벡터 자체에 대한 기존 면역의 형태, 또는 백신 투여 후 벡터에 대한 면역 발달의 형태일 수 있다. 후자는 별도의 프라이밍 및 부스팅 용량과 같이 동일한 백신의 다중 투여가 수행되는 경우, 또는 동일한 백신 벡터 시스템이 상이한 항원 카세트를 전달하는 데 사용되는 경우 중요한 고려사항이다.
알파바이러스 벡터의 경우, 표준 전달 방법은 캡시드, E1, 및 E2 단백질을 트랜스로 제공하여 감염성 바이러스 입자를 생산하는 이전에 논의된 헬퍼 바이러스 시스템이다. 그러나, E1 및 E2 단백질이 종종 중화 항체의 중요한 표적이라는 점에 유의하는 것이 중요하다(Strauss 1994). 따라서, 감염성 입자가 중화 항체에 의해 표적화되는 경우 관심 항원을 표적 세포에 전달하기 위해 알파바이러스 벡터를 사용하는 효능이 감소될 수 있다.
바이러스 입자 매개 유전자 전달에 대한 대안은 나노물질을 사용하여 발현 벡터에 전달하는 것이다(Riley 2017). 중요하게는, 나노물질 비히클은 비-면역원성 물질로 만들어지고 일반적으로 전달 벡터 자체에 대한 면역 유발을 피할 수 있다. 이들 물질은 지질, 무기 나노물질, 및 다른 중합체성 물질을 포함할 수 있으나 이에 제한되지 않는다. 지질은 양이온성, 음이온성, 또는 중성일 수 있다. 물질은 합성이거나 또는 자연적으로 유래될 수 있고, 일부 경우에 생분해성일 수 있다. 지질은 지방, 콜레스테롤, 인지질, 폴리에틸렌글리콜(PEG) 접합체(PEG화 지질)를 포함하나 이에 제한되지 않는 지질 접합체, 왁스, 오일, 글리세리드, 및 지용성 비타민을 포함할 수 있다.
지질 나노입자(LNP)는 막 및 소포 유사 구조의 형성을 가능하게 하는 지질의 양친매성 속성으로 인해 매력적인 전달 시스템이다(Riley 2017). 일반적으로, 이들 소포는 표적 세포의 막에 흡수되고 핵산을 세포질로 방출함으로써 발현 벡터를 전달한다. 또한, LNP는 특이적 세포 유형의 표적화를 가능하게 하도록 추가로 변형되거나 또는 기능화될 수 있다. 예시적 예로서, LNP의 선택적이고 표적화된 전달은 1) 세포-유형 특이적 수용체에 대한 지질 접합된 리간드(예를 들어, 만노스)를 LNP로 혼입하고/하거나, 2) 표적화 항체와 상호작용하는 막-테더링 지단백질(앵커(Anchor))을 LNP로 혼입함으로써 달성될 수 있다. 앵커는 단백질 A/G 및 scFv, Fab, 및 VHH 단일 도메인 항체 또는 N-말단 또는 C-말단에서 암호화된 외인성 지질화 신호(예를 들어, 팔미토일화, 프레닐화, 및 미리스토일화)를 갖는 나노바디(nanobody)를 포함하는 항체의 임의의 구조적 형태일 수 있다. LNP 설계에서 또 다른 고려사항은 표적화 효율과 세포독성 사이의 균형이다. 지질 조성물은 일반적으로 양이온성, 중성, 음이온성, 및 양친매성 지질의 한정된 혼합물을 포함한다. 일부 경우에, LNP 응집을 방지하거나, 지질 산화를 방지하거나, 또는 추가의 모이어티의 부착을 용이하게 하는 기능적 화학적 그룹을 제공하기 위해 특정 지질이 포함된다. 지질 조성물은 전반적인 LNP 크기 및 안정성에 영향을 미칠 수 있다. 예에서, 지질 조성물은 디리놀레일메틸- 4-디메틸아미노부티레이트(MC3) 또는 MC3-유사 분자를 포함한다. MC3 및 MC3-유사 지질 조성물은 PEG 또는 PEG-접합된 지질, 포스포콜린, 포스포에탄올아민, 스테롤, 또는 중성 지질과 같은 하나 이상의 다른 지질을 포함하도록 제형화될 수 있다.
혈청에 직접 노출된 발현 벡터와 같은 핵산 벡터는 혈청 뉴클레아제에 의한 핵산의 분해 또는 유리 핵산에 의한 면역계의 표적외 자극을 포함하는, 여러 원치않은 결과를 가질 수 있다. 따라서, 알파바이러스 벡터의 캡슐화는 분해를 피하면서, 또한 잠재적인 표적외 효과를 피하는 데 사용될 수 있다. 특정 예에서, 알파바이러스 벡터는 LNP의 수성 내부 내에서와 같이, 전달 비히클 내에서 완전히 캡슐화된다. LNP 내에서 알파바이러스 벡터의 캡슐화는 미세유체 혼합 및 미세유체 액적 생성 장치에서 수행되는 액적 생성과 같은 당업자에게 잘 알려진 기술에 의해 수행될 수 있다. 이러한 장치는 표준 T-접합 장치 또는 유동-포커싱 장치를 포함하나 이에 제한되지 않는다. 예에서, MC3 또는 MC3-유사 함유 조성물과 같은 원하는 지질 제형은 알파바이러스 전달 벡터 및 다른 원하는 제제와 동시에 액적 생성 장치에 제공되어, 전달 벡터 및 원하는 제제가 MC3 또는 MC3-유사 기반 LNP의 내부에서 완전히 캡슐화되도록 한다. 예에서, 액적 생성 장치는 생산된 LNP의 크기 범위 및 크기 분포를 제어할 수 있다. 예를 들어, LNP는 1 내지 1000 나노미터 직경, 예를 들어, 1, 10, 50, 100, 500, 또는 1000 나노미터의 크기 범위를 가질 수 있다. 액적 생성 후, 발현 벡터를 캡슐화하는 전달 비히클은 추가로 처리되거나 또는 변형되어 투여를 위해 제조될 수 있다.
다른 벡터
본원에 기재된 자기-증폭 mRNA(SAM) 기반 조성물은 별개의(예를 들어, 비-SAM) 벡터 백본을 특징으로 하는 다른 조성물과 함께 사용될 수 있다. 예를 들어 SAM 조성물은 항원 카세트를 암호화하기 위해 침팬지 기원의 벡터 백본을 또한 사용하는 백신 전략의 일부로서 사용될 수 있다. 침팬지 C68 아데노바이러스(본원에서 ChAdV68로도 지칭됨)의 뉴클레오티드 서열은 항원 전달을 위한 백신 조성물에 사용될 수 있다(서열번호: 1 참조). C68 아데노바이러스 유래 벡터의 사용은 USPN 6,083,716, 미국 출원 공개 번호 US20200197500A1, 및 국제 특허 출원 공개 WO2020/243719에 추가로 기재되어 있으며, 각각은 모든 목적을 위해 그 전문이 본원에 참조로 포함된다.
항원
항원은 뉴클레오티드 또는 폴리펩티드를 포함할 수 있다. 예를 들어, 항원은 폴리펩티드 서열을 암호화하는 RNA 서열일 수 있다. 따라서 백신에 유용한 항원은 뉴클레오티드 서열 또는 폴리펩티드 서열을 포함할 수 있다.
본원에는 본원에 개시된 방법에 의해 식별된 종양 특이적 돌연변이를 포함하는 단리된 펩티드, 알려진 종양 특이적 돌연변이를 포함하는 펩티드, 및 본원에 개시된 방법에 의해 식별된 돌연변이체 폴리펩티드 또는 이의 단편이 개시된다. 신생항원이 관련된 폴리펩티드 서열을 코딩하는 뉴클레오티드 서열(예를 들어, DNA 또는 RNA)을 포함하는 경우 신생항원 펩티드는 코딩 서열의 맥락에서 기재될 수 있다.
또한 본원에는 정상 세포 또는 조직과 비교하여 종양 세포 또는 암성 조직에서 변경된 발현을 갖는 것으로 알려져 있거나 또는 밝혀진 임의의 폴리펩티드, 예를 들어 정상 세포 또는 조직과 비교하여 종양 세포 또는 암성 조직에서 비정상적으로 발현되는 것으로 알려져 있거나 또는 밝혀진 임의의 폴리펩티드로부터 유래된 펩티드가 개시된다. 항원성 펩티드가 유래될 수 있는 적합한 폴리펩티드는 예를 들어 COSMIC 데이터베이스에서 찾을 수 있다. COSMIC은 인간 암에서 체세포 돌연변이에 대한 포괄적인 정보를 선별한다. 펩티드는 종양 특이적 돌연변이를 함유할 수 있다. 종양 항원(예를 들어, 공유된 종양 항원 및 종양 신생항원)은 미국 출원 번호 17/058,128에 기재된 것들을 포함할 수 있으나 이에 제한되지 않으며, 모든 목적을 위해 본원에 참조로 포함된다.
또한 본원에는 감염성 질환 유기체, 대상체의 감염, 또는 대상체의 감염된 세포와 연관된 임의의 폴리펩티드로부터 유래된 펩티드가 개시된다. 항원은 감염성 질환 유기체의 뉴클레오티드 서열 또는 폴리펩티드 서열로부터 유래될 수 있다. 감염성 질환 유기체의 폴리펩티드 서열은 병원체-유래 펩티드, 바이러스-유래 펩티드, 박테리아-유래 펩티드, 진균-유래 펩티드, 및/또는 기생충-유래 펩티드를 포함하나 이에 제한되지 않는다. 감염성 질환 유기체 중증 급성 호흡기 증후군-관련 코로나바이러스(SARS), 중증 급성 호흡기 증후군 코로나바이러스 2(SARS-CoV-2), 에볼라, HIV, B형 간염 바이러스(HBV), 인플루엔자, C형 간염 바이러스(HCV), 인간 유두종바이러스(HPV), 사이토메갈로바이러스(CMV), 치쿤구니야 바이러스, 호흡기 세포융합 바이러스(RSV), 뎅기 바이러스, 오르티믹소비리다에 바이러스, 및 결핵을 포함하나 이에 제한되지 않는다.
본원에는 본원에 개시된 방법에 의해 식별된 감염성 질환 유기체 특이적 항원 또는 에피토프를 포함하는 단리된 펩티드, 알려진 감염성 질환 유기체 특이적 항원 또는 에피토프를 포함하는 펩티드, 및 본원에 개시된 방법에 의해 식별된 돌연변이체 폴리펩티드 또는 이의 단편이 개시된다. 항원이 관련된 폴리펩티드 서열을 코딩하는 뉴클레오티드 서열(예를 들어, DNA 또는 RNA)을 포함하는 경우 항원 펩티드는 코딩 서열의 맥락에서 기재될 수 있다.
본원에 기재된 벡터 및 연관된 조성물은 독소 또는 다른 부산물을 포함하는 임의의 유기체로부터 항원을 전달하는 사용되어, 유기체 또는 그의 부산물과 연관된 감염 또는 다른 역반응을 예방 및/또는 치료할 수 있다.
백신에 혼입될 수 있는(예를 들어, 카세트에서 암호화된) 항원은 인간 및 비인간 척추동물을 감염시키는 병원성 바이러스와 같은 바이러스에 대한 인간 또는 비인간 동물을 면역화하는 데 유용한 면역원을 포함한다. 항원은 다양한 바이러스 과로부터 선택될 수 있다. 면역 반응이 바람직할 수 있는 것에 대한 바람직한 바이러스 과의 예는 감기 사례의 약 50%를 담당하는 리노바이러스 속; 폴리오바이러스, 콕사키바이러스, 에코바이러스, 및 A형 간염 바이러스와 같은 인간 장내바이러스를 포함하는 장내바이러스 속; 및 주로 비인간 동물에서 구제역을 담당하는 아프도바이러스 속을 포함하는 피코르나바이러스 과를 포함한다. 바이러스의 피코르나바이러스 과 내에서, 표적 항원은 VP1, VP2, VP3, VP4, 및 VPG를 포함한다. 또 다른 바이러스 과는 유행성 위장염의 중요한 원인 인자인 바이러스의 Norwalk 그룹을 포함하는 칼시바이러스 과를 포함한다. 인간 및 비인간 동물에서 면역 반응을 자극하기 위한 항원을 표적화하는 데 사용하기에 바람직한 또 다른 바이러스 과는 신드비스 바이러스, 로스리버 바이러스, 및 베네주엘라, 동부 및 서부 말 뇌염, 및 풍진 바이러스를 포함하는 루비바이러스를 포함하는 알파바이러스 속을 포함하는 토가바이러스 과이다. 플라비비리다에 과는 뎅기, 황열병, 일본 뇌염, 세인트 루이스 뇌염 및 진드기 매개 뇌염 바이러스를 포함한다. 다른 표적 항원은 감기 및/또는 비-A형, B형 또는 C형 간염을 유발할 수 있는, 전염성 기관지염 바이러스(가금류), 돼지 전염성 위장염 바이러스(되재), 돼지 혈구응집성 뇌척수염 바이러스(돼지), 고양이 전염성 복막염 바이러스(고양이), 고양이 장 코로나바이러스(고양이), 개 코로나바이러스(개), 및 인간 호흡기 코로나바이러스와 같은 다수의 비인간 바이러스를 포함하는, C형 간염 또는 코로나바이러스 과로부터 생성될 수 있다. 코로나바이러스 과 내에서, 표적 항원은 E1(M 또는 기질 단백질이라고도 함), E2(S 또는 스파이크 단백질이라고도 함), E3(HE 또는 헤마글루틴-엘테로스라고도 함) 당단백질(모든 코로나바이러스에 존재하지 않음), 또는 N(뉴클레오캡시드)을 포함한다. 또 다른 항원은 수포성바이러스 속(예를 들어, 수포성 구내염 바이러스), 및 리사바이러스 속(예를 들어, 공수병)을 포함하는 랍도바이러스 과에 대해 표적화될 수 있다. 랍도바이러스 과 내에서, 적합한 항원은 G 단백질 또는 N 단백질로부터 유래될 수 있다. 마르부르크 및 에볼라 바이러스와 같은 출혈열을 포함하는 필로비리다에 과는 적합한 항원 공급원일 수 있다. 파라믹소바이러스 과는 파라인플루엔자 바이러스 유형 1, 파라인플루엔자 바이러스 유형 3, 소 파라인플루엔자 바이러스 유형 3, 루불라바이러스(볼거리 바이러스), 파라인플루엔자 바이러스 유형 2, 파라인플루엔자 바이러스 유형 4, 뉴캐슬병 바이러스(닭), 우역, 홍역 및 개 홍역을 포함하는 모르빌리바이러스, 및 호흡기 세포융합 바이러스(예를 들어, 글리코-(G) 단백질 및 융합(F) 단백질, 이에 대한 서열은 GenBank로부터 이용가능함)를 포함하는 폐렴바이러스를 포함한다. 인플루엔자 바이러스는 오르토믹소바이러스 과 내에서 분류되고 적합한 항원 공급원(예를 들어, HA 단백질, N1 단백질)일 수 있다. 분야바이러스 과는 분야바이러스(캘리포니아 뇌염, La Crosse), 플레보바이러스(리프트 밸리열), 한타바이러스(푸레말라는 헤마하진 열 바이러스임), 나이로바이러스(나이로비 양 질환) 및 다양한 미할당 분가바이러스 속을 포함한다. 아레나바이러스 과는 LCM 및 라싸열 바이러스에 대한 항원 공급원을 제공한다. 레오바이러스 과는 레오바이러스, 로타바이러스(소아에서 급성 위장염 유발), 오르비바이러스, 및 쿨티바이러스의 속(콜로라도 진드기열, 레봄보(인간), 말 뇌염, 블루텅병)을 포함한다. 레트로바이러스 과는 고양이 백혈병 바이러스, HTLVI 및 HTLVII, 렌티비리날(인간 면역결핍 바이러스(HIV), 시미안 면역결핍 바이러스(SIV), 고양이 면역결핍 바이러스(FIV), 말 감염성 빈혈 바이러스, 및 스푸마비리날 포함)과 같은 인간 및 수의학 질환을 포함하는 온코리비리날 하위과를 포함한다. 렌티바이러스 중에서, 많은 적합한 항원이 기재되어 있고 용이하게 선택될 수 있다. 적합한 HIV 및 SIV 항원의 예는 gag, pol, Vif, Vpx, VPR, Env, Tat, Nef, 및 Rev 단백질, 뿐만 아니라 이의 다양한 단편을 포함하나 제한되지 않는다. 예를 들어, Env 단백질의 적합한 단편은 gp120, gp160, gp41, 또는 예를 들어, 적어도 약 8개 아미노산 길이의 이의 더 작은 단편과 같은 서브유닛 중 임의의 것을 포함할 수 있다. 유사하게, tat 단백질의 단편이 선택될 수 있다. [미국 특허 번호 5,891,994 및 미국 특허 번호 6,193,981 참조.] 또한, D. H. Barouch 등, J. Virol., 75(5):2462-2467 (March 2001), 및 R. R. Amara, 등, Science, 292:69-74 (6 Apr. 2001)에 기재된 HIV 및 SIV 단백질을 참조한다. 또 다른 예에서, HIV 및/또는 SIV 면역원성 단백질 또는 펩티드는 융합 단백질 또는 다른 면역원성 분자를 형성하는 데 사용될 수 있다. 예를 들어, 2001년 8월 2일 공개된 WO 01/54719, 및 1999년 4월 8일 공개된 WO 99/16884에 기재된 HIV-1 Tat 및/또는 Nef 융합 단백질 및 면역화 레지멘을 참조한다. 본 발명은 본원에 기재된 HIV 및/또는 SIV 면역원성 단백질 또는 펩티드에 제한되지 않는다. 또한, 이들 단백질에 대한 다양한 변형이 기재되어 있거나 또는 당업자에 의해 용이하게 이루어질 수 있다. 예를 들어, 미국 특허 번호 5,972,596에 기재된 변형된 gag 단백질을 참조한다. 추가로, 임의의 바람직한 HIV 및/또는 SIV 면역원은 단독으로 또는 조합하여 전달될 수 있다. 이러한 조합은 단일 벡터로부터 또는 다중 벡터로부터의 발현을 포함할 수 있다. 파포바바이러스 과는 폴리오마바이러스 하위과(BKU 및 JCU 바이러스) 및 유두종바이러스 하위과(유두종의 암 또는 악성 진행과 연관됨)를 포함한다. 아데노바이러스 과는 호흡기 질환 및/또는 장염을 유발하는 바이러스(EX, AD7, ARD, O.B.)를 포함한다. 파보바이러스 과 고양이 파보바이러스(고양이 장염), 고양이 전백혈구감소증바이러스, 개 파보바이러스, 및 돼지 파보바이러스. 헤르페스바이러스 과는 심플렉스바이러스(HSVI, HSVII), 바리셀로바이러스(가성광견병, 수두 대상포진)의 속을 포함하는 알파헤르페스비리나에 하위과 및 사이토메갈로바이러스 속(인간 CMV), 무로메갈로바이러스)을 포함하는 베타헤르페스비리나에 하위과 및 림포크립토바이러스 속, EBV(버킷 림프종), 감염성 비기관지염, 마렉병 바이러스, 및 라디노바이러스를 포함하는 감마헤르페스비리나에 하위과를 포함한다. 폭스바이러스 과는 오르토폭스바이러스 속(두창(천연두) 및 백시니아(우두)), 파라폭스바이러스, 아비폭스바이러스, 카프리폭스바이러스, 레포리폭스바이러스, 수이폭스바이러스를 포함하는 코르도폭시리나에 하위과, 및 엔토모폭시리나에 하위과를 포함한다. 헤파드나바이러스 과는 B형 간염 바이러스를 포함한다. 적합한 항원 공급원일 수 있는 하나의 분류되지 않은 바이러스는 델타 간염 바이러스이다. 또 다른 바이러스 공급원은 조류 감염성 낭병 바이러스 및 돼지 호흡기 생식기 증후군 바이러스를 포함할 수 있다. 알파바이러스 과는 말 동맥염 바이러스 및 다양한 뇌염 바이러스를 포함한다.
백신에 혼입될 수 있는(예를 들어, 카세트에서 암호화된) 항원은 또한 인간 및 비인간 척추동물을 감염시키는 박테리아, 진균, 기생충 미생물 또는 다세포 기생충을 포함하는 병원체에 대한 인간 또는 비인간 동물을 면역화하는 데 유용한 면역원을 포함한다. 박테리아 병원체의 예는 페렴상구균; 포도상구균; 및 연쇄상구균을 포함하는 병원성 그람-양성 구균을 포함한다. 병원성 그람-음성 구균은 수막염균; 임균을 포함한다. 병원성 장용성 그람-음성 간균은 장내세균; 슈도모나스(pseudomonas), 아시네토박테리아(acinetobacteria) 및 에이케넬라(eikenella); 멜리오이도시스(melioidosis); 살모넬라(salmonella); 시겔라(shigella); 헤모필루스(haemophilus)(헤모필루스 인플루엔자에(Haemophilus influenzae), 헤모필루스 솜누스(Haemophilus somnus)); 모락셀라(moraxella); 에이치. 듀크레이(H. ducreyi)(연성하감 유발); 브루셀라(brucella); 프라니셀라 튤라렌시스(Franisella tularensis)(야토병 유발); 예르시니아(yersinia)(파스퇴렐라(pasteurella)); 스트렙토바실루스 모닐리포르미스(streptobacillus moniliformis) 및 스피릴룸(spirillum)을 포함한다. 그람-양성 간균은 리스테리아 모노사이토게네스(listeria monocytogenes); 에리시펠로트릭스 루시오파티에(erysipelothrix rhusiopathiae); 코리네박테리움 디프테리아(Corynebacterium diphtheria)(디프테리아); 콜레라; 비. 안트라시스(B. anthracis)(탄저병); 도노반증(서혜부 육아종); 및 바르토넬라증을 포함한다. 병원성 혐기성 박테리아에 의해 유발되는 질환은 파상풍; 보툴리눔 중독; 다른 클로스트리디움강; 결핵; 한센병; 및 다른 마이코박테리아를 포함한다. 특이적 박테리아 종의 예는 스트렙토코쿠스 뉴모니에(Streptococcus pneumoniae), 스트렙토코쿠스 피오게네스(Streptococcus pyogenes), 스트렙토코쿠스 아갈락티에(Streptococcus agalactiae), 스트렙토코쿠스 페칼리스(Streptococcus faecalis), 모락셀라 카타르할리스(Moraxella catarrhalis), 헬리코박터 파일로리(Helicobacter pylori), 네이세리아 메닝기티디스(Neisseria meningitidis), 네이세리아 고노르호외(Neisseria gonorrhoeae), 클라미디아 트라코마티스(Chlamydia trachomatis), 클라미디아 뉴모니에(Chlamydia pneumoniae), 클라미디아 시타시(Chlamydia psittaci), 보르데텔라 페르투시스(Bordetella pertussis), 살모넬라 티피(Salmonella typhi), 살모넬라 티피무리움(Salmonella typhimurium), 살모넬라 콜레라에수이스(Salmonella choleraesuis), 에스케리키아 콜라이(Escherichia coli), 시겔라, 비브리오 콜레라에(Vibrio cholerae), 코리네박테리움 디프테리아에(Corynebacterium diphtheriae), 마이코박테리움 투베르쿨로시스(Mycobacterium tuberculosis), 마이코박테리움 아비움(Mycobacterium avium), 마이코박테리움 인트라셀루라레(Mycobacterium intracellulare) 복합체, 프로테우스 미라빌리스(Proteus mirabilis), 프로테우스 불가리스(Proteus vulgaris), 스타필로코쿠스 아우레우스(Staphylococcus aureus), 클로스트리디움 테타니(Clostridium tetani), 렙토스피라 인테로간스(Leptospira interrogans), 보렐리아 부르그도르페리(Borrelia burgdorferi), 파스퇴렐라 헤몰리티카(Pasteurella haemolytica), 파스퇴렐라 물토시다(Pasteurella multocida), 악티노바실루스 플레우로뉴모니애(Actinobacillus pleuropneumoniae) 및 마이코플라즈마 갈리셉티쿰(Mycoplasma gallisepticum)이나 제한되지 않는다. 병원성 스페로헤타병은 매독; 트레포네마증: 매종, 핀타 및 풍토성 매독; 및 렙토스피라증을 포함한다. 고등 병원체 박테리아 및 병원성 진균에 의해 유발된 다른 감염은 방선균증; 노카르디아증; 효모균증(크립토코쿠스(Cryptococcus)), 분아균증(블라스토마이세스(Blastomyces)), 히스토플라스마증(히스토플라스마(Histoplasma)) 및 콕시디오이데스진균증(콕시디오데스(Coccidiodes)); 칸디다증(칸디다(Candida)), 아스페르길루스증(아스페르길리스(Aspergillis)), 및 뮤코르진균증; 스포로트리쿰증; 파라콕시디오이데스진균증, 페트리엘리디오시스증, 토룰롭소시스증, 진균종 및 색소진균증; 및 피부사상균증을 포함한다. 리케치아성 감염은 발진티푸스, 로키산 홍반열, Q열, 및 리케치아두창을 포함한다. 마이코플라스마 및 클라마디아 감염의 예는 마이코플라스마 뉴모니애(mycoplasma pneumoniae); 서혜 림프 육아종; 앵부새병; 및 출산 전후 클라마디아 감염을 포함한다. 병원성 진핵생물은 병원성 원생동물 및 연충류를 포함하고 이에 의해 생성된 감염은 아메바증; 말라리아; 레슈마니아증(예를 들어, 레슈마니아 메이져(Leishmania major)에 의해 유발); 트리파노소마증; 톡소플라스마종(예를 들어, 톡소플라스마 곤디이(Toxoplasma gondii)에 의해 유발); 뉴모사이스티스 카리니이(Pneumocystis carinii); 트리칸스(Trichans); 톡소플라스마 곤디이; 바베시아증; 지아르디아증(예를 들어, 지아르디아(Giardia)에 의해 유발); 트리키넬라증(예를 들어, 트리코모나스(Trichomonas)에 의해 유발); 필라리아증; 주혈흡충병(예를 들어, 스키스토소마(Schistosoma)에 의해 유발); 선충류; 흡충류 또는 디스노마류; 및 촌충류(촌충) 감염을 포함한다. 다른 기생충 감염은 그 중에서도 아스카리스(Ascaris), 트리쿠리스(Trichuris), 크립토스포리디움(Cryptosporidium), 및 뉴모사이스티스 카리니이에 의해 유발될 수 있다.
또한 본원에는 감염성 질환 유기체, 대상체에서의 감염, 또는 대상체의 감염된 세포와 연관된 임의의 폴리펩티드로부터 유래된 펩티드가 개시된다. 항원은 감염성 질환 유기체의 핵산 서열 또는 폴리펩티드 서열로부터 유래될 수 있다. 감염성 질환 유기체의 폴리펩티드 서열은 병원체-유래 펩티드, 바이러스-유래 펩티드, 박테리아-유래 펩티드, 진균-유래 펩티드, 및/또는 기생충-유래 펩티드를 포함하나 이에 제한되지 않는다. 감염성 질환 유기체는 중증 급성 호흡기 증후군-관련 코로나바이러스(SARS), 중증 급성 호흡기 증후군 코로나바이러스 2 (SARS-CoV-2), 에볼라, HIV, B형 간염 바이러스(HBV), 인플루엔자, C형 간염 바이러스(HCV), 인간 유두종바이러스(HPV), 사이토메갈로바이러스(CMV), 치쿤구니야 바이러스, 호흡기 세포융합 바이러스(RSV), 뎅기 바이러스, 오르티믹소비리다에 바이러스, 및 결핵을 포함하나 이에 제한되지 않는다.
종양 세포, 감염된 세포, 또는 수지상 세포와 같은 전문 항원 제시 세포를 포함하는 면역 세포와 같은 세포의 세포 표면 상에 제시될 것으로 예측되는 항원이 선택될 수 있다. 면역원성인 것으로 예측되는 항원이 선택될 수 있다.
항원 뉴클레오티드 서열에 의해 암호화된 하나 이상의 폴리펩티드는 1000nM 미만의 IC50 값을 갖는 MHC와의 결합 친화도, MHC 클래스 I 펩티드의 경우 8-15개, 8, 9, 10, 11, 12, 13, 14, 또는 15개 아미노산 길이, 프로테아좀 절단을 촉진하는 펩티드 내 또는 근처의 서열 모티프의 존재, 및 TAP 수송을 촉진하는 존재 또는 서열 모티프 중 적어도 하나를 포함할 수 있다. MHC 클래스 II 펩티드의 경우 6-30개, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18,19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 또는 30개 아미노산 길이, 세포외 또는 리소좀 프로테아제(예를 들어, 카텝신)에 의한 절단을 촉진하는 펩티드 내 또는 근처의 서열 모티프의 존재 또는 HLA-DM 촉매화된 HLA 결합.
하나 이상의 항원은 종양의 표면 상에 제시될 수 있다. 하나 이상의 항원은 감염된 세포의 표면 상에 제시될 수 있다.
하나 이상의 항원은 예를 들어, 대상체에서 T 세포 반응 및/또는 B 세포 반응을 자극할 수 있는 종양을 갖는 대상체에서 면역원성일 수 있다. 하나 이상의 항원은 예를 들어, 대상체에서 T 세포 반응 및/또는 B 세포 반응을 자극할 수 있는 감염이 있거나 또는 감염이 있는 것으로 의심되는 대상체에서 면역원성일 수 있다. 하나 이상의 항원은 예를 들어, 기억 T 세포, 기억 B 세포, 및/또는 감염에 특이적인 항체의 생산을 자극하는 것과 같이, 예를 들어, 감염에 대한 면역학적 보호(즉, 면역)를 제공하는 대상체에서 T 세포 반응 및/또는 B 세포 반응을 자극할 수 있는 감염의 위험이 있는 대상체에서 면역원성일 수 있다.
하나 이상의 항원은 하나 이상의 항원을 인식하는 항체(예를 들어, 감염성 질환 항원을 인식하는 항체)의 생산과 같이, B 세포 반응을 자극할 수 있다. 항체는 선형 폴리펩티드 서열을 인식하거나 또는 2차 및 3차 구조를 인식할 수 있다. 따라서, B 세포 항원은 전장 단백질, 단백질 서브유닛, 단백질 도메인, 또는 2차 및 3차 구조를 갖는 것으로 알려져 있거나 또는 예측된 임의의 폴리펩티드 서열을 포함하나 이에 제한되지 않는, 선형 폴리펩티드 서열 또는 2차 및 3차 구조를 갖는 폴리펩티드를 포함할 수 있다 감염에 대한 B 세포 반응을 자극할 수 있는 항원은 감염성 질환 유기체의 표면 상에서 발견된 항원일 수 있다. 감염에 대한 B 세포 반응을 도출할 수 있는 항원은 감염성 질환 유기체에서 발현된 세포내 항원일 수 있다.
하나 이상의 항원은 T 세포 반응을 자극할 수 있는 항원(예를 들어, 예측된 T 세포 에피토프 서열을 포함하는 펩티드) 및 B 세포 반응을 자극할 수 있는 별개의 항원(예를 들어, 전장 단백질, 단백질 서브유닛, 단백질 도메인)의 조합을 포함할 수 있다.
대상체에서 자가면역 반응을 자극하는 하나 이상의 항원은 대상체에 대한 백신 생성의 맥락에서 고려사항으로부터 제외될 수 있다.
적어도 하나의 항원성 펩티드 분자(예를 들어, 에피토프 서열)의 크기는 약 5개, 약 6개, 약 7개, 약 8개, 약 9개, 약 10개, 약 11개, 약 12개, 약 13개, 약 14개, 약 15개, 약 16개, 약 17개, 약 18개, 약 19개, 약 20개, 약 21개, 약 22개, 약 23개, 약 24개, 약 25개, 약 26개, 약 27개, 약 28개, 약 29개, 약 30개, 약 31개, 약 32개, 약 33개, 약 34개, 약 35개, 약 36개, 약 37개, 약 38개, 약 39개, 약 40개, 약 41개, 약 42개, 약 43개, 약 44개, 약 45개, 약 46개, 약 47개, 약 48개, 약 49개, 약 50개, 약 60개, 약 70개, 약 80개, 약 90개, 약 100개, 약 110개, 약 120개 또는 그 이상의 아미노 분자 잔기, 및 그 안에서 유도가능한 임의의 범위를 포함할 수 있으나 이에 제한되지 않는다. 구체적 구현예에서 항원성 펩티드 분자는 50개 이하의 아미노산이다.
항원성 펩티드 및 폴리펩티드는 MHC 클래스 I의 경우 15개 잔기 이하의 길이일 수 있고 일반적으로 약 8 내지 약 11개 잔기, 특히 9 또는 10개 잔기로 이루어지며; MHC 클래스 II의 경우, 6-30개 잔기를 포함한다.
바람직한 경우, 더 긴 펩티드가 여러 방식으로 설계될 수 있다. 하나의 경우에, HLA 대립유전자 상에서 펩티드의 제시 가능성이 예측되거나 또는 알려진 경우, 더 긴 펩티드는 (1) 각각의 상응하는 유전자 산물의 N- 및 C-말단을 향해 2-5개 아미노산의 확장을 갖는 별개의 제시된 펩티드; (2) 각각에 대해 확장된 서열을 갖는 제시된 펩티드의 연속되는 일부 또는 전부 중 어느 하나로 이루어질 수 있다. 또 다른 경우에, 서열분석이 종양에 존재하는 긴(>10개 잔기) 네오에피토프 서열을 입증하는 경우(예를 들어 신규 펩티드 서열로 이어지는 프레임시프트, 판독 또는 인트론 포함으로 인해), 더 긴 펩티드는 (3) 신규 종양-특이적 또는 감염성 질환-특이적 아미노산의 전체 스트레치로 이루어지며, 따라서 가장 강력한 HLA-제시된 더 짧은 펩티드의 컴퓨터 또는 시험관내 테스트-기반 선택에 대한 필요성을 우회할 것이다. 두 경우에, 더 긴 펩티드의 사용은 환자 세포에 의한 내인성 처리를 가능하게 하고 보다 효과적인 항원 제시 및 T 세포 반응의 자극으로 이어질 수 있다. 더 긴 펩티드는 또한 전장 단백질, 단백질 서브유닛, 단백질 도메인, 및 감염성 질환 유기체에서 발현되는 것들과 같은 펩티드의 이의 조합을 포함할 수 있다. 더 긴 펩티드(예를 들어, 전장 단백질, 단백질 서브유닛, 또는 단백질 도메인) 및 이의 조합은 B 세포 반응을 자극하도록 포함될 수 있다.
항원성 펩티드 및 폴리펩티드는 HLA 단백질 상에 제시될 수 있다. 일부 측면에서 항원성 펩티드 및 폴리펩티드는 야생형 펩티드보다 더 큰 친화도로 HLA 단백질 상에 제시된다. 일부 측면에서, 항원성 펩티드 또는 폴리펩티드는 적어도 5000 nM 미만, 적어도 1000 nM 미만, 적어도 500 nM 미만, 적어도 250 nM 미만, 적어도 200 nM 미만, 적어도 150 nM 미만, 적어도 100 nM 미만, 적어도 50 nM 미만 또는 그 이하의 IC50을 가질 수 있다.
일부 측면에서, 항원성 펩티드 및 폴리펩티드는 대상체에게 투여될 때 자가면역 반응을 자극하지 않고/않거나 면역학적 관용을 적용하지 않는다.
또한 적어도 2개 이상의 항원성 펩티드를 포함하는 조성물이 제공된다. 일부 구현예에서 조성물은 적어도 2개의 별개의 펩티드를 함유한다. 적어도 2개의 별개의 펩티드는 동일한 폴리펩티드로부터 유래될 수 있다. 별개의 폴리펩티드란 펩티드가 길이, 아미노산 서열, 또는 둘 다에 의해 달라질 수 있음을 의미한다. 종양-특이적 펩티드는 종양 특이적 돌연변이를 함유하는 것으로 알려져 있거나 또는 밝혀진 임의의 폴리펩티드 또는 정상 세포 또는 조직과 비교하여 종양 세포 또는 암성 조직에서 변경된 발현을 갖는 것으로 알려져 있거나 또는 밝혀진 임의의 폴리펩티드, 예를 들어 정상 세포 또는 조직과 비교하여 종양 세포 또는 암성 조직에서 비정상적으로 발현되는 것으로 알려져 있거나 또는 밝혀진 임의의 폴리펩티드로부터 유래된 펩티드로부터 유래될 수 있다. 펩티드는 감염성 질환 유기체에 대해 알려져 있거나 또는 이와 연관된 것으로 의심되는 임의의 폴리펩티드, 또는 정상 세포 또는 조직과 비교하여 감염된 세포에서 변경된 발현을 갖는 것으로 알려져 있거나 또는 밝혀진 임의의 폴리펩티드(예를 들어, 숙주 세포에 대해 제한된 발현을 갖는 감염성 질환 폴리뉴클레오티드 또는 폴리펩티드를 포함하는 감염성 질환 폴리뉴클레오티드 또는 폴리펩티드)로부터 유래된 펩티드로부터 유래될 수 있다. 항원성 펩티드가 유래될 수 있는 적합한 폴리펩티드는 예를 들어 COSMIC 데이터베이스 또는 AACR 게놈 증거 신생물 정보 교환(GENIE) 데이터베이스에서 찾을 수 있다. COSMIC는 인간 암에서 체세포 돌연변이에 대한 포괄적인 정보를 선별한다. AACR GENIE는 임상-등급 암 게놈 데이터를 수만 명의 암 환자로부터의 임상 결과와 함께 집계하고 연결한다. 펩티드는 종양-특이적 돌연변이를 포함할 수 있다. 일부 측면에서 종양 특이적 돌연변이는 특정 암 유형에 대한 구동인자 돌연변이이다.
원하는 활성 및 특성을 갖는 항원성 펩티드 및 폴리펩티드는 특정한 원하는 속성, 예를 들어, 개선된 약리학적 특성을 제공하도록 변형되면서, 원하는 MHC 분자에 결합하고 적절한 T 세포를 활성화시키는 변형되지 않은 펩티드의 생물학적 활성을 실질적으로 모두 증가시키거나 또는 적어도 유지할 수 있다. 예를 들면, 항원성 펩티드 및 폴리펩티드는 보존적 또는 비보존적 치환과 같은 다양한 변화를 겪을 수 있으며, 이러한 변화는 개선된 MHC 결합, 안정성 또는 제시와 같은 사용 시 특정한 장점을 제공할 수 있다. 보존적 치환이란 아미노산 잔기를 생물학적으로 및/또는 화학적으로 유사한 또 다른 것으로, 예를 들어, 하나의 소수성 잔기를 또 다른 것으로, 또는 하나의 극성 잔기를 또 다른 것으로 대체하는 것을 의미한다. 치환은 Gly, Ala; Val, Ile, Leu, Met; Asp, Glu; Asn, Gln; Ser, Thr; Lys, Arg; 및 Phe, Tyr과 같은 조합을 포함한다. 단일 아미노산 치환의 효과는 또한 D-아미노산을 사용하여 탐색될 수 있다. 이러한 변형은 예를 들어, Merrifield, Science 232:341-347 (1986), Barany & Merrifield, The Peptides, Gross & Meienhofer, eds. (N.Y., Academic Press), pp. 1-284 (1979); 및 Stewart & Young, Solid Phase Peptide Synthesis, (Rockford, Ill., Pierce), 2d Ed. (1984)에 기재된 바와 같은, 잘 알려진 펩티드 합성 절차를 사용하여 이루어질 수 있다.
다양한 아미노산 모방체 또는 비천연 아미노산을 사용한 펩티드 및 폴리펩티드의 변형은 생체내에서 펩티드 및 폴리펩티드의 안정성을 증가시키는 데 특히 유용할 수 있다. 안정성은 다수의 방식으로 검정될 수 있다. 예를 들면, 펩티다제 및 인간 혈장 및 혈청과 같은 다양한 생물학적 매질이 안정성을 테스트하는 데 사용되었다. 예를 들어, Verhoef 등, Eur. J. Drug Metab Pharmacokin. 11:291-302 (1986)를 참조한다. 펩티드의 반감기는 25% 인간 혈청(v/v) 검정을 사용하여 편리하게 결정될 수 있다. 프로토콜은 일반적으로 다음과 같다. 풀링된 인간 혈청(AB형, 비-열 불활성화)을 사용 전에 원심분리에 의해 지질 제거한다. 그런 다음 혈청을 RPMI 조직 배양 배지로 25%로 희석하고 펩티드 안정성을 테스트 하는데 사용한다. 미리 결정된 시간 간격으로 소량의 반응 용액을 제거하고 6% 수성 트리클로르아세트산 또는 에탄올에 첨가한다. 탁한 반응 샘플을 15분 동안 냉각(4℃)한 다음 회전시켜 침전된 혈청 단백질을 펠릿화한다. 그런 다음 안정성-특이적 크로마토그래피 조건을 사용하여 역상 HPLC에 의해 펩티드의 존재를 결정한다.
펩티드 및 폴리펩티드는 개선된 혈청 반감기 이외에 원하는 속성을 제공하도록 변형될 수 있다. 예를 들면, CTL 활성을 자극하는 펩티드의 능력은 T 헬퍼 세포 반응을 자극할 수 있는 적어도 하나의 에피토프를 함유하는 서열에 대한 결합에 의해 향상될 수 있다. 면역원성 펩티드/T 헬퍼 접합체는 스페이서 분자에 의해 연결될 수 있다. 스페이서는 전형적으로 생리학적 조건 하에 실질적으로 하전되지 않은 아미노산 또는 아미노산 모방체와 같은 비교적 작은 중성 분자로 구성된다. 스페이서는 전형적으로 예를 들어, Ala, Gly, 또는 비극성 아미노산 또는 중성 극성 아미노산의 다른 중성 스페이서로부터 선택된다. 임의적으로 존재하는 스페이서는 동일한 잔기로 구성될 필요가 없으며 따라서 이종- 또는 동종-올리고머일 수 있음이 이해될 것이다. 존재하는 경우, 스페이서는 일반적으로 적어도 1 또는 2개의 잔기, 보다 일반적으로 3 내지 6개의 잔기일 것이다. 대안적으로, 펩티드는 스페이서 없이 T 헬퍼 펩티드에 연결될 수 있다.
항원성 펩티드는 직접적으로 또는 펩티드의 아미노 또는 카르복시 말단에서 스페이서를 통해 T 헬퍼 펩티드에 연결될 수 있다. 항원성 펩티드 또는 T 헬퍼 펩티드의 아미노 말단은 아실화될 수 있다. 예시적인 T 헬퍼 펩티드는 파상풍 톡소이드 830-843, 인플루엔자 307-319, 말라리아 포자소체 382-398 및 378-389를 포함한다.
단백질 또는 펩티드는 표준 분자 생물학적 기술을 통한 단백질, 폴리펩티드 또는 펩티드의 발현, 천연 공급원으로부터 단백질 또는 펩티드의 단리, 또는 단백질 또는 펩티드의 화학적 합성을 포함하는 당업자에게 알려진 임의의 기술에 의해 제조될 수 있다. 다양한 유전자에 상응하는 뉴클레오티드 및 단백질, 폴리펩티드 및 펩티드 서열은 이전에 개시되었고, 당업자에게 알려진 컴퓨터화된 데이터베이스에서 찾을 수 있다. 이러한 데이터베이스 중 하나는 미국립보건원(National Institutes of Health) 웹사이트에 위치한 미국립생물공학정보센터(National Center for Biotechnology Information)의 Genbank 및 GenPept 데이터베이스이다. 알려진 유전자에 대한 코딩 영역은 본원에 개시된 기술을 사용하거나 또는 당업자에게 알려진 바와 같이 증폭 및/또는 발현될 수 있다. 대안적으로, 단백질, 폴리펩티드 및 펩티드의 다양한 상업적 제제가 당업자에게 알려져 있다.
추가의 측면에서 항원은 항원성 펩티드 또는 이의 부분을 암호화하는 핵산(예를 들어 폴리뉴클레오티드)을 포함한다. 폴리뉴클레오티드는 예를 들어, DNA, cDNA, PNA, CNA, RNA(예를 들어, mRNA), 단일- 및/또는 이중-가닥, 또는 천연 또는 안정화된 형태의 폴리뉴클레오티드, 예컨대, 예를 들어, 포스포로티오에이트 백본이 있는 폴리뉴클레오티드, 또는 이의 조합일 수 있고 인트론을 함유할 수 있거나 또는 함유하지 않을 수 있다. 항원을 암호화하는 폴리뉴클레오티드 서열은 전사, 번역, 전사후 처리, 및/또는 RNA 안정성 개선을 통해서와 같이, 발현을 개선하도록 서열-최적화될 수 있다. 예를 들어, 항원을 암호화하는 폴리뉴클레오티드 서열은 코돈-최적화될 수 있다. 본원에서 "코돈-최적화"는 주어진 유기체의 코돈 편향과 관련하여 빈번하지 않게 사용되는 코돈을, 빈번하게 사용되는 동의의 코돈으로 대체하는 것을 지칭한다. 폴리뉴클레오티드 서열은 전사후 처리를 개선하도록 최적화될 수 있으며, 예를 들어 스플라이싱 모티프(예를 들어, 표준 및/또는 잠재적/비-표준 스플라이스 공여자, 분지, 및/또는 수용자 서열)의 제거 및/또는 선호하는 스플라이싱 이벤트를 편향하도록 외인성 스플라이싱 모티프(예를 들어, 스플라이스 공여자, 분지, 및/또는 수용자 서열)의 도입을 통해서와 같이, 의도되지 않은 스플라이싱을 감소시키도록 최적화될 수 있다. 외인성 인트론 서열은 SV40으로부터 유래된 것들(예를 들어, SV40 미니-인트론) 및 면역글로불린으로부터 유래된 것들(예를 들어, 인간 β-글로빈 유전자)을 포함하나 이에 제한되지 않는다. 외인성 인트론 서열은 프로모터/인핸서 서열과 항원(들) 서열 사이에 혼입될 수 있다. 발현 벡터에서 사용하기 위한 외인성 인트론 서열은 Callendret 등(Virology. 2007 Jul 5; 363(2): 288-302)에 보다 상세하게 기재되어 있으며, 모든 목적을 위해 본원에 참조로 포함된다. 폴리뉴클레오티드 서열은 예를 들어 RNA 불안정성 모티프(예를 들어, AU-풍부 요소 및 3' UTR 모티프) 및/또는 반복 뉴클레오티드 서열의 제거를 통해 전사체 안정성을 개선하도록 최적화될 수 있다. 폴리뉴클레오티드 서열은 예를 들어 잠재적 전사 개시자 및/또는 종결자의 제거를 통해 정확한 전사를 개선하도록 최적화될 수 있다. 폴리뉴클레오티드 서열은 예를 들어 잠재적 AUG 시작 코돈, 조기 폴리A 서열, 및/또는 2차 구조 모티프의 제거를 통해 번역 및 번역 정확도를 개선하도록 최적화될 수 있다. 폴리뉴클레오티드 서열은 구성적 수송 요소(CTE), RNA 수송 요소(RTE), 또는 우드척 전사후 조절 요소(WPRE)의 첨가를 통해서와 같이 전사체의 핵 유출을 개선하도록 최적화될 수 있다. 발현 벡터에서 사용하기 위한 핵 유출 신호는 Callendret 등 (Virology. 2007 Jul 5; 363(2): 288-302)에 보다 상세하게 기재되어 있으며, 모든 목적을 위해 본원에 참조로 포함된다. 폴리뉴클레오티드 서열은 예를 들어 주어진 유기체의 평균 GC 함량을 반영하기 위해, GC 함량과 관련하여 최적화될 수 있다. 서열 최적화는 전사, 번역, 전사후 처리, 및/또는 RNA 안정성과 같은 하나 이상의 서열 속성의 균형을 유지할 수 있다. 서열 최적화는 전사, 번역, 전사후 처리, 및 RNA 안정성 각각의 균형을 유지하는 최적 서열을 생성할 수 있다. GeneArt(Thermo Fisher), Codon Optimization Tool(IDT), Cool Tool(싱가포르 국립대학), SGI-DNA(캘리포니아주 라호이아)와 같은 서열 최적화 알고리즘이 당업자에게 알려져 있다. 항원-암호화 단백질의 하나 이상의 영역은 별도로 서열-최적화될 수 있다.
또한 추가의 측면은 폴리펩티드 또는 이의 부분을 발현할 수 있는 발현 벡터를 제공한다. 상이한 세포 유형에 대한 발현 벡터는 당업계에 잘 알려져 있고 과도한 실험 없이 선택될 수 있다. 일반적으로, DNA는 플라스미드와 같은 발현 벡터에, 적절한 배향 및 발현을 위한 올바른 판독 프레임으로 삽입된다. 필요하다면, DNA는 원하는 숙주에 의해 인식된 적절한 전사 및 번역 조절 제어 뉴클레오티드 서열에 연결될 수 있지만, 이러한 제어는 일반적으로 발현 벡터에서 이용가능하다. 그런 다음 벡터는 표준 기술을 통해 숙주에 도입된다. 지침은 예를 들어 Sambrook 등 (1989) Molecular Cloning, A Laboratory Manual, Cold Spring Harbor Laboratory, Cold Spring Harbor, N.Y에서 찾을 수 있다.
백신 조성물
또한 본원에는 특이적 면역 반응, 예를 들어, 종양-특이적 면역 반응 또는 감염성 질환 유기체-특이적 면역 반응을 일으킬 수 있는 면역원성 조성물, 예를 들어, 백신 조성물이 개시된다. 백신 조성물은 전형적으로 예를 들어, 본원에 기재된 방법을 사용하여 선택되거나 또는 병원체-유래 펩티드, 바이러스-유래 펩티드, 박테리아-유래 펩티드, 진균-유래 펩티드, 및/또는 기생충-유래 펩티드로부터 선택된 하나 또는 복수의 항원을 포함한다. 백신 조성물은 또한 백신으로 지칭될 수 있다.
백신은 1 내지 30개의 펩티드, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 또는 30개의 상이한 펩티드, 6, 7, 8, 9, 10 11, 12, 13, 또는 14개의 상이한 펩티드, 또는 12, 13 또는 14개의 상이한 펩티드를 함유할 수 있다. 펩티드는 번역후 변형을 포함할 수 있다. 백신은 1 내지 100개 이상의 뉴클레오티드 서열, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94,95, 96, 97, 98, 99, 100개 이상의 상이한 뉴클레오티드 서열, 6, 7, 8, 9, 10 11, 12, 13, 또는 14개의 상이한 뉴클레오티드 서열, 또는 12, 13 또는 14개의 상이한 뉴클레오티드 서열을 함유할 수 있다. 백신은 1 내지 30개의 항원 서열, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94,95, 96, 97, 98, 99, 100개 이상의 상이한 항원 서열, 6, 7, 8, 9, 10 11, 12, 13, 또는 14개의 상이한 항원 서열, 또는 12, 13 또는 14개의 상이한 항원 서열을 함유할 수 있다.
백신은 1 내지 30개의 항원-암호화 핵산 서열, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94,95, 96, 97, 98, 99, 100개 이상의 상이한 항원-암호화 핵산 서열, 6, 7, 8, 9, 10 11, 12, 13, 또는 14개의 상이한 항원-암호화 핵산 서열, 또는 12, 13 또는 14개의 상이한 항원-암호화 핵산 서열을 함유할 수 있다. 항원-암호화 핵산 서열은 "항원 카세트"의 항원 암호화 부분을 지칭할 수 있다. 항원 카세트의 특징은 본원에 더 상세하게 기재되어 있다. 항원-암호화 핵산 서열은 하나 이상의 에피토프-암호화 핵산 서열(예를 들어, 연결된 T 세포 에피토프를 암호화하는 항원-암호화 핵산 서열)을 함유할 수 있다.
백신은 1 내지 30개의 별개의 에피토프-암호화 핵산 서열, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94,95, 96, 97, 98, 99, 100개 이상의 별개의 에피토프-암호화 핵산 서열, 6, 7, 8, 9, 10 11, 12, 13, 또는 14개의 별개의 에피토프-암호화 핵산 서열, 또는 12, 13 또는 14개의 별개의 에피토프-암호화 핵산 서열을 함유할 수 있다. 에피토프-암호화 핵산 서열은 연결된 T 세포 에피토프를 암호화하는 항원-암호화 핵산 서열에서 각각의 T 세포 에피토프와 같은 개별 에피토프 서열에 대한 서열을 지칭할 수 있다.
백신은 에피토프-암호화 핵산 서열의 적어도 2개의 반복부를 함유할 수 있다. 본원에 사용된 바와 같이, "반복"은 항원-암호화 핵산 서열 내에서 동일한 핵산 에피토프-암호화 핵산 서열(본원에 기재된 임의적 5' 링커 서열 및/또는 임의적 3' 링커 서열의 포함)의 2개 이상의 반복을 지칭한다. 하나의 예에서, 카세트의 항원-암호화 핵산 서열 부분은 에피토프-암호화 핵산 서열의 적어도 2개의 반복부를 암호화한다. 추가의 비제한적인 예에서, 카세트의 항원-암호화 핵산 서열 부분은 하나 초과의 별개의 에피토프를 암호화하고, 별개의 에피토프 중 적어도 하나는 별개의 에피토프를 암호화하는 핵산 서열의 적어도 2개의 반복부(즉, 적어도 2개의 별개의 에피토프-암호화 핵산 서열)에 의해 암호화된다. 예시적인 비제한적인 예에서, 항원-암호화 핵산 서열은 에피토프-암호화 핵산 서열 에피토프-암호화 서열 A(EA), 에피토프-암호화 서열 B(EB), 및 에피토프-암호화 서열 C(EC)에 의해 암호화된 에피토프 A, B, 및 C를 암호화하고, 별개의 에피토프 중 적어도 하나의 반복부를 갖는 예시적인 항원-암호화 핵산 서열은 하기 식에 의해 예시되나 이에 제한되지 않는다:
- 하나의 별개의 에피토프의 반복부(에피토프 A의 반복부):
EA-EB-EC-EA; 또는
EA-EA-EB-EC
- 다중 별개의 에피토프의 반복부(에피토프 A, B, 및 C의 반복부):
EA-EB-EC-EA-EB-EC; 또는
EA-EA-EB-EB-EC-EC
- 다중 별개의 에피토프의 다중 반복부(에피토프 A, B, 및 C의 반복부):
EA-EB-EC-EA-EB-EC-EA-EB-EC; 또는
EA-EA-EA-EB-EB-EB-EC-EC-EC
상기 예는 제한적이지 않고 별개의 에피토프 중 적어도 하나의 반복부를 갖는 항원-암호화 핵산 서열은 임의의 순서 또는 빈도로 각각의 별개의 에피토프를 암호화할 수 있다. 예를 들어, 순서 및 빈도는 예를 들어, 화학식 EA-EB-EC-EC-EA-EB-EA-EC-EA-EC-EC-EB에 의한 에피토프 A, B, 및 C를 갖는 예에서, 별개의 에피토프의 무작위 배열일 수 있다.
또한 5'에서 3'으로, 하기 화학식에 의해 기재된 적어도 하나의 항원-암호화 핵산 서열을 갖는 항원-암호화 카세트가 본원에 제공된다:
(Ex-(EN n)y)z
상기 식에서 E는 적어도 하나의 별개의 에피토프-암호화 핵산 서열 중 적어도 하나를 포함하는 뉴클레오티드 서열을 나타내고,
n은 별도의 별개의 에피토프-암호화 핵산 서열의 수를 나타내고 0을 포함한 임의의 정수이고,
EN은 각각의 상응하는 n에 대해 별도의 별개의 에피토프-암호화 핵산 서열을 포함하는 뉴클레오티드 서열을 나타내고,
z의 각각의 반복에 대해: x = 0 또는 1을 나타내고, 각각의 n에 대해 y = 0 또는 1을 나타내고, x 또는 y 중 적어도 하나 = 1을 나타내고, z = 2 이상을 나타내며, 상기 항원-암호화 핵산 서열은 E, 주어진 EN, 또는 이의 조합의 적어도 2개의 반복을 포함한다.
각각의 E 또는 EN은 독립적으로 본원에 기재된 임의의 에피토프-암호화 핵산 서열(예를 들어, 감염성 질환 T 세포 에피토프 및/또는 신생항원 에피토프를 암호화하는 펩티드)을 포함할 수 있다. 예를 들어, 각각의 E 또는 EN은 독립적으로 5'에서 3'으로, 화학식 (L5b-Nc-L3d)에 의해 기재된 뉴클레오티드 서열을 포함할 수 있으며, 상기 식에서 N은 각각의 E 또는 EN과 연관된 별개의 에피토프-암호화 핵산 서열을 포함하고, 여기서 c = 1이고, L5는 5' 링커 서열을 포함하고, 여기서 b = 0 또는 1이고, L3은 3' 링커 서열을 포함하고, 여기서 d = 0 또는 1이다. 사용될 수 있는 에피토프 및 링커가 본원에 추가로 기재된다.
에피토프-암호화 핵산 서열(임의적 5' 링커 서열 및/또는 임의적 3' 링커 서열의 포함)의 반복부는 서로 직접적으로 선형으로 연결될 수 있다(예를 들어, 상기 예시된 바와 같은 EA-EA-...). 에피토프-암호화 핵산 서열의 반복부는 하나 이상의 추가의 뉴클레오티드 서열에 의해 분리될 수 있다. 일반적으로, 에피토프-암호화 핵산 서열의 반복부는 본원에 기재된 조성물에 적용가능한 임의의 크기의 뉴클레오티드 서열에 의해 분리될 수 있다. 하나의 예에서, 에피토프-암호화 핵산 서열의 반복부는 단일 별도의 별개의 에피토프-암호화 핵산 서열(예를 들어, 상기 예시된 바와 같은, EA-EB-EC-EA...)에 의해 분리될 수 있다. 반복부가 별도의 별개의 에피토프-암호화 핵산 서열에 의해 분리되고, 각각의 에피토프-암호화 핵산 서열(임의적 5' 링커 서열 및/또는 임의적 3' 링커 서열 포함)이 25개 아미노산 길이의 펩티드를 암호화하는 예에서, 반복부는 EA-EB-EA...로 표현되는 항원-암호화 핵산에서와 같이 75개 뉴클레오티드에 의해 분리될 수 있으며, EA는 75개 뉴클레오티드에 의해 분리된다. 예시적 예에서, 25mer 항원 Trp1(VTNTEMFVTAPDNLGYMYEVQWPGQ) 및 Trp2(TQPQIANCSVYDFFVWLHYYSVRDT)의 반복부를 암호화하는 서열 VTNTEMFVTAPDNLGYMYEVQWPGQTQPQIANCSVYDFFVWLHYYSVRDTVTNTEMFVTAPDNLGYMYEVQWPGQTQPQIANCSVYDFFVWLHYYSVRDT를 갖는 항원-암호화 핵산, Trp1의 반복부는 25mer Trp2에 의해 분리되고 따라서 Trp1 에피토프-암호화 핵산 서열의 반복부는 75개 뉴클레오티드 Trp2 에피토프-암호화 핵산 서열로 분리된다. 반복부가 2, 3, 4, 5, 6, 7, 8, 또는 9개의 별도의 별개의 에피토프-암호화 핵산 서열에 의해 분리되고, 각각의 에피토프-암호화 핵산 서열(임의적 5' 링커 서열 및/또는 임의적 3' 링커 서열의 포함)이 25개 아미노산 길이의 펩티드를 암호화하는 예에서, 반복부는 각각 150, 225, 300, 375, 450, 525, 600, 또는 675개 뉴클레오티드에 의해 분리될 수 있다.
일 구현예에서, 상이한 펩티드 및/또는 폴리펩티드 또는 이들을 암호화하는 뉴클레오티드 서열은 펩티드 및/또는 폴리펩티드가 상이한 MHC 클래스 I 분자 및/또는 상이한 MHC 클래스 II 분자와 같은 상이한 MHC 분자와 회합할 수 있도록 선택된다. 일부 측면에서, 하나의 백신 조성물은 가장 빈번하게 발생하는 MHC 클래스 I 분자 및/또는 상이한 MHC 클래스 II 분자와 회합할 수 있는 펩티드 및/또는 폴리펩티드에 대한 코딩 서열을 포함한다. 따라서, 백신 조성물은 적어도 2개의 바람직한, 적어도 3개의 바람직한, 또는 적어도 4개의 바람직한 MHC 클래스 I 분자 및/또는 상이한 MHC 클래스 II 분자와 회합할 수 있는 상이한 단편을 포함할 수 있다.
백신 조성물은 특이적 세포독성 T-세포 반응 및/또는 특이적 헬퍼 T-세포 반응을 자극할 수 있다. 백신 조성물은 특이적 세포독성 T-세포 반응 및 특이적 헬퍼 T-세포 반응을 자극할 수 있다.
백신 조성물은 특이적 B-세포 반응(예를 들어, 항체 반응)을 자극할 수 있다.
백신 조성물은 특이적 세포독성 T-세포 반응, 특이적 헬퍼 T-세포 반응, 및/또는 특이적 B-세포 반응을 자극할 수 있다. 백신 조성물은 특이적 세포독성 T-세포 반응 및 특이적 B-세포 반응을 자극할 수 있다. 백신 조성물은 특이적 헬퍼 T-세포 반응 및 특이적 B-세포 반응을 자극할 수 있다. 백신 조성물은 특이적 세포독성 T-세포 반응, 특이적 헬퍼 T-세포 반응, 및 특이적 B-세포 반응을 자극할 수 있다.
백신 조성물은 애쥬번트 및/또는 담체를 추가로 포함할 수 있다. 유용한 애쥬번트 및 담체의 예가 본원의 하기에 주어진다. 조성물은 예를 들어 단백질과 같은 담체 또는 예를 들어, T-세포에 펩티드를 제시할 수 있는 수지상 세포(DC)와 같은 항원-제시 세포와 회합될 수 있다.
애쥬번트는 백신 조성물로의 혼합이 항원에 대한 면역 반응을 증가시키거나 또는 달리 변형시키는 임의의 물질이다. 담체는 스캐폴드 구조, 예를 들어 항원에 회합될 수 있는 폴리펩티드 또는 다당류일 수 있다. 임의적으로, 애쥬번트는 공유적으로 또는 비공유적으로 접합된다.
항원에 대한 면역 반응을 증가시키는 애쥬번트의 능력은 전형적으로 면역-매개 반응의 상당한 또는 실질적 증가, 또는 질환 증상의 감소로 나타난다. 예를 들어, 체액성 면역의 증가는 전형적으로 항원에 대해 일어나는 항체의 역가에서 상당한 증가로 나타나고, T-세포 활성의 증가는 전형적으로 증가된 세포 증식, 또는 세포 세포독성, 또는 사이토카인 분비로 나타난다. 애쥬번트는 또한 예를 들어, 주로 체액성 또는 Th 반응을 주로 세포, 또는 Th 반응으로 바꿈으로써 면역 반응을 변경할 수 있다.
적합한 애쥬번트는 1018 ISS, 백반, 알루미늄 염, 암플리박스(Amplivax), AS15, BCG, CP-870,893, CpG7909, CyaA, dSLIM, GM-CSF, IC30, IC31, 이미퀴모드(Imiquimod), ImuFact IMP321, IS Patch, ISS, ISCOMATRIX, 쥬브이뮨(JuvImmune), 리포백(LipoVac), MF59, 모노포스포릴 지질 A, 몬타나이드(Montanide) IMS 1312, 몬타나이드 ISA 206, 몬타나이드 ISA 50V, 몬타나이드 ISA-51, OK-432, OM-174, OM-197-MP-EC, ONTAK, PepTel 벡터 시스템, PLG 미세입자, 레지퀴모드(resiquimod), SRL172, 바이로좀(Virosome) 및 다른 바이러스-유사 입자, YF-17D, VEGF 트랩, R848, 베타-글루칸, Pam3Cys, 사포닌에서 유래된 아퀼라(Aquila)의 QS21 스티뮬론(stimulon)(Aquila Biotech, 매국 매사추세츠주 우스터), 마이코박테리아 추출물 및 합성 박테리아 세포벽 모방체, 및 다른 독점 애쥬번트 예컨대 Ribi의 Detox. Quil 또는 Superfos를 포함하나 이에 제한되지 않는다. 불완전한 프로인트 또는 GM-CSF와 같은 애쥬번트가 유용하다. 수지상 세포에 특이적인 여러 면역학적 애쥬번트(예를 들어, MF59) 및 그들의 제제가 이전에 기재되었다(Dupuis M 등, Cell Immunol. 1998; 186(1):18-27; Allison A C; Dev Biol Stand. 1998; 92:3-11). 또한 사이토카인이 사용될 수 있다. 여러 사이토카인은 림프 조직으로의 수지상 세포 이동에 영향을 미치고(예를 들어, TNF-알파), T-림프구에 대한 효율적인 항원-제시 세포로의 수지상 세포의 성숙을 가속화하고(예를 들어, GM-CSF, IL-1 및 IL-4)(미국 특허 번호 5,849,589, 구체적으로 그 전문이 본원에 참조로 포함됨) 면역애쥬번트(예를 들어, IL-12)로서 작용하는 데 직접적으로 연관되었다(Gabrilovich D I 등, J Immunother Emphasis Tumor Immunol. 1996 (6):414-418).
CpG 면역자극 올리고뉴클레오티드는 또한 백신 설정에서 애쥬번트의 효과를 향상시키는 것으로 보고되었다. RNA 결합 TLR 7, TLR 8 및/또는 TLR 9와 같은 다른 TLR 결합 분자가 또한 사용될 수 있다.
유용한 애쥬번트의 다른 예는 화학적으로 변형된 CpG(예를 들어 CpR, Idera), 폴리(I:C)(예를 들어 폴리i:CI2U), 비-CpG 박테리아 DNA 또는 RNA 뿐만, 아니라 치료적으로 및/또는 애쥬번트로서 작용할 수 있는, 사이클로포스파미드, 수니티닙, 베바시주맙, 셀레브렉스, NCX-4016, 실데나필, 타달라필, 바르데나필, 소라피닙, XL-999, CP-547632, 파조파닙, ZD2171, AZD2171, 이필리무맙, 트레멜리무맙, 및 SC58175와 같은 면역활성 소분자 및 항체를 포함하나 이에 제한되지 않는다. 애쥬번트 및 첨가제의 양 및 농도는 과도한 실험 없이 당업자에 의해 용이하게 결정될 수 있다. 추가의 애쥬번트는 과립구 대식세포 콜로니 자극 인자(GM-CSF, 사르그라모스팀)와 같은 콜로니-자극 인자를 포함한다.
백신 조성물은 하나 초과의 상이한 애쥬번트를 포함할 수 있다. 또한, 치료적 조성물은 상기 또는 이의 조합 중 임의의 것을 포함하는 임의의 애쥬번트 물질을 포함할 수 있다. 또한 백신 및 애쥬번트가 임의의 적절한 순서로 함께 또는 별도로 투여될 수 있음이 고려된다.
담체(또는 부형제)는 애쥬번트와 독립적으로 존재할 수 있다. 담체의 기능은 예를 들어 활성 또는 면역원성을 증가시키거나, 안정성을 부여하거나, 생물학적 활성을 증가시키거나, 또는 혈청 반감기를 증가시키기 위해 특정 돌연변이체의 분자량을 증가시키는 것일 수 있다. 또한, 담체는 T-세포에 펩티드를 제시하는 것을 도울 수 있다. 담체는 당업자에게 알려진 임의의 적합한 담체, 예를 들어 단백질 또는 항원 제시 세포일 수 있다. 담체 단백질은 키홀 림펫 헤모시아닌, 트랜스페린, 소 혈청 알부민, 인간 혈청 알부민, 티로글로불린 또는 오브알부민과 같은 혈청 단백질, 면역글로불린, 또는 인슐린 또는 팔미트산과 같은 호르몬일 수 있으나 이에 제한되지 않는다. 인간의 면역화를 위해, 담체는 일반적으로 인간에게 허용되고 안전한 생리학적으로 허용되는 담체이다. 그러나, 파상풍 톡소이드 및/또는 디프테리아 톡소이드가 적합한 담체이다. 대안적으로, 담체는 덱스트란, 예를 들어 세파로스일 수 있다.
세포독성 T-세포(CTL)는 온전한 외래 항원 자체보다 MHC 분자에 결합된 펩티드의 형태로 항원을 인식한다. MHC 분자 자체는 항원 제시 세포의 세포 표면에 위치한다. 따라서, CTL의 활성화는 펩티드 항원, MHC 분자, 및 APC의 삼량체 복합체가 존재하는 경우 가능하다. 상응하게는, 펩티드가 CTL의 활성화에 사용되는 경우 뿐만 아니라, 추가로 각각의 MHC 분자를 갖는 APC가 첨가되는 경우 면역 반응을 향상시킬 수 있다. 따라서, 일부 구현예에서 백신 조성물은 적어도 하나의 항원 제시 세포를 추가로 함유한다.
항원은 또한 백시니아, 계두, 자기-복제 알파바이러스, 마라바바이러스, 아데노바이러스(예를 들어, Tatsis 등, Adenoviruses, Molecular Therapy (2004) 10, 616-629 참조), 또는 제2, 제3 또는 하이브리드 제2/제3 세대 렌티바이러스 및 특이적 세포 유형 또는 수용체를 표적하도록 설계된 임의의 세대의 재조합 렌티바이러스를 포함하나 이에 제한되지 않는, 렌티바이러스와 같은 바이러스 벡터-기반 백신 플랫폼에 포함될 수 있다(예를 들어, Hu 등, Immunization Delivered by Lentiviral Vectors for Cancer and Infectious Diseases, Immunol Rev. (2011) 239(1): 45-61, Sakuma 등, Lentiviral vectors: basic to translational, Biochem J. (2012) 443(3):603-18, Cooper 등, Rescue of splicing-mediated intron loss maximizes expression in lentiviral vectors containing the human ubiquitin C promoter, Nucl. Acids Res. (2015) 43 (1): 682-690, Zufferey 등, Self-Inactivating Lentivirus Vector for Safe and Efficient In Vivo Gene Delivery, J. Virol. (1998) 72 (12): 9873-9880 참조). 상기 언급된 바이러스 벡터-기반 백신 플랫폼의 패키징 용량에 따라, 이 접근법은 하나 이상의 항원 펩티드를 암호화하는 하나 이상의 뉴클레오티드 서열을 전달할 수 있다. 서열은 돌연변이되지 않은 서열 옆에 있을 수 있거나, 링커에 의해 분리될 수 있거나 또는 세포하 구획을 표적화하는 하나 이상의 서열이 선행될 수 있다(예를 들어, Gros 등, Prospective identification of neoantigen-specific lymphocytes in the peripheral blood of melanoma patients, Nat Med. (2016) 22 (4):433-8, Stronen 등, Targeting of cancer neoantigens with donor-derived T cell receptor repertoires, Science. (2016) 352 (6291):1337-41, Lu 등, Efficient identification of mutated cancer antigens recognized by T cells associated with durable tumor regressions, Clin Cancer Res. (2014) 20( 13):3401-10 참조). 숙주로 도입 시, 감염된 세포는 항원을 발현하여, 펩티드(들)에 대한 숙주 면역(예를 들어, CTL) 반응을 자극한다. 면역화 프로토콜에 유용한 백시니아 벡터 및 방법은 예를 들어, 미국 특허 번호 4,722,848에 기재되어 있다. 또 다른 벡터는 BCG(바실리 칼메트 게랑)이다. BCG 벡터는 Stover 등 (Nature 351:456-460 (1991))에 기재되어 있다. 항원의 치료적 투여 또는 면역화에 유용한 매우 다양한 다른 백신 벡터, 예를 들어, 살모넬라 티피(Salmonella typhi) 벡터 등이 본원의 설명으로부터 당업자에게 자명할 것이다.
항원 카세트
하나 이상의 항원의 선택, "항원 카세트"의 클로닝 및 구축 및 바이러스 벡터로의 삽입을 위해 이용되는 방법은 본원에 제공된 교시가 주어진 당업계 내에 있다. "항원 카세트"란 선택된 항원 또는 복수의 항원(예를 들어, 항원-암호화 핵산 서열) 및 항원(들)을 전사하고 전사된 생성물을 발현하는 데 필요한 다른 조절 요소의 조합을 의미한다. 선택된 항원 또는 복수의 항원은 별개의 에피토프 서열을 지칭할 수 있으며, 예를 들어, 카세트 내의 항원-암호화 핵산 서열은 에피토프가 전사되고 발현되도록 에피토프-암호화 핵산 서열(또는 복수의 에피토프-암호화 핵산 서열)을 암호화할 수 있다. 항원 또는 복수의 항원은 전사를 허용하는 방식으로 조절 구성요소에 작동가능하게 연결될 수 있다. 이러한 구성요소는 바이러스 벡터로 형질감염된 세포에서 항원(들)의 발현을 구동할 수 있는 통상적인 조절 요소를 포함한다. 따라서 항원 카세트는 또한 재조합 벡터의 선택된 바이러스 서열 내에서 항원(들)에 연결되고 다른 임의적인 조절 요소와 함께 위치한 선택된 프로모터를 함유할 수 있다. 카세트는 하나 이상의 병원체-유래 펩티드, 바이러스-유래 펩티드, 박테리아-유래 펩티드, 진균-유래 펩티드, 기생충-유래 펩티드, 및/또는 종양-유래 펩티드와 같은 하나 이상의 항원을 포함할 수 있다. 각각 독립적으로 별도의 프로모터에 작동가능하게 연결되고/되거나 2A 리보솜 스킵핑 서열 요소(예를 들어, E2A, P2A, F2A, 또는 T2A 서열) 또는 내부 리보솜 진입 부위(IRES) 서열 요소와 같은 다른 멀티시스트로닉 시스템을 사용하여 함께 연결된 다중 항원-암호화 핵산 서열을 함유하는 카세트와 같은 카세트는 하나 이상의 항원-암호화 핵산 서열을 가질 수 있다. 링커는 또한 TEV 또는 푸린 절단 부위와 같은 절단 부위를 가질 수 있다. 절단 부위가 있는 링커는 멀티시스트로닉 시스템의 요소와 같은 다른 요소와 조합하여 사용될 수 있다. 비제한적인 예시적 예에서, 푸린 프로테아제 절단 부위는 푸린 프로테아제 절단 부위가 번역 후 2A 서열의 제거를 용이하게 하도록 구성되게 2A 리보솜 스킵핑 서열 요소와 함께 사용될 수 있다. 하나 초과의 항원-암호화 핵산 서열을 함유하는 카세트에서, 각각의 항원-암호화 핵산 서열은 하나 이상의 에피토프-암호화 핵산 서열(예를 들어, 연결된 T 세포 에피토프를 암호화하는 항원-암호화 핵산 서열)을 함유할 수 있다.
유용한 프로모터는 구성적 프로모터 또는 조절된(유도성) 프로모터일 수 있으며, 이는 발현될 항원(들)의 양의 제어를 가능하게 할 것이다. 예를 들어, 바람직한 프로모터는 사이토메갈로바이러스 급초기 프로모터/인핸서의 프로모터이다[예를 들어, Boshart 등, Cell, 41:521-530 (1985) 참조]. 또 다른 바람직한 프로모터는 라우스 육종 바이러스 LTR 프로모터/인핸서를 포함한다. 또한 또 다른 프로모터/인핸서 서열은 닭 세포질 베타-액틴 프로모터이다[T. A. Kost 등, Nucl. Acids Res., 11(23):8287 (1983)]. 다른 적합하거나 또는 바람직한 프로모터가 당업자에 의해 선택될 수 있다.
항원 카세트는 또한 전사체의 효율적인 폴리아데닐화(폴리(A), 폴리-A 또는 pA)를 위한 신호를 제공하는 서열 및 기능적 스플라이스 공여자 및 수용자 부위가 있는 인트론을 포함하는 바이러스 벡터 서열에 이종인 핵산 서열을 포함할 수 있다. 본 발명의 예시적인 벡터에 이용되는 공통 폴리-A 서열은 파포바바이러스 SV-40으로부터 유래된 것이다. 폴리-A 서열은 일반적으로 항원-기반 서열 다음 및 바이러스 벡터 서열 전에 카세트에 삽입될 수 있다. 공통 인트론 서열은 또한 SV-40으로부터 유래될 수 있고, SV-40 T 인트론 서열로서 지칭된다. 항원 카세트는 또한 프로모터/인핸서 서열과 항원(들) 사이에 위치한 이러한 인트론을 함유할 수 있다. 이들 및 다른 공통 벡터 요소의 선택은 통상적이고[예를 들어, Sambrook 등, "Molecular Cloning. A Laboratory Manual.", 2d edit., Cold Spring Harbor Laboratory, New York (1989) 및 그 안에 인용된 참고문헌 참조] 많은 이러한 서열은 상업적 및 산업적 공급원 뿐만 아니라 Genbank로부터 입수가능하다.
항원 카세트는 하나 이상의 항원을 가질 수 있다. 예를 들어, 주어진 카세트는 1-10개, 1-20개, 1-30개, 10-20개, 15-25개, 15-20개, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20개, 또는 그 이상의 항원을 포함할 수 있다. 항원은 서로 직접적으로 연결될 수 있다. 항원은 또한 링커로 서로 연결될 수 있다. 항원은 N에서 C로 또는 C에서 N으로 포함하여 서로에 대해 임의의 배향으로 있을 수 있다.
본원의 다른 곳에 기재된 바와 같이, 항원 카세트는 특히 선택될 수 있는, VEEV 백본의 결실된 구조적 단백질 또는 ChAd-기반 벡터의 E1 유전자 영역 결실 또는 E3 유전자 영역 결실의 부위와 같은 바이러스 벡터에서 임의의 선택된 결실의 부위에 위치할 수 있다.
항원 카세트는 5'에서 3'으로 각각의 요소의 정렬된 서열을 기재하기 위해 하기 화학식을 사용하여 기재될 수 있다:
상기 식에서 P 및 P2는 프로모터 뉴클레오티드 서열을 포함하고, N은 MHC 클래스 I 에피토프-암호화 핵산 서열을 포함하고, L5는 5' 링커 서열을 포함하고, L3은 3' 링커 서열을 포함하고, G5는 아미노산 링커를 암호화하는 핵산 서열을 포함하고, G3은 아미노산 링커를 암호화하는 적어도 하나의 핵산 서열 중 하나를 포함하고, U는 MHC 클래스 II 항원-암호화 핵산 서열을 포함하고, 상기 각각의 X에 대해 상응하는 Nc는 에피토프 암호화 핵산 서열이고, 상기 각각의 Y에 대해 상응하는 Uf는 범용 MHC 클래스 II 에피토프-암호화 핵산 서열이다. 범용 서열은 파상풍 톡소이드 및 PADRE 중 적어도 하나를 포함할 수 있다. 범용 서열은 파상풍 톡소이드 펩티드를 포함할 수 있다. 범용 서열은 PADRE 펩티드를 포함할 수 있다. 범용 서열은 파상풍 톡소이드 및 PADRE 펩티드를 포함할 수 있다. 조성물 및 정렬된 서열은 존재하는 요소의 수를 선택함으로써 추가로 정의될 수 있으며, 예를 들어 여기서 a = 0 또는 1, 여기서 b = 0 또는 1, 여기서 c = 1, 여기서 d = 0 또는 1, 여기서 e = 0 또는 1, 여기서 f = 1, 여기서 g = 0 또는 1, 여기서 h = 0 또는 1, X = 1 내지 400, Y = 0, 1, 2, 3, 4 또는 5, Z = 1 내지 400, 및 W = 0, 1, 2, 3, 4 또는 5이다.
하나의 예에서, 존재하는 요소는 다음을 포함한다: 상기 a = 0, b = 1, d = 1, e = 1, g = 1, h = 0, X = 10, Y = 2, Z = 1, 및 W = 1은 추가의 프로모터가 존재하지 않고(예를 들어, RNA 알파바이러스 백본과 같은 벡터 백본에 의해 제공되는 프로모터 뉴클레오티드 서열만이 존재함), 10개의 MHC 클래스 I 에피토프가 존재하고, 5' 링커가 각각 N에 대해 존재하고, 3' 링커가 각각의 N에 대해 존재하고, 2개의 MHC 클래스 II 에피토프가 존재하고, 2개의 MHC 클래스 II 에피토프를 연결하는 링커가 존재하고, 2개의 MHC 클래스 II 에피토프의 5' 단부를 최종 MHC 클래스 I 에피토프의 3' 링커에 연결하는 링커가 존재하고, 2개의 MHC 클래스 II 에피토프의 3' 단부를 벡터 백본(예를 들어, RNA 알파바이러스 백본)에 연결하는 링커가 존재하는 경우를 설명한다. 항원 카세트의 3' 단부를 벡터 백본(예를 들어, RNA 알파바이러스 백본)에 연결하는 예는 3' 19-nt CSE와 같은 벡터 백본에 의해 제공된 3' UTR 요소에 직접적으로 연결하는 것을 포함한다. 항원 카세트의 5' 단부를 벡터 백본(예를 들어, RNA 알파바이러스 백본)에 연결하는 예는 프로모터 또는 서브게놈 프로모터 서열(예를 들어, 26S 서브게놈 프로모터 서열), 알파바이러스 5' UTR, 51-nt CSE, 또는 24-nt CSE와 같은 벡터 백본의 5' UTR 요소에 직접적으로 연결하는 것을 포함한다.
다른 예는 다음을 포함한다: 상기 a = 1은 벡터 백본(예를 들어, RNA 알파바이러스 백본)에 의해 제공된 프로모터 뉴클레오티드 서열 이외의 프로모터가 존재하는 경우를 설명하고; 상기 1개 이상의 별개의 MHC 클래스 I 에피토프 암호화 핵산 서열의 발현을 각각 구동하는 벡터 백본에 의해 제공된 프로모터 뉴클레오티드 서열 이외의 다중 프로모터가 존재하는 경우 a = 1 및 Z는 1보다 더 크고; 상기 h = 1은 별도의 프로모터가 MHC 클래스 II 에피토프-암호화 핵산 서열의 발현을 구동하기 위해 존재하는 경우를 설명하고; 상기 g = 0은 MHC 클래스 II 에피토프-암호화 핵산 서열이 존재하는 경우 벡터 백본(예를 들어, RNA 알파바이러스 백본)에 직접적으로 연결되는 것을 설명한다.
존재하는 각각의 MHC 클래스 I 에피토프가 5' 링커, 3' 링커, 어느 쪽도 갖지 않거나, 또는 둘 다 가질 수 있는 다른 예를 포함한다. 하나 초과의 MHC 클래스 I 에피토프가 동일한 항원 카세트에 존재하는 예에서, 일부 MHC 클래스 I 에피토프는 5' 링커 및 3' 링커를 둘 다 가질 수 있지만, 다른 MHC 클래스 I 에피토프는 5' 링커, 3' 링커 중 어느 하나를 갖거나, 또는 어느 쪽도 갖지 않을 수 있다. 하나 초과의 MHC 클래스 I 에피토프가 동일한 항원 카세트에 존재하는 다른 예에서, 일부 MHC 클래스 I 에피토프는 5' 링커 또는 3' 링커 중 어느 하나를 가질 수 있지만, 다른 MHC 클래스 I 에피토프는 5' 링커, 3' 링커 중 어느 하나를 갖거나, 또는 어느 쪽도 갖지 않을 수 있다.
하나 초과의 MHC 클래스 II 에피토프가 동일한 항원 카세트에 존재하는 예에서, 일부 MHC 클래스 II 에피토프는 5' 링커 및 3' 링커 둘 다 가질 수 있지만, 다른 MHC 클래스 II 에피토프는 5' 링커, 3' 링커 중 어느 하나를 갖거나, 또는 어느 쪽도 갖지 않을 수 있다. 하나 초과의 MHC 클래스 II 에피토프가 동일한 항원 카세트에 존재하는 다른 예에서, 일부 MHC 클래스 II 에피토프는 5' 링커 또는 3' 링커 중 어느 하나를 가질 수 있지만, 다른 MHC 클래스 II 에피토프는 5' 링커, 3' 링커 중 어느 하나를 갖거나, 또는 어느 쪽도 갖지 않을 수 있다.
존재하는 각각의 항원이 5' 링커, 3' 링커, 어느 쪽도 갖지 않거나, 또는 둘 다 가질 수 있는 다른 예를 포함한다. 하나 초과의 항원이 동일한 항원 카세트에 존재하는 예에서, 일부 항원은 5' 링커 및 3' 링커 둘 다 가질 수 있지만, 다른 항원은 5' 링커, 3' 링커 중 어느 하나를 갖거나, 또는 어느 쪽도 갖지 않을 수 있다. 하나 초과의 항원이 동일한 항원 카세트에 존재하는 다른 예에서, 일부 항원은 5' 링커 또는 3' 링커 중 어느 하나를 가질 수 있지만, 다른 항원은 5' 링커, 3' 링커 중 어느 하나를 갖거나, 또는 어느 쪽도 갖지 않을 수 있다.
프로모터 뉴클레오티드 서열 P 및/또는 P2는 RNA 알파바이러스 백본과 같은 벡터 백본에 의해 제공된 프로모터 뉴클레오티드 서열과 동일할 수 있다. 예를 들어, 벡터 백본에 의해 제공된 프로모터 서열, Pn 및 P2는 각각 서브게놈 프로모터 서열(예를 들어, 26S 서브게놈 프로모터) 또는 CMV 프로모터를 포함할 수 있다. 프로모터 뉴클레오티드 서열 P 및/또는 P2는 벡터 백본(예를 들어, RNA 알파바이러스 백본)에 의해 제공된 프로모터 뉴클레오티드 서열과 상이할 수 있을 뿐만 아니라, 서로 상이할 수 있다.
5' 링커 L5는 천연 서열 또는 비천연 서열일 수 있다. 비천연 서열은 AAY, RR, 및 DPP를 포함하나 이에 제한되지 않는다. 3' 링커 L3은 또한 천연 서열 또는 비천연 서열일 수 있다. 추가로, L5 및 L3은 둘 다 천연 서열일 수 있거나, 둘 다 비천연 서열일 수 있거나, 또는 하나는 천연이고 다른 하나는 비천연일 수 있다. 각각의 X에 대해, 아미노산 링커는 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94,95, 96, 97, 98, 99, 100개 이상의 아미노산 길이일 수 있다. 각각의 X에 대해, 아미노산 링커는 또한 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 적어도 11개, 적어도 12개, 적어도 13개, 적어도 14개, 적어도 15개, 적어도 16개, 적어도 17개, 적어도 18개, 적어도 19개, 적어도 20개, 적어도 21개, 적어도 22개, 적어도 23개, 적어도 24개, 적어도 25개, 적어도 26개, 적어도 27개, 적어도 28개, 적어도 29개, 또는 적어도 30개 아미노산 길이일 수 있다.
아미노산 링커 G5는, 각각의 Y에 대해, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94,95, 96, 97, 98, 99, 100개 이상의 아미노산 길이일 수 있다. 각각의 Y에 대해, 아미노산 링커는 또한 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 적어도 11개, 적어도 12개, 적어도 13개, 적어도 14개, 적어도 15개, 적어도 16개, 적어도 17개, 적어도 18개, 적어도 19개, 적어도 20개, 적어도 21개, 적어도 22개, 적어도 23개, 적어도 24개, 적어도 25개, 적어도 26개, 적어도 27개, 적어도 28개, 적어도 29개, 또는 적어도 30개 아미노산 길이일 수 있다.
아미노산 링커 G3은 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94,95, 96, 97, 98, 99, 100개 이상의 아미노산 길이일 수 있다. G3은 또한 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 적어도 11개, 적어도 12개, 적어도 13개, 적어도 14개, 적어도 15개, 적어도 16개, 적어도 17개, 적어도 18개, 적어도 19개, 적어도 20개, 적어도 21개, 적어도 22개, 적어도 23개, 적어도 24개, 적어도 25개, 적어도 26개, 적어도 27개, 적어도 28개, 적어도 29개, 또는 적어도 30개 아미노산 길이일 수 있다.
각각의 X에 대해, 각각의 N은 MHC 클래스 I 에피토프, MHC 클래스 II 에피토프, B 세포 반응을 자극할 수 있는 에피토프/항원, 또는 이의 조합을 암호화할 수 있다. 각각의 X에 대해, 각각의 N은 MHC 클래스 I 에피토프, MHC 클래스 II 에피토프, 및 B 세포 반응을 자극할 수 있는 에피토프/항원의 조합을 암호화할 수 있다. 각각의 X에 대해, 각각의 N은 MHC 클래스 I 에피토프 및 MHC 클래스 II 에피토프의 조합을 암호화할 수 있다. 각각의 X에 대해, 각각의 N은 MHC 클래스 I 에피토프 및 B 세포 반응을 자극할 수 있는 에피토프/항원의 조합을 암호화할 수 있다. 각각의 X에 대해, 각각의 N은 MHC 클래스 II 에피토프 및 B 세포 반응을 자극할 수 있는 에피토프/항원의 조합을 암호화할 수 있다. 각각의 X에 대해, 각각의 N은 MHC 클래스 II 에피토프를 암호화할 수 있다. 각각의 X에 대해, 각각의 N은 B 세포 반응을 자극할 수 있는 에피토프/항원을 암호화할 수 있다. 각각의 X에 대해, 각각의 N은 7-15개 아미노산 길이의 MHC 클래스 I 에피토프를 암호화할 수 있다. 각각의 X에 대해, 각각의 N은 또한 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 또는 30개 아미노산 길이의 MHC 클래스 I 에피토프를 암호화할 수 있다. 각각의 X에 대해, 각각의 N은 또한 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 적어도 11개, 적어도 12개, 적어도 13개, 적어도 14개, 적어도 15개, 적어도 16개, 적어도 17개, 적어도 18개, 적어도 19개, 적어도 20개, 적어도 21개, 적어도 22개, 적어도 23개, 적어도 24개, 적어도 25개, 적어도 26개, 적어도 27개, 적어도 28개, 적어도 29개, 또는 적어도 30개 아미노산 길이의 MHC 클래스 I 에피토프를 암호화할 수 있다.
하나 이상의 항원을 암호화하는 카세트는 700개 이하의 뉴클레오티드일 수 있다. 하나 이상의 항원을 암호화하는 카세트는 700개 이하의 뉴클레오티드일 수 있고 2개의 별개의 에피토프-암호화 핵산 서열을 암호화한다(예를 들어, 2개의 별개의 감염성 질환 또는 면역원성 폴리펩티드를 암호화하는 종양 유래 핵산 서열을 암호화한다). 하나 이상의 항원을 암호화하는 카세트는 700개 이하의 뉴클레오티드일 수 있고 적어도 2개의 별개의 에피토프-암호화 핵산 서열을 암호화한다. 하나 이상의 항원을 암호화하는 카세트는 700개 이하의 뉴클레오티드일 수 있고 3개의 별개의 에피토프-암호화 핵산 서열을 암호화한다. 하나 이상의 항원을 암호화하는 카세트는 700개 이하의 뉴클레오티드일 수 있고 적어도 3개의 별개의 에피토프-암호화 핵산 서열을 암호화한다. 하나 이상의 항원을 암호화하는 카세트는 700개 이하의 뉴클레오티드일 수 있고 1-10개, 1-5개, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개, 또는 그 이상의 항원을 포함한다.
하나 이상의 항원을 암호화하는 카세트는 375-700개 뉴클레오티드 길이일 수 있다. 하나 이상의 항원을 암호화하는 카세트는 375-700개 뉴클레오티드 길이일 수 있고 2개의 별개의 에피토프-암호화 핵산 서열을 암호화한다. 하나 이상의 항원을 암호화하는 카세트는 375-700개 뉴클레오티드 길이일 수 있고 적어도 2개의 별개의 에피토프-암호화 핵산 서열을 암호화한다. 하나 이상의 항원을 암호화하는 카세트는 375-700개 뉴클레오티드 길이일 수 있고 3개의 별개의 에피토프-암호화 핵산 서열을 암호화한다. 하나 이상의 항원을 암호화하는 카세트는 375-700개 뉴클레오티드 길이일 수 있고 적어도 3개의 별개의 에피토프-암호화 핵산 서열을 암호화한다. 하나 이상의 항원을 암호화하는 카세트는 375-700개 뉴클레오티드 길이일 수 있고 1-10개, 1-5개, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개, 또는 그 이상의 항원을 포함한다.
하나 이상의 항원을 암호화하는 카세트는 600, 500, 400, 300, 200, 또는 100개 이하의 뉴클레오티드 길이일 수 있다. 하나 이상의 항원을 암호화하는 카세트는 600, 500, 400, 300, 200, 또는 100개 이하의 뉴클레오티드 길이일 수 있고 2개의 별개의 에피토프-암호화 핵산 서열을 암호화한다. 하나 이상의 항원을 암호화하는 카세트는 600, 500, 400, 300, 200, 또는 100개 이하의 뉴클레오티드 길이일 수 있고 적어도 2개의 별개의 에피토프-암호화 핵산 서열을 암호화한다. 하나 이상의 항원을 암호화하는 카세트는 600, 500, 400, 300, 200, 또는 100개 이하의 뉴클레오티드 길이일 수 있고 3개의 별개의 에피토프-암호화 핵산 서열을 암호화한다. 하나 이상의 항원을 암호화하는 카세트는 600, 500, 400, 300, 200, 또는 100개 이하의 뉴클레오티드 길이일 수 있고 적어도 3개의 별개의 에피토프-암호화 핵산 서열을 암호화한다. 하나 이상의 항원을 암호화하는 카세트는 600, 500, 400, 300, 200, 또는 100개 이하의 뉴클레오티드 길이일 수 있고 1-10개, 1-5개, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개, 또는 그 이상의 항원을 포함한다.
하나 이상의 항원을 암호화하는 카세트는 375-600개, 375-500개, 또는 375-400개 뉴클레오티드 길이일 수 있다. 하나 이상의 항원을 암호화하는 카세트는 375-600개, 375-500개, 또는 375-400개 뉴클레오티드 길이일 수 있고 2개의 별개의 에피토프-암호화 핵산 서열을 암호화한다. 하나 이상의 항원을 암호화하는 카세트는 375-600개, 375-500개, 또는 375-400개 뉴클레오티드 길이일 수 있고 적어도 2개의 별개의 에피토프-암호화 핵산 서열을 암호화한다. 하나 이상의 항원을 암호화하는 카세트는 375-600개, 375-500개, 또는 375-400개 뉴클레오티드 길이일 수 있고 3개의 별개의 에피토프-암호화 핵산 서열을 암호화한다. 하나 이상의 항원을 암호화하는 카세트는 375-600개, 375-500개, 또는 375-400개 뉴클레오티드 길이일 수 있고 적어도 3개의 별개의 에피토프-암호화 핵산 서열을 암호화한다. 하나 이상의 항원을 암호화하는 카세트는 375-600개, 375-500개, 또는 375-400개 뉴클레오티드 길이일 수 있고 1-10개, 1-5개, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개, 또는 그 이상의 항원을 포함한다.
면역 조절제
본원에 기재된 C68 벡터 또는 본원에 기재된 알파바이러스 벡터와 같은 본원에 기재된 벡터는 적어도 하나의 항원을 암호화하는 핵산을 포함할 수 있고 동일한 또는 별도의 벡터는 적어도 하나의 면역 조절제를 암호화하는 핵산을 포함할 수 있다. 면역 조절제는 면역 체크포인트 분자에 결합하고 이의 활성을 차단하는 결합 분자(예를 들어, scFv와 같은 항체)를 포함할 수 있다. 면역 조절제는 IL-2, IL-7, IL-12(IL-12 p35, p40, p70, 및/또는 p70-융합 작제물 포함), IL-15, 또는 IL-21과 같은 사이토카인을 포함할 수 있다. 면역 조절제는 변형된 사이토카인(예를 들어, pegIL-2)을 포함할 수 있다. 벡터는 항원 카세트 및 면역 조절제를 암호화하는 하나 이상의 핵산 분자를 포함할 수 있다.
차단 또는 억제를 위해 표적화될 수 있는 예시적 면역 체크포인트 분자는 CTLA-4, 4-1BB(CD137), 4-1BBL(CD137L), PDL1, PDL2, PD1, B7-H3, B7-H4, BTLA, HVEM, TIM3, GAL9, LAG3, TIM3, B7H3, B7H4, VISTA, KIR, 2B4(CD2 계열의 분자에 속하고 모든 NK, γδ, 및 기억 CD8+(αβ) T 세포 상에서 발현됨), CD160(BY55로도 지칭됨), 및 CGEN-15049를 포함하나 이에 제한되지 않는다. 면역 체크포인트 억제제는 CTLA-4, PDL1, PDL2, PD1, B7-H3, B7-H4, BTLA, HVEM, TIM3, GAL9, LAG3, TIM3, B7H3, B7H4, VISTA, KIR, 2B4, CD160, 및 CGEN-15049 중 하나 이상에 결합하고 이의 활성을 차단 또는 억제하는 항체, 또는 이의 항원 결합 단편, 또는 다른 결합 단백질을 포함한다. 예시적 면역 체크포인트 억제제는 트레멜리무맙(CTLA-4 차단 항체), 항-OX40, PD-L1 단클론 항체(항-B7-H1; MEDI4736), 이필리무맙, MK-3475(PD-1 차단제), 니볼루맙(항-PD1 항체), CT-011(항-PD1 항체), BY55 단클론 항체, AMP224(항-PDL1 항체), BMS-936559(항-PDL1 항체), MPLDL3280A(항-PDL1 항체), MSB0010718C(항-PDL1 항체) 및 여보이/이필리무맙(항-CTLA-4 체크포인트 억제제)을 포함한다. 항체-암호화 서열은 당업계의 통상적인 기술을 사용하여 C68과 같은 벡터 내로 조작될 수 있다. 예시적인 방법은 Fang 등, Stable antibody expression at therapeutic levels using the 2A peptide. Nat Biotechnol. 2005 May;23(5):584-90. Epub 2005 Apr 17에 기재되어 있으며; 모든 목적을 위해 본원에 참조로 포함된다.
페이로드-암호화 SAM 조성물
또한 본원에는 카세트에서와 같이, 하나 이상의 페이로드 핵산 서열을 암호화하는 SAM 벡터가 유래된 자기-복제 바이러스의 내인성 5' 서열을 갖는(예를 들어, "AU-SAM"으로도 지칭되는 내인성 5' VEEV 뉴클레오티드 AU를 갖는) SAM 벡터가 개시된다. "카세트"란 선택된 폴리뉴클레오티드(들)(예를 들어, 항원-암호화 핵산 서열) 및 폴리뉴클레오티드(들)를 전사하고, 일반적으로 코딩 서열의 경우에, 전사된 생성물을 발현하는 데 필요한 다른 조절 요소의 조합을 의미한다. 또한 본원에는 하나 이상의 페이로드 핵산 서열을 전달할 수 있는 SAM 벡터 전달 조성물이 개시된다. 페이로드 핵산 서열은 관심 세포에 전달되기를 원하는 임의의 핵산 서열일 수 있다. 일반적으로, 페이로드는 핵산 서열의 발현을 구동하기 위해 프로모터 또는 임의의 번역 도구(예를 들어, IRES, 임의의 2A 자기-절단 펩티드 서열 예컨대 P2A, E2A, F2A, 및 T2A)에 연결된 핵산 서열이다. 페이로드 핵산 서열은 폴리펩티드(즉, 전사되고 단백질로 번역될 수 있는 핵산 서열)를 암호화할 수 있다. 일반적으로, 펩티드를 암호화하는 페이로드 핵산 서열은 세포에서 발현되기를 원하는 임의의 단백질을 암호화할 수 있다. 단백질의 예는 항원(예를 들어, MHC 클래스 I 에피토프, MHC 클래스 II 에피토프, 또는 B 세포 반응을 자극할 수 있는 에피토프), 항체, 사이토카인, 키메라 항원 수용체(CAR), T-세포 수용체, 또는 게놈-편집 시스템 구성요소(예를 들어, 게놈-편집 시스템에서 사용되는 뉴클레아제)를 포함하나 이에 제한되지 않는다. 게놈-편집 시스템은 CRISPR 시스템, 아연-핑거 시스템, 메가뉴클레아제 시스템, 또는 TALEN 시스템을 포함하나 이에 제한되지 않는다. 페이로드 핵산 서열은 비코딩(즉, 전사될 수 있지만 단백질로 번역되지 않는 핵산 서열)일 수 있다. 일반적으로, 비코딩 페이로드 핵산 서열은 세포에서 발현되기를 원하는 임의의 비코딩 폴리뉴클레오티드일 수 있다. 비코딩 폴리뉴클레오티드의 예는 RNA 간섭(RNAi) 폴리뉴클레오티드(예를 들어, 안티센스 올리고뉴클레오티드, shRNA, siRNA, miRNA 등) 또는 게놈-편집 시스템 폴리뉴클레오티드(예를 들어, 다양한/상이한 길이의 가이드 RNA[gRNA], 단일-가이드 RNA[sgRNA], 트랜스-활성화 CRISPR[tracrRNA], 및/또는 CRISPR RNA[crRNA])를 포함하나 이에 제한되지 않는다. 페이로드 핵산 서열은 2개 이상(예를 들어, 2, 3, 4, 5개 이상)의 별개의 폴리펩티드(예를 들어, 2개 이상의 별개의 에피토프 서열이 함께 연결됨)를 암호화할 수 있거나 또는 2개 이상의 별개의 비코딩 핵산 서열(예를 들어, 2개 이상의 별개의 RNAi 폴리뉴클레오티드)을 함유할 수 있다. 페이로드 핵산 서열은 폴리펩티드-암호화 핵산 서열 및 비코딩 핵산 서열의 조합을 가질 수 있다.
항원 식별
종양 및 정상 엑솜 및 전사체의 NGS 분석을 위한 연구 방법이 기재되었고 항원 식별 공간에서 적용되었다.6,14,15 임상 설정에서 항원 식별을 위한 더 큰 민감성 및 특이성에 대한 특정 최적화가 고려될 수 있다. 이러한 최적화는 실험실 과정에 관련되고 NGS 데이터 분석에 관련된 2가지 영역으로 그룹화될 수 있다. 기재된 연구 방법은 또한 감염성 질환 유기체, 대상체에서 감염, 또는 대상체의 감염된 세포로부터 항원을 식별하는 식별과 같은 다른 설정에서 항원의 식별에 적용될 수 있다. 최적화의 예, 예를 들어 미국 특허 번호 10,055,540, 미국 출원 공개 번호 US20200010849A1, 및 국제 특허 출원 공개 WO/2018/195357 및 WO/2018/208856에 보다 상세히 기재된 방법이 당업자에게 알려져 있으며, 각각은 모든 목적을 위해 그 전문이 본원에 참조로 포함된다.
항원(예를 들어, 종양 또는 감염성 질환 유기체로부터 유래된 항원)을 식별하는 방법은 세포 표면 상에 제시될(예를 들어, MHC에 의해 종양 세포, 감염된 세포, 또는 수지상 세포와 같은 전문 항원 제시 세포를 포함하는 면역 세포 상에 제시될) 가능성이 있고/있거나, 면역원성일 가능성이 있는 항원을 식별하는 단계를 포함한다. 예로서, 이러한 방법 중 하나는 종양, 감염된 세포, 또는 감염성 질환 유기체로부터 엑솜, 전사체 또는 전체 게놈 뉴클레오티드 서열분석 및/또는 발현 데이터 중 적어도 하나를 수득하는 단계로, 상기 뉴클레오티드 서열분석 데이터 및/또는 발현 데이터는 각각의 항원 세트(예를 들어, 종양 또는 감염성 질환 유기체로부터 유래된 항원)의 펩티드 서열을 나타내는 데이터를 수득하기 위해 사용되는 것인, 단계; 각각의 항원의 펩티드 서열을 하나 이상의 제시 모델에 입력하여 각각의 항원이 대상체의 종양 세포 또는 감염된 세포와 같은 세포 표면 상의 하나 이상의 MHC 대립유전자에 의해 제시되는, 적어도 수신된 질량 분광법 데이터에 기반하여 식별된 수치 가능성 세트를 생성하는 단계; 및 수치 가능성 세트에 기반한 항원 세트의 서브세트를 선택하여 선택된 항원 세트를 생성하는 단계를 포함할 수 있다.
모든 또는 대부분의 서브클론에 의해 제시된 것들을 의미하는 몸통 펩티드는 백신내로 포함시키기 위해 우선화될 수 있다. 임의적으로, 제시될 것으로 예측되고 높은 확률로 면역원성인 몸통 펩티드가 없는 경우, 또는 제시될 것으로 예측되고 높은 확률로 면역원성인 몸통 펩티드의 수가 추가의 비-몸통 펩티드가 백신에 포함될 수 있을만큼 충분히 작은 경우, 추가 펩티드는 서브클론의 수 및 정체성을 추정하고 백신에 의해 다뤄진 서브클론의 수를 최대화하기 위한 펩티드를 선택함으로써 우선화될 수 있다.
상기 항원 필터의 전부가 적용된 후, 더 많은 후보 항원은 백신 기술이 지원할 수 있는 것보다 백신 포함에 대해 여전히 이용가능하다. 추가로, 항원 분석의 다양한 측면에 관한 불확실성이 남아있을 수 있고 후보 백신 항원의 상이한 특성 사이에 적정성이 존재할 수 있다. 따라서, 선택 과정의 각 단계에서 미리 결정된 필터 대신에, 후보 항원을 적어도 하기 축을 가진 공간에 배치하고 통합 접근법을 사용하여 선택을 최적화하는 통합된 다차원 모델이 간주될 수 있다.
1. 자가면역 또는 관용의 위험(생식계열의 위험)(자가면역의 위험이 낮을수록 전형적으로 바람직함)
2. 서열분석 인공물의 확률(인공물의 확률이 낮을수록 전형적으로 바람직함)
3. 면역원성의 확률(면역원성의 확률이 높을수록 전형적으로 바람직함)
4. 제시 확률(제시 확률이 높을수록 전형적으로 바람직함)
5. 유전자 발현(발현이 높을수록 전형적으로 바람직함)
6. HLA 유전자의 적용범위(항원 세트의 제시에 연관된 HLA 분자의 수가 많을수록 종양, 감염성 질환, 및/또는 감염된 세포가 HLA 분자의 하향조절 또는 돌연변이를 통해 면역 공격을 피할 확률이 낮아질 수 있음)
7. HLA 클래스의 적용범위(HLA-I 및 HLA-II 둘 다를 적용하면 치료 반응의 확률이 증가하고 종양 또는 감염성 질환 탈출의 확률이 감소할 수 있음)
추가로, 임의적으로, 항원은 환자의 종양 또는 감염된 세포의 전부 또는 일부에서 상실되거나 또는 비활성화된 HLA 대립유전자에 의해 제시될 것으로 예측되는 경우 백신접종으로부터 우선순위가 낮아질 수 있다(예를 들어 제외됨). HLA 대립유전자 상실은 체세포 돌연변이, 이형접합성 손실, 또는 유전자좌의 동형접합 결실에 의해 발생할 수 있다. HLA 대립유전자 체세포 돌연변이의 검출 방법은 예를 들어 당업계에 잘 알려져 있다(Shukla 등, 2015). 체세포 LOH 및 동형접합 결실(HLA 유전자좌의 경우 포함)의 검출 방법은 마찬가지로 잘 기재되어 있다. (Carter 등, 2012; McGranahan 등, 2017; Van Loo 등, 2010). 항원은 또한 질량-분광법 데이터가 예측된 항원이 예측된 HLA 대립유전자에 의해 제시되지 않음을 나타내는 경우 항원은 또한 우선순위가 낮아질 수 있다.
치료 및 제조 방법
또한 본원에 개시된 방법을 사용하여 식별된 복수의 항원과 같은 하나 이상의 항원을 대상체에게 투여함으로써 대상체에서 종양 특이적 면역 반응을 자극하는 방법, 종양에 대해 백신접종하는 방법, 대상체에서 암의 증상을 치료 및/또는 완화하는 방법이 제공된다.
또한 본원에 개시된 방법을 사용하여 식별된 복수의 항원과 같은 하나 이상의 항원을 대상체에게 투여함으로써 대상체에서 감염성 질환 유기체-특이적 면역 반응을 자극하는 방법, 감염성 질환 유기체에 대해 백신접종하는 방법, 대상체에서 감염성 질환 유기체와 연관된 감염의 증상을 치료 및/또는 완화하는 방법이 제공된다.
일부 측면에서, 대상체는 암으로 진단되었거나 또는 암이 발병할 위험이 있다. 대상체는 인간, 개, 고양이, 말 또는 종양 특이적 면역 반응이 바람직한 임의의 동물일 수 있다. 종양은 유방, 난소, 전립선, 폐, 신장, 위, 결장, 고환, 두경부, 뇌, 흑색종, 및 조직 기관의 다른 종양과 같은 임의의 고형 종양 및 급성 골수성 백혈병, 만성 골수성 백혈병, 만성 림프구성 백혈병, T 세포 림프구성 백혈병, 및 B 세포 림프종을 포함하는 림프종 및 백혈병과 같은 혈액 종양일 수 있다.
일부 측면에서, 대상체는 감염으로 진단되었거나 또는 감염의 연령, 지리적/여행, 및/또는 작업-관련 증가된 위험 또는 이에 대한 경향과 같은 감염의 위험, 또는 계절적 및/또는 신규 질환 감염에 대한 위험이 있다.
항원은 CTL 반응을 자극하기에 충분한 양으로 투여될 수 있다. 항원은 T 세포 반응을 자극하기에 충분한 양으로 투여될 수 있다. 항원은 B 세포 반응을 자극하기에 충분한 양으로 투여될 수 있다.
항원은 단독으로 또는 다른 치료제와 조합하여 투여될 수 있다. 치료제는 항-바이러스제 또는 항생제와 같은 감염성 질환 유기체를 치료하는 것들을 포함할 수 있다.
게다가, 대상체는 체크포인트 억제제와 같은 항-면역억제제/면역자극제를 추가로 투여받을 수 있다. 예를 들어, 대상체는 항-CTLA 항체 또는 항-PD-1 또는 항-PD-L1을 추가로 투여받을 수 있다. 항체에 의한 CTLA-4 또는 PD-L1의 차단은 환자에서 암성 세포에 대한 면역 반응을 향상시킬 수 있다. 특히, CTLA-4 차단은 백신접종 프로토콜을 따를 때 효과적인 것으로 보였다.
백신 조성물에 포함될 각각의 항원의 최적량 및 최적 투약 레지멘이 결정될 수 있다. 예를 들어, 항원 또는 이의 변이체는 정맥내(i.v.) 주사, 피하(s.c.) 주사, 피내(i.d.) 주사, 복강내(i.p.) 주사, 근육내(i.m.) 주사를 위해 제조될 수 있다. 주사 방법은 s.c., i.d., i.p., i.m., 및 i.v.를 포함한다. DNA 또는 RNA 주사 방법은 i.d., i.m., s.c., i.p. 및 i.v.를 포함한다. 백신 조성물의 다른 투여 방법이 당업자에게 알려져 있다.
백신은 조성물에 존재하는 항원의 선택, 수 및/또는 양이 조직, 암, 감염성 질환, 및/또는 환자-특이적이도록 편집될 수 있다. 예를 들면, 펩티드의 정확한 선택은 주어진 조직에서 모 단백질의 발현 패턴에 의해 가이드되거나 또는 환자의 돌연변이 또는 질환 상태에 의해 가이드될 수 있다. 선택은 특이적 유형의 암, 특이적 감염성 질환(예를 들어 대상체가 감염되거나 감염 위험이 있는 특이적 감염성 질환 단리물/균주), 질환 상태, 백신접종의 목표(예를 들어, 진행중인 질환을 예방 또는 표적화), 조기 치료 레지멘, 환자의 면역 상태, 및, 물론, 환자의 HLA-일배체형에 따라 달라질 수 있다. 또한, 백신은 특정 환자의 개인적 필요에 따라 개인화된 구성요소를 함유할 수 있다. 예는 특정 환자에서 항원의 발현에 따라 항원의 선택을 변경하거나 또는 1차 치료 또는 치료 체계 후 2차 치료에 대한 조정을 포함한다.
환자는 다양한 진단 방법, 예를 들어, 하기에 추가로 기재된 환자 선택 방법의 사용하여 항원 백신의 투여를 위해 식별될 수 있다. 환자 선택은 하나 이상의 유전자에서 돌연변이, 또는 이의 발현 패턴을 식별하는 것을 수반할 수 있다. 환자 선택은 진행중인 감염의 감염성 질환을 식별하는 것을 수반할 수 있다. 환자 선택은 감염성 질환에 의한 감염 위험을 식별하는 것을 수반할 수 있다. 일부 경우에, 환자 선택은 환자의 일배체형을 식별하는 것을 수반한다. 다양한 환자 선택 방법은 동시에 수행될 수 있으며, 예를 들어, 서열분석 진단은 환자의 돌연변이 및 일배체형 둘 다를 식별할 수 있다. 다양한 환자 선택 방법은 순차적으로 수행될 수 있으며, 예를 들어, 하나의 진단 테스트는 돌연변이를 식별하고 별도의 진단 테스트는 환자의 일배체형을 식별하고, 여기서 각각의 테스트는 동일한(예를 들어, 둘 다 고처리량 서열분석) 또는 상이한(예를 들어, 하나는 고처리량 서열분석이고 다른 것은 Sanger 서열분석) 진단 방법일 수 있다.
암 또는 감염성 질환에 대한 백신으로서 사용될 조성물의 경우, 정상 조직에서 다량으로 발현되는 유사한 정상 자기-펩티드를 갖는 항원은 피할 수 있거나 또는 본원에 기재된 조성물에 소량으로 존재할 수 있다. 반면에, 환자의 종양 또는 감염된 세포가 다량의 특정 항원을 발현하는 것으로 알려진 경우, 이 암 또는 감염의 치료를 위한 각각의 약제학적 조성물은 다량으로 존재할 수 있고/있거나 특히 이 항원 또는 이 항원의 경로에 특이적인 하나 초과의 항원이 포함될 수 있다.
항원을 포함하는 조성물은 이미 암 또는 감염을 앓고 있는 개체에게 투여될 수 있다. 치료 적용에서, 조성물은 종양 항원 또는 감염성 질환 유기체 항원에 대한 효과적인 CTL 반응을 자극하고 증상 및/또는 합병증을 치유하거나 또는 적어도 부분적으로 저지하기에 충분한 양으로 환자에게 투여된다. 이를 달성하기에 적절한 양은 "치료적 유효량"으로 정의된다. 이 용도에 효과적인 양은 예를 들어, 조성물, 투여 방식, 치료되는 질환의 단계 및 중증도, 환자의 체중 및 일반 건강 상태, 및 참여 의사의 판단에 따라 달라질 것이다. 조성물이 일반적으로 심각한 질환 상태, 즉, 생명을 위협하거나 또는 잠재적으로 생명을 위협하는 상황에서, 특히 암이 전이되었거나 또는 감염성 질환 유기체가 기관 손상 및/또는 다른 면역 병리를 유도했을 때 이용될 수 있음을 염두해 주어야 한다. 이러한 경우에, 외부 물질의 최소화 및 항원의 상대적 무독성 속성의 관점에서, 치료 의사는 이러한 조성물을 실질적인 과량으로 투여하는 것이 가능하고 바람직하게 느낄 수 있다.
치료적 용도를 위해, 투여는 종양의 검출 또는 외과적 제거 시 시작하거나, 또는 감염의 검출 또는 치료 시 시작할 수 있다. 이는 적어도 증상이 실질적으로 약화될 때까지 그리고 이후 기간 동안, 또는 면역이 제공되는 것으로 간주될 때까지(예를 들어, 기억 B 세포 또는 T 세포 집단, 또는 항원 특이적 B 세포 또는 항체가 생산됨) 부스팅 용량이 뒷따를 수 있다.
치료적 치료를 위한 약제학적 조성물(예를 들어, 백신 조성물)은 비경구, 국소, 비강, 경구 또는 국부 투여를 위해 의도된다. 약제학적 조성물은 비경구로, 예를 들어, 정맥내, 피하, 피내, 또는 근육내로 투여될 수 있다. 조성물은 종양에 대한 국부 면역 반응을 자극하기 위해 외과적 절제 부위에 투여될 수 있다. 조성물은 대상체의 특이적 감염된 조직 및/또는 세포를 표적하기 위해 투여될 수 있다. 본원에는 항원의 용액을 포함하는 비경구 투여를 위한 조성물이 개시되고 백신 조성물은 허용되는 담체, 예를 들어, 수성 담체에 용해되거나 또는 현탁된다. 다양한 수성 담체, 예를 들어, 물, 완충수, 0.9% 식염수, 0.3% 글리신, 히알루론산 등이 사용될 수 있다. 이러한 조성물은 통상적인 잘 알려진 멸균화 기술에 의해 멸균될 수 있거나, 또는 멸균 여과될 수 있다. 생성된 수용액은 그대로 사용하기 위해 포장되거나, 또는 동결건조될 수 있으며, 동결건조된 제제는 투여 전에 멸균 용액과 조합된다. 조성물은 pH 조절제 및 완충제, 등장성 조절제, 습윤제 등, 예를 들어, 나트륨 아세테이트, 나트륨 락테이트, 나트륨 클로라이드, 칼륨 클로라이드, 칼슘 클로라이드, 소르비탄 모노라우레이트, 트리에탄올아민 올레에이트 등과 같은, 대략적인 생리학적 조건에 필요한 약제학적으로 허용되는 보조 물질을 함유할 수 있다.
항원은 또한 림프 조직과 같은 특정 세포 조직을 표적하는 리포솜을 통해 투여될 수 있다. 리포솜은 또한 반감기를 증가시키는 데 유용하다. 리포솜은 에멀젼, 폼, 미셸(micelle), 불용성 단층, 액정, 인지질 분산액, 라멜라 층 등을 포함한다. 이러한 제제에서 전달될 항원은 단독으로 또는, 예를 들어, CD45 항원에 결합하는 단클론 항체와 같은 림프계 세포 중에 널리 퍼져 있는 수용체에 결합하는 분자, 또는 다른 치료적 또는 면역원성 조성물과 함께 리포솜의 일부로서 혼입된다. 따라서, 원하는 항원으로 채워진 리포솜은 림프계 세포의 부위에 대해 지시될 수 있으며, 여기서 이어서 리포솜은 선택된 치료적/면역원성 조성물을 전달한다. 리포솜은 일반적으로 중성 및 음으로 하전된 인지질 및 콜레스테롤과 같은 스테롤을 포함하는 표준 소포-형성 지질로부터 형성될 수 있다. 지질의 선택은 일반적으로 예를 들어, 리포솜 크기, 혈류 내 리포솜의 산 불안정성 및 안정성을 고려하여 가이드된다. 예를 들어, Szoka 등, Ann. Rev. Biophys. Bioeng. 9; 467 (1980), 미국 특허 번호 4,235,871, 4,501,728, 4,501,728, 4,837,028, 및 5,019,369에 기재된 바와 같이 리포솜을 제조하기 위한 다양한 방법이 이용가능하다.
면역 세포에 대한 표적화를 위해, 리포솜에 혼입될 리간드는 예를 들어, 원하는 면역계 세포의 세포 표면 결정기에 특이적인 항체 또는 이의 단편을 포함할 수 있다. 리포솜 현탁액은 그 중에서도, 투여 방식, 전달되는 펩티드, 및 치료되는 질환의 상태에 따라 달라지는 용량으로 정맥내, 국부, 국소 등으로 투여될 수 있다.
치료적 또는 면역화 목적을 위해, 펩티드를 암호화하는 핵산 및 임의적으로 본원에 기재된 펩티드 중 하나 이상이 또한 환자에게 투여될 수 있다. 환자에게 핵산을 전달하기 위해 다수의 방법이 편리하게 사용된다. 예를 들면, 핵산은 "네이키드 DNA"로서 직접적으로 전달될 수 있다. 이 접근법은 예를 들면, Wolff 등, Science 247: 1465-1468 (1990) 뿐만 아니라 미국 특허 번호 5,580,859 및 5,589,466에 기재되어 있다. 핵산은 또한 예를 들면, 미국 특허 번호 5,204,253에 기재된 바와 같은 탄도 전달을 사용하여 투여될 수 있다. DNA로만 구성된 입자가 투여될 수 있다. 대안적으로, DNA는 금 입자와 같은 입자에 부착될 수 있다. 핵산 서열을 전달하기 위한 접근법은 전기천공이 있거나 없이 바이러스 벡터, mRNA 벡터, 및 DNA 벡터를 포함할 수 있다.
핵산은 또한 양이온성 지질과 같은 양이온성 화합물에 착화되어 전달될 수 있다. 지질-매개 유전자 전달 방법은, 예를 들면, 9618372WOAWO 96/18372; 9324640WOAWO 93/24640; Mannino & Gould-Fogerite, BioTechniques 6(7): 682-691 (1988); 미국 특허 번호 5,279,833 Rose 미국 특허 번호 5,279,833; 9106309WOAWO 91/06309; 및 Felgner 등, Proc. Natl. Acad. Sci. USA 84: 7413-7414 (1987)에 기재되어 있다.
항원은 또한 백시니아, 계두, 자기-복제 알파바이러스, 마라바바이러스, 아데노바이러스(예를 들어, Tatsis 등, Adenoviruses, Molecular Therapy (2004) 10, 616-629 참조), 또는 제2, 제3 또는 하이브리드 제2/제3 세대 렌티바이러스 및 특이적 세포 유형 또는 수용체를 표적하도록 설계된 임의의 세대의 재조합 렌티바이러스를 포함하나 이에 제한되지 않는 렌티바이러스(예를 들어, Hu 등, Immunization Delivered by Lentiviral Vectors for Cancer and Infectious Diseases, Immunol Rev. (2011) 239(1): 45-61, Sakuma 등, Lentiviral vectors: basic to translational, Biochem J. (2012) 443(3):603-18, Cooper 등, Rescue of splicing-mediated intron loss maximizes expression in lentiviral vectors containing the human ubiquitin C promoter, Nucl. Acids Res. (2015) 43 (1): 682-690, Zufferey 등, Self-Inactivating Lentivirus Vector for Safe and Efficient In Vivo Gene Delivery, J. Virol. (1998) 72 (12): 9873-9880 참조)와 같은 바이러스 벡터-기반 백신 플랫폼에 포함될 수 있다. 상기 언급된 바이러스 벡터-기반 백신 플랫폼의 패키징 용량에 따라, 이 접근법은 하나 이상의 항원 펩티드를 암호화하는 하나 이상의 뉴클레오티드 서열을 전달할 수 있다. 서열은 돌연변이되지 않은 서열 옆에 있을 수 있거나, 링커에 의해 분리될 수 있거나 또는 세포하 구획을 표적화하는 하나 이상의 서열이 선행될 수 있다(예를 들어, Gros 등, Prospective identification of neoantigen-specific lymphocytes in the peripheral blood of melanoma patients, Nat Med. (2016) 22 (4):433-8, Stronen 등, Targeting of cancer neoantigens with donor-derived T cell receptor repertoires, Science. (2016) 352 (6291):1337-41, Lu 등, Efficient identification of mutated cancer antigens recognized by T cells associated with durable tumor regressions, Clin Cancer Res. (2014) 20( 13):3401-10 참조). 숙주로 도입 시, 감염된 세포는 항원을 발현하여, 펩티드(들)에 대한 숙주 면역(예를 들어, CTL) 반응을 자극한다. 면역화 프로토콜에 유용한 백시니아 벡터 및 방법은 예를 들어, 미국 특허 번호 4,722,848에 기재되어 있다. 또 다른 벡터는 BCG(바실리 칼메트 게랑)이다. BCG 벡터는 Stover 등 (Nature 351:456-460 (1991))에 기재되어 있다. 항원의 치료적 투여 또는 면역화에 유용한 매우 다양한 다른 백신 벡터, 예를 들어, 살모넬라 티피 벡터 등이 본원의 설명으로부터 당업자에게 자명할 것이다.
핵산을 투여하는 수단은 하나 또는 다중 에피토프를 암호화하는 미니유전자 작제물을 사용한다. 인간 세포에서 발현을 위해 선택된 CTL 에피토프(미니유전자)를 암호화하는 DNA 서열을 생성하기 위해, 에피토프의 아미노산 서열은 역번역된다. 인간 코돈 용법 표는 각 아미노산에 대한 코돈 선택을 가이드하기 위해 사용된다. 이러한 에피토프-암호화 DNA 서열은 직접적으로 연결되어, 연속 폴리펩티드 서열을 생성한다. 발현 및/또는 면역원성을 최적화하기 위해, 추가의 요소가 미니유전자 설계에 혼입될 수 있다. 역번역될 수 있고 미니유전자 서열에 포함되는 아미노산 서열의 예는 헬퍼 T 림프구, 에피토프, 리더(신호) 서열, 및 소포체 잔류 신호를 포함한다. 게다가, CTL 에피토프의 MHC 제시는 CTL 에피토프에 인접한 합성(예를 들어 폴리-알라닌) 또는 자연 발생 측면 서열을 포함함으로써 개선될 수 있다. 미니유전자 서열은 미니유전자의 플러스 및 마이너스 가닥을 암호화하는 올리고뉴클레오티드를 조립함으로써 DNA로 전환된다. 중첩 올리고뉴클레오티드(30-100개 염기 길이)는 잘 알려진 기술을 사용하여 적절한 조건 하에 합성, 인산화, 정제 및 어닐링된다. 올리고뉴클레오티드의 단부는 T4 DNA 리가제를 사용하여 연결된다. 그런 다음 CTL 에피토프 폴리펩티드를 암호화하는 이 합성 미니유전자는 원하는 발현 벡터로 클로닝될 수 있다.
정제된 플라스미드 DNA는 다양한 제형을 사용하여 주사를 위해 제조될 수 있다. 이 중 가장 간단한 것은 멸균 포스페이트-완충 식염수(PBS)에서 동결건조된 DNA의 재구성이다. 다양한 방법이 기재되었고, 새로운 기술이 이용가능하게 될 수 있다. 상기 언급된 바와 같이, 핵산은 양이온성 지질로 편리하게 제형화된다. 게다가, 종합적으로 보호성 상호작용 비응축(PINC)으로 지칭되는 당지질, 융합생성 리포솜, 펩티드 및 화합물이 또한 정제된 플라스미드 DNA에 착화되어 안정성, 근육내 분산, 또는 특이적 기관 또는 세포 유형에 대한 교류와 같은 변수에 영향을 미칠 수 있다.
또한 본원에 개시된 방법의 단계를 수행하는 단계; 및 복수의 항원 또는 복수의 항원의 서브세트를 포함하는 백신을 생산하는 단계를 포함하는, 백신을 제조하는 방법이 개시된다.
본원에 개시된 항원은 당업계에 알려진 방법을 사용하여 제조될 수 있다. 예를 들어, 본원에 개시된 항원 또는 벡터(예를 들어, 하나 이상의 항원을 암호화하는 적어도 하나의 서열을 포함하는 벡터)를 생산하는 방법은 항원 또는 벡터를 발현하기에 적합한 조건 하에 숙주 세포를 배양하는 단계로, 상기 숙주 세포는 항원 또는 벡터를 암호화하는 적어도 하나의 폴리뉴클레오티드를 포함하는 것인, 단계, 및 항원 또는 벡터를 정제하는 단계를 포함할 수 있다. 표준 정제 방법은 크로마토그래픽 기술, 전기영동, 면역학, 침전, 투석, 여과, 농축, 및 크로마토포커싱 기술을 포함한다.
숙주 세포는 중국 햄스터 난소(CHO) 세포, NS0 세포, 효모, 또는 HEK293 세포를 포함할 수 있다. 숙주 세포는 본원에 개시된 항원 또는 벡터를 암호화하는 적어도 하나의 핵산 서열을 포함하는 하나 이상의 폴리뉴클레오티드로 형질전환될 수 있으며, 임의적으로 상기 단리된 폴리뉴클레오티드는 항원 또는 벡터를 암호화하는 적어도 하나의 핵산 서열에 작동가능하게 연결된 프로모터 서열을 추가로 포함한다. 특정 구현예에서 단리된 폴리뉴클레오티드는 cDNA일 수 있다.
항원 사용 및 투여
백신접종 프로토콜은 하나 이상의 항원을 대상체에게 투여하기 위해 사용될 수 있다. 프라이밍 백신 및 부스팅 백신은 대상체에게 투여하기 위해 사용될 수 있다.
프라이밍 백신은 SAM 벡터가 유래된 자기-복제 바이러스의 내인성 5' 서열을 갖는 SAM(예를 들어, "AU-SAM"으로도 지칭되는 내인성 5' VEEV 뉴클레오티드 AU)을 갖는 본원에 기재된 SAM 백신 조성물에 기반할 수 있다.
부스팅 백신(2개 이상의 부스팅 투여 포함)은 SAM 벡터가 유래된 자기-복제 바이러스의 내인성 5' 서열을 갖는 SAM(예를 들어, "AU-SAM"로도 지칭되는 내인성 5' VEEV 뉴클레오티드 AU)을 갖는 본원에 기재된 SAM 백신 조성물에 기반할 수 있다.
백신접종 프로토콜은 SAM 벡터가 유래된 자기-복제 바이러스의 내인성 5' 서열을 갖는 SAM(예를 들어, "AU-SAM"으로도 지칭되는 내인성 5' VEEV 뉴클레오티드 AU)을 갖는 본원에 기재된 SAM 백신 조성물에 기반한 프라이밍 백신 및 부스팅 백신 둘 다를 포함할 수 있다.
내인성 5' 서열을 갖는 SAM과 조합하여 사용하기 위한 것을 포함하는 프라이밍 백신은 또한 C68(예를 들어, 서열번호: 1 또는 2에 제시된 서열) 또는 SAM(예를 들어, 서열번호: 3 또는 4에 제시된 서열)에 기반할 수 있다. 내인성 5' 서열을 갖는 SAM과 조합하여 사용하는 것을 포함하는 부스팅 백신은 또한 C68(예를 들어, 서열번호: 1 또는 2에 제시된 서열) 또는 SAM (예를 들어, 서열번호: 3 또는 4에 제시된 서열)에 기반할 수 있다.
프라임/부스트 전략에서 각각의 벡터는 전형적으로 항원을 포함하는 카세트를 포함한다. 카세트는 정상적으로 각각의 항원을 둘러싸는 천연 서열과 같은 스페이서 또는 AAY와 같은 비천연 스페이서 서열에 의해 분리된 약 1-50개의 항원을 포함할 수 있다. 카세트는 또한 파상풍 톡소이드 항원 및 PADRE 항원과 같은 MHCII 항원을 포함할 수 있으며, 이는 범용 클래스 II 항원으로 간주될 수 있다. 카세트는 또한 유비퀴틴 표적화 서열과 같은 표적화 서열을 포함할 수 있다. 게다가, 각각의 백신 용량은 면역 조절제와 함께(예를 들어, 동시에, 전에, 또는 후에) 대상체에게 투여될 수 있다. 각각의 백신 용량은 체크포인트 억제제(CPI)와 함께(예를 들어, 동시에, 전에, 또는 후에) 대상체에게 투여될 수 있다. CPI는 항체 또는 이의 항원-결합 부분과 같은 CTLA4, PD1, 및/또는 PDL1을 억제하는 것들을 포함할 수 있다. 이러한 항체는 트레멜리무맙 또는 두르발루맙을 포함할 수 있다. 각각의 백신 용량은 IL-2, IL-7, IL-12(IL-12 p35, p40, p70, 및/또는 p70-융합 작제물 포함), IL-15, 또는 IL-21과 같은 사이토카인과 함께(예를 들어, 동시에, 전에, 또는 후에) 대상체에게 투여될 수 있다. 각각의 백신 용량은 변형된 사이토카인(예를 들어, pegIL-2)과 함께(예를 들어, 동시에, 전에, 또는 후에) 대상체에게 투여될 수 있다.
프라이밍 백신은 대상체에 주사(예를 들어, 근육내)될 수 있다. 용량 당 양측 주사가 사용될 수 있다. 예를 들어, ChAdV68(C68)의 하나 이상의 주사가 사용될 수 있거나(예를 들어, 총 용량 1x1012 바이러스 입자); 0.001 내지 1 ug RNA, 특히 0.1 또는 1 ug 범위로부터 선택된 낮은 백신 용량의 SAM 벡터의 하나 이상의 주사가 사용될 수 있거나; 또는 1 내지 100 ug RNA, 특히 10 또는 100 ug 범위로부터 선택된 높은 백신 용량의 SAM 벡터의 하나 이상의 주사가 사용될 수 있다.
백신 부스트(부스팅 백신)는 프라임 백신접종 후 주사(예를 들어, 근육내)될 수 있다. 부스팅 백신은 프라임 후 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10주마다, 예를 들어, 4주 및/또는 8주마다 투여될 수 있다. 용량 당 양측 주사가 사용될 수 있다. 예를 들어, ChAdV68(C68)의 하나 이상의 주사가 사용될 수 있거나(예를 들어, 총 용량 1x1012 바이러스 입자); 0.001 내지 1 ug RNA, 특히 0.1 또는 1 ug 범위로부터 선택된 낮은 백신 용량의 SAM 벡터의 하나 이상의 주사가 사용될 수 있거나; 또는 1 내지 100 ug RNA, 특히 10 또는 100 ug 범위로부터 선택된 높은 백신 용량의 SAM 벡터의 하나 이상의 주사가 사용될 수 있다.
항-CTLA-4(예를 들어, 트레멜리무맙)가 또한 대상체에게 투여될 수 있다. 예를 들어, 항-CTLA4는 근육내 백신 주사(ChAdV68 프라임 또는 SAM 저용량) 부위 근처에 피하로 투여되어 동일한 림프절로 배출되게 할 수 있다. 트레멜리무맙은 CTLA-4의 선택적 인간 IgG2 mAb 억제제이다. 표적 항-CTLA-4(트레멜리무맙) 피하 용량은 전형적으로 70-75 mg(특히 75 mg)이며, 용량 범위는 예를 들어, 1-100 mg 또는 5-420 mg이다.
특정 경우에 두르발루맙(MEDI 4736)과 같은 항-PD-L1 항체가 사용될 수 있다. 두르발루맙은 PD-1 및 CD80에 결합하는 PD-L1을 차단하는 선택적 고친화성 인간 IgG1 mAb이다. 두르발루맙은 일반적으로 4주마다 20 mg/kg i.v.로 투여된다.
면역 모니터링은 백신 투여 전에, 동안, 및/또는 후에 수행될 수 있다. 이러한 모니터링은 다른 매개변수 중에서 안전성 및 효능을 알릴 수 있다.
면역 모니터링을 수행하기 위해, PBMC가 통상적으로 사용된다. PBMC는 프라임 백신접종 전, 및 프라임 백신접종 후(예를 들어 4주 및 8주)에 단리될 수 있다. PBMC는 부스트 백신접종 직전 및 부스트 백신접종 후(예를 들어 4주 및 8주)에 수확될 수 있다.
T 세포 반응 및 B 세포 반응과 같은 면역 반응은 면역 모니터링 프로토콜의 일부로서 평가될 수 있다. 예를 들어, 면역 반응을 자극하는 본원에 기재된 백신 조성물의 능력은 모니터링 및/또는 평가될 수 있다. 본원에 사용된 바와 같이, "면역 반응을 자극하다"는 면역 반응의 개시(예를 들어, 미처리 대상체에서 면역 반응의 개시를 자극하는 프라이밍 백신) 또는 면역 반응의 향상(예를 들어, 프라이밍 백신에 의해 개시된 기존 면역 반응과 같은, 항원에 대한 기존 면역 반응을 갖는 대상체에서 면역 반응의 향상을 자극하는 부스팅 백신)과 같이, 면역 반응에서의 임의의 증가를 지칭한다. T 세포 반응은 ELISpot, 세포내 사이토카인 염색, 사이토카인 분비 및 세포 표면 포획, T 세포 증식, MHC 다량체 염색, 또는 세포독성 검정과 같은 당업계에 알려진 하나 이상의 방법을 사용하여 측정될 수 있다. 백신에서 암호화된 에피토프에 대한 T 세포 반응은 ELISpot 검정을 사용하여, IFN-감마와 같은 사이토카인의 유도를 측정함으로써 PBMC로부터 모니터링될 수 있다. 백신에서 암호화된 에피토프에 대한 특이적 CD4 또는 CD8 T 세포 반응은 유세포 분석을 사용하여, IFN-감마와 같은 세포내로 또는 세포외로 포획된 사이토카인의 유도를 측정함으로써 PBMC로부터 모니터링될 수 있다. 백신에서 암호화된 에피토프에 대한 특이적 CD4 또는 CD8 T 세포 반응은 MHC 다량체 염색을 사용하여 에피토프/MHC 클래스 I 복합체에 특이적인 T 세포 수용체를 발현하는 T 세포 집단을 측정함으로써 PBMC로부터 모니터링될 수 있다. 백신에서 암호화된 에피토프에 대한 특이적 CD4 또는 CD8 T 세포 반응은 3H-티미딘, 브로모데옥시우리딘 및 카르복시플루오레세인-디아세테이트-숙신이미딜에스테르(CFSE) 혼입 후 T 세포 집단의 생체외 확장을 측정함으로써 PBMC로부터 모니터링될 수 있다. 백신에서 암호화된 에피토프에 특이적인 PBMC-유래 T 세포의 항원 인식 능력 및 용해 활성은 크로늄 방출 검정 또는 대체 비색 세포독성 검정에 의해 기능적으로 평가될 수 있다.
B 세포 반응은 B 세포 분화(예를 들어, 형질 세포로의 분화), B 세포 또는 형질 세포 증식, B 세포 또는 형질 세포 활성화(예를 들어, CD80 또는 CD86과 같은 동시 자극 마커의 상향조절), 항체 클래스 전환, 및/또는 항체 생산(예를 들어, ELISA)을 결정하는 데 사용되는 검정과 같은 당업계에 알려진 하나 이상의 방법을 사용하여 측정될 수 있다. 항체는 또한 중화 능력에 대해 평가된 것과 같이 기능에 대해 평가될 수 있다.
예시
본원에 기재된 본 개시내용이 보다 완전히 이해될 수 있도록 하기 위해, 하기 실시예가 제시된다. 본 출원에 기재된 합성 및 생물학적 실시예는 본원에 제공된 화합물, 약제학적 조성물, 및 방법을 예시하기 위해 제공되며 어떤 식으로든 그들의 범위를 제한하려는 것으로 해석되어서는 안 된다.
재료 및 방법
본원에 제공된 화합물은 하기 일반적인 방법 및 절차를 사용하여 용이하게 이용가능한 출발 물질로부터 제조될 수 있다. 전형적 또는 바람직한 과정 조건(즉, 반응 온도, 시간, 반응물의 몰비, 용매, 압력 등)이 주어지는 경우, 달리 언급되지 않는 한 다른 과정 조건이 또한 사용될 수 있음이 이해될 것이다. 최적의 반응 조건은 특정 반응물 또는 사용되는 용매에 따라 달라질 수 있지만, 이러한 조건은 일상적인 최적화에 의해 당업자에 의해 결정될 수 있다.
추가로, 당업자에게 자명한 바와 같이, 통상적인 보호기는 특정 작용기가 원치않은 반응을 겪는 것을 방지하기 위해 필요할 수 있다. 특정 작용기에 대한 적합한 보호기 뿐만 아니라 보호 및 탈보호를 위한 적합한 조건의 선택은 당업계에 잘 알려져 있다. 예를 들어, 수많은 보호기, 및 그들의 도입 및 제거는 T. W. Greene 및 P. G. M. Wuts, Protecting Groups in Organic Synthesis, Second Edition, Wiley, New York, 1991, 및 그 안에 인용된 참고문헌에 기재되어 있다.
본원에 제공된 화합물은 알려진 표준 절차에 의해 단리 및 정제될 수 있다. 이러한 절차는 분쇄, 칼럼 크로마토그래피, HPLC, 또는 초임계 유체 크로마토그래피(SFC)를 포함한다(그러나 이에 제한되지 않는다). 하기 반응식은 본원에 나열된 대표적인 옥시스테롤의 제조에 관한 세부사항과 함께 제시된다. 본원에 제공된 화합물은 유기 합성 분야의 숙련자에 의해 알려지거나 또는 상업적으로 입수가능한 출발 물질 및 시약으로 제조될 수 있다. 본원에 제공된 거울상이성질체/부분입체이성질체의 분리/정제에 사용하기 위해 이용가능한 예시적인 키랄 칼럼은 ChiralPak® AD-10, CHIRALCEL® OB, CHIRALCEL® OB-H, CHIRALCEL® OD, CHIRALCEL® OD-H, CHIRALCEL® OF, CHIRALCEL® OG, CHIRALCEL® OJ 및 CHIRALCEL® OK를 포함하나 이에 제한되지 않는다.
약어:
PE: 석유 에테르; EtOAc: 에틸 아세테이트; THF: 테트라하이드로푸란; PCC: 피리디늄 클로로크로메이트; TLC: 박층 크로마토그래피; PCC: 피리디늄 클로로크로메이트; t-BuOK: 칼륨 tert-부톡사이드; 9-BBN: 9-보라비사이클로[3.3.1]노난; Pd(t-Bu3P)2: 비스(트리-tert-부틸포스핀)팔라듐(0); AcCl: 아세틸 클로라이드; i-PrMgCl: 이소프로필마그네슘 클로라이드; TBSCl: tert-부틸(클로로)디메틸실란; (i-PrO)4Ti: 티타늄 테트라이소프로폭시드; BHT: 2,6-디-t-부틸-4-메틸페녹사이드; Me: 메틸; i-Pr: 이소-프로필; t-Bu: tert-부틸; Ph: 페닐; Et: 에틸; Bz: 벤조일; BzCl: 벤조일 클로라이드; CsF: 세슘 플루오라이드; DAST: 디에틸아미노황 트리플루오라이드; DCC: 디사이클로헥실카르보디이미드; DCM: 디클로로메탄; DMAP: 4-디메틸아미노피리딘; DMP: 데스-마틴 페리오디난; EtMgBr: 에틸마그네슘 브로마이드; EtOAc: 에틸 아세테이트; TEA: 트리에틸아민; AlaOH: 알라닌; Boc: t-부톡시카르보닐. Py: 피리딘; TBAF: 테트라-n-부틸암모늄 플루오라이드; THF: 테트라하이드로푸란; TBS: t-부틸디메틸실릴; TMS: 트리메틸실릴; TMSCF3: (트리플루오로메틸)트리메틸실란; Ts: p-톨루엔술포닐; Bu: 부틸; Ti(OiPr)4: 테트라이소프로폭시티타늄; LAH: 리튬 알루미늄 하이드라이드; LDA: 리튬 디이소프로필아미드; LiOH.H2O: 리튬 하이드록사이드 수화물; MAD: 메틸 알루미늄 비스(2,6-디-t-부틸-4-메틸페녹사이드); MeCN: 아세토니트릴; NBS: N-브로모숙신이미드; Na2SO4: 나트륨 술페이트; Na2S2O3: 나트륨 티오술페이트; PE: 석유 에테르; MeCN: 아세토니트릴; MeOH: 메탄올; Boc: t-부톡시카르보닐; DMT: 4,4'-디메톡시트리틸; MTBE: 메틸 tert-부틸 에테르; K-셀릭트라이드: 칼륨 트리(s-부틸)보로하이드라이드.
실시예 1. 2'-플루오로 뉴클레오티드(7)의 합성
당업자는 2'-플루오로 뉴클레오티드(6)이 일반 반응식 I 등에 요약된 합성 단계를 통해 제조될 수 있음을 이해할 것이다.
일반 합성 반응식 I
뉴클레오티드(5)의 1차 알코올의 선택된 DMT 보호는 DMT-Cl을 사용하여 달성되어 4,4'-디메톡시트리틸-보호된 뉴클레오티드(6)을 수득할 수 있다. DAST에 후속 노출은 2'-플루오로 뉴클레오티드(7)을 제공할 수 있다.
실시예 2. 2'-메톡시에틸-뉴클레오티드(10)의 합성
당업자는 2'-메톡시에틸-뉴클레오티드(10)이 일반 반응식 II 등에 요약된 합성 단계를 통해 제조될 수 있음을 이해할 것이다.
일반 합성 반응식 II
뉴클레오티드(5)는 이미다졸 및 1,1 비스(비스(디-이소프로필)클로로실릴)메탄과 반응하여 탈보호된 뉴클레오티드(8)을 형성할 수 있다. 8을 NaHMDS 및 MeOCH2CH2Br에 노출시켜 보호된 2'-메톡시에틸-뉴클레오티드(8)을 제공할 것이다. TBAF를 사용하여 뉴클레오티드(9)를 탈보호하여 2'-메톡시에틸-뉴클레오티드(10)을 수득할 수 있다.
실시예 3. 2'-트리플루오로메틸-뉴클레오티드(16)의 합성
당업자는 2' 트리플루오로메틸 뉴클레오티드(16)이 일반 반응식 III 등에 요약된 합성 단계를 통해 제조될 수 있음을 이해할 것이다. 예를 들어, 이 뉴클레오티드의 합성은 Jeannot, F., 등 "Synthesis and antiviral evaluation of 2'-deoxy-2'-C-trifluoromethyl-β-D-ribonucleoside analogues bearing the five naturally occurring nucleic bases" Org. Biomol. Chem., 2003, 1, 2096-2102에 요약된 단계를 사용하여 복제될 수 있다.
일반 합성 반응식 III
DMP를 사용한 4-Cl-벤질-보호된 뉴클레오티드(11)의 산화 및 CF3SiMe3으로의 후속 처리는 3-트리플루오로메틸 뉴클레오티드(12)를 제공할 수 있다. 환원 탈보호 이어서 BzCl을 사용한 재보호는 벤조일-보호된 뉴클레오티드(13)을 초래할 수 있다. 라디칼-매개 탈산소화는 벤조일-보호된 데옥시-뉴클레오티드(14)를 수득할 수 있다. 메톡시 모이어티의 대체는 아세트산 및 아세트산 무수물에 노출시켜 달성될 수 있다. Jeannot 등에 기재된 조건을 사용하여 1'-아세테이트 뉴클레오티드(15)의 다양한 뉴클레오티드 유사체(16)으로의 전환이 달성될 수 있다.
반응식 4. 2',3' 디아세테이트 뉴클레오티드(19)의 합성
당업자는 2',3' 디아세테이트 뉴클레오티드(19)가 일반 반응식 III 등에 요약된 합성 단계를 통해 제조될 수 있음을 이해할 것이다.
일반 합성 반응식 IV
DMT-보호된 뉴클레오티드(17)(실시예 1 참조)을 아세트산 무수물(Ac2O) 및 N-메틸 이미다졸(NMI)로 처리하여 디아세테이트(18)을 생산할 수 있다. 디아세테이트(18)을 산으로 탈보호한 후 2-시아노에틸 N,N,N',N'-테트라이소프로필포스포로디아미다이트와 후속 반응시켜 2',3' 디아세테이트 뉴클레오티드(19)를 제공할 수 있다.
실시예 5. 화학식 (I-1)의 화합물의 합성
당업자는 화학식 (I-1)의 화합물이 일반 반응식 V 등에 요약된 합성 단계를 통해 제조될 수 있음을 이해할 것이다.
일반 합성 반응식 V
구체적으로, 화합물 포스폰아미다이트(19)를 적합한 조건 하에 보호된 뉴클레오티드(20)과 반응시켜 디뉴클레오티드(21)을 수득할 수 있다. 4,4'-디메톡시트리틸 디뉴클레오티드(21)의 탈보호는 양자성 산에 노출시켜 달성되어, 디뉴클레오티드(22)를 수득할 수 있다. 하이드록시 디뉴클레오티드(22)를 2-시아노에틸 N,N,N',N'-테트라이소프로필포스포로디아미다이트로 처리하여 2-시아노에틸 포스포스포로디아미다이트(23)을 제공할 수 있다. 2-시아노에틸 포스포스포로디아미다이트(23)을 적합한 조건(예를 들어, I2, H2O) 하에 산화시켜 2-시아노에틸 포스페이트(24)를 제공할 수 있다. 2-시아노에틸 포스페이트(24)는 적합한 조건 하에 탈보호될 수 있다. 생성된 디뉴클레오티드를 m7G 디포스페이트(25)와 커플링하여 화학식 (I-1)의 화합물의 합성을 달성할 수 있다.
m7G 디포스페이트(25)는 당업계에 알려진 방법을 사용하여 제조될 수 있다. 예를 들어, Kore, A. R., 등 "An Industrial Process for Selective Synthesis of 7-methyl Guanosine 5'-Diphosphate: Versatile Synthon of Synthesis of mRNA Cap Analogues" Nucleosides, Nucleotides, and Nucleic Acids 25:337-340, 2006, DOI:10.1080/15257770500544552를 참조한다.
실시예 6. 자기-증폭 발현 시스템
A. 자기-복제 RNA 바이러스 백본 및 SAM 생성
본 발명의 일 구현예에서, 항원 발현 시스템을 위한 RNA 알파바이러스 백본은 E1의 마지막 50개 아미노산을 제외하고, 26S 서브게놈 프로모터의 3'에 위치한 VEEV의 구조적 단백질을 결실시킴으로써(VEEV 서열 7544 내지 11,175가 결실됨; Kinney 등 1986에 기반한 넘버링; 서열번호: 6) 자기-복제 베네수엘라 말 뇌염 바이러스("VEEV"; Kinney, 1986, Virology 152: 400-413)로부터 생성되었다. 자기-증폭 mRNA("SAM") 벡터를 생성하기 위해, 결실된 서열을 항원 서열로 대체하였다. 20개의 모델 항원을 함유하는 대표적인 SAM 벡터는 "VEE-MAG25mer"(서열번호: 4)이다. 표준 3' 디뉴클레오티드 GG가 결여된 변형된 T7 RNA 폴리머라제 프로모터(TAATACGACTCACTATA)를 SAM 벡터의 5' 단부에 첨가하여 시험관내 전사 주형 DNA(서열번호: 57; 삽입된 항원 카세트 없이 7544 내지 11,175가 결실됨)를 생성하였다. PCR 정방향 프라이머 서열 및 3' 제한 부위를 첨가하여 추가의 주형 생산 벡터를 생산하였다(서열번호: 58; 삽입된 항원 카세트 없이 7544 내지 11,175가 결실됨).
상기 주형을 사용하여 생산된 RNA는 내인성 5' VEEV 뉴클레오티드 서열에 직접적으로 연결된 m7G 캡을 함유하며, 즉, m7G 캡과 내인성 5' VEEV 뉴클레오티드 서열 사이에 추가의 개입 뉴클레오티드가 존재하지 않으며, 예컨대 표준 T7 RNA 폴리머라제가 사용될 때 디뉴클레오티드 GG가 전형적으로 존재한다. 내인성 뉴클레오티드 AUG로 시작하고 표준 또는 변형된("최소") T7 프로모터를 사용하는 백본이 있는 SAM 벡터의 RNA 생산은 도 1에 예시되어 있다. m7G 캡과 내인성 5' AU 뉴클레오티드 사이에 위치한 추가의 개입 뉴클레오티드가 없는 SAM 벡터는 본원에서 "AU-SAM" 벡터로 지칭된다. 대표적인 AU-SAM 벡터의 개략도는 도 2에 제시되어 있다.
대표적인 항원을 암호화하는 카세트를 함유하는 캡핑된 AU-SAM RNA는 하기 단계를 사용하여 공동 전사적으로 생산하였다:
- 관심 항원 카세트를 시험관내 전사 주형 DNA(서열번호: 57)로 클로닝하여 DNA 주형을 생산하였다
- 아래에 요약된 바와 같이, 시험관내 전사(IVT)에 의해 캡핑된 RNA를 생산하였다:
o 함유된 반응: 1x T7 RNA 폴리머라제 믹스(E2040S)의 최종 농도를 사용하여 1x 전사 완충액(40 mM Tris, 10 mM 디티오트레이톨, 2 mM 스페르미딘, 0.002% Triton X-100, 및 27 mM 마그네슘 클로라이드); 0.025 mg/mL DNA 전사 주형(제한 소화에 의해 선형화 또는 PCR 증폭됨); 8 mM 트리뉴클레오티드 m7G-ppp-A-U 캡 유사체(CleanCap Reagent AU; Cat. No. N-7114) 및 각각 10 mM의 ATP, 시티딘 트리포스페이트(CTP), GTP, 및 우리딘 트리포스페이트(UTP)[하기에 나타낸 바와 같이, CleanCap Reagent AU는 디뉴클레오티드 m7G-ppp-A 캡 유사체(NEB)를 대체함]
o IVT 반응 조건: 전사 반응을 37℃에서 2시간 동안 인큐베이션하고 DNase I 완충액 중 최종 2 U DNase I(AM2239) /0.001 mg DNA 전사 주형으로 37℃에서 1시간 동안 처리하였다
o 캡핑된 AU-SAM을 RNeasy Maxi(QIAGEN, 75162) 또는 액체 크로마토그래피로 정제하였다
모델 항원 카세트("MAG25mer"; 뉴클레오티드 서열번호: 34 및 펩티드 서열번호: 35)를 VEEV 백본의 결실된 영역에 삽입하였다. 상기 기재된 바와 같이, 트리뉴클레오티드 m7G-ppp-A-U 캡 유사체 또는 디뉴클레오티드 m7G-ppp-A 캡 유사체를 사용하여 캡핑된 AU-SAM RNA를 생산하였다. 도 3에 제시된 바와 같이, 트리뉴클레오티드 m7G-ppp-A-U 캡을 함유하는 반응은 디뉴클레오티드 m7G-ppp-A 캡 유사체보다 20-배 이상 더 많은 RNA를 생산하였다.
캡핑된 AU-SAM RNA는 또한 디뉴클레오티드 m7G-ppp-A 캡 유사체의 사용보다 더 많은 양으로, 하기와 같이 본원에 기재된 트리뉴클레오티드 m7G-ppp-A-U 캡 유사체를 사용하여 IVT 반응에서 생산된다.
B. 마우스에서 자기-증폭 mRNA 바이러스 벡터 평가
면역화
Balb/c 마우스(그룹 당 n = 8)를 10 ug의 SAM-LNP로 면역화하였다. SAM은 AU-SAM(상기 기재된 바와 같이 생산됨), 또는 표준 T7 프로모터(서열번호: 8)를 함유하는 DNA 주형을 사용하여 생산된 GG-SAM이었으며, 여기서 생산된 RNA는 m7G 캡과 내인성 5' VEEV 뉴클레오티드 서열 사이에 GG 디뉴클레오티드를 특징으로 한다.
생체외 세포내 사이토카인 염색(ICS) 및 유세포 분석
연구에서 각각의 마우스에 대해, 백신에서 암호화된 AH1-A5 항원 클래스 I 에피토프(SPSYAYHQF)에 대한 T 세포 반응을 IFN-감마와 같은 사이토카인의 유도를 측정함으로써 비장세포에서 모니터링하였다. 2-5x106 세포/mL의 밀도로 새로 단리된 림프구를 10uM의 지시된 펩티드와 2시간 동안 인큐베이션하였다. 2시간 후, 브레펠딘 A를 5ug/ml의 농도로 첨가하였고 세포를 추가 4시간 동안 자극제와 함께 인큐베이션하였다. 자극 후, 생존 세포를 제조업체의 프로토콜에 따라 고정가능한 생존력 염료 eFluor780으로 표지하고 항-CD8 APC(클론 53-6.7, BioLegend)로 1:400 희석으로 염색하였다. 세포내 염색을 위해 항-IFNg PE(클론 XMG1.2, BioLegend)를 1:100으로 사용하였다. 샘플을 Cytoflex LX(Beckman Coulter)에서 수집하였다. 유세포 분석 데이터를 플롯팅하고 FlowJo를 사용하여 분석하였다. 항원-특이적 반응 정도를 평가하기 위해, 각각의 펩티드 자극제에 대한 반응으로 CD8+ 세포의 IFNg+ 퍼센트를 계산하였다.
마우스의 면역원성 결과
이 연구는 내인성 5' VEEV 뉴클레오티드 서열(AU-SAM)에 직접적으로 연결된 m7G 캡 또는 m7G 캡과 내인성 5' VEEV 뉴클레오티드 서열 사이의 GG 디뉴클레오티드(GG-SAM)를 함유하는 SAM 벡터를 사용하여 마우스에서 면역화를 평가하고 비교하도록 설계되었다. 자기-증폭 백본으로 삽입된 MAG25mer 모델 항원 카세트는 모델 비-자기항원으로서 AH1-A5 항원 클래스 I 에피토프 SPSYAYHQF를 특징으로 하였다.
상기 기재된 바와 같이 마우스를 면역화하였고, 초기 면역화 후 12일째에 비장세포를 수집하고 항원-특이적 면역 반응에 대해 평가하였다. 도 4 및 표 1에 제시된 바와 같이, AU-SAM으로의 백신접종은 GG-SAM에 비해 IFNγ+ CD8 세포 백분율의 ~2-배 증가를 생성하였으며, 이는 AU-SAM으로의 백신접종이 RNA의 5' 말단 상의 비-내인성 뉴클레오티드를 갖는 SAM 벡터에 비해 증가된 항원-특이적 면역 반응을 야기함을 나타낸다.
표 1 - 마우스에서 AU-SAM 또는 GG-SAM을 사용한 IFNγ+ CD8 세포
C. 비인간 영장류에서 자기-증폭 mRNA 바이러스 벡터 상동 프라임/부스트 면역원성 평가
면역화
Mamu-A*01 인디안 레서스 마카크(N = 5)를 MAG25mer 항원 카세트(상기 기재된 바와 같이 IVT에 의해 공동 전사적으로 생산됨)를 함유하는 AU-SAM 전달 조성물로 면역화하고 LNP로 제형화하였다. 면역화 당일에 SAM-LNP를 실온에서 해동시키고, PBS로 원하는 농도로 희석하고, 연동 펌프(Masterflex) 및 필터 카트리지(Sartorius Sartopore 2 Filter 캡슐 크기 4, 150 cm2, 0.2 μm)를 사용하여 여과하였다. 동물은 SIV에 대한 면역-조절 항체 또는 백신접종으로 임의의 사전 치료를 받지 않았고 SIV에 사전 노출되지 않았다. SAM을 대퇴 사두근에 양측 근육내 주사로 투여하였다. AU-SAM의 상동 부스트를 프라임 백신접종 후 4, 8, 및 20주에 근육내로 투여하였다. 모든 4회 용량은 동물 당 총 1 mg이었다. 처음 3회 용량(0, 4, 8주)에 대해, 2 mL의 SAM을 투여하였다(다리 당 1 mL). 4번째 용량(20주)에 대해, 주사된 부피는 1 mL(다리 당 0.5 mL)로 감소하였다.
면역 모니터링
면역 모니터링을 위해, 10-20 mL의 혈액을 헤파린을 함유하는 진공채혈기 튜브에 수집하고 단리할 때까지 실온에서 유지하였다. PBMC를 림프구 분리 배지(LSM) 및 Leucosep 분리기 튜브를 사용하여 밀도 구배 원심분리에 의해 단리하였다. PBMC를 프로피듐 요오다이드로 염색하였고 생존 세포를 Cytoflex LX(Beckman Coulter)를 사용하여 계수하였다. 그런 다음 샘플을 RPMI 완전(10% FBS)에서 4 x 106 세포/mL로 재현탁하였다.
제조업체의 프로토콜에 따라 사전-코팅된 96-웰 플레이트(MAbtech, 원숭이 IFNγ ELISPOT PLUS, ALP(키트 Lot #36, 플레이트 Lot #19))를 사용하여 IFNγ ELISPOT 검정을 수행하였다. 각각의 샘플 및 자극에 대해, 웰 당 2.5 x 104 및 1 x 105 PBMC를 10 ug/mL 펩티드 자극(GenScript)과 함께 삼중으로 플레이팅하고 완전 RPMI에서 밤새 인큐베이션하였다. 카세트에 함유되지 않은 인간 HBV S-항원 펩티드(WLSLLVPFV, Genscript)를 각각의 샘플에 대한 음성 대조군으로 사용하였다. 플레이트를 PBS로 세척하고 항-원숭이 IFNγ MAb 비오틴(MAbtech)과 함께 2시간 동안 인큐베이션한 후, 추가로 세척하고 스트렙타비딘-ALP(MAbtech)와 함께 1시간 동안 인큐베이션하였다. 최종 세척 후, 플레이트를 BCIP/NBT(MAbtech)와 함께 10분 동안 인큐베이션하여 면역스팟을 전개하고 37℃에서 밤새 건조시켰다. 스팟을 이미지화하고 AID 판독기(Autoimmun Diagnostika)를 사용하여 열거하였다.
복제 웰 가변성(가변성 = 변동성/[중앙값 + 1])이 10보다 크고 중앙값이 10보다 큰 샘플은 제외하였다. 스팟 값은 다음 식에 따라 웰 포화도에 기반하여 조정하였다: 조정된 스팟 = 원시 스팟 + 2*(원시 스팟*포화도/[100-포화도]). 웰 포화도가 33%보다 큰 웰은 "계수하기에 너무 많은"(TNTC) 것으로 간주하고 제외하였다. 각각의 샘플에 대한 배경 보정은 음성 대조군 펩티드 웰의 평균 값을 빼서 수행하였다. 보정된 스팟 수에 1x106/플레이팅된 세포 수를 곱하여 데이터를 1x106 PBMC 당 스팟 형성 콜로니(SFC)로 정규화하였다. 전반적인 요약 분석을 위해, 샘플이 TNTC인 경우를 제외하고, 세포를 1x105 세포/웰로 플레이팅함으로써 생성된 계산된 값을 활용하였으며, 이 경우 세포를 2.5x104 세포로 플레이팅하여 생성된 값을 해당 특이적 샘플/자극/시점에 대해 사용하였다. 데이터 처리는 R 프로그래밍 언어를 사용하여 수행하였다.
레서스 마카크에서 면역원성 결과
이 연구는 인간에서 백신 효능의 고도로 예측된 모델인 레서스 마카크에서 상동 프라임/부스트 면역화 전략에 기반한 SAM, 특히 AU-SAM의 면역원성 및 예비 안전성을 평가하도록 설계되었다. AU-SAM 연구 아암(arm)의 경우, 레서스 마카크를상기 기재된 바와 같이 면역화하였고, PBMC를 면역화 전 및 면역 모니터링을 위한 초기 면역화 후 1, 2, 3, 4, 5, 6, 8, 9, 10, 및 14주째에 수집하였다(AU-SAM 연구 아암 세부사항은 도 5, 상단 패널에 예시되어 있음). MAG25mer 모델 항원 카세트는 모델 비-자기 항원으로서 6개의 Mamu-A*01 제한 클래스 I 제한 바이러스 항원을 특징으로 하였다(모델 항원은 도 5, 하단 패널에 예시됨).
6개의 Mamu-A*01 항원 각각에 대해 항원-특이적 면역 반응을 평가하였다. 도 6에 제시된 바와 같이, 연구 6주까지 PBMC에서 항원-특이적 면역 반응은 면역화 후 평가된 모든 시점에서 관찰되었다. 106 PBMC 당 SFC의 초기 증가가 프라임 투여(2 및 3주) 후 Mamu-A*01 항원에 대해 관찰되었고, 이어서 축소(4주)가 관찰되었다. 특히, 초기 프라이밍 피크 반응을 초과하는 106 PBMC 당 SFC의 증가가 부스팅 투여 후 1주만에(5 및 6주) 관찰되었다.
6개의 Mamu-A*01 항원에 대한 합산 반응으로 항원-특이적 면역 반응을 평가하였다. 도 7에 제시된 바와 같이, 연구 22주까지 PBMC에서 항원-특이적 면역 반응은 면역화 후 평가된 모든 시점에서 관찰되었다. 106 PBMC 당 SFC의 초기 증가가 프라이밍 투여 후(2 및 3주) 6개의 Mamu-A*01 항원에 대한 합산 반응에 대해 관찰되었고, 이어서 축소(4주)가 관찰되었다. 초기 프라이밍 피크 반응을 초과하는 106 PBMC 당 SFC의 증가가 4주에 첫번째 부스팅 용량이 투여된 후 1주만에(5 및 6주) 관찰되었고, 이어서 축소(8주)가 관찰되었다. 106 PBMC 당 SFC의 증가가 8주에 제2 부스팅 용량이 투여된 후 1주(9주)에 다시 관찰되었고, 이어서 축소가 관찰되었으며 여기서 106 PBMC 당 SFC가 10주 동안 안정하게 남아있었다(10-20주). 특히, 106 PBMC 당 SFC의 증가가 이전 부스팅 용량 후 12-주에 투여된 세번째 부스팅 용량(20주)이 투여된 12-주 후 1주만에(21 및 22주) 다시 관찰되었다.
따라서, 데이터는 상동 프라임/부스트 AU-SAM 기반 면역화 전략이 레서스 마카크에서 비-자기 항원에 대한 강력하고, 신속하고, 안정한 항원-특이적 면역원성 반응을 초래하였음을 입증한다.
서열
본원에 언급된 벡터, 카세트, 및 항체는 하기에 기재되고 서열번호로 언급된다.
등가물 및 범위
청구범위에서, 단수형 관사는 달리 반대로 나타내지 않거나 또는 달리 문맥으로부터 명백하지 않는 한 하나 또는 하나 초과를 의미할 수 있다. 그룹의 하나 이상의 구성원 사이에 "또는"을 포함하는 청구범위 또는 설명은 달리 반대로 나타내지 않거나 또는 달리 문맥상 명백하지 않는 한 하나, 하나 초과, 또는 모든 그룹 구성원이 주어진 생산물 또는 과정에 존재하거나, 또는 이용되거나, 또는 달리 관련되는 경우 충족되는 것으로 간주된다. 본 개시내용은 그룹의 정확히 하나의 구성원이 주어진 생산물 또는 과정에 존재하거나, 이용되거나, 또는 달리 관련되는 구현예를 포함한다. 본 개시내용은 하나 초과, 또는 모든 그룹 구성원이 주어진 생산물 또는 과정에 존재하거나, 이용되거나, 또는 달리 관련되는 구현예를 포함한다.
또한, 본 개시내용은 나열된 청구범위 중 하나 이상으로부터의 하나 이상의 제한, 요소, 조항, 및 설명 용어가 또 다른 청구범위에 도입되는 모든 변경, 조합, 및 순열을 포함한다. 예를 들어, 또 다른 청구범위에 종속된 임의의 청구범위는 동일한 기본 청구범위에 종속된 임의의 다른 청구범위에서 발견된 하나 이상의 제한을 포함하도록 변형될 수 있다. 요소가 목록으로, 예를 들어, Markush 그룹 형식으로 존재하는 경우, 요소의 각각의 하위그룹이 또한 개시되고, 임의의 요소(들)가 그룹으로부터 제거될 수 있다. 일반적으로, 본 개시내용, 또는 본 개시내용의 측면이 특정 요소 및/또는 특징을 포함하는 것으로 언급되는 경우, 본 개시내용 또는 본 개시내용의 측면의 특정 구현예는 이러한 요소 및/또는 특징으로 이루어지거나, 또는 이로 본질적으로 이루어지는 것으로 이해되어야 한다. 단순화 목적을 위해, 이들 구현예는 본원에서 말 그대로 구체적으로 제시되지 않았다. 또한 용어 "포함하는" 및 "함유하는"은 개방적인 것으로 의도되고 추가의 요소 또는 단계의 포함을 허용한다는 것에 유의한다. 범위가 주어지는 경우, 종료점이 포함된다. 또한, 달리 나타내지 않거나 또는 달리 문맥상 명백하지 않고 당업자에 의해 이해되는 한, 범위로 표현되는 값은 문맥상 달리 명백하게 지시하지 않는 한, 범위의 하한치 단위의 1/10까지 본 개시내용의 상이한 구현예에서 명시된 범위 내에서 임의의 특정 값 또는 하위 범위를 가정할 수 있다.
본 출원은 다양한 발행된 특허, 공개된 특허 출원, 논문, 및 다른 간행물을 지칭하며, 이들 모두는 본원에 참조로 포함된다. 포함된 임의의 참고문헌과 본 명세서 사이에 충돌이 있는 경우, 명세서가 우선한다. 게다가, 선행 기술 내에 속하는 본 개시내용의 임의의 특정 구현예는 청구범위 중 임의의 하나 이상으로부터 명시적으로 제외될 수 있다. 이러한 구현예는 당업자에게 알려진 것으로 간주되기 때문에, 이들은 본원에서 제외가 명시적으로 제시되지 않더라도 배제될 수 있다. 본 개시내용의 임의의 특정 구현예는 선행 기술의 존재와 관련되든 아니든, 임의의 이유로 임의의 청구범위에서 배제될 수 있다.
당업자는 일상적인 실험만을 사용하여 본원에 기재된 특정 구현예에 대한 많은 등가물을 인식하거나 또는 확인할 수 있을 것이다. 본원에 기재된 본 구현예의 범위는 상기 설명에 제한되는 것으로 의도되지 않고, 오히려 첨부된 청구범위에 제시된 바와 같다. 당업자는 본 설명에 대한 다양한 변화 및 변형이 하기 청구범위에 정의된 바와 같이, 본 개시내용의 취지 또는 범위를 벗어나지 않고 이루어질 수 있음이 이해될 것이다.
SEQUENCE LISTING
<110> GRITSTONE ONCOLOGY, INC.
<120> CAPPING COMPOUNDS, COMPOSITIONS AND METHODS OF USE THEREOF
<130> GSO-088WO
<140>
<141>
<150> US63/013,456
<151> 2020-04-21
<150> US63/020,473
<151> 2020-05-05
<160> 56
<170> PatentIn version 3.5
<210> 1
<211> 36519
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 1
ccatcttcaa taatatacct caaacttttt gtgcgcgtta atatgcaaat gaggcgtttg 60
aatttgggga ggaagggcgg tgattggtcg agggatgagc gaccgttagg ggcggggcga 120
gtgacgtttt gatgacgtgg ttgcgaggag gagccagttt gcaagttctc gtgggaaaag 180
tgacgtcaaa cgaggtgtgg tttgaacacg gaaatactca attttcccgc gctctctgac 240
aggaaatgag gtgtttctgg gcggatgcaa gtgaaaacgg gccattttcg cgcgaaaact 300
gaatgaggaa gtgaaaatct gagtaatttc gcgtttatgg cagggaggag tatttgccga 360
gggccgagta gactttgacc gattacgtgg gggtttcgat taccgtgttt ttcacctaaa 420
tttccgcgta cggtgtcaaa gtccggtgtt tttacgtagg tgtcagctga tcgccagggt 480
atttaaacct gcgctctcca gtcaagaggc cactcttgag tgccagcgag aagagttttc 540
tcctccgcgc cgcgagtcag atctacactt tgaaagatga ggcacctgag agacctgccc 600
gatgagaaaa tcatcatcgc ttccgggaac gagattctgg aactggtggt aaatgccatg 660
atgggcgacg accctccgga gccccccacc ccatttgaga caccttcgct gcacgatttg 720
tatgatctgg aggtggatgt gcccgaggac gatcccaatg aggaggcggt aaatgatttt 780
tttagcgatg ccgcgctgct agctgccgag gaggcttcga gctctagctc agacagcgac 840
tcttcactgc atacccctag acccggcaga ggtgagaaaa agatccccga gcttaaaggg 900
gaagagatgg acttgcgctg ctatgaggaa tgcttgcccc cgagcgatga tgaggacgag 960
caggcgatcc agaacgcagc gagccaggga gtgcaagccg ccagcgagag ctttgcgctg 1020
gactgcccgc ctctgcccgg acacggctgt aagtcttgtg aatttcatcg catgaatact 1080
ggagataaag ctgtgttgtg tgcactttgc tatatgagag cttacaacca ttgtgtttac 1140
agtaagtgtg attaagttga actttagagg gaggcagaga gcagggtgac tgggcgatga 1200
ctggtttatt tatgtatata tgttctttat ataggtcccg tctctgacgc agatgatgag 1260
acccccacta caaagtccac ttcgtcaccc ccagaaattg gcacatctcc acctgagaat 1320
attgttagac cagttcctgt tagagccact gggaggagag cagctgtgga atgtttggat 1380
gacttgctac agggtggggt tgaacctttg gacttgtgta cccggaaacg ccccaggcac 1440
taagtgccac acatgtgtgt ttacttgagg tgatgtcagt atttataggg tgtggagtgc 1500
aataaaaaat gtgttgactt taagtgcgtg gtttatgact caggggtggg gactgtgagt 1560
atataagcag gtgcagacct gtgtggttag ctcagagcgg catggagatt tggacggtct 1620
tggaagactt tcacaagact agacagctgc tagagaacgc ctcgaacgga gtctcttacc 1680
tgtggagatt ctgcttcggt ggcgacctag ctaggctagt ctacagggcc aaacaggatt 1740
atagtgaaca atttgaggtt attttgagag agtgttctgg tctttttgac gctcttaact 1800
tgggccatca gtctcacttt aaccagagga tttcgagagc ccttgatttt actactcctg 1860
gcagaaccac tgcagcagta gccttttttg cttttattct tgacaaatgg agtcaagaaa 1920
cccatttcag cagggattac cagctggatt tcttagcagt agctttgtgg agaacatgga 1980
agtgccagcg cctgaatgca atctccggct acttgccggt acagccgcta gacactctga 2040
ggatcctgaa tctccaggag agtcccaggg cacgccaacg tcgccagcag cagcagcagg 2100
aggaggatca agaagagaac ccgagagccg gcctggaccc tccggcggag gaggaggagt 2160
agctgacctg tttcctgaac tgcgccgggt gctgactagg tcttcgagtg gtcgggagag 2220
ggggattaag cgggagaggc atgatgagac taatcacaga actgaactga ctgtgggtct 2280
gatgagtcgc aagcgcccag aaacagtgtg gtggcatgag gtgcagtcga ctggcacaga 2340
tgaggtgtcg gtgatgcatg agaggttttc tctagaacaa gtcaagactt gttggttaga 2400
gcctgaggat gattgggagg tagccatcag gaattatgcc aagctggctc tgaggccaga 2460
caagaagtac aagattacta agctgataaa tatcagaaat gcctgctaca tctcagggaa 2520
tggggctgaa gtggagatct gtctccagga aagggtggct ttcagatgct gcatgatgaa 2580
tatgtacccg ggagtggtgg gcatggatgg ggttaccttt atgaacatga ggttcagggg 2640
agatgggtat aatggcacgg tctttatggc caataccaag ctgacagtcc atggctgctc 2700
cttctttggg tttaataaca cctgcatcga ggcctggggt caggtcggtg tgaggggctg 2760
cagtttttca gccaactgga tgggggtcgt gggcaggacc aagagtatgc tgtccgtgaa 2820
gaaatgcttg tttgagaggt gccacctggg ggtgatgagc gagggcgaag ccagaatccg 2880
ccactgcgcc tctaccgaga cgggctgctt tgtgctgtgc aagggcaatg ctaagatcaa 2940
gcataatatg atctgtggag cctcggacga gcgcggctac cagatgctga cctgcgccgg 3000
cgggaacagc catatgctgg ccaccgtaca tgtggcttcc catgctcgca agccctggcc 3060
cgagttcgag cacaatgtca tgaccaggtg caatatgcat ctggggtccc gccgaggcat 3120
gttcatgccc taccagtgca acctgaatta tgtgaaggtg ctgctggagc ccgatgccat 3180
gtccagagtg agcctgacgg gggtgtttga catgaatgtg gaggtgtgga agattctgag 3240
atatgatgaa tccaagacca ggtgccgagc ctgcgagtgc ggagggaagc atgccaggtt 3300
ccagcccgtg tgtgtggatg tgacggagga cctgcgaccc gatcatttgg tgttgccctg 3360
caccgggacg gagttcggtt ccagcgggga agaatctgac tagagtgagt agtgttctgg 3420
ggcgggggag gacctgcatg agggccagaa taactgaaat ctgtgctttt ctgtgtgttg 3480
cagcagcatg agcggaagcg gctcctttga gggaggggta ttcagccctt atctgacggg 3540
gcgtctcccc tcctgggcgg gagtgcgtca gaatgtgatg ggatccacgg tggacggccg 3600
gcccgtgcag cccgcgaact cttcaaccct gacctatgca accctgagct cttcgtcgtt 3660
ggacgcagct gccgccgcag ctgctgcatc tgccgccagc gccgtgcgcg gaatggccat 3720
gggcgccggc tactacggca ctctggtggc caactcgagt tccaccaata atcccgccag 3780
cctgaacgag gagaagctgt tgctgctgat ggcccagctc gaggccttga cccagcgcct 3840
gggcgagctg acccagcagg tggctcagct gcaggagcag acgcgggccg cggttgccac 3900
ggtgaaatcc aaataaaaaa tgaatcaata aataaacgga gacggttgtt gattttaaca 3960
cagagtctga atctttattt gatttttcgc gcgcggtagg ccctggacca ccggtctcga 4020
tcattgagca cccggtggat cttttccagg acccggtaga ggtgggcttg gatgttgagg 4080
tacatgggca tgagcccgtc ccgggggtgg aggtagctcc attgcagggc ctcgtgctcg 4140
ggggtggtgt tgtaaatcac ccagtcatag caggggcgca gggcatggtg ttgcacaata 4200
tctttgagga ggagactgat ggccacgggc agccctttgg tgtaggtgtt tacaaatctg 4260
ttgagctggg agggatgcat gcggggggag atgaggtgca tcttggcctg gatcttgaga 4320
ttggcgatgt taccgcccag atcccgcctg gggttcatgt tgtgcaggac caccagcacg 4380
gtgtatccgg tgcacttggg gaatttatca tgcaacttgg aagggaaggc gtgaaagaat 4440
ttggcgacgc ctttgtgccc gcccaggttt tccatgcact catccatgat gatggcgatg 4500
ggcccgtggg cggcggcctg ggcaaagacg tttcgggggt cggacacatc atagttgtgg 4560
tcctgggtga ggtcatcata ggccatttta atgaatttgg ggcggagggt gccggactgg 4620
gggacaaagg taccctcgat cccgggggcg tagttcccct cacagatctg catctcccag 4680
gctttgagct cggagggggg gatcatgtcc acctgcgggg cgataaagaa cacggtttcc 4740
ggggcggggg agatgagctg ggccgaaagc aagttccgga gcagctggga cttgccgcag 4800
ccggtggggc cgtagatgac cccgatgacc ggctgcaggt ggtagttgag ggagagacag 4860
ctgccgtcct cccggaggag gggggccacc tcgttcatca tctcgcgcac gtgcatgttc 4920
tcgcgcacca gttccgccag gaggcgctct ccccccaggg ataggagctc ctggagcgag 4980
gcgaagtttt tcagcggctt gagtccgtcg gccatgggca ttttggagag ggtttgttgc 5040
aagagttcca ggcggtccca gagctcggtg atgtgctcta cggcatctcg atccagcaga 5100
cctcctcgtt tcgcgggttg ggacggctgc gggagtaggg caccagacga tgggcgtcca 5160
gcgcagccag ggtccggtcc ttccagggtc gcagcgtccg cgtcagggtg gtctccgtca 5220
cggtgaaggg gtgcgcgccg ggctgggcgc ttgcgagggt gcgcttcagg ctcatccggc 5280
tggtcgaaaa ccgctcccga tcggcgccct gcgcgtcggc caggtagcaa ttgaccatga 5340
gttcgtagtt gagcgcctcg gccgcgtggc ctttggcgcg gagcttacct ttggaagtct 5400
gcccgcaggc gggacagagg agggacttga gggcgtagag cttgggggcg aggaagacgg 5460
actcgggggc gtaggcgtcc gcgccgcagt gggcgcagac ggtctcgcac tccacgagcc 5520
aggtgaggtc gggctggtcg gggtcaaaaa ccagtttccc gccgttcttt ttgatgcgtt 5580
tcttaccttt ggtctccatg agctcgtgtc cccgctgggt gacaaagagg ctgtccgtgt 5640
ccccgtagac cgactttatg ggccggtcct cgagcggtgt gccgcggtcc tcctcgtaga 5700
ggaaccccgc ccactccgag acgaaagccc gggtccaggc cagcacgaag gaggccacgt 5760
gggacgggta gcggtcgttg tccaccagcg ggtccacctt ttccagggta tgcaaacaca 5820
tgtccccctc gtccacatcc aggaaggtga ttggcttgta agtgtaggcc acgtgaccgg 5880
gggtcccggc cgggggggta taaaagggtg cgggtccctg ctcgtcctca ctgtcttccg 5940
gatcgctgtc caggagcgcc agctgttggg gtaggtattc cctctcgaag gcgggcatga 6000
cctcggcact caggttgtca gtttctagaa acgaggagga tttgatattg acggtgccgg 6060
cggagatgcc tttcaagagc ccctcgtcca tctggtcaga aaagacgatc tttttgttgt 6120
cgagcttggt ggcgaaggag ccgtagaggg cgttggagag gagcttggcg atggagcgca 6180
tggtctggtt tttttccttg tcggcgcgct ccttggcggc gatgttgagc tgcacgtact 6240
cgcgcgccac gcacttccat tcggggaaga cggtggtcag ctcgtcgggc acgattctga 6300
cctgccagcc ccgattatgc agggtgatga ggtccacact ggtggccacc tcgccgcgca 6360
ggggctcatt agtccagcag aggcgtccgc ccttgcgcga gcagaagggg ggcagggggt 6420
ccagcatgac ctcgtcgggg gggtcggcat cgatggtgaa gatgccgggc aggaggtcgg 6480
ggtcaaagta gctgatggaa gtggccagat cgtccagggc agcttgccat tcgcgcacgg 6540
ccagcgcgcg ctcgtaggga ctgaggggcg tgccccaggg catgggatgg gtaagcgcgg 6600
aggcgtacat gccgcagatg tcgtagacgt agaggggctc ctcgaggatg ccgatgtagg 6660
tggggtagca gcgccccccg cggatgctgg cgcgcacgta gtcatacagc tcgtgcgagg 6720
gggcgaggag ccccgggccc aggttggtgc gactgggctt ttcggcgcgg tagacgatct 6780
ggcggaaaat ggcatgcgag ttggaggaga tggtgggcct ttggaagatg ttgaagtggg 6840
cgtggggcag tccgaccgag tcgcggatga agtgggcgta ggagtcttgc agcttggcga 6900
cgagctcggc ggtgactagg acgtccagag cgcagtagtc gagggtctcc tggatgatgt 6960
catacttgag ctgtcccttt tgtttccaca gctcgcggtt gagaaggaac tcttcgcggt 7020
ccttccagta ctcttcgagg gggaacccgt cctgatctgc acggtaagag cctagcatgt 7080
agaactggtt gacggccttg taggcgcagc agcccttctc cacggggagg gcgtaggcct 7140
gggcggcctt gcgcagggag gtgtgcgtga gggcgaaagt gtccctgacc atgaccttga 7200
ggaactggtg cttgaagtcg atatcgtcgc agcccccctg ctcccagagc tggaagtccg 7260
tgcgcttctt gtaggcgggg ttgggcaaag cgaaagtaac atcgttgaag aggatcttgc 7320
ccgcgcgggg cataaagttg cgagtgatgc ggaaaggttg gggcacctcg gcccggttgt 7380
tgatgacctg ggcggcgagc acgatctcgt cgaagccgtt gatgttgtgg cccacgatgt 7440
agagttccac gaatcgcgga cggcccttga cgtggggcag tttcttgagc tcctcgtagg 7500
tgagctcgtc ggggtcgctg agcccgtgct gctcgagcgc ccagtcggcg agatgggggt 7560
tggcgcggag gaaggaagtc cagagatcca cggccagggc ggtttgcaga cggtcccggt 7620
actgacggaa ctgctgcccg acggccattt tttcgggggt gacgcagtag aaggtgcggg 7680
ggtccccgtg ccagcgatcc catttgagct ggagggcgag atcgagggcg agctcgacga 7740
gccggtcgtc cccggagagt ttcatgacca gcatgaaggg gacgagctgc ttgccgaagg 7800
accccatcca ggtgtaggtt tccacatcgt aggtgaggaa gagcctttcg gtgcgaggat 7860
gcgagccgat ggggaagaac tggatctcct gccaccaatt ggaggaatgg ctgttgatgt 7920
gatggaagta gaaatgccga cggcgcgccg aacactcgtg cttgtgttta tacaagcggc 7980
cacagtgctc gcaacgctgc acgggatgca cgtgctgcac gagctgtacc tgagttcctt 8040
tgacgaggaa tttcagtggg aagtggagtc gtggcgcctg catctcgtgc tgtactacgt 8100
cgtggtggtc ggcctggccc tcttctgcct cgatggtggt catgctgacg agcccgcgcg 8160
ggaggcaggt ccagacctcg gcgcgagcgg gtcggagagc gaggacgagg gcgcgcaggc 8220
cggagctgtc cagggtcctg agacgctgcg gagtcaggtc agtgggcagc ggcggcgcgc 8280
ggttgacttg caggagtttt tccagggcgc gcgggaggtc cagatggtac ttgatctcca 8340
ccgcgccatt ggtggcgacg tcgatggctt gcagggtccc gtgcccctgg ggtgtgacca 8400
ccgtcccccg tttcttcttg ggcggctggg gcgacggggg cggtgcctct tccatggtta 8460
gaagcggcgg cgaggacgcg cgccgggcgg caggggcggc tcggggcccg gaggcagggg 8520
cggcaggggc acgtcggcgc cgcgcgcggg taggttctgg tactgcgccc ggagaagact 8580
ggcgtgagcg acgacgcgac ggttgacgtc ctggatctga cgcctctggg tgaaggccac 8640
gggacccgtg agtttgaacc tgaaagagag ttcgacagaa tcaatctcgg tatcgttgac 8700
ggcggcctgc cgcaggatct cttgcacgtc gcccgagttg tcctggtagg cgatctcggt 8760
catgaactgc tcgatctcct cctcttgaag gtctccgcgg ccggcgcgct ccacggtggc 8820
cgcgaggtcg ttggagatgc ggcccatgag ctgcgagaag gcgttcatgc ccgcctcgtt 8880
ccagacgcgg ctgtagacca cgacgccctc gggatcgcgg gcgcgcatga ccacctgggc 8940
gaggttgagc tccacgtggc gcgtgaagac cgcgtagttg cagaggcgct ggtagaggta 9000
gttgagcgtg gtggcgatgt gctcggtgac gaagaaatac atgatccagc ggcggagcgg 9060
catctcgctg acgtcgccca gcgcctccaa acgttccatg gcctcgtaaa agtccacggc 9120
gaagttgaaa aactgggagt tgcgcgccga gacggtcaac tcctcctcca gaagacggat 9180
gagctcggcg atggtggcgc gcacctcgcg ctcgaaggcc cccgggagtt cctccacttc 9240
ctcttcttcc tcctccacta acatctcttc tacttcctcc tcaggcggca gtggtggcgg 9300
gggagggggc ctgcgtcgcc ggcggcgcac gggcagacgg tcgatgaagc gctcgatggt 9360
ctcgccgcgc cggcgtcgca tggtctcggt gacggcgcgc ccgtcctcgc ggggccgcag 9420
cgtgaagacg ccgccgcgca tctccaggtg gccggggggg tccccgttgg gcagggagag 9480
ggcgctgacg atgcatctta tcaattgccc cgtagggact ccgcgcaagg acctgagcgt 9540
ctcgagatcc acgggatctg aaaaccgctg aacgaaggct tcgagccagt cgcagtcgca 9600
aggtaggctg agcacggttt cttctggcgg gtcatgttgg ttgggagcgg ggcgggcgat 9660
gctgctggtg atgaagttga aataggcggt tctgagacgg cggatggtgg cgaggagcac 9720
caggtctttg ggcccggctt gctggatgcg cagacggtcg gccatgcccc aggcgtggtc 9780
ctgacacctg gccaggtcct tgtagtagtc ctgcatgagc cgctccacgg gcacctcctc 9840
ctcgcccgcg cggccgtgca tgcgcgtgag cccgaagccg cgctggggct ggacgagcgc 9900
caggtcggcg acgacgcgct cggcgaggat ggcttgctgg atctgggtga gggtggtctg 9960
gaagtcatca aagtcgacga agcggtggta ggctccggtg ttgatggtgt aggagcagtt 10020
ggccatgacg gaccagttga cggtctggtg gcccggacgc acgagctcgt ggtacttgag 10080
gcgcgagtag gcgcgcgtgt cgaagatgta gtcgttgcag gtgcgcacca ggtactggta 10140
gccgatgagg aagtgcggcg gcggctggcg gtagagcggc catcgctcgg tggcgggggc 10200
gccgggcgcg aggtcctcga gcatggtgcg gtggtagccg tagatgtacc tggacatcca 10260
ggtgatgccg gcggcggtgg tggaggcgcg cgggaactcg cggacgcggt tccagatgtt 10320
gcgcagcggc aggaagtagt tcatggtggg cacggtctgg cccgtgaggc gcgcgcagtc 10380
gtggatgctc tatacgggca aaaacgaaag cggtcagcgg ctcgactccg tggcctggag 10440
gctaagcgaa cgggttgggc tgcgcgtgta ccccggttcg aatctcgaat caggctggag 10500
ccgcagctaa cgtggtattg gcactcccgt ctcgacccaa gcctgcacca accctccagg 10560
atacggaggc gggtcgtttt gcaacttttt tttggaggcc ggatgagact agtaagcgcg 10620
gaaagcggcc gaccgcgatg gctcgctgcc gtagtctgga gaagaatcgc cagggttgcg 10680
ttgcggtgtg ccccggttcg aggccggccg gattccgcgg ctaacgaggg cgtggctgcc 10740
ccgtcgtttc caagacccca tagccagccg acttctccag ttacggagcg agcccctctt 10800
ttgttttgtt tgtttttgcc agatgcatcc cgtactgcgg cagatgcgcc cccaccaccc 10860
tccaccgcaa caacagcccc ctccacagcc ggcgcttctg cccccgcccc agcagcaact 10920
tccagccacg accgccgcgg ccgccgtgag cggggctgga cagagttatg atcaccagct 10980
ggccttggaa gagggcgagg ggctggcgcg cctgggggcg tcgtcgccgg agcggcaccc 11040
gcgcgtgcag atgaaaaggg acgctcgcga ggcctacgtg cccaagcaga acctgttcag 11100
agacaggagc ggcgaggagc ccgaggagat gcgcgcggcc cggttccacg cggggcggga 11160
gctgcggcgc ggcctggacc gaaagagggt gctgagggac gaggatttcg aggcggacga 11220
gctgacgggg atcagccccg cgcgcgcgca cgtggccgcg gccaacctgg tcacggcgta 11280
cgagcagacc gtgaaggagg agagcaactt ccaaaaatcc ttcaacaacc acgtgcgcac 11340
cctgatcgcg cgcgaggagg tgaccctggg cctgatgcac ctgtgggacc tgctggaggc 11400
catcgtgcag aaccccacca gcaagccgct gacggcgcag ctgttcctgg tggtgcagca 11460
tagtcgggac aacgaagcgt tcagggaggc gctgctgaat atcaccgagc ccgagggccg 11520
ctggctcctg gacctggtga acattctgca gagcatcgtg gtgcaggagc gcgggctgcc 11580
gctgtccgag aagctggcgg ccatcaactt ctcggtgctg agtttgggca agtactacgc 11640
taggaagatc tacaagaccc cgtacgtgcc catagacaag gaggtgaaga tcgacgggtt 11700
ttacatgcgc atgaccctga aagtgctgac cctgagcgac gatctggggg tgtaccgcaa 11760
cgacaggatg caccgtgcgg tgagcgccag caggcggcgc gagctgagcg accaggagct 11820
gatgcatagt ctgcagcggg ccctgaccgg ggccgggacc gagggggaga gctactttga 11880
catgggcgcg gacctgcact ggcagcccag ccgccgggcc ttggaggcgg cggcaggacc 11940
ctacgtagaa gaggtggacg atgaggtgga cgaggagggc gagtacctgg aagactgatg 12000
gcgcgaccgt atttttgcta gatgcaacaa caacagccac ctcctgatcc cgcgatgcgg 12060
gcggcgctgc agagccagcc gtccggcatt aactcctcgg acgattggac ccaggccatg 12120
caacgcatca tggcgctgac gacccgcaac cccgaagcct ttagacagca gccccaggcc 12180
aaccggctct cggccatcct ggaggccgtg gtgccctcgc gctccaaccc cacgcacgag 12240
aaggtcctgg ccatcgtgaa cgcgctggtg gagaacaagg ccatccgcgg cgacgaggcc 12300
ggcctggtgt acaacgcgct gctggagcgc gtggcccgct acaacagcac caacgtgcag 12360
accaacctgg accgcatggt gaccgacgtg cgcgaggccg tggcccagcg cgagcggttc 12420
caccgcgagt ccaacctggg atccatggtg gcgctgaacg ccttcctcag cacccagccc 12480
gccaacgtgc cccggggcca ggaggactac accaacttca tcagcgccct gcgcctgatg 12540
gtgaccgagg tgccccagag cgaggtgtac cagtccgggc cggactactt cttccagacc 12600
agtcgccagg gcttgcagac cgtgaacctg agccaggctt tcaagaactt gcagggcctg 12660
tggggcgtgc aggccccggt cggggaccgc gcgacggtgt cgagcctgct gacgccgaac 12720
tcgcgcctgc tgctgctgct ggtggccccc ttcacggaca gcggcagcat caaccgcaac 12780
tcgtacctgg gctacctgat taacctgtac cgcgaggcca tcggccaggc gcacgtggac 12840
gagcagacct accaggagat cacccacgtg agccgcgccc tgggccagga cgacccgggc 12900
aacctggaag ccaccctgaa ctttttgctg accaaccggt cgcagaagat cccgccccag 12960
tacgcgctca gcaccgagga ggagcgcatc ctgcgttacg tgcagcagag cgtgggcctg 13020
ttcctgatgc aggagggggc cacccccagc gccgcgctcg acatgaccgc gcgcaacatg 13080
gagcccagca tgtacgccag caaccgcccg ttcatcaata aactgatgga ctacttgcat 13140
cgggcggccg ccatgaactc tgactatttc accaacgcca tcctgaatcc ccactggctc 13200
ccgccgccgg ggttctacac gggcgagtac gacatgcccg accccaatga cgggttcctg 13260
tgggacgatg tggacagcag cgtgttctcc ccccgaccgg gtgctaacga gcgccccttg 13320
tggaagaagg aaggcagcga ccgacgcccg tcctcggcgc tgtccggccg cgagggtgct 13380
gccgcggcgg tgcccgaggc cgccagtcct ttcccgagct tgcccttctc gctgaacagt 13440
atccgcagca gcgagctggg caggatcacg cgcccgcgct tgctgggcga agaggagtac 13500
ttgaatgact cgctgttgag acccgagcgg gagaagaact tccccaataa cgggatagaa 13560
agcctggtgg acaagatgag ccgctggaag acgtatgcgc aggagcacag ggacgatccc 13620
cgggcgtcgc agggggccac gagccggggc agcgccgccc gtaaacgccg gtggcacgac 13680
aggcagcggg gacagatgtg ggacgatgag gactccgccg acgacagcag cgtgttggac 13740
ttgggtggga gtggtaaccc gttcgctcac ctgcgccccc gtatcgggcg catgatgtaa 13800
gagaaaccga aaataaatga tactcaccaa ggccatggcg accagcgtgc gttcgtttct 13860
tctctgttgt tgttgtatct agtatgatga ggcgtgcgta cccggagggt cctcctccct 13920
cgtacgagag cgtgatgcag caggcgatgg cggcggcggc gatgcagccc ccgctggagg 13980
ctccttacgt gcccccgcgg tacctggcgc ctacggaggg gcggaacagc attcgttact 14040
cggagctggc acccttgtac gataccaccc ggttgtacct ggtggacaac aagtcggcgg 14100
acatcgcctc gctgaactac cagaacgacc acagcaactt cctgaccacc gtggtgcaga 14160
acaatgactt cacccccacg gaggccagca cccagaccat caactttgac gagcgctcgc 14220
ggtggggcgg ccagctgaaa accatcatgc acaccaacat gcccaacgtg aacgagttca 14280
tgtacagcaa caagttcaag gcgcgggtga tggtctcccg caagaccccc aatggggtga 14340
cagtgacaga ggattatgat ggtagtcagg atgagctgaa gtatgaatgg gtggaatttg 14400
agctgcccga aggcaacttc tcggtgacca tgaccatcga cctgatgaac aacgccatca 14460
tcgacaatta cttggcggtg gggcggcaga acggggtgct ggagagcgac atcggcgtga 14520
agttcgacac taggaacttc aggctgggct gggaccccgt gaccgagctg gtcatgcccg 14580
gggtgtacac caacgaggct ttccatcccg atattgtctt gctgcccggc tgcggggtgg 14640
acttcaccga gagccgcctc agcaacctgc tgggcattcg caagaggcag cccttccagg 14700
aaggcttcca gatcatgtac gaggatctgg aggggggcaa catccccgcg ctcctggatg 14760
tcgacgccta tgagaaaagc aaggaggatg cagcagctga agcaactgca gccgtagcta 14820
ccgcctctac cgaggtcagg ggcgataatt ttgcaagcgc cgcagcagtg gcagcggccg 14880
aggcggctga aaccgaaagt aagatagtca ttcagccggt ggagaaggat agcaagaaca 14940
ggagctacaa cgtactaccg gacaagataa acaccgccta ccgcagctgg tacctagcct 15000
acaactatgg cgaccccgag aagggcgtgc gctcctggac gctgctcacc acctcggacg 15060
tcacctgcgg cgtggagcaa gtctactggt cgctgcccga catgatgcaa gacccggtca 15120
ccttccgctc cacgcgtcaa gttagcaact acccggtggt gggcgccgag ctcctgcccg 15180
tctactccaa gagcttcttc aacgagcagg ccgtctactc gcagcagctg cgcgccttca 15240
cctcgcttac gcacgtcttc aaccgcttcc ccgagaacca gatcctcgtc cgcccgcccg 15300
cgcccaccat taccaccgtc agtgaaaacg ttcctgctct cacagatcac gggaccctgc 15360
cgctgcgcag cagtatccgg ggagtccagc gcgtgaccgt tactgacgcc agacgccgca 15420
cctgccccta cgtctacaag gccctgggca tagtcgcgcc gcgcgtcctc tcgagccgca 15480
ccttctaaat gtccattctc atctcgccca gtaataacac cggttggggc ctgcgcgcgc 15540
ccagcaagat gtacggaggc gctcgccaac gctccacgca acaccccgtg cgcgtgcgcg 15600
ggcacttccg cgctccctgg ggcgccctca agggccgcgt gcggtcgcgc accaccgtcg 15660
acgacgtgat cgaccaggtg gtggccgacg cgcgcaacta cacccccgcc gccgcgcccg 15720
tctccaccgt ggacgccgtc atcgacagcg tggtggccga cgcgcgccgg tacgcccgcg 15780
ccaagagccg gcggcggcgc atcgcccggc ggcaccggag cacccccgcc atgcgcgcgg 15840
cgcgagcctt gctgcgcagg gccaggcgca cgggacgcag ggccatgctc agggcggcca 15900
gacgcgcggc ttcaggcgcc agcgccggca ggacccggag acgcgcggcc acggcggcgg 15960
cagcggccat cgccagcatg tcccgcccgc ggcgagggaa cgtgtactgg gtgcgcgacg 16020
ccgccaccgg tgtgcgcgtg cccgtgcgca cccgcccccc tcgcacttga agatgttcac 16080
ttcgcgatgt tgatgtgtcc cagcggcgag gaggatgtcc aagcgcaaat tcaaggaaga 16140
gatgctccag gtcatcgcgc ctgagatcta cggccctgcg gtggtgaagg aggaaagaaa 16200
gccccgcaaa atcaagcggg tcaaaaagga caaaaaggaa gaagaaagtg atgtggacgg 16260
attggtggag tttgtgcgcg agttcgcccc ccggcggcgc gtgcagtggc gcgggcggaa 16320
ggtgcaaccg gtgctgagac ccggcaccac cgtggtcttc acgcccggcg agcgctccgg 16380
caccgcttcc aagcgctcct acgacgaggt gtacggggat gatgatattc tggagcaggc 16440
ggccgagcgc ctgggcgagt ttgcttacgg caagcgcagc cgttccgcac cgaaggaaga 16500
ggcggtgtcc atcccgctgg accacggcaa ccccacgccg agcctcaagc ccgtgacctt 16560
gcagcaggtg ctgccgaccg cggcgccgcg ccgggggttc aagcgcgagg gcgaggatct 16620
gtaccccacc atgcagctga tggtgcccaa gcgccagaag ctggaagacg tgctggagac 16680
catgaaggtg gacccggacg tgcagcccga ggtcaaggtg cggcccatca agcaggtggc 16740
cccgggcctg ggcgtgcaga ccgtggacat caagattccc acggagccca tggaaacgca 16800
gaccgagccc atgatcaagc ccagcaccag caccatggag gtgcagacgg atccctggat 16860
gccatcggct cctagtcgaa gaccccggcg caagtacggc gcggccagcc tgctgatgcc 16920
caactacgcg ctgcatcctt ccatcatccc cacgccgggc taccgcggca cgcgcttcta 16980
ccgcggtcat accagcagcc gccgccgcaa gaccaccact cgccgccgcc gtcgccgcac 17040
cgccgctgca accacccctg ccgccctggt gcggagagtg taccgccgcg gccgcgcacc 17100
tctgaccctg ccgcgcgcgc gctaccaccc gagcatcgcc atttaaactt tcgcctgctt 17160
tgcagatcaa tggccctcac atgccgcctt cgcgttccca ttacgggcta ccgaggaaga 17220
aaaccgcgcc gtagaaggct ggcggggaac gggatgcgtc gccaccacca ccggcggcgg 17280
cgcgccatca gcaagcggtt ggggggaggc ttcctgcccg cgctgatccc catcatcgcc 17340
gcggcgatcg gggcgatccc cggcattgct tccgtggcgg tgcaggcctc tcagcgccac 17400
tgagacacac ttggaaacat cttgtaataa accaatggac tctgacgctc ctggtcctgt 17460
gatgtgtttt cgtagacaga tggaagacat caatttttcg tccctggctc cgcgacacgg 17520
cacgcggccg ttcatgggca cctggagcga catcggcacc agccaactga acgggggcgc 17580
cttcaattgg agcagtctct ggagcgggct taagaatttc gggtccacgc ttaaaaccta 17640
tggcagcaag gcgtggaaca gcaccacagg gcaggcgctg agggataagc tgaaagagca 17700
gaacttccag cagaaggtgg tcgatgggct cgcctcgggc atcaacgggg tggtggacct 17760
ggccaaccag gccgtgcagc ggcagatcaa cagccgcctg gacccggtgc cgcccgccgg 17820
ctccgtggag atgccgcagg tggaggagga gctgcctccc ctggacaagc ggggcgagaa 17880
gcgaccccgc cccgatgcgg aggagacgct gctgacgcac acggacgagc cgcccccgta 17940
cgaggaggcg gtgaaactgg gtctgcccac cacgcggccc atcgcgcccc tggccaccgg 18000
ggtgctgaaa cccgaaaagc ccgcgaccct ggacttgcct cctccccagc cttcccgccc 18060
ctctacagtg gctaagcccc tgccgccggt ggccgtggcc cgcgcgcgac ccgggggcac 18120
cgcccgccct catgcgaact ggcagagcac tctgaacagc atcgtgggtc tgggagtgca 18180
gagtgtgaag cgccgccgct gctattaaac ctaccgtagc gcttaacttg cttgtctgtg 18240
tgtgtatgta ttatgtcgcc gccgccgctg tccaccagaa ggaggagtga agaggcgcgt 18300
cgccgagttg caagatggcc accccatcga tgctgcccca gtgggcgtac atgcacatcg 18360
ccggacagga cgcttcggag tacctgagtc cgggtctggt gcagtttgcc cgcgccacag 18420
acacctactt cagtctgggg aacaagttta ggaaccccac ggtggcgccc acgcacgatg 18480
tgaccaccga ccgcagccag cggctgacgc tgcgcttcgt gcccgtggac cgcgaggaca 18540
acacctactc gtacaaagtg cgctacacgc tggccgtggg cgacaaccgc gtgctggaca 18600
tggccagcac ctactttgac atccgcggcg tgctggatcg gggccctagc ttcaaaccct 18660
actccggcac cgcctacaac agtctggccc ccaagggagc acccaacact tgtcagtgga 18720
catataaagc cgatggtgaa actgccacag aaaaaaccta tacatatgga aatgcacccg 18780
tgcagggcat taacatcaca aaagatggta ttcaacttgg aactgacacc gatgatcagc 18840
caatctacgc agataaaacc tatcagcctg aacctcaagt gggtgatgct gaatggcatg 18900
acatcactgg tactgatgaa aagtatggag gcagagctct taagcctgat accaaaatga 18960
agccttgtta tggttctttt gccaagccta ctaataaaga aggaggtcag gcaaatgtga 19020
aaacaggaac aggcactact aaagaatatg acatagacat ggctttcttt gacaacagaa 19080
gtgcggctgc tgctggccta gctccagaaa ttgttttgta tactgaaaat gtggatttgg 19140
aaactccaga tacccatatt gtatacaaag caggcacaga tgacagcagc tcttctatta 19200
atttgggtca gcaagccatg cccaacagac ctaactacat tggtttcaga gacaacttta 19260
tcgggctcat gtactacaac agcactggca atatgggggt gctggccggt caggcttctc 19320
agctgaatgc tgtggttgac ttgcaagaca gaaacaccga gctgtcctac cagctcttgc 19380
ttgactctct gggtgacaga acccggtatt tcagtatgtg gaatcaggcg gtggacagct 19440
atgatcctga tgtgcgcatt attgaaaatc atggtgtgga ggatgaactt cccaactatt 19500
gtttccctct ggatgctgtt ggcagaacag atacttatca gggaattaag gctaatggaa 19560
ctgatcaaac cacatggacc aaagatgaca gtgtcaatga tgctaatgag ataggcaagg 19620
gtaatccatt cgccatggaa atcaacatcc aagccaacct gtggaggaac ttcctctacg 19680
ccaacgtggc cctgtacctg cccgactctt acaagtacac gccggccaat gttaccctgc 19740
ccaccaacac caacacctac gattacatga acggccgggt ggtggcgccc tcgctggtgg 19800
actcctacat caacatcggg gcgcgctggt cgctggatcc catggacaac gtgaacccct 19860
tcaaccacca ccgcaatgcg gggctgcgct accgctccat gctcctgggc aacgggcgct 19920
acgtgccctt ccacatccag gtgccccaga aatttttcgc catcaagagc ctcctgctcc 19980
tgcccgggtc ctacacctac gagtggaact tccgcaagga cgtcaacatg atcctgcaga 20040
gctccctcgg caacgacctg cgcacggacg gggcctccat ctccttcacc agcatcaacc 20100
tctacgccac cttcttcccc atggcgcaca acacggcctc cacgctcgag gccatgctgc 20160
gcaacgacac caacgaccag tccttcaacg actacctctc ggcggccaac atgctctacc 20220
ccatcccggc caacgccacc aacgtgccca tctccatccc ctcgcgcaac tgggccgcct 20280
tccgcggctg gtccttcacg cgtctcaaga ccaaggagac gccctcgctg ggctccgggt 20340
tcgaccccta cttcgtctac tcgggctcca tcccctacct cgacggcacc ttctacctca 20400
accacacctt caagaaggtc tccatcacct tcgactcctc cgtcagctgg cccggcaacg 20460
accggctcct gacgcccaac gagttcgaaa tcaagcgcac cgtcgacggc gagggctaca 20520
acgtggccca gtgcaacatg accaaggact ggttcctggt ccagatgctg gcccactaca 20580
acatcggcta ccagggcttc tacgtgcccg agggctacaa ggaccgcatg tactccttct 20640
tccgcaactt ccagcccatg agccgccagg tggtggacga ggtcaactac aaggactacc 20700
aggccgtcac cctggcctac cagcacaaca actcgggctt cgtcggctac ctcgcgccca 20760
ccatgcgcca gggccagccc taccccgcca actaccccta cccgctcatc ggcaagagcg 20820
ccgtcaccag cgtcacccag aaaaagttcc tctgcgacag ggtcatgtgg cgcatcccct 20880
tctccagcaa cttcatgtcc atgggcgcgc tcaccgacct cggccagaac atgctctatg 20940
ccaactccgc ccacgcgcta gacatgaatt tcgaagtcga ccccatggat gagtccaccc 21000
ttctctatgt tgtcttcgaa gtcttcgacg tcgtccgagt gcaccagccc caccgcggcg 21060
tcatcgaggc cgtctacctg cgcaccccct tctcggccgg taacgccacc acctaagctc 21120
ttgcttcttg caagccatgg ccgcgggctc cggcgagcag gagctcaggg ccatcatccg 21180
cgacctgggc tgcgggccct acttcctggg caccttcgat aagcgcttcc cgggattcat 21240
ggccccgcac aagctggcct gcgccatcgt caacacggcc ggccgcgaga ccgggggcga 21300
gcactggctg gccttcgcct ggaacccgcg ctcgaacacc tgctacctct tcgacccctt 21360
cgggttctcg gacgagcgcc tcaagcagat ctaccagttc gagtacgagg gcctgctgcg 21420
ccgcagcgcc ctggccaccg aggaccgctg cgtcaccctg gaaaagtcca cccagaccgt 21480
gcagggtccg cgctcggccg cctgcgggct cttctgctgc atgttcctgc acgccttcgt 21540
gcactggccc gaccgcccca tggacaagaa ccccaccatg aacttgctga cgggggtgcc 21600
caacggcatg ctccagtcgc cccaggtgga acccaccctg cgccgcaacc aggaggcgct 21660
ctaccgcttc ctcaactccc actccgccta ctttcgctcc caccgcgcgc gcatcgagaa 21720
ggccaccgcc ttcgaccgca tgaatcaaga catgtaaacc gtgtgtgtat gttaaatgtc 21780
tttaataaac agcactttca tgttacacat gcatctgaga tgatttattt agaaatcgaa 21840
agggttctgc cgggtctcgg catggcccgc gggcagggac acgttgcgga actggtactt 21900
ggccagccac ttgaactcgg ggatcagcag tttgggcagc ggggtgtcgg ggaaggagtc 21960
ggtccacagc ttccgcgtca gttgcagggc gcccagcagg tcgggcgcgg agatcttgaa 22020
atcgcagttg ggacccgcgt tctgcgcgcg ggagttgcgg tacacggggt tgcagcactg 22080
gaacaccatc agggccgggt gcttcacgct cgccagcacc gtcgcgtcgg tgatgctctc 22140
cacgtcgagg tcctcggcgt tggccatccc gaagggggtc atcttgcagg tctgccttcc 22200
catggtgggc acgcacccgg gcttgtggtt gcaatcgcag tgcaggggga tcagcatcat 22260
ctgggcctgg tcggcgttca tccccgggta catggccttc atgaaagcct ccaattgcct 22320
gaacgcctgc tgggccttgg ctccctcggt gaagaagacc ccgcaggact tgctagagaa 22380
ctggttggtg gcgcacccgg cgtcgtgcac gcagcagcgc gcgtcgttgt tggccagctg 22440
caccacgctg cgcccccagc ggttctgggt gatcttggcc cggtcggggt tctccttcag 22500
cgcgcgctgc ccgttctcgc tcgccacatc catctcgatc atgtgctcct tctggatcat 22560
ggtggtcccg tgcaggcacc gcagcttgcc ctcggcctcg gtgcacccgt gcagccacag 22620
cgcgcacccg gtgcactccc agttcttgtg ggcgatctgg gaatgcgcgt gcacgaagcc 22680
ctgcaggaag cggcccatca tggtggtcag ggtcttgttg ctagtgaagg tcagcggaat 22740
gccgcggtgc tcctcgttga tgtacaggtg gcagatgcgg cggtacacct cgccctgctc 22800
gggcatcagc tggaagttgg ctttcaggtc ggtctccacg cggtagcggt ccatcagcat 22860
agtcatgatt tccataccct tctcccaggc cgagacgatg ggcaggctca tagggttctt 22920
caccatcatc ttagcgctag cagccgcggc cagggggtcg ctctcgtcca gggtctcaaa 22980
gctccgcttg ccgtccttct cggtgatccg caccgggggg tagctgaagc ccacggccgc 23040
cagctcctcc tcggcctgtc tttcgtcctc gctgtcctgg ctgacgtcct gcaggaccac 23100
atgcttggtc ttgcggggtt tcttcttggg cggcagcggc ggcggagatg ttggagatgg 23160
cgagggggag cgcgagttct cgctcaccac tactatctct tcctcttctt ggtccgaggc 23220
cacgcggcgg taggtatgtc tcttcggggg cagaggcgga ggcgacgggc tctcgccgcc 23280
gcgacttggc ggatggctgg cagagcccct tccgcgttcg ggggtgcgct cccggcggcg 23340
ctctgactga cttcctccgc ggccggccat tgtgttctcc tagggaggaa caacaagcat 23400
ggagactcag ccatcgccaa cctcgccatc tgcccccacc gccgacgaga agcagcagca 23460
gcagaatgaa agcttaaccg ccccgccgcc cagccccgcc acctccgacg cggccgtccc 23520
agacatgcaa gagatggagg aatccatcga gattgacctg ggctatgtga cgcccgcgga 23580
gcacgaggag gagctggcag tgcgcttttc acaagaagag atacaccaag aacagccaga 23640
gcaggaagca gagaatgagc agagtcaggc tgggctcgag catgacggcg actacctcca 23700
cctgagcggg ggggaggacg cgctcatcaa gcatctggcc cggcaggcca ccatcgtcaa 23760
ggatgcgctg ctcgaccgca ccgaggtgcc cctcagcgtg gaggagctca gccgcgccta 23820
cgagttgaac ctcttctcgc cgcgcgtgcc ccccaagcgc cagcccaatg gcacctgcga 23880
gcccaacccg cgcctcaact tctacccggt cttcgcggtg cccgaggccc tggccaccta 23940
ccacatcttt ttcaagaacc aaaagatccc cgtctcctgc cgcgccaacc gcacccgcgc 24000
cgacgccctt ttcaacctgg gtcccggcgc ccgcctacct gatatcgcct ccttggaaga 24060
ggttcccaag atcttcgagg gtctgggcag cgacgagact cgggccgcga acgctctgca 24120
aggagaagga ggagagcatg agcaccacag cgccctggtc gagttggaag gcgacaacgc 24180
gcggctggcg gtgctcaaac gcacggtcga gctgacccat ttcgcctacc cggctctgaa 24240
cctgcccccc aaagtcatga gcgcggtcat ggaccaggtg ctcatcaagc gcgcgtcgcc 24300
catctccgag gacgagggca tgcaagactc cgaggagggc aagcccgtgg tcagcgacga 24360
gcagctggcc cggtggctgg gtcctaatgc tagtccccag agtttggaag agcggcgcaa 24420
actcatgatg gccgtggtcc tggtgaccgt ggagctggag tgcctgcgcc gcttcttcgc 24480
cgacgcggag accctgcgca aggtcgagga gaacctgcac tacctcttca ggcacgggtt 24540
cgtgcgccag gcctgcaaga tctccaacgt ggagctgacc aacctggtct cctacatggg 24600
catcttgcac gagaaccgcc tggggcagaa cgtgctgcac accaccctgc gcggggaggc 24660
ccggcgcgac tacatccgcg actgcgtcta cctctacctc tgccacacct ggcagacggg 24720
catgggcgtg tggcagcagt gtctggagga gcagaacctg aaagagctct gcaagctcct 24780
gcagaagaac ctcaagggtc tgtggaccgg gttcgacgag cgcaccaccg cctcggacct 24840
ggccgacctc attttccccg agcgcctcag gctgacgctg cgcaacggcc tgcccgactt 24900
tatgagccaa agcatgttgc aaaactttcg ctctttcatc ctcgaacgct ccggaatcct 24960
gcccgccacc tgctccgcgc tgccctcgga cttcgtgccg ctgaccttcc gcgagtgccc 25020
cccgccgctg tggagccact gctacctgct gcgcctggcc aactacctgg cctaccactc 25080
ggacgtgatc gaggacgtca gcggcgaggg cctgctcgag tgccactgcc gctgcaacct 25140
ctgcacgccg caccgctccc tggcctgcaa cccccagctg ctgagcgaga cccagatcat 25200
cggcaccttc gagttgcaag ggcccagcga aggcgagggt tcagccgcca aggggggtct 25260
gaaactcacc ccggggctgt ggacctcggc ctacttgcgc aagttcgtgc ccgaggacta 25320
ccatcccttc gagatcaggt tctacgagga ccaatcccat ccgcccaagg ccgagctgtc 25380
ggcctgcgtc atcacccagg gggcgatcct ggcccaattg caagccatcc agaaatcccg 25440
ccaagaattc ttgctgaaaa agggccgcgg ggtctacctc gacccccaga ccggtgagga 25500
gctcaacccc ggcttccccc aggatgcccc gaggaaacaa gaagctgaaa gtggagctgc 25560
cgcccgtgga ggatttggag gaagactggg agaacagcag tcaggcagag gaggaggaga 25620
tggaggaaga ctgggacagc actcaggcag aggaggacag cctgcaagac agtctggagg 25680
aagacgagga ggaggcagag gaggaggtgg aagaagcagc cgccgccaga ccgtcgtcct 25740
cggcggggga gaaagcaagc agcacggata ccatctccgc tccgggtcgg ggtcccgctc 25800
gaccacacag tagatgggac gagaccggac gattcccgaa ccccaccacc cagaccggta 25860
agaaggagcg gcagggatac aagtcctggc gggggcacaa aaacgccatc gtctcctgct 25920
tgcaggcctg cgggggcaac atctccttca cccggcgcta cctgctcttc caccgcgggg 25980
tgaactttcc ccgcaacatc ttgcattact accgtcacct ccacagcccc tactacttcc 26040
aagaagaggc agcagcagca gaaaaagacc agcagaaaac cagcagctag aaaatccaca 26100
gcggcggcag caggtggact gaggatcgcg gcgaacgagc cggcgcaaac ccgggagctg 26160
aggaaccgga tctttcccac cctctatgcc atcttccagc agagtcgggg gcaggagcag 26220
gaactgaaag tcaagaaccg ttctctgcgc tcgctcaccc gcagttgtct gtatcacaag 26280
agcgaagacc aacttcagcg cactctcgag gacgccgagg ctctcttcaa caagtactgc 26340
gcgctcactc ttaaagagta gcccgcgccc gcccagtcgc agaaaaaggc gggaattacg 26400
tcacctgtgc ccttcgccct agccgcctcc acccatcatc atgagcaaag agattcccac 26460
gccttacatg tggagctacc agccccagat gggcctggcc gccggtgccg cccaggacta 26520
ctccacccgc atgaattggc tcagcgccgg gcccgcgatg atctcacggg tgaatgacat 26580
ccgcgcccac cgaaaccaga tactcctaga acagtcagcg ctcaccgcca cgccccgcaa 26640
tcacctcaat ccgcgtaatt ggcccgccgc cctggtgtac caggaaattc cccagcccac 26700
gaccgtacta cttccgcgag acgcccaggc cgaagtccag ctgactaact caggtgtcca 26760
gctggcgggc ggcgccaccc tgtgtcgtca ccgccccgct cagggtataa agcggctggt 26820
gatccggggc agaggcacac agctcaacga cgaggtggtg agctcttcgc tgggtctgcg 26880
acctgacgga gtcttccaac tcgccggatc ggggagatct tccttcacgc ctcgtcaggc 26940
cgtcctgact ttggagagtt cgtcctcgca gccccgctcg ggtggcatcg gcactctcca 27000
gttcgtggag gagttcactc cctcggtcta cttcaacccc ttctccggct cccccggcca 27060
ctacccggac gagttcatcc cgaacttcga cgccatcagc gagtcggtgg acggctacga 27120
ttgaatgtcc catggtggcg cagctgacct agctcggctt cgacacctgg accactgccg 27180
ccgcttccgc tgcttcgctc gggatctcgc cgagtttgcc tactttgagc tgcccgagga 27240
gcaccctcag ggcccggccc acggagtgcg gatcgtcgtc gaagggggcc tcgactccca 27300
cctgcttcgg atcttcagcc agcgtccgat cctggtcgag cgcgagcaag gacagaccct 27360
tctgactctg tactgcatct gcaaccaccc cggcctgcat gaaagtcttt gttgtctgct 27420
gtgtactgag tataataaaa gctgagatca gcgactactc cggacttccg tgtgttcctg 27480
aatccatcaa ccagtctttg ttcttcaccg ggaacgagac cgagctccag ctccagtgta 27540
agccccacaa gaagtacctc acctggctgt tccagggctc cccgatcgcc gttgtcaacc 27600
actgcgacaa cgacggagtc ctgctgagcg gccctgccaa ccttactttt tccacccgca 27660
gaagcaagct ccagctcttc caacccttcc tccccgggac ctatcagtgc gtctcgggac 27720
cctgccatca caccttccac ctgatcccga ataccacagc gtcgctcccc gctactaaca 27780
accaaactaa cctccaccaa cgccaccgtc gcgacctttc tgaatctaat actaccaccc 27840
acaccggagg tgagctccga ggtcaaccaa cctctgggat ttactacggc ccctgggagg 27900
tggttgggtt aatagcgcta ggcctagttg cgggtgggct tttggttctc tgctacctat 27960
acctcccttg ctgttcgtac ttagtggtgc tgtgttgctg gtttaagaaa tggggaagat 28020
caccctagtg agctgcggtg cgctggtggc ggtgttgctt tcgattgtgg gactgggcgg 28080
tgcggctgta gtgaaggaga aggccgatcc ctgcttgcat ttcaatccca acaaatgcca 28140
gctgagtttt cagcccgatg gcaatcggtg cgcggtactg atcaagtgcg gatgggaatg 28200
cgagaacgtg agaatcgagt acaataacaa gactcggaac aatactctcg cgtccgtgtg 28260
gcagcccggg gaccccgagt ggtacaccgt ctctgtcccc ggtgctgacg gctccccgcg 28320
caccgtgaat aatactttca tttttgcgca catgtgcgac acggtcatgt ggatgagcaa 28380
gcagtacgat atgtggcccc ccacgaagga gaacatcgtg gtcttctcca tcgcttacag 28440
cctgtgcacg gcgctaatca ccgctatcgt gtgcctgagc attcacatgc tcatcgctat 28500
tcgccccaga aataatgccg aaaaagaaaa acagccataa cgtttttttt cacacctttt 28560
tcagaccatg gcctctgtta aatttttgct tttatttgcc agtctcattg ccgtcattca 28620
tggaatgagt aatgagaaaa ttactattta cactggcact aatcacacat tgaaaggtcc 28680
agaaaaagcc acagaagttt catggtattg ttattttaat gaatcagatg tatctactga 28740
actctgtgga aacaataaca aaaaaaatga gagcattact ctcatcaagt ttcaatgtgg 28800
atctgactta accctaatta acatcactag agactatgta ggtatgtatt atggaactac 28860
agcaggcatt tcggacatgg aattttatca agtttctgtg tctgaaccca ccacgcctag 28920
aatgaccaca accacaaaaa ctacacctgt taccactatg cagctcacta ccaataacat 28980
ttttgccatg cgtcaaatgg tcaacaatag cactcaaccc accccaccca gtgaggaaat 29040
tcccaaatcc atgattggca ttattgttgc tgtagtggtg tgcatgttga tcatcgcctt 29100
gtgcatggtg tactatgcct tctgctacag aaagcacaga ctgaacgaca agctggaaca 29160
cttactaagt gttgaatttt aattttttag aaccatgaag atcctaggcc ttttaatttt 29220
ttctatcatt acctctgctc tatgcaattc tgacaatgag gacgttactg tcgttgtcgg 29280
atcaaattat acactgaaag gtccagcgaa gggtatgctt tcgtggtatt gctattttgg 29340
atctgacact acagaaactg aattatgcaa tcttaagaat ggcaaaattc aaaattctaa 29400
aattaacaat tatatatgca atggtactga tctgatactc ctcaatatca cgaaatcata 29460
tgctggcagt tacacctgcc ctggagatga tgctgacagt atgatttttt acaaagtaac 29520
tgttgttgat cccactactc cacctccacc caccacaact actcacacca cacacacaga 29580
tcaaaccgca gcagaggagg cagcaaagtt agccttgcag gtccaagaca gttcatttgt 29640
tggcattacc cctacacctg atcagcggtg tccggggctg ctagtcagcg gcattgtcgg 29700
tgtgctttcg ggattagcag tcataatcat ctgcatgttc atttttgctt gctgctatag 29760
aaggctttac cgacaaaaat cagacccact gctgaacctc tatgtttaat tttttccaga 29820
gtcatgaagg cagttagcgc tctagttttt tgttctttga ttggcattgt tttttgcaat 29880
cctattccta aagttagctt tattaaagat gtgaatgtta ctgagggggg caatgtgaca 29940
ctggtaggtg tagagggtgc tgaaaacacc acctggacaa aataccacct caatgggtgg 30000
aaagatattt gcaattggag tgtattagtt tatacatgtg agggagttaa tcttaccatt 30060
gtcaatgcca cctcagctca aaatggtaga attcaaggac aaagtgtcag tgtatctaat 30120
gggtatttta cccaacatac ttttatctat gacgttaaag tcataccact gcctacgcct 30180
agcccaccta gcactaccac acagacaacc cacactacac agacaaccac atacagtaca 30240
ttaaatcagc ctaccaccac tacagcagca gaggttgcca gctcgtctgg ggtccgagtg 30300
gcatttttga tgtgggcccc atctagcagt cccactgcta gtaccaatga gcagactact 30360
gaatttttgt ccactgtcga gagccacacc acagctacct ccagtgcctt ctctagcacc 30420
gccaatctct cctcgctttc ctctacacca atcagtcccg ctactactcc tagccccgct 30480
cctcttccca ctcccctgaa gcaaacagac ggcggcatgc aatggcagat caccctgctc 30540
attgtgatcg ggttggtcat cctggccgtg ttgctctact acatcttctg ccgccgcatt 30600
cccaacgcgc accgcaagcc ggtctacaag cccatcattg tcgggcagcc ggagccgctt 30660
caggtggaag ggggtctaag gaatcttctc ttctctttta cagtatggtg attgaactat 30720
gattcctaga caattcttga tcactattct tatctgcctc ctccaagtct gtgccaccct 30780
cgctctggtg gccaacgcca gtccagactg tattgggccc ttcgcctcct acgtgctctt 30840
tgccttcacc acctgcatct gctgctgtag catagtctgc ctgcttatca ccttcttcca 30900
gttcattgac tggatctttg tgcgcatcgc ctacctgcgc caccaccccc agtaccgcga 30960
ccagcgagtg gcgcggctgc tcaggctcct ctgataagca tgcgggctct gctacttctc 31020
gcgcttctgc tgttagtgct cccccgtccc gtcgaccccc ggtcccccac ccagtccccc 31080
gaggaggtcc gcaaatgcaa attccaagaa ccctggaaat tcctcaaatg ctaccgccaa 31140
aaatcagaca tgcatcccag ctggatcatg atcattggga tcgtgaacat tctggcctgc 31200
accctcatct cctttgtgat ttacccctgc tttgactttg gttggaactc gccagaggcg 31260
ctctatctcc cgcctgaacc tgacacacca ccacagcaac ctcaggcaca cgcactacca 31320
ccactacagc ctaggccaca atacatgccc atattagact atgaggccga gccacagcga 31380
cccatgctcc ccgctattag ttacttcaat ctaaccggcg gagatgactg acccactggc 31440
caacaacaac gtcaacgacc ttctcctgga catggacggc cgcgcctcgg agcagcgact 31500
cgcccaactt cgcattcgcc agcagcagga gagagccgtc aaggagctgc aggatgcggt 31560
ggccatccac cagtgcaaga gaggcatctt ctgcctggtg aaacaggcca agatctccta 31620
cgaggtcact ccaaacgacc atcgcctctc ctacgagctc ctgcagcagc gccagaagtt 31680
cacctgcctg gtcggagtca accccatcgt catcacccag cagtctggcg ataccaaggg 31740
gtgcatccac tgctcctgcg actcccccga ctgcgtccac actctgatca agaccctctg 31800
cggcctccgc gacctcctcc ccatgaacta atcaccccct tatccagtga aataaagatc 31860
atattgatga tgattttaca gaaataaaaa ataatcattt gatttgaaat aaagatacaa 31920
tcatattgat gatttgagtt taacaaaaaa ataaagaatc acttacttga aatctgatac 31980
caggtctctg tccatgtttt ctgccaacac cacttcactc ccctcttccc agctctggta 32040
ctgcaggccc cggcgggctg caaacttcct ccacacgctg aaggggatgt caaattcctc 32100
ctgtccctca atcttcattt tatcttctat cagatgtcca aaaagcgcgt ccgggtggat 32160
gatgacttcg accccgtcta cccctacgat gcagacaacg caccgaccgt gcccttcatc 32220
aaccccccct tcgtctcttc agatggattc caagagaagc ccctgggggt gttgtccctg 32280
cgactggccg accccgtcac caccaagaac ggggaaatca ccctcaagct gggagagggg 32340
gtggacctcg attcctcggg aaaactcatc tccaacacgg ccaccaaggc cgccgcccct 32400
ctcagttttt ccaacaacac catttccctt aacatggatc acccctttta cactaaagat 32460
ggaaaattat ccttacaagt ttctccacca ttaaatatac tgagaacaag cattctaaac 32520
acactagctt taggttttgg atcaggttta ggactccgtg gctctgcctt ggcagtacag 32580
ttagtctctc cacttacatt tgatactgat ggaaacataa agcttacctt agacagaggt 32640
ttgcatgtta caacaggaga tgcaattgaa agcaacataa gctgggctaa aggtttaaaa 32700
tttgaagatg gagccatagc aaccaacatt ggaaatgggt tagagtttgg aagcagtagt 32760
acagaaacag gtgttgatga tgcttaccca atccaagtta aacttggatc tggccttagc 32820
tttgacagta caggagccat aatggctggt aacaaagaag acgataaact cactttgtgg 32880
acaacacctg atccatcacc aaactgtcaa atactcgcag aaaatgatgc aaaactaaca 32940
ctttgcttga ctaaatgtgg tagtcaaata ctggccactg tgtcagtctt agttgtagga 33000
agtggaaacc taaaccccat tactggcacc gtaagcagtg ctcaggtgtt tctacgtttt 33060
gatgcaaacg gtgttctttt aacagaacat tctacactaa aaaaatactg ggggtatagg 33120
cagggagata gcatagatgg cactccatat accaatgctg taggattcat gcccaattta 33180
aaagcttatc caaagtcaca aagttctact actaaaaata atatagtagg gcaagtatac 33240
atgaatggag atgtttcaaa acctatgctt ctcactataa ccctcaatgg tactgatgac 33300
agcaacagta catattcaat gtcattttca tacacctgga ctaatggaag ctatgttgga 33360
gcaacatttg gggctaactc ttataccttc tcatacatcg cccaagaatg aacactgtat 33420
cccaccctgc atgccaaccc ttcccacccc actctgtgga acaaactctg aaacacaaaa 33480
taaaataaag ttcaagtgtt ttattgattc aacagtttta caggattcga gcagttattt 33540
ttcctccacc ctcccaggac atggaataca ccaccctctc cccccgcaca gccttgaaca 33600
tctgaatgcc attggtgatg gacatgcttt tggtctccac gttccacaca gtttcagagc 33660
gagccagtct cgggtcggtc agggagatga aaccctccgg gcactcccgc atctgcacct 33720
cacagctcaa cagctgagga ttgtcctcgg tggtcgggat cacggttatc tggaagaagc 33780
agaagagcgg cggtgggaat catagtccgc gaacgggatc ggccggtggt gtcgcatcag 33840
gccccgcagc agtcgctgcc gccgccgctc cgtcaagctg ctgctcaggg ggtccgggtc 33900
cagggactcc ctcagcatga tgcccacggc cctcagcatc agtcgtctgg tgcggcgggc 33960
gcagcagcgc atgcggatct cgctcaggtc gctgcagtac gtgcaacaca gaaccaccag 34020
gttgttcaac agtccatagt tcaacacgct ccagccgaaa ctcatcgcgg gaaggatgct 34080
acccacgtgg ccgtcgtacc agatcctcag gtaaatcaag tggtgccccc tccagaacac 34140
gctgcccacg tacatgatct ccttgggcat gtggcggttc accacctccc ggtaccacat 34200
caccctctgg ttgaacatgc agccccggat gatcctgcgg aaccacaggg ccagcaccgc 34260
cccgcccgcc atgcagcgaa gagaccccgg gtcccggcaa tggcaatgga ggacccaccg 34320
ctcgtacccg tggatcatct gggagctgaa caagtctatg ttggcacagc acaggcatat 34380
gctcatgcat ctcttcagca ctctcaactc ctcgggggtc aaaaccatat cccagggcac 34440
ggggaactct tgcaggacag cgaaccccgc agaacagggc aatcctcgca cagaacttac 34500
attgtgcatg gacagggtat cgcaatcagg cagcaccggg tgatcctcca ccagagaagc 34560
gcgggtctcg gtctcctcac agcgtggtaa gggggccggc cgatacgggt gatggcggga 34620
cgcggctgat cgtgttcgcg accgtgtcat gatgcagttg ctttcggaca ttttcgtact 34680
tgctgtagca gaacctggtc cgggcgctgc acaccgatcg ccggcggcgg tctcggcgct 34740
tggaacgctc ggtgttgaaa ttgtaaaaca gccactctct cagaccgtgc agcagatcta 34800
gggcctcagg agtgatgaag atcccatcat gcctgatggc tctgatcaca tcgaccaccg 34860
tggaatgggc cagacccagc cagatgatgc aattttgttg ggtttcggtg acggcggggg 34920
agggaagaac aggaagaacc atgattaact tttaatccaa acggtctcgg agtacttcaa 34980
aatgaagatc gcggagatgg cacctctcgc ccccgctgtg ttggtggaaa ataacagcca 35040
ggtcaaaggt gatacggttc tcgagatgtt ccacggtggc ttccagcaaa gcctccacgc 35100
gcacatccag aaacaagaca atagcgaaag cgggagggtt ctctaattcc tcaatcatca 35160
tgttacactc ctgcaccatc cccagataat tttcattttt ccagccttga atgattcgaa 35220
ctagttcctg aggtaaatcc aagccagcca tgataaagag ctcgcgcaga gcgccctcca 35280
ccggcattct taagcacacc ctcataattc caagatattc tgctcctggt tcacctgcag 35340
cagattgaca agcggaatat caaaatctct gccgcgatcc ctgagctcct ccctcagcaa 35400
taactgtaag tactctttca tatcctctcc gaaattttta gccataggac caccaggaat 35460
aagattaggg caagccacag tacagataaa ccgaagtcct ccccagtgag cattgccaaa 35520
tgcaagactg ctataagcat gctggctaga cccggtgata tcttccagat aactggacag 35580
aaaatcgccc aggcaatttt taagaaaatc aacaaaagaa aaatcctcca ggtggacgtt 35640
tagagcctcg ggaacaacga tgaagtaaat gcaagcggtg cgttccagca tggttagtta 35700
gctgatctgt agaaaaaaca aaaatgaaca ttaaaccatg ctagcctggc gaacaggtgg 35760
gtaaatcgtt ctctccagca ccaggcaggc cacggggtct ccggcgcgac cctcgtaaaa 35820
attgtcgcta tgattgaaaa ccatcacaga gagacgttcc cggtggccgg cgtgaatgat 35880
tcgacaagat gaatacaccc ccggaacatt ggcgtccgcg agtgaaaaaa agcgcccgag 35940
gaagcaataa ggcactacaa tgctcagtct caagtccagc aaagcgatgc catgcggatg 36000
aagcacaaaa ttctcaggtg cgtacaaaat gtaattactc ccctcctgca caggcagcaa 36060
agcccccgat ccctccaggt acacatacaa agcctcagcg tccatagctt accgagcagc 36120
agcacacaac aggcgcaaga gtcagagaaa ggctgagctc taacctgtcc acccgctctc 36180
tgctcaatat atagcccaga tctacactga cgtaaaggcc aaagtctaaa aatacccgcc 36240
aaataatcac acacgcccag cacacgccca gaaaccggtg acacactcaa aaaaatacgc 36300
gcacttcctc aaacgcccaa aactgccgtc atttccgggt tcccacgcta cgtcatcaaa 36360
acacgacttt caaattccgt cgaccgttaa aaacgtcacc cgccccgccc ctaacggtcg 36420
cccgtctctc agccaatcag cgccccgcat ccccaaattc aaacacctca tttgcatatt 36480
aacgcgcaca aaaagtttga ggtatattat tgatgatgg 36519
<210> 2
<211> 31588
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 2
ccatcttcaa taatatacct caaacttttt gtgcgcgtta atatgcaaat gaggcgtttg 60
aatttgggga ggaagggcgg tgattggtcg agggatgagc gaccgttagg ggcggggcga 120
gtgacgtttt gatgacgtgg ttgcgaggag gagccagttt gcaagttctc gtgggaaaag 180
tgacgtcaaa cgaggtgtgg tttgaacacg gaaatactca attttcccgc gctctctgac 240
aggaaatgag gtgtttctgg gcggatgcaa gtgaaaacgg gccattttcg cgcgaaaact 300
gaatgaggaa gtgaaaatct gagtaatttc gcgtttatgg cagggaggag tatttgccga 360
gggccgagta gactttgacc gattacgtgg gggtttcgat taccgtgttt ttcacctaaa 420
tttccgcgta cggtgtcaaa gtccggtgtt tttacgtagg tgtcagctga tcgccagggt 480
atttaaacct gcgctctcca gtcaagaggc cactcttgag tgccagcgag aagagttttc 540
tcctccgcgc cgcgagtcag atctacactt tgaaagtagg gataacaggg taatgacatt 600
gattattgac tagttgttaa tagtaatcaa ttacggggtc attagttcat agcccatata 660
tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 720
cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 780
attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 840
atcatatgcc aagtccgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 900
atgcccagta catgacctta cgggactttc ctacttggca gtacatctac gtattagtca 960
tcgctattac catggtgatg cggttttggc agtacaccaa tgggcgtgga tagcggtttg 1020
actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 1080
aaaatcaacg ggactttcca aaatgtcgta ataaccccgc cccgttgacg caaatgggcg 1140
gtaggcgtgt acggtgggag gtctatataa gcagagctcg tttagtgaac cgtcagatcg 1200
cctggaacgc catccacgct gttttgacct ccatagaaga cagcgatcgc gccaccatgg 1260
ccgggatgtt ccaggcactg tccgaaggct gcacacccta tgatattaac cagatgctga 1320
atgtcctggg agaccaccag gtctctggcc tggagcagct ggagagcatc atcaacttcg 1380
agaagctgac cgagtggaca agctccaatg tgatgcctat cctgtcccca ctgaccaagg 1440
gcatcctggg cttcgtgttt accctgacag tgccttctga gcggggcctg tcttgcatca 1500
gcgaggcaga cgcaaccaca ccagagtccg ccaatctggg cgaggagatc ctgtctcagc 1560
tgtacctgtg gccccgggtg acatatcact ccccttctta cgcctatcac cagttcgagc 1620
ggagagccaa gtacaagaga cacttcccag gctttggcca gtctctgctg ttcggctacc 1680
ccgtgtacgt gttcggcgat tgcgtgcagg gcgactggga tgccatccgg tttagatact 1740
gcgcaccacc tggatatgca ctgctgaggt gtaacgacac caattattcc gccctgctgg 1800
cagtgggcgc cctggagggc cctcgcaatc aggattggct gggcgtgcca aggcagctgg 1860
tgacacgcat gcaggccatc cagaacgcag gcctgtgcac cctggtggca atgctggagg 1920
agacaatctt ctggctgcag gcctttctga tggccctgac cgacagcggc cccaagacaa 1980
acatcatcgt ggattcccag tacgtgatgg gcatctccaa gccttctttc caggagtttg 2040
tggactggga gaacgtgagc ccagagctga attccaccga tcagccattc tggcaggcag 2100
gaatcctggc aaggaacctg gtgcctatgg tggccacagt gcagggccag aatctgaagt 2160
accagggcca gagcctggtc atcagcgcct ccatcatcgt gtttaacctg ctggagctgg 2220
agggcgacta tcgggacgat ggcaacgtgt gggtgcacac cccactgagc cccagaacac 2280
tgaacgcctg ggtgaaggcc gtggaggaga agaagggcat cccagtgcac ctggagctgg 2340
cctccatgac caatatggag ctgatgtcta gcatcgtgca ccagcaggtg aggacatacg 2400
gacccgtgtt catgtgcctg ggaggcctgc tgaccatggt ggcaggagcc gtgtggctga 2460
cagtgcgggt gctggagctg ttcagagccg cccagctggc caacgatgtg gtgctgcaga 2520
tcatggagct gtgcggagca gcctttcgcc aggtgtgcca caccacagtg ccatggccca 2580
atgcctccct gacccccaag tggaacaatg agacaacaca gcctcagatc gccaactgta 2640
gcgtgtacga cttcttcgtg tggctgcact actatagcgt gagggatacc ctgtggcccc 2700
gcgtgacata ccacatgaat aagtacgcct atcacatgct ggagaggcgc gccaagtata 2760
agagaggccc tggcccaggc gcaaagtttg tggcagcatg gaccctgaag gccgccgccg 2820
gccccggccc cggccagtat atcaaggcta acagtaagtt cattggaatc acagagctgg 2880
gacccggacc tggataatga gtttaaactc ccatttaaat gtgagggtta atgcttcgag 2940
cagacatgat aagatacatt gatgagtttg gacaaaccac aactagaatg cagtgaaaaa 3000
aatgctttat ttgtgaaatt tgtgatgcta ttgctttatt tgtaaccatt ataagctgca 3060
ataaacaagt taacaacaac aattgcattc attttatgtt tcaggttcag ggggagatgt 3120
gggaggtttt ttaaagcaag taaaacctct acaaatgtgg taaaataact ataacggtcc 3180
taaggtagcg agtgagtagt gttctggggc gggggaggac ctgcatgagg gccagaataa 3240
ctgaaatctg tgcttttctg tgtgttgcag cagcatgagc ggaagcggct cctttgaggg 3300
aggggtattc agcccttatc tgacggggcg tctcccctcc tgggcgggag tgcgtcagaa 3360
tgtgatggga tccacggtgg acggccggcc cgtgcagccc gcgaactctt caaccctgac 3420
ctatgcaacc ctgagctctt cgtcgttgga cgcagctgcc gccgcagctg ctgcatctgc 3480
cgccagcgcc gtgcgcggaa tggccatggg cgccggctac tacggcactc tggtggccaa 3540
ctcgagttcc accaataatc ccgccagcct gaacgaggag aagctgttgc tgctgatggc 3600
ccagctcgag gccttgaccc agcgcctggg cgagctgacc cagcaggtgg ctcagctgca 3660
ggagcagacg cgggccgcgg ttgccacggt gaaatccaaa taaaaaatga atcaataaat 3720
aaacggagac ggttgttgat tttaacacag agtctgaatc tttatttgat ttttcgcgcg 3780
cggtaggccc tggaccaccg gtctcgatca ttgagcaccc ggtggatctt ttccaggacc 3840
cggtagaggt gggcttggat gttgaggtac atgggcatga gcccgtcccg ggggtggagg 3900
tagctccatt gcagggcctc gtgctcgggg gtggtgttgt aaatcaccca gtcatagcag 3960
gggcgcaggg catggtgttg cacaatatct ttgaggagga gactgatggc cacgggcagc 4020
cctttggtgt aggtgtttac aaatctgttg agctgggagg gatgcatgcg gggggagatg 4080
aggtgcatct tggcctggat cttgagattg gcgatgttac cgcccagatc ccgcctgggg 4140
ttcatgttgt gcaggaccac cagcacggtg tatccggtgc acttggggaa tttatcatgc 4200
aacttggaag ggaaggcgtg aaagaatttg gcgacgcctt tgtgcccgcc caggttttcc 4260
atgcactcat ccatgatgat ggcgatgggc ccgtgggcgg cggcctgggc aaagacgttt 4320
cgggggtcgg acacatcata gttgtggtcc tgggtgaggt catcataggc cattttaatg 4380
aatttggggc ggagggtgcc ggactggggg acaaaggtac cctcgatccc gggggcgtag 4440
ttcccctcac agatctgcat ctcccaggct ttgagctcgg agggggggat catgtccacc 4500
tgcggggcga taaagaacac ggtttccggg gcgggggaga tgagctgggc cgaaagcaag 4560
ttccggagca gctgggactt gccgcagccg gtggggccgt agatgacccc gatgaccggc 4620
tgcaggtggt agttgaggga gagacagctg ccgtcctccc ggaggagggg ggccacctcg 4680
ttcatcatct cgcgcacgtg catgttctcg cgcaccagtt ccgccaggag gcgctctccc 4740
cccagggata ggagctcctg gagcgaggcg aagtttttca gcggcttgag tccgtcggcc 4800
atgggcattt tggagagggt ttgttgcaag agttccaggc ggtcccagag ctcggtgatg 4860
tgctctacgg catctcgatc cagcagacct cctcgtttcg cgggttggga cggctgcggg 4920
agtagggcac cagacgatgg gcgtccagcg cagccagggt ccggtccttc cagggtcgca 4980
gcgtccgcgt cagggtggtc tccgtcacgg tgaaggggtg cgcgccgggc tgggcgcttg 5040
cgagggtgcg cttcaggctc atccggctgg tcgaaaaccg ctcccgatcg gcgccctgcg 5100
cgtcggccag gtagcaattg accatgagtt cgtagttgag cgcctcggcc gcgtggcctt 5160
tggcgcggag cttacctttg gaagtctgcc cgcaggcggg acagaggagg gacttgaggg 5220
cgtagagctt gggggcgagg aagacggact cgggggcgta ggcgtccgcg ccgcagtggg 5280
cgcagacggt ctcgcactcc acgagccagg tgaggtcggg ctggtcgggg tcaaaaacca 5340
gtttcccgcc gttctttttg atgcgtttct tacctttggt ctccatgagc tcgtgtcccc 5400
gctgggtgac aaagaggctg tccgtgtccc cgtagaccga ctttatgggc cggtcctcga 5460
gcggtgtgcc gcggtcctcc tcgtagagga accccgccca ctccgagacg aaagcccggg 5520
tccaggccag cacgaaggag gccacgtggg acgggtagcg gtcgttgtcc accagcgggt 5580
ccaccttttc cagggtatgc aaacacatgt ccccctcgtc cacatccagg aaggtgattg 5640
gcttgtaagt gtaggccacg tgaccggggg tcccggccgg gggggtataa aagggtgcgg 5700
gtccctgctc gtcctcactg tcttccggat cgctgtccag gagcgccagc tgttggggta 5760
ggtattccct ctcgaaggcg ggcatgacct cggcactcag gttgtcagtt tctagaaacg 5820
aggaggattt gatattgacg gtgccggcgg agatgccttt caagagcccc tcgtccatct 5880
ggtcagaaaa gacgatcttt ttgttgtcga gcttggtggc gaaggagccg tagagggcgt 5940
tggagaggag cttggcgatg gagcgcatgg tctggttttt ttccttgtcg gcgcgctcct 6000
tggcggcgat gttgagctgc acgtactcgc gcgccacgca cttccattcg gggaagacgg 6060
tggtcagctc gtcgggcacg attctgacct gccagccccg attatgcagg gtgatgaggt 6120
ccacactggt ggccacctcg ccgcgcaggg gctcattagt ccagcagagg cgtccgccct 6180
tgcgcgagca gaaggggggc agggggtcca gcatgacctc gtcggggggg tcggcatcga 6240
tggtgaagat gccgggcagg aggtcggggt caaagtagct gatggaagtg gccagatcgt 6300
ccagggcagc ttgccattcg cgcacggcca gcgcgcgctc gtagggactg aggggcgtgc 6360
cccagggcat gggatgggta agcgcggagg cgtacatgcc gcagatgtcg tagacgtaga 6420
ggggctcctc gaggatgccg atgtaggtgg ggtagcagcg ccccccgcgg atgctggcgc 6480
gcacgtagtc atacagctcg tgcgaggggg cgaggagccc cgggcccagg ttggtgcgac 6540
tgggcttttc ggcgcggtag acgatctggc ggaaaatggc atgcgagttg gaggagatgg 6600
tgggcctttg gaagatgttg aagtgggcgt ggggcagtcc gaccgagtcg cggatgaagt 6660
gggcgtagga gtcttgcagc ttggcgacga gctcggcggt gactaggacg tccagagcgc 6720
agtagtcgag ggtctcctgg atgatgtcat acttgagctg tcccttttgt ttccacagct 6780
cgcggttgag aaggaactct tcgcggtcct tccagtactc ttcgaggggg aacccgtcct 6840
gatctgcacg gtaagagcct agcatgtaga actggttgac ggccttgtag gcgcagcagc 6900
ccttctccac ggggagggcg taggcctggg cggccttgcg cagggaggtg tgcgtgaggg 6960
cgaaagtgtc cctgaccatg accttgagga actggtgctt gaagtcgata tcgtcgcagc 7020
ccccctgctc ccagagctgg aagtccgtgc gcttcttgta ggcggggttg ggcaaagcga 7080
aagtaacatc gttgaagagg atcttgcccg cgcggggcat aaagttgcga gtgatgcgga 7140
aaggttgggg cacctcggcc cggttgttga tgacctgggc ggcgagcacg atctcgtcga 7200
agccgttgat gttgtggccc acgatgtaga gttccacgaa tcgcggacgg cccttgacgt 7260
ggggcagttt cttgagctcc tcgtaggtga gctcgtcggg gtcgctgagc ccgtgctgct 7320
cgagcgccca gtcggcgaga tgggggttgg cgcggaggaa ggaagtccag agatccacgg 7380
ccagggcggt ttgcagacgg tcccggtact gacggaactg ctgcccgacg gccatttttt 7440
cgggggtgac gcagtagaag gtgcgggggt ccccgtgcca gcgatcccat ttgagctgga 7500
gggcgagatc gagggcgagc tcgacgagcc ggtcgtcccc ggagagtttc atgaccagca 7560
tgaaggggac gagctgcttg ccgaaggacc ccatccaggt gtaggtttcc acatcgtagg 7620
tgaggaagag cctttcggtg cgaggatgcg agccgatggg gaagaactgg atctcctgcc 7680
accaattgga ggaatggctg ttgatgtgat ggaagtagaa atgccgacgg cgcgccgaac 7740
actcgtgctt gtgtttatac aagcggccac agtgctcgca acgctgcacg ggatgcacgt 7800
gctgcacgag ctgtacctga gttcctttga cgaggaattt cagtgggaag tggagtcgtg 7860
gcgcctgcat ctcgtgctgt actacgtcgt ggtggtcggc ctggccctct tctgcctcga 7920
tggtggtcat gctgacgagc ccgcgcggga ggcaggtcca gacctcggcg cgagcgggtc 7980
ggagagcgag gacgagggcg cgcaggccgg agctgtccag ggtcctgaga cgctgcggag 8040
tcaggtcagt gggcagcggc ggcgcgcggt tgacttgcag gagtttttcc agggcgcgcg 8100
ggaggtccag atggtacttg atctccaccg cgccattggt ggcgacgtcg atggcttgca 8160
gggtcccgtg cccctggggt gtgaccaccg tcccccgttt cttcttgggc ggctggggcg 8220
acgggggcgg tgcctcttcc atggttagaa gcggcggcga ggacgcgcgc cgggcggcag 8280
gggcggctcg gggcccggag gcaggggcgg caggggcacg tcggcgccgc gcgcgggtag 8340
gttctggtac tgcgcccgga gaagactggc gtgagcgacg acgcgacggt tgacgtcctg 8400
gatctgacgc ctctgggtga aggccacggg acccgtgagt ttgaacctga aagagagttc 8460
gacagaatca atctcggtat cgttgacggc ggcctgccgc aggatctctt gcacgtcgcc 8520
cgagttgtcc tggtaggcga tctcggtcat gaactgctcg atctcctcct cttgaaggtc 8580
tccgcggccg gcgcgctcca cggtggccgc gaggtcgttg gagatgcggc ccatgagctg 8640
cgagaaggcg ttcatgcccg cctcgttcca gacgcggctg tagaccacga cgccctcggg 8700
atcgcgggcg cgcatgacca cctgggcgag gttgagctcc acgtggcgcg tgaagaccgc 8760
gtagttgcag aggcgctggt agaggtagtt gagcgtggtg gcgatgtgct cggtgacgaa 8820
gaaatacatg atccagcggc ggagcggcat ctcgctgacg tcgcccagcg cctccaaacg 8880
ttccatggcc tcgtaaaagt ccacggcgaa gttgaaaaac tgggagttgc gcgccgagac 8940
ggtcaactcc tcctccagaa gacggatgag ctcggcgatg gtggcgcgca cctcgcgctc 9000
gaaggccccc gggagttcct ccacttcctc ttcttcctcc tccactaaca tctcttctac 9060
ttcctcctca ggcggcagtg gtggcggggg agggggcctg cgtcgccggc ggcgcacggg 9120
cagacggtcg atgaagcgct cgatggtctc gccgcgccgg cgtcgcatgg tctcggtgac 9180
ggcgcgcccg tcctcgcggg gccgcagcgt gaagacgccg ccgcgcatct ccaggtggcc 9240
gggggggtcc ccgttgggca gggagagggc gctgacgatg catcttatca attgccccgt 9300
agggactccg cgcaaggacc tgagcgtctc gagatccacg ggatctgaaa accgctgaac 9360
gaaggcttcg agccagtcgc agtcgcaagg taggctgagc acggtttctt ctggcgggtc 9420
atgttggttg ggagcggggc gggcgatgct gctggtgatg aagttgaaat aggcggttct 9480
gagacggcgg atggtggcga ggagcaccag gtctttgggc ccggcttgct ggatgcgcag 9540
acggtcggcc atgccccagg cgtggtcctg acacctggcc aggtccttgt agtagtcctg 9600
catgagccgc tccacgggca cctcctcctc gcccgcgcgg ccgtgcatgc gcgtgagccc 9660
gaagccgcgc tggggctgga cgagcgccag gtcggcgacg acgcgctcgg cgaggatggc 9720
ttgctggatc tgggtgaggg tggtctggaa gtcatcaaag tcgacgaagc ggtggtaggc 9780
tccggtgttg atggtgtagg agcagttggc catgacggac cagttgacgg tctggtggcc 9840
cggacgcacg agctcgtggt acttgaggcg cgagtaggcg cgcgtgtcga agatgtagtc 9900
gttgcaggtg cgcaccaggt actggtagcc gatgaggaag tgcggcggcg gctggcggta 9960
gagcggccat cgctcggtgg cgggggcgcc gggcgcgagg tcctcgagca tggtgcggtg 10020
gtagccgtag atgtacctgg acatccaggt gatgccggcg gcggtggtgg aggcgcgcgg 10080
gaactcgcgg acgcggttcc agatgttgcg cagcggcagg aagtagttca tggtgggcac 10140
ggtctggccc gtgaggcgcg cgcagtcgtg gatgctctat acgggcaaaa acgaaagcgg 10200
tcagcggctc gactccgtgg cctggaggct aagcgaacgg gttgggctgc gcgtgtaccc 10260
cggttcgaat ctcgaatcag gctggagccg cagctaacgt ggtattggca ctcccgtctc 10320
gacccaagcc tgcaccaacc ctccaggata cggaggcggg tcgttttgca actttttttt 10380
ggaggccgga tgagactagt aagcgcggaa agcggccgac cgcgatggct cgctgccgta 10440
gtctggagaa gaatcgccag ggttgcgttg cggtgtgccc cggttcgagg ccggccggat 10500
tccgcggcta acgagggcgt ggctgccccg tcgtttccaa gaccccatag ccagccgact 10560
tctccagtta cggagcgagc ccctcttttg ttttgtttgt ttttgccaga tgcatcccgt 10620
actgcggcag atgcgccccc accaccctcc accgcaacaa cagccccctc cacagccggc 10680
gcttctgccc ccgccccagc agcaacttcc agccacgacc gccgcggccg ccgtgagcgg 10740
ggctggacag agttatgatc accagctggc cttggaagag ggcgaggggc tggcgcgcct 10800
gggggcgtcg tcgccggagc ggcacccgcg cgtgcagatg aaaagggacg ctcgcgaggc 10860
ctacgtgccc aagcagaacc tgttcagaga caggagcggc gaggagcccg aggagatgcg 10920
cgcggcccgg ttccacgcgg ggcgggagct gcggcgcggc ctggaccgaa agagggtgct 10980
gagggacgag gatttcgagg cggacgagct gacggggatc agccccgcgc gcgcgcacgt 11040
ggccgcggcc aacctggtca cggcgtacga gcagaccgtg aaggaggaga gcaacttcca 11100
aaaatccttc aacaaccacg tgcgcaccct gatcgcgcgc gaggaggtga ccctgggcct 11160
gatgcacctg tgggacctgc tggaggccat cgtgcagaac cccaccagca agccgctgac 11220
ggcgcagctg ttcctggtgg tgcagcatag tcgggacaac gaagcgttca gggaggcgct 11280
gctgaatatc accgagcccg agggccgctg gctcctggac ctggtgaaca ttctgcagag 11340
catcgtggtg caggagcgcg ggctgccgct gtccgagaag ctggcggcca tcaacttctc 11400
ggtgctgagt ttgggcaagt actacgctag gaagatctac aagaccccgt acgtgcccat 11460
agacaaggag gtgaagatcg acgggtttta catgcgcatg accctgaaag tgctgaccct 11520
gagcgacgat ctgggggtgt accgcaacga caggatgcac cgtgcggtga gcgccagcag 11580
gcggcgcgag ctgagcgacc aggagctgat gcatagtctg cagcgggccc tgaccggggc 11640
cgggaccgag ggggagagct actttgacat gggcgcggac ctgcactggc agcccagccg 11700
ccgggccttg gaggcggcgg caggacccta cgtagaagag gtggacgatg aggtggacga 11760
ggagggcgag tacctggaag actgatggcg cgaccgtatt tttgctagat gcaacaacaa 11820
cagccacctc ctgatcccgc gatgcgggcg gcgctgcaga gccagccgtc cggcattaac 11880
tcctcggacg attggaccca ggccatgcaa cgcatcatgg cgctgacgac ccgcaacccc 11940
gaagccttta gacagcagcc ccaggccaac cggctctcgg ccatcctgga ggccgtggtg 12000
ccctcgcgct ccaaccccac gcacgagaag gtcctggcca tcgtgaacgc gctggtggag 12060
aacaaggcca tccgcggcga cgaggccggc ctggtgtaca acgcgctgct ggagcgcgtg 12120
gcccgctaca acagcaccaa cgtgcagacc aacctggacc gcatggtgac cgacgtgcgc 12180
gaggccgtgg cccagcgcga gcggttccac cgcgagtcca acctgggatc catggtggcg 12240
ctgaacgcct tcctcagcac ccagcccgcc aacgtgcccc ggggccagga ggactacacc 12300
aacttcatca gcgccctgcg cctgatggtg accgaggtgc cccagagcga ggtgtaccag 12360
tccgggccgg actacttctt ccagaccagt cgccagggct tgcagaccgt gaacctgagc 12420
caggctttca agaacttgca gggcctgtgg ggcgtgcagg ccccggtcgg ggaccgcgcg 12480
acggtgtcga gcctgctgac gccgaactcg cgcctgctgc tgctgctggt ggcccccttc 12540
acggacagcg gcagcatcaa ccgcaactcg tacctgggct acctgattaa cctgtaccgc 12600
gaggccatcg gccaggcgca cgtggacgag cagacctacc aggagatcac ccacgtgagc 12660
cgcgccctgg gccaggacga cccgggcaac ctggaagcca ccctgaactt tttgctgacc 12720
aaccggtcgc agaagatccc gccccagtac gcgctcagca ccgaggagga gcgcatcctg 12780
cgttacgtgc agcagagcgt gggcctgttc ctgatgcagg agggggccac ccccagcgcc 12840
gcgctcgaca tgaccgcgcg caacatggag cccagcatgt acgccagcaa ccgcccgttc 12900
atcaataaac tgatggacta cttgcatcgg gcggccgcca tgaactctga ctatttcacc 12960
aacgccatcc tgaatcccca ctggctcccg ccgccggggt tctacacggg cgagtacgac 13020
atgcccgacc ccaatgacgg gttcctgtgg gacgatgtgg acagcagcgt gttctccccc 13080
cgaccgggtg ctaacgagcg ccccttgtgg aagaaggaag gcagcgaccg acgcccgtcc 13140
tcggcgctgt ccggccgcga gggtgctgcc gcggcggtgc ccgaggccgc cagtcctttc 13200
ccgagcttgc ccttctcgct gaacagtatc cgcagcagcg agctgggcag gatcacgcgc 13260
ccgcgcttgc tgggcgaaga ggagtacttg aatgactcgc tgttgagacc cgagcgggag 13320
aagaacttcc ccaataacgg gatagaaagc ctggtggaca agatgagccg ctggaagacg 13380
tatgcgcagg agcacaggga cgatccccgg gcgtcgcagg gggccacgag ccggggcagc 13440
gccgcccgta aacgccggtg gcacgacagg cagcggggac agatgtggga cgatgaggac 13500
tccgccgacg acagcagcgt gttggacttg ggtgggagtg gtaacccgtt cgctcacctg 13560
cgcccccgta tcgggcgcat gatgtaagag aaaccgaaaa taaatgatac tcaccaaggc 13620
catggcgacc agcgtgcgtt cgtttcttct ctgttgttgt tgtatctagt atgatgaggc 13680
gtgcgtaccc ggagggtcct cctccctcgt acgagagcgt gatgcagcag gcgatggcgg 13740
cggcggcgat gcagcccccg ctggaggctc cttacgtgcc cccgcggtac ctggcgccta 13800
cggaggggcg gaacagcatt cgttactcgg agctggcacc cttgtacgat accacccggt 13860
tgtacctggt ggacaacaag tcggcggaca tcgcctcgct gaactaccag aacgaccaca 13920
gcaacttcct gaccaccgtg gtgcagaaca atgacttcac ccccacggag gccagcaccc 13980
agaccatcaa ctttgacgag cgctcgcggt ggggcggcca gctgaaaacc atcatgcaca 14040
ccaacatgcc caacgtgaac gagttcatgt acagcaacaa gttcaaggcg cgggtgatgg 14100
tctcccgcaa gacccccaat ggggtgacag tgacagagga ttatgatggt agtcaggatg 14160
agctgaagta tgaatgggtg gaatttgagc tgcccgaagg caacttctcg gtgaccatga 14220
ccatcgacct gatgaacaac gccatcatcg acaattactt ggcggtgggg cggcagaacg 14280
gggtgctgga gagcgacatc ggcgtgaagt tcgacactag gaacttcagg ctgggctggg 14340
accccgtgac cgagctggtc atgcccgggg tgtacaccaa cgaggctttc catcccgata 14400
ttgtcttgct gcccggctgc ggggtggact tcaccgagag ccgcctcagc aacctgctgg 14460
gcattcgcaa gaggcagccc ttccaggaag gcttccagat catgtacgag gatctggagg 14520
ggggcaacat ccccgcgctc ctggatgtcg acgcctatga gaaaagcaag gaggatgcag 14580
cagctgaagc aactgcagcc gtagctaccg cctctaccga ggtcaggggc gataattttg 14640
caagcgccgc agcagtggca gcggccgagg cggctgaaac cgaaagtaag atagtcattc 14700
agccggtgga gaaggatagc aagaacagga gctacaacgt actaccggac aagataaaca 14760
ccgcctaccg cagctggtac ctagcctaca actatggcga ccccgagaag ggcgtgcgct 14820
cctggacgct gctcaccacc tcggacgtca cctgcggcgt ggagcaagtc tactggtcgc 14880
tgcccgacat gatgcaagac ccggtcacct tccgctccac gcgtcaagtt agcaactacc 14940
cggtggtggg cgccgagctc ctgcccgtct actccaagag cttcttcaac gagcaggccg 15000
tctactcgca gcagctgcgc gccttcacct cgcttacgca cgtcttcaac cgcttccccg 15060
agaaccagat cctcgtccgc ccgcccgcgc ccaccattac caccgtcagt gaaaacgttc 15120
ctgctctcac agatcacggg accctgccgc tgcgcagcag tatccgggga gtccagcgcg 15180
tgaccgttac tgacgccaga cgccgcacct gcccctacgt ctacaaggcc ctgggcatag 15240
tcgcgccgcg cgtcctctcg agccgcacct tctaaatgtc cattctcatc tcgcccagta 15300
ataacaccgg ttggggcctg cgcgcgccca gcaagatgta cggaggcgct cgccaacgct 15360
ccacgcaaca ccccgtgcgc gtgcgcgggc acttccgcgc tccctggggc gccctcaagg 15420
gccgcgtgcg gtcgcgcacc accgtcgacg acgtgatcga ccaggtggtg gccgacgcgc 15480
gcaactacac ccccgccgcc gcgcccgtct ccaccgtgga cgccgtcatc gacagcgtgg 15540
tggccgacgc gcgccggtac gcccgcgcca agagccggcg gcggcgcatc gcccggcggc 15600
accggagcac ccccgccatg cgcgcggcgc gagccttgct gcgcagggcc aggcgcacgg 15660
gacgcagggc catgctcagg gcggccagac gcgcggcttc aggcgccagc gccggcagga 15720
cccggagacg cgcggccacg gcggcggcag cggccatcgc cagcatgtcc cgcccgcggc 15780
gagggaacgt gtactgggtg cgcgacgccg ccaccggtgt gcgcgtgccc gtgcgcaccc 15840
gcccccctcg cacttgaaga tgttcacttc gcgatgttga tgtgtcccag cggcgaggag 15900
gatgtccaag cgcaaattca aggaagagat gctccaggtc atcgcgcctg agatctacgg 15960
ccctgcggtg gtgaaggagg aaagaaagcc ccgcaaaatc aagcgggtca aaaaggacaa 16020
aaaggaagaa gaaagtgatg tggacggatt ggtggagttt gtgcgcgagt tcgccccccg 16080
gcggcgcgtg cagtggcgcg ggcggaaggt gcaaccggtg ctgagacccg gcaccaccgt 16140
ggtcttcacg cccggcgagc gctccggcac cgcttccaag cgctcctacg acgaggtgta 16200
cggggatgat gatattctgg agcaggcggc cgagcgcctg ggcgagtttg cttacggcaa 16260
gcgcagccgt tccgcaccga aggaagaggc ggtgtccatc ccgctggacc acggcaaccc 16320
cacgccgagc ctcaagcccg tgaccttgca gcaggtgctg ccgaccgcgg cgccgcgccg 16380
ggggttcaag cgcgagggcg aggatctgta ccccaccatg cagctgatgg tgcccaagcg 16440
ccagaagctg gaagacgtgc tggagaccat gaaggtggac ccggacgtgc agcccgaggt 16500
caaggtgcgg cccatcaagc aggtggcccc gggcctgggc gtgcagaccg tggacatcaa 16560
gattcccacg gagcccatgg aaacgcagac cgagcccatg atcaagccca gcaccagcac 16620
catggaggtg cagacggatc cctggatgcc atcggctcct agtcgaagac cccggcgcaa 16680
gtacggcgcg gccagcctgc tgatgcccaa ctacgcgctg catccttcca tcatccccac 16740
gccgggctac cgcggcacgc gcttctaccg cggtcatacc agcagccgcc gccgcaagac 16800
caccactcgc cgccgccgtc gccgcaccgc cgctgcaacc acccctgccg ccctggtgcg 16860
gagagtgtac cgccgcggcc gcgcacctct gaccctgccg cgcgcgcgct accacccgag 16920
catcgccatt taaactttcg cctgctttgc agatcaatgg ccctcacatg ccgccttcgc 16980
gttcccatta cgggctaccg aggaagaaaa ccgcgccgta gaaggctggc ggggaacggg 17040
atgcgtcgcc accaccaccg gcggcggcgc gccatcagca agcggttggg gggaggcttc 17100
ctgcccgcgc tgatccccat catcgccgcg gcgatcgggg cgatccccgg cattgcttcc 17160
gtggcggtgc aggcctctca gcgccactga gacacacttg gaaacatctt gtaataaacc 17220
aatggactct gacgctcctg gtcctgtgat gtgttttcgt agacagatgg aagacatcaa 17280
tttttcgtcc ctggctccgc gacacggcac gcggccgttc atgggcacct ggagcgacat 17340
cggcaccagc caactgaacg ggggcgcctt caattggagc agtctctgga gcgggcttaa 17400
gaatttcggg tccacgctta aaacctatgg cagcaaggcg tggaacagca ccacagggca 17460
ggcgctgagg gataagctga aagagcagaa cttccagcag aaggtggtcg atgggctcgc 17520
ctcgggcatc aacggggtgg tggacctggc caaccaggcc gtgcagcggc agatcaacag 17580
ccgcctggac ccggtgccgc ccgccggctc cgtggagatg ccgcaggtgg aggaggagct 17640
gcctcccctg gacaagcggg gcgagaagcg accccgcccc gatgcggagg agacgctgct 17700
gacgcacacg gacgagccgc ccccgtacga ggaggcggtg aaactgggtc tgcccaccac 17760
gcggcccatc gcgcccctgg ccaccggggt gctgaaaccc gaaaagcccg cgaccctgga 17820
cttgcctcct ccccagcctt cccgcccctc tacagtggct aagcccctgc cgccggtggc 17880
cgtggcccgc gcgcgacccg ggggcaccgc ccgccctcat gcgaactggc agagcactct 17940
gaacagcatc gtgggtctgg gagtgcagag tgtgaagcgc cgccgctgct attaaaccta 18000
ccgtagcgct taacttgctt gtctgtgtgt gtatgtatta tgtcgccgcc gccgctgtcc 18060
accagaagga ggagtgaaga ggcgcgtcgc cgagttgcaa gatggccacc ccatcgatgc 18120
tgccccagtg ggcgtacatg cacatcgccg gacaggacgc ttcggagtac ctgagtccgg 18180
gtctggtgca gtttgcccgc gccacagaca cctacttcag tctggggaac aagtttagga 18240
accccacggt ggcgcccacg cacgatgtga ccaccgaccg cagccagcgg ctgacgctgc 18300
gcttcgtgcc cgtggaccgc gaggacaaca cctactcgta caaagtgcgc tacacgctgg 18360
ccgtgggcga caaccgcgtg ctggacatgg ccagcaccta ctttgacatc cgcggcgtgc 18420
tggatcgggg ccctagcttc aaaccctact ccggcaccgc ctacaacagt ctggccccca 18480
agggagcacc caacacttgt cagtggacat ataaagccga tggtgaaact gccacagaaa 18540
aaacctatac atatggaaat gcacccgtgc agggcattaa catcacaaaa gatggtattc 18600
aacttggaac tgacaccgat gatcagccaa tctacgcaga taaaacctat cagcctgaac 18660
ctcaagtggg tgatgctgaa tggcatgaca tcactggtac tgatgaaaag tatggaggca 18720
gagctcttaa gcctgatacc aaaatgaagc cttgttatgg ttcttttgcc aagcctacta 18780
ataaagaagg aggtcaggca aatgtgaaaa caggaacagg cactactaaa gaatatgaca 18840
tagacatggc tttctttgac aacagaagtg cggctgctgc tggcctagct ccagaaattg 18900
ttttgtatac tgaaaatgtg gatttggaaa ctccagatac ccatattgta tacaaagcag 18960
gcacagatga cagcagctct tctattaatt tgggtcagca agccatgccc aacagaccta 19020
actacattgg tttcagagac aactttatcg ggctcatgta ctacaacagc actggcaata 19080
tgggggtgct ggccggtcag gcttctcagc tgaatgctgt ggttgacttg caagacagaa 19140
acaccgagct gtcctaccag ctcttgcttg actctctggg tgacagaacc cggtatttca 19200
gtatgtggaa tcaggcggtg gacagctatg atcctgatgt gcgcattatt gaaaatcatg 19260
gtgtggagga tgaacttccc aactattgtt tccctctgga tgctgttggc agaacagata 19320
cttatcaggg aattaaggct aatggaactg atcaaaccac atggaccaaa gatgacagtg 19380
tcaatgatgc taatgagata ggcaagggta atccattcgc catggaaatc aacatccaag 19440
ccaacctgtg gaggaacttc ctctacgcca acgtggccct gtacctgccc gactcttaca 19500
agtacacgcc ggccaatgtt accctgccca ccaacaccaa cacctacgat tacatgaacg 19560
gccgggtggt ggcgccctcg ctggtggact cctacatcaa catcggggcg cgctggtcgc 19620
tggatcccat ggacaacgtg aaccccttca accaccaccg caatgcgggg ctgcgctacc 19680
gctccatgct cctgggcaac gggcgctacg tgcccttcca catccaggtg ccccagaaat 19740
ttttcgccat caagagcctc ctgctcctgc ccgggtccta cacctacgag tggaacttcc 19800
gcaaggacgt caacatgatc ctgcagagct ccctcggcaa cgacctgcgc acggacgggg 19860
cctccatctc cttcaccagc atcaacctct acgccacctt cttccccatg gcgcacaaca 19920
cggcctccac gctcgaggcc atgctgcgca acgacaccaa cgaccagtcc ttcaacgact 19980
acctctcggc ggccaacatg ctctacccca tcccggccaa cgccaccaac gtgcccatct 20040
ccatcccctc gcgcaactgg gccgccttcc gcggctggtc cttcacgcgt ctcaagacca 20100
aggagacgcc ctcgctgggc tccgggttcg acccctactt cgtctactcg ggctccatcc 20160
cctacctcga cggcaccttc tacctcaacc acaccttcaa gaaggtctcc atcaccttcg 20220
actcctccgt cagctggccc ggcaacgacc ggctcctgac gcccaacgag ttcgaaatca 20280
agcgcaccgt cgacggcgag ggctacaacg tggcccagtg caacatgacc aaggactggt 20340
tcctggtcca gatgctggcc cactacaaca tcggctacca gggcttctac gtgcccgagg 20400
gctacaagga ccgcatgtac tccttcttcc gcaacttcca gcccatgagc cgccaggtgg 20460
tggacgaggt caactacaag gactaccagg ccgtcaccct ggcctaccag cacaacaact 20520
cgggcttcgt cggctacctc gcgcccacca tgcgccaggg ccagccctac cccgccaact 20580
acccctaccc gctcatcggc aagagcgccg tcaccagcgt cacccagaaa aagttcctct 20640
gcgacagggt catgtggcgc atccccttct ccagcaactt catgtccatg ggcgcgctca 20700
ccgacctcgg ccagaacatg ctctatgcca actccgccca cgcgctagac atgaatttcg 20760
aagtcgaccc catggatgag tccacccttc tctatgttgt cttcgaagtc ttcgacgtcg 20820
tccgagtgca ccagccccac cgcggcgtca tcgaggccgt ctacctgcgc acccccttct 20880
cggccggtaa cgccaccacc taagctcttg cttcttgcaa gccatggccg cgggctccgg 20940
cgagcaggag ctcagggcca tcatccgcga cctgggctgc gggccctact tcctgggcac 21000
cttcgataag cgcttcccgg gattcatggc cccgcacaag ctggcctgcg ccatcgtcaa 21060
cacggccggc cgcgagaccg ggggcgagca ctggctggcc ttcgcctgga acccgcgctc 21120
gaacacctgc tacctcttcg accccttcgg gttctcggac gagcgcctca agcagatcta 21180
ccagttcgag tacgagggcc tgctgcgccg cagcgccctg gccaccgagg accgctgcgt 21240
caccctggaa aagtccaccc agaccgtgca gggtccgcgc tcggccgcct gcgggctctt 21300
ctgctgcatg ttcctgcacg ccttcgtgca ctggcccgac cgccccatgg acaagaaccc 21360
caccatgaac ttgctgacgg gggtgcccaa cggcatgctc cagtcgcccc aggtggaacc 21420
caccctgcgc cgcaaccagg aggcgctcta ccgcttcctc aactcccact ccgcctactt 21480
tcgctcccac cgcgcgcgca tcgagaaggc caccgccttc gaccgcatga atcaagacat 21540
gtaaaccgtg tgtgtatgtt aaatgtcttt aataaacagc actttcatgt tacacatgca 21600
tctgagatga tttatttaga aatcgaaagg gttctgccgg gtctcggcat ggcccgcggg 21660
cagggacacg ttgcggaact ggtacttggc cagccacttg aactcgggga tcagcagttt 21720
gggcagcggg gtgtcgggga aggagtcggt ccacagcttc cgcgtcagtt gcagggcgcc 21780
cagcaggtcg ggcgcggaga tcttgaaatc gcagttggga cccgcgttct gcgcgcggga 21840
gttgcggtac acggggttgc agcactggaa caccatcagg gccgggtgct tcacgctcgc 21900
cagcaccgtc gcgtcggtga tgctctccac gtcgaggtcc tcggcgttgg ccatcccgaa 21960
gggggtcatc ttgcaggtct gccttcccat ggtgggcacg cacccgggct tgtggttgca 22020
atcgcagtgc agggggatca gcatcatctg ggcctggtcg gcgttcatcc ccgggtacat 22080
ggccttcatg aaagcctcca attgcctgaa cgcctgctgg gccttggctc cctcggtgaa 22140
gaagaccccg caggacttgc tagagaactg gttggtggcg cacccggcgt cgtgcacgca 22200
gcagcgcgcg tcgttgttgg ccagctgcac cacgctgcgc ccccagcggt tctgggtgat 22260
cttggcccgg tcggggttct ccttcagcgc gcgctgcccg ttctcgctcg ccacatccat 22320
ctcgatcatg tgctccttct ggatcatggt ggtcccgtgc aggcaccgca gcttgccctc 22380
ggcctcggtg cacccgtgca gccacagcgc gcacccggtg cactcccagt tcttgtgggc 22440
gatctgggaa tgcgcgtgca cgaagccctg caggaagcgg cccatcatgg tggtcagggt 22500
cttgttgcta gtgaaggtca gcggaatgcc gcggtgctcc tcgttgatgt acaggtggca 22560
gatgcggcgg tacacctcgc cctgctcggg catcagctgg aagttggctt tcaggtcggt 22620
ctccacgcgg tagcggtcca tcagcatagt catgatttcc atacccttct cccaggccga 22680
gacgatgggc aggctcatag ggttcttcac catcatctta gcgctagcag ccgcggccag 22740
ggggtcgctc tcgtccaggg tctcaaagct ccgcttgccg tccttctcgg tgatccgcac 22800
cggggggtag ctgaagccca cggccgccag ctcctcctcg gcctgtcttt cgtcctcgct 22860
gtcctggctg acgtcctgca ggaccacatg cttggtcttg cggggtttct tcttgggcgg 22920
cagcggcggc ggagatgttg gagatggcga gggggagcgc gagttctcgc tcaccactac 22980
tatctcttcc tcttcttggt ccgaggccac gcggcggtag gtatgtctct tcgggggcag 23040
aggcggaggc gacgggctct cgccgccgcg acttggcgga tggctggcag agccccttcc 23100
gcgttcgggg gtgcgctccc ggcggcgctc tgactgactt cctccgcggc cggccattgt 23160
gttctcctag ggaggaacaa caagcatgga gactcagcca tcgccaacct cgccatctgc 23220
ccccaccgcc gacgagaagc agcagcagca gaatgaaagc ttaaccgccc cgccgcccag 23280
ccccgccacc tccgacgcgg ccgtcccaga catgcaagag atggaggaat ccatcgagat 23340
tgacctgggc tatgtgacgc ccgcggagca cgaggaggag ctggcagtgc gcttttcaca 23400
agaagagata caccaagaac agccagagca ggaagcagag aatgagcaga gtcaggctgg 23460
gctcgagcat gacggcgact acctccacct gagcgggggg gaggacgcgc tcatcaagca 23520
tctggcccgg caggccacca tcgtcaagga tgcgctgctc gaccgcaccg aggtgcccct 23580
cagcgtggag gagctcagcc gcgcctacga gttgaacctc ttctcgccgc gcgtgccccc 23640
caagcgccag cccaatggca cctgcgagcc caacccgcgc ctcaacttct acccggtctt 23700
cgcggtgccc gaggccctgg ccacctacca catctttttc aagaaccaaa agatccccgt 23760
ctcctgccgc gccaaccgca cccgcgccga cgcccttttc aacctgggtc ccggcgcccg 23820
cctacctgat atcgcctcct tggaagaggt tcccaagatc ttcgagggtc tgggcagcga 23880
cgagactcgg gccgcgaacg ctctgcaagg agaaggagga gagcatgagc accacagcgc 23940
cctggtcgag ttggaaggcg acaacgcgcg gctggcggtg ctcaaacgca cggtcgagct 24000
gacccatttc gcctacccgg ctctgaacct gccccccaaa gtcatgagcg cggtcatgga 24060
ccaggtgctc atcaagcgcg cgtcgcccat ctccgaggac gagggcatgc aagactccga 24120
ggagggcaag cccgtggtca gcgacgagca gctggcccgg tggctgggtc ctaatgctag 24180
tccccagagt ttggaagagc ggcgcaaact catgatggcc gtggtcctgg tgaccgtgga 24240
gctggagtgc ctgcgccgct tcttcgccga cgcggagacc ctgcgcaagg tcgaggagaa 24300
cctgcactac ctcttcaggc acgggttcgt gcgccaggcc tgcaagatct ccaacgtgga 24360
gctgaccaac ctggtctcct acatgggcat cttgcacgag aaccgcctgg ggcagaacgt 24420
gctgcacacc accctgcgcg gggaggcccg gcgcgactac atccgcgact gcgtctacct 24480
ctacctctgc cacacctggc agacgggcat gggcgtgtgg cagcagtgtc tggaggagca 24540
gaacctgaaa gagctctgca agctcctgca gaagaacctc aagggtctgt ggaccgggtt 24600
cgacgagcgc accaccgcct cggacctggc cgacctcatt ttccccgagc gcctcaggct 24660
gacgctgcgc aacggcctgc ccgactttat gagccaaagc atgttgcaaa actttcgctc 24720
tttcatcctc gaacgctccg gaatcctgcc cgccacctgc tccgcgctgc cctcggactt 24780
cgtgccgctg accttccgcg agtgcccccc gccgctgtgg agccactgct acctgctgcg 24840
cctggccaac tacctggcct accactcgga cgtgatcgag gacgtcagcg gcgagggcct 24900
gctcgagtgc cactgccgct gcaacctctg cacgccgcac cgctccctgg cctgcaaccc 24960
ccagctgctg agcgagaccc agatcatcgg caccttcgag ttgcaagggc ccagcgaagg 25020
cgagggttca gccgccaagg ggggtctgaa actcaccccg gggctgtgga cctcggccta 25080
cttgcgcaag ttcgtgcccg aggactacca tcccttcgag atcaggttct acgaggacca 25140
atcccatccg cccaaggccg agctgtcggc ctgcgtcatc acccaggggg cgatcctggc 25200
ccaattgcaa gccatccaga aatcccgcca agaattcttg ctgaaaaagg gccgcggggt 25260
ctacctcgac ccccagaccg gtgaggagct caaccccggc ttcccccagg atgccccgag 25320
gaaacaagaa gctgaaagtg gagctgccgc ccgtggagga tttggaggaa gactgggaga 25380
acagcagtca ggcagaggag gaggagatgg aggaagactg ggacagcact caggcagagg 25440
aggacagcct gcaagacagt ctggaggaag acgaggagga ggcagaggag gaggtggaag 25500
aagcagccgc cgccagaccg tcgtcctcgg cgggggagaa agcaagcagc acggatacca 25560
tctccgctcc gggtcggggt cccgctcgac cacacagtag atgggacgag accggacgat 25620
tcccgaaccc caccacccag accggtaaga aggagcggca gggatacaag tcctggcggg 25680
ggcacaaaaa cgccatcgtc tcctgcttgc aggcctgcgg gggcaacatc tccttcaccc 25740
ggcgctacct gctcttccac cgcggggtga actttccccg caacatcttg cattactacc 25800
gtcacctcca cagcccctac tacttccaag aagaggcagc agcagcagaa aaagaccagc 25860
agaaaaccag cagctagaaa atccacagcg gcggcagcag gtggactgag gatcgcggcg 25920
aacgagccgg cgcaaacccg ggagctgagg aaccggatct ttcccaccct ctatgccatc 25980
ttccagcaga gtcgggggca ggagcaggaa ctgaaagtca agaaccgttc tctgcgctcg 26040
ctcacccgca gttgtctgta tcacaagagc gaagaccaac ttcagcgcac tctcgaggac 26100
gccgaggctc tcttcaacaa gtactgcgcg ctcactctta aagagtagcc cgcgcccgcc 26160
cagtcgcaga aaaaggcggg aattacgtca cctgtgccct tcgccctagc cgcctccacc 26220
catcatcatg agcaaagaga ttcccacgcc ttacatgtgg agctaccagc cccagatggg 26280
cctggccgcc ggtgccgccc aggactactc cacccgcatg aattggctca gcgccgggcc 26340
cgcgatgatc tcacgggtga atgacatccg cgcccaccga aaccagatac tcctagaaca 26400
gtcagcgctc accgccacgc cccgcaatca cctcaatccg cgtaattggc ccgccgccct 26460
ggtgtaccag gaaattcccc agcccacgac cgtactactt ccgcgagacg cccaggccga 26520
agtccagctg actaactcag gtgtccagct ggcgggcggc gccaccctgt gtcgtcaccg 26580
ccccgctcag ggtataaagc ggctggtgat ccggggcaga ggcacacagc tcaacgacga 26640
ggtggtgagc tcttcgctgg gtctgcgacc tgacggagtc ttccaactcg ccggatcggg 26700
gagatcttcc ttcacgcctc gtcaggccgt cctgactttg gagagttcgt cctcgcagcc 26760
ccgctcgggt ggcatcggca ctctccagtt cgtggaggag ttcactccct cggtctactt 26820
caaccccttc tccggctccc ccggccacta cccggacgag ttcatcccga acttcgacgc 26880
catcagcgag tcggtggacg gctacgattg aaactaatca cccccttatc cagtgaaata 26940
aagatcatat tgatgatgat tttacagaaa taaaaaataa tcatttgatt tgaaataaag 27000
atacaatcat attgatgatt tgagtttaac aaaaaaataa agaatcactt acttgaaatc 27060
tgataccagg tctctgtcca tgttttctgc caacaccact tcactcccct cttcccagct 27120
ctggtactgc aggccccggc gggctgcaaa cttcctccac acgctgaagg ggatgtcaaa 27180
ttcctcctgt ccctcaatct tcattttatc ttctatcaga tgtccaaaaa gcgcgtccgg 27240
gtggatgatg acttcgaccc cgtctacccc tacgatgcag acaacgcacc gaccgtgccc 27300
ttcatcaacc cccccttcgt ctcttcagat ggattccaag agaagcccct gggggtgttg 27360
tccctgcgac tggccgaccc cgtcaccacc aagaacgggg aaatcaccct caagctggga 27420
gagggggtgg acctcgattc ctcgggaaaa ctcatctcca acacggccac caaggccgcc 27480
gcccctctca gtttttccaa caacaccatt tcccttaaca tggatcaccc cttttacact 27540
aaagatggaa aattatcctt acaagtttct ccaccattaa atatactgag aacaagcatt 27600
ctaaacacac tagctttagg ttttggatca ggtttaggac tccgtggctc tgccttggca 27660
gtacagttag tctctccact tacatttgat actgatggaa acataaagct taccttagac 27720
agaggtttgc atgttacaac aggagatgca attgaaagca acataagctg ggctaaaggt 27780
ttaaaatttg aagatggagc catagcaacc aacattggaa atgggttaga gtttggaagc 27840
agtagtacag aaacaggtgt tgatgatgct tacccaatcc aagttaaact tggatctggc 27900
cttagctttg acagtacagg agccataatg gctggtaaca aagaagacga taaactcact 27960
ttgtggacaa cacctgatcc atcaccaaac tgtcaaatac tcgcagaaaa tgatgcaaaa 28020
ctaacacttt gcttgactaa atgtggtagt caaatactgg ccactgtgtc agtcttagtt 28080
gtaggaagtg gaaacctaaa ccccattact ggcaccgtaa gcagtgctca ggtgtttcta 28140
cgttttgatg caaacggtgt tcttttaaca gaacattcta cactaaaaaa atactggggg 28200
tataggcagg gagatagcat agatggcact ccatatacca atgctgtagg attcatgccc 28260
aatttaaaag cttatccaaa gtcacaaagt tctactacta aaaataatat agtagggcaa 28320
gtatacatga atggagatgt ttcaaaacct atgcttctca ctataaccct caatggtact 28380
gatgacagca acagtacata ttcaatgtca ttttcataca cctggactaa tggaagctat 28440
gttggagcaa catttggggc taactcttat accttctcat acatcgccca agaatgaaca 28500
ctgtatccca ccctgcatgc caacccttcc caccccactc tgtggaacaa actctgaaac 28560
acaaaataaa ataaagttca agtgttttat tgattcaaca gttttacagg attcgagcag 28620
ttatttttcc tccaccctcc caggacatgg aatacaccac cctctccccc cgcacagcct 28680
tgaacatctg aatgccattg gtgatggaca tgcttttggt ctccacgttc cacacagttt 28740
cagagcgagc cagtctcggg tcggtcaggg agatgaaacc ctccgggcac tcccgcatct 28800
gcacctcaca gctcaacagc tgaggattgt cctcggtggt cgggatcacg gttatctgga 28860
agaagcagaa gagcggcggt gggaatcata gtccgcgaac gggatcggcc ggtggtgtcg 28920
catcaggccc cgcagcagtc gctgccgccg ccgctccgtc aagctgctgc tcagggggtc 28980
cgggtccagg gactccctca gcatgatgcc cacggccctc agcatcagtc gtctggtgcg 29040
gcgggcgcag cagcgcatgc ggatctcgct caggtcgctg cagtacgtgc aacacagaac 29100
caccaggttg ttcaacagtc catagttcaa cacgctccag ccgaaactca tcgcgggaag 29160
gatgctaccc acgtggccgt cgtaccagat cctcaggtaa atcaagtggt gccccctcca 29220
gaacacgctg cccacgtaca tgatctcctt gggcatgtgg cggttcacca cctcccggta 29280
ccacatcacc ctctggttga acatgcagcc ccggatgatc ctgcggaacc acagggccag 29340
caccgccccg cccgccatgc agcgaagaga ccccgggtcc cggcaatggc aatggaggac 29400
ccaccgctcg tacccgtgga tcatctggga gctgaacaag tctatgttgg cacagcacag 29460
gcatatgctc atgcatctct tcagcactct caactcctcg ggggtcaaaa ccatatccca 29520
gggcacgggg aactcttgca ggacagcgaa ccccgcagaa cagggcaatc ctcgcacaga 29580
acttacattg tgcatggaca gggtatcgca atcaggcagc accgggtgat cctccaccag 29640
agaagcgcgg gtctcggtct cctcacagcg tggtaagggg gccggccgat acgggtgatg 29700
gcgggacgcg gctgatcgtg ttcgcgaccg tgtcatgatg cagttgcttt cggacatttt 29760
cgtacttgct gtagcagaac ctggtccggg cgctgcacac cgatcgccgg cggcggtctc 29820
ggcgcttgga acgctcggtg ttgaaattgt aaaacagcca ctctctcaga ccgtgcagca 29880
gatctagggc ctcaggagtg atgaagatcc catcatgcct gatggctctg atcacatcga 29940
ccaccgtgga atgggccaga cccagccaga tgatgcaatt ttgttgggtt tcggtgacgg 30000
cgggggaggg aagaacagga agaaccatga ttaactttta atccaaacgg tctcggagta 30060
cttcaaaatg aagatcgcgg agatggcacc tctcgccccc gctgtgttgg tggaaaataa 30120
cagccaggtc aaaggtgata cggttctcga gatgttccac ggtggcttcc agcaaagcct 30180
ccacgcgcac atccagaaac aagacaatag cgaaagcggg agggttctct aattcctcaa 30240
tcatcatgtt acactcctgc accatcccca gataattttc atttttccag ccttgaatga 30300
ttcgaactag ttcctgaggt aaatccaagc cagccatgat aaagagctcg cgcagagcgc 30360
cctccaccgg cattcttaag cacaccctca taattccaag atattctgct cctggttcac 30420
ctgcagcaga ttgacaagcg gaatatcaaa atctctgccg cgatccctga gctcctccct 30480
cagcaataac tgtaagtact ctttcatatc ctctccgaaa tttttagcca taggaccacc 30540
aggaataaga ttagggcaag ccacagtaca gataaaccga agtcctcccc agtgagcatt 30600
gccaaatgca agactgctat aagcatgctg gctagacccg gtgatatctt ccagataact 30660
ggacagaaaa tcgcccaggc aatttttaag aaaatcaaca aaagaaaaat cctccaggtg 30720
gacgtttaga gcctcgggaa caacgatgaa gtaaatgcaa gcggtgcgtt ccagcatggt 30780
tagttagctg atctgtagaa aaaacaaaaa tgaacattaa accatgctag cctggcgaac 30840
aggtgggtaa atcgttctct ccagcaccag gcaggccacg gggtctccgg cgcgaccctc 30900
gtaaaaattg tcgctatgat tgaaaaccat cacagagaga cgttcccggt ggccggcgtg 30960
aatgattcga caagatgaat acacccccgg aacattggcg tccgcgagtg aaaaaaagcg 31020
cccgaggaag caataaggca ctacaatgct cagtctcaag tccagcaaag cgatgccatg 31080
cggatgaagc acaaaattct caggtgcgta caaaatgtaa ttactcccct cctgcacagg 31140
cagcaaagcc cccgatccct ccaggtacac atacaaagcc tcagcgtcca tagcttaccg 31200
agcagcagca cacaacaggc gcaagagtca gagaaaggct gagctctaac ctgtccaccc 31260
gctctctgct caatatatag cccagatcta cactgacgta aaggccaaag tctaaaaata 31320
cccgccaaat aatcacacac gcccagcaca cgcccagaaa ccggtgacac actcaaaaaa 31380
atacgcgcac ttcctcaaac gcccaaaact gccgtcattt ccgggttccc acgctacgtc 31440
atcaaaacac gactttcaaa ttccgtcgac cgttaaaaac gtcacccgcc ccgcccctaa 31500
cggtcgcccg tctctcagcc aatcagcgcc ccgcatcccc aaattcaaac acctcatttg 31560
catattaacg cgcacaaaaa gtttgagg 31588
<210> 3
<211> 11447
<212> DNA
<213> Venezuelan equine encephalitis virus
<400> 3
atgggcggcg catgagagaa gcccagacca attacctacc caaaatggag aaagttcacg 60
ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120
aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180
tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240
gtgcgcccgc ccgcagaatg tattctaagc acaagtatca ttgtatctgt ccgatgagat 300
gtgcggaaga tccggacaga ttgtataagt atgcaactaa gctgaagaaa aactgtaagg 360
aaataactga taaggaattg gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc 420
ctgacctgga aactgagact atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc 480
aagtcgctgt ttaccaggat gtatacgcgg ttgacggacc gacaagtctc tatcaccaag 540
ccaataaggg agttagagtc gcctactgga taggctttga caccacccct tttatgttta 600
agaacttggc tggagcatat ccatcatact ctaccaactg ggccgacgaa accgtgttaa 660
cggctcgtaa cataggccta tgcagctctg acgttatgga gcggtcacgt agagggatgt 720
ccattcttag aaagaagtat ttgaaaccat ccaacaatgt tctattctct gttggctcga 780
ccatctacca cgagaagagg gacttactga ggagctggca cctgccgtct gtatttcact 840
tacgtggcaa gcaaaattac acatgtcggt gtgagactat agttagttgc gacgggtacg 900
tcgttaaaag aatagctatc agtccaggcc tgtatgggaa gccttcaggc tatgctgcta 960
cgatgcaccg cgagggattc ttgtgctgca aagtgacaga cacattgaac ggggagaggg 1020
tctcttttcc cgtgtgcacg tatgtgccag ctacattgtg tgaccaaatg actggcatac 1080
tggcaacaga tgtcagtgcg gacgacgcgc aaaaactgct ggttgggctc aaccagcgta 1140
tagtcgtcaa cggtcgcacc cagagaaaca ccaataccat gaaaaattac cttttgcccg 1200
tagtggccca ggcatttgct aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa 1260
ggccactagg actacgagat agacagttag tcatggggtg ttgttgggct tttagaaggc 1320
acaagataac atctatttat aagcgcccgg atacccaaac catcatcaaa gtgaacagcg 1380
atttccactc attcgtgctg cccaggatag gcagtaacac attggagatc gggctgagaa 1440
caagaatcag gaaaatgtta gaggagcaca aggagccgtc acctctcatt accgccgagg 1500
acgtacaaga agctaagtgc gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt 1560
tgcgcgcagc tctaccacct ttggcagctg atgttgagga gcccactctg gaagccgatg 1620
tcgacttgat gttacaagag gctggggccg gctcagtgga gacacctcgt ggcttgataa 1680
aggttaccag ctacgctggc gaggacaaga tcggctctta cgctgtgctt tctccgcagg 1740
ctgtactcaa gagtgaaaaa ttatcttgca tccaccctct cgctgaacaa gtcatagtga 1800
taacacactc tggccgaaaa gggcgttatg ccgtggaacc ataccatggt aaagtagtgg 1860
tgccagaggg acatgcaata cccgtccagg actttcaagc tctgagtgaa agtgccacca 1920
ttgtgtacaa cgaacgtgag ttcgtaaaca ggtacctgca ccatattgcc acacatggag 1980
gagcgctgaa cactgatgaa gaatattaca aaactgtcaa gcccagcgag cacgacggcg 2040
aatacctgta cgacatcgac aggaaacagt gcgtcaagaa agaactagtc actgggctag 2100
ggctcacagg cgagctggtg gatcctccct tccatgaatt cgcctacgag agtctgagaa 2160
cacgaccagc cgctccttac caagtaccaa ccataggggt gtatggcgtg ccaggatcag 2220
gcaagtctgg catcattaaa agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga 2280
aagaaaactg tgcagaaatt ataagggacg tcaagaaaat gaaagggctg gacgtcaatg 2340
ccagaactgt ggactcagtg ctcttgaatg gatgcaaaca ccccgtagag accctgtata 2400
ttgacgaagc ttttgcttgt catgcaggta ctctcagagc gctcatagcc attataagac 2460
ctaaaaaggc agtgctctgc ggggatccca aacagtgcgg tttttttaac atgatgtgcc 2520
tgaaagtgca ttttaaccac gagatttgca cacaagtctt ccacaaaagc atctctcgcc 2580
gttgcactaa atctgtgact tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa 2640
cgacgaatcc gaaagagact aagattgtga ttgacactac cggcagtacc aaacctaagc 2700
aggacgatct cattctcact tgtttcagag ggtgggtgaa gcagttgcaa atagattaca 2760
aaggcaacga aataatgacg gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg 2820
ccgttcggta caaggtgaat gaaaatcctc tgtacgcacc cacctcagaa catgtgaacg 2880
tcctactgac ccgcacggag gaccgcatcg tgtggaaaac actagccggc gacccatgga 2940
taaaaacact gactgccaag taccctggga atttcactgc cacgatagag gagtggcaag 3000
cagagcatga tgccatcatg aggcacatct tggagagacc ggaccctacc gacgtcttcc 3060
agaataaggc aaacgtgtgt tgggccaagg ctttagtgcc ggtgctgaag accgctggca 3120
tagacatgac cactgaacaa tggaacactg tggattattt tgaaacggac aaagctcact 3180
cagcagagat agtattgaac caactatgcg tgaggttctt tggactcgat ctggactccg 3240
gtctattttc tgcacccact gttccgttat ccattaggaa taatcactgg gataactccc 3300
cgtcgcctaa catgtacggg ctgaataaag aagtggtccg tcagctctct cgcaggtacc 3360
cacaactgcc tcgggcagtt gccactggaa gagtctatga catgaacact ggtacactgc 3420
gcaattatga tccgcgcata aacctagtac ctgtaaacag aagactgcct catgctttag 3480
tcctccacca taatgaacac ccacagagtg acttttcttc attcgtcagc aaattgaagg 3540
gcagaactgt cctggtggtc ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt 3600
tgtcagaccg gcctgaggct accttcagag ctcggctgga tttaggcatc ccaggtgatg 3660
tgcccaaata tgacataata tttgttaatg tgaggacccc atataaatac catcactatc 3720
agcagtgtga agaccatgcc attaagctta gcatgttgac caagaaagct tgtctgcatc 3780
tgaatcccgg cggaacctgt gtcagcatag gttatggtta cgctgacagg gccagcgaaa 3840
gcatcattgg tgctatagcg cggcagttca agttttcccg ggtatgcaaa ccgaaatcct 3900
cacttgaaga gacggaagtt ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc 3960
acaatcctta caagctttca tcaaccttga ccaacattta tacaggttcc agactccacg 4020
aagccggatg tgcaccctca tatcatgtgg tgcgagggga tattgccacg gccaccgaag 4080
gagtgattat aaatgctgct aacagcaaag gacaacctgg cggaggggtg tgcggagcgc 4140
tgtataagaa attcccggaa agcttcgatt tacagccgat cgaagtagga aaagcgcgac 4200
tggtcaaagg tgcagctaaa catatcattc atgccgtagg accaaacttc aacaaagttt 4260
cggaggttga aggtgacaaa cagttggcag aggcttatga gtccatcgct aagattgtca 4320
acgataacaa ttacaagtca gtagcgattc cactgttgtc caccggcatc ttttccggga 4380
acaaagatcg actaacccaa tcattgaacc atttgctgac agctttagac accactgatg 4440
cagatgtagc catatactgc agggacaaga aatgggaaat gactctcaag gaagcagtgg 4500
ctaggagaga agcagtggag gagatatgca tatccgacga ctcttcagtg acagaacctg 4560
atgcagagct ggtgagggtg catccgaaga gttctttggc tggaaggaag ggctacagca 4620
caagcgatgg caaaactttc tcatatttgg aagggaccaa gtttcaccag gcggccaagg 4680
atatagcaga aattaatgcc atgtggcccg ttgcaacgga ggccaatgag caggtatgca 4740
tgtatatcct cggagaaagc atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg 4800
aagcctccac accacctagc acgctgcctt gcttgtgcat ccatgccatg actccagaaa 4860
gagtacagcg cctaaaagcc tcacgtccag aacaaattac tgtgtgctca tcctttccat 4920
tgccgaagta tagaatcact ggtgtgcaga agatccaatg ctcccagcct atattgttct 4980
caccgaaagt gcctgcgtat attcatccaa ggaagtatct cgtggaaaca ccaccggtag 5040
acgagactcc ggagccatcg gcagagaacc aatccacaga ggggacacct gaacaaccac 5100
cacttataac cgaggatgag accaggacta gaacgcctga gccgatcatc atcgaagagg 5160
aagaagagga tagcataagt ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg 5220
aggcagacat tcacgggccg ccctctgtat ctagctcatc ctggtccatt cctcatgcat 5280
ccgactttga tgtggacagt ttatccatac ttgacaccct ggagggagct agcgtgacca 5340
gcggggcaac gtcagccgag actaactctt acttcgcaaa gagtatggag tttctggcgc 5400
gaccggtgcc tgcgcctcga acagtattca ggaaccctcc acatcccgct ccgcgcacaa 5460
gaacaccgtc acttgcaccc agcagggcct gctcgagaac cagcctagtt tccaccccgc 5520
caggcgtgaa tagggtgatc actagagagg agctcgaggc gcttaccccg tcacgcactc 5580
ctagcaggtc ggtctcgaga accagcctgg tctccaaccc gccaggcgta aatagggtga 5640
ttacaagaga ggagtttgag gcgttcgtag cacaacaaca atgacggttt gatgcgggtg 5700
catacatctt ttcctccgac accggtcaag ggcatttaca acaaaaatca gtaaggcaaa 5760
cggtgctatc cgaagtggtg ttggagagga ccgaattgga gatttcgtat gccccgcgcc 5820
tcgaccaaga aaaagaagaa ttactacgca agaaattaca gttaaatccc acacctgcta 5880
acagaagcag ataccagtcc aggaaggtgg agaacatgaa agccataaca gctagacgta 5940
ttctgcaagg cctagggcat tatttgaagg cagaaggaaa agtggagtgc taccgaaccc 6000
tgcatcctgt tcctttgtat tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg 6060
cagtggaagc ctgtaacgcc atgttgaaag agaactttcc gactgtggct tcttactgta 6120
ttattccaga gtacgatgcc tatttggaca tggttgacgg agcttcatgc tgcttagaca 6180
ctgccagttt ttgccctgca aagctgcgca gctttccaaa gaaacactcc tatttggaac 6240
ccacaatacg atcggcagtg ccttcagcga tccagaacac gctccagaac gtcctggcag 6300
ctgccacaaa aagaaattgc aatgtcacgc aaatgagaga attgcccgta ttggattcgg 6360
cggcctttaa tgtggaatgc ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt 6420
ttaaagaaaa ccccatcagg cttactgaag aaaacgtggt aaattacatt accaaattaa 6480
aaggaccaaa agctgctgct ctttttgcga agacacataa tttgaatatg ttgcaggaca 6540
taccaatgga caggtttgta atggacttaa agagagacgt gaaagtgact ccaggaacaa 6600
aacatactga agaacggccc aaggtacagg tgatccaggc tgccgatccg ctagcaacag 6660
cgtatctgtg cggaatccac cgagagctgg ttaggagatt aaatgcggtc ctgcttccga 6720
acattcatac actgtttgat atgtcggctg aagactttga cgctattata gccgagcact 6780
tccagcctgg ggattgtgtt ctggaaactg acatcgcgtc gtttgataaa agtgaggacg 6840
acgccatggc tctgaccgcg ttaatgattc tggaagactt aggtgtggac gcagagctgt 6900
tgacgctgat tgaggcggct ttcggcgaaa tttcatcaat acatttgccc actaaaacta 6960
aatttaaatt cggagccatg atgaaatctg gaatgttcct cacactgttt gtgaacacag 7020
tcattaacat tgtaatcgca agcagagtgt tgagagaacg gctaaccgga tcaccatgtg 7080
cagcattcat tggagatgac aatatcgtga aaggagtcaa atcggacaaa ttaatggcag 7140
acaggtgcgc cacctggttg aatatggaag tcaagattat agatgctgtg gtgggcgaga 7200
aagcgcctta tttctgtgga gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc 7260
gtgtggcaga ccccctaaaa aggctgttta agcttggcaa acctctggca gcagacgatg 7320
aacatgatga tgacaggaga agggcattgc atgaagagtc aacacgctgg aaccgagtgg 7380
gtattctttc agagctgtgc aaggcagtag aatcaaggta tgaaaccgta ggaacttcca 7440
tcatagttat ggccatgact actctagcta gcagtgttaa atcattcagc tacctgagag 7500
gggcccctat aactctctac ggctaacctg aatggactac gacatagtct agtccgccaa 7560
gatgttcccg ttccagccaa tgtatccgat gcagccaatg ccctatcgca acccgttcgc 7620
ggccccgcgc aggccctggt tccccagaac cgaccctttt ctggcgatgc aggtgcagga 7680
attaacccgc tcgatggcta acctgacgtt caagcaacgc cgggacgcgc cacctgaggg 7740
gccatccgct aagaaaccga agaaggaggc ctcgcaaaaa cagaaagggg gaggccaagg 7800
gaagaagaag aagaaccaag ggaagaagaa ggctaagaca gggccgccta atccgaaggc 7860
acagaatgga aacaagaaga agaccaacaa gaaaccaggc aagagacagc gcatggtcat 7920
gaaattggaa tctgacaaga cgttcccaat catgttggaa gggaagataa acggctacgc 7980
ttgtgtggtc ggagggaagt tattcaggcc gatgcatgtg gaaggcaaga tcgacaacga 8040
cgttctggcc gcgcttaaga cgaagaaagc atccaaatac gatcttgagt atgcagatgt 8100
gccacagaac atgcgggccg atacattcaa atacacccat gagaaacccc aaggctatta 8160
cagctggcat catggagcag tccaatatga aaatgggcgt ttcacggtgc cgaaaggagt 8220
tggggccaag ggagacagcg gacgacccat tctggataac cagggacggg tggtcgctat 8280
tgtgctggga ggtgtgaatg aaggatctag gacagccctt tcagtcgtca tgtggaacga 8340
gaagggagtt accgtgaagt atactccgga gaactgcgag caatggtcac tagtgaccac 8400
catgtgtctg ctcgccaatg tgacgttccc atgtgctcaa ccaccaattt gctacgacag 8460
aaaaccagca gagactttgg ccatgctcag cgttaacgtt gacaacccgg gctacgatga 8520
gctgctggaa gcagctgtta agtgccccgg aaggaaaagg agatccaccg aggagctgtt 8580
taaggagtat aagctaacgc gcccttacat ggccagatgc atcagatgtg cagttgggag 8640
ctgccatagt ccaatagcaa tcgaggcagt aaagagcgac gggcacgacg gttatgttag 8700
acttcagact tcctcgcagt atggcctgga ttcctccggc aacttaaagg gcaggaccat 8760
gcggtatgac atgcacggga ccattaaaga gataccacta catcaagtgt cactccatac 8820
atctcgcccg tgtcacattg tggatgggca cggttatttc ctgcttgcca ggtgcccggc 8880
aggggactcc atcaccatgg aatttaagaa agattccgtc acacactcct gctcggtgcc 8940
gtatgaagtg aaatttaatc ctgtaggcag agaactctat actcatcccc cagaacacgg 9000
agtagagcaa gcgtgccaag tctacgcaca tgatgcacag aacagaggag cttatgtcga 9060
gatgcacctc ccgggctcag aagtggacag cagtttggtt tccttgagcg gcagttcagt 9120
caccgtgaca cctcctgttg ggactagcgc cctggtggaa tgcgagtgtg gcggcacaaa 9180
gatctccgag accatcaaca agacaaaaca gttcagccag tgcacaaaga aggagcagtg 9240
cagagcatat cggctgcaga acgataagtg ggtgtataat tctgacaaac tgcccaaagc 9300
agcgggagcc accttaaaag gaaaactgca tgtcccattc ttgctggcag acggcaaatg 9360
caccgtgcct ctagcaccag aacctatgat aacctttggt ttcagatcag tgtcactgaa 9420
actgcaccct aagaatccca catatctaac cacccgccaa cttgctgatg agcctcacta 9480
cacgcacgag ctcatatctg aaccagctgt taggaatttt accgtcaccg aaaaagggtg 9540
ggagtttgta tggggaaacc acccgccgaa aaggttttgg gcacaggaaa cagcacccgg 9600
aaatccacat gggctaccgc acgaggtgat aactcattat taccacagat accctatgtc 9660
caccatcctg ggtttgtcaa tttgtgccgc cattgcaacc gtttccgttg cagcgtctac 9720
ctggctgttt tgcagatcta gagttgcgtg cctaactcct taccggctaa cacctaacgc 9780
taggatacca ttttgtctgg ctgtgctttg ctgcgcccgc actgcccggg ccgagaccac 9840
ctgggagtcc ttggatcacc tatggaacaa taaccaacag atgttctgga ttcaattgct 9900
gatccctctg gccgccttga tcgtagtgac tcgcctgctc aggtgcgtgt gctgtgtcgt 9960
gcctttttta gtcatggccg gcgccgcagg cgccggcgcc tacgagcacg cgaccacgat 10020
gccgagccaa gcgggaatct cgtataacac tatagtcaac agagcaggct acgcaccact 10080
ccctatcagc ataacaccaa caaagatcaa gctgatacct acagtgaact tggagtacgt 10140
cacctgccac tacaaaacag gaatggattc accagccatc aaatgctgcg gatctcagga 10200
atgcactcca acttacaggc ctgatgaaca gtgcaaagtc ttcacagggg tttacccgtt 10260
catgtggggt ggtgcatatt gcttttgcga cactgagaac acccaagtca gcaaggccta 10320
cgtaatgaaa tctgacgact gccttgcgga tcatgctgaa gcatataaag cgcacacagc 10380
ctcagtgcag gcgttcctca acatcacagt gggagaacac tctattgtga ctaccgtgta 10440
tgtgaatgga gaaactcctg tgaatttcaa tggggtcaaa ttaactgcag gtccgctttc 10500
cacagcttgg acaccctttg atcgcaaaat cgtgcagtat gccggggaga tctataatta 10560
tgattttcct gagtatgggg caggacaacc aggagcattt ggagatatac aatccagaac 10620
agtctcaagc tcagatctgt atgccaatac caacctagtg ctgcagagac ccaaagcagg 10680
agcgatccac gtgccataca ctcaggcacc ttcgggtttt gagcaatgga agaaagataa 10740
agctccatca ttgaaattta ccgccccttt cggatgcgaa atatatacaa accccattcg 10800
cgccgaaaac tgtgctgtag ggtcaattcc attagccttt gacattcccg acgccttgtt 10860
caccagggtg tcagaaacac cgacactttc agcggccgaa tgcactctta acgagtgcgt 10920
gtattcttcc gactttggtg ggatcgccac ggtcaagtac tcggccagca agtcaggcaa 10980
gtgcgcagtc catgtgccat cagggactgc taccctaaaa gaagcagcag tcgagctaac 11040
cgagcaaggg tcggcgacta tccatttctc gaccgcaaat atccacccgg agttcaggct 11100
ccaaatatgc acatcatatg ttacgtgcaa aggtgattgt caccccccga aagaccatat 11160
tgtgacacac cctcagtatc acgcccaaac atttacagcc gcggtgtcaa aaaccgcgtg 11220
gacgtggtta acatccctgc tgggaggatc agccgtaatt attataattg gcttggtgct 11280
ggctactatt gtggccatgt acgtgctgac caaccagaaa cataattgaa tacagcagca 11340
attggcaagc tgcttacata gaactcgcgg cgattggcat gccgccttaa aatttttatt 11400
ttattttttc ttttcttttc cgaatcggat tttgttttta atatttc 11447
<210> 4
<211> 9577
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 4
atgggcggcg catgagagaa gcccagacca attacctacc caaaatggag aaagttcacg 60
ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120
aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180
tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240
gtgcgcccgc ccgcagaatg tattctaagc acaagtatca ttgtatctgt ccgatgagat 300
gtgcggaaga tccggacaga ttgtataagt atgcaactaa gctgaagaaa aactgtaagg 360
aaataactga taaggaattg gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc 420
ctgacctgga aactgagact atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc 480
aagtcgctgt ttaccaggat gtatacgcgg ttgacggacc gacaagtctc tatcaccaag 540
ccaataaggg agttagagtc gcctactgga taggctttga caccacccct tttatgttta 600
agaacttggc tggagcatat ccatcatact ctaccaactg ggccgacgaa accgtgttaa 660
cggctcgtaa cataggccta tgcagctctg acgttatgga gcggtcacgt agagggatgt 720
ccattcttag aaagaagtat ttgaaaccat ccaacaatgt tctattctct gttggctcga 780
ccatctacca cgagaagagg gacttactga ggagctggca cctgccgtct gtatttcact 840
tacgtggcaa gcaaaattac acatgtcggt gtgagactat agttagttgc gacgggtacg 900
tcgttaaaag aatagctatc agtccaggcc tgtatgggaa gccttcaggc tatgctgcta 960
cgatgcaccg cgagggattc ttgtgctgca aagtgacaga cacattgaac ggggagaggg 1020
tctcttttcc cgtgtgcacg tatgtgccag ctacattgtg tgaccaaatg actggcatac 1080
tggcaacaga tgtcagtgcg gacgacgcgc aaaaactgct ggttgggctc aaccagcgta 1140
tagtcgtcaa cggtcgcacc cagagaaaca ccaataccat gaaaaattac cttttgcccg 1200
tagtggccca ggcatttgct aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa 1260
ggccactagg actacgagat agacagttag tcatggggtg ttgttgggct tttagaaggc 1320
acaagataac atctatttat aagcgcccgg atacccaaac catcatcaaa gtgaacagcg 1380
atttccactc attcgtgctg cccaggatag gcagtaacac attggagatc gggctgagaa 1440
caagaatcag gaaaatgtta gaggagcaca aggagccgtc acctctcatt accgccgagg 1500
acgtacaaga agctaagtgc gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt 1560
tgcgcgcagc tctaccacct ttggcagctg atgttgagga gcccactctg gaagccgatg 1620
tcgacttgat gttacaagag gctggggccg gctcagtgga gacacctcgt ggcttgataa 1680
aggttaccag ctacgctggc gaggacaaga tcggctctta cgctgtgctt tctccgcagg 1740
ctgtactcaa gagtgaaaaa ttatcttgca tccaccctct cgctgaacaa gtcatagtga 1800
taacacactc tggccgaaaa gggcgttatg ccgtggaacc ataccatggt aaagtagtgg 1860
tgccagaggg acatgcaata cccgtccagg actttcaagc tctgagtgaa agtgccacca 1920
ttgtgtacaa cgaacgtgag ttcgtaaaca ggtacctgca ccatattgcc acacatggag 1980
gagcgctgaa cactgatgaa gaatattaca aaactgtcaa gcccagcgag cacgacggcg 2040
aatacctgta cgacatcgac aggaaacagt gcgtcaagaa agaactagtc actgggctag 2100
ggctcacagg cgagctggtg gatcctccct tccatgaatt cgcctacgag agtctgagaa 2160
cacgaccagc cgctccttac caagtaccaa ccataggggt gtatggcgtg ccaggatcag 2220
gcaagtctgg catcattaaa agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga 2280
aagaaaactg tgcagaaatt ataagggacg tcaagaaaat gaaagggctg gacgtcaatg 2340
ccagaactgt ggactcagtg ctcttgaatg gatgcaaaca ccccgtagag accctgtata 2400
ttgacgaagc ttttgcttgt catgcaggta ctctcagagc gctcatagcc attataagac 2460
ctaaaaaggc agtgctctgc ggggatccca aacagtgcgg tttttttaac atgatgtgcc 2520
tgaaagtgca ttttaaccac gagatttgca cacaagtctt ccacaaaagc atctctcgcc 2580
gttgcactaa atctgtgact tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa 2640
cgacgaatcc gaaagagact aagattgtga ttgacactac cggcagtacc aaacctaagc 2700
aggacgatct cattctcact tgtttcagag ggtgggtgaa gcagttgcaa atagattaca 2760
aaggcaacga aataatgacg gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg 2820
ccgttcggta caaggtgaat gaaaatcctc tgtacgcacc cacctcagaa catgtgaacg 2880
tcctactgac ccgcacggag gaccgcatcg tgtggaaaac actagccggc gacccatgga 2940
taaaaacact gactgccaag taccctggga atttcactgc cacgatagag gagtggcaag 3000
cagagcatga tgccatcatg aggcacatct tggagagacc ggaccctacc gacgtcttcc 3060
agaataaggc aaacgtgtgt tgggccaagg ctttagtgcc ggtgctgaag accgctggca 3120
tagacatgac cactgaacaa tggaacactg tggattattt tgaaacggac aaagctcact 3180
cagcagagat agtattgaac caactatgcg tgaggttctt tggactcgat ctggactccg 3240
gtctattttc tgcacccact gttccgttat ccattaggaa taatcactgg gataactccc 3300
cgtcgcctaa catgtacggg ctgaataaag aagtggtccg tcagctctct cgcaggtacc 3360
cacaactgcc tcgggcagtt gccactggaa gagtctatga catgaacact ggtacactgc 3420
gcaattatga tccgcgcata aacctagtac ctgtaaacag aagactgcct catgctttag 3480
tcctccacca taatgaacac ccacagagtg acttttcttc attcgtcagc aaattgaagg 3540
gcagaactgt cctggtggtc ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt 3600
tgtcagaccg gcctgaggct accttcagag ctcggctgga tttaggcatc ccaggtgatg 3660
tgcccaaata tgacataata tttgttaatg tgaggacccc atataaatac catcactatc 3720
agcagtgtga agaccatgcc attaagctta gcatgttgac caagaaagct tgtctgcatc 3780
tgaatcccgg cggaacctgt gtcagcatag gttatggtta cgctgacagg gccagcgaaa 3840
gcatcattgg tgctatagcg cggcagttca agttttcccg ggtatgcaaa ccgaaatcct 3900
cacttgaaga gacggaagtt ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc 3960
acaatcctta caagctttca tcaaccttga ccaacattta tacaggttcc agactccacg 4020
aagccggatg tgcaccctca tatcatgtgg tgcgagggga tattgccacg gccaccgaag 4080
gagtgattat aaatgctgct aacagcaaag gacaacctgg cggaggggtg tgcggagcgc 4140
tgtataagaa attcccggaa agcttcgatt tacagccgat cgaagtagga aaagcgcgac 4200
tggtcaaagg tgcagctaaa catatcattc atgccgtagg accaaacttc aacaaagttt 4260
cggaggttga aggtgacaaa cagttggcag aggcttatga gtccatcgct aagattgtca 4320
acgataacaa ttacaagtca gtagcgattc cactgttgtc caccggcatc ttttccggga 4380
acaaagatcg actaacccaa tcattgaacc atttgctgac agctttagac accactgatg 4440
cagatgtagc catatactgc agggacaaga aatgggaaat gactctcaag gaagcagtgg 4500
ctaggagaga agcagtggag gagatatgca tatccgacga ctcttcagtg acagaacctg 4560
atgcagagct ggtgagggtg catccgaaga gttctttggc tggaaggaag ggctacagca 4620
caagcgatgg caaaactttc tcatatttgg aagggaccaa gtttcaccag gcggccaagg 4680
atatagcaga aattaatgcc atgtggcccg ttgcaacgga ggccaatgag caggtatgca 4740
tgtatatcct cggagaaagc atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg 4800
aagcctccac accacctagc acgctgcctt gcttgtgcat ccatgccatg actccagaaa 4860
gagtacagcg cctaaaagcc tcacgtccag aacaaattac tgtgtgctca tcctttccat 4920
tgccgaagta tagaatcact ggtgtgcaga agatccaatg ctcccagcct atattgttct 4980
caccgaaagt gcctgcgtat attcatccaa ggaagtatct cgtggaaaca ccaccggtag 5040
acgagactcc ggagccatcg gcagagaacc aatccacaga ggggacacct gaacaaccac 5100
cacttataac cgaggatgag accaggacta gaacgcctga gccgatcatc atcgaagagg 5160
aagaagagga tagcataagt ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg 5220
aggcagacat tcacgggccg ccctctgtat ctagctcatc ctggtccatt cctcatgcat 5280
ccgactttga tgtggacagt ttatccatac ttgacaccct ggagggagct agcgtgacca 5340
gcggggcaac gtcagccgag actaactctt acttcgcaaa gagtatggag tttctggcgc 5400
gaccggtgcc tgcgcctcga acagtattca ggaaccctcc acatcccgct ccgcgcacaa 5460
gaacaccgtc acttgcaccc agcagggcct gctcgagaac cagcctagtt tccaccccgc 5520
caggcgtgaa tagggtgatc actagagagg agctcgaggc gcttaccccg tcacgcactc 5580
ctagcaggtc ggtctcgaga accagcctgg tctccaaccc gccaggcgta aatagggtga 5640
ttacaagaga ggagtttgag gcgttcgtag cacaacaaca atgacggttt gatgcgggtg 5700
catacatctt ttcctccgac accggtcaag ggcatttaca acaaaaatca gtaaggcaaa 5760
cggtgctatc cgaagtggtg ttggagagga ccgaattgga gatttcgtat gccccgcgcc 5820
tcgaccaaga aaaagaagaa ttactacgca agaaattaca gttaaatccc acacctgcta 5880
acagaagcag ataccagtcc aggaaggtgg agaacatgaa agccataaca gctagacgta 5940
ttctgcaagg cctagggcat tatttgaagg cagaaggaaa agtggagtgc taccgaaccc 6000
tgcatcctgt tcctttgtat tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg 6060
cagtggaagc ctgtaacgcc atgttgaaag agaactttcc gactgtggct tcttactgta 6120
ttattccaga gtacgatgcc tatttggaca tggttgacgg agcttcatgc tgcttagaca 6180
ctgccagttt ttgccctgca aagctgcgca gctttccaaa gaaacactcc tatttggaac 6240
ccacaatacg atcggcagtg ccttcagcga tccagaacac gctccagaac gtcctggcag 6300
ctgccacaaa aagaaattgc aatgtcacgc aaatgagaga attgcccgta ttggattcgg 6360
cggcctttaa tgtggaatgc ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt 6420
ttaaagaaaa ccccatcagg cttactgaag aaaacgtggt aaattacatt accaaattaa 6480
aaggaccaaa agctgctgct ctttttgcga agacacataa tttgaatatg ttgcaggaca 6540
taccaatgga caggtttgta atggacttaa agagagacgt gaaagtgact ccaggaacaa 6600
aacatactga agaacggccc aaggtacagg tgatccaggc tgccgatccg ctagcaacag 6660
cgtatctgtg cggaatccac cgagagctgg ttaggagatt aaatgcggtc ctgcttccga 6720
acattcatac actgtttgat atgtcggctg aagactttga cgctattata gccgagcact 6780
tccagcctgg ggattgtgtt ctggaaactg acatcgcgtc gtttgataaa agtgaggacg 6840
acgccatggc tctgaccgcg ttaatgattc tggaagactt aggtgtggac gcagagctgt 6900
tgacgctgat tgaggcggct ttcggcgaaa tttcatcaat acatttgccc actaaaacta 6960
aatttaaatt cggagccatg atgaaatctg gaatgttcct cacactgttt gtgaacacag 7020
tcattaacat tgtaatcgca agcagagtgt tgagagaacg gctaaccgga tcaccatgtg 7080
cagcattcat tggagatgac aatatcgtga aaggagtcaa atcggacaaa ttaatggcag 7140
acaggtgcgc cacctggttg aatatggaag tcaagattat agatgctgtg gtgggcgaga 7200
aagcgcctta tttctgtgga gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc 7260
gtgtggcaga ccccctaaaa aggctgttta agcttggcaa acctctggca gcagacgatg 7320
aacatgatga tgacaggaga agggcattgc atgaagagtc aacacgctgg aaccgagtgg 7380
gtattctttc agagctgtgc aaggcagtag aatcaaggta tgaaaccgta ggaacttcca 7440
tcatagttat ggccatgact actctagcta gcagtgttaa atcattcagc tacctgagag 7500
gggcccctat aactctctac ggctaacctg aatggactac gactctagaa tagtctttaa 7560
ttaagccacc atggcaggca tgtttcaggc gctgagcgaa ggctgcaccc cgtatgatat 7620
taaccagatg ctgaacgtgc tgggcgatca tcaggtctca ggccttgagc agcttgagag 7680
tataatcaac tttgaaaaac tgactgaatg gaccagttct aatgttatgc ctatcctgtc 7740
tcctctgaca aagggcatcc tgggcttcgt gtttaccctg accgtgcctt ctgagagagg 7800
acttagctgc attagcgaag cggatgcgac caccccggaa agcgcgaacc tgggcgaaga 7860
aattctgagc cagctgtatc tttggccaag ggtgacctac cattccccta gttatgctta 7920
ccaccaattt gaaagacgag ccaaatataa aagacacttc cccggctttg gccagagcct 7980
gctgtttggc taccctgtgt acgtgttcgg cgattgcgtg cagggcgatt gggatgcgat 8040
tcgctttcgc tattgcgcgc cgccgggcta tgcgctgctg cgctgcaacg ataccaacta 8100
tagcgctctg ctggctgtgg gggccctaga aggacccagg aatcaggact ggcttggtgt 8160
cccaagacaa cttgtaactc ggatgcaggc tattcagaat gccggcctgt gtaccctggt 8220
ggccatgctg gaagagacaa tcttctggct gcaagcgttt ctgatggcgc tgaccgatag 8280
cggcccgaaa accaacatta ttgtggatag ccagtatgtg atgggcatta gcaaaccgag 8340
ctttcaggaa tttgtggatt gggaaaacgt gagcccggaa ctgaacagca ccgatcagcc 8400
gttttggcaa gccggaatcc tggccagaaa tctggtgcct atggtggcca cagtgcaggg 8460
ccagaacctg aagtaccagg gtcagtcact agtcatctct gcttctatca ttgtcttcaa 8520
cctgctggaa ctggaaggtg attatcgaga tgatggcaac gtgtgggtgc ataccccgct 8580
gagcccgcgc accctgaacg cgtgggtgaa agcggtggaa gaaaaaaaag gtattccagt 8640
tcacctagag ctggccagta tgaccaacat ggagctcatg agcagtattg tgcatcagca 8700
ggtcagaaca tacggccccg tgttcatgtg tctcggcgga ctgcttacaa tggtggctgg 8760
tgctgtgtgg ctgacagtgc gagtgctcga gctgttccgg gccgcgcagc tggccaacga 8820
cgtggtcctc cagatcatgg agctttgtgg tgcagcgttt cgccaggtgt gccataccac 8880
cgtgccgtgg ccgaacgcga gcctgacccc gaaatggaac aacgaaacca cccagcccca 8940
gatcgccaac tgcagcgtgt atgacttttt tgtgtggctc cattattatt ctgttcgaga 9000
cacactttgg ccaagggtga cctaccatat gaacaaatat gcgtatcata tgctggaaag 9060
acgagccaaa tataaaagag gaccaggacc tggcgctaaa tttgtggccg cctggacact 9120
gaaagccgct gctggtcctg gacctggcca gtacatcaag gccaacagca agttcatcgg 9180
catcaccgaa ctcggacccg gaccaggctg atgattcgaa cggccgtatc acgcccaaac 9240
atttacagcc gcggtgtcaa aaaccgcgtg gacgtggtta acatccctgc tgggaggatc 9300
agccgtaatt attataattg gcttggtgct ggctactatt gtggccatgt acgtgctgac 9360
caaccagaaa cataattgaa tacagcagca attggcaagc tgcttacata gaactcgcgg 9420
cgattggcat gccgccttaa aatttttatt ttattttttc ttttcttttc cgaatcggat 9480
tttgttttta atatttcaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 9540
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaa 9577
<210> 5
<211> 11447
<212> DNA
<213> Venezuelan equine encephalitis virus
<400> 5
atgggcggcg catgagagaa gcccagacca attacctacc caaaatggag aaagttcacg 60
ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120
aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180
tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240
gtgcgcccgc ccgcagaatg tattctaagc acaagtatca ttgtatctgt ccgatgagat 300
gtgcggaaga tccggacaga ttgtataagt atgcaactaa gctgaagaaa aactgtaagg 360
aaataactga taaggaattg gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc 420
ctgacctgga aactgagact atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc 480
aagtcgctgt ttaccaggat gtatacgcgg ttgacggacc gacaagtctc tatcaccaag 540
ccaataaggg agttagagtc gcctactgga taggctttga caccacccct tttatgttta 600
agaacttggc tggagcatat ccatcatact ctaccaactg ggccgacgaa accgtgttaa 660
cggctcgtaa cataggccta tgcagctctg acgttatgga gcggtcacgt agagggatgt 720
ccattcttag aaagaagtat ttgaaaccat ccaacaatgt tctattctct gttggctcga 780
ccatctacca cgagaagagg gacttactga ggagctggca cctgccgtct gtatttcact 840
tacgtggcaa gcaaaattac acatgtcggt gtgagactat agttagttgc gacgggtacg 900
tcgttaaaag aatagctatc agtccaggcc tgtatgggaa gccttcaggc tatgctgcta 960
cgatgcaccg cgagggattc ttgtgctgca aagtgacaga cacattgaac ggggagaggg 1020
tctcttttcc cgtgtgcacg tatgtgccag ctacattgtg tgaccaaatg actggcatac 1080
tggcaacaga tgtcagtgcg gacgacgcgc aaaaactgct ggttgggctc aaccagcgta 1140
tagtcgtcaa cggtcgcacc cagagaaaca ccaataccat gaaaaattac cttttgcccg 1200
tagtggccca ggcatttgct aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa 1260
ggccactagg actacgagat agacagttag tcatggggtg ttgttgggct tttagaaggc 1320
acaagataac atctatttat aagcgcccgg atacccaaac catcatcaaa gtgaacagcg 1380
atttccactc attcgtgctg cccaggatag gcagtaacac attggagatc gggctgagaa 1440
caagaatcag gaaaatgtta gaggagcaca aggagccgtc acctctcatt accgccgagg 1500
acgtacaaga agctaagtgc gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt 1560
tgcgcgcagc tctaccacct ttggcagctg atgttgagga gcccactctg gaagccgatg 1620
tcgacttgat gttacaagag gctggggccg gctcagtgga gacacctcgt ggcttgataa 1680
aggttaccag ctacgctggc gaggacaaga tcggctctta cgctgtgctt tctccgcagg 1740
ctgtactcaa gagtgaaaaa ttatcttgca tccaccctct cgctgaacaa gtcatagtga 1800
taacacactc tggccgaaaa gggcgttatg ccgtggaacc ataccatggt aaagtagtgg 1860
tgccagaggg acatgcaata cccgtccagg actttcaagc tctgagtgaa agtgccacca 1920
ttgtgtacaa cgaacgtgag ttcgtaaaca ggtacctgca ccatattgcc acacatggag 1980
gagcgctgaa cactgatgaa gaatattaca aaactgtcaa gcccagcgag cacgacggcg 2040
aatacctgta cgacatcgac aggaaacagt gcgtcaagaa agaactagtc actgggctag 2100
ggctcacagg cgagctggtg gatcctccct tccatgaatt cgcctacgag agtctgagaa 2160
cacgaccagc cgctccttac caagtaccaa ccataggggt gtatggcgtg ccaggatcag 2220
gcaagtctgg catcattaaa agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga 2280
aagaaaactg tgcagaaatt ataagggacg tcaagaaaat gaaagggctg gacgtcaatg 2340
ccagaactgt ggactcagtg ctcttgaatg gatgcaaaca ccccgtagag accctgtata 2400
ttgacgaagc ttttgcttgt catgcaggta ctctcagagc gctcatagcc attataagac 2460
ctaaaaaggc agtgctctgc ggggatccca aacagtgcgg tttttttaac atgatgtgcc 2520
tgaaagtgca ttttaaccac gagatttgca cacaagtctt ccacaaaagc atctctcgcc 2580
gttgcactaa atctgtgact tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa 2640
cgacgaatcc gaaagagact aagattgtga ttgacactac cggcagtacc aaacctaagc 2700
aggacgatct cattctcact tgtttcagag ggtgggtgaa gcagttgcaa atagattaca 2760
aaggcaacga aataatgacg gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg 2820
ccgttcggta caaggtgaat gaaaatcctc tgtacgcacc cacctcagaa catgtgaacg 2880
tcctactgac ccgcacggag gaccgcatcg tgtggaaaac actagccggc gacccatgga 2940
taaaaacact gactgccaag taccctggga atttcactgc cacgatagag gagtggcaag 3000
cagagcatga tgccatcatg aggcacatct tggagagacc ggaccctacc gacgtcttcc 3060
agaataaggc aaacgtgtgt tgggccaagg ctttagtgcc ggtgctgaag accgctggca 3120
tagacatgac cactgaacaa tggaacactg tggattattt tgaaacggac aaagctcact 3180
cagcagagat agtattgaac caactatgcg tgaggttctt tggactcgat ctggactccg 3240
gtctattttc tgcacccact gttccgttat ccattaggaa taatcactgg gataactccc 3300
cgtcgcctaa catgtacggg ctgaataaag aagtggtccg tcagctctct cgcaggtacc 3360
cacaactgcc tcgggcagtt gccactggaa gagtctatga catgaacact ggtacactgc 3420
gcaattatga tccgcgcata aacctagtac ctgtaaacag aagactgcct catgctttag 3480
tcctccacca taatgaacac ccacagagtg acttttcttc attcgtcagc aaattgaagg 3540
gcagaactgt cctggtggtc ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt 3600
tgtcagaccg gcctgaggct accttcagag ctcggctgga tttaggcatc ccaggtgatg 3660
tgcccaaata tgacataata tttgttaatg tgaggacccc atataaatac catcactatc 3720
agcagtgtga agaccatgcc attaagctta gcatgttgac caagaaagct tgtctgcatc 3780
tgaatcccgg cggaacctgt gtcagcatag gttatggtta cgctgacagg gccagcgaaa 3840
gcatcattgg tgctatagcg cggcagttca agttttcccg ggtatgcaaa ccgaaatcct 3900
cacttgaaga gacggaagtt ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc 3960
acaatcctta caagctttca tcaaccttga ccaacattta tacaggttcc agactccacg 4020
aagccggatg tgcaccctca tatcatgtgg tgcgagggga tattgccacg gccaccgaag 4080
gagtgattat aaatgctgct aacagcaaag gacaacctgg cggaggggtg tgcggagcgc 4140
tgtataagaa attcccggaa agcttcgatt tacagccgat cgaagtagga aaagcgcgac 4200
tggtcaaagg tgcagctaaa catatcattc atgccgtagg accaaacttc aacaaagttt 4260
cggaggttga aggtgacaaa cagttggcag aggcttatga gtccatcgct aagattgtca 4320
acgataacaa ttacaagtca gtagcgattc cactgttgtc caccggcatc ttttccggga 4380
acaaagatcg actaacccaa tcattgaacc atttgctgac agctttagac accactgatg 4440
cagatgtagc catatactgc agggacaaga aatgggaaat gactctcaag gaagcagtgg 4500
ctaggagaga agcagtggag gagatatgca tatccgacga ctcttcagtg acagaacctg 4560
atgcagagct ggtgagggtg catccgaaga gttctttggc tggaaggaag ggctacagca 4620
caagcgatgg caaaactttc tcatatttgg aagggaccaa gtttcaccag gcggccaagg 4680
atatagcaga aattaatgcc atgtggcccg ttgcaacgga ggccaatgag caggtatgca 4740
tgtatatcct cggagaaagc atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg 4800
aagcctccac accacctagc acgctgcctt gcttgtgcat ccatgccatg actccagaaa 4860
gagtacagcg cctaaaagcc tcacgtccag aacaaattac tgtgtgctca tcctttccat 4920
tgccgaagta tagaatcact ggtgtgcaga agatccaatg ctcccagcct atattgttct 4980
caccgaaagt gcctgcgtat attcatccaa ggaagtatct cgtggaaaca ccaccggtag 5040
acgagactcc ggagccatcg gcagagaacc aatccacaga ggggacacct gaacaaccac 5100
cacttataac cgaggatgag accaggacta gaacgcctga gccgatcatc atcgaagagg 5160
aagaagagga tagcataagt ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg 5220
aggcagacat tcacgggccg ccctctgtat ctagctcatc ctggtccatt cctcatgcat 5280
ccgactttga tgtggacagt ttatccatac ttgacaccct ggagggagct agcgtgacca 5340
gcggggcaac gtcagccgag actaactctt acttcgcaaa gagtatggag tttctggcgc 5400
gaccggtgcc tgcgcctcga acagtattca ggaaccctcc acatcccgct ccgcgcacaa 5460
gaacaccgtc acttgcaccc agcagggcct gctcgagaac cagcctagtt tccaccccgc 5520
caggcgtgaa tagggtgatc actagagagg agctcgaggc gcttaccccg tcacgcactc 5580
ctagcaggtc ggtctcgaga accagcctgg tctccaaccc gccaggcgta aatagggtga 5640
ttacaagaga ggagtttgag gcgttcgtag cacaacaaca atgacggttt gatgcgggtg 5700
catacatctt ttcctccgac accggtcaag ggcatttaca acaaaaatca gtaaggcaaa 5760
cggtgctatc cgaagtggtg ttggagagga ccgaattgga gatttcgtat gccccgcgcc 5820
tcgaccaaga aaaagaagaa ttactacgca agaaattaca gttaaatccc acacctgcta 5880
acagaagcag ataccagtcc aggaaggtgg agaacatgaa agccataaca gctagacgta 5940
ttctgcaagg cctagggcat tatttgaagg cagaaggaaa agtggagtgc taccgaaccc 6000
tgcatcctgt tcctttgtat tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg 6060
cagtggaagc ctgtaacgcc atgttgaaag agaactttcc gactgtggct tcttactgta 6120
ttattccaga gtacgatgcc tatttggaca tggttgacgg agcttcatgc tgcttagaca 6180
ctgccagttt ttgccctgca aagctgcgca gctttccaaa gaaacactcc tatttggaac 6240
ccacaatacg atcggcagtg ccttcagcga tccagaacac gctccagaac gtcctggcag 6300
ctgccacaaa aagaaattgc aatgtcacgc aaatgagaga attgcccgta ttggattcgg 6360
cggcctttaa tgtggaatgc ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt 6420
ttaaagaaaa ccccatcagg cttactgaag aaaacgtggt aaattacatt accaaattaa 6480
aaggaccaaa agctgctgct ctttttgcga agacacataa tttgaatatg ttgcaggaca 6540
taccaatgga caggtttgta atggacttaa agagagacgt gaaagtgact ccaggaacaa 6600
aacatactga agaacggccc aaggtacagg tgatccaggc tgccgatccg ctagcaacag 6660
cgtatctgtg cggaatccac cgagagctgg ttaggagatt aaatgcggtc ctgcttccga 6720
acattcatac actgtttgat atgtcggctg aagactttga cgctattata gccgagcact 6780
tccagcctgg ggattgtgtt ctggaaactg acatcgcgtc gtttgataaa agtgaggacg 6840
acgccatggc tctgaccgcg ttaatgattc tggaagactt aggtgtggac gcagagctgt 6900
tgacgctgat tgaggcggct ttcggcgaaa tttcatcaat acatttgccc actaaaacta 6960
aatttaaatt cggagccatg atgaaatctg gaatgttcct cacactgttt gtgaacacag 7020
tcattaacat tgtaatcgca agcagagtgt tgagagaacg gctaaccgga tcaccatgtg 7080
cagcattcat tggagatgac aatatcgtga aaggagtcaa atcggacaaa ttaatggcag 7140
acaggtgcgc cacctggttg aatatggaag tcaagattat agatgctgtg gtgggcgaga 7200
aagcgcctta tttctgtgga gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc 7260
gtgtggcaga ccccctaaaa aggctgttta agcttggcaa acctctggca gcagacgatg 7320
aacatgatga tgacaggaga agggcattgc atgaagagtc aacacgctgg aaccgagtgg 7380
gtattctttc agagctgtgc aaggcagtag aatcaaggta tgaaaccgta ggaacttcca 7440
tcatagttat ggccatgact actctagcta gcagtgttaa atcattcagc tacctgagag 7500
gggcccctat aactctctac ggctaacctg aatggactac gacatagtct agtccgccaa 7560
gatgttcccg ttccagccaa tgtatccgat gcagccaatg ccctatcgca acccgttcgc 7620
ggccccgcgc aggccctggt tccccagaac cgaccctttt ctggcgatgc aggtgcagga 7680
attaacccgc tcgatggcta acctgacgtt caagcaacgc cgggacgcgc cacctgaggg 7740
gccatccgct aagaaaccga agaaggaggc ctcgcaaaaa cagaaagggg gaggccaagg 7800
gaagaagaag aagaaccaag ggaagaagaa ggctaagaca gggccgccta atccgaaggc 7860
acagaatgga aacaagaaga agaccaacaa gaaaccaggc aagagacagc gcatggtcat 7920
gaaattggaa tctgacaaga cgttcccaat catgttggaa gggaagataa acggctacgc 7980
ttgtgtggtc ggagggaagt tattcaggcc gatgcatgtg gaaggcaaga tcgacaacga 8040
cgttctggcc gcgcttaaga cgaagaaagc atccaaatac gatcttgagt atgcagatgt 8100
gccacagaac atgcgggccg atacattcaa atacacccat gagaaacccc aaggctatta 8160
cagctggcat catggagcag tccaatatga aaatgggcgt ttcacggtgc cgaaaggagt 8220
tggggccaag ggagacagcg gacgacccat tctggataac cagggacggg tggtcgctat 8280
tgtgctggga ggtgtgaatg aaggatctag gacagccctt tcagtcgtca tgtggaacga 8340
gaagggagtt accgtgaagt atactccgga gaactgcgag caatggtcac tagtgaccac 8400
catgtgtctg ctcgccaatg tgacgttccc atgtgctcaa ccaccaattt gctacgacag 8460
aaaaccagca gagactttgg ccatgctcag cgttaacgtt gacaacccgg gctacgatga 8520
gctgctggaa gcagctgtta agtgccccgg aaggaaaagg agatccaccg aggagctgtt 8580
taaggagtat aagctaacgc gcccttacat ggccagatgc atcagatgtg cagttgggag 8640
ctgccatagt ccaatagcaa tcgaggcagt aaagagcgac gggcacgacg gttatgttag 8700
acttcagact tcctcgcagt atggcctgga ttcctccggc aacttaaagg gcaggaccat 8760
gcggtatgac atgcacggga ccattaaaga gataccacta catcaagtgt cactccatac 8820
atctcgcccg tgtcacattg tggatgggca cggttatttc ctgcttgcca ggtgcccggc 8880
aggggactcc atcaccatgg aatttaagaa agattccgtc acacactcct gctcggtgcc 8940
gtatgaagtg aaatttaatc ctgtaggcag agaactctat actcatcccc cagaacacgg 9000
agtagagcaa gcgtgccaag tctacgcaca tgatgcacag aacagaggag cttatgtcga 9060
gatgcacctc ccgggctcag aagtggacag cagtttggtt tccttgagcg gcagttcagt 9120
caccgtgaca cctcctgttg ggactagcgc cctggtggaa tgcgagtgtg gcggcacaaa 9180
gatctccgag accatcaaca agacaaaaca gttcagccag tgcacaaaga aggagcagtg 9240
cagagcatat cggctgcaga acgataagtg ggtgtataat tctgacaaac tgcccaaagc 9300
agcgggagcc accttaaaag gaaaactgca tgtcccattc ttgctggcag acggcaaatg 9360
caccgtgcct ctagcaccag aacctatgat aacctttggt ttcagatcag tgtcactgaa 9420
actgcaccct aagaatccca catatctaac cacccgccaa cttgctgatg agcctcacta 9480
cacgcacgag ctcatatctg aaccagctgt taggaatttt accgtcaccg aaaaagggtg 9540
ggagtttgta tggggaaacc acccgccgaa aaggttttgg gcacaggaaa cagcacccgg 9600
aaatccacat gggctaccgc acgaggtgat aactcattat taccacagat accctatgtc 9660
caccatcctg ggtttgtcaa tttgtgccgc cattgcaacc gtttccgttg cagcgtctac 9720
ctggctgttt tgcagatcta gagttgcgtg cctaactcct taccggctaa cacctaacgc 9780
taggatacca ttttgtctgg ctgtgctttg ctgcgcccgc actgcccggg ccgagaccac 9840
ctgggagtcc ttggatcacc tatggaacaa taaccaacag atgttctgga ttcaattgct 9900
gatccctctg gccgccttga tcgtagtgac tcgcctgctc aggtgcgtgt gctgtgtcgt 9960
gcctttttta gtcatggccg gcgccgcagg cgccggcgcc tacgagcacg cgaccacgat 10020
gccgagccaa gcgggaatct cgtataacac tatagtcaac agagcaggct acgcaccact 10080
ccctatcagc ataacaccaa caaagatcaa gctgatacct acagtgaact tggagtacgt 10140
cacctgccac tacaaaacag gaatggattc accagccatc aaatgctgcg gatctcagga 10200
atgcactcca acttacaggc ctgatgaaca gtgcaaagtc ttcacagggg tttacccgtt 10260
catgtggggt ggtgcatatt gcttttgcga cactgagaac acccaagtca gcaaggccta 10320
cgtaatgaaa tctgacgact gccttgcgga tcatgctgaa gcatataaag cgcacacagc 10380
ctcagtgcag gcgttcctca acatcacagt gggagaacac tctattgtga ctaccgtgta 10440
tgtgaatgga gaaactcctg tgaatttcaa tggggtcaaa ttaactgcag gtccgctttc 10500
cacagcttgg acaccctttg atcgcaaaat cgtgcagtat gccggggaga tctataatta 10560
tgattttcct gagtatgggg caggacaacc aggagcattt ggagatatac aatccagaac 10620
agtctcaagc tcagatctgt atgccaatac caacctagtg ctgcagagac ccaaagcagg 10680
agcgatccac gtgccataca ctcaggcacc ttcgggtttt gagcaatgga agaaagataa 10740
agctccatca ttgaaattta ccgccccttt cggatgcgaa atatatacaa accccattcg 10800
cgccgaaaac tgtgctgtag ggtcaattcc attagccttt gacattcccg acgccttgtt 10860
caccagggtg tcagaaacac cgacactttc agcggccgaa tgcactctta acgagtgcgt 10920
gtattcttcc gactttggtg ggatcgccac ggtcaagtac tcggccagca agtcaggcaa 10980
gtgcgcagtc catgtgccat cagggactgc taccctaaaa gaagcagcag tcgagctaac 11040
cgagcaaggg tcggcgacta tccatttctc gaccgcaaat atccacccgg agttcaggct 11100
ccaaatatgc acatcatatg ttacgtgcaa aggtgattgt caccccccga aagaccatat 11160
tgtgacacac cctcagtatc acgcccaaac atttacagcc gcggtgtcaa aaaccgcgtg 11220
gacgtggtta acatccctgc tgggaggatc agccgtaatt attataattg gcttggtgct 11280
ggctactatt gtggccatgt acgtgctgac caaccagaaa cataattgaa tacagcagca 11340
attggcaagc tgcttacata gaactcgcgg cgattggcat gccgccttaa aatttttatt 11400
ttattttttc ttttcttttc cgaatcggat tttgttttta atatttc 11447
<210> 6
<211> 7894
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 6
atgggcggcg catgagagaa gcccagacca attacctacc caaaatggag aaagttcacg 60
ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120
aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180
tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240
gtgcgcccgc ccgcagaatg tattctaagc acaagtatca ttgtatctgt ccgatgagat 300
gtgcggaaga tccggacaga ttgtataagt atgcaactaa gctgaagaaa aactgtaagg 360
aaataactga taaggaattg gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc 420
ctgacctgga aactgagact atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc 480
aagtcgctgt ttaccaggat gtatacgcgg ttgacggacc gacaagtctc tatcaccaag 540
ccaataaggg agttagagtc gcctactgga taggctttga caccacccct tttatgttta 600
agaacttggc tggagcatat ccatcatact ctaccaactg ggccgacgaa accgtgttaa 660
cggctcgtaa cataggccta tgcagctctg acgttatgga gcggtcacgt agagggatgt 720
ccattcttag aaagaagtat ttgaaaccat ccaacaatgt tctattctct gttggctcga 780
ccatctacca cgagaagagg gacttactga ggagctggca cctgccgtct gtatttcact 840
tacgtggcaa gcaaaattac acatgtcggt gtgagactat agttagttgc gacgggtacg 900
tcgttaaaag aatagctatc agtccaggcc tgtatgggaa gccttcaggc tatgctgcta 960
cgatgcaccg cgagggattc ttgtgctgca aagtgacaga cacattgaac ggggagaggg 1020
tctcttttcc cgtgtgcacg tatgtgccag ctacattgtg tgaccaaatg actggcatac 1080
tggcaacaga tgtcagtgcg gacgacgcgc aaaaactgct ggttgggctc aaccagcgta 1140
tagtcgtcaa cggtcgcacc cagagaaaca ccaataccat gaaaaattac cttttgcccg 1200
tagtggccca ggcatttgct aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa 1260
ggccactagg actacgagat agacagttag tcatggggtg ttgttgggct tttagaaggc 1320
acaagataac atctatttat aagcgcccgg atacccaaac catcatcaaa gtgaacagcg 1380
atttccactc attcgtgctg cccaggatag gcagtaacac attggagatc gggctgagaa 1440
caagaatcag gaaaatgtta gaggagcaca aggagccgtc acctctcatt accgccgagg 1500
acgtacaaga agctaagtgc gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt 1560
tgcgcgcagc tctaccacct ttggcagctg atgttgagga gcccactctg gaagccgatg 1620
tcgacttgat gttacaagag gctggggccg gctcagtgga gacacctcgt ggcttgataa 1680
aggttaccag ctacgctggc gaggacaaga tcggctctta cgctgtgctt tctccgcagg 1740
ctgtactcaa gagtgaaaaa ttatcttgca tccaccctct cgctgaacaa gtcatagtga 1800
taacacactc tggccgaaaa gggcgttatg ccgtggaacc ataccatggt aaagtagtgg 1860
tgccagaggg acatgcaata cccgtccagg actttcaagc tctgagtgaa agtgccacca 1920
ttgtgtacaa cgaacgtgag ttcgtaaaca ggtacctgca ccatattgcc acacatggag 1980
gagcgctgaa cactgatgaa gaatattaca aaactgtcaa gcccagcgag cacgacggcg 2040
aatacctgta cgacatcgac aggaaacagt gcgtcaagaa agaactagtc actgggctag 2100
ggctcacagg cgagctggtg gatcctccct tccatgaatt cgcctacgag agtctgagaa 2160
cacgaccagc cgctccttac caagtaccaa ccataggggt gtatggcgtg ccaggatcag 2220
gcaagtctgg catcattaaa agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga 2280
aagaaaactg tgcagaaatt ataagggacg tcaagaaaat gaaagggctg gacgtcaatg 2340
ccagaactgt ggactcagtg ctcttgaatg gatgcaaaca ccccgtagag accctgtata 2400
ttgacgaagc ttttgcttgt catgcaggta ctctcagagc gctcatagcc attataagac 2460
ctaaaaaggc agtgctctgc ggggatccca aacagtgcgg tttttttaac atgatgtgcc 2520
tgaaagtgca ttttaaccac gagatttgca cacaagtctt ccacaaaagc atctctcgcc 2580
gttgcactaa atctgtgact tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa 2640
cgacgaatcc gaaagagact aagattgtga ttgacactac cggcagtacc aaacctaagc 2700
aggacgatct cattctcact tgtttcagag ggtgggtgaa gcagttgcaa atagattaca 2760
aaggcaacga aataatgacg gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg 2820
ccgttcggta caaggtgaat gaaaatcctc tgtacgcacc cacctcagaa catgtgaacg 2880
tcctactgac ccgcacggag gaccgcatcg tgtggaaaac actagccggc gacccatgga 2940
taaaaacact gactgccaag taccctggga atttcactgc cacgatagag gagtggcaag 3000
cagagcatga tgccatcatg aggcacatct tggagagacc ggaccctacc gacgtcttcc 3060
agaataaggc aaacgtgtgt tgggccaagg ctttagtgcc ggtgctgaag accgctggca 3120
tagacatgac cactgaacaa tggaacactg tggattattt tgaaacggac aaagctcact 3180
cagcagagat agtattgaac caactatgcg tgaggttctt tggactcgat ctggactccg 3240
gtctattttc tgcacccact gttccgttat ccattaggaa taatcactgg gataactccc 3300
cgtcgcctaa catgtacggg ctgaataaag aagtggtccg tcagctctct cgcaggtacc 3360
cacaactgcc tcgggcagtt gccactggaa gagtctatga catgaacact ggtacactgc 3420
gcaattatga tccgcgcata aacctagtac ctgtaaacag aagactgcct catgctttag 3480
tcctccacca taatgaacac ccacagagtg acttttcttc attcgtcagc aaattgaagg 3540
gcagaactgt cctggtggtc ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt 3600
tgtcagaccg gcctgaggct accttcagag ctcggctgga tttaggcatc ccaggtgatg 3660
tgcccaaata tgacataata tttgttaatg tgaggacccc atataaatac catcactatc 3720
agcagtgtga agaccatgcc attaagctta gcatgttgac caagaaagct tgtctgcatc 3780
tgaatcccgg cggaacctgt gtcagcatag gttatggtta cgctgacagg gccagcgaaa 3840
gcatcattgg tgctatagcg cggcagttca agttttcccg ggtatgcaaa ccgaaatcct 3900
cacttgaaga gacggaagtt ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc 3960
acaatcctta caagctttca tcaaccttga ccaacattta tacaggttcc agactccacg 4020
aagccggatg tgcaccctca tatcatgtgg tgcgagggga tattgccacg gccaccgaag 4080
gagtgattat aaatgctgct aacagcaaag gacaacctgg cggaggggtg tgcggagcgc 4140
tgtataagaa attcccggaa agcttcgatt tacagccgat cgaagtagga aaagcgcgac 4200
tggtcaaagg tgcagctaaa catatcattc atgccgtagg accaaacttc aacaaagttt 4260
cggaggttga aggtgacaaa cagttggcag aggcttatga gtccatcgct aagattgtca 4320
acgataacaa ttacaagtca gtagcgattc cactgttgtc caccggcatc ttttccggga 4380
acaaagatcg actaacccaa tcattgaacc atttgctgac agctttagac accactgatg 4440
cagatgtagc catatactgc agggacaaga aatgggaaat gactctcaag gaagcagtgg 4500
ctaggagaga agcagtggag gagatatgca tatccgacga ctcttcagtg acagaacctg 4560
atgcagagct ggtgagggtg catccgaaga gttctttggc tggaaggaag ggctacagca 4620
caagcgatgg caaaactttc tcatatttgg aagggaccaa gtttcaccag gcggccaagg 4680
atatagcaga aattaatgcc atgtggcccg ttgcaacgga ggccaatgag caggtatgca 4740
tgtatatcct cggagaaagc atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg 4800
aagcctccac accacctagc acgctgcctt gcttgtgcat ccatgccatg actccagaaa 4860
gagtacagcg cctaaaagcc tcacgtccag aacaaattac tgtgtgctca tcctttccat 4920
tgccgaagta tagaatcact ggtgtgcaga agatccaatg ctcccagcct atattgttct 4980
caccgaaagt gcctgcgtat attcatccaa ggaagtatct cgtggaaaca ccaccggtag 5040
acgagactcc ggagccatcg gcagagaacc aatccacaga ggggacacct gaacaaccac 5100
cacttataac cgaggatgag accaggacta gaacgcctga gccgatcatc atcgaagagg 5160
aagaagagga tagcataagt ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg 5220
aggcagacat tcacgggccg ccctctgtat ctagctcatc ctggtccatt cctcatgcat 5280
ccgactttga tgtggacagt ttatccatac ttgacaccct ggagggagct agcgtgacca 5340
gcggggcaac gtcagccgag actaactctt acttcgcaaa gagtatggag tttctggcgc 5400
gaccggtgcc tgcgcctcga acagtattca ggaaccctcc acatcccgct ccgcgcacaa 5460
gaacaccgtc acttgcaccc agcagggcct gctcgagaac cagcctagtt tccaccccgc 5520
caggcgtgaa tagggtgatc actagagagg agctcgaggc gcttaccccg tcacgcactc 5580
ctagcaggtc ggtctcgaga accagcctgg tctccaaccc gccaggcgta aatagggtga 5640
ttacaagaga ggagtttgag gcgttcgtag cacaacaaca atgacggttt gatgcgggtg 5700
catacatctt ttcctccgac accggtcaag ggcatttaca acaaaaatca gtaaggcaaa 5760
cggtgctatc cgaagtggtg ttggagagga ccgaattgga gatttcgtat gccccgcgcc 5820
tcgaccaaga aaaagaagaa ttactacgca agaaattaca gttaaatccc acacctgcta 5880
acagaagcag ataccagtcc aggaaggtgg agaacatgaa agccataaca gctagacgta 5940
ttctgcaagg cctagggcat tatttgaagg cagaaggaaa agtggagtgc taccgaaccc 6000
tgcatcctgt tcctttgtat tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg 6060
cagtggaagc ctgtaacgcc atgttgaaag agaactttcc gactgtggct tcttactgta 6120
ttattccaga gtacgatgcc tatttggaca tggttgacgg agcttcatgc tgcttagaca 6180
ctgccagttt ttgccctgca aagctgcgca gctttccaaa gaaacactcc tatttggaac 6240
ccacaatacg atcggcagtg ccttcagcga tccagaacac gctccagaac gtcctggcag 6300
ctgccacaaa aagaaattgc aatgtcacgc aaatgagaga attgcccgta ttggattcgg 6360
cggcctttaa tgtggaatgc ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt 6420
ttaaagaaaa ccccatcagg cttactgaag aaaacgtggt aaattacatt accaaattaa 6480
aaggaccaaa agctgctgct ctttttgcga agacacataa tttgaatatg ttgcaggaca 6540
taccaatgga caggtttgta atggacttaa agagagacgt gaaagtgact ccaggaacaa 6600
aacatactga agaacggccc aaggtacagg tgatccaggc tgccgatccg ctagcaacag 6660
cgtatctgtg cggaatccac cgagagctgg ttaggagatt aaatgcggtc ctgcttccga 6720
acattcatac actgtttgat atgtcggctg aagactttga cgctattata gccgagcact 6780
tccagcctgg ggattgtgtt ctggaaactg acatcgcgtc gtttgataaa agtgaggacg 6840
acgccatggc tctgaccgcg ttaatgattc tggaagactt aggtgtggac gcagagctgt 6900
tgacgctgat tgaggcggct ttcggcgaaa tttcatcaat acatttgccc actaaaacta 6960
aatttaaatt cggagccatg atgaaatctg gaatgttcct cacactgttt gtgaacacag 7020
tcattaacat tgtaatcgca agcagagtgt tgagagaacg gctaaccgga tcaccatgtg 7080
cagcattcat tggagatgac aatatcgtga aaggagtcaa atcggacaaa ttaatggcag 7140
acaggtgcgc cacctggttg aatatggaag tcaagattat agatgctgtg gtgggcgaga 7200
aagcgcctta tttctgtgga gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc 7260
gtgtggcaga ccccctaaaa aggctgttta agcttggcaa acctctggca gcagacgatg 7320
aacatgatga tgacaggaga agggcattgc atgaagagtc aacacgctgg aaccgagtgg 7380
gtattctttc agagctgtgc aaggcagtag aatcaaggta tgaaaccgta ggaacttcca 7440
tcatagttat ggccatgact actctagcta gcagtgttaa atcattcagc tacctgagag 7500
gggcccctat aactctctac ggctaacctg aatggactac gactatcacg cccaaacatt 7560
tacagccgcg gtgtcaaaaa ccgcgtggac gtggttaaca tccctgctgg gaggatcagc 7620
cgtaattatt ataattggct tggtgctggc tactattgtg gccatgtacg tgctgaccaa 7680
ccagaaacat aattgaatac agcagcaatt ggcaagctgc ttacatagaa ctcgcggcga 7740
ttggcatgcc gccttaaaat ttttatttta ttttttcttt tcttttccga atcggatttt 7800
gtttttaata tttcaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 7860
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaa 7894
<210> 7
<211> 7893
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 7
ataggcggcg catgagagaa gcccagacca attacctacc caaaatggag aaagttcacg 60
ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120
aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180
tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240
gtgcgcccgc ccgcagaatg tattctaagc acaagtatca ttgtatctgt ccgatgagat 300
gtgcggaaga tccggacaga ttgtataagt atgcaactaa gctgaagaaa aactgtaagg 360
aaataactga taaggaattg gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc 420
ctgacctgga aactgagact atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc 480
aagtcgctgt ttaccaggat gtatacgcgg ttgacggacc gacaagtctc tatcaccaag 540
ccaataaggg agttagagtc gcctactgga taggctttga caccacccct tttatgttta 600
agaacttggc tggagcatat ccatcatact ctaccaactg ggccgacgaa accgtgttaa 660
cggctcgtaa cataggccta tgcagctctg acgttatgga gcggtcacgt agagggatgt 720
ccattcttag aaagaagtat ttgaaaccat ccaacaatgt tctattctct gttggctcga 780
ccatctacca cgagaagagg gacttactga ggagctggca cctgccgtct gtatttcact 840
tacgtggcaa gcaaaattac acatgtcggt gtgagactat agttagttgc gacgggtacg 900
tcgttaaaag aatagctatc agtccaggcc tgtatgggaa gccttcaggc tatgctgcta 960
cgatgcaccg cgagggattc ttgtgctgca aagtgacaga cacattgaac ggggagaggg 1020
tctcttttcc cgtgtgcacg tatgtgccag ctacattgtg tgaccaaatg actggcatac 1080
tggcaacaga tgtcagtgcg gacgacgcgc aaaaactgct ggttgggctc aaccagcgta 1140
tagtcgtcaa cggtcgcacc cagagaaaca ccaataccat gaaaaattac cttttgcccg 1200
tagtggccca ggcatttgct aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa 1260
ggccactagg actacgagat agacagttag tcatggggtg ttgttgggct tttagaaggc 1320
acaagataac atctatttat aagcgcccgg atacccaaac catcatcaaa gtgaacagcg 1380
atttccactc attcgtgctg cccaggatag gcagtaacac attggagatc gggctgagaa 1440
caagaatcag gaaaatgtta gaggagcaca aggagccgtc acctctcatt accgccgagg 1500
acgtacaaga agctaagtgc gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt 1560
tgcgcgcagc tctaccacct ttggcagctg atgttgagga gcccactctg gaagccgatg 1620
tcgacttgat gttacaagag gctggggccg gctcagtgga gacacctcgt ggcttgataa 1680
aggttaccag ctacgatggc gaggacaaga tcggctctta cgctgtgctt tctccgcagg 1740
ctgtactcaa gagtgaaaaa ttatcttgca tccaccctct cgctgaacaa gtcatagtga 1800
taacacactc tggccgaaaa gggcgttatg ccgtggaacc ataccatggt aaagtagtgg 1860
tgccagaggg acatgcaata cccgtccagg actttcaagc tctgagtgaa agtgccacca 1920
ttgtgtacaa cgaacgtgag ttcgtaaaca ggtacctgca ccatattgcc acacatggag 1980
gagcgctgaa cactgatgaa gaatattaca aaactgtcaa gcccagcgag cacgacggcg 2040
aatacctgta cgacatcgac aggaaacagt gcgtcaagaa agaactagtc actgggctag 2100
ggctcacagg cgagctggtg gatcctccct tccatgaatt cgcctacgag agtctgagaa 2160
cacgaccagc cgctccttac caagtaccaa ccataggggt gtatggcgtg ccaggatcag 2220
gcaagtctgg catcattaaa agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga 2280
aagaaaactg tgcagaaatt ataagggacg tcaagaaaat gaaagggctg gacgtcaatg 2340
ccagaactgt ggactcagtg ctcttgaatg gatgcaaaca ccccgtagag accctgtata 2400
ttgacgaagc ttttgcttgt catgcaggta ctctcagagc gctcatagcc attataagac 2460
ctaaaaaggc agtgctctgc ggggatccca aacagtgcgg tttttttaac atgatgtgcc 2520
tgaaagtgca ttttaaccac gagatttgca cacaagtctt ccacaaaagc atctctcgcc 2580
gttgcactaa atctgtgact tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa 2640
cgacgaatcc gaaagagact aagattgtga ttgacactac cggcagtacc aaacctaagc 2700
aggacgatct cattctcact tgtttcagag ggtgggtgaa gcagttgcaa atagattaca 2760
aaggcaacga aataatgacg gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg 2820
ccgttcggta caaggtgaat gaaaatcctc tgtacgcacc cacctcagaa catgtgaacg 2880
tcctactgac ccgcacggag gaccgcatcg tgtggaaaac actagccggc gacccatgga 2940
taaaaacact gactgccaag taccctggga atttcactgc cacgatagag gagtggcaag 3000
cagagcatga tgccatcatg aggcacatct tggagagacc ggaccctacc gacgtcttcc 3060
agaataaggc aaacgtgtgt tgggccaagg ctttagtgcc ggtgctgaag accgctggca 3120
tagacatgac cactgaacaa tggaacactg tggattattt tgaaacggac aaagctcact 3180
cagcagagat agtattgaac caactatgcg tgaggttctt tggactcgat ctggactccg 3240
gtctattttc tgcacccact gttccgttat ccattaggaa taatcactgg gataactccc 3300
cgtcgcctaa catgtacggg ctgaataaag aagtggtccg tcagctctct cgcaggtacc 3360
cacaactgcc tcgggcagtt gccactggaa gagtctatga catgaacact ggtacactgc 3420
gcaattatga tccgcgcata aacctagtac ctgtaaacag aagactgcct catgctttag 3480
tcctccacca taatgaacac ccacagagtg acttttcttc attcgtcagc aaattgaagg 3540
gcagaactgt cctggtggtc ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt 3600
tgtcagaccg gcctgaggct accttcagag ctcggctgga tttaggcatc ccaggtgatg 3660
tgcccaaata tgacataata tttgttaatg tgaggacccc atataaatac catcactatc 3720
agcagtgtga agaccatgcc attaagctta gcatgttgac caagaaagct tgtctgcatc 3780
tgaatcccgg cggaacctgt gtcagcatag gttatggtta cgctgacagg gccagcgaaa 3840
gcatcattgg tgctatagcg cggcagttca agttttcccg ggtatgcaaa ccgaaatcct 3900
cacttgaaga gacggaagtt ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc 3960
acaatcctta caagctttca tcaaccttga ccaacattta tacaggttcc agactccacg 4020
aagccggatg tgcaccctca tatcatgtgg tgcgagggga tattgccacg gccaccgaag 4080
gagtgattat aaatgctgct aacagcaaag gacaacctgg cggaggggtg tgcggagcgc 4140
tgtataagaa attcccggaa agcttcgatt tacagccgat cgaagtagga aaagcgcgac 4200
tggtcaaagg tgcagctaaa catatcattc atgccgtagg accaaacttc aacaaagttt 4260
cggaggttga aggtgacaaa cagttggcag aggcttatga gtccatcgct aagattgtca 4320
acgataacaa ttacaagtca gtagcgattc cactgttgtc caccggcatc ttttccggga 4380
acaaagatcg actaacccaa tcattgaacc atttgctgac agctttagac accactgatg 4440
cagatgtagc catatactgc agggacaaga aatgggaaat gactctcaag gaagcagtgg 4500
ctaggagaga agcagtggag gagatatgca tatccgacga ctcttcagtg acagaacctg 4560
atgcagagct ggtgagggtg catccgaaga gttctttggc tggaaggaag ggctacagca 4620
caagcgatgg caaaactttc tcatatttgg aagggaccaa gtttcaccag gcggccaagg 4680
atatagcaga aattaatgcc atgtggcccg ttgcaacgga ggccaatgag caggtatgca 4740
tgtatatcct cggagaaagc atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg 4800
aagcctccac accacctagc acgctgcctt gcttgtgcat ccatgccatg actccagaaa 4860
gagtacagcg cctaaaagcc tcacgtccag aacaaattac tgtgtgctca tcctttccat 4920
tgccgaagta tagaatcact ggtgtgcaga agatccaatg ctcccagcct atattgttct 4980
caccgaaagt gcctgcgtat attcatccaa ggaagtatct cgtggaaaca ccaccggtag 5040
acgagactcc ggagccatcg gcagagaacc aatccacaga ggggacacct gaacaaccac 5100
cacttataac cgaggatgag accaggacta gaacgcctga gccgatcatc atcgaagagg 5160
aagaagagga tagcataagt ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg 5220
aggcagacat tcacgggccg ccctctgtat ctagctcatc ctggtccatt cctcatgcat 5280
ccgactttga tgtggacagt ttatccatac ttgacaccct ggagggagct agcgtgacca 5340
gcggggcaac gtcagccgag actaactctt acttcgcaaa gagtatggag tttctggcgc 5400
gaccggtgcc tgcgcctcga acagtattca ggaaccctcc acatcccgct ccgcgcacaa 5460
gaacaccgtc acttgcaccc agcagggcct gctcgagaac cagcctagtt tccaccccgc 5520
caggcgtgaa tagggtgatc actagagagg agctcgaggc gcttaccccg tcacgcactc 5580
ctagcaggtc ggtctcgaga accagcctgg tctccaaccc gccaggcgta aatagggtga 5640
ttacaagaga ggagtttgag gcgttcgtag cacaacaaca atgacggttt gatgcgggtg 5700
catacatctt ttcctccgac accggtcaag ggcatttaca acaaaaatca gtaaggcaaa 5760
cggtgctatc cgaagtggtg ttggagagga ccgaattgga gatttcgtat gccccgcgcc 5820
tcgaccaaga aaaagaagaa ttactacgca agaaattaca gttaaatccc acacctgcta 5880
acagaagcag ataccagtcc aggaaggtgg agaacatgaa agccataaca gctagacgta 5940
ttctgcaagg cctagggcat tatttgaagg cagaaggaaa agtggagtgc taccgaaccc 6000
tgcatcctgt tcctttgtat tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg 6060
cagtggaagc ctgtaacgcc atgttgaaag agaactttcc gactgtggct tcttactgta 6120
ttattccaga gtacgatgcc tatttggaca tggttgacgg agcttcatgc tgcttagaca 6180
ctgccagttt ttgccctgca aagctgcgca gctttccaaa gaaacactcc tatttggaac 6240
ccacaatacg atcggcagtg ccttcagcga tccagaacac gctccagaac gtcctggcag 6300
ctgccacaaa aagaaattgc aatgtcacgc aaatgagaga attgcccgta ttggattcgg 6360
cggcctttaa tgtggaatgc ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt 6420
ttaaagaaaa ccccatcagg cttactgaag aaaacgtggt aaattacatt accaaattaa 6480
aaggaccaaa agctgctgct ctttttgcga agacacataa tttgaatatg ttgcaggaca 6540
taccaatgga caggtttgta atggacttaa agagagacgt gaaagtgact ccaggaacaa 6600
aacatactga agaacggccc aaggtacagg tgatccaggc tgccgatccg ctagcaacag 6660
cgtatctgtg cggaatccac cgagagctgg ttaggagatt aaatgcggtc ctgcttccga 6720
acattcatac actgtttgat atgtcggctg aagactttga cgctattata gccgagcact 6780
tccagcctgg ggattgtgtt ctggaaactg acatcgcgtc gtttgataaa agtgaggacg 6840
acgccatggc tctgaccgcg ttaatgattc tggaagactt aggtgtggac gcagagctgt 6900
tgacgctgat tgaggcggct ttcggcgaaa tttcatcaat acatttgccc actaaaacta 6960
aatttaaatt cggagccatg atgaaatctg gaatgttcct cacactgttt gtgaacacag 7020
tcattaacat tgtaatcgca agcagagtgt tgagagaacg gctaaccgga tcaccatgtg 7080
cagcattcat tggagatgac aatatcgtga aaggagtcaa atcggacaaa ttaatggcag 7140
acaggtgcgc cacctggttg aatatggaag tcaagattat agatgctgtg gtgggcgaga 7200
aagcgcctta tttctgtgga gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc 7260
gtgtggcaga ccccctaaaa aggctgttta agcttggcaa acctctggca gcagacgatg 7320
aacatgatga tgacaggaga agggcattgc atgaagagtc aacacgctgg aaccgagtgg 7380
gtattctttc agagctgtgc aaggcagtag aatcaaggta tgaaaccgta ggaacttcca 7440
tcatagttat ggccatgact actctagcta gcagtgttaa atcattcagc tacctgagag 7500
gggcccctat aactctctac ggctaacctg aatggactac gactatcacg cccaaacatt 7560
tacagccgcg gtgtcaaaaa ccgcgtggac gtggttaaca tccctgctgg gaggatcagc 7620
cgtaattatt ataattggct tggtgctggc tactattgtg gccatgtacg tgctgaccaa 7680
ccagaaacat aattgaatac agcagcaatt ggcaagctgc ttacatagaa ctcgcggcga 7740
ttggcatgcc gccttaaaat ttttatttta tttttctttt cttttccgaa tcggattttg 7800
tttttaatat ttcaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 7860
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaa 7893
<210> 8
<211> 7927
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 8
taatacgact cactatagga tgggcggcgc atgagagaag cccagaccaa ttacctaccc 60
aaaatggaga aagttcacgt tgacatcgag gaagacagcc cattcctcag agctttgcag 120
cggagcttcc cgcagtttga ggtagaagcc aagcaggtca ctgataatga ccatgctaat 180
gccagagcgt tttcgcatct ggcttcaaaa ctgatcgaaa cggaggtgga cccatccgac 240
acgatccttg acattggaag tgcgcccgcc cgcagaatgt attctaagca caagtatcat 300
tgtatctgtc cgatgagatg tgcggaagat ccggacagat tgtataagta tgcaactaag 360
ctgaagaaaa actgtaagga aataactgat aaggaattgg acaagaaaat gaaggagctc 420
gccgccgtca tgagcgaccc tgacctggaa actgagacta tgtgcctcca cgacgacgag 480
tcgtgtcgct acgaagggca agtcgctgtt taccaggatg tatacgcggt tgacggaccg 540
acaagtctct atcaccaagc caataaggga gttagagtcg cctactggat aggctttgac 600
accacccctt ttatgtttaa gaacttggct ggagcatatc catcatactc taccaactgg 660
gccgacgaaa ccgtgttaac ggctcgtaac ataggcctat gcagctctga cgttatggag 720
cggtcacgta gagggatgtc cattcttaga aagaagtatt tgaaaccatc caacaatgtt 780
ctattctctg ttggctcgac catctaccac gagaagaggg acttactgag gagctggcac 840
ctgccgtctg tatttcactt acgtggcaag caaaattaca catgtcggtg tgagactata 900
gttagttgcg acgggtacgt cgttaaaaga atagctatca gtccaggcct gtatgggaag 960
ccttcaggct atgctgctac gatgcaccgc gagggattct tgtgctgcaa agtgacagac 1020
acattgaacg gggagagggt ctcttttccc gtgtgcacgt atgtgccagc tacattgtgt 1080
gaccaaatga ctggcatact ggcaacagat gtcagtgcgg acgacgcgca aaaactgctg 1140
gttgggctca accagcgtat agtcgtcaac ggtcgcaccc agagaaacac caataccatg 1200
aaaaattacc ttttgcccgt agtggcccag gcatttgcta ggtgggcaaa ggaatataag 1260
gaagatcaag aagatgaaag gccactagga ctacgagata gacagttagt catggggtgt 1320
tgttgggctt ttagaaggca caagataaca tctatttata agcgcccgga tacccaaacc 1380
atcatcaaag tgaacagcga tttccactca ttcgtgctgc ccaggatagg cagtaacaca 1440
ttggagatcg ggctgagaac aagaatcagg aaaatgttag aggagcacaa ggagccgtca 1500
cctctcatta ccgccgagga cgtacaagaa gctaagtgcg cagccgatga ggctaaggag 1560
gtgcgtgaag ccgaggagtt gcgcgcagct ctaccacctt tggcagctga tgttgaggag 1620
cccactctgg aagccgatgt cgacttgatg ttacaagagg ctggggccgg ctcagtggag 1680
acacctcgtg gcttgataaa ggttaccagc tacgctggcg aggacaagat cggctcttac 1740
gctgtgcttt ctccgcaggc tgtactcaag agtgaaaaat tatcttgcat ccaccctctc 1800
gctgaacaag tcatagtgat aacacactct ggccgaaaag ggcgttatgc cgtggaacca 1860
taccatggta aagtagtggt gccagaggga catgcaatac ccgtccagga ctttcaagct 1920
ctgagtgaaa gtgccaccat tgtgtacaac gaacgtgagt tcgtaaacag gtacctgcac 1980
catattgcca cacatggagg agcgctgaac actgatgaag aatattacaa aactgtcaag 2040
cccagcgagc acgacggcga atacctgtac gacatcgaca ggaaacagtg cgtcaagaaa 2100
gaactagtca ctgggctagg gctcacaggc gagctggtgg atcctccctt ccatgaattc 2160
gcctacgaga gtctgagaac acgaccagcc gctccttacc aagtaccaac cataggggtg 2220
tatggcgtgc caggatcagg caagtctggc atcattaaaa gcgcagtcac caaaaaagat 2280
ctagtggtga gcgccaagaa agaaaactgt gcagaaatta taagggacgt caagaaaatg 2340
aaagggctgg acgtcaatgc cagaactgtg gactcagtgc tcttgaatgg atgcaaacac 2400
cccgtagaga ccctgtatat tgacgaagct tttgcttgtc atgcaggtac tctcagagcg 2460
ctcatagcca ttataagacc taaaaaggca gtgctctgcg gggatcccaa acagtgcggt 2520
ttttttaaca tgatgtgcct gaaagtgcat tttaaccacg agatttgcac acaagtcttc 2580
cacaaaagca tctctcgccg ttgcactaaa tctgtgactt cggtcgtctc aaccttgttt 2640
tacgacaaaa aaatgagaac gacgaatccg aaagagacta agattgtgat tgacactacc 2700
ggcagtacca aacctaagca ggacgatctc attctcactt gtttcagagg gtgggtgaag 2760
cagttgcaaa tagattacaa aggcaacgaa ataatgacgg cagctgcctc tcaagggctg 2820
acccgtaaag gtgtgtatgc cgttcggtac aaggtgaatg aaaatcctct gtacgcaccc 2880
acctcagaac atgtgaacgt cctactgacc cgcacggagg accgcatcgt gtggaaaaca 2940
ctagccggcg acccatggat aaaaacactg actgccaagt accctgggaa tttcactgcc 3000
acgatagagg agtggcaagc agagcatgat gccatcatga ggcacatctt ggagagaccg 3060
gaccctaccg acgtcttcca gaataaggca aacgtgtgtt gggccaaggc tttagtgccg 3120
gtgctgaaga ccgctggcat agacatgacc actgaacaat ggaacactgt ggattatttt 3180
gaaacggaca aagctcactc agcagagata gtattgaacc aactatgcgt gaggttcttt 3240
ggactcgatc tggactccgg tctattttct gcacccactg ttccgttatc cattaggaat 3300
aatcactggg ataactcccc gtcgcctaac atgtacgggc tgaataaaga agtggtccgt 3360
cagctctctc gcaggtaccc acaactgcct cgggcagttg ccactggaag agtctatgac 3420
atgaacactg gtacactgcg caattatgat ccgcgcataa acctagtacc tgtaaacaga 3480
agactgcctc atgctttagt cctccaccat aatgaacacc cacagagtga cttttcttca 3540
ttcgtcagca aattgaaggg cagaactgtc ctggtggtcg gggaaaagtt gtccgtccca 3600
ggcaaaatgg ttgactggtt gtcagaccgg cctgaggcta ccttcagagc tcggctggat 3660
ttaggcatcc caggtgatgt gcccaaatat gacataatat ttgttaatgt gaggacccca 3720
tataaatacc atcactatca gcagtgtgaa gaccatgcca ttaagcttag catgttgacc 3780
aagaaagctt gtctgcatct gaatcccggc ggaacctgtg tcagcatagg ttatggttac 3840
gctgacaggg ccagcgaaag catcattggt gctatagcgc ggcagttcaa gttttcccgg 3900
gtatgcaaac cgaaatcctc acttgaagag acggaagttc tgtttgtatt cattgggtac 3960
gatcgcaagg cccgtacgca caatccttac aagctttcat caaccttgac caacatttat 4020
acaggttcca gactccacga agccggatgt gcaccctcat atcatgtggt gcgaggggat 4080
attgccacgg ccaccgaagg agtgattata aatgctgcta acagcaaagg acaacctggc 4140
ggaggggtgt gcggagcgct gtataagaaa ttcccggaaa gcttcgattt acagccgatc 4200
gaagtaggaa aagcgcgact ggtcaaaggt gcagctaaac atatcattca tgccgtagga 4260
ccaaacttca acaaagtttc ggaggttgaa ggtgacaaac agttggcaga ggcttatgag 4320
tccatcgcta agattgtcaa cgataacaat tacaagtcag tagcgattcc actgttgtcc 4380
accggcatct tttccgggaa caaagatcga ctaacccaat cattgaacca tttgctgaca 4440
gctttagaca ccactgatgc agatgtagcc atatactgca gggacaagaa atgggaaatg 4500
actctcaagg aagcagtggc taggagagaa gcagtggagg agatatgcat atccgacgac 4560
tcttcagtga cagaacctga tgcagagctg gtgagggtgc atccgaagag ttctttggct 4620
ggaaggaagg gctacagcac aagcgatggc aaaactttct catatttgga agggaccaag 4680
tttcaccagg cggccaagga tatagcagaa attaatgcca tgtggcccgt tgcaacggag 4740
gccaatgagc aggtatgcat gtatatcctc ggagaaagca tgagcagtat taggtcgaaa 4800
tgccccgtcg aagagtcgga agcctccaca ccacctagca cgctgccttg cttgtgcatc 4860
catgccatga ctccagaaag agtacagcgc ctaaaagcct cacgtccaga acaaattact 4920
gtgtgctcat cctttccatt gccgaagtat agaatcactg gtgtgcagaa gatccaatgc 4980
tcccagccta tattgttctc accgaaagtg cctgcgtata ttcatccaag gaagtatctc 5040
gtggaaacac caccggtaga cgagactccg gagccatcgg cagagaacca atccacagag 5100
gggacacctg aacaaccacc acttataacc gaggatgaga ccaggactag aacgcctgag 5160
ccgatcatca tcgaagagga agaagaggat agcataagtt tgctgtcaga tggcccgacc 5220
caccaggtgc tgcaagtcga ggcagacatt cacgggccgc cctctgtatc tagctcatcc 5280
tggtccattc ctcatgcatc cgactttgat gtggacagtt tatccatact tgacaccctg 5340
gagggagcta gcgtgaccag cggggcaacg tcagccgaga ctaactctta cttcgcaaag 5400
agtatggagt ttctggcgcg accggtgcct gcgcctcgaa cagtattcag gaaccctcca 5460
catcccgctc cgcgcacaag aacaccgtca cttgcaccca gcagggcctg ctcgagaacc 5520
agcctagttt ccaccccgcc aggcgtgaat agggtgatca ctagagagga gctcgaggcg 5580
cttaccccgt cacgcactcc tagcaggtcg gtctcgagaa ccagcctggt ctccaacccg 5640
ccaggcgtaa atagggtgat tacaagagag gagtttgagg cgttcgtagc acaacaacaa 5700
tgacggtttg atgcgggtgc atacatcttt tcctccgaca ccggtcaagg gcatttacaa 5760
caaaaatcag taaggcaaac ggtgctatcc gaagtggtgt tggagaggac cgaattggag 5820
atttcgtatg ccccgcgcct cgaccaagaa aaagaagaat tactacgcaa gaaattacag 5880
ttaaatccca cacctgctaa cagaagcaga taccagtcca ggaaggtgga gaacatgaaa 5940
gccataacag ctagacgtat tctgcaaggc ctagggcatt atttgaaggc agaaggaaaa 6000
gtggagtgct accgaaccct gcatcctgtt cctttgtatt catctagtgt gaaccgtgcc 6060
ttttcaagcc ccaaggtcgc agtggaagcc tgtaacgcca tgttgaaaga gaactttccg 6120
actgtggctt cttactgtat tattccagag tacgatgcct atttggacat ggttgacgga 6180
gcttcatgct gcttagacac tgccagtttt tgccctgcaa agctgcgcag ctttccaaag 6240
aaacactcct atttggaacc cacaatacga tcggcagtgc cttcagcgat ccagaacacg 6300
ctccagaacg tcctggcagc tgccacaaaa agaaattgca atgtcacgca aatgagagaa 6360
ttgcccgtat tggattcggc ggcctttaat gtggaatgct tcaagaaata tgcgtgtaat 6420
aatgaatatt gggaaacgtt taaagaaaac cccatcaggc ttactgaaga aaacgtggta 6480
aattacatta ccaaattaaa aggaccaaaa gctgctgctc tttttgcgaa gacacataat 6540
ttgaatatgt tgcaggacat accaatggac aggtttgtaa tggacttaaa gagagacgtg 6600
aaagtgactc caggaacaaa acatactgaa gaacggccca aggtacaggt gatccaggct 6660
gccgatccgc tagcaacagc gtatctgtgc ggaatccacc gagagctggt taggagatta 6720
aatgcggtcc tgcttccgaa cattcataca ctgtttgata tgtcggctga agactttgac 6780
gctattatag ccgagcactt ccagcctggg gattgtgttc tggaaactga catcgcgtcg 6840
tttgataaaa gtgaggacga cgccatggct ctgaccgcgt taatgattct ggaagactta 6900
ggtgtggacg cagagctgtt gacgctgatt gaggcggctt tcggcgaaat ttcatcaata 6960
catttgccca ctaaaactaa atttaaattc ggagccatga tgaaatctgg aatgttcctc 7020
acactgtttg tgaacacagt cattaacatt gtaatcgcaa gcagagtgtt gagagaacgg 7080
ctaaccggat caccatgtgc agcattcatt ggagatgaca atatcgtgaa aggagtcaaa 7140
tcggacaaat taatggcaga caggtgcgcc acctggttga atatggaagt caagattata 7200
gatgctgtgg tgggcgagaa agcgccttat ttctgtggag ggtttatttt gtgtgactcc 7260
gtgaccggca cagcgtgccg tgtggcagac cccctaaaaa ggctgtttaa gcttggcaaa 7320
cctctggcag cagacgatga acatgatgat gacaggagaa gggcattgca tgaagagtca 7380
acacgctgga accgagtggg tattctttca gagctgtgca aggcagtaga atcaaggtat 7440
gaaaccgtag gaacttccat catagttatg gccatgacta ctctagctag cagtgttaaa 7500
tcattcagct acctgagagg ggcccctata actctctacg gctaacctga atggactacg 7560
actatcacgc ccaaacattt acagccgcgg tgtcaaaaac cgcgtggacg tggttaacat 7620
ccctgctggg aggatcagcc gtaattatta taattggctt ggtgctggct actattgtgg 7680
ccatgtacgt gctgaccaac cagaaacata attgaataca gcagcaattg gcaagctgct 7740
tacatagaac tcgcggcgat tggcatgccg ccttaaaatt tttattttat tttttctttt 7800
cttttccgaa tcggattttg tttttaatat ttcaaaaaaa aaaaaaaaaa aaaaaaaaaa 7860
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaatacgtag 7920
tttaaac 7927
<210> 9
<211> 7926
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 9
taatacgact cactatagga taggcggcgc atgagagaag cccagaccaa ttacctaccc 60
aaaatggaga aagttcacgt tgacatcgag gaagacagcc cattcctcag agctttgcag 120
cggagcttcc cgcagtttga ggtagaagcc aagcaggtca ctgataatga ccatgctaat 180
gccagagcgt tttcgcatct ggcttcaaaa ctgatcgaaa cggaggtgga cccatccgac 240
acgatccttg acattggaag tgcgcccgcc cgcagaatgt attctaagca caagtatcat 300
tgtatctgtc cgatgagatg tgcggaagat ccggacagat tgtataagta tgcaactaag 360
ctgaagaaaa actgtaagga aataactgat aaggaattgg acaagaaaat gaaggagctc 420
gccgccgtca tgagcgaccc tgacctggaa actgagacta tgtgcctcca cgacgacgag 480
tcgtgtcgct acgaagggca agtcgctgtt taccaggatg tatacgcggt tgacggaccg 540
acaagtctct atcaccaagc caataaggga gttagagtcg cctactggat aggctttgac 600
accacccctt ttatgtttaa gaacttggct ggagcatatc catcatactc taccaactgg 660
gccgacgaaa ccgtgttaac ggctcgtaac ataggcctat gcagctctga cgttatggag 720
cggtcacgta gagggatgtc cattcttaga aagaagtatt tgaaaccatc caacaatgtt 780
ctattctctg ttggctcgac catctaccac gagaagaggg acttactgag gagctggcac 840
ctgccgtctg tatttcactt acgtggcaag caaaattaca catgtcggtg tgagactata 900
gttagttgcg acgggtacgt cgttaaaaga atagctatca gtccaggcct gtatgggaag 960
ccttcaggct atgctgctac gatgcaccgc gagggattct tgtgctgcaa agtgacagac 1020
acattgaacg gggagagggt ctcttttccc gtgtgcacgt atgtgccagc tacattgtgt 1080
gaccaaatga ctggcatact ggcaacagat gtcagtgcgg acgacgcgca aaaactgctg 1140
gttgggctca accagcgtat agtcgtcaac ggtcgcaccc agagaaacac caataccatg 1200
aaaaattacc ttttgcccgt agtggcccag gcatttgcta ggtgggcaaa ggaatataag 1260
gaagatcaag aagatgaaag gccactagga ctacgagata gacagttagt catggggtgt 1320
tgttgggctt ttagaaggca caagataaca tctatttata agcgcccgga tacccaaacc 1380
atcatcaaag tgaacagcga tttccactca ttcgtgctgc ccaggatagg cagtaacaca 1440
ttggagatcg ggctgagaac aagaatcagg aaaatgttag aggagcacaa ggagccgtca 1500
cctctcatta ccgccgagga cgtacaagaa gctaagtgcg cagccgatga ggctaaggag 1560
gtgcgtgaag ccgaggagtt gcgcgcagct ctaccacctt tggcagctga tgttgaggag 1620
cccactctgg aagccgatgt cgacttgatg ttacaagagg ctggggccgg ctcagtggag 1680
acacctcgtg gcttgataaa ggttaccagc tacgatggcg aggacaagat cggctcttac 1740
gctgtgcttt ctccgcaggc tgtactcaag agtgaaaaat tatcttgcat ccaccctctc 1800
gctgaacaag tcatagtgat aacacactct ggccgaaaag ggcgttatgc cgtggaacca 1860
taccatggta aagtagtggt gccagaggga catgcaatac ccgtccagga ctttcaagct 1920
ctgagtgaaa gtgccaccat tgtgtacaac gaacgtgagt tcgtaaacag gtacctgcac 1980
catattgcca cacatggagg agcgctgaac actgatgaag aatattacaa aactgtcaag 2040
cccagcgagc acgacggcga atacctgtac gacatcgaca ggaaacagtg cgtcaagaaa 2100
gaactagtca ctgggctagg gctcacaggc gagctggtgg atcctccctt ccatgaattc 2160
gcctacgaga gtctgagaac acgaccagcc gctccttacc aagtaccaac cataggggtg 2220
tatggcgtgc caggatcagg caagtctggc atcattaaaa gcgcagtcac caaaaaagat 2280
ctagtggtga gcgccaagaa agaaaactgt gcagaaatta taagggacgt caagaaaatg 2340
aaagggctgg acgtcaatgc cagaactgtg gactcagtgc tcttgaatgg atgcaaacac 2400
cccgtagaga ccctgtatat tgacgaagct tttgcttgtc atgcaggtac tctcagagcg 2460
ctcatagcca ttataagacc taaaaaggca gtgctctgcg gggatcccaa acagtgcggt 2520
ttttttaaca tgatgtgcct gaaagtgcat tttaaccacg agatttgcac acaagtcttc 2580
cacaaaagca tctctcgccg ttgcactaaa tctgtgactt cggtcgtctc aaccttgttt 2640
tacgacaaaa aaatgagaac gacgaatccg aaagagacta agattgtgat tgacactacc 2700
ggcagtacca aacctaagca ggacgatctc attctcactt gtttcagagg gtgggtgaag 2760
cagttgcaaa tagattacaa aggcaacgaa ataatgacgg cagctgcctc tcaagggctg 2820
acccgtaaag gtgtgtatgc cgttcggtac aaggtgaatg aaaatcctct gtacgcaccc 2880
acctcagaac atgtgaacgt cctactgacc cgcacggagg accgcatcgt gtggaaaaca 2940
ctagccggcg acccatggat aaaaacactg actgccaagt accctgggaa tttcactgcc 3000
acgatagagg agtggcaagc agagcatgat gccatcatga ggcacatctt ggagagaccg 3060
gaccctaccg acgtcttcca gaataaggca aacgtgtgtt gggccaaggc tttagtgccg 3120
gtgctgaaga ccgctggcat agacatgacc actgaacaat ggaacactgt ggattatttt 3180
gaaacggaca aagctcactc agcagagata gtattgaacc aactatgcgt gaggttcttt 3240
ggactcgatc tggactccgg tctattttct gcacccactg ttccgttatc cattaggaat 3300
aatcactggg ataactcccc gtcgcctaac atgtacgggc tgaataaaga agtggtccgt 3360
cagctctctc gcaggtaccc acaactgcct cgggcagttg ccactggaag agtctatgac 3420
atgaacactg gtacactgcg caattatgat ccgcgcataa acctagtacc tgtaaacaga 3480
agactgcctc atgctttagt cctccaccat aatgaacacc cacagagtga cttttcttca 3540
ttcgtcagca aattgaaggg cagaactgtc ctggtggtcg gggaaaagtt gtccgtccca 3600
ggcaaaatgg ttgactggtt gtcagaccgg cctgaggcta ccttcagagc tcggctggat 3660
ttaggcatcc caggtgatgt gcccaaatat gacataatat ttgttaatgt gaggacccca 3720
tataaatacc atcactatca gcagtgtgaa gaccatgcca ttaagcttag catgttgacc 3780
aagaaagctt gtctgcatct gaatcccggc ggaacctgtg tcagcatagg ttatggttac 3840
gctgacaggg ccagcgaaag catcattggt gctatagcgc ggcagttcaa gttttcccgg 3900
gtatgcaaac cgaaatcctc acttgaagag acggaagttc tgtttgtatt cattgggtac 3960
gatcgcaagg cccgtacgca caatccttac aagctttcat caaccttgac caacatttat 4020
acaggttcca gactccacga agccggatgt gcaccctcat atcatgtggt gcgaggggat 4080
attgccacgg ccaccgaagg agtgattata aatgctgcta acagcaaagg acaacctggc 4140
ggaggggtgt gcggagcgct gtataagaaa ttcccggaaa gcttcgattt acagccgatc 4200
gaagtaggaa aagcgcgact ggtcaaaggt gcagctaaac atatcattca tgccgtagga 4260
ccaaacttca acaaagtttc ggaggttgaa ggtgacaaac agttggcaga ggcttatgag 4320
tccatcgcta agattgtcaa cgataacaat tacaagtcag tagcgattcc actgttgtcc 4380
accggcatct tttccgggaa caaagatcga ctaacccaat cattgaacca tttgctgaca 4440
gctttagaca ccactgatgc agatgtagcc atatactgca gggacaagaa atgggaaatg 4500
actctcaagg aagcagtggc taggagagaa gcagtggagg agatatgcat atccgacgac 4560
tcttcagtga cagaacctga tgcagagctg gtgagggtgc atccgaagag ttctttggct 4620
ggaaggaagg gctacagcac aagcgatggc aaaactttct catatttgga agggaccaag 4680
tttcaccagg cggccaagga tatagcagaa attaatgcca tgtggcccgt tgcaacggag 4740
gccaatgagc aggtatgcat gtatatcctc ggagaaagca tgagcagtat taggtcgaaa 4800
tgccccgtcg aagagtcgga agcctccaca ccacctagca cgctgccttg cttgtgcatc 4860
catgccatga ctccagaaag agtacagcgc ctaaaagcct cacgtccaga acaaattact 4920
gtgtgctcat cctttccatt gccgaagtat agaatcactg gtgtgcagaa gatccaatgc 4980
tcccagccta tattgttctc accgaaagtg cctgcgtata ttcatccaag gaagtatctc 5040
gtggaaacac caccggtaga cgagactccg gagccatcgg cagagaacca atccacagag 5100
gggacacctg aacaaccacc acttataacc gaggatgaga ccaggactag aacgcctgag 5160
ccgatcatca tcgaagagga agaagaggat agcataagtt tgctgtcaga tggcccgacc 5220
caccaggtgc tgcaagtcga ggcagacatt cacgggccgc cctctgtatc tagctcatcc 5280
tggtccattc ctcatgcatc cgactttgat gtggacagtt tatccatact tgacaccctg 5340
gagggagcta gcgtgaccag cggggcaacg tcagccgaga ctaactctta cttcgcaaag 5400
agtatggagt ttctggcgcg accggtgcct gcgcctcgaa cagtattcag gaaccctcca 5460
catcccgctc cgcgcacaag aacaccgtca cttgcaccca gcagggcctg ctcgagaacc 5520
agcctagttt ccaccccgcc aggcgtgaat agggtgatca ctagagagga gctcgaggcg 5580
cttaccccgt cacgcactcc tagcaggtcg gtctcgagaa ccagcctggt ctccaacccg 5640
ccaggcgtaa atagggtgat tacaagagag gagtttgagg cgttcgtagc acaacaacaa 5700
tgacggtttg atgcgggtgc atacatcttt tcctccgaca ccggtcaagg gcatttacaa 5760
caaaaatcag taaggcaaac ggtgctatcc gaagtggtgt tggagaggac cgaattggag 5820
atttcgtatg ccccgcgcct cgaccaagaa aaagaagaat tactacgcaa gaaattacag 5880
ttaaatccca cacctgctaa cagaagcaga taccagtcca ggaaggtgga gaacatgaaa 5940
gccataacag ctagacgtat tctgcaaggc ctagggcatt atttgaaggc agaaggaaaa 6000
gtggagtgct accgaaccct gcatcctgtt cctttgtatt catctagtgt gaaccgtgcc 6060
ttttcaagcc ccaaggtcgc agtggaagcc tgtaacgcca tgttgaaaga gaactttccg 6120
actgtggctt cttactgtat tattccagag tacgatgcct atttggacat ggttgacgga 6180
gcttcatgct gcttagacac tgccagtttt tgccctgcaa agctgcgcag ctttccaaag 6240
aaacactcct atttggaacc cacaatacga tcggcagtgc cttcagcgat ccagaacacg 6300
ctccagaacg tcctggcagc tgccacaaaa agaaattgca atgtcacgca aatgagagaa 6360
ttgcccgtat tggattcggc ggcctttaat gtggaatgct tcaagaaata tgcgtgtaat 6420
aatgaatatt gggaaacgtt taaagaaaac cccatcaggc ttactgaaga aaacgtggta 6480
aattacatta ccaaattaaa aggaccaaaa gctgctgctc tttttgcgaa gacacataat 6540
ttgaatatgt tgcaggacat accaatggac aggtttgtaa tggacttaaa gagagacgtg 6600
aaagtgactc caggaacaaa acatactgaa gaacggccca aggtacaggt gatccaggct 6660
gccgatccgc tagcaacagc gtatctgtgc ggaatccacc gagagctggt taggagatta 6720
aatgcggtcc tgcttccgaa cattcataca ctgtttgata tgtcggctga agactttgac 6780
gctattatag ccgagcactt ccagcctggg gattgtgttc tggaaactga catcgcgtcg 6840
tttgataaaa gtgaggacga cgccatggct ctgaccgcgt taatgattct ggaagactta 6900
ggtgtggacg cagagctgtt gacgctgatt gaggcggctt tcggcgaaat ttcatcaata 6960
catttgccca ctaaaactaa atttaaattc ggagccatga tgaaatctgg aatgttcctc 7020
acactgtttg tgaacacagt cattaacatt gtaatcgcaa gcagagtgtt gagagaacgg 7080
ctaaccggat caccatgtgc agcattcatt ggagatgaca atatcgtgaa aggagtcaaa 7140
tcggacaaat taatggcaga caggtgcgcc acctggttga atatggaagt caagattata 7200
gatgctgtgg tgggcgagaa agcgccttat ttctgtggag ggtttatttt gtgtgactcc 7260
gtgaccggca cagcgtgccg tgtggcagac cccctaaaaa ggctgtttaa gcttggcaaa 7320
cctctggcag cagacgatga acatgatgat gacaggagaa gggcattgca tgaagagtca 7380
acacgctgga accgagtggg tattctttca gagctgtgca aggcagtaga atcaaggtat 7440
gaaaccgtag gaacttccat catagttatg gccatgacta ctctagctag cagtgttaaa 7500
tcattcagct acctgagagg ggcccctata actctctacg gctaacctga atggactacg 7560
actatcacgc ccaaacattt acagccgcgg tgtcaaaaac cgcgtggacg tggttaacat 7620
ccctgctggg aggatcagcc gtaattatta taattggctt ggtgctggct actattgtgg 7680
ccatgtacgt gctgaccaac cagaaacata attgaataca gcagcaattg gcaagctgct 7740
tacatagaac tcgcggcgat tggcatgccg ccttaaaatt tttattttat ttttcttttc 7800
ttttccgaat cggattttgt ttttaatatt tcaaaaaaaa aaaaaaaaaa aaaaaaaaaa 7860
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aatacgtagt 7920
ttaaac 7926
<210> 10
<211> 36519
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 10
ccatcttcaa taatatacct caaacttttt gtgcgcgtta atatgcaaat gaggcgtttg 60
aatttgggga ggaagggcgg tgattggtcg agggatgagc gaccgttagg ggcggggcga 120
gtgacgtttt gatgacgtgg ttgcgaggag gagccagttt gcaagttctc gtgggaaaag 180
tgacgtcaaa cgaggtgtgg tttgaacacg gaaatactca attttcccgc gctctctgac 240
aggaaatgag gtgtttctgg gcggatgcaa gtgaaaacgg gccattttcg cgcgaaaact 300
gaatgaggaa gtgaaaatct gagtaatttc gcgtttatgg cagggaggag tatttgccga 360
gggccgagta gactttgacc gattacgtgg gggtttcgat taccgtgttt ttcacctaaa 420
tttccgcgta cggtgtcaaa gtccggtgtt tttacgtagg tgtcagctga tcgccagggt 480
atttaaacct gcgctctcca gtcaagaggc cactcttgag tgccagcgag aagagttttc 540
tcctccgcgc cgcgagtcag atctacactt tgaaagatga ggcacctgag agacctgccc 600
gatgagaaaa tcatcatcgc ttccgggaac gagattctgg aactggtggt aaatgccatg 660
atgggcgacg accctccgga gccccccacc ccatttgaga caccttcgct gcacgatttg 720
tatgatctgg aggtggatgt gcccgaggac gatcccaatg aggaggcggt aaatgatttt 780
tttagcgatg ccgcgctgct agctgccgag gaggcttcga gctctagctc agacagcgac 840
tcttcactgc atacccctag acccggcaga ggtgagaaaa agatccccga gcttaaaggg 900
gaagagatgg acttgcgctg ctatgaggaa tgcttgcccc cgagcgatga tgaggacgag 960
caggcgatcc agaacgcagc gagccaggga gtgcaagccg ccagcgagag ctttgcgctg 1020
gactgcccgc ctctgcccgg acacggctgt aagtcttgtg aatttcatcg catgaatact 1080
ggagataaag ctgtgttgtg tgcactttgc tatatgagag cttacaacca ttgtgtttac 1140
agtaagtgtg attaagttga actttagagg gaggcagaga gcagggtgac tgggcgatga 1200
ctggtttatt tatgtatata tgttctttat ataggtcccg tctctgacgc agatgatgag 1260
acccccacta caaagtccac ttcgtcaccc ccagaaattg gcacatctcc acctgagaat 1320
attgttagac cagttcctgt tagagccact gggaggagag cagctgtgga atgtttggat 1380
gacttgctac agggtggggt tgaacctttg gacttgtgta cccggaaacg ccccaggcac 1440
taagtgccac acatgtgtgt ttacttgagg tgatgtcagt atttataggg tgtggagtgc 1500
aataaaaaat gtgttgactt taagtgcgtg gtttatgact caggggtggg gactgtgagt 1560
atataagcag gtgcagacct gtgtggttag ctcagagcgg catggagatt tggacggtct 1620
tggaagactt tcacaagact agacagctgc tagagaacgc ctcgaacgga gtctcttacc 1680
tgtggagatt ctgcttcggt ggcgacctag ctaggctagt ctacagggcc aaacaggatt 1740
atagtgaaca atttgaggtt attttgagag agtgttctgg tctttttgac gctcttaact 1800
tgggccatca gtctcacttt aaccagagga tttcgagagc ccttgatttt actactcctg 1860
gcagaaccac tgcagcagta gccttttttg cttttattct tgacaaatgg agtcaagaaa 1920
cccatttcag cagggattac cagctggatt tcttagcagt agctttgtgg agaacatgga 1980
agtgccagcg cctgaatgca atctccggct acttgccggt acagccgcta gacactctga 2040
ggatcctgaa tctccaggag agtcccaggg cacgccaacg tcgccagcag cagcagcagg 2100
aggaggatca agaagagaac ccgagagccg gcctggaccc tccggcggag gaggaggagt 2160
agctgacctg tttcctgaac tgcgccgggt gctgactagg tcttcgagtg gtcgggagag 2220
ggggattaag cgggagaggc atgatgagac taatcacaga actgaactga ctgtgggtct 2280
gatgagtcgc aagcgcccag aaacagtgtg gtggcatgag gtgcagtcga ctggcacaga 2340
tgaggtgtcg gtgatgcatg agaggttttc tctagaacaa gtcaagactt gttggttaga 2400
gcctgaggat gattgggagg tagccatcag gaattatgcc aagctggctc tgaggccaga 2460
caagaagtac aagattacta agctgataaa tatcagaaat gcctgctaca tctcagggaa 2520
tggggctgaa gtggagatct gtctccagga aagggtggct ttcagatgct gcatgatgaa 2580
tatgtacccg ggagtggtgg gcatggatgg ggttaccttt atgaacatga ggttcagggg 2640
agatgggtat aatggcacgg tctttatggc caataccaag ctgacagtcc atggctgctc 2700
cttctttggg tttaataaca cctgcatcga ggcctggggt caggtcggtg tgaggggctg 2760
cagtttttca gccaactgga tgggggtcgt gggcaggacc aagagtatgc tgtccgtgaa 2820
gaaatgcttg tttgagaggt gccacctggg ggtgatgagc gagggcgaag ccagaatccg 2880
ccactgcgcc tctaccgaga cgggctgctt tgtgctgtgc aagggcaatg ctaagatcaa 2940
gcataatatg atctgtggag cctcggacga gcgcggctac cagatgctga cctgcgccgg 3000
cgggaacagc catatgctgg ccaccgtaca tgtggcttcc catgctcgca agccctggcc 3060
cgagttcgag cacaatgtca tgaccaggtg caatatgcat ctggggtccc gccgaggcat 3120
gttcatgccc taccagtgca acctgaatta tgtgaaggtg ctgctggagc ccgatgccat 3180
gtccagagtg agcctgacgg gggtgtttga catgaatgtg gaggtgtgga agattctgag 3240
atatgatgaa tccaagacca ggtgccgagc ctgcgagtgc ggagggaagc atgccaggtt 3300
ccagcccgtg tgtgtggatg tgacggagga cctgcgaccc gatcatttgg tgttgccctg 3360
caccgggacg gagttcggtt ccagcgggga agaatctgac tagagtgagt agtgttctgg 3420
ggcgggggag gacctgcatg agggccagaa taactgaaat ctgtgctttt ctgtgtgttg 3480
cagcagcatg agcggaagcg gctcctttga gggaggggta ttcagccctt atctgacggg 3540
gcgtctcccc tcctgggcgg gagtgcgtca gaatgtgatg ggatccacgg tggacggccg 3600
gcccgtgcag cccgcgaact cttcaaccct gacctatgca accctgagct cttcgtcgtt 3660
ggacgcagct gccgccgcag ctgctgcatc tgccgccagc gccgtgcgcg gaatggccat 3720
gggcgccggc tactacggca ctctggtggc caactcgagt tccaccaata atcccgccag 3780
cctgaacgag gagaagctgt tgctgctgat ggcccagctc gaggccttga cccagcgcct 3840
gggcgagctg acccagcagg tggctcagct gcaggagcag acgcgggccg cggttgccac 3900
ggtgaaatcc aaataaaaaa tgaatcaata aataaacgga gacggttgtt gattttaaca 3960
cagagtctga atctttattt gatttttcgc gcgcggtagg ccctggacca ccggtctcga 4020
tcattgagca cccggtggat cttttccagg acccggtaga ggtgggcttg gatgttgagg 4080
tacatgggca tgagcccgtc ccgggggtgg aggtagctcc attgcagggc ctcgtgctcg 4140
ggggtggtgt tgtaaatcac ccagtcatag caggggcgca gggcatggtg ttgcacaata 4200
tctttgagga ggagactgat ggccacgggc agccctttgg tgtaggtgtt tacaaatctg 4260
ttgagctggg agggatgcat gcggggggag atgaggtgca tcttggcctg gatcttgaga 4320
ttggcgatgt taccgcccag atcccgcctg gggttcatgt tgtgcaggac caccagcacg 4380
gtgtatccgg tgcacttggg gaatttatca tgcaacttgg aagggaaggc gtgaaagaat 4440
ttggcgacgc ctttgtgccc gcccaggttt tccatgcact catccatgat gatggcgatg 4500
ggcccgtggg cggcggcctg ggcaaagacg tttcgggggt cggacacatc atagttgtgg 4560
tcctgggtga ggtcatcata ggccatttta atgaatttgg ggcggagggt gccggactgg 4620
gggacaaagg taccctcgat cccgggggcg tagttcccct cacagatctg catctcccag 4680
gctttgagct cggagggggg gatcatgtcc acctgcgggg cgataaagaa cacggtttcc 4740
ggggcggggg agatgagctg ggccgaaagc aagttccgga gcagctggga cttgccgcag 4800
ccggtggggc cgtagatgac cccgatgacc ggctgcaggt ggtagttgag ggagagacag 4860
ctgccgtcct cccggaggag gggggccacc tcgttcatca tctcgcgcac gtgcatgttc 4920
tcgcgcacca gttccgccag gaggcgctct ccccccaggg ataggagctc ctggagcgag 4980
gcgaagtttt tcagcggctt gagtccgtcg gccatgggca ttttggagag ggtttgttgc 5040
aagagttcca ggcggtccca gagctcggtg atgtgctcta cggcatctcg atccagcaga 5100
cctcctcgtt tcgcgggttg ggacggctgc gggagtaggg caccagacga tgggcgtcca 5160
gcgcagccag ggtccggtcc ttccagggtc gcagcgtccg cgtcagggtg gtctccgtca 5220
cggtgaaggg gtgcgcgccg ggctgggcgc ttgcgagggt gcgcttcagg ctcatccggc 5280
tggtcgaaaa ccgctcccga tcggcgccct gcgcgtcggc caggtagcaa ttgaccatga 5340
gttcgtagtt gagcgcctcg gccgcgtggc ctttggcgcg gagcttacct ttggaagtct 5400
gcccgcaggc gggacagagg agggacttga gggcgtagag cttgggggcg aggaagacgg 5460
actcgggggc gtaggcgtcc gcgccgcagt gggcgcagac ggtctcgcac tccacgagcc 5520
aggtgaggtc gggctggtcg gggtcaaaaa ccagtttccc gccgttcttt ttgatgcgtt 5580
tcttaccttt ggtctccatg agctcgtgtc cccgctgggt gacaaagagg ctgtccgtgt 5640
ccccgtagac cgactttatg ggccggtcct cgagcggtgt gccgcggtcc tcctcgtaga 5700
ggaaccccgc ccactccgag acgaaagccc gggtccaggc cagcacgaag gaggccacgt 5760
gggacgggta gcggtcgttg tccaccagcg ggtccacctt ttccagggta tgcaaacaca 5820
tgtccccctc gtccacatcc aggaaggtga ttggcttgta agtgtaggcc acgtgaccgg 5880
gggtcccggc cgggggggta taaaagggtg cgggtccctg ctcgtcctca ctgtcttccg 5940
gatcgctgtc caggagcgcc agctgttggg gtaggtattc cctctcgaag gcgggcatga 6000
cctcggcact caggttgtca gtttctagaa acgaggagga tttgatattg acggtgccgg 6060
cggagatgcc tttcaagagc ccctcgtcca tctggtcaga aaagacgatc tttttgttgt 6120
cgagcttggt ggcgaaggag ccgtagaggg cgttggagag gagcttggcg atggagcgca 6180
tggtctggtt tttttccttg tcggcgcgct ccttggcggc gatgttgagc tgcacgtact 6240
cgcgcgccac gcacttccat tcggggaaga cggtggtcag ctcgtcgggc acgattctga 6300
cctgccagcc ccgattatgc agggtgatga ggtccacact ggtggccacc tcgccgcgca 6360
ggggctcatt agtccagcag aggcgtccgc ccttgcgcga gcagaagggg ggcagggggt 6420
ccagcatgac ctcgtcgggg gggtcggcat cgatggtgaa gatgccgggc aggaggtcgg 6480
ggtcaaagta gctgatggaa gtggccagat cgtccagggc agcttgccat tcgcgcacgg 6540
ccagcgcgcg ctcgtaggga ctgaggggcg tgccccaggg catgggatgg gtaagcgcgg 6600
aggcgtacat gccgcagatg tcgtagacgt agaggggctc ctcgaggatg ccgatgtagg 6660
tggggtagca gcgccccccg cggatgctgg cgcgcacgta gtcatacagc tcgtgcgagg 6720
gggcgaggag ccccgggccc aggttggtgc gactgggctt ttcggcgcgg tagacgatct 6780
ggcggaaaat ggcatgcgag ttggaggaga tggtgggcct ttggaagatg ttgaagtggg 6840
cgtggggcag tccgaccgag tcgcggatga agtgggcgta ggagtcttgc agcttggcga 6900
cgagctcggc ggtgactagg acgtccagag cgcagtagtc gagggtctcc tggatgatgt 6960
catacttgag ctgtcccttt tgtttccaca gctcgcggtt gagaaggaac tcttcgcggt 7020
ccttccagta ctcttcgagg gggaacccgt cctgatctgc acggtaagag cctagcatgt 7080
agaactggtt gacggccttg taggcgcagc agcccttctc cacggggagg gcgtaggcct 7140
gggcggcctt gcgcagggag gtgtgcgtga gggcgaaagt gtccctgacc atgaccttga 7200
ggaactggtg cttgaagtcg atatcgtcgc agcccccctg ctcccagagc tggaagtccg 7260
tgcgcttctt gtaggcgggg ttgggcaaag cgaaagtaac atcgttgaag aggatcttgc 7320
ccgcgcgggg cataaagttg cgagtgatgc ggaaaggttg gggcacctcg gcccggttgt 7380
tgatgacctg ggcggcgagc acgatctcgt cgaagccgtt gatgttgtgg cccacgatgt 7440
agagttccac gaatcgcgga cggcccttga cgtggggcag tttcttgagc tcctcgtagg 7500
tgagctcgtc ggggtcgctg agcccgtgct gctcgagcgc ccagtcggcg agatgggggt 7560
tggcgcggag gaaggaagtc cagagatcca cggccagggc ggtttgcaga cggtcccggt 7620
actgacggaa ctgctgcccg acggccattt tttcgggggt gacgcagtag aaggtgcggg 7680
ggtccccgtg ccagcgatcc catttgagct ggagggcgag atcgagggcg agctcgacga 7740
gccggtcgtc cccggagagt ttcatgacca gcatgaaggg gacgagctgc ttgccgaagg 7800
accccatcca ggtgtaggtt tccacatcgt aggtgaggaa gagcctttcg gtgcgaggat 7860
gcgagccgat ggggaagaac tggatctcct gccaccaatt ggaggaatgg ctgttgatgt 7920
gatggaagta gaaatgccga cggcgcgccg aacactcgtg cttgtgttta tacaagcggc 7980
cacagtgctc gcaacgctgc acgggatgca cgtgctgcac gagctgtacc tgagttcctt 8040
tgacgaggaa tttcagtggg aagtggagtc gtggcgcctg catctcgtgc tgtactacgt 8100
cgtggtggtc ggcctggccc tcttctgcct cgatggtggt catgctgacg agcccgcgcg 8160
ggaggcaggt ccagacctcg gcgcgagcgg gtcggagagc gaggacgagg gcgcgcaggc 8220
cggagctgtc cagggtcctg agacgctgcg gagtcaggtc agtgggcagc ggcggcgcgc 8280
ggttgacttg caggagtttt tccagggcgc gcgggaggtc cagatggtac ttgatctcca 8340
ccgcgccatt ggtggcgacg tcgatggctt gcagggtccc gtgcccctgg ggtgtgacca 8400
ccgtcccccg tttcttcttg ggcggctggg gcgacggggg cggtgcctct tccatggtta 8460
gaagcggcgg cgaggacgcg cgccgggcgg caggggcggc tcggggcccg gaggcagggg 8520
cggcaggggc acgtcggcgc cgcgcgcggg taggttctgg tactgcgccc ggagaagact 8580
ggcgtgagcg acgacgcgac ggttgacgtc ctggatctga cgcctctggg tgaaggccac 8640
gggacccgtg agtttgaacc tgaaagagag ttcgacagaa tcaatctcgg tatcgttgac 8700
ggcggcctgc cgcaggatct cttgcacgtc gcccgagttg tcctggtagg cgatctcggt 8760
catgaactgc tcgatctcct cctcttgaag gtctccgcgg ccggcgcgct ccacggtggc 8820
cgcgaggtcg ttggagatgc ggcccatgag ctgcgagaag gcgttcatgc ccgcctcgtt 8880
ccagacgcgg ctgtagacca cgacgccctc gggatcgcgg gcgcgcatga ccacctgggc 8940
gaggttgagc tccacgtggc gcgtgaagac cgcgtagttg cagaggcgct ggtagaggta 9000
gttgagcgtg gtggcgatgt gctcggtgac gaagaaatac atgatccagc ggcggagcgg 9060
catctcgctg acgtcgccca gcgcctccaa acgttccatg gcctcgtaaa agtccacggc 9120
gaagttgaaa aactgggagt tgcgcgccga gacggtcaac tcctcctcca gaagacggat 9180
gagctcggcg atggtggcgc gcacctcgcg ctcgaaggcc cccgggagtt cctccacttc 9240
ctcttcttcc tcctccacta acatctcttc tacttcctcc tcaggcggca gtggtggcgg 9300
gggagggggc ctgcgtcgcc ggcggcgcac gggcagacgg tcgatgaagc gctcgatggt 9360
ctcgccgcgc cggcgtcgca tggtctcggt gacggcgcgc ccgtcctcgc ggggccgcag 9420
cgtgaagacg ccgccgcgca tctccaggtg gccggggggg tccccgttgg gcagggagag 9480
ggcgctgacg atgcatctta tcaattgccc cgtagggact ccgcgcaagg acctgagcgt 9540
ctcgagatcc acgggatctg aaaaccgctg aacgaaggct tcgagccagt cgcagtcgca 9600
aggtaggctg agcacggttt cttctggcgg gtcatgttgg ttgggagcgg ggcgggcgat 9660
gctgctggtg atgaagttga aataggcggt tctgagacgg cggatggtgg cgaggagcac 9720
caggtctttg ggcccggctt gctggatgcg cagacggtcg gccatgcccc aggcgtggtc 9780
ctgacacctg gccaggtcct tgtagtagtc ctgcatgagc cgctccacgg gcacctcctc 9840
ctcgcccgcg cggccgtgca tgcgcgtgag cccgaagccg cgctggggct ggacgagcgc 9900
caggtcggcg acgacgcgct cggcgaggat ggcttgctgg atctgggtga gggtggtctg 9960
gaagtcatca aagtcgacga agcggtggta ggctccggtg ttgatggtgt aggagcagtt 10020
ggccatgacg gaccagttga cggtctggtg gcccggacgc acgagctcgt ggtacttgag 10080
gcgcgagtag gcgcgcgtgt cgaagatgta gtcgttgcag gtgcgcacca ggtactggta 10140
gccgatgagg aagtgcggcg gcggctggcg gtagagcggc catcgctcgg tggcgggggc 10200
gccgggcgcg aggtcctcga gcatggtgcg gtggtagccg tagatgtacc tggacatcca 10260
ggtgatgccg gcggcggtgg tggaggcgcg cgggaactcg cggacgcggt tccagatgtt 10320
gcgcagcggc aggaagtagt tcatggtggg cacggtctgg cccgtgaggc gcgcgcagtc 10380
gtggatgctc tatacgggca aaaacgaaag cggtcagcgg ctcgactccg tggcctggag 10440
gctaagcgaa cgggttgggc tgcgcgtgta ccccggttcg aatctcgaat caggctggag 10500
ccgcagctaa cgtggtattg gcactcccgt ctcgacccaa gcctgcacca accctccagg 10560
atacggaggc gggtcgtttt gcaacttttt tttggaggcc ggatgagact agtaagcgcg 10620
gaaagcggcc gaccgcgatg gctcgctgcc gtagtctgga gaagaatcgc cagggttgcg 10680
ttgcggtgtg ccccggttcg aggccggccg gattccgcgg ctaacgaggg cgtggctgcc 10740
ccgtcgtttc caagacccca tagccagccg acttctccag ttacggagcg agcccctctt 10800
ttgttttgtt tgtttttgcc agatgcatcc cgtactgcgg cagatgcgcc cccaccaccc 10860
tccaccgcaa caacagcccc ctccacagcc ggcgcttctg cccccgcccc agcagcaact 10920
tccagccacg accgccgcgg ccgccgtgag cggggctgga cagagttatg atcaccagct 10980
ggccttggaa gagggcgagg ggctggcgcg cctgggggcg tcgtcgccgg agcggcaccc 11040
gcgcgtgcag atgaaaaggg acgctcgcga ggcctacgtg cccaagcaga acctgttcag 11100
agacaggagc ggcgaggagc ccgaggagat gcgcgcggcc cggttccacg cggggcggga 11160
gctgcggcgc ggcctggacc gaaagagggt gctgagggac gaggatttcg aggcggacga 11220
gctgacgggg atcagccccg cgcgcgcgca cgtggccgcg gccaacctgg tcacggcgta 11280
cgagcagacc gtgaaggagg agagcaactt ccaaaaatcc ttcaacaacc acgtgcgcac 11340
cctgatcgcg cgcgaggagg tgaccctggg cctgatgcac ctgtgggacc tgctggaggc 11400
catcgtgcag aaccccacca gcaagccgct gacggcgcag ctgttcctgg tggtgcagca 11460
tagtcgggac aacgaagcgt tcagggaggc gctgctgaat atcaccgagc ccgagggccg 11520
ctggctcctg gacctggtga acattctgca gagcatcgtg gtgcaggagc gcgggctgcc 11580
gctgtccgag aagctggcgg ccatcaactt ctcggtgctg agtttgggca agtactacgc 11640
taggaagatc tacaagaccc cgtacgtgcc catagacaag gaggtgaaga tcgacgggtt 11700
ttacatgcgc atgaccctga aagtgctgac cctgagcgac gatctggggg tgtaccgcaa 11760
cgacaggatg caccgtgcgg tgagcgccag caggcggcgc gagctgagcg accaggagct 11820
gatgcatagt ctgcagcggg ccctgaccgg ggccgggacc gagggggaga gctactttga 11880
catgggcgcg gacctgcact ggcagcccag ccgccgggcc ttggaggcgg cggcaggacc 11940
ctacgtagaa gaggtggacg atgaggtgga cgaggagggc gagtacctgg aagactgatg 12000
gcgcgaccgt atttttgcta gatgcaacaa caacagccac ctcctgatcc cgcgatgcgg 12060
gcggcgctgc agagccagcc gtccggcatt aactcctcgg acgattggac ccaggccatg 12120
caacgcatca tggcgctgac gacccgcaac cccgaagcct ttagacagca gccccaggcc 12180
aaccggctct cggccatcct ggaggccgtg gtgccctcgc gctccaaccc cacgcacgag 12240
aaggtcctgg ccatcgtgaa cgcgctggtg gagaacaagg ccatccgcgg cgacgaggcc 12300
ggcctggtgt acaacgcgct gctggagcgc gtggcccgct acaacagcac caacgtgcag 12360
accaacctgg accgcatggt gaccgacgtg cgcgaggccg tggcccagcg cgagcggttc 12420
caccgcgagt ccaacctggg atccatggtg gcgctgaacg ccttcctcag cacccagccc 12480
gccaacgtgc cccggggcca ggaggactac accaacttca tcagcgccct gcgcctgatg 12540
gtgaccgagg tgccccagag cgaggtgtac cagtccgggc cggactactt cttccagacc 12600
agtcgccagg gcttgcagac cgtgaacctg agccaggctt tcaagaactt gcagggcctg 12660
tggggcgtgc aggccccggt cggggaccgc gcgacggtgt cgagcctgct gacgccgaac 12720
tcgcgcctgc tgctgctgct ggtggccccc ttcacggaca gcggcagcat caaccgcaac 12780
tcgtacctgg gctacctgat taacctgtac cgcgaggcca tcggccaggc gcacgtggac 12840
gagcagacct accaggagat cacccacgtg agccgcgccc tgggccagga cgacccgggc 12900
aacctggaag ccaccctgaa ctttttgctg accaaccggt cgcagaagat cccgccccag 12960
tacgcgctca gcaccgagga ggagcgcatc ctgcgttacg tgcagcagag cgtgggcctg 13020
ttcctgatgc aggagggggc cacccccagc gccgcgctcg acatgaccgc gcgcaacatg 13080
gagcccagca tgtacgccag caaccgcccg ttcatcaata aactgatgga ctacttgcat 13140
cgggcggccg ccatgaactc tgactatttc accaacgcca tcctgaatcc ccactggctc 13200
ccgccgccgg ggttctacac gggcgagtac gacatgcccg accccaatga cgggttcctg 13260
tgggacgatg tggacagcag cgtgttctcc ccccgaccgg gtgctaacga gcgccccttg 13320
tggaagaagg aaggcagcga ccgacgcccg tcctcggcgc tgtccggccg cgagggtgct 13380
gccgcggcgg tgcccgaggc cgccagtcct ttcccgagct tgcccttctc gctgaacagt 13440
atccgcagca gcgagctggg caggatcacg cgcccgcgct tgctgggcga agaggagtac 13500
ttgaatgact cgctgttgag acccgagcgg gagaagaact tccccaataa cgggatagaa 13560
agcctggtgg acaagatgag ccgctggaag acgtatgcgc aggagcacag ggacgatccc 13620
cgggcgtcgc agggggccac gagccggggc agcgccgccc gtaaacgccg gtggcacgac 13680
aggcagcggg gacagatgtg ggacgatgag gactccgccg acgacagcag cgtgttggac 13740
ttgggtggga gtggtaaccc gttcgctcac ctgcgccccc gtatcgggcg catgatgtaa 13800
gagaaaccga aaataaatga tactcaccaa ggccatggcg accagcgtgc gttcgtttct 13860
tctctgttgt tgttgtatct agtatgatga ggcgtgcgta cccggagggt cctcctccct 13920
cgtacgagag cgtgatgcag caggcgatgg cggcggcggc gatgcagccc ccgctggagg 13980
ctccttacgt gcccccgcgg tacctggcgc ctacggaggg gcggaacagc attcgttact 14040
cggagctggc acccttgtac gataccaccc ggttgtacct ggtggacaac aagtcggcgg 14100
acatcgcctc gctgaactac cagaacgacc acagcaactt cctgaccacc gtggtgcaga 14160
acaatgactt cacccccacg gaggccagca cccagaccat caactttgac gagcgctcgc 14220
ggtggggcgg ccagctgaaa accatcatgc acaccaacat gcccaacgtg aacgagttca 14280
tgtacagcaa caagttcaag gcgcgggtga tggtctcccg caagaccccc aatggggtga 14340
cagtgacaga ggattatgat ggtagtcagg atgagctgaa gtatgaatgg gtggaatttg 14400
agctgcccga aggcaacttc tcggtgacca tgaccatcga cctgatgaac aacgccatca 14460
tcgacaatta cttggcggtg gggcggcaga acggggtgct ggagagcgac atcggcgtga 14520
agttcgacac taggaacttc aggctgggct gggaccccgt gaccgagctg gtcatgcccg 14580
gggtgtacac caacgaggct ttccatcccg atattgtctt gctgcccggc tgcggggtgg 14640
acttcaccga gagccgcctc agcaacctgc tgggcattcg caagaggcag cccttccagg 14700
aaggcttcca gatcatgtac gaggatctgg aggggggcaa catccccgcg ctcctggatg 14760
tcgacgccta tgagaaaagc aaggaggatg cagcagctga agcaactgca gccgtagcta 14820
ccgcctctac cgaggtcagg ggcgataatt ttgcaagcgc cgcagcagtg gcagcggccg 14880
aggcggctga aaccgaaagt aagatagtca ttcagccggt ggagaaggat agcaagaaca 14940
ggagctacaa cgtactaccg gacaagataa acaccgccta ccgcagctgg tacctagcct 15000
acaactatgg cgaccccgag aagggcgtgc gctcctggac gctgctcacc acctcggacg 15060
tcacctgcgg cgtggagcaa gtctactggt cgctgcccga catgatgcaa gacccggtca 15120
ccttccgctc cacgcgtcaa gttagcaact acccggtggt gggcgccgag ctcctgcccg 15180
tctactccaa gagcttcttc aacgagcagg ccgtctactc gcagcagctg cgcgccttca 15240
cctcgcttac gcacgtcttc aaccgcttcc ccgagaacca gatcctcgtc cgcccgcccg 15300
cgcccaccat taccaccgtc agtgaaaacg ttcctgctct cacagatcac gggaccctgc 15360
cgctgcgcag cagtatccgg ggagtccagc gcgtgaccgt tactgacgcc agacgccgca 15420
cctgccccta cgtctacaag gccctgggca tagtcgcgcc gcgcgtcctc tcgagccgca 15480
ccttctaaat gtccattctc atctcgccca gtaataacac cggttggggc ctgcgcgcgc 15540
ccagcaagat gtacggaggc gctcgccaac gctccacgca acaccccgtg cgcgtgcgcg 15600
ggcacttccg cgctccctgg ggcgccctca agggccgcgt gcggtcgcgc accaccgtcg 15660
acgacgtgat cgaccaggtg gtggccgacg cgcgcaacta cacccccgcc gccgcgcccg 15720
tctccaccgt ggacgccgtc atcgacagcg tggtggccga cgcgcgccgg tacgcccgcg 15780
ccaagagccg gcggcggcgc atcgcccggc ggcaccggag cacccccgcc atgcgcgcgg 15840
cgcgagcctt gctgcgcagg gccaggcgca cgggacgcag ggccatgctc agggcggcca 15900
gacgcgcggc ttcaggcgcc agcgccggca ggacccggag acgcgcggcc acggcggcgg 15960
cagcggccat cgccagcatg tcccgcccgc ggcgagggaa cgtgtactgg gtgcgcgacg 16020
ccgccaccgg tgtgcgcgtg cccgtgcgca cccgcccccc tcgcacttga agatgttcac 16080
ttcgcgatgt tgatgtgtcc cagcggcgag gaggatgtcc aagcgcaaat tcaaggaaga 16140
gatgctccag gtcatcgcgc ctgagatcta cggccctgcg gtggtgaagg aggaaagaaa 16200
gccccgcaaa atcaagcggg tcaaaaagga caaaaaggaa gaagaaagtg atgtggacgg 16260
attggtggag tttgtgcgcg agttcgcccc ccggcggcgc gtgcagtggc gcgggcggaa 16320
ggtgcaaccg gtgctgagac ccggcaccac cgtggtcttc acgcccggcg agcgctccgg 16380
caccgcttcc aagcgctcct acgacgaggt gtacggggat gatgatattc tggagcaggc 16440
ggccgagcgc ctgggcgagt ttgcttacgg caagcgcagc cgttccgcac cgaaggaaga 16500
ggcggtgtcc atcccgctgg accacggcaa ccccacgccg agcctcaagc ccgtgacctt 16560
gcagcaggtg ctgccgaccg cggcgccgcg ccgggggttc aagcgcgagg gcgaggatct 16620
gtaccccacc atgcagctga tggtgcccaa gcgccagaag ctggaagacg tgctggagac 16680
catgaaggtg gacccggacg tgcagcccga ggtcaaggtg cggcccatca agcaggtggc 16740
cccgggcctg ggcgtgcaga ccgtggacat caagattccc acggagccca tggaaacgca 16800
gaccgagccc atgatcaagc ccagcaccag caccatggag gtgcagacgg atccctggat 16860
gccatcggct cctagtcgaa gaccccggcg caagtacggc gcggccagcc tgctgatgcc 16920
caactacgcg ctgcatcctt ccatcatccc cacgccgggc taccgcggca cgcgcttcta 16980
ccgcggtcat accagcagcc gccgccgcaa gaccaccact cgccgccgcc gtcgccgcac 17040
cgccgctgca accacccctg ccgccctggt gcggagagtg taccgccgcg gccgcgcacc 17100
tctgaccctg ccgcgcgcgc gctaccaccc gagcatcgcc atttaaactt tcgcctgctt 17160
tgcagatcaa tggccctcac atgccgcctt cgcgttccca ttacgggcta ccgaggaaga 17220
aaaccgcgcc gtagaaggct ggcggggaac gggatgcgtc gccaccacca ccggcggcgg 17280
cgcgccatca gcaagcggtt ggggggaggc ttcctgcccg cgctgatccc catcatcgcc 17340
gcggcgatcg gggcgatccc cggcattgct tccgtggcgg tgcaggcctc tcagcgccac 17400
tgagacacac ttggaaacat cttgtaataa accaatggac tctgacgctc ctggtcctgt 17460
gatgtgtttt cgtagacaga tggaagacat caatttttcg tccctggctc cgcgacacgg 17520
cacgcggccg ttcatgggca cctggagcga catcggcacc agccaactga acgggggcgc 17580
cttcaattgg agcagtctct ggagcgggct taagaatttc gggtccacgc ttaaaaccta 17640
tggcagcaag gcgtggaaca gcaccacagg gcaggcgctg agggataagc tgaaagagca 17700
gaacttccag cagaaggtgg tcgatgggct cgcctcgggc atcaacgggg tggtggacct 17760
ggccaaccag gccgtgcagc ggcagatcaa cagccgcctg gacccggtgc cgcccgccgg 17820
ctccgtggag atgccgcagg tggaggagga gctgcctccc ctggacaagc ggggcgagaa 17880
gcgaccccgc cccgatgcgg aggagacgct gctgacgcac acggacgagc cgcccccgta 17940
cgaggaggcg gtgaaactgg gtctgcccac cacgcggccc atcgcgcccc tggccaccgg 18000
ggtgctgaaa cccgaaaagc ccgcgaccct ggacttgcct cctccccagc cttcccgccc 18060
ctctacagtg gctaagcccc tgccgccggt ggccgtggcc cgcgcgcgac ccgggggcac 18120
cgcccgccct catgcgaact ggcagagcac tctgaacagc atcgtgggtc tgggagtgca 18180
gagtgtgaag cgccgccgct gctattaaac ctaccgtagc gcttaacttg cttgtctgtg 18240
tgtgtatgta ttatgtcgcc gccgccgctg tccaccagaa ggaggagtga agaggcgcgt 18300
cgccgagttg caagatggcc accccatcga tgctgcccca gtgggcgtac atgcacatcg 18360
ccggacagga cgcttcggag tacctgagtc cgggtctggt gcagtttgcc cgcgccacag 18420
acacctactt cagtctgggg aacaagttta ggaaccccac ggtggcgccc acgcacgatg 18480
tgaccaccga ccgcagccag cggctgacgc tgcgcttcgt gcccgtggac cgcgaggaca 18540
acacctactc gtacaaagtg cgctacacgc tggccgtggg cgacaaccgc gtgctggaca 18600
tggccagcac ctactttgac atccgcggcg tgctggatcg gggccctagc ttcaaaccct 18660
actccggcac cgcctacaac agtctggccc ccaagggagc acccaacact tgtcagtgga 18720
catataaagc cgatggtgaa actgccacag aaaaaaccta tacatatgga aatgcacccg 18780
tgcagggcat taacatcaca aaagatggta ttcaacttgg aactgacacc gatgatcagc 18840
caatctacgc agataaaacc tatcagcctg aacctcaagt gggtgatgct gaatggcatg 18900
acatcactgg tactgatgaa aagtatggag gcagagctct taagcctgat accaaaatga 18960
agccttgtta tggttctttt gccaagccta ctaataaaga aggaggtcag gcaaatgtga 19020
aaacaggaac aggcactact aaagaatatg acatagacat ggctttcttt gacaacagaa 19080
gtgcggctgc tgctggccta gctccagaaa ttgttttgta tactgaaaat gtggatttgg 19140
aaactccaga tacccatatt gtatacaaag caggcacaga tgacagcagc tcttctatta 19200
atttgggtca gcaagccatg cccaacagac ctaactacat tggtttcaga gacaacttta 19260
tcgggctcat gtactacaac agcactggca atatgggggt gctggccggt caggcttctc 19320
agctgaatgc tgtggttgac ttgcaagaca gaaacaccga gctgtcctac cagctcttgc 19380
ttgactctct gggtgacaga acccggtatt tcagtatgtg gaatcaggcg gtggacagct 19440
atgatcctga tgtgcgcatt attgaaaatc atggtgtgga ggatgaactt cccaactatt 19500
gtttccctct ggatgctgtt ggcagaacag atacttatca gggaattaag gctaatggaa 19560
ctgatcaaac cacatggacc aaagatgaca gtgtcaatga tgctaatgag ataggcaagg 19620
gtaatccatt cgccatggaa atcaacatcc aagccaacct gtggaggaac ttcctctacg 19680
ccaacgtggc cctgtacctg cccgactctt acaagtacac gccggccaat gttaccctgc 19740
ccaccaacac caacacctac gattacatga acggccgggt ggtggcgccc tcgctggtgg 19800
actcctacat caacatcggg gcgcgctggt cgctggatcc catggacaac gtgaacccct 19860
tcaaccacca ccgcaatgcg gggctgcgct accgctccat gctcctgggc aacgggcgct 19920
acgtgccctt ccacatccag gtgccccaga aatttttcgc catcaagagc ctcctgctcc 19980
tgcccgggtc ctacacctac gagtggaact tccgcaagga cgtcaacatg atcctgcaga 20040
gctccctcgg caacgacctg cgcacggacg gggcctccat ctccttcacc agcatcaacc 20100
tctacgccac cttcttcccc atggcgcaca acacggcctc cacgctcgag gccatgctgc 20160
gcaacgacac caacgaccag tccttcaacg actacctctc ggcggccaac atgctctacc 20220
ccatcccggc caacgccacc aacgtgccca tctccatccc ctcgcgcaac tgggccgcct 20280
tccgcggctg gtccttcacg cgtctcaaga ccaaggagac gccctcgctg ggctccgggt 20340
tcgaccccta cttcgtctac tcgggctcca tcccctacct cgacggcacc ttctacctca 20400
accacacctt caagaaggtc tccatcacct tcgactcctc cgtcagctgg cccggcaacg 20460
accggctcct gacgcccaac gagttcgaaa tcaagcgcac cgtcgacggc gagggctaca 20520
acgtggccca gtgcaacatg accaaggact ggttcctggt ccagatgctg gcccactaca 20580
acatcggcta ccagggcttc tacgtgcccg agggctacaa ggaccgcatg tactccttct 20640
tccgcaactt ccagcccatg agccgccagg tggtggacga ggtcaactac aaggactacc 20700
aggccgtcac cctggcctac cagcacaaca actcgggctt cgtcggctac ctcgcgccca 20760
ccatgcgcca gggccagccc taccccgcca actaccccta cccgctcatc ggcaagagcg 20820
ccgtcaccag cgtcacccag aaaaagttcc tctgcgacag ggtcatgtgg cgcatcccct 20880
tctccagcaa cttcatgtcc atgggcgcgc tcaccgacct cggccagaac atgctctatg 20940
ccaactccgc ccacgcgcta gacatgaatt tcgaagtcga ccccatggat gagtccaccc 21000
ttctctatgt tgtcttcgaa gtcttcgacg tcgtccgagt gcaccagccc caccgcggcg 21060
tcatcgaggc cgtctacctg cgcaccccct tctcggccgg taacgccacc acctaagctc 21120
ttgcttcttg caagccatgg ccgcgggctc cggcgagcag gagctcaggg ccatcatccg 21180
cgacctgggc tgcgggccct acttcctggg caccttcgat aagcgcttcc cgggattcat 21240
ggccccgcac aagctggcct gcgccatcgt caacacggcc ggccgcgaga ccgggggcga 21300
gcactggctg gccttcgcct ggaacccgcg ctcgaacacc tgctacctct tcgacccctt 21360
cgggttctcg gacgagcgcc tcaagcagat ctaccagttc gagtacgagg gcctgctgcg 21420
ccgcagcgcc ctggccaccg aggaccgctg cgtcaccctg gaaaagtcca cccagaccgt 21480
gcagggtccg cgctcggccg cctgcgggct cttctgctgc atgttcctgc acgccttcgt 21540
gcactggccc gaccgcccca tggacaagaa ccccaccatg aacttgctga cgggggtgcc 21600
caacggcatg ctccagtcgc cccaggtgga acccaccctg cgccgcaacc aggaggcgct 21660
ctaccgcttc ctcaactccc actccgccta ctttcgctcc caccgcgcgc gcatcgagaa 21720
ggccaccgcc ttcgaccgca tgaatcaaga catgtaaacc gtgtgtgtat gttaaatgtc 21780
tttaataaac agcactttca tgttacacat gcatctgaga tgatttattt agaaatcgaa 21840
agggttctgc cgggtctcgg catggcccgc gggcagggac acgttgcgga actggtactt 21900
ggccagccac ttgaactcgg ggatcagcag tttgggcagc ggggtgtcgg ggaaggagtc 21960
ggtccacagc ttccgcgtca gttgcagggc gcccagcagg tcgggcgcgg agatcttgaa 22020
atcgcagttg ggacccgcgt tctgcgcgcg ggagttgcgg tacacggggt tgcagcactg 22080
gaacaccatc agggccgggt gcttcacgct cgccagcacc gtcgcgtcgg tgatgctctc 22140
cacgtcgagg tcctcggcgt tggccatccc gaagggggtc atcttgcagg tctgccttcc 22200
catggtgggc acgcacccgg gcttgtggtt gcaatcgcag tgcaggggga tcagcatcat 22260
ctgggcctgg tcggcgttca tccccgggta catggccttc atgaaagcct ccaattgcct 22320
gaacgcctgc tgggccttgg ctccctcggt gaagaagacc ccgcaggact tgctagagaa 22380
ctggttggtg gcgcacccgg cgtcgtgcac gcagcagcgc gcgtcgttgt tggccagctg 22440
caccacgctg cgcccccagc ggttctgggt gatcttggcc cggtcggggt tctccttcag 22500
cgcgcgctgc ccgttctcgc tcgccacatc catctcgatc atgtgctcct tctggatcat 22560
ggtggtcccg tgcaggcacc gcagcttgcc ctcggcctcg gtgcacccgt gcagccacag 22620
cgcgcacccg gtgcactccc agttcttgtg ggcgatctgg gaatgcgcgt gcacgaagcc 22680
ctgcaggaag cggcccatca tggtggtcag ggtcttgttg ctagtgaagg tcagcggaat 22740
gccgcggtgc tcctcgttga tgtacaggtg gcagatgcgg cggtacacct cgccctgctc 22800
gggcatcagc tggaagttgg ctttcaggtc ggtctccacg cggtagcggt ccatcagcat 22860
agtcatgatt tccataccct tctcccaggc cgagacgatg ggcaggctca tagggttctt 22920
caccatcatc ttagcgctag cagccgcggc cagggggtcg ctctcgtcca gggtctcaaa 22980
gctccgcttg ccgtccttct cggtgatccg caccgggggg tagctgaagc ccacggccgc 23040
cagctcctcc tcggcctgtc tttcgtcctc gctgtcctgg ctgacgtcct gcaggaccac 23100
atgcttggtc ttgcggggtt tcttcttggg cggcagcggc ggcggagatg ttggagatgg 23160
cgagggggag cgcgagttct cgctcaccac tactatctct tcctcttctt ggtccgaggc 23220
cacgcggcgg taggtatgtc tcttcggggg cagaggcgga ggcgacgggc tctcgccgcc 23280
gcgacttggc ggatggctgg cagagcccct tccgcgttcg ggggtgcgct cccggcggcg 23340
ctctgactga cttcctccgc ggccggccat tgtgttctcc tagggaggaa caacaagcat 23400
ggagactcag ccatcgccaa cctcgccatc tgcccccacc gccgacgaga agcagcagca 23460
gcagaatgaa agcttaaccg ccccgccgcc cagccccgcc acctccgacg cggccgtccc 23520
agacatgcaa gagatggagg aatccatcga gattgacctg ggctatgtga cgcccgcgga 23580
gcacgaggag gagctggcag tgcgcttttc acaagaagag atacaccaag aacagccaga 23640
gcaggaagca gagaatgagc agagtcaggc tgggctcgag catgacggcg actacctcca 23700
cctgagcggg ggggaggacg cgctcatcaa gcatctggcc cggcaggcca ccatcgtcaa 23760
ggatgcgctg ctcgaccgca ccgaggtgcc cctcagcgtg gaggagctca gccgcgccta 23820
cgagttgaac ctcttctcgc cgcgcgtgcc ccccaagcgc cagcccaatg gcacctgcga 23880
gcccaacccg cgcctcaact tctacccggt cttcgcggtg cccgaggccc tggccaccta 23940
ccacatcttt ttcaagaacc aaaagatccc cgtctcctgc cgcgccaacc gcacccgcgc 24000
cgacgccctt ttcaacctgg gtcccggcgc ccgcctacct gatatcgcct ccttggaaga 24060
ggttcccaag atcttcgagg gtctgggcag cgacgagact cgggccgcga acgctctgca 24120
aggagaagga ggagagcatg agcaccacag cgccctggtc gagttggaag gcgacaacgc 24180
gcggctggcg gtgctcaaac gcacggtcga gctgacccat ttcgcctacc cggctctgaa 24240
cctgcccccc aaagtcatga gcgcggtcat ggaccaggtg ctcatcaagc gcgcgtcgcc 24300
catctccgag gacgagggca tgcaagactc cgaggagggc aagcccgtgg tcagcgacga 24360
gcagctggcc cggtggctgg gtcctaatgc tagtccccag agtttggaag agcggcgcaa 24420
actcatgatg gccgtggtcc tggtgaccgt ggagctggag tgcctgcgcc gcttcttcgc 24480
cgacgcggag accctgcgca aggtcgagga gaacctgcac tacctcttca ggcacgggtt 24540
cgtgcgccag gcctgcaaga tctccaacgt ggagctgacc aacctggtct cctacatggg 24600
catcttgcac gagaaccgcc tggggcagaa cgtgctgcac accaccctgc gcggggaggc 24660
ccggcgcgac tacatccgcg actgcgtcta cctctacctc tgccacacct ggcagacggg 24720
catgggcgtg tggcagcagt gtctggagga gcagaacctg aaagagctct gcaagctcct 24780
gcagaagaac ctcaagggtc tgtggaccgg gttcgacgag cgcaccaccg cctcggacct 24840
ggccgacctc attttccccg agcgcctcag gctgacgctg cgcaacggcc tgcccgactt 24900
tatgagccaa agcatgttgc aaaactttcg ctctttcatc ctcgaacgct ccggaatcct 24960
gcccgccacc tgctccgcgc tgccctcgga cttcgtgccg ctgaccttcc gcgagtgccc 25020
cccgccgctg tggagccact gctacctgct gcgcctggcc aactacctgg cctaccactc 25080
ggacgtgatc gaggacgtca gcggcgaggg cctgctcgag tgccactgcc gctgcaacct 25140
ctgcacgccg caccgctccc tggcctgcaa cccccagctg ctgagcgaga cccagatcat 25200
cggcaccttc gagttgcaag ggcccagcga aggcgagggt tcagccgcca aggggggtct 25260
gaaactcacc ccggggctgt ggacctcggc ctacttgcgc aagttcgtgc ccgaggacta 25320
ccatcccttc gagatcaggt tctacgagga ccaatcccat ccgcccaagg ccgagctgtc 25380
ggcctgcgtc atcacccagg gggcgatcct ggcccaattg caagccatcc agaaatcccg 25440
ccaagaattc ttgctgaaaa agggccgcgg ggtctacctc gacccccaga ccggtgagga 25500
gctcaacccc ggcttccccc aggatgcccc gaggaaacaa gaagctgaaa gtggagctgc 25560
cgcccgtgga ggatttggag gaagactggg agaacagcag tcaggcagag gaggaggaga 25620
tggaggaaga ctgggacagc actcaggcag aggaggacag cctgcaagac agtctggagg 25680
aagacgagga ggaggcagag gaggaggtgg aagaagcagc cgccgccaga ccgtcgtcct 25740
cggcggggga gaaagcaagc agcacggata ccatctccgc tccgggtcgg ggtcccgctc 25800
gaccacacag tagatgggac gagaccggac gattcccgaa ccccaccacc cagaccggta 25860
agaaggagcg gcagggatac aagtcctggc gggggcacaa aaacgccatc gtctcctgct 25920
tgcaggcctg cgggggcaac atctccttca cccggcgcta cctgctcttc caccgcgggg 25980
tgaactttcc ccgcaacatc ttgcattact accgtcacct ccacagcccc tactacttcc 26040
aagaagaggc agcagcagca gaaaaagacc agcagaaaac cagcagctag aaaatccaca 26100
gcggcggcag caggtggact gaggatcgcg gcgaacgagc cggcgcaaac ccgggagctg 26160
aggaaccgga tctttcccac cctctatgcc atcttccagc agagtcgggg gcaggagcag 26220
gaactgaaag tcaagaaccg ttctctgcgc tcgctcaccc gcagttgtct gtatcacaag 26280
agcgaagacc aacttcagcg cactctcgag gacgccgagg ctctcttcaa caagtactgc 26340
gcgctcactc ttaaagagta gcccgcgccc gcccagtcgc agaaaaaggc gggaattacg 26400
tcacctgtgc ccttcgccct agccgcctcc acccatcatc atgagcaaag agattcccac 26460
gccttacatg tggagctacc agccccagat gggcctggcc gccggtgccg cccaggacta 26520
ctccacccgc atgaattggc tcagcgccgg gcccgcgatg atctcacggg tgaatgacat 26580
ccgcgcccac cgaaaccaga tactcctaga acagtcagcg ctcaccgcca cgccccgcaa 26640
tcacctcaat ccgcgtaatt ggcccgccgc cctggtgtac caggaaattc cccagcccac 26700
gaccgtacta cttccgcgag acgcccaggc cgaagtccag ctgactaact caggtgtcca 26760
gctggcgggc ggcgccaccc tgtgtcgtca ccgccccgct cagggtataa agcggctggt 26820
gatccggggc agaggcacac agctcaacga cgaggtggtg agctcttcgc tgggtctgcg 26880
acctgacgga gtcttccaac tcgccggatc ggggagatct tccttcacgc ctcgtcaggc 26940
cgtcctgact ttggagagtt cgtcctcgca gccccgctcg ggtggcatcg gcactctcca 27000
gttcgtggag gagttcactc cctcggtcta cttcaacccc ttctccggct cccccggcca 27060
ctacccggac gagttcatcc cgaacttcga cgccatcagc gagtcggtgg acggctacga 27120
ttgaatgtcc catggtggcg cagctgacct agctcggctt cgacacctgg accactgccg 27180
ccgcttccgc tgcttcgctc gggatctcgc cgagtttgcc tactttgagc tgcccgagga 27240
gcaccctcag ggcccggccc acggagtgcg gatcgtcgtc gaagggggcc tcgactccca 27300
cctgcttcgg atcttcagcc agcgtccgat cctggtcgag cgcgagcaag gacagaccct 27360
tctgactctg tactgcatct gcaaccaccc cggcctgcat gaaagtcttt gttgtctgct 27420
gtgtactgag tataataaaa gctgagatca gcgactactc cggacttccg tgtgttcctg 27480
aatccatcaa ccagtctttg ttcttcaccg ggaacgagac cgagctccag ctccagtgta 27540
agccccacaa gaagtacctc acctggctgt tccagggctc cccgatcgcc gttgtcaacc 27600
actgcgacaa cgacggagtc ctgctgagcg gccctgccaa ccttactttt tccacccgca 27660
gaagcaagct ccagctcttc caacccttcc tccccgggac ctatcagtgc gtctcgggac 27720
cctgccatca caccttccac ctgatcccga ataccacagc gtcgctcccc gctactaaca 27780
accaaactaa cctccaccaa cgccaccgtc gcgacctttc tgaatctaat actaccaccc 27840
acaccggagg tgagctccga ggtcaaccaa cctctgggat ttactacggc ccctgggagg 27900
tggttgggtt aatagcgcta ggcctagttg cgggtgggct tttggttctc tgctacctat 27960
acctcccttg ctgttcgtac ttagtggtgc tgtgttgctg gtttaagaaa tggggaagat 28020
caccctagtg agctgcggtg cgctggtggc ggtgttgctt tcgattgtgg gactgggcgg 28080
tgcggctgta gtgaaggaga aggccgatcc ctgcttgcat ttcaatccca acaaatgcca 28140
gctgagtttt cagcccgatg gcaatcggtg cgcggtactg atcaagtgcg gatgggaatg 28200
cgagaacgtg agaatcgagt acaataacaa gactcggaac aatactctcg cgtccgtgtg 28260
gcagcccggg gaccccgagt ggtacaccgt ctctgtcccc ggtgctgacg gctccccgcg 28320
caccgtgaat aatactttca tttttgcgca catgtgcgac acggtcatgt ggatgagcaa 28380
gcagtacgat atgtggcccc ccacgaagga gaacatcgtg gtcttctcca tcgcttacag 28440
cctgtgcacg gcgctaatca ccgctatcgt gtgcctgagc attcacatgc tcatcgctat 28500
tcgccccaga aataatgccg aaaaagaaaa acagccataa cgtttttttt cacacctttt 28560
tcagaccatg gcctctgtta aatttttgct tttatttgcc agtctcattg ccgtcattca 28620
tggaatgagt aatgagaaaa ttactattta cactggcact aatcacacat tgaaaggtcc 28680
agaaaaagcc acagaagttt catggtattg ttattttaat gaatcagatg tatctactga 28740
actctgtgga aacaataaca aaaaaaatga gagcattact ctcatcaagt ttcaatgtgg 28800
atctgactta accctaatta acatcactag agactatgta ggtatgtatt atggaactac 28860
agcaggcatt tcggacatgg aattttatca agtttctgtg tctgaaccca ccacgcctag 28920
aatgaccaca accacaaaaa ctacacctgt taccactatg cagctcacta ccaataacat 28980
ttttgccatg cgtcaaatgg tcaacaatag cactcaaccc accccaccca gtgaggaaat 29040
tcccaaatcc atgattggca ttattgttgc tgtagtggtg tgcatgttga tcatcgcctt 29100
gtgcatggtg tactatgcct tctgctacag aaagcacaga ctgaacgaca agctggaaca 29160
cttactaagt gttgaatttt aattttttag aaccatgaag atcctaggcc ttttaatttt 29220
ttctatcatt acctctgctc tatgcaattc tgacaatgag gacgttactg tcgttgtcgg 29280
atcaaattat acactgaaag gtccagcgaa gggtatgctt tcgtggtatt gctattttgg 29340
atctgacact acagaaactg aattatgcaa tcttaagaat ggcaaaattc aaaattctaa 29400
aattaacaat tatatatgca atggtactga tctgatactc ctcaatatca cgaaatcata 29460
tgctggcagt tacacctgcc ctggagatga tgctgacagt atgatttttt acaaagtaac 29520
tgttgttgat cccactactc cacctccacc caccacaact actcacacca cacacacaga 29580
tcaaaccgca gcagaggagg cagcaaagtt agccttgcag gtccaagaca gttcatttgt 29640
tggcattacc cctacacctg atcagcggtg tccggggctg ctagtcagcg gcattgtcgg 29700
tgtgctttcg ggattagcag tcataatcat ctgcatgttc atttttgctt gctgctatag 29760
aaggctttac cgacaaaaat cagacccact gctgaacctc tatgtttaat tttttccaga 29820
gtcatgaagg cagttagcgc tctagttttt tgttctttga ttggcattgt tttttgcaat 29880
cctattccta aagttagctt tattaaagat gtgaatgtta ctgagggggg caatgtgaca 29940
ctggtaggtg tagagggtgc tgaaaacacc acctggacaa aataccacct caatgggtgg 30000
aaagatattt gcaattggag tgtattagtt tatacatgtg agggagttaa tcttaccatt 30060
gtcaatgcca cctcagctca aaatggtaga attcaaggac aaagtgtcag tgtatctaat 30120
gggtatttta cccaacatac ttttatctat gacgttaaag tcataccact gcctacgcct 30180
agcccaccta gcactaccac acagacaacc cacactacac agacaaccac atacagtaca 30240
ttaaatcagc ctaccaccac tacagcagca gaggttgcca gctcgtctgg ggtccgagtg 30300
gcatttttga tgttggcccc atctagcagt cccactgcta gtaccaatga gcagactact 30360
gaatttttgt ccactgtcga gagccacacc acagctacct ccagtgcctt ctctagcacc 30420
gccaatctct cctcgctttc ctctacacca atcagtcccg ctactactcc tagccccgct 30480
cctcttccca ctcccctgaa gcaaacagac ggcggcatgc aatggcagat caccctgctc 30540
attgtgatcg ggttggtcat cctggccgtg ttgctctact acatcttctg ccgccgcatt 30600
cccaacgcgc accgcaagcc ggtctacaag cccatcattg tcgggcagcc ggagccgctt 30660
caggtggaag ggggtctaag gaatcttctc ttctctttta cagtatggtg attgaactat 30720
gattcctaga caattcttga tcactattct tatctgcctc ctccaagtct gtgccaccct 30780
cgctctggtg gccaacgcca gtccagactg tattgggccc ttcgcctcct acgtgctctt 30840
tgccttcacc acctgcatct gctgctgtag catagtctgc ctgcttatca ccttcttcca 30900
gttcattgac tggatctttg tgcgcatcgc ctacctgcgc caccaccccc agtaccgcga 30960
ccagcgagtg gcgcggctgc tcaggctcct ctgataagca tgcgggctct gctacttctc 31020
gcgcttctgc tgttagtgct cccccgtccc gtcgaccccc ggtcccccac ccagtccccc 31080
gaggaggtcc gcaaatgcaa attccaagaa ccctggaaat tcctcaaatg ctaccgccaa 31140
aaatcagaca tgcatcccag ctggatcatg atcattggga tcgtgaacat tctggcctgc 31200
accctcatct cctttgtgat ttacccctgc tttgactttg gttggaactc gccagaggcg 31260
ctctatctcc cgcctgaacc tgacacacca ccacagcaac ctcaggcaca cgcactacca 31320
ccactacagc ctaggccaca atacatgccc atattagact atgaggccga gccacagcga 31380
cccatgctcc ccgctattag ttacttcaat ctaaccggcg gagatgactg acccactggc 31440
caacaacaac gtcaacgacc ttctcctgga catggacggc cgcgcctcgg agcagcgact 31500
cgcccaactt cgcattcgcc agcagcagga gagagccgtc aaggagctgc aggatgcggt 31560
ggccatccac cagtgcaaga gaggcatctt ctgcctggtg aaacaggcca agatctccta 31620
cgaggtcact ccaaacgacc atcgcctctc ctacgagctc ctgcagcagc gccagaagtt 31680
cacctgcctg gtcggagtca accccatcgt catcacccag cagtctggcg ataccaaggg 31740
gtgcatccac tgctcctgcg actcccccga ctgcgtccac actctgatca agaccctctg 31800
cggcctccgc gacctcctcc ccatgaacta atcaccccct tatccagtga aataaagatc 31860
atattgatga tgattttaca gaaataaaaa ataatcattt gatttgaaat aaagatacaa 31920
tcatattgat gatttgagtt taacaaaaaa ataaagaatc acttacttga aatctgatac 31980
caggtctctg tccatgtttt ctgccaacac cacttcactc ccctcttccc agctctggta 32040
ctgcaggccc cggcgggctg caaacttcct ccacacgctg aaggggatgt caaattcctc 32100
ctgtccctca atcttcattt tatcttctat cagatgtcca aaaagcgcgt ccgggtggat 32160
gatgacttcg accccgtcta cccctacgat gcagacaacg caccgaccgt gcccttcatc 32220
aaccccccct tcgtctcttc agatggattc caagagaagc ccctgggggt gttgtccctg 32280
cgactggccg accccgtcac caccaagaac ggggaaatca ccctcaagct gggagagggg 32340
gtggacctcg attcctcggg aaaactcatc tccaacacgg ccaccaaggc cgccgcccct 32400
ctcagttttt ccaacaacac catttccctt aacatggatc acccctttta cactaaagat 32460
ggaaaattat ccttacaagt ttctccacca ttaaatatac tgagaacaag cattctaaac 32520
acactagctt taggttttgg atcaggttta ggactccgtg gctctgcctt ggcagtacag 32580
ttagtctctc cacttacatt tgatactgat ggaaacataa agcttacctt agacagaggt 32640
ttgcatgtta caacaggaga tgcaattgaa agcaacataa gctgggctaa aggtttaaaa 32700
tttgaagatg gagccatagc aaccaacatt ggaaatgggt tagagtttgg aagcagtagt 32760
acagaaacag gtgttgatga tgcttaccca atccaagtta aacttggatc tggccttagc 32820
tttgacagta caggagccat aatggctggt aacaaagaag acgataaact cactttgtgg 32880
acaacacctg atccatcacc aaactgtcaa atactcgcag aaaatgatgc aaaactaaca 32940
ctttgcttga ctaaatgtgg tagtcaaata ctggccactg tgtcagtctt agttgtagga 33000
agtggaaacc taaaccccat tactggcacc gtaagcagtg ctcaggtgtt tctacgtttt 33060
gatgcaaacg gtgttctttt aacagaacat tctacactaa aaaaatactg ggggtatagg 33120
cagggagata gcatagatgg cactccatat accaatgctg taggattcat gcccaattta 33180
aaagcttatc caaagtcaca aagttctact actaaaaata atatagtagg gcaagtatac 33240
atgaatggag atgtttcaaa acctatgctt ctcactataa ccctcaatgg tactgatgac 33300
agcaacagta catattcaat gtcattttca tacacctgga ctaatggaag ctatgttgga 33360
gcaacatttg gggctaactc ttataccttc tcatacatcg cccaagaatg aacactgtat 33420
cccaccctgc atgccaaccc ttcccacccc actctgtgga acaaactctg aaacacaaaa 33480
taaaataaag ttcaagtgtt ttattgattc aacagtttta caggattcga gcagttattt 33540
ttcctccacc ctcccaggac atggaataca ccaccctctc cccccgcaca gccttgaaca 33600
tctgaatgcc attggtgatg gacatgcttt tggtctccac gttccacaca gtttcagagc 33660
gagccagtct cgggtcggtc agggagatga aaccctccgg gcactcccgc atctgcacct 33720
cacagctcaa cagctgagga ttgtcctcgg tggtcgggat cacggttatc tggaagaagc 33780
agaagagcgg cggtgggaat catagtccgc gaacgggatc ggccggtggt gtcgcatcag 33840
gccccgcagc agtcgctgcc gccgccgctc cgtcaagctg ctgctcaggg ggtccgggtc 33900
cagggactcc ctcagcatga tgcccacggc cctcagcatc agtcgtctgg tgcggcgggc 33960
gcagcagcgc atgcggatct cgctcaggtc gctgcagtac gtgcaacaca gaaccaccag 34020
gttgttcaac agtccatagt tcaacacgct ccagccgaaa ctcatcgcgg gaaggatgct 34080
acccacgtgg ccgtcgtacc agatcctcag gtaaatcaag tggtgccccc tccagaacac 34140
gctgcccacg tacatgatct ccttgggcat gtggcggttc accacctccc ggtaccacat 34200
caccctctgg ttgaacatgc agccccggat gatcctgcgg aaccacaggg ccagcaccgc 34260
cccgcccgcc atgcagcgaa gagaccccgg gtcccggcaa tggcaatgga ggacccaccg 34320
ctcgtacccg tggatcatct gggagctgaa caagtctatg ttggcacagc acaggcatat 34380
gctcatgcat ctcttcagca ctctcaactc ctcgggggtc aaaaccatat cccagggcac 34440
ggggaactct tgcaggacag cgaaccccgc agaacagggc aatcctcgca cagaacttac 34500
attgtgcatg gacagggtat cgcaatcagg cagcaccggg tgatcctcca ccagagaagc 34560
gcgggtctcg gtctcctcac agcgtggtaa gggggccggc cgatacgggt gatggcggga 34620
cgcggctgat cgtgttcgcg accgtgtcat gatgcagttg ctttcggaca ttttcgtact 34680
tgctgtagca gaacctggtc cgggcgctgc acaccgatcg ccggcggcgg tctcggcgct 34740
tggaacgctc ggtgttgaaa ttgtaaaaca gccactctct cagaccgtgc agcagatcta 34800
gggcctcagg agtgatgaag atcccatcat gcctgatggc tctgatcaca tcgaccaccg 34860
tggaatgggc cagacccagc cagatgatgc aattttgttg ggtttcggtg acggcggggg 34920
agggaagaac aggaagaacc atgattaact tttaatccaa acggtctcgg agtacttcaa 34980
aatgaagatc gcggagatgg cacctctcgc ccccgctgtg ttggtggaaa ataacagcca 35040
ggtcaaaggt gatacggttc tcgagatgtt ccacggtggc ttccagcaaa gcctccacgc 35100
gcacatccag aaacaagaca atagcgaaag cgggagggtt ctctaattcc tcaatcatca 35160
tgttacactc ctgcaccatc cccagataat tttcattttt ccagccttga atgattcgaa 35220
ctagttcctg aggtaaatcc aagccagcca tgataaagag ctcgcgcaga gcgccctcca 35280
ccggcattct taagcacacc ctcataattc caagatattc tgctcctggt tcacctgcag 35340
cagattgaca agcggaatat caaaatctct gccgcgatcc ctgagctcct ccctcagcaa 35400
taactgtaag tactctttca tatcctctcc gaaattttta gccataggac caccaggaat 35460
aagattaggg caagccacag tacagataaa ccgaagtcct ccccagtgag cattgccaaa 35520
tgcaagactg ctataagcat gctggctaga cccggtgata tcttccagat aactggacag 35580
aaaatcgccc aggcaatttt taagaaaatc aacaaaagaa aaatcctcca ggtggacgtt 35640
tagagcctcg ggaacaacga tgaagtaaat gcaagcggtg cgttccagca tggttagtta 35700
gctgatctgt agaaaaaaca aaaatgaaca ttaaaccatg ctagcctggc gaacaggtgg 35760
gtaaatcgtt ctctccagca ccaggcaggc cacggggtct ccggcgcgac cctcgtaaaa 35820
attgtcgcta tgattgaaaa ccatcacaga gagacgttcc cggtggccgg cgtgaatgat 35880
tcgacaagat gaatacaccc ccggaacatt ggcgtccgcg agtgaaaaaa agcgcccgag 35940
gaagcaataa ggcactacaa tgctcagtct caagtccagc aaagcgatgc catgcggatg 36000
aagcacaaaa ttctcaggtg cgtacaaaat gtaattactc ccctcctgca caggcagcaa 36060
agcccccgat ccctccaggt acacatacaa agcctcagcg tccatagctt accgagcagc 36120
agcacacaac aggcgcaaga gtcagagaaa ggctgagctc taacctgtcc acccgctctc 36180
tgctcaatat atagcccaga tctacactga cgtaaaggcc aaagtctaaa aatacccgcc 36240
aaataatcac acacgcccag cacacgccca gaaaccggtg acacactcaa aaaaatacgc 36300
gcacttcctc aaacgcccaa aactgccgtc atttccgggt tcccacgcta cgtcatcaaa 36360
acacgacttt caaattccgt cgaccgttaa aaacgtcacc cgccccgccc ctaacggtcg 36420
cccgtctctc agccaatcag cgccccgcat ccccaaattc aaacacctca tttgcatatt 36480
aacgcgcaca aaaagtttga ggtatattat tgatgatgg 36519
<210> 11
<211> 31867
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 11
ccatcttcaa taatatacct caaacttttt gtgcgcgtta atatgcaaat gaggcgtttg 60
aatttgggga ggaagggcgg tgattggtcg agggatgagc gaccgttagg ggcggggcga 120
gtgacgtttt gatgacgtgg ttgcgaggag gagccagttt gcaagttctc gtgggaaaag 180
tgacgtcaaa cgaggtgtgg tttgaacacg gaaatactca attttcccgc gctctctgac 240
aggaaatgag gtgtttctgg gcggatgcaa gtgaaaacgg gccattttcg cgcgaaaact 300
gaatgaggaa gtgaaaatct gagtaatttc gcgtttatgg cagggaggag tatttgccga 360
gggccgagta gactttgacc gattacgtgg gggtttcgat taccgtgttt ttcacctaaa 420
tttccgcgta cggtgtcaaa gtccggtgtt tttacgtagg tgtcagctga tcgccagggt 480
atttaaacct gcgctctcca gtcaagaggc cactcttgag tgccagcgag aagagttttc 540
tcctccgcgc cgcgagtcag atctacactt tgaaagtagg gataacaggg taatgacatt 600
gattattgac tagttgttaa tagtaatcaa ttacggggtc attagttcat agcccatata 660
tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 720
cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 780
attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 840
atcatatgcc aagtccgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 900
atgcccagta catgacctta cgggactttc ctacttggca gtacatctac gtattagtca 960
tcgctattac catggtgatg cggttttggc agtacaccaa tgggcgtgga tagcggtttg 1020
actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 1080
aaaatcaacg ggactttcca aaatgtcgta ataaccccgc cccgttgacg caaatgggcg 1140
gtaggcgtgt acggtgggag gtctatataa gcagagctcg tttagtgaac cgtcagatcg 1200
cctggaacgc catccacgct gttttgacct ccatagaaga cagcgatcgc gccaccatgg 1260
tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat cctggtcgag ctggacggcg 1320
acgtaaacgg ccacaagttc agcgtgtccg gcgagggcga gggcgatgcc acctacggca 1380
agctgaccct gaagttcatc tgcaccaccg gcaagctgcc cgtgccctgg cccaccctcg 1440
tgaccaccct gacctacggc gtgcagtgct tcagccgcta ccccgaccac atgaagcagc 1500
acgacttctt caagtccgcc atgcccgaag gctacgtcca ggagcgcacc atcttcttca 1560
aggacgacgg caactacaag acccgcgccg aggtgaagtt cgagggcgac accctggtga 1620
accgcatcga gctgaagggc atcgacttca aggaggacgg caacatcctg gggcacaagc 1680
tggagtacaa ctacaacagc cacaacgtct atatcatggc cgacaagcag aagaacggca 1740
tcaaggtgaa cttcaagatc cgccacaaca tcgaggacgg cagcgtgcag ctcgccgacc 1800
actaccagca gaacaccccc atcggcgacg gccccgtgct gctgcccgac aaccactacc 1860
tgagcaccca gtccgccctg agcaaagacc ccaacgagaa gcgcgatcac atggtcctgc 1920
tggagttcgt gaccgccgcc gggatcactc tcggcatgga cgagctttac aagtagtgag 1980
tttaaactcc catttaaatg tgagggttaa tgcttcgagc agacatgata agatacattg 2040
atgagtttgg acaaaccaca actagaatgc agtgaaaaaa atgctttatt tgtgaaattt 2100
gtgatgctat tgctttattt gtaaccatta taagctgcaa taaacaagtt aacaacaaca 2160
attgcattca ttttatgttt caggttcagg gggagatgtg ggaggttttt taaagcaagt 2220
aaaacctcta caaatgtggt aaaataacta taacggtcct aaggtagcga gtgagtagtg 2280
ttctggggcg ggggaggacc tgcatgaggg ccagaataac tgaaatctgt gcttttctgt 2340
gtgttgcagc agcatgagcg gaagcggctc ctttgaggga ggggtattca gcccttatct 2400
gacggggcgt ctcccctcct gggcgggagt gcgtcagaat gtgatgggat ccacggtgga 2460
cggccggccc gtgcagcccg cgaactcttc aaccctgacc tatgcaaccc tgagctcttc 2520
gtcgttggac gcagctgccg ccgcagctgc tgcatctgcc gccagcgccg tgcgcggaat 2580
ggccatgggc gccggctact acggcactct ggtggccaac tcgagttcca ccaataatcc 2640
cgccagcctg aacgaggaga agctgttgct gctgatggcc cagctcgagg ccttgaccca 2700
gcgcctgggc gagctgaccc agcaggtggc tcagctgcag gagcagacgc gggccgcggt 2760
tgccacggtg aaatccaaat aaaaaatgaa tcaataaata aacggagacg gttgttgatt 2820
ttaacacaga gtctgaatct ttatttgatt tttcgcgcgc ggtaggccct ggaccaccgg 2880
tctcgatcat tgagcacccg gtggatcttt tccaggaccc ggtagaggtg ggcttggatg 2940
ttgaggtaca tgggcatgag cccgtcccgg gggtggaggt agctccattg cagggcctcg 3000
tgctcggggg tggtgttgta aatcacccag tcatagcagg ggcgcagggc atggtgttgc 3060
acaatatctt tgaggaggag actgatggcc acgggcagcc ctttggtgta ggtgtttaca 3120
aatctgttga gctgggaggg atgcatgcgg ggggagatga ggtgcatctt ggcctggatc 3180
ttgagattgg cgatgttacc gcccagatcc cgcctggggt tcatgttgtg caggaccacc 3240
agcacggtgt atccggtgca cttggggaat ttatcatgca acttggaagg gaaggcgtga 3300
aagaatttgg cgacgccttt gtgcccgccc aggttttcca tgcactcatc catgatgatg 3360
gcgatgggcc cgtgggcggc ggcctgggca aagacgtttc gggggtcgga cacatcatag 3420
ttgtggtcct gggtgaggtc atcataggcc attttaatga atttggggcg gagggtgccg 3480
gactggggga caaaggtacc ctcgatcccg ggggcgtagt tcccctcaca gatctgcatc 3540
tcccaggctt tgagctcgga gggggggatc atgtccacct gcggggcgat aaagaacacg 3600
gtttccgggg cgggggagat gagctgggcc gaaagcaagt tccggagcag ctgggacttg 3660
ccgcagccgg tggggccgta gatgaccccg atgaccggct gcaggtggta gttgagggag 3720
agacagctgc cgtcctcccg gaggaggggg gccacctcgt tcatcatctc gcgcacgtgc 3780
atgttctcgc gcaccagttc cgccaggagg cgctctcccc ccagggatag gagctcctgg 3840
agcgaggcga agtttttcag cggcttgagt ccgtcggcca tgggcatttt ggagagggtt 3900
tgttgcaaga gttccaggcg gtcccagagc tcggtgatgt gctctacggc atctcgatcc 3960
agcagacctc ctcgtttcgc gggttgggac ggctgcggga gtagggcacc agacgatggg 4020
cgtccagcgc agccagggtc cggtccttcc agggtcgcag cgtccgcgtc agggtggtct 4080
ccgtcacggt gaaggggtgc gcgccgggct gggcgcttgc gagggtgcgc ttcaggctca 4140
tccggctggt cgaaaaccgc tcccgatcgg cgccctgcgc gtcggccagg tagcaattga 4200
ccatgagttc gtagttgagc gcctcggccg cgtggccttt ggcgcggagc ttacctttgg 4260
aagtctgccc gcaggcggga cagaggaggg acttgagggc gtagagcttg ggggcgagga 4320
agacggactc gggggcgtag gcgtccgcgc cgcagtgggc gcagacggtc tcgcactcca 4380
cgagccaggt gaggtcgggc tggtcggggt caaaaaccag tttcccgccg ttctttttga 4440
tgcgtttctt acctttggtc tccatgagct cgtgtccccg ctgggtgaca aagaggctgt 4500
ccgtgtcccc gtagaccgac tttatgggcc ggtcctcgag cggtgtgccg cggtcctcct 4560
cgtagaggaa ccccgcccac tccgagacga aagcccgggt ccaggccagc acgaaggagg 4620
ccacgtggga cgggtagcgg tcgttgtcca ccagcgggtc caccttttcc agggtatgca 4680
aacacatgtc cccctcgtcc acatccagga aggtgattgg cttgtaagtg taggccacgt 4740
gaccgggggt cccggccggg ggggtataaa agggtgcggg tccctgctcg tcctcactgt 4800
cttccggatc gctgtccagg agcgccagct gttggggtag gtattccctc tcgaaggcgg 4860
gcatgacctc ggcactcagg ttgtcagttt ctagaaacga ggaggatttg atattgacgg 4920
tgccggcgga gatgcctttc aagagcccct cgtccatctg gtcagaaaag acgatctttt 4980
tgttgtcgag cttggtggcg aaggagccgt agagggcgtt ggagaggagc ttggcgatgg 5040
agcgcatggt ctggtttttt tccttgtcgg cgcgctcctt ggcggcgatg ttgagctgca 5100
cgtactcgcg cgccacgcac ttccattcgg ggaagacggt ggtcagctcg tcgggcacga 5160
ttctgacctg ccagccccga ttatgcaggg tgatgaggtc cacactggtg gccacctcgc 5220
cgcgcagggg ctcattagtc cagcagaggc gtccgccctt gcgcgagcag aaggggggca 5280
gggggtccag catgacctcg tcgggggggt cggcatcgat ggtgaagatg ccgggcagga 5340
ggtcggggtc aaagtagctg atggaagtgg ccagatcgtc cagggcagct tgccattcgc 5400
gcacggccag cgcgctctcg tagggactga ggggcgtgcc ccagggcatg ggatgggtaa 5460
gcgcggaggc gtacatgccg cagatgtcgt agacgtagag gggctcctcg aggatgccga 5520
tgtaggtggg gtagcagcgc cccccgcgga tgctggcgcg cacgtagtca tacagctcgt 5580
gcgagggggc gaggagcccc gggcccaggt tggtgcgact gggcttttcg gcgcggtaga 5640
cgatctggcg gaaaatggca tgcgagttgg aggagatggt gggcctttgg aagatgttga 5700
agtgggcgtg gggcagtccg accgagtcgc ggatgaagtg ggcgtaggag tcttgcagct 5760
tggcgacgag ctcggcggtg actaggacgt ccagagcgca gtagtcgagg gtctcctgga 5820
tgatgtcata cttgagctgt cccttttgtt tccacagctc gcggttgaga aggaactctt 5880
cgcggtcctt ccagtactct tcgaggggga acccgtcctg atctgcacgg taagagccta 5940
gcatgtagaa ctggttgacg gccttgtagg cgcagcagcc cttctccacg gggagggcgt 6000
aggcctgggc ggccttgcgc agggaggtgt gcgtgagggc gaaagtgtcc ctgaccatga 6060
ccttgaggaa ctggtgcttg aagtcgatat cgtcgcagcc cccctgctcc cagagctgga 6120
agtccgtgcg cttcttgtag gcggggttgg gcaaagcgaa agtaacatcg ttgaagagga 6180
tcttgcccgc gcggggcata aagttgcgag tgatgcggaa aggttggggc acctcggccc 6240
ggttgttgat gacctgggcg gcgagcacga tctcgtcgaa gccgttgatg ttgtggccca 6300
cgatgtagag ttccacgaat cgcggacggc ccttgacgtg gggcagtttc ttgagctcct 6360
cgtaggtgag ctcgtcgggg tcgctgagcc cgtgctgctc gagcgcccag tcggcgagat 6420
gggggttggc gcggaggaag gaagtccaga gatccacggc cagggcggtt tgcagacggt 6480
cccggtactg acggaactgc tgcccgacgg ccattttttc gggggtgacg cagtagaagg 6540
tgcgggggtc cccgtgccag cgatcccatt tgagctggag ggcgagatcg agggcgagct 6600
cgacgagccg gtcgtccccg gagagtttca tgaccagcat gaaggggacg agctgcttgc 6660
cgaaggaccc catccaggtg taggtttcca catcgtaggt gaggaagagc ctttcggtgc 6720
gaggatgcga gccgatgggg aagaactgga tctcctgcca ccaattggag gaatggctgt 6780
tgatgtgatg gaagtagaaa tgccgacggc gcgccgaaca ctcgtgcttg tgtttataca 6840
agcggccaca gtgctcgcaa cgctgcacgg gatgcacgtg ctgcacgagc tgtacctgag 6900
ttcctttgac gaggaatttc agtgggaagt ggagtcgtgg cgcctgcatc tcgtgctgta 6960
ctacgtcgtg gtggtcggcc tggccctctt ctgcctcgat ggtggtcatg ctgacgagcc 7020
cgcgcgggag gcaggtccag acctcggcgc gagcgggtcg gagagcgagg acgagggcgc 7080
gcaggccgga gctgtccagg gtcctgagac gctgcggagt caggtcagtg ggcagcggcg 7140
gcgcgcggtt gacttgcagg agtttttcca gggcgcgcgg gaggtccaga tggtacttga 7200
tctccaccgc gccattggtg gcgacgtcga tggcttgcag ggtcccgtgc ccctggggtg 7260
tgaccaccgt cccccgtttc ttcttgggcg gctggggcga cgggggcggt gcctcttcca 7320
tggttagaag cggcggcgag gacgcgcgcc gggcggcagg ggcggctcgg ggcccggagg 7380
caggggcggc aggggcacgt cggcgccgcg cgcgggtagg ttctggtact gcgcccggag 7440
aagactggcg tgagcgacga cgcgacggtt gacgtcctgg atctgacgcc tctgggtgaa 7500
ggccacggga cccgtgagtt tgaacctgaa agagagttcg acagaatcaa tctcggtatc 7560
gttgacggcg gcctgccgca ggatctcttg cacgtcgccc gagttgtcct ggtaggcgat 7620
ctcggtcatg aactgctcga tctcctcctc ttgaaggtct ccgcggccgg cgcgctccac 7680
ggtggccgcg aggtcgttgg agatgcggcc catgagctgc gagaaggcgt tcatgcccgc 7740
ctcgttccag acgcggctgt agaccacgac gccctcggga tcgcgggcgc gcatgaccac 7800
ctgggcgagg ttgagctcca cgtggcgcgt gaagaccgcg tagttgcaga ggcgctggta 7860
gaggtagttg agcgtggtgg cgatgtgctc ggtgacgaag aaatacatga tccagcggcg 7920
gagcggcatc tcgctgacgt cgcccagcgc ctccaaacgt tccatggcct cgtaaaagtc 7980
cacggcgaag ttgaaaaact gggagttgcg cgccgagacg gtcaactcct cctccagaag 8040
acggatgagc tcggcgatgg tggcgcgcac ctcgcgctcg aaggcccccg ggagttcctc 8100
cacttcctct tcttcctcct ccactaacat ctcttctact tcctcctcag gcggcagtgg 8160
tggcggggga gggggcctgc gtcgccggcg gcgcacgggc agacggtcga tgaagcgctc 8220
gatggtctcg ccgcgccggc gtcgcatggt ctcggtgacg gcgcgcccgt cctcgcgggg 8280
ccgcagcgtg aagacgccgc cgcgcatctc caggtggccg ggggggtccc cgttgggcag 8340
ggagagggcg ctgacgatgc atcttatcaa ttgccccgta gggactccgc gcaaggacct 8400
gagcgtctcg agatccacgg gatctgaaaa ccgctgaacg aaggcttcga gccagtcgca 8460
gtcgcaaggt aggctgagca cggtttcttc tggcgggtca tgttggttgg gagcggggcg 8520
ggcgatgctg ctggtgatga agttgaaata ggcggttctg agacggcgga tggtggcgag 8580
gagcaccagg tctttgggcc cggcttgctg gatgcgcaga cggtcggcca tgccccaggc 8640
gtggtcctga cacctggcca ggtccttgta gtagtcctgc atgagccgct ccacgggcac 8700
ctcctcctcg cccgcgcggc cgtgcatgcg cgtgagcccg aagccgcgct ggggctggac 8760
gagcgccagg tcggcgacga cgcgctcggc gaggatggct tgctggatct gggtgagggt 8820
ggtctggaag tcatcaaagt cgacgaagcg gtggtaggct ccggtgttga tggtgtagga 8880
gcagttggcc atgacggacc agttgacggt ctggtggccc ggacgcacga gctcgtggta 8940
cttgaggcgc gagtaggcgc gcgtgtcgaa gatgtagtcg ttgcaggtgc gcaccaggta 9000
ctggtagccg atgaggaagt gcggcggcgg ctggcggtag agcggccatc gctcggtggc 9060
gggggcgccg ggcgcgaggt cctcgagcat ggtgcggtgg tagccgtaga tgtacctgga 9120
catccaggtg atgccggcgg cggtggtgga ggcgcgcggg aactcgcgga cgcggttcca 9180
gatgttgcgc agcggcagga agtagttcat ggtgggcacg gtctggcccg tgaggcgcgc 9240
gcagtcgtgg atgctctata cgggcaaaaa cgaaagcggt cagcggctcg actccgtggc 9300
ctggaggcta agcgaacggg ttgggctgcg cgtgtacccc ggttcgaatc tcgaatcagg 9360
ctggagccgc agctaacgtg gtattggcac tcccgtctcg acccaagcct gcaccaaccc 9420
tccaggatac ggaggcgggt cgttttgcaa cttttttttg gaggccggat gagactagta 9480
agcgcggaaa gcggccgacc gcgatggctc gctgccgtag tctggagaag aatcgccagg 9540
gttgcgttgc ggtgtgcccc ggttcgaggc cggccggatt ccgcggctaa cgagggcgtg 9600
gctgccccgt cgtttccaag accccatagc cagccgactt ctccagttac ggagcgagcc 9660
cctcttttgt tttgtttgtt tttgccagat gcatcccgta ctgcggcaga tgcgccccca 9720
ccaccctcca ccgcaacaac agccccctcc acagccggcg cttctgcccc cgccccagca 9780
gcaacttcca gccacgaccg ccgcggccgc cgtgagcggg gctggacaga gttatgatca 9840
ccagctggcc ttggaagagg gcgaggggct ggcgcgcctg ggggcgtcgt cgccggagcg 9900
gcacccgcgc gtgcagatga aaagggacgc tcgcgaggcc tacgtgccca agcagaacct 9960
gttcagagac aggagcggcg aggagcccga ggagatgcgc gcggcccggt tccacgcggg 10020
gcgggagctg cggcgcggcc tggaccgaaa gagggtgctg agggacgagg atttcgaggc 10080
ggacgagctg acggggatca gccccgcgcg cgcgcacgtg gccgcggcca acctggtcac 10140
ggcgtacgag cagaccgtga aggaggagag caacttccaa aaatccttca acaaccacgt 10200
gcgcaccctg atcgcgcgcg aggaggtgac cctgggcctg atgcacctgt gggacctgct 10260
ggaggccatc gtgcagaacc ccaccagcaa gccgctgacg gcgcagctgt tcctggtggt 10320
gcagcatagt cgggacaacg aagcgttcag ggaggcgctg ctgaatatca ccgagcccga 10380
gggccgctgg ctcctggacc tggtgaacat tctgcagagc atcgtggtgc aggagcgcgg 10440
gctgccgctg tccgagaagc tggcggccat caacttctcg gtgctgagtt tgggcaagta 10500
ctacgctagg aagatctaca agaccccgta cgtgcccata gacaaggagg tgaagatcga 10560
cgggttttac atgcgcatga ccctgaaagt gctgaccctg agcgacgatc tgggggtgta 10620
ccgcaacgac aggatgcacc gtgcggtgag cgccagcagg cggcgcgagc tgagcgacca 10680
ggagctgatg catagtctgc agcgggccct gaccggggcc gggaccgagg gggagagcta 10740
ctttgacatg ggcgcggacc tgcactggca gcccagccgc cgggccttgg aggcggcggc 10800
aggaccctac gtagaagagg tggacgatga ggtggacgag gagggcgagt acctggaaga 10860
ctgatggcgc gaccgtattt ttgctagatg caacaacaac agccacctcc tgatcccgcg 10920
atgcgggcgg cgctgcagag ccagccgtcc ggcattaact cctcggacga ttggacccag 10980
gccatgcaac gcatcatggc gctgacgacc cgcaaccccg aagcctttag acagcagccc 11040
caggccaacc ggctctcggc catcctggag gccgtggtgc cctcgcgctc caaccccacg 11100
cacgagaagg tcctggccat cgtgaacgcg ctggtggaga acaaggccat ccgcggcgac 11160
gaggccggcc tggtgtacaa cgcgctgctg gagcgcgtgg cccgctacaa cagcaccaac 11220
gtgcagacca acctggaccg catggtgacc gacgtgcgcg aggccgtggc ccagcgcgag 11280
cggttccacc gcgagtccaa cctgggatcc atggtggcgc tgaacgcctt cctcagcacc 11340
cagcccgcca acgtgccccg gggccaggag gactacacca acttcatcag cgccctgcgc 11400
ctgatggtga ccgaggtgcc ccagagcgag gtgtaccagt ccgggccgga ctacttcttc 11460
cagaccagtc gccagggctt gcagaccgtg aacctgagcc aggctttcaa gaacttgcag 11520
ggcctgtggg gcgtgcaggc cccggtcggg gaccgcgcga cggtgtcgag cctgctgacg 11580
ccgaactcgc gcctgctgct gctgctggtg gcccccttca cggacagcgg cagcatcaac 11640
cgcaactcgt acctgggcta cctgattaac ctgtaccgcg aggccatcgg ccaggcgcac 11700
gtggacgagc agacctacca ggagatcacc cacgtgagcc gcgccctggg ccaggacgac 11760
ccgggcaacc tggaagccac cctgaacttt ttgctgacca accggtcgca gaagatcccg 11820
ccccagtacg cgctcagcac cgaggaggag cgcatcctgc gttacgtgca gcagagcgtg 11880
ggcctgttcc tgatgcagga gggggccacc cccagcgccg cgctcgacat gaccgcgcgc 11940
aacatggagc ccagcatgta cgccagcaac cgcccgttca tcaataaact gatggactac 12000
ttgcatcggg cggccgccat gaactctgac tatttcacca acgccatcct gaatccccac 12060
tggctcccgc cgccggggtt ctacacgggc gagtacgaca tgcccgaccc caatgacggg 12120
ttcctgtggg acgatgtgga cagcagcgtg ttctcccccc gaccgggtgc taacgagcgc 12180
cccttgtgga agaaggaagg cagcgaccga cgcccgtcct cggcgctgtc cggccgcgag 12240
ggtgctgccg cggcggtgcc cgaggccgcc agtcctttcc cgagcttgcc cttctcgctg 12300
aacagtatcc gcagcagcga gctgggcagg atcacgcgcc cgcgcttgct gggcgaagag 12360
gagtacttga atgactcgct gttgagaccc gagcgggaga agaacttccc caataacggg 12420
atagaaagcc tggtggacaa gatgagccgc tggaagacgt atgcgcagga gcacagggac 12480
gatccccggg cgtcgcaggg ggccacgagc cggggcagcg ccgcccgtaa acgccggtgg 12540
cacgacaggc agcggggaca gatgtgggac gatgaggact ccgccgacga cagcagcgtg 12600
ttggacttgg gtgggagtgg taacccgttc gctcacctgc gcccccgtat cgggcgcatg 12660
atgtaagaga aaccgaaaat aaatgatact caccaaggcc atggcgacca gcgtgcgttc 12720
gtttcttctc tgttgttgtt gtatctagta tgatgaggcg tgcgtacccg gagggtcctc 12780
ctccctcgta cgagagcgtg atgcagcagg cgatggcggc ggcggcgatg cagcccccgc 12840
tggaggctcc ttacgtgccc ccgcggtacc tggcgcctac ggaggggcgg aacagcattc 12900
gttactcgga gctggcaccc ttgtacgata ccacccggtt gtacctggtg gacaacaagt 12960
cggcggacat cgcctcgctg aactaccaga acgaccacag caacttcctg accaccgtgg 13020
tgcagaacaa tgacttcacc cccacggagg ccagcaccca gaccatcaac tttgacgagc 13080
gctcgcggtg gggcggccag ctgaaaacca tcatgcacac caacatgccc aacgtgaacg 13140
agttcatgta cagcaacaag ttcaaggcgc gggtgatggt ctcccgcaag acccccaatg 13200
gggtgacagt gacagaggat tatgatggta gtcaggatga gctgaagtat gaatgggtgg 13260
aatttgagct gcccgaaggc aacttctcgg tgaccatgac catcgacctg atgaacaacg 13320
ccatcatcga caattacttg gcggtggggc ggcagaacgg ggtgctggag agcgacatcg 13380
gcgtgaagtt cgacactagg aacttcaggc tgggctggga ccccgtgacc gagctggtca 13440
tgcccggggt gtacaccaac gaggctttcc atcccgatat tgtcttgctg cccggctgcg 13500
gggtggactt caccgagagc cgcctcagca acctgctggg cattcgcaag aggcagccct 13560
tccaggaagg cttccagatc atgtacgagg atctggaggg gggcaacatc cccgcgctcc 13620
tggatgtcga cgcctatgag aaaagcaagg aggatgcagc agctgaagca actgcagccg 13680
tagctaccgc ctctaccgag gtcaggggcg ataattttgc aagcgccgca gcagtggcag 13740
cggccgaggc ggctgaaacc gaaagtaaga tagtcattca gccggtggag aaggatagca 13800
agaacaggag ctacaacgta ctaccggaca agataaacac cgcctaccgc agctggtacc 13860
tagcctacaa ctatggcgac cccgagaagg gcgtgcgctc ctggacgctg ctcaccacct 13920
cggacgtcac ctgcggcgtg gagcaagtct actggtcgct gcccgacatg atgcaagacc 13980
cggtcacctt ccgctccacg cgtcaagtta gcaactaccc ggtggtgggc gccgagctcc 14040
tgcccgtcta ctccaagagc ttcttcaacg agcaggccgt ctactcgcag cagctgcgcg 14100
ccttcacctc gcttacgcac gtcttcaacc gcttccccga gaaccagatc ctcgtccgcc 14160
cgcccgcgcc caccattacc accgtcagtg aaaacgttcc tgctctcaca gatcacggga 14220
ccctgccgct gcgcagcagt atccggggag tccagcgcgt gaccgttact gacgccagac 14280
gccgcacctg cccctacgtc tacaaggccc tgggcatagt cgcgccgcgc gtcctctcga 14340
gccgcacctt ctaaatgtcc attctcatct cgcccagtaa taacaccggt tggggcctgc 14400
gcgcgcccag caagatgtac ggaggcgctc gccaacgctc cacgcaacac cccgtgcgcg 14460
tgcgcgggca cttccgcgct ccctggggcg ccctcaaggg ccgcgtgcgg tcgcgcacca 14520
ccgtcgacga cgtgatcgac caggtggtgg ccgacgcgcg caactacacc cccgccgccg 14580
cgcccgtctc caccgtggac gccgtcatcg acagcgtggt ggccgacgcg cgccggtacg 14640
cccgcgccaa gagccggcgg cggcgcatcg cccggcggca ccggagcacc cccgccatgc 14700
gcgcggcgcg agccttgctg cgcagggcca ggcgcacggg acgcagggcc atgctcaggg 14760
cggccagacg cgcggcttca ggcgccagcg ccggcaggac ccggagacgc gcggccacgg 14820
cggcggcagc ggccatcgcc agcatgtccc gcccgcggcg agggaacgtg tactgggtgc 14880
gcgacgccgc caccggtgtg cgcgtgcccg tgcgcacccg cccccctcgc acttgaagat 14940
gttcacttcg cgatgttgat gtgtcccagc ggcgaggagg atgtccaagc gcaaattcaa 15000
ggaagagatg ctccaggtca tcgcgcctga gatctacggc cctgcggtgg tgaaggagga 15060
aagaaagccc cgcaaaatca agcgggtcaa aaaggacaaa aaggaagaag aaagtgatgt 15120
ggacggattg gtggagtttg tgcgcgagtt cgccccccgg cggcgcgtgc agtggcgcgg 15180
gcggaaggtg caaccggtgc tgagacccgg caccaccgtg gtcttcacgc ccggcgagcg 15240
ctccggcacc gcttccaagc gctcctacga cgaggtgtac ggggatgatg atattctgga 15300
gcaggcggcc gagcgcctgg gcgagtttgc ttacggcaag cgcagccgtt ccgcaccgaa 15360
ggaagaggcg gtgtccatcc cgctggacca cggcaacccc acgccgagcc tcaagcccgt 15420
gaccttgcag caggtgctgc cgaccgcggc gccgcgccgg gggttcaagc gcgagggcga 15480
ggatctgtac cccaccatgc agctgatggt gcccaagcgc cagaagctgg aagacgtgct 15540
ggagaccatg aaggtggacc cggacgtgca gcccgaggtc aaggtgcggc ccatcaagca 15600
ggtggccccg ggcctgggcg tgcagaccgt ggacatcaag attcccacgg agcccatgga 15660
aacgcagacc gagcccatga tcaagcccag caccagcacc atggaggtgc agacggatcc 15720
ctggatgcca tcggctccta gtcgaagacc ccggcgcaag tacggcgcgg ccagcctgct 15780
gatgcccaac tacgcgctgc atccttccat catccccacg ccgggctacc gcggcacgcg 15840
cttctaccgc ggtcatacca gcagccgccg ccgcaagacc accactcgcc gccgccgtcg 15900
ccgcaccgcc gctgcaacca cccctgccgc cctggtgcgg agagtgtacc gccgcggccg 15960
cgcacctctg accctgccgc gcgcgcgcta ccacccgagc atcgccattt aaactttcgc 16020
ctgctttgca gatcaatggc cctcacatgc cgccttcgcg ttcccattac gggctaccga 16080
ggaagaaaac cgcgccgtag aaggctggcg gggaacggga tgcgtcgcca ccaccaccgg 16140
cggcggcgcg ccatcagcaa gcggttgggg ggaggcttcc tgcccgcgct gatccccatc 16200
atcgccgcgg cgatcggggc gatccccggc attgcttccg tggcggtgca ggcctctcag 16260
cgccactgag acacacttgg aaacatcttg taataaacca atggactctg acgctcctgg 16320
tcctgtgatg tgttttcgta gacagatgga agacatcaat ttttcgtccc tggctccgcg 16380
acacggcacg cggccgttca tgggcacctg gagcgacatc ggcaccagcc aactgaacgg 16440
gggcgccttc aattggagca gtctctggag cgggcttaag aatttcgggt ccacgcttaa 16500
aacctatggc agcaaggcgt ggaacagcac cacagggcag gcgctgaggg ataagctgaa 16560
agagcagaac ttccagcaga aggtggtcga tgggctcgcc tcgggcatca acggggtggt 16620
ggacctggcc aaccaggccg tgcagcggca gatcaacagc cgcctggacc cggtgccgcc 16680
cgccggctcc gtggagatgc cgcaggtgga ggaggagctg cctcccctgg acaagcgggg 16740
cgagaagcga ccccgccccg atgcggagga gacgctgctg acgcacacgg acgagccgcc 16800
cccgtacgag gaggcggtga aactgggtct gcccaccacg cggcccatcg cgcccctggc 16860
caccggggtg ctgaaacccg aaaagcccgc gaccctggac ttgcctcctc cccagccttc 16920
ccgcccctct acagtggcta agcccctgcc gccggtggcc gtggcccgcg cgcgacccgg 16980
gggcaccgcc cgccctcatg cgaactggca gagcactctg aacagcatcg tgggtctggg 17040
agtgcagagt gtgaagcgcc gccgctgcta ttaaacctac cgtagcgctt aacttgcttg 17100
tctgtgtgtg tatgtattat gtcgccgccg ccgctgtcca ccagaaggag gagtgaagag 17160
gcgcgtcgcc gagttgcaag atggccaccc catcgatgct gccccagtgg gcgtacatgc 17220
acatcgccgg acaggacgct tcggagtacc tgagtccggg tctggtgcag tttgcccgcg 17280
ccacagacac ctacttcagt ctggggaaca agtttaggaa ccccacggtg gcgcccacgc 17340
acgatgtgac caccgaccgc agccagcggc tgacgctgcg cttcgtgccc gtggaccgcg 17400
aggacaacac ctactcgtac aaagtgcgct acacgctggc cgtgggcgac aaccgcgtgc 17460
tggacatggc cagcacctac tttgacatcc gcggcgtgct ggatcggggc cctagcttca 17520
aaccctactc cggcaccgcc tacaacagtc tggcccccaa gggagcaccc aacacttgtc 17580
agtggacata taaagccgat ggtgaaactg ccacagaaaa aacctataca tatggaaatg 17640
cacccgtgca gggcattaac atcacaaaag atggtattca acttggaact gacaccgatg 17700
atcagccaat ctacgcagat aaaacctatc agcctgaacc tcaagtgggt gatgctgaat 17760
ggcatgacat cactggtact gatgaaaagt atggaggcag agctcttaag cctgatacca 17820
aaatgaagcc ttgttatggt tcttttgcca agcctactaa taaagaagga ggtcaggcaa 17880
atgtgaaaac aggaacaggc actactaaag aatatgacat agacatggct ttctttgaca 17940
acagaagtgc ggctgctgct ggcctagctc cagaaattgt tttgtatact gaaaatgtgg 18000
atttggaaac tccagatacc catattgtat acaaagcagg cacagatgac agcagctctt 18060
ctattaattt gggtcagcaa gccatgccca acagacctaa ctacattggt ttcagagaca 18120
actttatcgg gctcatgtac tacaacagca ctggcaatat gggggtgctg gccggtcagg 18180
cttctcagct gaatgctgtg gttgacttgc aagacagaaa caccgagctg tcctaccagc 18240
tcttgcttga ctctctgggt gacagaaccc ggtatttcag tatgtggaat caggcggtgg 18300
acagctatga tcctgatgtg cgcattattg aaaatcatgg tgtggaggat gaacttccca 18360
actattgttt ccctctggat gctgttggca gaacagatac ttatcaggga attaaggcta 18420
atggaactga tcaaaccaca tggaccaaag atgacagtgt caatgatgct aatgagatag 18480
gcaagggtaa tccattcgcc atggaaatca acatccaagc caacctgtgg aggaacttcc 18540
tctacgccaa cgtggccctg tacctgcccg actcttacaa gtacacgccg gccaatgtta 18600
ccctgcccac caacaccaac acctacgatt acatgaacgg ccgggtggtg gcgccctcgc 18660
tggtggactc ctacatcaac atcggggcgc gctggtcgct ggatcccatg gacaacgtga 18720
accccttcaa ccaccaccgc aatgcggggc tgcgctaccg ctccatgctc ctgggcaacg 18780
ggcgctacgt gcccttccac atccaggtgc cccagaaatt tttcgccatc aagagcctcc 18840
tgctcctgcc cgggtcctac acctacgagt ggaacttccg caaggacgtc aacatgatcc 18900
tgcagagctc cctcggcaac gacctgcgca cggacggggc ctccatctcc ttcaccagca 18960
tcaacctcta cgccaccttc ttccccatgg cgcacaacac ggcctccacg ctcgaggcca 19020
tgctgcgcaa cgacaccaac gaccagtcct tcaacgacta cctctcggcg gccaacatgc 19080
tctaccccat cccggccaac gccaccaacg tgcccatctc catcccctcg cgcaactggg 19140
ccgccttccg cggctggtcc ttcacgcgtc tcaagaccaa ggagacgccc tcgctgggct 19200
ccgggttcga cccctacttc gtctactcgg gctccatccc ctacctcgac ggcaccttct 19260
acctcaacca caccttcaag aaggtctcca tcaccttcga ctcctccgtc agctggcccg 19320
gcaacgaccg gctcctgacg cccaacgagt tcgaaatcaa gcgcaccgtc gacggcgagg 19380
gctacaacgt ggcccagtgc aacatgacca aggactggtt cctggtccag atgctggccc 19440
actacaacat cggctaccag ggcttctacg tgcccgaggg ctacaaggac cgcatgtact 19500
ccttcttccg caacttccag cccatgagcc gccaggtggt ggacgaggtc aactacaagg 19560
actaccaggc cgtcaccctg gcctaccagc acaacaactc gggcttcgtc ggctacctcg 19620
cgcccaccat gcgccagggc cagccctacc ccgccaacta cccctacccg ctcatcggca 19680
agagcgccgt caccagcgtc acccagaaaa agttcctctg cgacagggtc atgtggcgca 19740
tccccttctc cagcaacttc atgtccatgg gcgcgctcac cgacctcggc cagaacatgc 19800
tctatgccaa ctccgcccac gcgctagaca tgaatttcga agtcgacccc atggatgagt 19860
ccacccttct ctatgttgtc ttcgaagtct tcgacgtcgt ccgagtgcac cagccccacc 19920
gcggcgtcat cgaggccgtc tacctgcgca cccccttctc ggccggtaac gccaccacct 19980
aagctcttgc ttcttgcaag ccatggccgc gggctccggc gagcaggagc tcagggccat 20040
catccgcgac ctgggctgcg ggccctactt cctgggcacc ttcgataagc gcttcccggg 20100
attcatggcc ccgcacaagc tggcctgcgc catcgtcaac acggccggcc gcgagaccgg 20160
gggcgagcac tggctggcct tcgcctggaa cccgcgctcg aacacctgct acctcttcga 20220
ccccttcggg ttctcggacg agcgcctcaa gcagatctac cagttcgagt acgagggcct 20280
gctgcgccgc agcgccctgg ccaccgagga ccgctgcgtc accctggaaa agtccaccca 20340
gaccgtgcag ggtccgcgct cggccgcctg cgggctcttc tgctgcatgt tcctgcacgc 20400
cttcgtgcac tggcccgacc gccccatgga caagaacccc accatgaact tgctgacggg 20460
ggtgcccaac ggcatgctcc agtcgcccca ggtggaaccc accctgcgcc gcaaccagga 20520
ggcgctctac cgcttcctca actcccactc cgcctacttt cgctcccacc gcgcgcgcat 20580
cgagaaggcc accgccttcg accgcatgaa tcaagacatg taaaccgtgt gtgtatgtta 20640
aatgtcttta ataaacagca ctttcatgtt acacatgcat ctgagatgat ttatttagaa 20700
atcgaaaggg ttctgccggg tctcggcatg gcccgcgggc agggacacgt tgcggaactg 20760
gtacttggcc agccacttga actcggggat cagcagtttg ggcagcgggg tgtcggggaa 20820
ggagtcggtc cacagcttcc gcgtcagttg cagggcgccc agcaggtcgg gcgcggagat 20880
cttgaaatcg cagttgggac ccgcgttctg cgcgcgggag ttgcggtaca cggggttgca 20940
gcactggaac accatcaggg ccgggtgctt cacgctcgcc agcaccgtcg cgtcggtgat 21000
gctctccacg tcgaggtcct cggcgttggc catcccgaag ggggtcatct tgcaggtctg 21060
ccttcccatg gtgggcacgc acccgggctt gtggttgcaa tcgcagtgca gggggatcag 21120
catcatctgg gcctggtcgg cgttcatccc cgggtacatg gccttcatga aagcctccaa 21180
ttgcctgaac gcctgctggg ccttggctcc ctcggtgaag aagaccccgc aggacttgct 21240
agagaactgg ttggtggcgc acccggcgtc gtgcacgcag cagcgcgcgt cgttgttggc 21300
cagctgcacc acgctgcgcc cccagcggtt ctgggtgatc ttggcccggt cggggttctc 21360
cttcagcgcg cgctgcccgt tctcgctcgc cacatccatc tcgatcatgt gctccttctg 21420
gatcatggtg gtcccgtgca ggcaccgcag cttgccctcg gcctcggtgc acccgtgcag 21480
ccacagcgcg cacccggtgc actcccagtt cttgtgggcg atctgggaat gcgcgtgcac 21540
gaagccctgc aggaagcggc ccatcatggt ggtcagggtc ttgttgctag tgaaggtcag 21600
cggaatgccg cggtgctcct cgttgatgta caggtggcag atgcggcggt acacctcgcc 21660
ctgctcgggc atcagctgga agttggcttt caggtcggtc tccacgcggt agcggtccat 21720
cagcatagtc atgatttcca tacccttctc ccaggccgag acgatgggca ggctcatagg 21780
gttcttcacc atcatcttag cgctagcagc cgcggccagg gggtcgctct cgtccagggt 21840
ctcaaagctc cgcttgccgt ccttctcggt gatccgcacc ggggggtagc tgaagcccac 21900
ggccgccagc tcctcctcgg cctgtctttc gtcctcgctg tcctggctga cgtcctgcag 21960
gaccacatgc ttggtcttgc ggggtttctt cttgggcggc agcggcggcg gagatgttgg 22020
agatggcgag ggggagcgcg agttctcgct caccactact atctcttcct cttcttggtc 22080
cgaggccacg cggcggtagg tatgtctctt cgggggcaga ggcggaggcg acgggctctc 22140
gccgccgcga cttggcggat ggctggcaga gccccttccg cgttcggggg tgcgctcccg 22200
gcggcgctct gactgacttc ctccgcggcc ggccattgtg ttctcctagg gaggaacaac 22260
aagcatggag actcagccat cgccaacctc gccatctgcc cccaccgccg acgagaagca 22320
gcagcagcag aatgaaagct taaccgcccc gccgcccagc cccgccacct ccgacgcggc 22380
cgtcccagac atgcaagaga tggaggaatc catcgagatt gacctgggct atgtgacgcc 22440
cgcggagcac gaggaggagc tggcagtgcg cttttcacaa gaagagatac accaagaaca 22500
gccagagcag gaagcagaga atgagcagag tcaggctggg ctcgagcatg acggcgacta 22560
cctccacctg agcggggggg aggacgcgct catcaagcat ctggcccggc aggccaccat 22620
cgtcaaggat gcgctgctcg accgcaccga ggtgcccctc agcgtggagg agctcagccg 22680
cgcctacgag ttgaacctct tctcgccgcg cgtgcccccc aagcgccagc ccaatggcac 22740
ctgcgagccc aacccgcgcc tcaacttcta cccggtcttc gcggtgcccg aggccctggc 22800
cacctaccac atctttttca agaaccaaaa gatccccgtc tcctgccgcg ccaaccgcac 22860
ccgcgccgac gcccttttca acctgggtcc cggcgcccgc ctacctgata tcgcctcctt 22920
ggaagaggtt cccaagatct tcgagggtct gggcagcgac gagactcggg ccgcgaacgc 22980
tctgcaagga gaaggaggag agcatgagca ccacagcgcc ctggtcgagt tggaaggcga 23040
caacgcgcgg ctggcggtgc tcaaacgcac ggtcgagctg acccatttcg cctacccggc 23100
tctgaacctg ccccccaaag tcatgagcgc ggtcatggac caggtgctca tcaagcgcgc 23160
gtcgcccatc tccgaggacg agggcatgca agactccgag gagggcaagc ccgtggtcag 23220
cgacgagcag ctggcccggt ggctgggtcc taatgctagt ccccagagtt tggaagagcg 23280
gcgcaaactc atgatggccg tggtcctggt gaccgtggag ctggagtgcc tgcgccgctt 23340
cttcgccgac gcggagaccc tgcgcaaggt cgaggagaac ctgcactacc tcttcaggca 23400
cgggttcgtg cgccaggcct gcaagatctc caacgtggag ctgaccaacc tggtctccta 23460
catgggcatc ttgcacgaga accgcctggg gcagaacgtg ctgcacacca ccctgcgcgg 23520
ggaggcccgg cgcgactaca tccgcgactg cgtctacctc tacctctgcc acacctggca 23580
gacgggcatg ggcgtgtggc agcagtgtct ggaggagcag aacctgaaag agctctgcaa 23640
gctcctgcag aagaacctca agggtctgtg gaccgggttc gacgagcgca ccaccgcctc 23700
ggacctggcc gacctcattt tccccgagcg cctcaggctg acgctgcgca acggcctgcc 23760
cgactttatg agccaaagca tgttgcaaaa ctttcgctct ttcatcctcg aacgctccgg 23820
aatcctgccc gccacctgct ccgcgctgcc ctcggacttc gtgccgctga ccttccgcga 23880
gtgccccccg ccgctgtgga gccactgcta cctgctgcgc ctggccaact acctggccta 23940
ccactcggac gtgatcgagg acgtcagcgg cgagggcctg ctcgagtgcc actgccgctg 24000
caacctctgc acgccgcacc gctccctggc ctgcaacccc cagctgctga gcgagaccca 24060
gatcatcggc accttcgagt tgcaagggcc cagcgaaggc gagggttcag ccgccaaggg 24120
gggtctgaaa ctcaccccgg ggctgtggac ctcggcctac ttgcgcaagt tcgtgcccga 24180
ggactaccat cccttcgaga tcaggttcta cgaggaccaa tcccatccgc ccaaggccga 24240
gctgtcggcc tgcgtcatca cccagggggc gatcctggcc caattgcaag ccatccagaa 24300
atcccgccaa gaattcttgc tgaaaaaggg ccgcggggtc tacctcgacc cccagaccgg 24360
tgaggagctc aaccccggct tcccccagga tgccccgagg aaacaagaag ctgaaagtgg 24420
agctgccgcc cgtggaggat ttggaggaag actgggagaa cagcagtcag gcagaggagg 24480
aggagatgga ggaagactgg gacagcactc aggcagagga ggacagcctg caagacagtc 24540
tggaggaaga cgaggaggag gcagaggagg aggtggaaga agcagccgcc gccagaccgt 24600
cgtcctcggc gggggagaaa gcaagcagca cggataccat ctccgctccg ggtcggggtc 24660
ccgctcgacc acacagtaga tgggacgaga ccggacgatt cccgaacccc accacccaga 24720
ccggtaagaa ggagcggcag ggatacaagt cctggcgggg gcacaaaaac gccatcgtct 24780
cctgcttgca ggcctgcggg ggcaacatct ccttcacccg gcgctacctg ctcttccacc 24840
gcggggtgaa ctttccccgc aacatcttgc attactaccg tcacctccac agcccctact 24900
acttccaaga agaggcagca gcagcagaaa aagaccagca gaaaaccagc agctagaaaa 24960
tccacagcgg cggcagcagg tggactgagg atcgcggcga acgagccggc gcaaacccgg 25020
gagctgagga accggatctt tcccaccctc tatgccatct tccagcagag tcgggggcag 25080
gagcaggaac tgaaagtcaa gaaccgttct ctgcgctcgc tcacccgcag ttgtctgtat 25140
cacaagagcg aagaccaact tcagcgcact ctcgaggacg ccgaggctct cttcaacaag 25200
tactgcgcgc tcactcttaa agagtagccc gcgcccgccc agtcgcagaa aaaggcggga 25260
attacgtcac ctgtgccctt cgccctagcc gcctccaccc atcatcatga gcaaagagat 25320
tcccacgcct tacatgtgga gctaccagcc ccagatgggc ctggccgccg gtgccgccca 25380
ggactactcc acccgcatga attggctcag cgccgggccc gcgatgatct cacgggtgaa 25440
tgacatccgc gcccaccgaa accagatact cctagaacag tcagcgctca ccgccacgcc 25500
ccgcaatcac ctcaatccgc gtaattggcc cgccgccctg gtgtaccagg aaattcccca 25560
gcccacgacc gtactacttc cgcgagacgc ccaggccgaa gtccagctga ctaactcagg 25620
tgtccagctg gcgggcggcg ccaccctgtg tcgtcaccgc cccgctcagg gtataaagcg 25680
gctggtgatc cggggcagag gcacacagct caacgacgag gtggtgagct cttcgctggg 25740
tctgcgacct gacggagtct tccaactcgc cggatcgggg agatcttcct tcacgcctcg 25800
tcaggccgtc ctgactttgg agagttcgtc ctcgcagccc cgctcgggtg gcatcggcac 25860
tctccagttc gtggaggagt tcactccctc ggtctacttc aaccccttct ccggctcccc 25920
cggccactac ccggacgagt tcatcccgaa cttcgacgcc atcagcgagt cggtggacgg 25980
ctacgattga atgtcccatg gtggcgcagc tgacctagct cggcttcgac acctggacca 26040
ctgccgccgc ttccgctgct tcgctcggga tctcgccgag tttgcctact ttgagctgcc 26100
cgaggagcac cctcagggcc cggcccacgg agtgcggatc gtcgtcgaag ggggcctcga 26160
ctcccacctg cttcggatct tcagccagcg tccgatcctg gtcgagcgcg agcaaggaca 26220
gacccttctg actctgtact gcatctgcaa ccaccccggc ctgcatgaaa gtctttgttg 26280
tctgctgtgt actgagtata ataaaagctg agatcagcga ctactccgga cttccgtgtg 26340
ttcctgaatc catcaaccag tctttgttct tcaccgggaa cgagaccgag ctccagctcc 26400
agtgtaagcc ccacaagaag tacctcacct ggctgttcca gggctccccg atcgccgttg 26460
tcaaccactg cgacaacgac ggagtcctgc tgagcggccc tgccaacctt actttttcca 26520
cccgcagaag caagctccag ctcttccaac ccttcctccc cgggacctat cagtgcgtct 26580
cgggaccctg ccatcacacc ttccacctga tcccgaatac cacagcgtcg ctccccgcta 26640
ctaacaacca aactaacctc caccaacgcc accgtcgcga cggccacaat acatgcccat 26700
attagactat gaggccgagc cacagcgacc catgctcccc gctattagtt acttcaatct 26760
aaccggcgga gatgactgac ccactggcca acaacaacgt caacgacctt ctcctggaca 26820
tggacggccg cgcctcggag cagcgactcg cccaacttcg cattcgccag cagcaggaga 26880
gagccgtcaa ggagctgcag gatgcggtgg ccatccacca gtgcaagaga ggcatcttct 26940
gcctggtgaa acaggccaag atctcctacg aggtcactcc aaacgaccat cgcctctcct 27000
acgagctcct gcagcagcgc cagaagttca cctgcctggt cggagtcaac cccatcgtca 27060
tcacccagca gtctggcgat accaaggggt gcatccactg ctcctgcgac tcccccgact 27120
gcgtccacac tctgatcaag accctctgcg gcctccgcga cctcctcccc atgaactaat 27180
caccccctta tccagtgaaa taaagatcat attgatgatg attttacaga aataaaaaat 27240
aatcatttga tttgaaataa agatacaatc atattgatga tttgagttta acaaaaaaat 27300
aaagaatcac ttacttgaaa tctgatacca ggtctctgtc catgttttct gccaacacca 27360
cttcactccc ctcttcccag ctctggtact gcaggccccg gcgggctgca aacttcctcc 27420
acacgctgaa ggggatgtca aattcctcct gtccctcaat cttcatttta tcttctatca 27480
gatgtccaaa aagcgcgtcc gggtggatga tgacttcgac cccgtctacc cctacgatgc 27540
agacaacgca ccgaccgtgc ccttcatcaa cccccccttc gtctcttcag atggattcca 27600
agagaagccc ctgggggtgt tgtccctgcg actggccgac cccgtcacca ccaagaacgg 27660
ggaaatcacc ctcaagctgg gagagggggt ggacctcgat tcctcgggaa aactcatctc 27720
caacacggcc accaaggccg ccgcccctct cagtttttcc aacaacacca tttcccttaa 27780
catggatcac cccttttaca ctaaagatgg aaaattatcc ttacaagttt ctccaccatt 27840
aaatatactg agaacaagca ttctaaacac actagcttta ggttttggat caggtttagg 27900
actccgtggc tctgccttgg cagtacagtt agtctctcca cttacatttg atactgatgg 27960
aaacataaag cttaccttag acagaggttt gcatgttaca acaggagatg caattgaaag 28020
caacataagc tgggctaaag gtttaaaatt tgaagatgga gccatagcaa ccaacattgg 28080
aaatgggtta gagtttggaa gcagtagtac agaaacaggt gttgatgatg cttacccaat 28140
ccaagttaaa cttggatctg gccttagctt tgacagtaca ggagccataa tggctggtaa 28200
caaagaagac gataaactca ctttgtggac aacacctgat ccatcaccaa actgtcaaat 28260
actcgcagaa aatgatgcaa aactaacact ttgcttgact aaatgtggta gtcaaatact 28320
ggccactgtg tcagtcttag ttgtaggaag tggaaaccta aaccccatta ctggcaccgt 28380
aagcagtgct caggtgtttc tacgttttga tgcaaacggt gttcttttaa cagaacattc 28440
tacactaaaa aaatactggg ggtataggca gggagatagc atagatggca ctccatatac 28500
caatgctgta ggattcatgc ccaatttaaa agcttatcca aagtcacaaa gttctactac 28560
taaaaataat atagtagggc aagtatacat gaatggagat gtttcaaaac ctatgcttct 28620
cactataacc ctcaatggta ctgatgacag caacagtaca tattcaatgt cattttcata 28680
cacctggact aatggaagct atgttggagc aacatttggg gctaactctt ataccttctc 28740
atacatcgcc caagaatgaa cactgtatcc caccctgcat gccaaccctt cccaccccac 28800
tctgtggaac aaactctgaa acacaaaata aaataaagtt caagtgtttt attgattcaa 28860
cagttttaca ggattcgagc agttattttt cctccaccct cccaggacat ggaatacacc 28920
accctctccc cccgcacagc cttgaacatc tgaatgccat tggtgatgga catgcttttg 28980
gtctccacgt tccacacagt ttcagagcga gccagtctcg ggtcggtcag ggagatgaaa 29040
ccctccgggc actcccgcat ctgcacctca cagctcaaca gctgaggatt gtcctcggtg 29100
gtcgggatca cggttatctg gaagaagcag aagagcggcg gtgggaatca tagtccgcga 29160
acgggatcgg ccggtggtgt cgcatcaggc cccgcagcag tcgctgccgc cgccgctccg 29220
tcaagctgct gctcaggggg tccgggtcca gggactccct cagcatgatg cccacggccc 29280
tcagcatcag tcgtctggtg cggcgggcgc agcagcgcat gcggatctcg ctcaggtcgc 29340
tgcagtacgt gcaacacaga accaccaggt tgttcaacag tccatagttc aacacgctcc 29400
agccgaaact catcgcggga aggatgctac ccacgtggcc gtcgtaccag atcctcaggt 29460
aaatcaagtg gtgccccctc cagaacacgc tgcccacgta catgatctcc ttgggcatgt 29520
ggcggttcac cacctcccgg taccacatca ccctctggtt gaacatgcag ccccggatga 29580
tcctgcggaa ccacagggcc agcaccgccc cgcccgccat gcagcgaaga gaccccgggt 29640
cccggcaatg gcaatggagg acccaccgct cgtacccgtg gatcatctgg gagctgaaca 29700
agtctatgtt ggcacagcac aggcatatgc tcatgcatct cttcagcact ctcaactcct 29760
cgggggtcaa aaccatatcc cagggcacgg ggaactcttg caggacagcg aaccccgcag 29820
aacagggcaa tcctcgcaca gaacttacat tgtgcatgga cagggtatcg caatcaggca 29880
gcaccgggtg atcctccacc agagaagcgc gggtctcggt ctcctcacag cgtggtaagg 29940
gggccggccg atacgggtga tggcgggacg cggctgatcg tgttcgcgac cgtgtcatga 30000
tgcagttgct ttcggacatt ttcgtacttg ctgtagcaga acctggtccg ggcgctgcac 30060
accgatcgcc ggcggcggtc tcggcgcttg gaacgctcgg tgttgaaatt gtaaaacagc 30120
cactctctca gaccgtgcag cagatctagg gcctcaggag tgatgaagat cccatcatgc 30180
ctgatggctc tgatcacatc gaccaccgtg gaatgggcca gacccagcca gatgatgcaa 30240
ttttgttggg tttcggtgac ggcgggggag ggaagaacag gaagaaccat gattaacttt 30300
taatccaaac ggtctcggag tacttcaaaa tgaagatcgc ggagatggca cctctcgccc 30360
ccgctgtgtt ggtggaaaat aacagccagg tcaaaggtga tacggttctc gagatgttcc 30420
acggtggctt ccagcaaagc ctccacgcgc acatccagaa acaagacaat agcgaaagcg 30480
ggagggttct ctaattcctc aatcatcatg ttacactcct gcaccatccc cagataattt 30540
tcatttttcc agccttgaat gattcgaact agttcgtgag gtaaatccaa gccagccatg 30600
ataaagagct cgcgcagagc gccctccacc ggcattctta agcacaccct cataattcca 30660
agatattctg ctcctggttc acctgcagca gattgacaag cggaatatca aaatctctgc 30720
cgcgatccct gagctcctcc ctcagcaata actgtaagta ctctttcata tcctctccga 30780
aatttttagc cataggacca ccaggaataa gattagggca agccacagta cagataaacc 30840
gaagtcctcc ccagtgagca ttgccaaatg caagactgct ataagcatgc tggctagacc 30900
cggtgatatc ttccagataa ctggacagaa aatcgcccag gcaattttta agaaaatcaa 30960
caaaagaaaa atcctccagg tggacgttta gagcctcggg aacaacgatg aagtaaatgc 31020
aagcggtgcg ttccagcatg gttagttagc tgatctgtag aaaaaacaaa aatgaacatt 31080
aaaccatgct agcctggcga acaggtgggt aaatcgttct ctccagcacc aggcaggcca 31140
cggggtctcc ggcgcgaccc tcgtaaaaat tgtcgctatg attgaaaacc atcacagaga 31200
gacgttcccg gtggccggcg tgaatgattc gacaagatga atacaccccc ggaacattgg 31260
cgtccgcgag tgaaaaaaag cgcccgagga agcaataagg cactacaatg ctcagtctca 31320
agtccagcaa agcgatgcca tgcggatgaa gcacaaaatt ctcaggtgcg tacaaaatgt 31380
aattactccc ctcctgcaca ggcagcaaag cccccgatcc ctccaggtac acatacaaag 31440
cctcagcgtc catagcttac cgagcagcag cacacaacag gcgcaagagt cagagaaagg 31500
ctgagctcta acctgtccac ccgctctctg ctcaatatat agcccagatc tacactgacg 31560
taaaggccaa agtctaaaaa tacccgccaa ataatcacac acgcccagca cacgcccaga 31620
aaccggtgac acactcaaaa aaatacgcgc acttcctcaa acgcccaaaa ctgccgtcat 31680
ttccgggttc ccacgctacg tcatcaaaac acgactttca aattccgtcg accgttaaaa 31740
acgtcacccg ccccgcccct aacggtcgcc cgtctctcag ccaatcagcg ccccgcatcc 31800
ccaaattcaa acacctcatt tgcatattaa cgcgcacaaa aagtttgagg tatattattg 31860
atgatgg 31867
<210> 12
<211> 32788
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 12
ccatcttcaa taatatacct caaacttttt gtgcgcgtta atatgcaaat gaggcgtttg 60
aatttgggga ggaagggcgg tgattggtcg agggatgagc gaccgttagg ggcggggcga 120
gtgacgtttt gatgacgtgg ttgcgaggag gagccagttt gcaagttctc gtgggaaaag 180
tgacgtcaaa cgaggtgtgg tttgaacacg gaaatactca attttcccgc gctctctgac 240
aggaaatgag gtgtttctgg gcggatgcaa gtgaaaacgg gccattttcg cgcgaaaact 300
gaatgaggaa gtgaaaatct gagtaatttc gcgtttatgg cagggaggag tatttgccga 360
gggccgagta gactttgacc gattacgtgg gggtttcgat taccgtgttt ttcacctaaa 420
tttccgcgta cggtgtcaaa gtccggtgtt tttacgtagg tgtcagctga tcgccagggt 480
atttaaacct gcgctctcca gtcaagaggc cactcttgag tgccagcgag aagagttttc 540
tcctccgcgc cgcgagtcag atctacactt tgaaagtagg gataacaggg taatgacatt 600
gattattgac tagttgttaa tagtaatcaa ttacggggtc attagttcat agcccatata 660
tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 720
cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 780
attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 840
atcatatgcc aagtccgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 900
atgcccagta catgacctta cgggactttc ctacttggca gtacatctac gtattagtca 960
tcgctattac catggtgatg cggttttggc agtacaccaa tgggcgtgga tagcggtttg 1020
actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 1080
aaaatcaacg ggactttcca aaatgtcgta ataaccccgc cccgttgacg caaatgggcg 1140
gtaggcgtgt acggtgggag gtctatataa gcagagctcg tttagtgaac cgtcagatcg 1200
cctggaacgc catccacgct gttttgacct ccatagaaga cagcgatcgc gccaccatgg 1260
ccgggatgtt ccaggcactg tccgaaggct gcacacccta tgatattaac cagatgctga 1320
atgtcctggg agaccaccag gtctctggcc tggagcagct ggagagcatc atcaacttcg 1380
agaagctgac cgagtggaca agctccaatg tgatgcctat cctgtcccca ctgaccaagg 1440
gcatcctggg cttcgtgttt accctgacag tgccttctga gcggggcctg tcttgcatca 1500
gcgaggcaga cgcaaccaca ccagagtccg ccaatctggg cgaggagatc ctgtctcagc 1560
tgtacctgtg gccccgggtg acatatcact ccccttctta cgcctatcac cagttcgagc 1620
ggagagccaa gtacaagaga cacttcccag gctttggcca gtctctgctg ttcggctacc 1680
ccgtgtacgt gttcggcgat tgcgtgcagg gcgactggga tgccatccgg tttagatact 1740
gcgcaccacc tggatatgca ctgctgaggt gtaacgacac caattattcc gccctgctgg 1800
cagtgggcgc cctggagggc cctcgcaatc aggattggct gggcgtgcca aggcagctgg 1860
tgacacgcat gcaggccatc cagaacgcag gcctgtgcac cctggtggca atgctggagg 1920
agacaatctt ctggctgcag gcctttctga tggccctgac cgacagcggc cccaagacaa 1980
acatcatcgt ggattcccag tacgtgatgg gcatctccaa gccttctttc caggagtttg 2040
tggactggga gaacgtgagc ccagagctga attccaccga tcagccattc tggcaggcag 2100
gaatcctggc aaggaacctg gtgcctatgg tggccacagt gcagggccag aatctgaagt 2160
accagggcca gagcctggtc atcagcgcct ccatcatcgt gtttaacctg ctggagctgg 2220
agggcgacta tcgggacgat ggcaacgtgt gggtgcacac cccactgagc cccagaacac 2280
tgaacgcctg ggtgaaggcc gtggaggaga agaagggcat cccagtgcac ctggagctgg 2340
cctccatgac caatatggag ctgatgtcta gcatcgtgca ccagcaggtg aggacatacg 2400
gacccgtgtt catgtgcctg ggaggcctgc tgaccatggt ggcaggagcc gtgtggctga 2460
cagtgcgggt gctggagctg ttcagagccg cccagctggc caacgatgtg gtgctgcaga 2520
tcatggagct gtgcggagca gcctttcgcc aggtgtgcca caccacagtg ccatggccca 2580
atgcctccct gacccccaag tggaacaatg agacaacaca gcctcagatc gccaactgta 2640
gcgtgtacga cttcttcgtg tggctgcact actatagcgt gagggatacc ctgtggcccc 2700
gcgtgacata ccacatgaat aagtacgcct atcacatgct ggagaggcgc gccaagtata 2760
agagaggccc tggcccaggc gcaaagtttg tggcagcatg gaccctgaag gccgccgccg 2820
gccccggccc cggccagtat atcaaggcta acagtaagtt cattggaatc acagagctgg 2880
gacccggacc tggataatga gtttaaactc ccatttaaat gtgagggtta atgcttcgag 2940
cagacatgat aagatacatt gatgagtttg gacaaaccac aactagaatg cagtgaaaaa 3000
aatgctttat ttgtgaaatt tgtgatgcta ttgctttatt tgtaaccatt ataagctgca 3060
ataaacaagt taacaacaac aattgcattc attttatgtt tcaggttcag ggggagatgt 3120
gggaggtttt ttaaagcaag taaaacctct acaaatgtgg taaaataact ataacggtcc 3180
taaggtagcg agtgagtagt gttctggggc gggggaggac ctgcatgagg gccagaataa 3240
ctgaaatctg tgcttttctg tgtgttgcag cagcatgagc ggaagcggct cctttgaggg 3300
aggggtattc agcccttatc tgacggggcg tctcccctcc tgggcgggag tgcgtcagaa 3360
tgtgatggga tccacggtgg acggccggcc cgtgcagccc gcgaactctt caaccctgac 3420
ctatgcaacc ctgagctctt cgtcgttgga cgcagctgcc gccgcagctg ctgcatctgc 3480
cgccagcgcc gtgcgcggaa tggccatggg cgccggctac tacggcactc tggtggccaa 3540
ctcgagttcc accaataatc ccgccagcct gaacgaggag aagctgttgc tgctgatggc 3600
ccagctcgag gccttgaccc agcgcctggg cgagctgacc cagcaggtgg ctcagctgca 3660
ggagcagacg cgggccgcgg ttgccacggt gaaatccaaa taaaaaatga atcaataaat 3720
aaacggagac ggttgttgat tttaacacag agtctgaatc tttatttgat ttttcgcgcg 3780
cggtaggccc tggaccaccg gtctcgatca ttgagcaccc ggtggatctt ttccaggacc 3840
cggtagaggt gggcttggat gttgaggtac atgggcatga gcccgtcccg ggggtggagg 3900
tagctccatt gcagggcctc gtgctcgggg gtggtgttgt aaatcaccca gtcatagcag 3960
gggcgcaggg catggtgttg cacaatatct ttgaggagga gactgatggc cacgggcagc 4020
cctttggtgt aggtgtttac aaatctgttg agctgggagg gatgcatgcg gggggagatg 4080
aggtgcatct tggcctggat cttgagattg gcgatgttac cgcccagatc ccgcctgggg 4140
ttcatgttgt gcaggaccac cagcacggtg tatccggtgc acttggggaa tttatcatgc 4200
aacttggaag ggaaggcgtg aaagaatttg gcgacgcctt tgtgcccgcc caggttttcc 4260
atgcactcat ccatgatgat ggcgatgggc ccgtgggcgg cggcctgggc aaagacgttt 4320
cgggggtcgg acacatcata gttgtggtcc tgggtgaggt catcataggc cattttaatg 4380
aatttggggc ggagggtgcc ggactggggg acaaaggtac cctcgatccc gggggcgtag 4440
ttcccctcac agatctgcat ctcccaggct ttgagctcgg agggggggat catgtccacc 4500
tgcggggcga taaagaacac ggtttccggg gcgggggaga tgagctgggc cgaaagcaag 4560
ttccggagca gctgggactt gccgcagccg gtggggccgt agatgacccc gatgaccggc 4620
tgcaggtggt agttgaggga gagacagctg ccgtcctccc ggaggagggg ggccacctcg 4680
ttcatcatct cgcgcacgtg catgttctcg cgcaccagtt ccgccaggag gcgctctccc 4740
cccagggata ggagctcctg gagcgaggcg aagtttttca gcggcttgag tccgtcggcc 4800
atgggcattt tggagagggt ttgttgcaag agttccaggc ggtcccagag ctcggtgatg 4860
tgctctacgg catctcgatc cagcagacct cctcgtttcg cgggttggga cggctgcggg 4920
agtagggcac cagacgatgg gcgtccagcg cagccagggt ccggtccttc cagggtcgca 4980
gcgtccgcgt cagggtggtc tccgtcacgg tgaaggggtg cgcgccgggc tgggcgcttg 5040
cgagggtgcg cttcaggctc atccggctgg tcgaaaaccg ctcccgatcg gcgccctgcg 5100
cgtcggccag gtagcaattg accatgagtt cgtagttgag cgcctcggcc gcgtggcctt 5160
tggcgcggag cttacctttg gaagtctgcc cgcaggcggg acagaggagg gacttgaggg 5220
cgtagagctt gggggcgagg aagacggact cgggggcgta ggcgtccgcg ccgcagtggg 5280
cgcagacggt ctcgcactcc acgagccagg tgaggtcggg ctggtcgggg tcaaaaacca 5340
gtttcccgcc gttctttttg atgcgtttct tacctttggt ctccatgagc tcgtgtcccc 5400
gctgggtgac aaagaggctg tccgtgtccc cgtagaccga ctttatgggc cggtcctcga 5460
gcggtgtgcc gcggtcctcc tcgtagagga accccgccca ctccgagacg aaagcccggg 5520
tccaggccag cacgaaggag gccacgtggg acgggtagcg gtcgttgtcc accagcgggt 5580
ccaccttttc cagggtatgc aaacacatgt ccccctcgtc cacatccagg aaggtgattg 5640
gcttgtaagt gtaggccacg tgaccggggg tcccggccgg gggggtataa aagggtgcgg 5700
gtccctgctc gtcctcactg tcttccggat cgctgtccag gagcgccagc tgttggggta 5760
ggtattccct ctcgaaggcg ggcatgacct cggcactcag gttgtcagtt tctagaaacg 5820
aggaggattt gatattgacg gtgccggcgg agatgccttt caagagcccc tcgtccatct 5880
ggtcagaaaa gacgatcttt ttgttgtcga gcttggtggc gaaggagccg tagagggcgt 5940
tggagaggag cttggcgatg gagcgcatgg tctggttttt ttccttgtcg gcgcgctcct 6000
tggcggcgat gttgagctgc acgtactcgc gcgccacgca cttccattcg gggaagacgg 6060
tggtcagctc gtcgggcacg attctgacct gccagccccg attatgcagg gtgatgaggt 6120
ccacactggt ggccacctcg ccgcgcaggg gctcattagt ccagcagagg cgtccgccct 6180
tgcgcgagca gaaggggggc agggggtcca gcatgacctc gtcggggggg tcggcatcga 6240
tggtgaagat gccgggcagg aggtcggggt caaagtagct gatggaagtg gccagatcgt 6300
ccagggcagc ttgccattcg cgcacggcca gcgcgctctc gtagggactg aggggcgtgc 6360
cccagggcat gggatgggta agcgcggagg cgtacatgcc gcagatgtcg tagacgtaga 6420
ggggctcctc gaggatgccg atgtaggtgg ggtagcagcg ccccccgcgg atgctggcgc 6480
gcacgtagtc atacagctcg tgcgaggggg cgaggagccc cgggcccagg ttggtgcgac 6540
tgggcttttc ggcgcggtag acgatctggc ggaaaatggc atgcgagttg gaggagatgg 6600
tgggcctttg gaagatgttg aagtgggcgt ggggcagtcc gaccgagtcg cggatgaagt 6660
gggcgtagga gtcttgcagc ttggcgacga gctcggcggt gactaggacg tccagagcgc 6720
agtagtcgag ggtctcctgg atgatgtcat acttgagctg tcccttttgt ttccacagct 6780
cgcggttgag aaggaactct tcgcggtcct tccagtactc ttcgaggggg aacccgtcct 6840
gatctgcacg gtaagagcct agcatgtaga actggttgac ggccttgtag gcgcagcagc 6900
ccttctccac ggggagggcg taggcctggg cggccttgcg cagggaggtg tgcgtgaggg 6960
cgaaagtgtc cctgaccatg accttgagga actggtgctt gaagtcgata tcgtcgcagc 7020
ccccctgctc ccagagctgg aagtccgtgc gcttcttgta ggcggggttg ggcaaagcga 7080
aagtaacatc gttgaagagg atcttgcccg cgcggggcat aaagttgcga gtgatgcgga 7140
aaggttgggg cacctcggcc cggttgttga tgacctgggc ggcgagcacg atctcgtcga 7200
agccgttgat gttgtggccc acgatgtaga gttccacgaa tcgcggacgg cccttgacgt 7260
ggggcagttt cttgagctcc tcgtaggtga gctcgtcggg gtcgctgagc ccgtgctgct 7320
cgagcgccca gtcggcgaga tgggggttgg cgcggaggaa ggaagtccag agatccacgg 7380
ccagggcggt ttgcagacgg tcccggtact gacggaactg ctgcccgacg gccatttttt 7440
cgggggtgac gcagtagaag gtgcgggggt ccccgtgcca gcgatcccat ttgagctgga 7500
gggcgagatc gagggcgagc tcgacgagcc ggtcgtcccc ggagagtttc atgaccagca 7560
tgaaggggac gagctgcttg ccgaaggacc ccatccaggt gtaggtttcc acatcgtagg 7620
tgaggaagag cctttcggtg cgaggatgcg agccgatggg gaagaactgg atctcctgcc 7680
accaattgga ggaatggctg ttgatgtgat ggaagtagaa atgccgacgg cgcgccgaac 7740
actcgtgctt gtgtttatac aagcggccac agtgctcgca acgctgcacg ggatgcacgt 7800
gctgcacgag ctgtacctga gttcctttga cgaggaattt cagtgggaag tggagtcgtg 7860
gcgcctgcat ctcgtgctgt actacgtcgt ggtggtcggc ctggccctct tctgcctcga 7920
tggtggtcat gctgacgagc ccgcgcggga ggcaggtcca gacctcggcg cgagcgggtc 7980
ggagagcgag gacgagggcg cgcaggccgg agctgtccag ggtcctgaga cgctgcggag 8040
tcaggtcagt gggcagcggc ggcgcgcggt tgacttgcag gagtttttcc agggcgcgcg 8100
ggaggtccag atggtacttg atctccaccg cgccattggt ggcgacgtcg atggcttgca 8160
gggtcccgtg cccctggggt gtgaccaccg tcccccgttt cttcttgggc ggctggggcg 8220
acgggggcgg tgcctcttcc atggttagaa gcggcggcga ggacgcgcgc cgggcggcag 8280
gggcggctcg gggcccggag gcaggggcgg caggggcacg tcggcgccgc gcgcgggtag 8340
gttctggtac tgcgcccgga gaagactggc gtgagcgacg acgcgacggt tgacgtcctg 8400
gatctgacgc ctctgggtga aggccacggg acccgtgagt ttgaacctga aagagagttc 8460
gacagaatca atctcggtat cgttgacggc ggcctgccgc aggatctctt gcacgtcgcc 8520
cgagttgtcc tggtaggcga tctcggtcat gaactgctcg atctcctcct cttgaaggtc 8580
tccgcggccg gcgcgctcca cggtggccgc gaggtcgttg gagatgcggc ccatgagctg 8640
cgagaaggcg ttcatgcccg cctcgttcca gacgcggctg tagaccacga cgccctcggg 8700
atcgcgggcg cgcatgacca cctgggcgag gttgagctcc acgtggcgcg tgaagaccgc 8760
gtagttgcag aggcgctggt agaggtagtt gagcgtggtg gcgatgtgct cggtgacgaa 8820
gaaatacatg atccagcggc ggagcggcat ctcgctgacg tcgcccagcg cctccaaacg 8880
ttccatggcc tcgtaaaagt ccacggcgaa gttgaaaaac tgggagttgc gcgccgagac 8940
ggtcaactcc tcctccagaa gacggatgag ctcggcgatg gtggcgcgca cctcgcgctc 9000
gaaggccccc gggagttcct ccacttcctc ttcttcctcc tccactaaca tctcttctac 9060
ttcctcctca ggcggcagtg gtggcggggg agggggcctg cgtcgccggc ggcgcacggg 9120
cagacggtcg atgaagcgct cgatggtctc gccgcgccgg cgtcgcatgg tctcggtgac 9180
ggcgcgcccg tcctcgcggg gccgcagcgt gaagacgccg ccgcgcatct ccaggtggcc 9240
gggggggtcc ccgttgggca gggagagggc gctgacgatg catcttatca attgccccgt 9300
agggactccg cgcaaggacc tgagcgtctc gagatccacg ggatctgaaa accgctgaac 9360
gaaggcttcg agccagtcgc agtcgcaagg taggctgagc acggtttctt ctggcgggtc 9420
atgttggttg ggagcggggc gggcgatgct gctggtgatg aagttgaaat aggcggttct 9480
gagacggcgg atggtggcga ggagcaccag gtctttgggc ccggcttgct ggatgcgcag 9540
acggtcggcc atgccccagg cgtggtcctg acacctggcc aggtccttgt agtagtcctg 9600
catgagccgc tccacgggca cctcctcctc gcccgcgcgg ccgtgcatgc gcgtgagccc 9660
gaagccgcgc tggggctgga cgagcgccag gtcggcgacg acgcgctcgg cgaggatggc 9720
ttgctggatc tgggtgaggg tggtctggaa gtcatcaaag tcgacgaagc ggtggtaggc 9780
tccggtgttg atggtgtagg agcagttggc catgacggac cagttgacgg tctggtggcc 9840
cggacgcacg agctcgtggt acttgaggcg cgagtaggcg cgcgtgtcga agatgtagtc 9900
gttgcaggtg cgcaccaggt actggtagcc gatgaggaag tgcggcggcg gctggcggta 9960
gagcggccat cgctcggtgg cgggggcgcc gggcgcgagg tcctcgagca tggtgcggtg 10020
gtagccgtag atgtacctgg acatccaggt gatgccggcg gcggtggtgg aggcgcgcgg 10080
gaactcgcgg acgcggttcc agatgttgcg cagcggcagg aagtagttca tggtgggcac 10140
ggtctggccc gtgaggcgcg cgcagtcgtg gatgctctat acgggcaaaa acgaaagcgg 10200
tcagcggctc gactccgtgg cctggaggct aagcgaacgg gttgggctgc gcgtgtaccc 10260
cggttcgaat ctcgaatcag gctggagccg cagctaacgt ggtattggca ctcccgtctc 10320
gacccaagcc tgcaccaacc ctccaggata cggaggcggg tcgttttgca actttttttt 10380
ggaggccgga tgagactagt aagcgcggaa agcggccgac cgcgatggct cgctgccgta 10440
gtctggagaa gaatcgccag ggttgcgttg cggtgtgccc cggttcgagg ccggccggat 10500
tccgcggcta acgagggcgt ggctgccccg tcgtttccaa gaccccatag ccagccgact 10560
tctccagtta cggagcgagc ccctcttttg ttttgtttgt ttttgccaga tgcatcccgt 10620
actgcggcag atgcgccccc accaccctcc accgcaacaa cagccccctc cacagccggc 10680
gcttctgccc ccgccccagc agcaacttcc agccacgacc gccgcggccg ccgtgagcgg 10740
ggctggacag agttatgatc accagctggc cttggaagag ggcgaggggc tggcgcgcct 10800
gggggcgtcg tcgccggagc ggcacccgcg cgtgcagatg aaaagggacg ctcgcgaggc 10860
ctacgtgccc aagcagaacc tgttcagaga caggagcggc gaggagcccg aggagatgcg 10920
cgcggcccgg ttccacgcgg ggcgggagct gcggcgcggc ctggaccgaa agagggtgct 10980
gagggacgag gatttcgagg cggacgagct gacggggatc agccccgcgc gcgcgcacgt 11040
ggccgcggcc aacctggtca cggcgtacga gcagaccgtg aaggaggaga gcaacttcca 11100
aaaatccttc aacaaccacg tgcgcaccct gatcgcgcgc gaggaggtga ccctgggcct 11160
gatgcacctg tgggacctgc tggaggccat cgtgcagaac cccaccagca agccgctgac 11220
ggcgcagctg ttcctggtgg tgcagcatag tcgggacaac gaagcgttca gggaggcgct 11280
gctgaatatc accgagcccg agggccgctg gctcctggac ctggtgaaca ttctgcagag 11340
catcgtggtg caggagcgcg ggctgccgct gtccgagaag ctggcggcca tcaacttctc 11400
ggtgctgagt ttgggcaagt actacgctag gaagatctac aagaccccgt acgtgcccat 11460
agacaaggag gtgaagatcg acgggtttta catgcgcatg accctgaaag tgctgaccct 11520
gagcgacgat ctgggggtgt accgcaacga caggatgcac cgtgcggtga gcgccagcag 11580
gcggcgcgag ctgagcgacc aggagctgat gcatagtctg cagcgggccc tgaccggggc 11640
cgggaccgag ggggagagct actttgacat gggcgcggac ctgcactggc agcccagccg 11700
ccgggccttg gaggcggcgg caggacccta cgtagaagag gtggacgatg aggtggacga 11760
ggagggcgag tacctggaag actgatggcg cgaccgtatt tttgctagat gcaacaacaa 11820
cagccacctc ctgatcccgc gatgcgggcg gcgctgcaga gccagccgtc cggcattaac 11880
tcctcggacg attggaccca ggccatgcaa cgcatcatgg cgctgacgac ccgcaacccc 11940
gaagccttta gacagcagcc ccaggccaac cggctctcgg ccatcctgga ggccgtggtg 12000
ccctcgcgct ccaaccccac gcacgagaag gtcctggcca tcgtgaacgc gctggtggag 12060
aacaaggcca tccgcggcga cgaggccggc ctggtgtaca acgcgctgct ggagcgcgtg 12120
gcccgctaca acagcaccaa cgtgcagacc aacctggacc gcatggtgac cgacgtgcgc 12180
gaggccgtgg cccagcgcga gcggttccac cgcgagtcca acctgggatc catggtggcg 12240
ctgaacgcct tcctcagcac ccagcccgcc aacgtgcccc ggggccagga ggactacacc 12300
aacttcatca gcgccctgcg cctgatggtg accgaggtgc cccagagcga ggtgtaccag 12360
tccgggccgg actacttctt ccagaccagt cgccagggct tgcagaccgt gaacctgagc 12420
caggctttca agaacttgca gggcctgtgg ggcgtgcagg ccccggtcgg ggaccgcgcg 12480
acggtgtcga gcctgctgac gccgaactcg cgcctgctgc tgctgctggt ggcccccttc 12540
acggacagcg gcagcatcaa ccgcaactcg tacctgggct acctgattaa cctgtaccgc 12600
gaggccatcg gccaggcgca cgtggacgag cagacctacc aggagatcac ccacgtgagc 12660
cgcgccctgg gccaggacga cccgggcaac ctggaagcca ccctgaactt tttgctgacc 12720
aaccggtcgc agaagatccc gccccagtac gcgctcagca ccgaggagga gcgcatcctg 12780
cgttacgtgc agcagagcgt gggcctgttc ctgatgcagg agggggccac ccccagcgcc 12840
gcgctcgaca tgaccgcgcg caacatggag cccagcatgt acgccagcaa ccgcccgttc 12900
atcaataaac tgatggacta cttgcatcgg gcggccgcca tgaactctga ctatttcacc 12960
aacgccatcc tgaatcccca ctggctcccg ccgccggggt tctacacggg cgagtacgac 13020
atgcccgacc ccaatgacgg gttcctgtgg gacgatgtgg acagcagcgt gttctccccc 13080
cgaccgggtg ctaacgagcg ccccttgtgg aagaaggaag gcagcgaccg acgcccgtcc 13140
tcggcgctgt ccggccgcga gggtgctgcc gcggcggtgc ccgaggccgc cagtcctttc 13200
ccgagcttgc ccttctcgct gaacagtatc cgcagcagcg agctgggcag gatcacgcgc 13260
ccgcgcttgc tgggcgaaga ggagtacttg aatgactcgc tgttgagacc cgagcgggag 13320
aagaacttcc ccaataacgg gatagaaagc ctggtggaca agatgagccg ctggaagacg 13380
tatgcgcagg agcacaggga cgatccccgg gcgtcgcagg gggccacgag ccggggcagc 13440
gccgcccgta aacgccggtg gcacgacagg cagcggggac agatgtggga cgatgaggac 13500
tccgccgacg acagcagcgt gttggacttg ggtgggagtg gtaacccgtt cgctcacctg 13560
cgcccccgta tcgggcgcat gatgtaagag aaaccgaaaa taaatgatac tcaccaaggc 13620
catggcgacc agcgtgcgtt cgtttcttct ctgttgttgt tgtatctagt atgatgaggc 13680
gtgcgtaccc ggagggtcct cctccctcgt acgagagcgt gatgcagcag gcgatggcgg 13740
cggcggcgat gcagcccccg ctggaggctc cttacgtgcc cccgcggtac ctggcgccta 13800
cggaggggcg gaacagcatt cgttactcgg agctggcacc cttgtacgat accacccggt 13860
tgtacctggt ggacaacaag tcggcggaca tcgcctcgct gaactaccag aacgaccaca 13920
gcaacttcct gaccaccgtg gtgcagaaca atgacttcac ccccacggag gccagcaccc 13980
agaccatcaa ctttgacgag cgctcgcggt ggggcggcca gctgaaaacc atcatgcaca 14040
ccaacatgcc caacgtgaac gagttcatgt acagcaacaa gttcaaggcg cgggtgatgg 14100
tctcccgcaa gacccccaat ggggtgacag tgacagagga ttatgatggt agtcaggatg 14160
agctgaagta tgaatgggtg gaatttgagc tgcccgaagg caacttctcg gtgaccatga 14220
ccatcgacct gatgaacaac gccatcatcg acaattactt ggcggtgggg cggcagaacg 14280
gggtgctgga gagcgacatc ggcgtgaagt tcgacactag gaacttcagg ctgggctggg 14340
accccgtgac cgagctggtc atgcccgggg tgtacaccaa cgaggctttc catcccgata 14400
ttgtcttgct gcccggctgc ggggtggact tcaccgagag ccgcctcagc aacctgctgg 14460
gcattcgcaa gaggcagccc ttccaggaag gcttccagat catgtacgag gatctggagg 14520
ggggcaacat ccccgcgctc ctggatgtcg acgcctatga gaaaagcaag gaggatgcag 14580
cagctgaagc aactgcagcc gtagctaccg cctctaccga ggtcaggggc gataattttg 14640
caagcgccgc agcagtggca gcggccgagg cggctgaaac cgaaagtaag atagtcattc 14700
agccggtgga gaaggatagc aagaacagga gctacaacgt actaccggac aagataaaca 14760
ccgcctaccg cagctggtac ctagcctaca actatggcga ccccgagaag ggcgtgcgct 14820
cctggacgct gctcaccacc tcggacgtca cctgcggcgt ggagcaagtc tactggtcgc 14880
tgcccgacat gatgcaagac ccggtcacct tccgctccac gcgtcaagtt agcaactacc 14940
cggtggtggg cgccgagctc ctgcccgtct actccaagag cttcttcaac gagcaggccg 15000
tctactcgca gcagctgcgc gccttcacct cgcttacgca cgtcttcaac cgcttccccg 15060
agaaccagat cctcgtccgc ccgcccgcgc ccaccattac caccgtcagt gaaaacgttc 15120
ctgctctcac agatcacggg accctgccgc tgcgcagcag tatccgggga gtccagcgcg 15180
tgaccgttac tgacgccaga cgccgcacct gcccctacgt ctacaaggcc ctgggcatag 15240
tcgcgccgcg cgtcctctcg agccgcacct tctaaatgtc cattctcatc tcgcccagta 15300
ataacaccgg ttggggcctg cgcgcgccca gcaagatgta cggaggcgct cgccaacgct 15360
ccacgcaaca ccccgtgcgc gtgcgcgggc acttccgcgc tccctggggc gccctcaagg 15420
gccgcgtgcg gtcgcgcacc accgtcgacg acgtgatcga ccaggtggtg gccgacgcgc 15480
gcaactacac ccccgccgcc gcgcccgtct ccaccgtgga cgccgtcatc gacagcgtgg 15540
tggccgacgc gcgccggtac gcccgcgcca agagccggcg gcggcgcatc gcccggcggc 15600
accggagcac ccccgccatg cgcgcggcgc gagccttgct gcgcagggcc aggcgcacgg 15660
gacgcagggc catgctcagg gcggccagac gcgcggcttc aggcgccagc gccggcagga 15720
cccggagacg cgcggccacg gcggcggcag cggccatcgc cagcatgtcc cgcccgcggc 15780
gagggaacgt gtactgggtg cgcgacgccg ccaccggtgt gcgcgtgccc gtgcgcaccc 15840
gcccccctcg cacttgaaga tgttcacttc gcgatgttga tgtgtcccag cggcgaggag 15900
gatgtccaag cgcaaattca aggaagagat gctccaggtc atcgcgcctg agatctacgg 15960
ccctgcggtg gtgaaggagg aaagaaagcc ccgcaaaatc aagcgggtca aaaaggacaa 16020
aaaggaagaa gaaagtgatg tggacggatt ggtggagttt gtgcgcgagt tcgccccccg 16080
gcggcgcgtg cagtggcgcg ggcggaaggt gcaaccggtg ctgagacccg gcaccaccgt 16140
ggtcttcacg cccggcgagc gctccggcac cgcttccaag cgctcctacg acgaggtgta 16200
cggggatgat gatattctgg agcaggcggc cgagcgcctg ggcgagtttg cttacggcaa 16260
gcgcagccgt tccgcaccga aggaagaggc ggtgtccatc ccgctggacc acggcaaccc 16320
cacgccgagc ctcaagcccg tgaccttgca gcaggtgctg ccgaccgcgg cgccgcgccg 16380
ggggttcaag cgcgagggcg aggatctgta ccccaccatg cagctgatgg tgcccaagcg 16440
ccagaagctg gaagacgtgc tggagaccat gaaggtggac ccggacgtgc agcccgaggt 16500
caaggtgcgg cccatcaagc aggtggcccc gggcctgggc gtgcagaccg tggacatcaa 16560
gattcccacg gagcccatgg aaacgcagac cgagcccatg atcaagccca gcaccagcac 16620
catggaggtg cagacggatc cctggatgcc atcggctcct agtcgaagac cccggcgcaa 16680
gtacggcgcg gccagcctgc tgatgcccaa ctacgcgctg catccttcca tcatccccac 16740
gccgggctac cgcggcacgc gcttctaccg cggtcatacc agcagccgcc gccgcaagac 16800
caccactcgc cgccgccgtc gccgcaccgc cgctgcaacc acccctgccg ccctggtgcg 16860
gagagtgtac cgccgcggcc gcgcacctct gaccctgccg cgcgcgcgct accacccgag 16920
catcgccatt taaactttcg cctgctttgc agatcaatgg ccctcacatg ccgccttcgc 16980
gttcccatta cgggctaccg aggaagaaaa ccgcgccgta gaaggctggc ggggaacggg 17040
atgcgtcgcc accaccaccg gcggcggcgc gccatcagca agcggttggg gggaggcttc 17100
ctgcccgcgc tgatccccat catcgccgcg gcgatcgggg cgatccccgg cattgcttcc 17160
gtggcggtgc aggcctctca gcgccactga gacacacttg gaaacatctt gtaataaacc 17220
aatggactct gacgctcctg gtcctgtgat gtgttttcgt agacagatgg aagacatcaa 17280
tttttcgtcc ctggctccgc gacacggcac gcggccgttc atgggcacct ggagcgacat 17340
cggcaccagc caactgaacg ggggcgcctt caattggagc agtctctgga gcgggcttaa 17400
gaatttcggg tccacgctta aaacctatgg cagcaaggcg tggaacagca ccacagggca 17460
ggcgctgagg gataagctga aagagcagaa cttccagcag aaggtggtcg atgggctcgc 17520
ctcgggcatc aacggggtgg tggacctggc caaccaggcc gtgcagcggc agatcaacag 17580
ccgcctggac ccggtgccgc ccgccggctc cgtggagatg ccgcaggtgg aggaggagct 17640
gcctcccctg gacaagcggg gcgagaagcg accccgcccc gatgcggagg agacgctgct 17700
gacgcacacg gacgagccgc ccccgtacga ggaggcggtg aaactgggtc tgcccaccac 17760
gcggcccatc gcgcccctgg ccaccggggt gctgaaaccc gaaaagcccg cgaccctgga 17820
cttgcctcct ccccagcctt cccgcccctc tacagtggct aagcccctgc cgccggtggc 17880
cgtggcccgc gcgcgacccg ggggcaccgc ccgccctcat gcgaactggc agagcactct 17940
gaacagcatc gtgggtctgg gagtgcagag tgtgaagcgc cgccgctgct attaaaccta 18000
ccgtagcgct taacttgctt gtctgtgtgt gtatgtatta tgtcgccgcc gccgctgtcc 18060
accagaagga ggagtgaaga ggcgcgtcgc cgagttgcaa gatggccacc ccatcgatgc 18120
tgccccagtg ggcgtacatg cacatcgccg gacaggacgc ttcggagtac ctgagtccgg 18180
gtctggtgca gtttgcccgc gccacagaca cctacttcag tctggggaac aagtttagga 18240
accccacggt ggcgcccacg cacgatgtga ccaccgaccg cagccagcgg ctgacgctgc 18300
gcttcgtgcc cgtggaccgc gaggacaaca cctactcgta caaagtgcgc tacacgctgg 18360
ccgtgggcga caaccgcgtg ctggacatgg ccagcaccta ctttgacatc cgcggcgtgc 18420
tggatcgggg ccctagcttc aaaccctact ccggcaccgc ctacaacagt ctggccccca 18480
agggagcacc caacacttgt cagtggacat ataaagccga tggtgaaact gccacagaaa 18540
aaacctatac atatggaaat gcacccgtgc agggcattaa catcacaaaa gatggtattc 18600
aacttggaac tgacaccgat gatcagccaa tctacgcaga taaaacctat cagcctgaac 18660
ctcaagtggg tgatgctgaa tggcatgaca tcactggtac tgatgaaaag tatggaggca 18720
gagctcttaa gcctgatacc aaaatgaagc cttgttatgg ttcttttgcc aagcctacta 18780
ataaagaagg aggtcaggca aatgtgaaaa caggaacagg cactactaaa gaatatgaca 18840
tagacatggc tttctttgac aacagaagtg cggctgctgc tggcctagct ccagaaattg 18900
ttttgtatac tgaaaatgtg gatttggaaa ctccagatac ccatattgta tacaaagcag 18960
gcacagatga cagcagctct tctattaatt tgggtcagca agccatgccc aacagaccta 19020
actacattgg tttcagagac aactttatcg ggctcatgta ctacaacagc actggcaata 19080
tgggggtgct ggccggtcag gcttctcagc tgaatgctgt ggttgacttg caagacagaa 19140
acaccgagct gtcctaccag ctcttgcttg actctctggg tgacagaacc cggtatttca 19200
gtatgtggaa tcaggcggtg gacagctatg atcctgatgt gcgcattatt gaaaatcatg 19260
gtgtggagga tgaacttccc aactattgtt tccctctgga tgctgttggc agaacagata 19320
cttatcaggg aattaaggct aatggaactg atcaaaccac atggaccaaa gatgacagtg 19380
tcaatgatgc taatgagata ggcaagggta atccattcgc catggaaatc aacatccaag 19440
ccaacctgtg gaggaacttc ctctacgcca acgtggccct gtacctgccc gactcttaca 19500
agtacacgcc ggccaatgtt accctgccca ccaacaccaa cacctacgat tacatgaacg 19560
gccgggtggt ggcgccctcg ctggtggact cctacatcaa catcggggcg cgctggtcgc 19620
tggatcccat ggacaacgtg aaccccttca accaccaccg caatgcgggg ctgcgctacc 19680
gctccatgct cctgggcaac gggcgctacg tgcccttcca catccaggtg ccccagaaat 19740
ttttcgccat caagagcctc ctgctcctgc ccgggtccta cacctacgag tggaacttcc 19800
gcaaggacgt caacatgatc ctgcagagct ccctcggcaa cgacctgcgc acggacgggg 19860
cctccatctc cttcaccagc atcaacctct acgccacctt cttccccatg gcgcacaaca 19920
cggcctccac gctcgaggcc atgctgcgca acgacaccaa cgaccagtcc ttcaacgact 19980
acctctcggc ggccaacatg ctctacccca tcccggccaa cgccaccaac gtgcccatct 20040
ccatcccctc gcgcaactgg gccgccttcc gcggctggtc cttcacgcgt ctcaagacca 20100
aggagacgcc ctcgctgggc tccgggttcg acccctactt cgtctactcg ggctccatcc 20160
cctacctcga cggcaccttc tacctcaacc acaccttcaa gaaggtctcc atcaccttcg 20220
actcctccgt cagctggccc ggcaacgacc ggctcctgac gcccaacgag ttcgaaatca 20280
agcgcaccgt cgacggcgag ggctacaacg tggcccagtg caacatgacc aaggactggt 20340
tcctggtcca gatgctggcc cactacaaca tcggctacca gggcttctac gtgcccgagg 20400
gctacaagga ccgcatgtac tccttcttcc gcaacttcca gcccatgagc cgccaggtgg 20460
tggacgaggt caactacaag gactaccagg ccgtcaccct ggcctaccag cacaacaact 20520
cgggcttcgt cggctacctc gcgcccacca tgcgccaggg ccagccctac cccgccaact 20580
acccctaccc gctcatcggc aagagcgccg tcaccagcgt cacccagaaa aagttcctct 20640
gcgacagggt catgtggcgc atccccttct ccagcaactt catgtccatg ggcgcgctca 20700
ccgacctcgg ccagaacatg ctctatgcca actccgccca cgcgctagac atgaatttcg 20760
aagtcgaccc catggatgag tccacccttc tctatgttgt cttcgaagtc ttcgacgtcg 20820
tccgagtgca ccagccccac cgcggcgtca tcgaggccgt ctacctgcgc acccccttct 20880
cggccggtaa cgccaccacc taagctcttg cttcttgcaa gccatggccg cgggctccgg 20940
cgagcaggag ctcagggcca tcatccgcga cctgggctgc gggccctact tcctgggcac 21000
cttcgataag cgcttcccgg gattcatggc cccgcacaag ctggcctgcg ccatcgtcaa 21060
cacggccggc cgcgagaccg ggggcgagca ctggctggcc ttcgcctgga acccgcgctc 21120
gaacacctgc tacctcttcg accccttcgg gttctcggac gagcgcctca agcagatcta 21180
ccagttcgag tacgagggcc tgctgcgccg cagcgccctg gccaccgagg accgctgcgt 21240
caccctggaa aagtccaccc agaccgtgca gggtccgcgc tcggccgcct gcgggctctt 21300
ctgctgcatg ttcctgcacg ccttcgtgca ctggcccgac cgccccatgg acaagaaccc 21360
caccatgaac ttgctgacgg gggtgcccaa cggcatgctc cagtcgcccc aggtggaacc 21420
caccctgcgc cgcaaccagg aggcgctcta ccgcttcctc aactcccact ccgcctactt 21480
tcgctcccac cgcgcgcgca tcgagaaggc caccgccttc gaccgcatga atcaagacat 21540
gtaaaccgtg tgtgtatgtt aaatgtcttt aataaacagc actttcatgt tacacatgca 21600
tctgagatga tttatttaga aatcgaaagg gttctgccgg gtctcggcat ggcccgcggg 21660
cagggacacg ttgcggaact ggtacttggc cagccacttg aactcgggga tcagcagttt 21720
gggcagcggg gtgtcgggga aggagtcggt ccacagcttc cgcgtcagtt gcagggcgcc 21780
cagcaggtcg ggcgcggaga tcttgaaatc gcagttggga cccgcgttct gcgcgcggga 21840
gttgcggtac acggggttgc agcactggaa caccatcagg gccgggtgct tcacgctcgc 21900
cagcaccgtc gcgtcggtga tgctctccac gtcgaggtcc tcggcgttgg ccatcccgaa 21960
gggggtcatc ttgcaggtct gccttcccat ggtgggcacg cacccgggct tgtggttgca 22020
atcgcagtgc agggggatca gcatcatctg ggcctggtcg gcgttcatcc ccgggtacat 22080
ggccttcatg aaagcctcca attgcctgaa cgcctgctgg gccttggctc cctcggtgaa 22140
gaagaccccg caggacttgc tagagaactg gttggtggcg cacccggcgt cgtgcacgca 22200
gcagcgcgcg tcgttgttgg ccagctgcac cacgctgcgc ccccagcggt tctgggtgat 22260
cttggcccgg tcggggttct ccttcagcgc gcgctgcccg ttctcgctcg ccacatccat 22320
ctcgatcatg tgctccttct ggatcatggt ggtcccgtgc aggcaccgca gcttgccctc 22380
ggcctcggtg cacccgtgca gccacagcgc gcacccggtg cactcccagt tcttgtgggc 22440
gatctgggaa tgcgcgtgca cgaagccctg caggaagcgg cccatcatgg tggtcagggt 22500
cttgttgcta gtgaaggtca gcggaatgcc gcggtgctcc tcgttgatgt acaggtggca 22560
gatgcggcgg tacacctcgc cctgctcggg catcagctgg aagttggctt tcaggtcggt 22620
ctccacgcgg tagcggtcca tcagcatagt catgatttcc atacccttct cccaggccga 22680
gacgatgggc aggctcatag ggttcttcac catcatctta gcgctagcag ccgcggccag 22740
ggggtcgctc tcgtccaggg tctcaaagct ccgcttgccg tccttctcgg tgatccgcac 22800
cggggggtag ctgaagccca cggccgccag ctcctcctcg gcctgtcttt cgtcctcgct 22860
gtcctggctg acgtcctgca ggaccacatg cttggtcttg cggggtttct tcttgggcgg 22920
cagcggcggc ggagatgttg gagatggcga gggggagcgc gagttctcgc tcaccactac 22980
tatctcttcc tcttcttggt ccgaggccac gcggcggtag gtatgtctct tcgggggcag 23040
aggcggaggc gacgggctct cgccgccgcg acttggcgga tggctggcag agccccttcc 23100
gcgttcgggg gtgcgctccc ggcggcgctc tgactgactt cctccgcggc cggccattgt 23160
gttctcctag ggaggaacaa caagcatgga gactcagcca tcgccaacct cgccatctgc 23220
ccccaccgcc gacgagaagc agcagcagca gaatgaaagc ttaaccgccc cgccgcccag 23280
ccccgccacc tccgacgcgg ccgtcccaga catgcaagag atggaggaat ccatcgagat 23340
tgacctgggc tatgtgacgc ccgcggagca cgaggaggag ctggcagtgc gcttttcaca 23400
agaagagata caccaagaac agccagagca ggaagcagag aatgagcaga gtcaggctgg 23460
gctcgagcat gacggcgact acctccacct gagcgggggg gaggacgcgc tcatcaagca 23520
tctggcccgg caggccacca tcgtcaagga tgcgctgctc gaccgcaccg aggtgcccct 23580
cagcgtggag gagctcagcc gcgcctacga gttgaacctc ttctcgccgc gcgtgccccc 23640
caagcgccag cccaatggca cctgcgagcc caacccgcgc ctcaacttct acccggtctt 23700
cgcggtgccc gaggccctgg ccacctacca catctttttc aagaaccaaa agatccccgt 23760
ctcctgccgc gccaaccgca cccgcgccga cgcccttttc aacctgggtc ccggcgcccg 23820
cctacctgat atcgcctcct tggaagaggt tcccaagatc ttcgagggtc tgggcagcga 23880
cgagactcgg gccgcgaacg ctctgcaagg agaaggagga gagcatgagc accacagcgc 23940
cctggtcgag ttggaaggcg acaacgcgcg gctggcggtg ctcaaacgca cggtcgagct 24000
gacccatttc gcctacccgg ctctgaacct gccccccaaa gtcatgagcg cggtcatgga 24060
ccaggtgctc atcaagcgcg cgtcgcccat ctccgaggac gagggcatgc aagactccga 24120
ggagggcaag cccgtggtca gcgacgagca gctggcccgg tggctgggtc ctaatgctag 24180
tccccagagt ttggaagagc ggcgcaaact catgatggcc gtggtcctgg tgaccgtgga 24240
gctggagtgc ctgcgccgct tcttcgccga cgcggagacc ctgcgcaagg tcgaggagaa 24300
cctgcactac ctcttcaggc acgggttcgt gcgccaggcc tgcaagatct ccaacgtgga 24360
gctgaccaac ctggtctcct acatgggcat cttgcacgag aaccgcctgg ggcagaacgt 24420
gctgcacacc accctgcgcg gggaggcccg gcgcgactac atccgcgact gcgtctacct 24480
ctacctctgc cacacctggc agacgggcat gggcgtgtgg cagcagtgtc tggaggagca 24540
gaacctgaaa gagctctgca agctcctgca gaagaacctc aagggtctgt ggaccgggtt 24600
cgacgagcgc accaccgcct cggacctggc cgacctcatt ttccccgagc gcctcaggct 24660
gacgctgcgc aacggcctgc ccgactttat gagccaaagc atgttgcaaa actttcgctc 24720
tttcatcctc gaacgctccg gaatcctgcc cgccacctgc tccgcgctgc cctcggactt 24780
cgtgccgctg accttccgcg agtgcccccc gccgctgtgg agccactgct acctgctgcg 24840
cctggccaac tacctggcct accactcgga cgtgatcgag gacgtcagcg gcgagggcct 24900
gctcgagtgc cactgccgct gcaacctctg cacgccgcac cgctccctgg cctgcaaccc 24960
ccagctgctg agcgagaccc agatcatcgg caccttcgag ttgcaagggc ccagcgaagg 25020
cgagggttca gccgccaagg ggggtctgaa actcaccccg gggctgtgga cctcggccta 25080
cttgcgcaag ttcgtgcccg aggactacca tcccttcgag atcaggttct acgaggacca 25140
atcccatccg cccaaggccg agctgtcggc ctgcgtcatc acccaggggg cgatcctggc 25200
ccaattgcaa gccatccaga aatcccgcca agaattcttg ctgaaaaagg gccgcggggt 25260
ctacctcgac ccccagaccg gtgaggagct caaccccggc ttcccccagg atgccccgag 25320
gaaacaagaa gctgaaagtg gagctgccgc ccgtggagga tttggaggaa gactgggaga 25380
acagcagtca ggcagaggag gaggagatgg aggaagactg ggacagcact caggcagagg 25440
aggacagcct gcaagacagt ctggaggaag acgaggagga ggcagaggag gaggtggaag 25500
aagcagccgc cgccagaccg tcgtcctcgg cgggggagaa agcaagcagc acggatacca 25560
tctccgctcc gggtcggggt cccgctcgac cacacagtag atgggacgag accggacgat 25620
tcccgaaccc caccacccag accggtaaga aggagcggca gggatacaag tcctggcggg 25680
ggcacaaaaa cgccatcgtc tcctgcttgc aggcctgcgg gggcaacatc tccttcaccc 25740
ggcgctacct gctcttccac cgcggggtga actttccccg caacatcttg cattactacc 25800
gtcacctcca cagcccctac tacttccaag aagaggcagc agcagcagaa aaagaccagc 25860
agaaaaccag cagctagaaa atccacagcg gcggcagcag gtggactgag gatcgcggcg 25920
aacgagccgg cgcaaacccg ggagctgagg aaccggatct ttcccaccct ctatgccatc 25980
ttccagcaga gtcgggggca ggagcaggaa ctgaaagtca agaaccgttc tctgcgctcg 26040
ctcacccgca gttgtctgta tcacaagagc gaagaccaac ttcagcgcac tctcgaggac 26100
gccgaggctc tcttcaacaa gtactgcgcg ctcactctta aagagtagcc cgcgcccgcc 26160
cagtcgcaga aaaaggcggg aattacgtca cctgtgccct tcgccctagc cgcctccacc 26220
catcatcatg agcaaagaga ttcccacgcc ttacatgtgg agctaccagc cccagatggg 26280
cctggccgcc ggtgccgccc aggactactc cacccgcatg aattggctca gcgccgggcc 26340
cgcgatgatc tcacgggtga atgacatccg cgcccaccga aaccagatac tcctagaaca 26400
gtcagcgctc accgccacgc cccgcaatca cctcaatccg cgtaattggc ccgccgccct 26460
ggtgtaccag gaaattcccc agcccacgac cgtactactt ccgcgagacg cccaggccga 26520
agtccagctg actaactcag gtgtccagct ggcgggcggc gccaccctgt gtcgtcaccg 26580
ccccgctcag ggtataaagc ggctggtgat ccggggcaga ggcacacagc tcaacgacga 26640
ggtggtgagc tcttcgctgg gtctgcgacc tgacggagtc ttccaactcg ccggatcggg 26700
gagatcttcc ttcacgcctc gtcaggccgt cctgactttg gagagttcgt cctcgcagcc 26760
ccgctcgggt ggcatcggca ctctccagtt cgtggaggag ttcactccct cggtctactt 26820
caaccccttc tccggctccc ccggccacta cccggacgag ttcatcccga acttcgacgc 26880
catcagcgag tcggtggacg gctacgattg aatgtcccat ggtggcgcag ctgacctagc 26940
tcggcttcga cacctggacc actgccgccg cttccgctgc ttcgctcggg atctcgccga 27000
gtttgcctac tttgagctgc ccgaggagca ccctcagggc ccggcccacg gagtgcggat 27060
cgtcgtcgaa gggggcctcg actcccacct gcttcggatc ttcagccagc gtccgatcct 27120
ggtcgagcgc gagcaaggac agacccttct gactctgtac tgcatctgca accaccccgg 27180
cctgcatgaa agtctttgtt gtctgctgtg tactgagtat aataaaagct gagatcagcg 27240
actactccgg acttccgtgt gttcctgaat ccatcaacca gtctttgttc ttcaccggga 27300
acgagaccga gctccagctc cagtgtaagc cccacaagaa gtacctcacc tggctgttcc 27360
agggctcccc gatcgccgtt gtcaaccact gcgacaacga cggagtcctg ctgagcggcc 27420
ctgccaacct tactttttcc acccgcagaa gcaagctcca gctcttccaa cccttcctcc 27480
ccgggaccta tcagtgcgtc tcgggaccct gccatcacac cttccacctg atcccgaata 27540
ccacagcgtc gctccccgct actaacaacc aaactaacct ccaccaacgc caccgtcgcg 27600
acggccacaa tacatgccca tattagacta tgaggccgag ccacagcgac ccatgctccc 27660
cgctattagt tacttcaatc taaccggcgg agatgactga cccactggcc aacaacaacg 27720
tcaacgacct tctcctggac atggacggcc gcgcctcgga gcagcgactc gcccaacttc 27780
gcattcgcca gcagcaggag agagccgtca aggagctgca ggatgcggtg gccatccacc 27840
agtgcaagag aggcatcttc tgcctggtga aacaggccaa gatctcctac gaggtcactc 27900
caaacgacca tcgcctctcc tacgagctcc tgcagcagcg ccagaagttc acctgcctgg 27960
tcggagtcaa ccccatcgtc atcacccagc agtctggcga taccaagggg tgcatccact 28020
gctcctgcga ctcccccgac tgcgtccaca ctctgatcaa gaccctctgc ggcctccgcg 28080
acctcctccc catgaactaa tcaccccctt atccagtgaa ataaagatca tattgatgat 28140
gattttacag aaataaaaaa taatcatttg atttgaaata aagatacaat catattgatg 28200
atttgagttt aacaaaaaaa taaagaatca cttacttgaa atctgatacc aggtctctgt 28260
ccatgttttc tgccaacacc acttcactcc cctcttccca gctctggtac tgcaggcccc 28320
ggcgggctgc aaacttcctc cacacgctga aggggatgtc aaattcctcc tgtccctcaa 28380
tcttcatttt atcttctatc agatgtccaa aaagcgcgtc cgggtggatg atgacttcga 28440
ccccgtctac ccctacgatg cagacaacgc accgaccgtg cccttcatca accccccctt 28500
cgtctcttca gatggattcc aagagaagcc cctgggggtg ttgtccctgc gactggccga 28560
ccccgtcacc accaagaacg gggaaatcac cctcaagctg ggagaggggg tggacctcga 28620
ttcctcggga aaactcatct ccaacacggc caccaaggcc gccgcccctc tcagtttttc 28680
caacaacacc atttccctta acatggatca ccccttttac actaaagatg gaaaattatc 28740
cttacaagtt tctccaccat taaatatact gagaacaagc attctaaaca cactagcttt 28800
aggttttgga tcaggtttag gactccgtgg ctctgccttg gcagtacagt tagtctctcc 28860
acttacattt gatactgatg gaaacataaa gcttacctta gacagaggtt tgcatgttac 28920
aacaggagat gcaattgaaa gcaacataag ctgggctaaa ggtttaaaat ttgaagatgg 28980
agccatagca accaacattg gaaatgggtt agagtttgga agcagtagta cagaaacagg 29040
tgttgatgat gcttacccaa tccaagttaa acttggatct ggccttagct ttgacagtac 29100
aggagccata atggctggta acaaagaaga cgataaactc actttgtgga caacacctga 29160
tccatcacca aactgtcaaa tactcgcaga aaatgatgca aaactaacac tttgcttgac 29220
taaatgtggt agtcaaatac tggccactgt gtcagtctta gttgtaggaa gtggaaacct 29280
aaaccccatt actggcaccg taagcagtgc tcaggtgttt ctacgttttg atgcaaacgg 29340
tgttctttta acagaacatt ctacactaaa aaaatactgg gggtataggc agggagatag 29400
catagatggc actccatata ccaatgctgt aggattcatg cccaatttaa aagcttatcc 29460
aaagtcacaa agttctacta ctaaaaataa tatagtaggg caagtataca tgaatggaga 29520
tgtttcaaaa cctatgcttc tcactataac cctcaatggt actgatgaca gcaacagtac 29580
atattcaatg tcattttcat acacctggac taatggaagc tatgttggag caacatttgg 29640
ggctaactct tataccttct catacatcgc ccaagaatga acactgtatc ccaccctgca 29700
tgccaaccct tcccacccca ctctgtggaa caaactctga aacacaaaat aaaataaagt 29760
tcaagtgttt tattgattca acagttttac aggattcgag cagttatttt tcctccaccc 29820
tcccaggaca tggaatacac caccctctcc ccccgcacag ccttgaacat ctgaatgcca 29880
ttggtgatgg acatgctttt ggtctccacg ttccacacag tttcagagcg agccagtctc 29940
gggtcggtca gggagatgaa accctccggg cactcccgca tctgcacctc acagctcaac 30000
agctgaggat tgtcctcggt ggtcgggatc acggttatct ggaagaagca gaagagcggc 30060
ggtgggaatc atagtccgcg aacgggatcg gccggtggtg tcgcatcagg ccccgcagca 30120
gtcgctgccg ccgccgctcc gtcaagctgc tgctcagggg gtccgggtcc agggactccc 30180
tcagcatgat gcccacggcc ctcagcatca gtcgtctggt gcggcgggcg cagcagcgca 30240
tgcggatctc gctcaggtcg ctgcagtacg tgcaacacag aaccaccagg ttgttcaaca 30300
gtccatagtt caacacgctc cagccgaaac tcatcgcggg aaggatgcta cccacgtggc 30360
cgtcgtacca gatcctcagg taaatcaagt ggtgccccct ccagaacacg ctgcccacgt 30420
acatgatctc cttgggcatg tggcggttca ccacctcccg gtaccacatc accctctggt 30480
tgaacatgca gccccggatg atcctgcgga accacagggc cagcaccgcc ccgcccgcca 30540
tgcagcgaag agaccccggg tcccggcaat ggcaatggag gacccaccgc tcgtacccgt 30600
ggatcatctg ggagctgaac aagtctatgt tggcacagca caggcatatg ctcatgcatc 30660
tcttcagcac tctcaactcc tcgggggtca aaaccatatc ccagggcacg gggaactctt 30720
gcaggacagc gaaccccgca gaacagggca atcctcgcac agaacttaca ttgtgcatgg 30780
acagggtatc gcaatcaggc agcaccgggt gatcctccac cagagaagcg cgggtctcgg 30840
tctcctcaca gcgtggtaag ggggccggcc gatacgggtg atggcgggac gcggctgatc 30900
gtgttcgcga ccgtgtcatg atgcagttgc tttcggacat tttcgtactt gctgtagcag 30960
aacctggtcc gggcgctgca caccgatcgc cggcggcggt ctcggcgctt ggaacgctcg 31020
gtgttgaaat tgtaaaacag ccactctctc agaccgtgca gcagatctag ggcctcagga 31080
gtgatgaaga tcccatcatg cctgatggct ctgatcacat cgaccaccgt ggaatgggcc 31140
agacccagcc agatgatgca attttgttgg gtttcggtga cggcggggga gggaagaaca 31200
ggaagaacca tgattaactt ttaatccaaa cggtctcgga gtacttcaaa atgaagatcg 31260
cggagatggc acctctcgcc cccgctgtgt tggtggaaaa taacagccag gtcaaaggtg 31320
atacggttct cgagatgttc cacggtggct tccagcaaag cctccacgcg cacatccaga 31380
aacaagacaa tagcgaaagc gggagggttc tctaattcct caatcatcat gttacactcc 31440
tgcaccatcc ccagataatt ttcatttttc cagccttgaa tgattcgaac tagttcgtga 31500
ggtaaatcca agccagccat gataaagagc tcgcgcagag cgccctccac cggcattctt 31560
aagcacaccc tcataattcc aagatattct gctcctggtt cacctgcagc agattgacaa 31620
gcggaatatc aaaatctctg ccgcgatccc tgagctcctc cctcagcaat aactgtaagt 31680
actctttcat atcctctccg aaatttttag ccataggacc accaggaata agattagggc 31740
aagccacagt acagataaac cgaagtcctc cccagtgagc attgccaaat gcaagactgc 31800
tataagcatg ctggctagac ccggtgatat cttccagata actggacaga aaatcgccca 31860
ggcaattttt aagaaaatca acaaaagaaa aatcctccag gtggacgttt agagcctcgg 31920
gaacaacgat gaagtaaatg caagcggtgc gttccagcat ggttagttag ctgatctgta 31980
gaaaaaacaa aaatgaacat taaaccatgc tagcctggcg aacaggtggg taaatcgttc 32040
tctccagcac caggcaggcc acggggtctc cggcgcgacc ctcgtaaaaa ttgtcgctat 32100
gattgaaaac catcacagag agacgttccc ggtggccggc gtgaatgatt cgacaagatg 32160
aatacacccc cggaacattg gcgtccgcga gtgaaaaaaa gcgcccgagg aagcaataag 32220
gcactacaat gctcagtctc aagtccagca aagcgatgcc atgcggatga agcacaaaat 32280
tctcaggtgc gtacaaaatg taattactcc cctcctgcac aggcagcaaa gcccccgatc 32340
cctccaggta cacatacaaa gcctcagcgt ccatagctta ccgagcagca gcacacaaca 32400
ggcgcaagag tcagagaaag gctgagctct aacctgtcca cccgctctct gctcaatata 32460
tagcccagat ctacactgac gtaaaggcca aagtctaaaa atacccgcca aataatcaca 32520
cacgcccagc acacgcccag aaaccggtga cacactcaaa aaaatacgcg cacttcctca 32580
aacgcccaaa actgccgtca tttccgggtt cccacgctac gtcatcaaaa cacgactttc 32640
aaattccgtc gaccgttaaa aacgtcaccc gccccgcccc taacggtcgc ccgtctctca 32700
gccaatcagc gccccgcatc cccaaattca aacacctcat ttgcatatta acgcgcacaa 32760
aaagtttgag gtatattatt gatgatgg 32788
<210> 13
<211> 30684
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 13
ccatcttcaa taatatacct caaacttttt gtgcgcgtta atatgcaaat gaggcgtttg 60
aatttgggga ggaagggcgg tgattggtcg agggatgagc gaccgttagg ggcggggcga 120
gtgacgtttt gatgacgtgg ttgcgaggag gagccagttt gcaagttctc gtgggaaaag 180
tgacgtcaaa cgaggtgtgg tttgaacacg gaaatactca attttcccgc gctctctgac 240
aggaaatgag gtgtttctgg gcggatgcaa gtgaaaacgg gccattttcg cgcgaaaact 300
gaatgaggaa gtgaaaatct gagtaatttc gcgtttatgg cagggaggag tatttgccga 360
gggccgagta gactttgacc gattacgtgg gggtttcgat taccgtgttt ttcacctaaa 420
tttccgcgta cggtgtcaaa gtccggtgtt tttacgtagg tgtcagctga tcgccagggt 480
atttaaacct gcgctctcca gtcaagaggc cactcttgag tgccagcgag aagagttttc 540
tcctccgcgc cgcgagtcag atctacactt tgaaagtagg gataacaggg taatgacatt 600
gattattgac tagttgttaa tagtaatcaa ttacggggtc attagttcat agcccatata 660
tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 720
cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 780
attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 840
atcatatgcc aagtccgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 900
atgcccagta catgacctta cgggactttc ctacttggca gtacatctac gtattagtca 960
tcgctattac catggtgatg cggttttggc agtacaccaa tgggcgtgga tagcggtttg 1020
actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 1080
aaaatcaacg ggactttcca aaatgtcgta ataaccccgc cccgttgacg caaatgggcg 1140
gtaggcgtgt acggtgggag gtctatataa gcagagctcg tttagtgaac cgtcagatcg 1200
cctggaacgc catccacgct gttttgacct ccatagaaga cagcgatcgc gccaccatgg 1260
tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat cctggtcgag ctggacggcg 1320
acgtaaacgg ccacaagttc agcgtgtccg gcgagggcga gggcgatgcc acctacggca 1380
agctgaccct gaagttcatc tgcaccaccg gcaagctgcc cgtgccctgg cccaccctcg 1440
tgaccaccct gacctacggc gtgcagtgct tcagccgcta ccccgaccac atgaagcagc 1500
acgacttctt caagtccgcc atgcccgaag gctacgtcca ggagcgcacc atcttcttca 1560
aggacgacgg caactacaag acccgcgccg aggtgaagtt cgagggcgac accctggtga 1620
accgcatcga gctgaagggc atcgacttca aggaggacgg caacatcctg gggcacaagc 1680
tggagtacaa ctacaacagc cacaacgtct atatcatggc cgacaagcag aagaacggca 1740
tcaaggtgaa cttcaagatc cgccacaaca tcgaggacgg cagcgtgcag ctcgccgacc 1800
actaccagca gaacaccccc atcggcgacg gccccgtgct gctgcccgac aaccactacc 1860
tgagcaccca gtccgccctg agcaaagacc ccaacgagaa gcgcgatcac atggtcctgc 1920
tggagttcgt gaccgccgcc gggatcactc tcggcatgga cgagctttac aagtagtgag 1980
tttaaactcc catttaaatg tgagggttaa tgcttcgagc agacatgata agatacattg 2040
atgagtttgg acaaaccaca actagaatgc agtgaaaaaa atgctttatt tgtgaaattt 2100
gtgatgctat tgctttattt gtaaccatta taagctgcaa taaacaagtt aacaacaaca 2160
attgcattca ttttatgttt caggttcagg gggagatgtg ggaggttttt taaagcaagt 2220
aaaacctcta caaatgtggt aaaataacta taacggtcct aaggtagcga gtgagtagtg 2280
ttctggggcg ggggaggacc tgcatgaggg ccagaataac tgaaatctgt gcttttctgt 2340
gtgttgcagc agcatgagcg gaagcggctc ctttgaggga ggggtattca gcccttatct 2400
gacggggcgt ctcccctcct gggcgggagt gcgtcagaat gtgatgggat ccacggtgga 2460
cggccggccc gtgcagcccg cgaactcttc aaccctgacc tatgcaaccc tgagctcttc 2520
gtcgttggac gcagctgccg ccgcagctgc tgcatctgcc gccagcgccg tgcgcggaat 2580
ggccatgggc gccggctact acggcactct ggtggccaac tcgagttcca ccaataatcc 2640
cgccagcctg aacgaggaga agctgttgct gctgatggcc cagctcgagg ccttgaccca 2700
gcgcctgggc gagctgaccc agcaggtggc tcagctgcag gagcagacgc gggccgcggt 2760
tgccacggtg aaatccaaat aaaaaatgaa tcaataaata aacggagacg gttgttgatt 2820
ttaacacaga gtctgaatct ttatttgatt tttcgcgcgc ggtaggccct ggaccaccgg 2880
tctcgatcat tgagcacccg gtggatcttt tccaggaccc ggtagaggtg ggcttggatg 2940
ttgaggtaca tgggcatgag cccgtcccgg gggtggaggt agctccattg cagggcctcg 3000
tgctcggggg tggtgttgta aatcacccag tcatagcagg ggcgcagggc atggtgttgc 3060
acaatatctt tgaggaggag actgatggcc acgggcagcc ctttggtgta ggtgtttaca 3120
aatctgttga gctgggaggg atgcatgcgg ggggagatga ggtgcatctt ggcctggatc 3180
ttgagattgg cgatgttacc gcccagatcc cgcctggggt tcatgttgtg caggaccacc 3240
agcacggtgt atccggtgca cttggggaat ttatcatgca acttggaagg gaaggcgtga 3300
aagaatttgg cgacgccttt gtgcccgccc aggttttcca tgcactcatc catgatgatg 3360
gcgatgggcc cgtgggcggc ggcctgggca aagacgtttc gggggtcgga cacatcatag 3420
ttgtggtcct gggtgaggtc atcataggcc attttaatga atttggggcg gagggtgccg 3480
gactggggga caaaggtacc ctcgatcccg ggggcgtagt tcccctcaca gatctgcatc 3540
tcccaggctt tgagctcgga gggggggatc atgtccacct gcggggcgat aaagaacacg 3600
gtttccgggg cgggggagat gagctgggcc gaaagcaagt tccggagcag ctgggacttg 3660
ccgcagccgg tggggccgta gatgaccccg atgaccggct gcaggtggta gttgagggag 3720
agacagctgc cgtcctcccg gaggaggggg gccacctcgt tcatcatctc gcgcacgtgc 3780
atgttctcgc gcaccagttc cgccaggagg cgctctcccc ccagggatag gagctcctgg 3840
agcgaggcga agtttttcag cggcttgagt ccgtcggcca tgggcatttt ggagagggtt 3900
tgttgcaaga gttccaggcg gtcccagagc tcggtgatgt gctctacggc atctcgatcc 3960
agcagacctc ctcgtttcgc gggttgggac ggctgcggga gtagggcacc agacgatggg 4020
cgtccagcgc agccagggtc cggtccttcc agggtcgcag cgtccgcgtc agggtggtct 4080
ccgtcacggt gaaggggtgc gcgccgggct gggcgcttgc gagggtgcgc ttcaggctca 4140
tccggctggt cgaaaaccgc tcccgatcgg cgccctgcgc gtcggccagg tagcaattga 4200
ccatgagttc gtagttgagc gcctcggccg cgtggccttt ggcgcggagc ttacctttgg 4260
aagtctgccc gcaggcggga cagaggaggg acttgagggc gtagagcttg ggggcgagga 4320
agacggactc gggggcgtag gcgtccgcgc cgcagtgggc gcagacggtc tcgcactcca 4380
cgagccaggt gaggtcgggc tggtcggggt caaaaaccag tttcccgccg ttctttttga 4440
tgcgtttctt acctttggtc tccatgagct cgtgtccccg ctgggtgaca aagaggctgt 4500
ccgtgtcccc gtagaccgac tttatgggcc ggtcctcgag cggtgtgccg cggtcctcct 4560
cgtagaggaa ccccgcccac tccgagacga aagcccgggt ccaggccagc acgaaggagg 4620
ccacgtggga cgggtagcgg tcgttgtcca ccagcgggtc caccttttcc agggtatgca 4680
aacacatgtc cccctcgtcc acatccagga aggtgattgg cttgtaagtg taggccacgt 4740
gaccgggggt cccggccggg ggggtataaa agggtgcggg tccctgctcg tcctcactgt 4800
cttccggatc gctgtccagg agcgccagct gttggggtag gtattccctc tcgaaggcgg 4860
gcatgacctc ggcactcagg ttgtcagttt ctagaaacga ggaggatttg atattgacgg 4920
tgccggcgga gatgcctttc aagagcccct cgtccatctg gtcagaaaag acgatctttt 4980
tgttgtcgag cttggtggcg aaggagccgt agagggcgtt ggagaggagc ttggcgatgg 5040
agcgcatggt ctggtttttt tccttgtcgg cgcgctcctt ggcggcgatg ttgagctgca 5100
cgtactcgcg cgccacgcac ttccattcgg ggaagacggt ggtcagctcg tcgggcacga 5160
ttctgacctg ccagccccga ttatgcaggg tgatgaggtc cacactggtg gccacctcgc 5220
cgcgcagggg ctcattagtc cagcagaggc gtccgccctt gcgcgagcag aaggggggca 5280
gggggtccag catgacctcg tcgggggggt cggcatcgat ggtgaagatg ccgggcagga 5340
ggtcggggtc aaagtagctg atggaagtgg ccagatcgtc cagggcagct tgccattcgc 5400
gcacggccag cgcgcgctcg tagggactga ggggcgtgcc ccagggcatg ggatgggtaa 5460
gcgcggaggc gtacatgccg cagatgtcgt agacgtagag gggctcctcg aggatgccga 5520
tgtaggtggg gtagcagcgc cccccgcgga tgctggcgcg cacgtagtca tacagctcgt 5580
gcgagggggc gaggagcccc gggcccaggt tggtgcgact gggcttttcg gcgcggtaga 5640
cgatctggcg gaaaatggca tgcgagttgg aggagatggt gggcctttgg aagatgttga 5700
agtgggcgtg gggcagtccg accgagtcgc ggatgaagtg ggcgtaggag tcttgcagct 5760
tggcgacgag ctcggcggtg actaggacgt ccagagcgca gtagtcgagg gtctcctgga 5820
tgatgtcata cttgagctgt cccttttgtt tccacagctc gcggttgaga aggaactctt 5880
cgcggtcctt ccagtactct tcgaggggga acccgtcctg atctgcacgg taagagccta 5940
gcatgtagaa ctggttgacg gccttgtagg cgcagcagcc cttctccacg gggagggcgt 6000
aggcctgggc ggccttgcgc agggaggtgt gcgtgagggc gaaagtgtcc ctgaccatga 6060
ccttgaggaa ctggtgcttg aagtcgatat cgtcgcagcc cccctgctcc cagagctgga 6120
agtccgtgcg cttcttgtag gcggggttgg gcaaagcgaa agtaacatcg ttgaagagga 6180
tcttgcccgc gcggggcata aagttgcgag tgatgcggaa aggttggggc acctcggccc 6240
ggttgttgat gacctgggcg gcgagcacga tctcgtcgaa gccgttgatg ttgtggccca 6300
cgatgtagag ttccacgaat cgcggacggc ccttgacgtg gggcagtttc ttgagctcct 6360
cgtaggtgag ctcgtcgggg tcgctgagcc cgtgctgctc gagcgcccag tcggcgagat 6420
gggggttggc gcggaggaag gaagtccaga gatccacggc cagggcggtt tgcagacggt 6480
cccggtactg acggaactgc tgcccgacgg ccattttttc gggggtgacg cagtagaagg 6540
tgcgggggtc cccgtgccag cgatcccatt tgagctggag ggcgagatcg agggcgagct 6600
cgacgagccg gtcgtccccg gagagtttca tgaccagcat gaaggggacg agctgcttgc 6660
cgaaggaccc catccaggtg taggtttcca catcgtaggt gaggaagagc ctttcggtgc 6720
gaggatgcga gccgatgggg aagaactgga tctcctgcca ccaattggag gaatggctgt 6780
tgatgtgatg gaagtagaaa tgccgacggc gcgccgaaca ctcgtgcttg tgtttataca 6840
agcggccaca gtgctcgcaa cgctgcacgg gatgcacgtg ctgcacgagc tgtacctgag 6900
ttcctttgac gaggaatttc agtgggaagt ggagtcgtgg cgcctgcatc tcgtgctgta 6960
ctacgtcgtg gtggtcggcc tggccctctt ctgcctcgat ggtggtcatg ctgacgagcc 7020
cgcgcgggag gcaggtccag acctcggcgc gagcgggtcg gagagcgagg acgagggcgc 7080
gcaggccgga gctgtccagg gtcctgagac gctgcggagt caggtcagtg ggcagcggcg 7140
gcgcgcggtt gacttgcagg agtttttcca gggcgcgcgg gaggtccaga tggtacttga 7200
tctccaccgc gccattggtg gcgacgtcga tggcttgcag ggtcccgtgc ccctggggtg 7260
tgaccaccgt cccccgtttc ttcttgggcg gctggggcga cgggggcggt gcctcttcca 7320
tggttagaag cggcggcgag gacgcgcgcc gggcggcagg ggcggctcgg ggcccggagg 7380
caggggcggc aggggcacgt cggcgccgcg cgcgggtagg ttctggtact gcgcccggag 7440
aagactggcg tgagcgacga cgcgacggtt gacgtcctgg atctgacgcc tctgggtgaa 7500
ggccacggga cccgtgagtt tgaacctgaa agagagttcg acagaatcaa tctcggtatc 7560
gttgacggcg gcctgccgca ggatctcttg cacgtcgccc gagttgtcct ggtaggcgat 7620
ctcggtcatg aactgctcga tctcctcctc ttgaaggtct ccgcggccgg cgcgctccac 7680
ggtggccgcg aggtcgttgg agatgcggcc catgagctgc gagaaggcgt tcatgcccgc 7740
ctcgttccag acgcggctgt agaccacgac gccctcggga tcgcgggcgc gcatgaccac 7800
ctgggcgagg ttgagctcca cgtggcgcgt gaagaccgcg tagttgcaga ggcgctggta 7860
gaggtagttg agcgtggtgg cgatgtgctc ggtgacgaag aaatacatga tccagcggcg 7920
gagcggcatc tcgctgacgt cgcccagcgc ctccaaacgt tccatggcct cgtaaaagtc 7980
cacggcgaag ttgaaaaact gggagttgcg cgccgagacg gtcaactcct cctccagaag 8040
acggatgagc tcggcgatgg tggcgcgcac ctcgcgctcg aaggcccccg ggagttcctc 8100
cacttcctct tcttcctcct ccactaacat ctcttctact tcctcctcag gcggcagtgg 8160
tggcggggga gggggcctgc gtcgccggcg gcgcacgggc agacggtcga tgaagcgctc 8220
gatggtctcg ccgcgccggc gtcgcatggt ctcggtgacg gcgcgcccgt cctcgcgggg 8280
ccgcagcgtg aagacgccgc cgcgcatctc caggtggccg ggggggtccc cgttgggcag 8340
ggagagggcg ctgacgatgc atcttatcaa ttgccccgta gggactccgc gcaaggacct 8400
gagcgtctcg agatccacgg gatctgaaaa ccgctgaacg aaggcttcga gccagtcgca 8460
gtcgcaaggt aggctgagca cggtttcttc tggcgggtca tgttggttgg gagcggggcg 8520
ggcgatgctg ctggtgatga agttgaaata ggcggttctg agacggcgga tggtggcgag 8580
gagcaccagg tctttgggcc cggcttgctg gatgcgcaga cggtcggcca tgccccaggc 8640
gtggtcctga cacctggcca ggtccttgta gtagtcctgc atgagccgct ccacgggcac 8700
ctcctcctcg cccgcgcggc cgtgcatgcg cgtgagcccg aagccgcgct ggggctggac 8760
gagcgccagg tcggcgacga cgcgctcggc gaggatggct tgctggatct gggtgagggt 8820
ggtctggaag tcatcaaagt cgacgaagcg gtggtaggct ccggtgttga tggtgtagga 8880
gcagttggcc atgacggacc agttgacggt ctggtggccc ggacgcacga gctcgtggta 8940
cttgaggcgc gagtaggcgc gcgtgtcgaa gatgtagtcg ttgcaggtgc gcaccaggta 9000
ctggtagccg atgaggaagt gcggcggcgg ctggcggtag agcggccatc gctcggtggc 9060
gggggcgccg ggcgcgaggt cctcgagcat ggtgcggtgg tagccgtaga tgtacctgga 9120
catccaggtg atgccggcgg cggtggtgga ggcgcgcggg aactcgcgga cgcggttcca 9180
gatgttgcgc agcggcagga agtagttcat ggtgggcacg gtctggcccg tgaggcgcgc 9240
gcagtcgtgg atgctctata cgggcaaaaa cgaaagcggt cagcggctcg actccgtggc 9300
ctggaggcta agcgaacggg ttgggctgcg cgtgtacccc ggttcgaatc tcgaatcagg 9360
ctggagccgc agctaacgtg gtattggcac tcccgtctcg acccaagcct gcaccaaccc 9420
tccaggatac ggaggcgggt cgttttgcaa cttttttttg gaggccggat gagactagta 9480
agcgcggaaa gcggccgacc gcgatggctc gctgccgtag tctggagaag aatcgccagg 9540
gttgcgttgc ggtgtgcccc ggttcgaggc cggccggatt ccgcggctaa cgagggcgtg 9600
gctgccccgt cgtttccaag accccatagc cagccgactt ctccagttac ggagcgagcc 9660
cctcttttgt tttgtttgtt tttgccagat gcatcccgta ctgcggcaga tgcgccccca 9720
ccaccctcca ccgcaacaac agccccctcc acagccggcg cttctgcccc cgccccagca 9780
gcaacttcca gccacgaccg ccgcggccgc cgtgagcggg gctggacaga gttatgatca 9840
ccagctggcc ttggaagagg gcgaggggct ggcgcgcctg ggggcgtcgt cgccggagcg 9900
gcacccgcgc gtgcagatga aaagggacgc tcgcgaggcc tacgtgccca agcagaacct 9960
gttcagagac aggagcggcg aggagcccga ggagatgcgc gcggcccggt tccacgcggg 10020
gcgggagctg cggcgcggcc tggaccgaaa gagggtgctg agggacgagg atttcgaggc 10080
ggacgagctg acggggatca gccccgcgcg cgcgcacgtg gccgcggcca acctggtcac 10140
ggcgtacgag cagaccgtga aggaggagag caacttccaa aaatccttca acaaccacgt 10200
gcgcaccctg atcgcgcgcg aggaggtgac cctgggcctg atgcacctgt gggacctgct 10260
ggaggccatc gtgcagaacc ccaccagcaa gccgctgacg gcgcagctgt tcctggtggt 10320
gcagcatagt cgggacaacg aagcgttcag ggaggcgctg ctgaatatca ccgagcccga 10380
gggccgctgg ctcctggacc tggtgaacat tctgcagagc atcgtggtgc aggagcgcgg 10440
gctgccgctg tccgagaagc tggcggccat caacttctcg gtgctgagtt tgggcaagta 10500
ctacgctagg aagatctaca agaccccgta cgtgcccata gacaaggagg tgaagatcga 10560
cgggttttac atgcgcatga ccctgaaagt gctgaccctg agcgacgatc tgggggtgta 10620
ccgcaacgac aggatgcacc gtgcggtgag cgccagcagg cggcgcgagc tgagcgacca 10680
ggagctgatg catagtctgc agcgggccct gaccggggcc gggaccgagg gggagagcta 10740
ctttgacatg ggcgcggacc tgcactggca gcccagccgc cgggccttgg aggcggcggc 10800
aggaccctac gtagaagagg tggacgatga ggtggacgag gagggcgagt acctggaaga 10860
ctgatggcgc gaccgtattt ttgctagatg caacaacaac agccacctcc tgatcccgcg 10920
atgcgggcgg cgctgcagag ccagccgtcc ggcattaact cctcggacga ttggacccag 10980
gccatgcaac gcatcatggc gctgacgacc cgcaaccccg aagcctttag acagcagccc 11040
caggccaacc ggctctcggc catcctggag gccgtggtgc cctcgcgctc caaccccacg 11100
cacgagaagg tcctggccat cgtgaacgcg ctggtggaga acaaggccat ccgcggcgac 11160
gaggccggcc tggtgtacaa cgcgctgctg gagcgcgtgg cccgctacaa cagcaccaac 11220
gtgcagacca acctggaccg catggtgacc gacgtgcgcg aggccgtggc ccagcgcgag 11280
cggttccacc gcgagtccaa cctgggatcc atggtggcgc tgaacgcctt cctcagcacc 11340
cagcccgcca acgtgccccg gggccaggag gactacacca acttcatcag cgccctgcgc 11400
ctgatggtga ccgaggtgcc ccagagcgag gtgtaccagt ccgggccgga ctacttcttc 11460
cagaccagtc gccagggctt gcagaccgtg aacctgagcc aggctttcaa gaacttgcag 11520
ggcctgtggg gcgtgcaggc cccggtcggg gaccgcgcga cggtgtcgag cctgctgacg 11580
ccgaactcgc gcctgctgct gctgctggtg gcccccttca cggacagcgg cagcatcaac 11640
cgcaactcgt acctgggcta cctgattaac ctgtaccgcg aggccatcgg ccaggcgcac 11700
gtggacgagc agacctacca ggagatcacc cacgtgagcc gcgccctggg ccaggacgac 11760
ccgggcaacc tggaagccac cctgaacttt ttgctgacca accggtcgca gaagatcccg 11820
ccccagtacg cgctcagcac cgaggaggag cgcatcctgc gttacgtgca gcagagcgtg 11880
ggcctgttcc tgatgcagga gggggccacc cccagcgccg cgctcgacat gaccgcgcgc 11940
aacatggagc ccagcatgta cgccagcaac cgcccgttca tcaataaact gatggactac 12000
ttgcatcggg cggccgccat gaactctgac tatttcacca acgccatcct gaatccccac 12060
tggctcccgc cgccggggtt ctacacgggc gagtacgaca tgcccgaccc caatgacggg 12120
ttcctgtggg acgatgtgga cagcagcgtg ttctcccccc gaccgggtgc taacgagcgc 12180
cccttgtgga agaaggaagg cagcgaccga cgcccgtcct cggcgctgtc cggccgcgag 12240
ggtgctgccg cggcggtgcc cgaggccgcc agtcctttcc cgagcttgcc cttctcgctg 12300
aacagtatcc gcagcagcga gctgggcagg atcacgcgcc cgcgcttgct gggcgaagag 12360
gagtacttga atgactcgct gttgagaccc gagcgggaga agaacttccc caataacggg 12420
atagaaagcc tggtggacaa gatgagccgc tggaagacgt atgcgcagga gcacagggac 12480
gatccccggg cgtcgcaggg ggccacgagc cggggcagcg ccgcccgtaa acgccggtgg 12540
cacgacaggc agcggggaca gatgtgggac gatgaggact ccgccgacga cagcagcgtg 12600
ttggacttgg gtgggagtgg taacccgttc gctcacctgc gcccccgtat cgggcgcatg 12660
atgtaagaga aaccgaaaat aaatgatact caccaaggcc atggcgacca gcgtgcgttc 12720
gtttcttctc tgttgttgtt gtatctagta tgatgaggcg tgcgtacccg gagggtcctc 12780
ctccctcgta cgagagcgtg atgcagcagg cgatggcggc ggcggcgatg cagcccccgc 12840
tggaggctcc ttacgtgccc ccgcggtacc tggcgcctac ggaggggcgg aacagcattc 12900
gttactcgga gctggcaccc ttgtacgata ccacccggtt gtacctggtg gacaacaagt 12960
cggcggacat cgcctcgctg aactaccaga acgaccacag caacttcctg accaccgtgg 13020
tgcagaacaa tgacttcacc cccacggagg ccagcaccca gaccatcaac tttgacgagc 13080
gctcgcggtg gggcggccag ctgaaaacca tcatgcacac caacatgccc aacgtgaacg 13140
agttcatgta cagcaacaag ttcaaggcgc gggtgatggt ctcccgcaag acccccaatg 13200
gggtgacagt gacagaggat tatgatggta gtcaggatga gctgaagtat gaatgggtgg 13260
aatttgagct gcccgaaggc aacttctcgg tgaccatgac catcgacctg atgaacaacg 13320
ccatcatcga caattacttg gcggtggggc ggcagaacgg ggtgctggag agcgacatcg 13380
gcgtgaagtt cgacactagg aacttcaggc tgggctggga ccccgtgacc gagctggtca 13440
tgcccggggt gtacaccaac gaggctttcc atcccgatat tgtcttgctg cccggctgcg 13500
gggtggactt caccgagagc cgcctcagca acctgctggg cattcgcaag aggcagccct 13560
tccaggaagg cttccagatc atgtacgagg atctggaggg gggcaacatc cccgcgctcc 13620
tggatgtcga cgcctatgag aaaagcaagg aggatgcagc agctgaagca actgcagccg 13680
tagctaccgc ctctaccgag gtcaggggcg ataattttgc aagcgccgca gcagtggcag 13740
cggccgaggc ggctgaaacc gaaagtaaga tagtcattca gccggtggag aaggatagca 13800
agaacaggag ctacaacgta ctaccggaca agataaacac cgcctaccgc agctggtacc 13860
tagcctacaa ctatggcgac cccgagaagg gcgtgcgctc ctggacgctg ctcaccacct 13920
cggacgtcac ctgcggcgtg gagcaagtct actggtcgct gcccgacatg atgcaagacc 13980
cggtcacctt ccgctccacg cgtcaagtta gcaactaccc ggtggtgggc gccgagctcc 14040
tgcccgtcta ctccaagagc ttcttcaacg agcaggccgt ctactcgcag cagctgcgcg 14100
ccttcacctc gcttacgcac gtcttcaacc gcttccccga gaaccagatc ctcgtccgcc 14160
cgcccgcgcc caccattacc accgtcagtg aaaacgttcc tgctctcaca gatcacggga 14220
ccctgccgct gcgcagcagt atccggggag tccagcgcgt gaccgttact gacgccagac 14280
gccgcacctg cccctacgtc tacaaggccc tgggcatagt cgcgccgcgc gtcctctcga 14340
gccgcacctt ctaaatgtcc attctcatct cgcccagtaa taacaccggt tggggcctgc 14400
gcgcgcccag caagatgtac ggaggcgctc gccaacgctc cacgcaacac cccgtgcgcg 14460
tgcgcgggca cttccgcgct ccctggggcg ccctcaaggg ccgcgtgcgg tcgcgcacca 14520
ccgtcgacga cgtgatcgac caggtggtgg ccgacgcgcg caactacacc cccgccgccg 14580
cgcccgtctc caccgtggac gccgtcatcg acagcgtggt ggccgacgcg cgccggtacg 14640
cccgcgccaa gagccggcgg cggcgcatcg cccggcggca ccggagcacc cccgccatgc 14700
gcgcggcgcg agccttgctg cgcagggcca ggcgcacggg acgcagggcc atgctcaggg 14760
cggccagacg cgcggcttca ggcgccagcg ccggcaggac ccggagacgc gcggccacgg 14820
cggcggcagc ggccatcgcc agcatgtccc gcccgcggcg agggaacgtg tactgggtgc 14880
gcgacgccgc caccggtgtg cgcgtgcccg tgcgcacccg cccccctcgc acttgaagat 14940
gttcacttcg cgatgttgat gtgtcccagc ggcgaggagg atgtccaagc gcaaattcaa 15000
ggaagagatg ctccaggtca tcgcgcctga gatctacggc cctgcggtgg tgaaggagga 15060
aagaaagccc cgcaaaatca agcgggtcaa aaaggacaaa aaggaagaag aaagtgatgt 15120
ggacggattg gtggagtttg tgcgcgagtt cgccccccgg cggcgcgtgc agtggcgcgg 15180
gcggaaggtg caaccggtgc tgagacccgg caccaccgtg gtcttcacgc ccggcgagcg 15240
ctccggcacc gcttccaagc gctcctacga cgaggtgtac ggggatgatg atattctgga 15300
gcaggcggcc gagcgcctgg gcgagtttgc ttacggcaag cgcagccgtt ccgcaccgaa 15360
ggaagaggcg gtgtccatcc cgctggacca cggcaacccc acgccgagcc tcaagcccgt 15420
gaccttgcag caggtgctgc cgaccgcggc gccgcgccgg gggttcaagc gcgagggcga 15480
ggatctgtac cccaccatgc agctgatggt gcccaagcgc cagaagctgg aagacgtgct 15540
ggagaccatg aaggtggacc cggacgtgca gcccgaggtc aaggtgcggc ccatcaagca 15600
ggtggccccg ggcctgggcg tgcagaccgt ggacatcaag attcccacgg agcccatgga 15660
aacgcagacc gagcccatga tcaagcccag caccagcacc atggaggtgc agacggatcc 15720
ctggatgcca tcggctccta gtcgaagacc ccggcgcaag tacggcgcgg ccagcctgct 15780
gatgcccaac tacgcgctgc atccttccat catccccacg ccgggctacc gcggcacgcg 15840
cttctaccgc ggtcatacca gcagccgccg ccgcaagacc accactcgcc gccgccgtcg 15900
ccgcaccgcc gctgcaacca cccctgccgc cctggtgcgg agagtgtacc gccgcggccg 15960
cgcacctctg accctgccgc gcgcgcgcta ccacccgagc atcgccattt aaactttcgc 16020
ctgctttgca gatcaatggc cctcacatgc cgccttcgcg ttcccattac gggctaccga 16080
ggaagaaaac cgcgccgtag aaggctggcg gggaacggga tgcgtcgcca ccaccaccgg 16140
cggcggcgcg ccatcagcaa gcggttgggg ggaggcttcc tgcccgcgct gatccccatc 16200
atcgccgcgg cgatcggggc gatccccggc attgcttccg tggcggtgca ggcctctcag 16260
cgccactgag acacacttgg aaacatcttg taataaacca atggactctg acgctcctgg 16320
tcctgtgatg tgttttcgta gacagatgga agacatcaat ttttcgtccc tggctccgcg 16380
acacggcacg cggccgttca tgggcacctg gagcgacatc ggcaccagcc aactgaacgg 16440
gggcgccttc aattggagca gtctctggag cgggcttaag aatttcgggt ccacgcttaa 16500
aacctatggc agcaaggcgt ggaacagcac cacagggcag gcgctgaggg ataagctgaa 16560
agagcagaac ttccagcaga aggtggtcga tgggctcgcc tcgggcatca acggggtggt 16620
ggacctggcc aaccaggccg tgcagcggca gatcaacagc cgcctggacc cggtgccgcc 16680
cgccggctcc gtggagatgc cgcaggtgga ggaggagctg cctcccctgg acaagcgggg 16740
cgagaagcga ccccgccccg atgcggagga gacgctgctg acgcacacgg acgagccgcc 16800
cccgtacgag gaggcggtga aactgggtct gcccaccacg cggcccatcg cgcccctggc 16860
caccggggtg ctgaaacccg aaaagcccgc gaccctggac ttgcctcctc cccagccttc 16920
ccgcccctct acagtggcta agcccctgcc gccggtggcc gtggcccgcg cgcgacccgg 16980
gggcaccgcc cgccctcatg cgaactggca gagcactctg aacagcatcg tgggtctggg 17040
agtgcagagt gtgaagcgcc gccgctgcta ttaaacctac cgtagcgctt aacttgcttg 17100
tctgtgtgtg tatgtattat gtcgccgccg ccgctgtcca ccagaaggag gagtgaagag 17160
gcgcgtcgcc gagttgcaag atggccaccc catcgatgct gccccagtgg gcgtacatgc 17220
acatcgccgg acaggacgct tcggagtacc tgagtccggg tctggtgcag tttgcccgcg 17280
ccacagacac ctacttcagt ctggggaaca agtttaggaa ccccacggtg gcgcccacgc 17340
acgatgtgac caccgaccgc agccagcggc tgacgctgcg cttcgtgccc gtggaccgcg 17400
aggacaacac ctactcgtac aaagtgcgct acacgctggc cgtgggcgac aaccgcgtgc 17460
tggacatggc cagcacctac tttgacatcc gcggcgtgct ggatcggggc cctagcttca 17520
aaccctactc cggcaccgcc tacaacagtc tggcccccaa gggagcaccc aacacttgtc 17580
agtggacata taaagccgat ggtgaaactg ccacagaaaa aacctataca tatggaaatg 17640
cacccgtgca gggcattaac atcacaaaag atggtattca acttggaact gacaccgatg 17700
atcagccaat ctacgcagat aaaacctatc agcctgaacc tcaagtgggt gatgctgaat 17760
ggcatgacat cactggtact gatgaaaagt atggaggcag agctcttaag cctgatacca 17820
aaatgaagcc ttgttatggt tcttttgcca agcctactaa taaagaagga ggtcaggcaa 17880
atgtgaaaac aggaacaggc actactaaag aatatgacat agacatggct ttctttgaca 17940
acagaagtgc ggctgctgct ggcctagctc cagaaattgt tttgtatact gaaaatgtgg 18000
atttggaaac tccagatacc catattgtat acaaagcagg cacagatgac agcagctctt 18060
ctattaattt gggtcagcaa gccatgccca acagacctaa ctacattggt ttcagagaca 18120
actttatcgg gctcatgtac tacaacagca ctggcaatat gggggtgctg gccggtcagg 18180
cttctcagct gaatgctgtg gttgacttgc aagacagaaa caccgagctg tcctaccagc 18240
tcttgcttga ctctctgggt gacagaaccc ggtatttcag tatgtggaat caggcggtgg 18300
acagctatga tcctgatgtg cgcattattg aaaatcatgg tgtggaggat gaacttccca 18360
actattgttt ccctctggat gctgttggca gaacagatac ttatcaggga attaaggcta 18420
atggaactga tcaaaccaca tggaccaaag atgacagtgt caatgatgct aatgagatag 18480
gcaagggtaa tccattcgcc atggaaatca acatccaagc caacctgtgg aggaacttcc 18540
tctacgccaa cgtggccctg tacctgcccg actcttacaa gtacacgccg gccaatgtta 18600
ccctgcccac caacaccaac acctacgatt acatgaacgg ccgggtggtg gcgccctcgc 18660
tggtggactc ctacatcaac atcggggcgc gctggtcgct ggatcccatg gacaacgtga 18720
accccttcaa ccaccaccgc aatgcggggc tgcgctaccg ctccatgctc ctgggcaacg 18780
ggcgctacgt gcccttccac atccaggtgc cccagaaatt tttcgccatc aagagcctcc 18840
tgctcctgcc cgggtcctac acctacgagt ggaacttccg caaggacgtc aacatgatcc 18900
tgcagagctc cctcggcaac gacctgcgca cggacggggc ctccatctcc ttcaccagca 18960
tcaacctcta cgccaccttc ttccccatgg cgcacaacac ggcctccacg ctcgaggcca 19020
tgctgcgcaa cgacaccaac gaccagtcct tcaacgacta cctctcggcg gccaacatgc 19080
tctaccccat cccggccaac gccaccaacg tgcccatctc catcccctcg cgcaactggg 19140
ccgccttccg cggctggtcc ttcacgcgtc tcaagaccaa ggagacgccc tcgctgggct 19200
ccgggttcga cccctacttc gtctactcgg gctccatccc ctacctcgac ggcaccttct 19260
acctcaacca caccttcaag aaggtctcca tcaccttcga ctcctccgtc agctggcccg 19320
gcaacgaccg gctcctgacg cccaacgagt tcgaaatcaa gcgcaccgtc gacggcgagg 19380
gctacaacgt ggcccagtgc aacatgacca aggactggtt cctggtccag atgctggccc 19440
actacaacat cggctaccag ggcttctacg tgcccgaggg ctacaaggac cgcatgtact 19500
ccttcttccg caacttccag cccatgagcc gccaggtggt ggacgaggtc aactacaagg 19560
actaccaggc cgtcaccctg gcctaccagc acaacaactc gggcttcgtc ggctacctcg 19620
cgcccaccat gcgccagggc cagccctacc ccgccaacta cccctacccg ctcatcggca 19680
agagcgccgt caccagcgtc acccagaaaa agttcctctg cgacagggtc atgtggcgca 19740
tccccttctc cagcaacttc atgtccatgg gcgcgctcac cgacctcggc cagaacatgc 19800
tctatgccaa ctccgcccac gcgctagaca tgaatttcga agtcgacccc atggatgagt 19860
ccacccttct ctatgttgtc ttcgaagtct tcgacgtcgt ccgagtgcac cagccccacc 19920
gcggcgtcat cgaggccgtc tacctgcgca cccccttctc ggccggtaac gccaccacct 19980
aagctcttgc ttcttgcaag ccatggccgc gggctccggc gagcaggagc tcagggccat 20040
catccgcgac ctgggctgcg ggccctactt cctgggcacc ttcgataagc gcttcccggg 20100
attcatggcc ccgcacaagc tggcctgcgc catcgtcaac acggccggcc gcgagaccgg 20160
gggcgagcac tggctggcct tcgcctggaa cccgcgctcg aacacctgct acctcttcga 20220
ccccttcggg ttctcggacg agcgcctcaa gcagatctac cagttcgagt acgagggcct 20280
gctgcgccgc agcgccctgg ccaccgagga ccgctgcgtc accctggaaa agtccaccca 20340
gaccgtgcag ggtccgcgct cggccgcctg cgggctcttc tgctgcatgt tcctgcacgc 20400
cttcgtgcac tggcccgacc gccccatgga caagaacccc accatgaact tgctgacggg 20460
ggtgcccaac ggcatgctcc agtcgcccca ggtggaaccc accctgcgcc gcaaccagga 20520
ggcgctctac cgcttcctca actcccactc cgcctacttt cgctcccacc gcgcgcgcat 20580
cgagaaggcc accgccttcg accgcatgaa tcaagacatg taaaccgtgt gtgtatgtta 20640
aatgtcttta ataaacagca ctttcatgtt acacatgcat ctgagatgat ttatttagaa 20700
atcgaaaggg ttctgccggg tctcggcatg gcccgcgggc agggacacgt tgcggaactg 20760
gtacttggcc agccacttga actcggggat cagcagtttg ggcagcgggg tgtcggggaa 20820
ggagtcggtc cacagcttcc gcgtcagttg cagggcgccc agcaggtcgg gcgcggagat 20880
cttgaaatcg cagttgggac ccgcgttctg cgcgcgggag ttgcggtaca cggggttgca 20940
gcactggaac accatcaggg ccgggtgctt cacgctcgcc agcaccgtcg cgtcggtgat 21000
gctctccacg tcgaggtcct cggcgttggc catcccgaag ggggtcatct tgcaggtctg 21060
ccttcccatg gtgggcacgc acccgggctt gtggttgcaa tcgcagtgca gggggatcag 21120
catcatctgg gcctggtcgg cgttcatccc cgggtacatg gccttcatga aagcctccaa 21180
ttgcctgaac gcctgctggg ccttggctcc ctcggtgaag aagaccccgc aggacttgct 21240
agagaactgg ttggtggcgc acccggcgtc gtgcacgcag cagcgcgcgt cgttgttggc 21300
cagctgcacc acgctgcgcc cccagcggtt ctgggtgatc ttggcccggt cggggttctc 21360
cttcagcgcg cgctgcccgt tctcgctcgc cacatccatc tcgatcatgt gctccttctg 21420
gatcatggtg gtcccgtgca ggcaccgcag cttgccctcg gcctcggtgc acccgtgcag 21480
ccacagcgcg cacccggtgc actcccagtt cttgtgggcg atctgggaat gcgcgtgcac 21540
gaagccctgc aggaagcggc ccatcatggt ggtcagggtc ttgttgctag tgaaggtcag 21600
cggaatgccg cggtgctcct cgttgatgta caggtggcag atgcggcggt acacctcgcc 21660
ctgctcgggc atcagctgga agttggcttt caggtcggtc tccacgcggt agcggtccat 21720
cagcatagtc atgatttcca tacccttctc ccaggccgag acgatgggca ggctcatagg 21780
gttcttcacc atcatcttag cgctagcagc cgcggccagg gggtcgctct cgtccagggt 21840
ctcaaagctc cgcttgccgt ccttctcggt gatccgcacc ggggggtagc tgaagcccac 21900
ggccgccagc tcctcctcgg cctgtctttc gtcctcgctg tcctggctga cgtcctgcag 21960
gaccacatgc ttggtcttgc ggggtttctt cttgggcggc agcggcggcg gagatgttgg 22020
agatggcgag ggggagcgcg agttctcgct caccactact atctcttcct cttcttggtc 22080
cgaggccacg cggcggtagg tatgtctctt cgggggcaga ggcggaggcg acgggctctc 22140
gccgccgcga cttggcggat ggctggcaga gccccttccg cgttcggggg tgcgctcccg 22200
gcggcgctct gactgacttc ctccgcggcc ggccattgtg ttctcctagg gaggaacaac 22260
aagcatggag actcagccat cgccaacctc gccatctgcc cccaccgccg acgagaagca 22320
gcagcagcag aatgaaagct taaccgcccc gccgcccagc cccgccacct ccgacgcggc 22380
cgtcccagac atgcaagaga tggaggaatc catcgagatt gacctgggct atgtgacgcc 22440
cgcggagcac gaggaggagc tggcagtgcg cttttcacaa gaagagatac accaagaaca 22500
gccagagcag gaagcagaga atgagcagag tcaggctggg ctcgagcatg acggcgacta 22560
cctccacctg agcggggggg aggacgcgct catcaagcat ctggcccggc aggccaccat 22620
cgtcaaggat gcgctgctcg accgcaccga ggtgcccctc agcgtggagg agctcagccg 22680
cgcctacgag ttgaacctct tctcgccgcg cgtgcccccc aagcgccagc ccaatggcac 22740
ctgcgagccc aacccgcgcc tcaacttcta cccggtcttc gcggtgcccg aggccctggc 22800
cacctaccac atctttttca agaaccaaaa gatccccgtc tcctgccgcg ccaaccgcac 22860
ccgcgccgac gcccttttca acctgggtcc cggcgcccgc ctacctgata tcgcctcctt 22920
ggaagaggtt cccaagatct tcgagggtct gggcagcgac gagactcggg ccgcgaacgc 22980
tctgcaagga gaaggaggag agcatgagca ccacagcgcc ctggtcgagt tggaaggcga 23040
caacgcgcgg ctggcggtgc tcaaacgcac ggtcgagctg acccatttcg cctacccggc 23100
tctgaacctg ccccccaaag tcatgagcgc ggtcatggac caggtgctca tcaagcgcgc 23160
gtcgcccatc tccgaggacg agggcatgca agactccgag gagggcaagc ccgtggtcag 23220
cgacgagcag ctggcccggt ggctgggtcc taatgctagt ccccagagtt tggaagagcg 23280
gcgcaaactc atgatggccg tggtcctggt gaccgtggag ctggagtgcc tgcgccgctt 23340
cttcgccgac gcggagaccc tgcgcaaggt cgaggagaac ctgcactacc tcttcaggca 23400
cgggttcgtg cgccaggcct gcaagatctc caacgtggag ctgaccaacc tggtctccta 23460
catgggcatc ttgcacgaga accgcctggg gcagaacgtg ctgcacacca ccctgcgcgg 23520
ggaggcccgg cgcgactaca tccgcgactg cgtctacctc tacctctgcc acacctggca 23580
gacgggcatg ggcgtgtggc agcagtgtct ggaggagcag aacctgaaag agctctgcaa 23640
gctcctgcag aagaacctca agggtctgtg gaccgggttc gacgagcgca ccaccgcctc 23700
ggacctggcc gacctcattt tccccgagcg cctcaggctg acgctgcgca acggcctgcc 23760
cgactttatg agccaaagca tgttgcaaaa ctttcgctct ttcatcctcg aacgctccgg 23820
aatcctgccc gccacctgct ccgcgctgcc ctcggacttc gtgccgctga ccttccgcga 23880
gtgccccccg ccgctgtgga gccactgcta cctgctgcgc ctggccaact acctggccta 23940
ccactcggac gtgatcgagg acgtcagcgg cgagggcctg ctcgagtgcc actgccgctg 24000
caacctctgc acgccgcacc gctccctggc ctgcaacccc cagctgctga gcgagaccca 24060
gatcatcggc accttcgagt tgcaagggcc cagcgaaggc gagggttcag ccgccaaggg 24120
gggtctgaaa ctcaccccgg ggctgtggac ctcggcctac ttgcgcaagt tcgtgcccga 24180
ggactaccat cccttcgaga tcaggttcta cgaggaccaa tcccatccgc ccaaggccga 24240
gctgtcggcc tgcgtcatca cccagggggc gatcctggcc caattgcaag ccatccagaa 24300
atcccgccaa gaattcttgc tgaaaaaggg ccgcggggtc tacctcgacc cccagaccgg 24360
tgaggagctc aaccccggct tcccccagga tgccccgagg aaacaagaag ctgaaagtgg 24420
agctgccgcc cgtggaggat ttggaggaag actgggagaa cagcagtcag gcagaggagg 24480
aggagatgga ggaagactgg gacagcactc aggcagagga ggacagcctg caagacagtc 24540
tggaggaaga cgaggaggag gcagaggagg aggtggaaga agcagccgcc gccagaccgt 24600
cgtcctcggc gggggagaaa gcaagcagca cggataccat ctccgctccg ggtcggggtc 24660
ccgctcgacc acacagtaga tgggacgaga ccggacgatt cccgaacccc accacccaga 24720
ccggtaagaa ggagcggcag ggatacaagt cctggcgggg gcacaaaaac gccatcgtct 24780
cctgcttgca ggcctgcggg ggcaacatct ccttcacccg gcgctacctg ctcttccacc 24840
gcggggtgaa ctttccccgc aacatcttgc attactaccg tcacctccac agcccctact 24900
acttccaaga agaggcagca gcagcagaaa aagaccagca gaaaaccagc agctagaaaa 24960
tccacagcgg cggcagcagg tggactgagg atcgcggcga acgagccggc gcaaacccgg 25020
gagctgagga accggatctt tcccaccctc tatgccatct tccagcagag tcgggggcag 25080
gagcaggaac tgaaagtcaa gaaccgttct ctgcgctcgc tcacccgcag ttgtctgtat 25140
cacaagagcg aagaccaact tcagcgcact ctcgaggacg ccgaggctct cttcaacaag 25200
tactgcgcgc tcactcttaa agagtagccc gcgcccgccc agtcgcagaa aaaggcggga 25260
attacgtcac ctgtgccctt cgccctagcc gcctccaccc atcatcatga gcaaagagat 25320
tcccacgcct tacatgtgga gctaccagcc ccagatgggc ctggccgccg gtgccgccca 25380
ggactactcc acccgcatga attggctcag cgccgggccc gcgatgatct cacgggtgaa 25440
tgacatccgc gcccaccgaa accagatact cctagaacag tcagcgctca ccgccacgcc 25500
ccgcaatcac ctcaatccgc gtaattggcc cgccgccctg gtgtaccagg aaattcccca 25560
gcccacgacc gtactacttc cgcgagacgc ccaggccgaa gtccagctga ctaactcagg 25620
tgtccagctg gcgggcggcg ccaccctgtg tcgtcaccgc cccgctcagg gtataaagcg 25680
gctggtgatc cggggcagag gcacacagct caacgacgag gtggtgagct cttcgctggg 25740
tctgcgacct gacggagtct tccaactcgc cggatcgggg agatcttcct tcacgcctcg 25800
tcaggccgtc ctgactttgg agagttcgtc ctcgcagccc cgctcgggtg gcatcggcac 25860
tctccagttc gtggaggagt tcactccctc ggtctacttc aaccccttct ccggctcccc 25920
cggccactac ccggacgagt tcatcccgaa cttcgacgcc atcagcgagt cggtggacgg 25980
ctacgattga aactaatcac ccccttatcc agtgaaataa agatcatatt gatgatgatt 26040
ttacagaaat aaaaaataat catttgattt gaaataaaga tacaatcata ttgatgattt 26100
gagtttaaca aaaaaataaa gaatcactta cttgaaatct gataccaggt ctctgtccat 26160
gttttctgcc aacaccactt cactcccctc ttcccagctc tggtactgca ggccccggcg 26220
ggctgcaaac ttcctccaca cgctgaaggg gatgtcaaat tcctcctgtc cctcaatctt 26280
cattttatct tctatcagat gtccaaaaag cgcgtccggg tggatgatga cttcgacccc 26340
gtctacccct acgatgcaga caacgcaccg accgtgccct tcatcaaccc ccccttcgtc 26400
tcttcagatg gattccaaga gaagcccctg ggggtgttgt ccctgcgact ggccgacccc 26460
gtcaccacca agaacgggga aatcaccctc aagctgggag agggggtgga cctcgattcc 26520
tcgggaaaac tcatctccaa cacggccacc aaggccgccg cccctctcag tttttccaac 26580
aacaccattt cccttaacat ggatcacccc ttttacacta aagatggaaa attatcctta 26640
caagtttctc caccattaaa tatactgaga acaagcattc taaacacact agctttaggt 26700
tttggatcag gtttaggact ccgtggctct gccttggcag tacagttagt ctctccactt 26760
acatttgata ctgatggaaa cataaagctt accttagaca gaggtttgca tgttacaaca 26820
ggagatgcaa ttgaaagcaa cataagctgg gctaaaggtt taaaatttga agatggagcc 26880
atagcaacca acattggaaa tgggttagag tttggaagca gtagtacaga aacaggtgtt 26940
gatgatgctt acccaatcca agttaaactt ggatctggcc ttagctttga cagtacagga 27000
gccataatgg ctggtaacaa agaagacgat aaactcactt tgtggacaac acctgatcca 27060
tcaccaaact gtcaaatact cgcagaaaat gatgcaaaac taacactttg cttgactaaa 27120
tgtggtagtc aaatactggc cactgtgtca gtcttagttg taggaagtgg aaacctaaac 27180
cccattactg gcaccgtaag cagtgctcag gtgtttctac gttttgatgc aaacggtgtt 27240
cttttaacag aacattctac actaaaaaaa tactgggggt ataggcaggg agatagcata 27300
gatggcactc catataccaa tgctgtagga ttcatgccca atttaaaagc ttatccaaag 27360
tcacaaagtt ctactactaa aaataatata gtagggcaag tatacatgaa tggagatgtt 27420
tcaaaaccta tgcttctcac tataaccctc aatggtactg atgacagcaa cagtacatat 27480
tcaatgtcat tttcatacac ctggactaat ggaagctatg ttggagcaac atttggggct 27540
aactcttata ccttctcata catcgcccaa gaatgaacac tgtatcccac cctgcatgcc 27600
aacccttccc accccactct gtggaacaaa ctctgaaaca caaaataaaa taaagttcaa 27660
gtgttttatt gattcaacag ttttacagga ttcgagcagt tatttttcct ccaccctccc 27720
aggacatgga atacaccacc ctctcccccc gcacagcctt gaacatctga atgccattgg 27780
tgatggacat gcttttggtc tccacgttcc acacagtttc agagcgagcc agtctcgggt 27840
cggtcaggga gatgaaaccc tccgggcact cccgcatctg cacctcacag ctcaacagct 27900
gaggattgtc ctcggtggtc gggatcacgg ttatctggaa gaagcagaag agcggcggtg 27960
ggaatcatag tccgcgaacg ggatcggccg gtggtgtcgc atcaggcccc gcagcagtcg 28020
ctgccgccgc cgctccgtca agctgctgct cagggggtcc gggtccaggg actccctcag 28080
catgatgccc acggccctca gcatcagtcg tctggtgcgg cgggcgcagc agcgcatgcg 28140
gatctcgctc aggtcgctgc agtacgtgca acacagaacc accaggttgt tcaacagtcc 28200
atagttcaac acgctccagc cgaaactcat cgcgggaagg atgctaccca cgtggccgtc 28260
gtaccagatc ctcaggtaaa tcaagtggtg ccccctccag aacacgctgc ccacgtacat 28320
gatctccttg ggcatgtggc ggttcaccac ctcccggtac cacatcaccc tctggttgaa 28380
catgcagccc cggatgatcc tgcggaacca cagggccagc accgccccgc ccgccatgca 28440
gcgaagagac cccgggtccc ggcaatggca atggaggacc caccgctcgt acccgtggat 28500
catctgggag ctgaacaagt ctatgttggc acagcacagg catatgctca tgcatctctt 28560
cagcactctc aactcctcgg gggtcaaaac catatcccag ggcacgggga actcttgcag 28620
gacagcgaac cccgcagaac agggcaatcc tcgcacagaa cttacattgt gcatggacag 28680
ggtatcgcaa tcaggcagca ccgggtgatc ctccaccaga gaagcgcggg tctcggtctc 28740
ctcacagcgt ggtaaggggg ccggccgata cgggtgatgg cgggacgcgg ctgatcgtgt 28800
tcgcgaccgt gtcatgatgc agttgctttc ggacattttc gtacttgctg tagcagaacc 28860
tggtccgggc gctgcacacc gatcgccggc ggcggtctcg gcgcttggaa cgctcggtgt 28920
tgaaattgta aaacagccac tctctcagac cgtgcagcag atctagggcc tcaggagtga 28980
tgaagatccc atcatgcctg atggctctga tcacatcgac caccgtggaa tgggccagac 29040
ccagccagat gatgcaattt tgttgggttt cggtgacggc gggggaggga agaacaggaa 29100
gaaccatgat taacttttaa tccaaacggt ctcggagtac ttcaaaatga agatcgcgga 29160
gatggcacct ctcgcccccg ctgtgttggt ggaaaataac agccaggtca aaggtgatac 29220
ggttctcgag atgttccacg gtggcttcca gcaaagcctc cacgcgcaca tccagaaaca 29280
agacaatagc gaaagcggga gggttctcta attcctcaat catcatgtta cactcctgca 29340
ccatccccag ataattttca tttttccagc cttgaatgat tcgaactagt tcctgaggta 29400
aatccaagcc agccatgata aagagctcgc gcagagcgcc ctccaccggc attcttaagc 29460
acaccctcat aattccaaga tattctgctc ctggttcacc tgcagcagat tgacaagcgg 29520
aatatcaaaa tctctgccgc gatccctgag ctcctccctc agcaataact gtaagtactc 29580
tttcatatcc tctccgaaat ttttagccat aggaccacca ggaataagat tagggcaagc 29640
cacagtacag ataaaccgaa gtcctcccca gtgagcattg ccaaatgcaa gactgctata 29700
agcatgctgg ctagacccgg tgatatcttc cagataactg gacagaaaat cgcccaggca 29760
atttttaaga aaatcaacaa aagaaaaatc ctccaggtgg acgtttagag cctcgggaac 29820
aacgatgaag taaatgcaag cggtgcgttc cagcatggtt agttagctga tctgtagaaa 29880
aaacaaaaat gaacattaaa ccatgctagc ctggcgaaca ggtgggtaaa tcgttctctc 29940
cagcaccagg caggccacgg ggtctccggc gcgaccctcg taaaaattgt cgctatgatt 30000
gaaaaccatc acagagagac gttcccggtg gccggcgtga atgattcgac aagatgaata 30060
cacccccgga acattggcgt ccgcgagtga aaaaaagcgc ccgaggaagc aataaggcac 30120
tacaatgctc agtctcaagt ccagcaaagc gatgccatgc ggatgaagca caaaattctc 30180
aggtgcgtac aaaatgtaat tactcccctc ctgcacaggc agcaaagccc ccgatccctc 30240
caggtacaca tacaaagcct cagcgtccat agcttaccga gcagcagcac acaacaggcg 30300
caagagtcag agaaaggctg agctctaacc tgtccacccg ctctctgctc aatatatagc 30360
ccagatctac actgacgtaa aggccaaagt ctaaaaatac ccgccaaata atcacacacg 30420
cccagcacac gcccagaaac cggtgacaca ctcaaaaaaa tacgcgcact tcctcaaacg 30480
cccaaaactg ccgtcatttc cgggttccca cgctacgtca tcaaaacacg actttcaaat 30540
tccgtcgacc gttaaaaacg tcacccgccc cgcccctaac ggtcgcccgt ctctcagcca 30600
atcagcgccc cgcatcccca aattcaaaca cctcatttgc atattaacgc gcacaaaaag 30660
tttgaggtat attattgatg atgg 30684
<210> 14
<211> 8602
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 14
atgggcggcg catgagagaa gcccagacca attacctacc caaaatggag aaagttcacg 60
ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120
aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180
tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240
gtgcgcccgc ccgcagaatg tattctaagc acaagtatca ttgtatctgt ccgatgagat 300
gtgcggaaga tccggacaga ttgtataagt atgcaactaa gctgaagaaa aactgtaagg 360
aaataactga taaggaattg gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc 420
ctgacctgga aactgagact atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc 480
aagtcgctgt ttaccaggat gtatacgcgg ttgacggacc gacaagtctc tatcaccaag 540
ccaataaggg agttagagtc gcctactgga taggctttga caccacccct tttatgttta 600
agaacttggc tggagcatat ccatcatact ctaccaactg ggccgacgaa accgtgttaa 660
cggctcgtaa cataggccta tgcagctctg acgttatgga gcggtcacgt agagggatgt 720
ccattcttag aaagaagtat ttgaaaccat ccaacaatgt tctattctct gttggctcga 780
ccatctacca cgagaagagg gacttactga ggagctggca cctgccgtct gtatttcact 840
tacgtggcaa gcaaaattac acatgtcggt gtgagactat agttagttgc gacgggtacg 900
tcgttaaaag aatagctatc agtccaggcc tgtatgggaa gccttcaggc tatgctgcta 960
cgatgcaccg cgagggattc ttgtgctgca aagtgacaga cacattgaac ggggagaggg 1020
tctcttttcc cgtgtgcacg tatgtgccag ctacattgtg tgaccaaatg actggcatac 1080
tggcaacaga tgtcagtgcg gacgacgcgc aaaaactgct ggttgggctc aaccagcgta 1140
tagtcgtcaa cggtcgcacc cagagaaaca ccaataccat gaaaaattac cttttgcccg 1200
tagtggccca ggcatttgct aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa 1260
ggccactagg actacgagat agacagttag tcatggggtg ttgttgggct tttagaaggc 1320
acaagataac atctatttat aagcgcccgg atacccaaac catcatcaaa gtgaacagcg 1380
atttccactc attcgtgctg cccaggatag gcagtaacac attggagatc gggctgagaa 1440
caagaatcag gaaaatgtta gaggagcaca aggagccgtc acctctcatt accgccgagg 1500
acgtacaaga agctaagtgc gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt 1560
tgcgcgcagc tctaccacct ttggcagctg atgttgagga gcccactctg gaagccgatg 1620
tcgacttgat gttacaagag gctggggccg gctcagtgga gacacctcgt ggcttgataa 1680
aggttaccag ctacgctggc gaggacaaga tcggctctta cgctgtgctt tctccgcagg 1740
ctgtactcaa gagtgaaaaa ttatcttgca tccaccctct cgctgaacaa gtcatagtga 1800
taacacactc tggccgaaaa gggcgttatg ccgtggaacc ataccatggt aaagtagtgg 1860
tgccagaggg acatgcaata cccgtccagg actttcaagc tctgagtgaa agtgccacca 1920
ttgtgtacaa cgaacgtgag ttcgtaaaca ggtacctgca ccatattgcc acacatggag 1980
gagcgctgaa cactgatgaa gaatattaca aaactgtcaa gcccagcgag cacgacggcg 2040
aatacctgta cgacatcgac aggaaacagt gcgtcaagaa agaactagtc actgggctag 2100
ggctcacagg cgagctggtg gatcctccct tccatgaatt cgcctacgag agtctgagaa 2160
cacgaccagc cgctccttac caagtaccaa ccataggggt gtatggcgtg ccaggatcag 2220
gcaagtctgg catcattaaa agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga 2280
aagaaaactg tgcagaaatt ataagggacg tcaagaaaat gaaagggctg gacgtcaatg 2340
ccagaactgt ggactcagtg ctcttgaatg gatgcaaaca ccccgtagag accctgtata 2400
ttgacgaagc ttttgcttgt catgcaggta ctctcagagc gctcatagcc attataagac 2460
ctaaaaaggc agtgctctgc ggggatccca aacagtgcgg tttttttaac atgatgtgcc 2520
tgaaagtgca ttttaaccac gagatttgca cacaagtctt ccacaaaagc atctctcgcc 2580
gttgcactaa atctgtgact tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa 2640
cgacgaatcc gaaagagact aagattgtga ttgacactac cggcagtacc aaacctaagc 2700
aggacgatct cattctcact tgtttcagag ggtgggtgaa gcagttgcaa atagattaca 2760
aaggcaacga aataatgacg gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg 2820
ccgttcggta caaggtgaat gaaaatcctc tgtacgcacc cacctcagaa catgtgaacg 2880
tcctactgac ccgcacggag gaccgcatcg tgtggaaaac actagccggc gacccatgga 2940
taaaaacact gactgccaag taccctggga atttcactgc cacgatagag gagtggcaag 3000
cagagcatga tgccatcatg aggcacatct tggagagacc ggaccctacc gacgtcttcc 3060
agaataaggc aaacgtgtgt tgggccaagg ctttagtgcc ggtgctgaag accgctggca 3120
tagacatgac cactgaacaa tggaacactg tggattattt tgaaacggac aaagctcact 3180
cagcagagat agtattgaac caactatgcg tgaggttctt tggactcgat ctggactccg 3240
gtctattttc tgcacccact gttccgttat ccattaggaa taatcactgg gataactccc 3300
cgtcgcctaa catgtacggg ctgaataaag aagtggtccg tcagctctct cgcaggtacc 3360
cacaactgcc tcgggcagtt gccactggaa gagtctatga catgaacact ggtacactgc 3420
gcaattatga tccgcgcata aacctagtac ctgtaaacag aagactgcct catgctttag 3480
tcctccacca taatgaacac ccacagagtg acttttcttc attcgtcagc aaattgaagg 3540
gcagaactgt cctggtggtc ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt 3600
tgtcagaccg gcctgaggct accttcagag ctcggctgga tttaggcatc ccaggtgatg 3660
tgcccaaata tgacataata tttgttaatg tgaggacccc atataaatac catcactatc 3720
agcagtgtga agaccatgcc attaagctta gcatgttgac caagaaagct tgtctgcatc 3780
tgaatcccgg cggaacctgt gtcagcatag gttatggtta cgctgacagg gccagcgaaa 3840
gcatcattgg tgctatagcg cggcagttca agttttcccg ggtatgcaaa ccgaaatcct 3900
cacttgaaga gacggaagtt ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc 3960
acaatcctta caagctttca tcaaccttga ccaacattta tacaggttcc agactccacg 4020
aagccggatg tgcaccctca tatcatgtgg tgcgagggga tattgccacg gccaccgaag 4080
gagtgattat aaatgctgct aacagcaaag gacaacctgg cggaggggtg tgcggagcgc 4140
tgtataagaa attcccggaa agcttcgatt tacagccgat cgaagtagga aaagcgcgac 4200
tggtcaaagg tgcagctaaa catatcattc atgccgtagg accaaacttc aacaaagttt 4260
cggaggttga aggtgacaaa cagttggcag aggcttatga gtccatcgct aagattgtca 4320
acgataacaa ttacaagtca gtagcgattc cactgttgtc caccggcatc ttttccggga 4380
acaaagatcg actaacccaa tcattgaacc atttgctgac agctttagac accactgatg 4440
cagatgtagc catatactgc agggacaaga aatgggaaat gactctcaag gaagcagtgg 4500
ctaggagaga agcagtggag gagatatgca tatccgacga ctcttcagtg acagaacctg 4560
atgcagagct ggtgagggtg catccgaaga gttctttggc tggaaggaag ggctacagca 4620
caagcgatgg caaaactttc tcatatttgg aagggaccaa gtttcaccag gcggccaagg 4680
atatagcaga aattaatgcc atgtggcccg ttgcaacgga ggccaatgag caggtatgca 4740
tgtatatcct cggagaaagc atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg 4800
aagcctccac accacctagc acgctgcctt gcttgtgcat ccatgccatg actccagaaa 4860
gagtacagcg cctaaaagcc tcacgtccag aacaaattac tgtgtgctca tcctttccat 4920
tgccgaagta tagaatcact ggtgtgcaga agatccaatg ctcccagcct atattgttct 4980
caccgaaagt gcctgcgtat attcatccaa ggaagtatct cgtggaaaca ccaccggtag 5040
acgagactcc ggagccatcg gcagagaacc aatccacaga ggggacacct gaacaaccac 5100
cacttataac cgaggatgag accaggacta gaacgcctga gccgatcatc atcgaagagg 5160
aagaagagga tagcataagt ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg 5220
aggcagacat tcacgggccg ccctctgtat ctagctcatc ctggtccatt cctcatgcat 5280
ccgactttga tgtggacagt ttatccatac ttgacaccct ggagggagct agcgtgacca 5340
gcggggcaac gtcagccgag actaactctt acttcgcaaa gagtatggag tttctggcgc 5400
gaccggtgcc tgcgcctcga acagtattca ggaaccctcc acatcccgct ccgcgcacaa 5460
gaacaccgtc acttgcaccc agcagggcct gctcgagaac cagcctagtt tccaccccgc 5520
caggcgtgaa tagggtgatc actagagagg agctcgaggc gcttaccccg tcacgcactc 5580
ctagcaggtc ggtctcgaga accagcctgg tctccaaccc gccaggcgta aatagggtga 5640
ttacaagaga ggagtttgag gcgttcgtag cacaacaaca atgacggttt gatgcgggtg 5700
catacatctt ttcctccgac accggtcaag ggcatttaca acaaaaatca gtaaggcaaa 5760
cggtgctatc cgaagtggtg ttggagagga ccgaattgga gatttcgtat gccccgcgcc 5820
tcgaccaaga aaaagaagaa ttactacgca agaaattaca gttaaatccc acacctgcta 5880
acagaagcag ataccagtcc aggaaggtgg agaacatgaa agccataaca gctagacgta 5940
ttctgcaagg cctagggcat tatttgaagg cagaaggaaa agtggagtgc taccgaaccc 6000
tgcatcctgt tcctttgtat tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg 6060
cagtggaagc ctgtaacgcc atgttgaaag agaactttcc gactgtggct tcttactgta 6120
ttattccaga gtacgatgcc tatttggaca tggttgacgg agcttcatgc tgcttagaca 6180
ctgccagttt ttgccctgca aagctgcgca gctttccaaa gaaacactcc tatttggaac 6240
ccacaatacg atcggcagtg ccttcagcga tccagaacac gctccagaac gtcctggcag 6300
ctgccacaaa aagaaattgc aatgtcacgc aaatgagaga attgcccgta ttggattcgg 6360
cggcctttaa tgtggaatgc ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt 6420
ttaaagaaaa ccccatcagg cttactgaag aaaacgtggt aaattacatt accaaattaa 6480
aaggaccaaa agctgctgct ctttttgcga agacacataa tttgaatatg ttgcaggaca 6540
taccaatgga caggtttgta atggacttaa agagagacgt gaaagtgact ccaggaacaa 6600
aacatactga agaacggccc aaggtacagg tgatccaggc tgccgatccg ctagcaacag 6660
cgtatctgtg cggaatccac cgagagctgg ttaggagatt aaatgcggtc ctgcttccga 6720
acattcatac actgtttgat atgtcggctg aagactttga cgctattata gccgagcact 6780
tccagcctgg ggattgtgtt ctggaaactg acatcgcgtc gtttgataaa agtgaggacg 6840
acgccatggc tctgaccgcg ttaatgattc tggaagactt aggtgtggac gcagagctgt 6900
tgacgctgat tgaggcggct ttcggcgaaa tttcatcaat acatttgccc actaaaacta 6960
aatttaaatt cggagccatg atgaaatctg gaatgttcct cacactgttt gtgaacacag 7020
tcattaacat tgtaatcgca agcagagtgt tgagagaacg gctaaccgga tcaccatgtg 7080
cagcattcat tggagatgac aatatcgtga aaggagtcaa atcggacaaa ttaatggcag 7140
acaggtgcgc cacctggttg aatatggaag tcaagattat agatgctgtg gtgggcgaga 7200
aagcgcctta tttctgtgga gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc 7260
gtgtggcaga ccccctaaaa aggctgttta agcttggcaa acctctggca gcagacgatg 7320
aacatgatga tgacaggaga agggcattgc atgaagagtc aacacgctgg aaccgagtgg 7380
gtattctttc agagctgtgc aaggcagtag aatcaaggta tgaaaccgta ggaacttcca 7440
tcatagttat ggccatgact actctagcta gcagtgttaa atcattcagc tacctgagag 7500
gggcccctat aactctctac ggctaacctg aatggactac gactctagaa tagtctttaa 7560
ttaaagtccg ccatatgagg ccaccatgca gatcttcgtg aagaccctga ccggcaagac 7620
catcacccta gaggtggagc ccagtgacac catcgagaac gtgaaggcca agatccagga 7680
taaagagggc atcccccctg accagcagag gctgatcttt gccggcaagc agctggaaga 7740
tggccgcacc ctctctgatt acaacatcca gaaggagtca accctgcacc tggtccttcg 7800
cctgagaggt ggcgctgctt acagtataat caactttgaa aaactggctg cttacggcat 7860
cctgggcttt gtgtttacac tggctgccta cctgctgttt ggctatcctg tgtacgtggc 7920
cgcttatgga ctgtgtaccc tggtggccat gctggctgct tacaatctgg tgcctatggt 7980
ggccacagtg gccgcctatt gtcttggcgg actgctgaca atggtggcag cctacagccc 8040
gagctatgcg tatcatcagt ttgcagccta cggcccagga ccaggcgcta aatttgtggc 8100
tgcctggaca ctgaaagccg ccgctggacc aggtcctgga cagtacatca aggccaacag 8160
caagttcatc ggcatcaccg aactcggccc aggaccaggc tatccctacg atgtgcctga 8220
ttacgcctga tagtgatgat tcgaacggcc gtatcacgcc caaacattta cagccgcggt 8280
gtcaaaaacc gcgtggacgt ggttaacatc cctgctggga ggatcagccg taattattat 8340
aattggcttg gtgctggcta ctattgtggc catgtacgtg ctgaccaacc agaaacataa 8400
ttgaatacag cagcaattgg caagctgctt acatagaact cgcggcgatt ggcatgccgc 8460
cttaaaattt ttattttatt ttttcttttc ttttccgaat cggattttgt ttttaatatt 8520
tcaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 8580
aaaaaaaaaa aaaaaaaaaa aa 8602
<210> 15
<211> 9595
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 15
atgggcggcg catgagagaa gcccagacca attacctacc caaaatggag aaagttcacg 60
ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120
aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180
tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240
gtgcgcccgc ccgcagaatg tattctaagc acaagtatca ttgtatctgt ccgatgagat 300
gtgcggaaga tccggacaga ttgtataagt atgcaactaa gctgaagaaa aactgtaagg 360
aaataactga taaggaattg gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc 420
ctgacctgga aactgagact atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc 480
aagtcgctgt ttaccaggat gtatacgcgg ttgacggacc gacaagtctc tatcaccaag 540
ccaataaggg agttagagtc gcctactgga taggctttga caccacccct tttatgttta 600
agaacttggc tggagcatat ccatcatact ctaccaactg ggccgacgaa accgtgttaa 660
cggctcgtaa cataggccta tgcagctctg acgttatgga gcggtcacgt agagggatgt 720
ccattcttag aaagaagtat ttgaaaccat ccaacaatgt tctattctct gttggctcga 780
ccatctacca cgagaagagg gacttactga ggagctggca cctgccgtct gtatttcact 840
tacgtggcaa gcaaaattac acatgtcggt gtgagactat agttagttgc gacgggtacg 900
tcgttaaaag aatagctatc agtccaggcc tgtatgggaa gccttcaggc tatgctgcta 960
cgatgcaccg cgagggattc ttgtgctgca aagtgacaga cacattgaac ggggagaggg 1020
tctcttttcc cgtgtgcacg tatgtgccag ctacattgtg tgaccaaatg actggcatac 1080
tggcaacaga tgtcagtgcg gacgacgcgc aaaaactgct ggttgggctc aaccagcgta 1140
tagtcgtcaa cggtcgcacc cagagaaaca ccaataccat gaaaaattac cttttgcccg 1200
tagtggccca ggcatttgct aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa 1260
ggccactagg actacgagat agacagttag tcatggggtg ttgttgggct tttagaaggc 1320
acaagataac atctatttat aagcgcccgg atacccaaac catcatcaaa gtgaacagcg 1380
atttccactc attcgtgctg cccaggatag gcagtaacac attggagatc gggctgagaa 1440
caagaatcag gaaaatgtta gaggagcaca aggagccgtc acctctcatt accgccgagg 1500
acgtacaaga agctaagtgc gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt 1560
tgcgcgcagc tctaccacct ttggcagctg atgttgagga gcccactctg gaagccgatg 1620
tcgacttgat gttacaagag gctggggccg gctcagtgga gacacctcgt ggcttgataa 1680
aggttaccag ctacgctggc gaggacaaga tcggctctta cgctgtgctt tctccgcagg 1740
ctgtactcaa gagtgaaaaa ttatcttgca tccaccctct cgctgaacaa gtcatagtga 1800
taacacactc tggccgaaaa gggcgttatg ccgtggaacc ataccatggt aaagtagtgg 1860
tgccagaggg acatgcaata cccgtccagg actttcaagc tctgagtgaa agtgccacca 1920
ttgtgtacaa cgaacgtgag ttcgtaaaca ggtacctgca ccatattgcc acacatggag 1980
gagcgctgaa cactgatgaa gaatattaca aaactgtcaa gcccagcgag cacgacggcg 2040
aatacctgta cgacatcgac aggaaacagt gcgtcaagaa agaactagtc actgggctag 2100
ggctcacagg cgagctggtg gatcctccct tccatgaatt cgcctacgag agtctgagaa 2160
cacgaccagc cgctccttac caagtaccaa ccataggggt gtatggcgtg ccaggatcag 2220
gcaagtctgg catcattaaa agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga 2280
aagaaaactg tgcagaaatt ataagggacg tcaagaaaat gaaagggctg gacgtcaatg 2340
ccagaactgt ggactcagtg ctcttgaatg gatgcaaaca ccccgtagag accctgtata 2400
ttgacgaagc ttttgcttgt catgcaggta ctctcagagc gctcatagcc attataagac 2460
ctaaaaaggc agtgctctgc ggggatccca aacagtgcgg tttttttaac atgatgtgcc 2520
tgaaagtgca ttttaaccac gagatttgca cacaagtctt ccacaaaagc atctctcgcc 2580
gttgcactaa atctgtgact tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa 2640
cgacgaatcc gaaagagact aagattgtga ttgacactac cggcagtacc aaacctaagc 2700
aggacgatct cattctcact tgtttcagag ggtgggtgaa gcagttgcaa atagattaca 2760
aaggcaacga aataatgacg gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg 2820
ccgttcggta caaggtgaat gaaaatcctc tgtacgcacc cacctcagaa catgtgaacg 2880
tcctactgac ccgcacggag gaccgcatcg tgtggaaaac actagccggc gacccatgga 2940
taaaaacact gactgccaag taccctggga atttcactgc cacgatagag gagtggcaag 3000
cagagcatga tgccatcatg aggcacatct tggagagacc ggaccctacc gacgtcttcc 3060
agaataaggc aaacgtgtgt tgggccaagg ctttagtgcc ggtgctgaag accgctggca 3120
tagacatgac cactgaacaa tggaacactg tggattattt tgaaacggac aaagctcact 3180
cagcagagat agtattgaac caactatgcg tgaggttctt tggactcgat ctggactccg 3240
gtctattttc tgcacccact gttccgttat ccattaggaa taatcactgg gataactccc 3300
cgtcgcctaa catgtacggg ctgaataaag aagtggtccg tcagctctct cgcaggtacc 3360
cacaactgcc tcgggcagtt gccactggaa gagtctatga catgaacact ggtacactgc 3420
gcaattatga tccgcgcata aacctagtac ctgtaaacag aagactgcct catgctttag 3480
tcctccacca taatgaacac ccacagagtg acttttcttc attcgtcagc aaattgaagg 3540
gcagaactgt cctggtggtc ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt 3600
tgtcagaccg gcctgaggct accttcagag ctcggctgga tttaggcatc ccaggtgatg 3660
tgcccaaata tgacataata tttgttaatg tgaggacccc atataaatac catcactatc 3720
agcagtgtga agaccatgcc attaagctta gcatgttgac caagaaagct tgtctgcatc 3780
tgaatcccgg cggaacctgt gtcagcatag gttatggtta cgctgacagg gccagcgaaa 3840
gcatcattgg tgctatagcg cggcagttca agttttcccg ggtatgcaaa ccgaaatcct 3900
cacttgaaga gacggaagtt ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc 3960
acaatcctta caagctttca tcaaccttga ccaacattta tacaggttcc agactccacg 4020
aagccggatg tgcaccctca tatcatgtgg tgcgagggga tattgccacg gccaccgaag 4080
gagtgattat aaatgctgct aacagcaaag gacaacctgg cggaggggtg tgcggagcgc 4140
tgtataagaa attcccggaa agcttcgatt tacagccgat cgaagtagga aaagcgcgac 4200
tggtcaaagg tgcagctaaa catatcattc atgccgtagg accaaacttc aacaaagttt 4260
cggaggttga aggtgacaaa cagttggcag aggcttatga gtccatcgct aagattgtca 4320
acgataacaa ttacaagtca gtagcgattc cactgttgtc caccggcatc ttttccggga 4380
acaaagatcg actaacccaa tcattgaacc atttgctgac agctttagac accactgatg 4440
cagatgtagc catatactgc agggacaaga aatgggaaat gactctcaag gaagcagtgg 4500
ctaggagaga agcagtggag gagatatgca tatccgacga ctcttcagtg acagaacctg 4560
atgcagagct ggtgagggtg catccgaaga gttctttggc tggaaggaag ggctacagca 4620
caagcgatgg caaaactttc tcatatttgg aagggaccaa gtttcaccag gcggccaagg 4680
atatagcaga aattaatgcc atgtggcccg ttgcaacgga ggccaatgag caggtatgca 4740
tgtatatcct cggagaaagc atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg 4800
aagcctccac accacctagc acgctgcctt gcttgtgcat ccatgccatg actccagaaa 4860
gagtacagcg cctaaaagcc tcacgtccag aacaaattac tgtgtgctca tcctttccat 4920
tgccgaagta tagaatcact ggtgtgcaga agatccaatg ctcccagcct atattgttct 4980
caccgaaagt gcctgcgtat attcatccaa ggaagtatct cgtggaaaca ccaccggtag 5040
acgagactcc ggagccatcg gcagagaacc aatccacaga ggggacacct gaacaaccac 5100
cacttataac cgaggatgag accaggacta gaacgcctga gccgatcatc atcgaagagg 5160
aagaagagga tagcataagt ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg 5220
aggcagacat tcacgggccg ccctctgtat ctagctcatc ctggtccatt cctcatgcat 5280
ccgactttga tgtggacagt ttatccatac ttgacaccct ggagggagct agcgtgacca 5340
gcggggcaac gtcagccgag actaactctt acttcgcaaa gagtatggag tttctggcgc 5400
gaccggtgcc tgcgcctcga acagtattca ggaaccctcc acatcccgct ccgcgcacaa 5460
gaacaccgtc acttgcaccc agcagggcct gctcgagaac cagcctagtt tccaccccgc 5520
caggcgtgaa tagggtgatc actagagagg agctcgaggc gcttaccccg tcacgcactc 5580
ctagcaggtc ggtctcgaga accagcctgg tctccaaccc gccaggcgta aatagggtga 5640
ttacaagaga ggagtttgag gcgttcgtag cacaacaaca atgacggttt gatgcgggtg 5700
catacatctt ttcctccgac accggtcaag ggcatttaca acaaaaatca gtaaggcaaa 5760
cggtgctatc cgaagtggtg ttggagagga ccgaattgga gatttcgtat gccccgcgcc 5820
tcgaccaaga aaaagaagaa ttactacgca agaaattaca gttaaatccc acacctgcta 5880
acagaagcag ataccagtcc aggaaggtgg agaacatgaa agccataaca gctagacgta 5940
ttctgcaagg cctagggcat tatttgaagg cagaaggaaa agtggagtgc taccgaaccc 6000
tgcatcctgt tcctttgtat tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg 6060
cagtggaagc ctgtaacgcc atgttgaaag agaactttcc gactgtggct tcttactgta 6120
ttattccaga gtacgatgcc tatttggaca tggttgacgg agcttcatgc tgcttagaca 6180
ctgccagttt ttgccctgca aagctgcgca gctttccaaa gaaacactcc tatttggaac 6240
ccacaatacg atcggcagtg ccttcagcga tccagaacac gctccagaac gtcctggcag 6300
ctgccacaaa aagaaattgc aatgtcacgc aaatgagaga attgcccgta ttggattcgg 6360
cggcctttaa tgtggaatgc ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt 6420
ttaaagaaaa ccccatcagg cttactgaag aaaacgtggt aaattacatt accaaattaa 6480
aaggaccaaa agctgctgct ctttttgcga agacacataa tttgaatatg ttgcaggaca 6540
taccaatgga caggtttgta atggacttaa agagagacgt gaaagtgact ccaggaacaa 6600
aacatactga agaacggccc aaggtacagg tgatccaggc tgccgatccg ctagcaacag 6660
cgtatctgtg cggaatccac cgagagctgg ttaggagatt aaatgcggtc ctgcttccga 6720
acattcatac actgtttgat atgtcggctg aagactttga cgctattata gccgagcact 6780
tccagcctgg ggattgtgtt ctggaaactg acatcgcgtc gtttgataaa agtgaggacg 6840
acgccatggc tctgaccgcg ttaatgattc tggaagactt aggtgtggac gcagagctgt 6900
tgacgctgat tgaggcggct ttcggcgaaa tttcatcaat acatttgccc actaaaacta 6960
aatttaaatt cggagccatg atgaaatctg gaatgttcct cacactgttt gtgaacacag 7020
tcattaacat tgtaatcgca agcagagtgt tgagagaacg gctaaccgga tcaccatgtg 7080
cagcattcat tggagatgac aatatcgtga aaggagtcaa atcggacaaa ttaatggcag 7140
acaggtgcgc cacctggttg aatatggaag tcaagattat agatgctgtg gtgggcgaga 7200
aagcgcctta tttctgtgga gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc 7260
gtgtggcaga ccccctaaaa aggctgttta agcttggcaa acctctggca gcagacgatg 7320
aacatgatga tgacaggaga agggcattgc atgaagagtc aacacgctgg aaccgagtgg 7380
gtattctttc agagctgtgc aaggcagtag aatcaaggta tgaaaccgta ggaacttcca 7440
tcatagttat ggccatgact actctagcta gcagtgttaa atcattcagc tacctgagag 7500
gggcccctat aactctctac ggctaacctg aatggactac gactctagaa tagtctttaa 7560
ttaaagtccg ccatatgaga tggaagatgc caaaaacatt aagaagggcc cagcgccatt 7620
ctacccactc gaagacggga ccgccggcga gcagctgcac aaagccatga agcgctacgc 7680
cctggtgccc ggcaccatcg cctttaccga cgcacatatc gaggtggaca ttacctacgc 7740
cgagtacttc gagatgagcg ttcggctggc agaagctatg aagcgctatg ggctgaatac 7800
aaaccatcgg atcgtggtgt gcagcgagaa tagcttgcag ttcttcatgc ccgtgttggg 7860
tgccctgttc atcggtgtgg ctgtggcccc agctaacgac atctacaacg agcgcgagct 7920
gctgaacagc atgggcatca gccagcccac cgtcgtattc gtgagcaaga aagggctgca 7980
aaagatcctc aacgtgcaaa agaagctacc gatcatacaa aagatcatca tcatggatag 8040
caagaccgac taccagggct tccaaagcat gtacaccttc gtgacttccc atttgccacc 8100
cggcttcaac gagtacgact tcgtgcccga gagcttcgac cgggacaaaa ccatcgccct 8160
gatcatgaac agtagtggca gtaccggatt gcccaagggc gtagccctac cgcaccgcac 8220
cgcttgtgtc cgattcagtc atgcccgcga ccccatcttc ggcaaccaga tcatccccga 8280
caccgctatc ctcagcgtgg tgccatttca ccacggcttc ggcatgttca ccacgctggg 8340
ctacttgatc tgcggctttc gggtcgtgct catgtaccgc ttcgaggagg agctattctt 8400
gcgcagcttg caagactata agattcaatc tgccctgctg gtgcccacac tatttagctt 8460
cttcgctaag agcactctca tcgacaagta cgacctaagc aacttgcacg agatcgccag 8520
cggcggggcg ccgctcagca aggaggtagg tgaggccgtg gccaaacgct tccacctacc 8580
aggcatccgc cagggctacg gcctgacaga aacaaccagc gccattctga tcacccccga 8640
aggggacgac aagcctggcg cagtaggcaa ggtggtgccc ttcttcgagg ctaaggtggt 8700
ggacttggac accggtaaga cactgggtgt gaaccagcgc ggcgagctgt gcgtccgtgg 8760
ccccatgatc atgagcggct acgttaacaa ccccgaggct acaaacgctc tcatcgacaa 8820
ggacggctgg ctgcacagcg gcgacatcgc ctactgggac gaggacgagc acttcttcat 8880
cgtggaccgg ctgaagagcc tgatcaaata caagggctac caggtagccc cagccgaact 8940
ggagagcatc ctgctgcaac accccaacat cttcgacgcc ggggtcgccg gcctgcccga 9000
cgacgatgcc ggcgagctgc ccgccgcagt cgtcgtgctg gaacacggta aaaccatgac 9060
cgagaaggag atcgtggact atgtggccag ccaggttaca accgccaaga agctgcgcgg 9120
tggtgttgtg ttcgtggacg aggtgcctaa aggactgacc ggcaagttgg acgcccgcaa 9180
gatccgcgag attctcatta aggccaagaa gggcggcaag atcgccgtgt aattcgaacg 9240
gccgtatcac gcccaaacat ttacagccgc ggtgtcaaaa accgcgtgga cgtggttaac 9300
atccctgctg ggaggatcag ccgtaattat tataattggc ttggtgctgg ctactattgt 9360
ggccatgtac gtgctgacca accagaaaca taattgaata cagcagcaat tggcaagctg 9420
cttacataga actcgcggcg attggcatgc cgccttaaaa tttttatttt attttttctt 9480
ttcttttccg aatcggattt tgtttttaat atttcaaaaa aaaaaaaaaa aaaaaaaaaa 9540
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaa 9595
<210> 16
<211> 139
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 16
Pro Ser Ser Leu Ser Ala Ser Val Gly Asp Arg Val Thr Ile Thr Cys
1 5 10 15
Arg Ala Ser Gln Ser Ile Asn Ser Tyr Leu Asp Trp Tyr Gln Gln Lys
20 25 30
Pro Gly Lys Ala Pro Lys Leu Leu Ile Tyr Ala Ala Ser Ser Leu Gln
35 40 45
Ser Gly Val Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe
50 55 60
Thr Leu Thr Ile Ser Ser Leu Gln Pro Glu Asp Phe Ala Thr Tyr Tyr
65 70 75 80
Cys Gln Gln Tyr Tyr Ser Thr Pro Phe Thr Phe Gly Pro Gly Thr Lys
85 90 95
Val Glu Ile Lys Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro
100 105 110
Pro Ser Asp Glu Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu
115 120 125
Leu Asn Asn Phe Tyr Pro Arg Glu Ala Lys Val
130 135
<210> 17
<211> 167
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 17
Gly Val Val Gln Pro Gly Arg Ser Leu Arg Leu Ser Cys Ala Ala Ser
1 5 10 15
Gly Phe Thr Phe Ser Ser Tyr Gly Met His Trp Val Arg Gln Ala Pro
20 25 30
Gly Lys Gly Leu Glu Trp Val Ala Val Ile Trp Tyr Asp Gly Ser Asn
35 40 45
Lys Tyr Tyr Ala Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asp
50 55 60
Asn Ser Lys Asn Thr Leu Tyr Leu Gln Met Asn Ser Leu Arg Ala Glu
65 70 75 80
Asp Thr Ala Val Tyr Tyr Cys Ala Arg Asp Pro Arg Gly Ala Thr Leu
85 90 95
Tyr Tyr Tyr Tyr Tyr Gly Met Asp Val Trp Gly Gln Gly Thr Thr Val
100 105 110
Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala
115 120 125
Pro Cys Ser Arg Ser Thr Ser Glu Ser Thr Ala Ala Leu Gly Cys Leu
130 135 140
Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly
145 150 155 160
Ala Leu Thr Ser Gly Val His
165
<210> 18
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 18
Gly Phe Thr Phe Ser Ser Tyr Gly Met His
1 5 10
<210> 19
<211> 15
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 19
Val Ile Trp Tyr Asp Gly Ser Asn Lys Tyr Tyr Ala Asp Ser Val
1 5 10 15
<210> 20
<211> 16
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 20
Asp Pro Arg Gly Ala Thr Leu Tyr Tyr Tyr Tyr Tyr Gly Met Asp Val
1 5 10 15
<210> 21
<211> 11
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 21
Arg Ala Ser Gln Ser Ile Asn Ser Tyr Leu Asp
1 5 10
<210> 22
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 22
Ala Ala Ser Ser Leu Gln Ser
1 5
<210> 23
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 23
Gln Gln Tyr Tyr Ser Thr Pro Phe Thr
1 5
<210> 24
<211> 108
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 24
Glu Ile Val Leu Thr Gln Ser Pro Gly Thr Leu Ser Leu Ser Pro Gly
1 5 10 15
Glu Arg Ala Thr Leu Ser Cys Arg Ala Ser Gln Arg Val Ser Ser Ser
20 25 30
Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly Gln Ala Pro Arg Leu Leu
35 40 45
Ile Tyr Asp Ala Ser Ser Arg Ala Thr Gly Ile Pro Asp Arg Phe Ser
50 55 60
Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Arg Leu Glu
65 70 75 80
Pro Glu Asp Phe Ala Val Tyr Tyr Cys Gln Gln Tyr Gly Ser Leu Pro
85 90 95
Trp Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys
100 105
<210> 25
<211> 121
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 25
Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly
1 5 10 15
Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe Ser Arg Tyr
20 25 30
Trp Met Ser Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val
35 40 45
Ala Asn Ile Lys Gln Asp Gly Ser Glu Lys Tyr Tyr Val Asp Ser Val
50 55 60
Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Ser Leu Tyr
65 70 75 80
Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys
85 90 95
Ala Arg Glu Gly Gly Trp Phe Gly Glu Leu Ala Phe Asp Tyr Trp Gly
100 105 110
Gln Gly Thr Leu Val Thr Val Ser Ser
115 120
<210> 26
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 26
Arg Tyr Trp Met Ser
1 5
<210> 27
<211> 17
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 27
Asn Ile Lys Gln Asp Gly Ser Glu Lys Tyr Tyr Val Asp Ser Val Lys
1 5 10 15
Gly
<210> 28
<211> 12
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 28
Glu Gly Gly Trp Phe Gly Glu Leu Ala Phe Asp Tyr
1 5 10
<210> 29
<211> 12
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 29
Arg Ala Ser Gln Arg Val Ser Ser Ser Tyr Leu Ala
1 5 10
<210> 30
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 30
Asp Ala Ser Ser Arg Ala Thr
1 5
<210> 31
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 31
Gln Gln Tyr Gly Ser Leu Pro Trp Thr
1 5
<210> 32
<211> 2019
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 32
gcccgggcat ttaaatgcga tcgcatcgat tacgactcta gaatagtcta gtccgcaggc 60
caccatgcag atcttcgtga agaccctgac cggcaagacc atcaccctag aggtggagcc 120
cagtgacacc atcgagaacg tgaaggccaa gatccaggat aaagagggca tcccccctga 180
ccagcagagg ctgatctttg ccggcaagca gctggaagat ggccgcaccc tctctgatta 240
caacatccag aaggagtcaa ccctgcacct ggtccttcgc ctgagaggtg ccatgtttca 300
ggcgctgagc gaaggctgca ccccgtatga tattaaccag atgctgaacg tgctgggcga 360
tcatcaggtc tcaggccttg agcagcttga gagtataatc aactttgaaa aactgactga 420
atggaccagt tctaatgtta tgcctatcct gtctcctctg acaaagggca tcctgggctt 480
cgtgtttacc ctgaccgtgc cttctgagag aggacttagc tgcattagcg aagcggatgc 540
gaccaccccg gaaagcgcga acctgggcga agaaattctg agccagctgt atctttggcc 600
aagggtgacc taccattccc ctagttatgc ttaccaccaa tttgaaagac gagccaaata 660
taaaagacac ttccccggct ttggccagag cctgctgttt ggctaccctg tgtacgtgtt 720
cggcgattgc gtgcagggcg attgggatgc gattcgcttt cgctattgcg cgccgccggg 780
ctatgcgctg ctgcgctgca acgataccaa ctatagcgct ctgctggctg tgggggccct 840
agaaggaccc aggaatcagg actggcttgg tgtcccaaga caacttgtaa ctcggatgca 900
ggctattcag aatgccggcc tgtgtaccct ggtggccatg ctggaagaga caatcttctg 960
gctgcaagcg tttctgatgg cgctgaccga tagcggcccg aaaaccaaca ttattgtgga 1020
tagccagtat gtgatgggca ttagcaaacc gagctttcag gaatttgtgg attgggaaaa 1080
cgtgagcccg gaactgaaca gcaccgatca gccgttttgg caagccggaa tcctggccag 1140
aaatctggtg cctatggtgg ccacagtgca gggccagaac ctgaagtacc agggtcagtc 1200
actagtcatc tctgcttcta tcattgtctt caacctgctg gaactggaag gtgattatcg 1260
agatgatggc aacgtgtggg tgcatacccc gctgagcccg cgcaccctga acgcgtgggt 1320
gaaagcggtg gaagaaaaaa aaggtattcc agttcaccta gagctggcca gtatgaccaa 1380
catggagctc atgagcagta ttgtgcatca gcaggtcaga acatacggcc ccgtgttcat 1440
gtgtctcggc ggactgctta caatggtggc tggtgctgtg tggctgacag tgcgagtgct 1500
cgagctgttc cgggccgcgc agctggccaa cgacgtggtc ctccagatca tggagctttg 1560
tggtgcagcg tttcgccagg tgtgccatac caccgtgccg tggccgaacg cgagcctgac 1620
cccgaaatgg aacaacgaaa ccacccagcc ccagatcgcc aactgcagcg tgtatgactt 1680
ttttgtgtgg ctccattatt attctgttcg agacacactt tggccaaggg tgacctacca 1740
tatgaacaaa tatgcgtatc atatgctgga aagacgagcc aaatataaaa gaggaccagg 1800
acctggcgct aaatttgtgg ccgcctggac actgaaagcc gctgctggtc ctggacctgg 1860
ccagtacatc aaggccaaca gcaagttcat cggcatcacc gaactcggac ccggaccagg 1920
ctgatgattt cgaaatttaa ataagcttgc ggccgctagg gataacaggg taattatcac 1980
gcccaaacat ttacagccgc ggtgtcaaaa accgcgtgg 2019
<210> 33
<211> 619
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 33
Met Gln Ile Phe Val Lys Thr Leu Thr Gly Lys Thr Ile Thr Leu Glu
1 5 10 15
Val Glu Pro Ser Asp Thr Ile Glu Asn Val Lys Ala Lys Ile Gln Asp
20 25 30
Lys Glu Gly Ile Pro Pro Asp Gln Gln Arg Leu Ile Phe Ala Gly Lys
35 40 45
Gln Leu Glu Asp Gly Arg Thr Leu Ser Asp Tyr Asn Ile Gln Lys Glu
50 55 60
Ser Thr Leu His Leu Val Leu Arg Leu Arg Gly Ala Met Phe Gln Ala
65 70 75 80
Leu Ser Glu Gly Cys Thr Pro Tyr Asp Ile Asn Gln Met Leu Asn Val
85 90 95
Leu Gly Asp His Gln Val Ser Gly Leu Glu Gln Leu Glu Ser Ile Ile
100 105 110
Asn Phe Glu Lys Leu Thr Glu Trp Thr Ser Ser Asn Val Met Pro Ile
115 120 125
Leu Ser Pro Leu Thr Lys Gly Ile Leu Gly Phe Val Phe Thr Leu Thr
130 135 140
Val Pro Ser Glu Arg Gly Leu Ser Cys Ile Ser Glu Ala Asp Ala Thr
145 150 155 160
Thr Pro Glu Ser Ala Asn Leu Gly Glu Glu Ile Leu Ser Gln Leu Tyr
165 170 175
Leu Trp Pro Arg Val Thr Tyr His Ser Pro Ser Tyr Ala Tyr His Gln
180 185 190
Phe Glu Arg Arg Ala Lys Tyr Lys Arg His Phe Pro Gly Phe Gly Gln
195 200 205
Ser Leu Leu Phe Gly Tyr Pro Val Tyr Val Phe Gly Asp Cys Val Gln
210 215 220
Gly Asp Trp Asp Ala Ile Arg Phe Arg Tyr Cys Ala Pro Pro Gly Tyr
225 230 235 240
Ala Leu Leu Arg Cys Asn Asp Thr Asn Tyr Ser Ala Leu Leu Ala Val
245 250 255
Gly Ala Leu Glu Gly Pro Arg Asn Gln Asp Trp Leu Gly Val Pro Arg
260 265 270
Gln Leu Val Thr Arg Met Gln Ala Ile Gln Asn Ala Gly Leu Cys Thr
275 280 285
Leu Val Ala Met Leu Glu Glu Thr Ile Phe Trp Leu Gln Ala Phe Leu
290 295 300
Met Ala Leu Thr Asp Ser Gly Pro Lys Thr Asn Ile Ile Val Asp Ser
305 310 315 320
Gln Tyr Val Met Gly Ile Ser Lys Pro Ser Phe Gln Glu Phe Val Asp
325 330 335
Trp Glu Asn Val Ser Pro Glu Leu Asn Ser Thr Asp Gln Pro Phe Trp
340 345 350
Gln Ala Gly Ile Leu Ala Arg Asn Leu Val Pro Met Val Ala Thr Val
355 360 365
Gln Gly Gln Asn Leu Lys Tyr Gln Gly Gln Ser Leu Val Ile Ser Ala
370 375 380
Ser Ile Ile Val Phe Asn Leu Leu Glu Leu Glu Gly Asp Tyr Arg Asp
385 390 395 400
Asp Gly Asn Val Trp Val His Thr Pro Leu Ser Pro Arg Thr Leu Asn
405 410 415
Ala Trp Val Lys Ala Val Glu Glu Lys Lys Gly Ile Pro Val His Leu
420 425 430
Glu Leu Ala Ser Met Thr Asn Met Glu Leu Met Ser Ser Ile Val His
435 440 445
Gln Gln Val Arg Thr Tyr Gly Pro Val Phe Met Cys Leu Gly Gly Leu
450 455 460
Leu Thr Met Val Ala Gly Ala Val Trp Leu Thr Val Arg Val Leu Glu
465 470 475 480
Leu Phe Arg Ala Ala Gln Leu Ala Asn Asp Val Val Leu Gln Ile Met
485 490 495
Glu Leu Cys Gly Ala Ala Phe Arg Gln Val Cys His Thr Thr Val Pro
500 505 510
Trp Pro Asn Ala Ser Leu Thr Pro Lys Trp Asn Asn Glu Thr Thr Gln
515 520 525
Pro Gln Ile Ala Asn Cys Ser Val Tyr Asp Phe Phe Val Trp Leu His
530 535 540
Tyr Tyr Ser Val Arg Asp Thr Leu Trp Pro Arg Val Thr Tyr His Met
545 550 555 560
Asn Lys Tyr Ala Tyr His Met Leu Glu Arg Arg Ala Lys Tyr Lys Arg
565 570 575
Gly Pro Gly Pro Gly Ala Lys Phe Val Ala Ala Trp Thr Leu Lys Ala
580 585 590
Ala Ala Gly Pro Gly Pro Gly Gln Tyr Ile Lys Ala Asn Ser Lys Phe
595 600 605
Ile Gly Ile Thr Glu Leu Gly Pro Gly Pro Gly
610 615
<210> 34
<211> 1638
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 34
atggccggga tgttccaggc actgtccgaa ggctgcacac cctatgatat taaccagatg 60
ctgaatgtcc tgggagacca ccaggtctct ggcctggagc agctggagag catcatcaac 120
ttcgagaagc tgaccgagtg gacaagctcc aatgtgatgc ctatcctgtc cccactgacc 180
aagggcatcc tgggcttcgt gtttaccctg acagtgcctt ctgagcgggg cctgtcttgc 240
atcagcgagg cagacgcaac cacaccagag tccgccaatc tgggcgagga gatcctgtct 300
cagctgtacc tgtggccccg ggtgacatat cactcccctt cttacgccta tcaccagttc 360
gagcggagag ccaagtacaa gagacacttc ccaggctttg gccagtctct gctgttcggc 420
taccccgtgt acgtgttcgg cgattgcgtg cagggcgact gggatgccat ccggtttaga 480
tactgcgcac cacctggata tgcactgctg aggtgtaacg acaccaatta ttccgccctg 540
ctggcagtgg gcgccctgga gggccctcgc aatcaggatt ggctgggcgt gccaaggcag 600
ctggtgacac gcatgcaggc catccagaac gcaggcctgt gcaccctggt ggcaatgctg 660
gaggagacaa tcttctggct gcaggccttt ctgatggccc tgaccgacag cggccccaag 720
acaaacatca tcgtggattc ccagtacgtg atgggcatct ccaagccttc tttccaggag 780
tttgtggact gggagaacgt gagcccagag ctgaattcca ccgatcagcc attctggcag 840
gcaggaatcc tggcaaggaa cctggtgcct atggtggcca cagtgcaggg ccagaatctg 900
aagtaccagg gccagagcct ggtcatcagc gcctccatca tcgtgtttaa cctgctggag 960
ctggagggcg actatcggga cgatggcaac gtgtgggtgc acaccccact gagccccaga 1020
acactgaacg cctgggtgaa ggccgtggag gagaagaagg gcatcccagt gcacctggag 1080
ctggcctcca tgaccaatat ggagctgatg tctagcatcg tgcaccagca ggtgaggaca 1140
tacggacccg tgttcatgtg cctgggaggc ctgctgacca tggtggcagg agccgtgtgg 1200
ctgacagtgc gggtgctgga gctgttcaga gccgcccagc tggccaacga tgtggtgctg 1260
cagatcatgg agctgtgcgg agcagccttt cgccaggtgt gccacaccac agtgccatgg 1320
cccaatgcct ccctgacccc caagtggaac aatgagacaa cacagcctca gatcgccaac 1380
tgtagcgtgt acgacttctt cgtgtggctg cactactata gcgtgaggga taccctgtgg 1440
ccccgcgtga cataccacat gaataagtac gcctatcaca tgctggagag gcgcgccaag 1500
tataagagag gccctggccc aggcgcaaag tttgtggcag catggaccct gaaggccgcc 1560
gccggccccg gccccggcca gtatatcaag gctaacagta agttcattgg aatcacagag 1620
ctgggacccg gacctgga 1638
<210> 35
<211> 546
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 35
Met Ala Gly Met Phe Gln Ala Leu Ser Glu Gly Cys Thr Pro Tyr Asp
1 5 10 15
Ile Asn Gln Met Leu Asn Val Leu Gly Asp His Gln Val Ser Gly Leu
20 25 30
Glu Gln Leu Glu Ser Ile Ile Asn Phe Glu Lys Leu Thr Glu Trp Thr
35 40 45
Ser Ser Asn Val Met Pro Ile Leu Ser Pro Leu Thr Lys Gly Ile Leu
50 55 60
Gly Phe Val Phe Thr Leu Thr Val Pro Ser Glu Arg Gly Leu Ser Cys
65 70 75 80
Ile Ser Glu Ala Asp Ala Thr Thr Pro Glu Ser Ala Asn Leu Gly Glu
85 90 95
Glu Ile Leu Ser Gln Leu Tyr Leu Trp Pro Arg Val Thr Tyr His Ser
100 105 110
Pro Ser Tyr Ala Tyr His Gln Phe Glu Arg Arg Ala Lys Tyr Lys Arg
115 120 125
His Phe Pro Gly Phe Gly Gln Ser Leu Leu Phe Gly Tyr Pro Val Tyr
130 135 140
Val Phe Gly Asp Cys Val Gln Gly Asp Trp Asp Ala Ile Arg Phe Arg
145 150 155 160
Tyr Cys Ala Pro Pro Gly Tyr Ala Leu Leu Arg Cys Asn Asp Thr Asn
165 170 175
Tyr Ser Ala Leu Leu Ala Val Gly Ala Leu Glu Gly Pro Arg Asn Gln
180 185 190
Asp Trp Leu Gly Val Pro Arg Gln Leu Val Thr Arg Met Gln Ala Ile
195 200 205
Gln Asn Ala Gly Leu Cys Thr Leu Val Ala Met Leu Glu Glu Thr Ile
210 215 220
Phe Trp Leu Gln Ala Phe Leu Met Ala Leu Thr Asp Ser Gly Pro Lys
225 230 235 240
Thr Asn Ile Ile Val Asp Ser Gln Tyr Val Met Gly Ile Ser Lys Pro
245 250 255
Ser Phe Gln Glu Phe Val Asp Trp Glu Asn Val Ser Pro Glu Leu Asn
260 265 270
Ser Thr Asp Gln Pro Phe Trp Gln Ala Gly Ile Leu Ala Arg Asn Leu
275 280 285
Val Pro Met Val Ala Thr Val Gln Gly Gln Asn Leu Lys Tyr Gln Gly
290 295 300
Gln Ser Leu Val Ile Ser Ala Ser Ile Ile Val Phe Asn Leu Leu Glu
305 310 315 320
Leu Glu Gly Asp Tyr Arg Asp Asp Gly Asn Val Trp Val His Thr Pro
325 330 335
Leu Ser Pro Arg Thr Leu Asn Ala Trp Val Lys Ala Val Glu Glu Lys
340 345 350
Lys Gly Ile Pro Val His Leu Glu Leu Ala Ser Met Thr Asn Met Glu
355 360 365
Leu Met Ser Ser Ile Val His Gln Gln Val Arg Thr Tyr Gly Pro Val
370 375 380
Phe Met Cys Leu Gly Gly Leu Leu Thr Met Val Ala Gly Ala Val Trp
385 390 395 400
Leu Thr Val Arg Val Leu Glu Leu Phe Arg Ala Ala Gln Leu Ala Asn
405 410 415
Asp Val Val Leu Gln Ile Met Glu Leu Cys Gly Ala Ala Phe Arg Gln
420 425 430
Val Cys His Thr Thr Val Pro Trp Pro Asn Ala Ser Leu Thr Pro Lys
435 440 445
Trp Asn Asn Glu Thr Thr Gln Pro Gln Ile Ala Asn Cys Ser Val Tyr
450 455 460
Asp Phe Phe Val Trp Leu His Tyr Tyr Ser Val Arg Asp Thr Leu Trp
465 470 475 480
Pro Arg Val Thr Tyr His Met Asn Lys Tyr Ala Tyr His Met Leu Glu
485 490 495
Arg Arg Ala Lys Tyr Lys Arg Gly Pro Gly Pro Gly Ala Lys Phe Val
500 505 510
Ala Ala Trp Thr Leu Lys Ala Ala Ala Gly Pro Gly Pro Gly Gln Tyr
515 520 525
Ile Lys Ala Asn Ser Lys Phe Ile Gly Ile Thr Glu Leu Gly Pro Gly
530 535 540
Pro Gly
545
<210> 36
<211> 2019
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 36
gcccgggcat ttaaatgcga tcgcatcgat tacgactcta gaatagtcta gtccgcaggc 60
caccatgcag atcttcgtga agaccctgac cggcaagacc atcaccctag aggtggagcc 120
cagtgacacc atcgagaacg tgaaggccaa gatccaggat aaagagggca tcccccctga 180
ccagcagagg ctgatctttg ccggcaagca gctggaagat ggccgcaccc tctctgatta 240
caacatccag aaggagtcaa ccctgcacct ggtccttcgc ctgagaggtg ccatgtttca 300
ggcgctgagc gaaggctgca ccccgtatga tattaaccag atgctgaacg tgctgggcga 360
tcatcagttt aagcacatca aagcctttga ccggacattt gctaacaacc caggtcccat 420
ggttgtgttt gccacacctg ggcctatcct gtctcctctg acaaagggca tcctgggctt 480
cgtgtttacc ctgaccgtgc cttctgagag aggacttagc tgcattagcg aagcggatgc 540
gaccaccccg gaaagcgcga acctgggcga agaaattctg agccagctgt atctttggcc 600
aagggtgacc taccattccc ctagttatgc ttaccaccaa tttgaaagac gagccaaata 660
taaaagacac ttccccggct ttggccagag cctgctgttt ggctaccctg tgtacgtgtt 720
cggcgattgc gtgcagggcg attgggatgc gattcgcttt cgctattgcg cgccgccggg 780
ctatgcgctg ctgcgctgca acgataccaa ctatagcgct ctgctggctg tgggggccct 840
agaaggaccc aggaatcagg actggcttgg tgtcccaaga caacttgtaa ctcggatgca 900
ggctattcag aatgccggcc tgtgtaccct ggtggccatg ctggaagaga caatcttctg 960
gctgcaagcg tttctgatgg cgctgaccga tagcggcccg aaaaccaaca ttattgtgga 1020
tagccagtat gtgatgggca ttagcaaacc gagctttcag gaatttgtgg attgggaaaa 1080
cgtgagcccg gaactgaaca gcaccgatca gccgttttgg caagccggaa tcctggccag 1140
aaatctggtg cctatggtgg ccacagtgca gggccagaac ctgaagtacc agggtcagtc 1200
actagtcatc tctgcttcta tcattgtctt caacctgctg gaactggaag gtgattatcg 1260
agatgatggc aacgtgtggg tgcatacccc gctgagcccg cgcaccctga acgcgtgggt 1320
gaaagcggtg gaagaaaaaa aaggtattcc agttcaccta gagctggcca gtatgaccaa 1380
catggagctc atgagcagta ttgtgcatca gcaggtcaga acatacggcc ccgtgttcat 1440
gtgtctcggc ggactgctta caatggtggc tggtgctgtg tggctgacag tgcgagtgct 1500
cgagctgttc cgggccgcgc agctggccaa cgacgtggtc ctccagatca tggagctttg 1560
tggtgcagcg tttcgccagg tgtgccatac caccgtgccg tggccgaacg cgagcctgac 1620
cccgaaatgg aacaacgaaa ccacccagcc ccagatcgcc aactgcagcg tgtatgactt 1680
ttttgtgtgg ctccattatt attctgttcg agacacactt tggccaaggg tgacctacca 1740
tatgaacaaa tatgcgtatc atatgctgga aagacgagcc aaatataaaa gaggaccagg 1800
acctggcgct aaatttgtgg ccgcctggac actgaaagcc gctgctggtc ctggacctgg 1860
ccagtacatc aaggccaaca gcaagttcat cggcatcacc gaactcggac ccggaccagg 1920
ctgatgattt cgaaatttaa ataagcttgc ggccgctagg gataacaggg taattatcac 1980
gcccaaacat ttacagccgc ggtgtcaaaa accgcgtgg 2019
<210> 37
<211> 619
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 37
Met Gln Ile Phe Val Lys Thr Leu Thr Gly Lys Thr Ile Thr Leu Glu
1 5 10 15
Val Glu Pro Ser Asp Thr Ile Glu Asn Val Lys Ala Lys Ile Gln Asp
20 25 30
Lys Glu Gly Ile Pro Pro Asp Gln Gln Arg Leu Ile Phe Ala Gly Lys
35 40 45
Gln Leu Glu Asp Gly Arg Thr Leu Ser Asp Tyr Asn Ile Gln Lys Glu
50 55 60
Ser Thr Leu His Leu Val Leu Arg Leu Arg Gly Ala Met Phe Gln Ala
65 70 75 80
Leu Ser Glu Gly Cys Thr Pro Tyr Asp Ile Asn Gln Met Leu Asn Val
85 90 95
Leu Gly Asp His Gln Phe Lys His Ile Lys Ala Phe Asp Arg Thr Phe
100 105 110
Ala Asn Asn Pro Gly Pro Met Val Val Phe Ala Thr Pro Gly Pro Ile
115 120 125
Leu Ser Pro Leu Thr Lys Gly Ile Leu Gly Phe Val Phe Thr Leu Thr
130 135 140
Val Pro Ser Glu Arg Gly Leu Ser Cys Ile Ser Glu Ala Asp Ala Thr
145 150 155 160
Thr Pro Glu Ser Ala Asn Leu Gly Glu Glu Ile Leu Ser Gln Leu Tyr
165 170 175
Leu Trp Pro Arg Val Thr Tyr His Ser Pro Ser Tyr Ala Tyr His Gln
180 185 190
Phe Glu Arg Arg Ala Lys Tyr Lys Arg His Phe Pro Gly Phe Gly Gln
195 200 205
Ser Leu Leu Phe Gly Tyr Pro Val Tyr Val Phe Gly Asp Cys Val Gln
210 215 220
Gly Asp Trp Asp Ala Ile Arg Phe Arg Tyr Cys Ala Pro Pro Gly Tyr
225 230 235 240
Ala Leu Leu Arg Cys Asn Asp Thr Asn Tyr Ser Ala Leu Leu Ala Val
245 250 255
Gly Ala Leu Glu Gly Pro Arg Asn Gln Asp Trp Leu Gly Val Pro Arg
260 265 270
Gln Leu Val Thr Arg Met Gln Ala Ile Gln Asn Ala Gly Leu Cys Thr
275 280 285
Leu Val Ala Met Leu Glu Glu Thr Ile Phe Trp Leu Gln Ala Phe Leu
290 295 300
Met Ala Leu Thr Asp Ser Gly Pro Lys Thr Asn Ile Ile Val Asp Ser
305 310 315 320
Gln Tyr Val Met Gly Ile Ser Lys Pro Ser Phe Gln Glu Phe Val Asp
325 330 335
Trp Glu Asn Val Ser Pro Glu Leu Asn Ser Thr Asp Gln Pro Phe Trp
340 345 350
Gln Ala Gly Ile Leu Ala Arg Asn Leu Val Pro Met Val Ala Thr Val
355 360 365
Gln Gly Gln Asn Leu Lys Tyr Gln Gly Gln Ser Leu Val Ile Ser Ala
370 375 380
Ser Ile Ile Val Phe Asn Leu Leu Glu Leu Glu Gly Asp Tyr Arg Asp
385 390 395 400
Asp Gly Asn Val Trp Val His Thr Pro Leu Ser Pro Arg Thr Leu Asn
405 410 415
Ala Trp Val Lys Ala Val Glu Glu Lys Lys Gly Ile Pro Val His Leu
420 425 430
Glu Leu Ala Ser Met Thr Asn Met Glu Leu Met Ser Ser Ile Val His
435 440 445
Gln Gln Val Arg Thr Tyr Gly Pro Val Phe Met Cys Leu Gly Gly Leu
450 455 460
Leu Thr Met Val Ala Gly Ala Val Trp Leu Thr Val Arg Val Leu Glu
465 470 475 480
Leu Phe Arg Ala Ala Gln Leu Ala Asn Asp Val Val Leu Gln Ile Met
485 490 495
Glu Leu Cys Gly Ala Ala Phe Arg Gln Val Cys His Thr Thr Val Pro
500 505 510
Trp Pro Asn Ala Ser Leu Thr Pro Lys Trp Asn Asn Glu Thr Thr Gln
515 520 525
Pro Gln Ile Ala Asn Cys Ser Val Tyr Asp Phe Phe Val Trp Leu His
530 535 540
Tyr Tyr Ser Val Arg Asp Thr Leu Trp Pro Arg Val Thr Tyr His Met
545 550 555 560
Asn Lys Tyr Ala Tyr His Met Leu Glu Arg Arg Ala Lys Tyr Lys Arg
565 570 575
Gly Pro Gly Pro Gly Ala Lys Phe Val Ala Ala Trp Thr Leu Lys Ala
580 585 590
Ala Ala Gly Pro Gly Pro Gly Gln Tyr Ile Lys Ala Asn Ser Lys Phe
595 600 605
Ile Gly Ile Thr Glu Leu Gly Pro Gly Pro Gly
610 615
<210> 38
<211> 228
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 38
atgcagatct tcgtgaagac cctgaccggc aagaccatca ccctagaggt ggagcccagt 60
gacaccatcg agaacgtgaa ggccaagatc caggataaag agggcatccc ccctgaccag 120
cagaggctga tctttgccgg caagcagctg gaagatggcc gcaccctctc tgattacaac 180
atccagaagg agtcaaccct gcacctggtc cttcgcctga gaggtggc 228
<210> 39
<211> 228
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 39
atgcagatct tcgtgaagac cctgaccggc aagaccatca ccctagaggt ggagcccagt 60
gacaccatcg agaacgtgaa ggccaagatc caggataaag agggcatccc ccctgaccag 120
cagaggctga tctttgccgg caagcagctg gaagatggcc gcaccctctc tgattacaac 180
atccagaagg agtcaaccct gcacctggtc cttcgcctga gaggtgcc 228
<210> 40
<211> 78
<212> DNA
<213> Homo sapiens
<400> 40
atggccgtca tggcgccccg aaccctcgtc ctgctactct cgggggctct ggccctgacc 60
cagacctggg cgggctct 78
<210> 41
<211> 201
<212> DNA
<213> Homo sapiens
<400> 41
ccgtcttccc agcccaccat ccccatcgtg ggcatcattg ctggcctggt tctctttgga 60
gctgtgatca ctggagctgt ggtcgctgct gtgatgtgga ggaggaagag ctcagataga 120
aaaggaggga gctactctca ggctgcaagc agtgacagtg cccagggctc tgatgtgtct 180
ctcacagctt gtaaagtgtg a 201
<210> 42
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 42
atggagaccg atacactgct gctgtgggtg ctgctcctgt gggtgccagg aagcacaggc 60
<210> 43
<211> 3178
<212> DNA
<213> Homo sapiens
<400> 43
ggcaccgatt cggggcctgc ccggacttcg ccgcacgctg cagaacctcg cccagcgccc 60
accatgcccc ggcagctcag cgcggcggcc gcgctcttcg cgtccctggc cgtaattttg 120
cacgatggca gtcaaatgag agcaaaagca tttccagaaa ccagagatta ttctcaacct 180
actgcagcag caacagtaca ggacataaaa aaacctgtcc agcaaccagc taagcaagca 240
cctcaccaaa ctttagcagc aagattcatg gatggtcata tcacctttca aacagcggcc 300
acagtaaaaa ttccaacaac taccccagca actacaaaaa acactgcaac caccagccca 360
attacctaca ccctggtcac aacccaggcc acacccaaca actcacacac agctcctcca 420
gttactgaag ttacagtcgg ccctagctta gccccttatt cactgccacc caccatcacc 480
ccaccagctc atacagctgg aaccagttca tcaaccgtca gccacacaac tgggaacacc 540
actcaaccca gtaaccagac cacccttcca gcaactttat cgatagcact gcacaaaagc 600
acaaccggtc agaagcctga tcaacccacc catgccccag gaacaacggc agctgcccac 660
aataccaccc gcacagctgc acctgcctcc acggttcctg ggcccaccct tgcacctcag 720
ccatcgtcag tcaagactgg aatttatcag gttctaaacg gaagcagact ctgtataaaa 780
gcagagatgg ggatacagct gattgttcaa gacaaggagt cggttttttc acctcggaga 840
tacttcaaca tcgaccccaa cgcaacgcaa gcctctggga actgtggcac ccgaaaatcc 900
aaccttctgt tgaattttca gggcggattt gtgaatctca catttaccaa ggatgaagaa 960
tcatattata tcagtgaagt gggagcctat ttgaccgtct cagatccaga gacagtttac 1020
caaggaatca aacatgcggt ggtgatgttc cagacagcag tcgggcattc cttcaagtgc 1080
gtgagtgaac agagcctcca gttgtcagcc cacctgcagg tgaaaacaac cgatgtccaa 1140
cttcaagcct ttgattttga agatgaccac tttggaaatg tggatgagtg ctcgtctgac 1200
tacacaattg tgcttcctgt gattggggcc atcgtggttg gtctctgcct tatgggtatg 1260
ggtgtctata aaatccgcct aaggtgtcaa tcatctggat accagagaat ctaattgttg 1320
cccgggggga atgaaaataa tggaatttag agaactcttt catcccttcc aggatggatg 1380
ttgggaaatt ccctcagagt gtgggtcctt caaacaatgt aaaccaccat cttctattca 1440
aatgaagtga gtcatgtgtg atttaagttc aggcagcaca tcaatttcta aatacttttt 1500
gtttatttta tgaaagatat agtgagctgt ttattttcta gtttccttta gaatatttta 1560
gccactcaaa gtcaacattt gagatatgtt gaattaacat aatatatgta aagtagaata 1620
agccttcaaa ttataaacca agggtcaatt gtaactaata ctactgtgtg tgcattgaag 1680
attttatttt acccttgatc ttaacaaagc ctttgctttg ttatcaaatg gactttcagt 1740
gcttttacta tctgtgtttt atggtttcat gtaacataca tattcctggt gtagcactta 1800
actccttttc cactttaaat ttgtttttgt tttttgagac ggagtttcac tcttgtcacc 1860
caggctggag tacagtggca cgatctcggc ttatggcaac ctccgcctcc cgggttcaag 1920
tgattctcct gcttcagctt cccgagtagc tgggattaca ggcacacact accacgcctg 1980
gctaattttt gtatttttat tatagacggg tttcaccatg ttggccagac tggtcttgaa 2040
ctcttgacct caggtgatcc acccacctca gcctcccaaa gtgctgggat tacaggcatg 2100
agccattgcg cccggcctta aatgtttttt ttaatcatca aaaagaacaa catatctcag 2160
gttgtctaag tgtttttatg taaaaccaac aaaaagaaca aatcagctta tattttttat 2220
cttgatgact cctgctccag aattgctaga ctaagaatta ggtggctaca gatggtagaa 2280
ctaaacaata agcaagagac aataataatg gcccttaatt attaacaaag tgccagagtc 2340
taggctaagc actttatcta tatctcattt cattctcaca acttataagt gaatgagtaa 2400
actgagactt aagggaactg aatcacttaa atgtcacctg gctaactgat ggcagagcca 2460
gagcttgaat tcatgttggt ctgacatcaa ggtctttggt cttctcccta caccaagtta 2520
cctacaagaa caatgacacc acactctgcc tgaaggctca cacctcatac cagcatacgc 2580
tcaccttaca gggaaatggg tttatccagg atcatgagac attagggtag atgaaaggag 2640
agctttgcag ataacaaaat agcctatcct taataaatcc tccactctct ggaaggagac 2700
tgaggggctt tgtaaaacat tagtcagttg ctcattttta tgggattgct tagctgggct 2760
gtaaagatga aggcatcaaa taaactcaaa gtatttttaa atttttttga taatagagaa 2820
acttcgctaa ccaactgttc tttcttgagt gtatagcccc atcttgtggt aacttgctgc 2880
ttctgcactt catatccata tttcctattg ttcactttat tctgtagagc agcctgccaa 2940
gaattttatt tctgctgttt tttttgctgc taaagaaagg aactaagtca ggatgttaac 3000
agaaaagtcc acataaccct agaattctta gtcaaggaat aattcaagtc agcctagaga 3060
ccatgttgac tttcctcatg tgtttcctta tgactcagta agttggcaag gtcctgactt 3120
tagtcttaat aaaacattga attgtagtaa aggtttttgc aataaaaact tactttgg 3178
<210> 44
<211> 1858
<212> DNA
<213> Mus sp.
<400> 44
attccggagg tgaaaaacaa tggcacaacg tgtataatgg ccagcttctc tgcctccttt 60
ctgaccacct acgagactgc gaatggttct cagatcgtga acatttccct gccagcctct 120
gcagaagtac tgaaaaatgg cagttcttgt ggtaaagaaa atgtttctga ccccagcctc 180
acaattactt ttggaagagg atatttactg acactcaact tcacaaaaaa tacaacacgt 240
tacagtgtcc agcatatgta ttttacatat aacttgtcag atacagaaca ttttcccaat 300
gccatcagca aagagatcta caccatggat tccacaactg acatcaaggc agacatcaac 360
aaagcatacc ggtgtgtcag tgatatccgg gtctacatga agaatgtgac cgttgtgctc 420
cgggatgcca ctatccaggc ctacctgtcg agtggcaact tcagcaagga agagacacac 480
tgcacacagg atggaccttc cccaaccact gggccaccca gcccctcacc accacttgtg 540
cccacaaacc ccactgtatc caagtacaat gttactggta acaacggaac ctgcctgctg 600
gcctctatgg cactgcaact gaatatcacc tacctgaaaa aggacaacaa gacggtgacc 660
agagcgttca acatcagccc aaatgacaca tctagtggga gttgcggtat caacttggtg 720
accctgaaag tggagaacaa gaacagagcc ctggaattgc agtttgggat gaatgccagc 780
tctagcctgt ttttcttgca aggagtgcgc ttgaatatga ctcttcctga tgccctagtg 840
cccacattca gcatctccaa ccattcactg aaagctcttc aggccactgt gggaaactca 900
tacaagtgca acactgagga acacatcttt gtcagcaaga tgctctccct caatgtcttc 960
agtgtgcagg tccaggcttt caaggtggac agtgacaggt ttgggtctgt ggaagagtgt 1020
gttcaggatg gtaacaacat gttgatcccc attgctgtgg gcggtgccct ggcagggctg 1080
atcctcatcg tcctcattgc ctacctcatt ggcaggaaga ggagtcacgc cggctatcag 1140
accatctagc ctggtgggca ggtgcaccag agatgcacag gggcctgttc tcacatcccc 1200
aagcttagat aggtgtggaa gggaggcaca ctttctggca aactgtttta aaatctgctt 1260
tatcaaatgt gaagttcatc ttgcaacatt tactatgcac aaaggaataa ctattgaaat 1320
gacggtgtta attttgctaa ctgggttaaa tattgatgag aaggctccac tgatttgact 1380
tttaagactt ggtgtttggt tcttcattct tttactcaga tttaagccta tcaaagggat 1440
actctggtcc agaccttggc ctggcaaggg tggctgatgg ttaggctgca cacacttaag 1500
aagcaacggg agcagggaag gcttgcacac aggcacgcac agggtcaacc tctggacact 1560
tggcttgggc tacctggcct tgggggggct gaactctggc atctggctgg gtacacaccc 1620
ccccaatttc tgtgctctgc cacccgtgag ctgccacttt cctaaataga aaatggcatt 1680
atttttattt acttttttgt aaagtgattt ccagtcttgt gttggcgttc agggtggccc 1740
tgtctctgca ctgtgtacaa taatagattc acactgctga cgtgtcttgc agcgtaggtg 1800
ggttgtacac tgggcatcag ctcacgtaat gcattgcctg taacgatgct aataaaaa 1858
<210> 45
<211> 2339
<212> DNA
<213> Homo sapiens
<400> 45
ggcccaaccg ccgcccgcgc ccccgctctc cgcaccgtac ccggccgcct cgcgccatgg 60
cggcccccgg cagcgcccgg cgacccctgc tgctgctact gctgttgctg ctgctcggcc 120
tcatgcattg tgcgtcagca gcaatgttta tggtgaaaaa tggcaacggg accgcgtgca 180
taatggccaa cttctctgct gccttctcag tgaactacga caccaagagt ggccctaaga 240
acatgacctt tgacctgcca tcagatgcca cagtggtgct caaccgcagc tcctgtggaa 300
aagagaacac ttctgacccc agtctcgtga ttgcttttgg aagaggacat acactcactc 360
tcaatttcac gagaaatgca acacgttaca gcgtccagct catgagtttt gtttataact 420
tgtcagacac acaccttttc cccaatgcga gctccaaaga aatcaagact gtggaatcta 480
taactgacat cagggcagat atagataaaa aatacagatg tgttagtggc acccaggtcc 540
acatgaacaa cgtgaccgta acgctccatg atgccaccat ccaggcgtac ctttccaaca 600
gcagcttcag caggggagag acacgctgtg aacaagacag gccttcccca accacagcgc 660
cccctgcgcc acccagcccc tcgccctcac ccgtgcccaa gagcccctct gtggacaagt 720
acaacgtgag cggcaccaac gggacctgcc tgctggccag catggggctg cagctgaacc 780
tcacctatga gaggaaggac aacacgacgg tgacaaggct tctcaacatc aaccccaaca 840
agacctcggc cagcgggagc tgcggcgccc acctggtgac tctggagctg cacagcgagg 900
gcaccaccgt cctgctcttc cagttcggga tgaatgcaag ttctagccgg tttttcctac 960
aaggaatcca gttgaataca attcttcctg acgccagaga ccctgccttt aaagctgcca 1020
acggctccct gcgagcgctg caggccacag tcggcaattc ctacaagtgc aacgcggagg 1080
agcacgtccg tgtcacgaag gcgttttcag tcaatatatt caaagtgtgg gtccaggctt 1140
tcaaggtgga aggtggccag tttggctctg tggaggagtg tctgctggac gagaacagca 1200
tgctgatccc catcgctgtg ggtggtgccc tggcggggct ggtcctcatc gtcctcatcg 1260
cctacctcgt cggcaggaag aggagtcacg caggctacca gactatctag cctggtgcac 1320
gcaggcacag cagctgcagg ggcctctgtt cctttctctg ggcttagggt cctgtcgaag 1380
gggaggcaca ctttctggca aacgtttctc aaatctgctt catccaatgt gaagttcatc 1440
ttgcagcatt tactatgcac aacagagtaa ctatcgaaat gacggtgtta attttgctaa 1500
ctgggttaaa tattttgcta actggttaaa cattaatatt taccaaagta ggattttgag 1560
ggtgggggtg ctctctctga gggggtgggg gtgccgctgt ctctgagggg tgggggtgcc 1620
gctgtctctg aggggtgggg gtgccgctct ctctgagggg gtgggggtgc cgctttctct 1680
gagggggtgg gggtgccgct ctctctgagg gggtgggggt gctgctctct ccgaggggtg 1740
gaatgccgct gtctctgagg ggtgggggtg ccgctctaaa ttggctccat atcatttgag 1800
tttagggttc tggtgtttgg tttcttcatt ctttactgca ctcagattta agccttacaa 1860
agggaaagcc tctggccgtc acacgtagga cgcatgaagg tcactcgtgg tgaggctgac 1920
atgctcacac attacaacag tagagaggga aaatcctaag acagaggaac tccagagatg 1980
agtgtctgga gcgcttcagt tcagctttaa aggccaggac gggccacacg tggctggcgg 2040
cctcgttcca gtggcggcac gtccttgggc gtctctaatg tctgcagctc aagggctggc 2100
acttttttaa atataaaaat gggtgttatt tttatttttt tttgtaaagt gatttttggt 2160
cttctgttga cattcggggt gatcctgttc tgcgctgtgt acaatgtgag atcggtgcgt 2220
tctcctgatg ttttgccgtg gcttggggat tgtacacggg accagctcac gtaatgcatt 2280
gcctgtaaca atgtaataaa aagcctcttt cttttaaaaa aaaaaaaaaa aaaaaaaaa 2339
<210> 46
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 46
cagtacatca aggccaacag caagttcatc ggcatcaccg aactc 45
<210> 47
<211> 15
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 47
Gln Tyr Ile Lys Ala Asn Ser Lys Phe Ile Gly Ile Thr Glu Leu
1 5 10 15
<210> 48
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 48
gctaaatttg tggctgcctg gacactgaaa gccgccgct 39
<210> 49
<211> 13
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 49
Ala Lys Phe Val Ala Ala Trp Thr Leu Lys Ala Ala Ala
1 5 10
<210> 50
<211> 593
<212> DNA
<213> Woodchuck hepatitis virus
<400> 50
aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60
ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120
atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180
tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240
ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300
attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360
ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc atggctgctc 420
gcctgtgttg ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480
aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540
cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tgt 593
<210> 51
<211> 589
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 51
tctccccccc ccccctctcc ctcccccccc cctaacgtta ctggccgaag ccgcttggaa 60
taaggccggt gtgcgtttgt ctatatgtta ttttccacca tattgccgtc ttttggcaat 120
gtgagggccc ggaaacctgg ccctgtcttc ttgacgagca ttcctagggg tctttcccct 180
ctcgccaaag gaatgcaagg tctgttgaat gtcgtgaagg aagcagttcc tctggaagct 240
tcttgaagac aaacaacgtc tgtagcgacc ctttgcaggc agcggaaccc cccacctggc 300
gacaggtgcc tctgcggcca aaagccacgt gtataagata cacctgcaaa ggcggcacaa 360
ccccagtgcc acgttgtgag ttggatagtt gtggaaagag tcaaatggct ctcctcaagc 420
gtattcaaca aggggctgaa ggatgcccag aaggtacccc attgtatggg atctgatctg 480
gggcctcggt gcacatgctt tacatgtgtt tagtcgaggt taaaaaaacg tctaggcccc 540
ccgaaccacg gggacgtggt tttcctttga aaaacacgat gataatatg 589
<210> 52
<211> 720
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 52
atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 60
ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga tgccacctac 120
ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc ctggcccacc 180
ctcgtgacca ccctgaccta cggcgtgcag tgcttcagcc gctaccccga ccacatgaag 240
cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg caccatcttc 300
ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 360
gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 420
aagctggagt acaactacaa cagccacaac gtctatatca tggccgacaa gcagaagaac 480
ggcatcaagg tgaacttcaa gatccgccac aacatcgagg acggcagcgt gcagctcgcc 540
gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 600
tacctgagca cccagtccgc cctgagcaaa gaccccaacg agaagcgcga tcacatggtc 660
ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaagtag 720
<210> 53
<211> 1563
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 53
atgctgctgc tgctgctgct gctgggcctg aggctacagc tctccctggg catcatccca 60
gttgaggagg agaacccgga cttctggaac cgcgaggcag ccgaggccct gggtgccgcc 120
aagaagctgc agcctgcaca gacagccgcc aagaacctca tcatcttcct gggcgatggg 180
atgggggtgt ctacggtgac agctgccagg atcctaaaag ggcagaagaa ggacaaactg 240
gggcctgaga tacccctggc catggaccgc ttcccatatg tggctctgtc caagacatac 300
aatgtagaca aacatgtgcc agacagtgga gccacagcca cggcctacct gtgcggggtc 360
aagggcaact tccagaccat tggcttgagt gcagccgccc gctttaacca gtgcaacacg 420
acacgcggca acgaggtcat ctccgtgatg aatcgggcca agaaagcagg gaagtcagtg 480
ggagtggtaa ccaccacacg agtgcagcac gcctcgccag ccggcaccta cgcccacacg 540
gtgaaccgca actggtactc ggacgccgac gtgcctgcct cggcccgcca ggaggggtgc 600
caggacatcg ctacgcagct catctccaac atggacattg acgtgatcct aggtggaggc 660
cgaaagtaca tgtttcgcat gggaacccca gaccctgagt acccagatga ctacagccaa 720
ggtgggacca ggctggacgg gaagaatctg gtgcaggaat ggctggcgaa gcgccagggt 780
gcccggtatg tgtggaaccg cactgagctc atgcaggctt ccctggaccc gtctgtgacc 840
catctcatgg gtctctttga gcctggagac atgaaatacg agatccaccg agactccaca 900
ctggacccct ccctgatgga gatgacagag gctgccctgc gcctgctgag caggaacccc 960
cgcggcttct tcctcttcgt ggagggtggt cgcatcgacc atggtcatca tgaaagcagg 1020
gcttaccggg cactgactga gacgatcatg ttcgacgacg ccattgagag ggcgggccag 1080
ctcaccagcg aggaggacac gctgagcctc gtcactgccg accactccca cgtcttctcc 1140
ttcggaggct accccctgcg agggagctcc atcttcgggc tggcccctgg caaggcccgg 1200
gacaggaagg cctacacggt cctcctatac ggaaacggtc caggctatgt gctcaaggac 1260
ggcgcccggc cggatgttac cgagagcgag agcgggagcc ccgagtatcg gcagcagtca 1320
gcagtgcccc tggacgaaga gacccacgca ggcgaggacg tggcggtgtt cgcgcgcggc 1380
ccgcaggcgc acctggttca cggcgtgcag gagcagacct tcatagcgca cgtcatggcc 1440
ttcgccgcct gcctggagcc ctacaccgcc tgcgacctgg cgccccccgc cggcaccacc 1500
gacgccgcgc acccgggtta ctctagagtc ggggcggccg gccgcttcga gcagacatga 1560
taa 1563
<210> 54
<211> 1653
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 54
atggaagatg ccaaaaacat taagaagggc ccagcgccat tctacccact cgaagacggg 60
accgccggcg agcagctgca caaagccatg aagcgctacg ccctggtgcc cggcaccatc 120
gcctttaccg acgcacatat cgaggtggac attacctacg ccgagtactt cgagatgagc 180
gttcggctgg cagaagctat gaagcgctat gggctgaata caaaccatcg gatcgtggtg 240
tgcagcgaga atagcttgca gttcttcatg cccgtgttgg gtgccctgtt catcggtgtg 300
gctgtggccc cagctaacga catctacaac gagcgcgagc tgctgaacag catgggcatc 360
agccagccca ccgtcgtatt cgtgagcaag aaagggctgc aaaagatcct caacgtgcaa 420
aagaagctac cgatcataca aaagatcatc atcatggata gcaagaccga ctaccagggc 480
ttccaaagca tgtacacctt cgtgacttcc catttgccac ccggcttcaa cgagtacgac 540
ttcgtgcccg agagcttcga ccgggacaaa accatcgccc tgatcatgaa cagtagtggc 600
agtaccggat tgcccaaggg cgtagcccta ccgcaccgca ccgcttgtgt ccgattcagt 660
catgcccgcg accccatctt cggcaaccag atcatccccg acaccgctat cctcagcgtg 720
gtgccatttc accacggctt cggcatgttc accacgctgg gctacttgat ctgcggcttt 780
cgggtcgtgc tcatgtaccg cttcgaggag gagctattct tgcgcagctt gcaagactat 840
aagattcaat ctgccctgct ggtgcccaca ctatttagct tcttcgctaa gagcactctc 900
atcgacaagt acgacctaag caacttgcac gagatcgcca gcggcggggc gccgctcagc 960
aaggaggtag gtgaggccgt ggccaaacgc ttccacctac caggcatccg ccagggctac 1020
ggcctgacag aaacaaccag cgccattctg atcacccccg aaggggacga caagcctggc 1080
gcagtaggca aggtggtgcc cttcttcgag gctaaggtgg tggacttgga caccggtaag 1140
acactgggtg tgaaccagcg cggcgagctg tgcgtccgtg gccccatgat catgagcggc 1200
tacgttaaca accccgaggc tacaaacgct ctcatcgaca aggacggctg gctgcacagc 1260
ggcgacatcg cctactggga cgaggacgag cacttcttca tcgtggaccg gctgaagagc 1320
ctgatcaaat acaagggcta ccaggtagcc ccagccgaac tggagagcat cctgctgcaa 1380
caccccaaca tcttcgacgc cggggtcgcc ggcctgcccg acgacgatgc cggcgagctg 1440
cccgccgcag tcgtcgtgct ggaacacggt aaaaccatga ccgagaagga gatcgtggac 1500
tatgtggcca gccaggttac aaccgccaag aagctgcgcg gtggtgttgt gttcgtggac 1560
gaggtgccta aaggactgac cggcaagttg gacgcccgca agatccgcga gattctcatt 1620
aaggccaaga agggcggcaa gatcgccgtg taa 1653
<210> 55
<211> 66
<212> DNA
<213> Foot-and-mouth disease virus
<400> 55
gtaaagcaaa cactgaactt tgaccttctc aagttggctg gagacgttga gtccaatcct 60
gggccc 66
<210> 56
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 56
Gly Pro Gly Pro Gly
1 5
Claims (253)
- 제1항에 있어서, 상기 R1이 아데닌이고, 임의적으로 R1이 N6-메틸화된 아데닌인, 화합물.
- 제1항 또는 제2항에 있어서, 상기 R2가 우라실인, 화합물.
- 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 R3이 플루오린, -CF3, -OCF3 및 -OCH2CH2OCH3으로 이루어진 군으로부터 선택되는 것인, 화합물.
- 제1항 내지 제5항 중 어느 한 항의 화합물을 포함하는 RNA 올리고뉴클레오티드를 이를 필요로 하는 환자에게 투여하는 단계를 포함하는, 임의적으로 면역 반응이 암을 치료하는, 면역 반응을 자극하는 방법.
- 제6항에 있어서, 상기 암이 폐암, 흑색종, 유방암, 난소암, 전립선암, 신장암, 위암, 결장암, 고환암, 두경부암, 췌장암, 방광암, 뇌암, B-세포 림프종, 급성 골수성 백혈병, 성인 급성 림프모구성 백혈병, 만성 골수성 백혈병, 만성 림프구성 백혈병, T 세포 림프구성 백혈병, 비소세포 폐암, 및 소세포 폐암으로 이루어진 군으로부터 선택되는 것인, 방법.
- 제6항에 있어서, 상기 암이 고형 종양인, 방법.
- 제6항 또는 제8항에 있어서, 상기 암이 MSS-CRC, NSCLC, 및 PDA로 이루어진 군으로부터 선택되는 것인, 방법.
- 제6항 또는 제8항에 있어서, 상기 암이 미세부수체 안정성-대장암(MSS-CRC), 비소세포 폐암(NSCLC), 췌장 도관 선암종(PDA), 및 위식도 선암종(GEA)으로 이루어진 군으로부터 선택되는 것인, 방법.
- 제1항 내지 제5항 중 어느 한 항의 화합물을 포함하는 RNA 올리고뉴클레오티드를 이를 필요로 하는 환자에게 투여하는 단계를 포함하는, 감염을 면역화 또는 치료하는 방법.
- 제11항에 있어서, 상기 감염이 박테리아 감염인, 방법.
- 제11항에 있어서, 상기 감염이 진균 감염인, 방법.
- 제11항에 있어서, 상기 감염이 바이러스 감염인, 방법.
- 제14항에 있어서, 상기 바이러스 감염이 HIV 감염인, 방법.
- 개시 캡핑된 올리고뉴클레오티드 프라이머 및 DNA 주형을 포함하는 복합체로서,
상기 개시 캡핑된 올리고뉴클레오티드 프라이머가 제1항 내지 제5항 중 어느 한 항의 화합물을 포함하고,
상기 DNA 주형이 뉴클레오티드 위치 + 1에서 첫번째 뉴클레오티드 및 뉴클레오티드 위치 +2에서 두번째 뉴클레오티드를 갖는 전사 시작 부위를 포함하는 프로모터 영역을 포함하고;
상기 개시 캡핑된 올리고뉴클레오티드 프라이머가 적어도 뉴클레오티드 위치 +1 및 +2에서 DNA 주형에 혼성화되는 것인, 복합체. - 제17항에 있어서, 상기 단계가 24 및 25를 트리플루오로아세트산 무수물 및 트리에틸아민으로 처리하는 것을 포함하고, 생성된 혼합물을 N-메틸이미다졸로 처리하는 것을 추가로 포함하는 것인, 공정.
- 제19항에 있어서, 상기 단계가 화합물 23을 I2 및 물로 처리하는 것을 포함하는 것인, 공정.
- 제24항에 있어서, 상기 R1이 아데닌이고, 임의적으로 R1이 N6-메틸화된 아데닌인, 화합물.
- 제24항 또는 제25항에 있어서, 상기 R2가 우라실인, 화합물.
- 제24항 내지 제26항 중 어느 한 항에 있어서, 상기 R3이 플루오린, -CF3, -OCF3 및 -OCH2CH2OCH3으로 이루어진 군으로부터 선택되는 것인, 화합물.
- 자기-증폭 발현 시스템으로서,
상기 자기-증폭 발현 시스템이 자기-증폭 백본을 포함하고,
상기 자기-증폭 백본이 자기-복제 RNA 바이러스의 하나 이상의 폴리펩티드 서열을 포함하고;
상기 자기-증폭 발현 시스템이 핵산 서열을 포함하고,
상기 각각의 요소가 5'에서 3'으로 연결되며, 하기 식으로 기재되는 것인, 자기-증폭 발현 시스템:
m7G-ppp-N1-N2-NV
상기 식에서
m7G은 7-메틸구아닐레이트(m7G) 캡이고,
ppp는 트리포스페이트 가교이고,
N1은 자기-복제 RNA 바이러스의 첫번째 내인성 5' 뉴클레오티드에 상응하는 자기-증폭 백본의 첫번째 뉴클레오티드이고,
N2는 자기-복제 RNA 바이러스의 두번째 내인성 5' 뉴클레오티드에 상응하는 자기-증폭 백본의 두번째 뉴클레오티드이고,
NV는 (1) 자기-증폭 백본의 하나 이상의 추가의 핵산 서열, 및 (2) 전달을 위한 적어도 하나의 외인성 핵산 서열을 포함하는 카세트를 포함하고, 임의적으로 상기 적어도 하나의 외인성 핵산 서열은 폴리펩티드-암호화 핵산 서열을 포함하고, 임의적으로 상기 폴리펩티드-암호화 핵산 서열은 항원-암호화 핵산 서열이고, 상기 카세트는 자기-증폭 백본에 작동가능하게 연결되거나 또는 작동가능하게 삽입됨. - 제29항에 있어서,
상기 자기-증폭 발현 시스템의 전달을 위한 조성물이 하기 (A) 및 (B)를 포함하는 것인, 조성물:
(A) 하기 (a) 및 (b)를 포함하는 하나 이상의 자기-증폭 mRNA(SAM) 벡터를 포함하는 자기-증폭 발현 시스템:
(a) 하기 (i), (ii)를 포함하는 자기-증폭 백본:
(i) 적어도 하나의 프로모터 뉴클레오티드 서열,
(ii) 적어도 하나의 폴리아데닐화(폴리(A)) 서열, 및
(b) 임의적으로 하기 (i), (ii), 또는 (iii) 중 하나 이상을 포함하는 카세트:
(i) 하기 a, b, 및 c를 포함하는, 적어도 하나의 항원-암호화 핵산 서열:
a. 임의적으로 (1) 야생형 핵산 서열에 의해 암호화된 상응하는 펩티드 서열과 구별되는 암호화된 에피토프 서열을 만드는 적어도 하나의 변경, 또는 (2) 병원체-유래 펩티드, 바이러스-유래 펩티드, 박테리아-유래 펩티드, 진균-유래 펩티드, 및 기생충-유래 펩티드로 이루어진 군으로부터 선택된 감염성 질환 유기체 펩티드를 암호화하는 핵산 서열을 포함하는, 에피토프-암호화 핵산 서열,
b. 임의적으로 5' 링커 서열, 및
c. 임의적으로 3' 링커 서열;
(ii) 적어도 하나의 항원-암호화 핵산 서열에 작동가능하게 연결된 제2 프로모터 뉴클레오티드 서열; 또는
(iii) 임의적으로, 자기-복제 RNA 바이러스에 대한 천연 폴리(A) 서열 또는 외인성 폴리(A) 서열인, 적어도 하나의 제2 폴리(A) 서열; 및
(B) 임의적으로, 자기-증폭 발현 시스템을 캡슐화하는 지질-나노입자(LNP). - 제29항에 있어서,
상기 자기-증폭 발현 시스템의 전달을 위한 조성물이 하기 (A) 및 (B)를 포함하는 것인, 조성물:
(A) 하기 (a) 및 (b)를 포함하는 하나 이상의 자기-증폭 mRNA(SAM) 벡터를 포함하는 자기-증폭 발현 시스템:
(a) 서열번호: 6에 제시된 핵산 서열을 포함하는 자기-증폭 백본으로서, 상기 자기-증폭 백본 서열은 서브게놈 프로모터 뉴클레오티드 서열 및 폴리(A) 서열을 포함하고, 상기 서브게놈 프로모터 서열은 자기-복제 RNA 바이러스에 내인성이고, 상기 폴리(A) 서열은 자기-복제 RNA 바이러스 백본에 내인성인 자기-증폭 백본; 및
(b) 서브게놈 프로모터 뉴클레오티드 서열과 폴리(A) 서열 사이에 통합되고, 서브게놈 프로모터 뉴클레오티드 서열에 작동가능하게 연결되고, 임의적으로 하기 a, b, 및 c를 포함하는 적어도 하나의 항원-암호화 핵산 서열을 포함하는, 카세트:
a. 임의적으로 (1) 야생형 핵산 서열에 의해 암호화된 상응하는 펩티드 서열과 구별되는 암호화된 에피토프 서열을 만드는 적어도 하나의 변경, 또는 (2) 병원체-유래 펩티드, 바이러스-유래 펩티드, 박테리아-유래 펩티드, 진균-유래 펩티드, 및 기생충-유래 펩티드로 이루어진 군으로부터 선택된 감염성 질환 유기체 펩티드를 암호화하는 핵산 서열을 포함하는, 에피토프-암호화 핵산 서열,
b. 임의적으로 5' 링커 서열, 및
c. 임의적으로 3' 링커 서열; 및
(B) 임의적으로, 자기-증폭 발현 시스템을 캡슐화하는 지질-나노입자(LNP). - 제29항 내지 제31항 중 어느 한 항에 있어서, 상기 N1이 변형된 뉴클레오티드이고, 임의적으로 상기 변형된 뉴클레오티드가 변형된 당, 변형된 뉴클레오시드, 뉴클레오시드 유사체, 또는 이의 조합으로 이루어진 군으로부터 선택된 변형을 포함하고, 임의적으로 상기 변형된 당이 변형된 리보스인, 조성물.
- 제29항 내지 제31항 중 어느 한 항에 있어서, 상기 N2가 변형된 뉴클레오티드이고, 임의적으로 상기 변형된 뉴클레오티드가 변형된 당, 변형된 뉴클레오시드, 뉴클레오시드 유사체, 또는 이의 조합으로 이루어진 군으로부터 선택된 변형을 포함하고, 임의적으로 상기 변형된 당이 변형된 리보스인, 조성물.
- 제29항 내지 제31항 중 어느 한 항에 있어서, 상기 N1 및 N2가 변형된 뉴클레오티드이고, 임의적으로 상기 변형된 뉴클레오티드가 각각 독립적으로 변형된 당, 변형된 뉴클레오시드, 뉴클레오시드 유사체, 또는 이의 조합으로 이루어진 군으로부터 선택된 변형을 포함하고, 임의적으로 상기 변형된 당이 변형된 리보스인, 조성물.
- 제29항 내지 제34항 중 어느 한 항에 있어서, 상기 N1이 아데노신 또는 변형된 아데노신이고, 임의적으로 상기 변형된 아데노신이 변형된 당, 변형된 뉴클레오시드, 뉴클레오시드 유사체, 또는 이의 조합으로 이루어진 군으로부터 선택된 변형을 포함하고, 임의적으로 상기 변형된 당이 변형된 리보스인, 조성물.
- 제29항 내지 제35항 중 어느 한 항에 있어서, 상기 N2가 우리딘 또는 변형된 우리딘이고, 임의적으로 상기 변형된 우리딘이 변형된 당, 변형된 뉴클레오시드, 뉴클레오시드 유사체, 또는 이의 조합으로 이루어진 군으로부터 선택된 변형을 포함하고, 임의적으로 상기 변형된 당이 변형된 리보스인, 조성물.
- 제29항 내지 제36항 중 어느 한 항에 있어서, 상기 N1이 변형된 아데노신이고, 임의적으로 상기 변형된 아데노신이 변형된 당, 변형된 뉴클레오시드, 뉴클레오시드 유사체, 또는 이의 조합으로 이루어진 군으로부터 선택된 변형을 포함하고, 임의적으로 상기 변형된 당이 변형된 리보스이고, N2가 우리딘인, 조성물.
- 제38항에 있어서, 상기 R3이 플루오린, -CF3, -OCF3 및 -OCH2CH2OCH3으로 이루어진 군으로부터 선택되는 것인, 조성물.
- 제29항 내지 제40항 중 어느 한 항에 있어서, 상기 자기-증폭 발현 시스템이 시험관내 전사에 의해 생산되는 것인, 조성물.
- 제41항에 있어서, 상기 시험관내 전사 과정이 제29항 내지 제40항 중 어느 한 항의 m7G-ppp-N1-N2를 포함하는 개시 캡핑된 올리고뉴클레오티드의 사용을 포함하는 것인, 조성물.
- 개시 캡핑된 올리고뉴클레오티드 프라이머 및 DNA 주형을 포함하는 복합체로서, 상기 개시 캡핑된 올리고뉴클레오티드 프라이머가 제1항 내지 제42항 중 어느 한 항의 m7G-ppp-N1-N2를 포함하고,
상기 DNA 주형이 5'에서 3'으로, 하기 (A) 및 (B)를 포함하는 것인, 복합체:
(A) 뉴클레오티드 위치 + 1에서 첫번째 뉴클레오티드 및 뉴클레오티드 위치 +2에서 두번째 뉴클레오티드를 갖는 전사 시작 부위를 포함하는 RNA 전사 프로모터 영역, 및
(B) RNA 전사 프로모터 영역에 작동가능하게 연결된 제1항 내지 제42항 중 어느 한 항의 N1-N2-NV를 포함하는 서열. - 제43항에 있어서, 상기 RNA 전사 프로모터 영역이 임의적으로 뉴클레오티드 서열 TAATACGACTCACTATA 또는 TAATACGACTCACTATT인 T7 프로모터 서열, 임의적으로 뉴클레오티드 서열 ATTTAGGTGACACTATA인 SP6 프로모터 서열, 또는 임의적으로 뉴클레오티드 서열 AATTAGGGCACACTATA인 K11 RNAP 프로모터 서열을 포함하는 것인, 복합체.
- 제43항 또는 제44항에 있어서, 상기 DNA 주형이 서열번호: 57에 제시된 서열을 포함하고,
상기 카세트가 서열번호: 3 또는 서열번호: 5의 서열에 제시된 바와 같은 염기쌍 7544와 11175 사이의 결실을 대체하기 위해 서열번호: 6의 서열에 제시된 바와 같이 위치 7544에 삽입되는 것인, 복합체. - 제29항 내지 제45항 중 어느 한 항에 있어서, 상기 자기-증폭 발현 시스템의 전달을 위한 조성물에서 카세트의 각각의 요소의 정렬된 순서가 5'에서 3'으로, 하기를 포함하는 반응식으로 기재되는 것인, 조성물:
Pa-(L5b-Nc-L3d)X-(G5e-Uf)Y-G3g
상기 식에서 P는 제2 프로모터 뉴클레오티드 서열을 포함하고, 여기서 a = 0 또는 1이고,
N은 MHC 클래스 I 에피토프-암호화 핵산 서열을 포함하는 에피토프-암호화 핵산 서열은 중 하나를 포함하고, 여기서 c = 1이고,
L5는 5' 링커 서열을 포함하고, 여기서 b = 0 또는 1이고,
L3은 3' 링커 서열을 포함하고, 여기서 d = 0 또는 1이고,
G5는 GPGPG 아미노산 링커를 암호화하는 적어도 하나의 핵산 서열 중 하나를 포함하고, 여기서 e = 0 또는 1이고,
G3은 GPGPG 아미노산 링커를 암호화하는 적어도 하나의 핵산 서열 중 하나를 포함하고, 여기서 g = 0 또는 1이고,
U는 적어도 하나의 MHC 클래스 II 에피토프-암호화 핵산 서열 중 하나를 포함하고, 여기서 f = 1이고,
X = 1 내지 400이며, 여기서 각각의 X에 대해 상응하는 Nc는 MHC 클래스 I 에피토프-암호화 핵산 서열이고,
Y = 0, 1, 또는 2이며, 여기서 각각의 Y에 대해 상응하는 Uf는 MHC 클래스 II 에피토프-암호화 핵산 서열임. - 제46항에 있어서, 각각의 X에 대해 상응하는 Nc가 별개의 MHC 클래스 I 에피토프-암호화 핵산 서열인, 조성물.
- 제46항 또는 제47항에 있어서, 각각의 Y에 대해 상응하는 Uf가 별개의 MHC 클래스 II 에피토프-암호화 핵산 서열인, 조성물.
- 제46항 내지 제48항 중 어느 한 항에 있어서,
상기 a = 0, b = 1, d = 1, e = 1, g = 1, h = 1, X = 10, Y = 2이고,
적어도 하나의 프로모터 뉴클레오티드 서열이 자기-증폭 백본에 의해 제공되는 단일 서브게놈 프로모터 뉴클레오티드 서열이고,
적어도 하나의 폴리아데닐화 폴리(A) 서열이 자기-증폭 백본에 의해 제공되는 적어도 80개의 연속 A 뉴클레오티드의 폴리(A) 서열이고,
카세트가 서브게놈 프로모터 뉴클레오티드 서열과 폴리(A) 서열 사이에 통합되고, 서브게놈 프로모터 뉴클레오티드 서열 및 폴리(A) 서열에 작동가능하게 연결되고,
각각의 N이 7-15개 아미노산 길이의 MHC 클래스 I 에피토프를 암호화하고,
L5가 MHC I 에피토프의 천연 N-말단 아미노산 서열을 암호화하는 천연 5' 링커 서열이고, 상기 5' 링커 서열은 적어도 3개 아미노산 길이인 펩티드를 암호화하고,
L3이 MHC I 에피토프의 천연 C-말단 아미노산 서열을 암호화하는 천연 3' 링커 서열이고, 상기 3' 링커 서열은 적어도 3개 아미노산 길이인 펩티드를 암호화하고,
U가 각각의 PADRE 클래스 II 서열 및 파상풍 톡소이드 MHC 클래스 II 서열이고,
자기-증폭 백본이 서열번호: 6에 제시된 서열이고,
각각의 MHC 클래스 I 에피토프-암호화 핵산 서열이 13 내지 25개 아미노산 길이인 폴리펩티드를 암호화하는 것인, 조성물. - 제29항 내지 제45항 중 어느 한 항에 있어서, 상기 전달을 위한 적어도 하나의 외인성 핵산 서열이 폴리펩티드-암호화 핵산 서열을 포함하는 것인, 조성물.
- 제50항에 있어서, 상기 폴리펩티드-암호화 핵산 서열이 항원-암호화 핵산 서열을 암호화하는 것인, 조성물.
- 제51항에 있어서, 상기 항원-암호화 핵산 서열이 MHC 클래스 I 에피토프, MHC 클래스 II 에피토프, B 세포 반응을 자극할 수 있는 에피토프, 또는 이의 조합을 포함하는 것인, 조성물.
- 제51항 또는 제52항에 있어서, 상기 항원-암호화 핵산 서열이 전장 단백질, 단백질 서브유닛, 단백질 도메인, 또는 이의 조합을 암호화하는 서열을 포함하는 것인, 조성물.
- 제50항에 있어서, 상기 폴리펩티드-암호화 핵산 서열이 전장 단백질 또는 이의 기능적 부분을 암호화하는 것인, 조성물.
- 제54항에 있어서, 상기 전장 단백질 또는 이의 기능적 부분이 항체, 사이토카인, 키메라 항원 수용체(CAR), T-세포 수용체, 및 게놈-편집 시스템 뉴클레아제로 이루어진 군으로부터 선택되는 것인, 조성물.
- 제29항 내지 제45항 중 어느 한 항에 있어서, 상기 전달을 위한 적어도 하나의 외인성 핵산 서열이 비코딩 핵산 서열을 포함하는 적어도 하나의 핵산 서열을 포함하는 것인, 조성물.
- 제56항에 있어서, 상기 비코딩 핵산 서열이 RNA 간섭(RNAi) 폴리뉴클레오티드 또는 게놈-편집 시스템 폴리뉴클레오티드인, 조성물.
- 제1항 내지 제57항 중 어느 한 항에 있어서, 상기 LNP가 이온화가능한 아미노 지질, 포스파티딜콜린, 콜레스테롤, PEG-기반 코트 지질, 또는 이의 조합으로 이루어진 군으로부터 선택된 지질을 포함하는 것인, 조성물.
- 제1항 내지 제58항 중 어느 한 항에 있어서, 상기 LNP가 이온화가능한 아미노 지질, 포스파티딜콜린, 콜레스테롤, 및 PEG-기반 코트 지질을 포함하는 것인, 조성물.
- 제58항 또는 제59항에 있어서, 상기 이온화가능한 아미노 지질이 MC3-유사(디리놀레일메틸-4-디메틸아미노부티레이트) 분자를 포함하는 것인, 조성물.
- 제1항 내지 제60항 중 어느 한 항에 있어서, 상기 LNP-캡슐화된 발현 시스템이 60 내지 140nm의 직경을 갖는 것인, 조성물.
- 제1항 내지 제61항 중 어느 한 항에 있어서, 상기 자기-증폭 발현 시스템의 전달을 위한 조성물이 근육내(IM), 피내(ID), 피하(SC), 유리체내(IVT), 척추강내, 또는 정맥내(IV) 투여를 위해 제형화되는 것인, 조성물.
- 제1항 내지 제62항 중 어느 한 항에 있어서, 상기 자기-증폭 발현 시스템의 전달을 위한 조성물이 근육내(IM) 투여를 위해 제형화되는 것인, 조성물.
- 제29항, 제30항, 제32항 내지 제48항, 또는 제58항 내지 제63항 중 어느 한 항에 있어서, 상기 카세트가 적어도 하나의 프로모터 뉴클레오티드 서열과 적어도 하나의 폴리(A) 서열 사이에 통합되는 것인, 조성물.
- 제29항, 제30항, 제32항 내지 제48항, 또는 제58항 내지 제64항 중 어느 한 항에 있어서, 상기 적어도 하나의 프로모터 뉴클레오티드 서열이 카세트에 작동가능하게 연결되는 것인, 조성물.
- 제29항, 제30항, 제32항 내지 제48항, 또는 제58항 내지 제65항 중 어느 한 항에 있어서, 상기 하나 이상의 SAM 벡터가 하나 이상의 양성-가닥 RNA 벡터를 포함하는 것인, 조성물.
- 제29항, 제30항, 제32항 내지 제48항, 또는 제58항 내지 제65항 중 어느 한 항에 있어서, 상기 하나 이상의 SAM 벡터가 하나 이상의 음성-가닥 RNA 벡터를 포함하는 것인, 조성물.
- 제67항에 있어서, 상기 하나 이상의 음성-가닥 RNA 벡터가 홍역 바이러스 또는 랍도바이러스의 적어도 하나의 폴리뉴클레오티드 서열을 포함하는 것인, 조성물.
- 제29항, 제30항, 제32항 내지 제48항, 또는 제58항 내지 제68항 중 어느 한 항에 있어서, 상기 하나 이상의 SAM 벡터가 포유류 세포 내에서 자기-증폭되는 것인, 조성물.
- 제29항, 제30항, 제32항 내지 제48항, 또는 제58항 내지 제69항 중 어느 한 항에 있어서, 상기 자기-복제 RNA 바이러스가 알파바이러스; 플라비바이러스, 홍역, 및 랍도바이러스로 이루어진 군으로부터 선택되는 것인, 조성물.
- 제29항, 제30항, 제32항 내지 제48항, 또는 제58항 내지 제69항 중 어느 한 항에 있어서, 상기 자기-증폭 백본이 알파바이러스의 적어도 하나의 폴리뉴클레오티드 서열을 포함하고, 임의적으로 상기 알파바이러스가 아우라 바이러스, 포트 모간 바이러스, 베네수엘라 말 뇌염 바이러스, 로스 리버 바이러스, 셈리키 삼림열 바이러스, 신드비스 바이러스, 및 마야로 바이러스로 이루어진 군으로부터 선택되는 것인, 조성물.
- 제29항, 제30항, 제32항 내지 제48항, 또는 제58항 내지 제69항 중 어느 한 항에 있어서, 상기 자기-증폭 백본이 베네수엘라 말 뇌염 바이러스의 적어도 하나의 뉴클레오티드 서열을 포함하는 것인, 조성물.
- 제71항 또는 제72항에 있어서, 상기 자기-증폭 백본이 아우라 바이러스, 포트 모간 바이러스, 베네수엘라 말 뇌염 바이러스, 로스 리버 바이러스, 셈리키 삼림열 바이러스, 신드비스 바이러스, 또는 마야로 바이러스의 뉴클레오티드 서열에 의해 암호화된, 적어도 비구조적 단백질-매개 증폭을 위한 서열, 서브게놈 프로모터 서열, 폴리(A) 서열, 비구조적 단백질 1(nsP1) 유전자, nsP2 유전자, nsP3 유전자, 및 nsP4 유전자를 포함하는 것인, 조성물.
- 제71항 또는 제72항에 있어서, 상기 자기-증폭 백본이 아우라 바이러스, 포트 모간 바이러스, 베네수엘라 말 뇌염 바이러스, 로스 리버 바이러스, 셈리키 삼림열 바이러스, 신드비스 바이러스, 또는 마야로 바이러스의 뉴클레오티드 서열에 의해 암호화된, 적어도 비구조적 단백질-매개 증폭을 위한 서열, 서브게놈 프로모터 서열, 및 폴리(A) 서열을 포함하는 것인, 조성물.
- 제73항 또는 제74항에 있어서, 상기 비구조적 단백질-매개 증폭을 위한 서열이 알파바이러스 5' UTR, 51-nt CSE, 24-nt CSE, 26S 서브게놈 프로모터 서열, 19-nt CSE, 알파바이러스 3' UTR, 또는 이의 조합으로 이루어진 군으로부터 선택되는 것인, 조성물.
- 제73항 내지 제75항 중 어느 한 항에 있어서, 상기 자기-증폭 백본이 구조적 비리온 단백질 캡시드, E2 및 E1을 암호화하지 않으며, 임의적으로 상기 E1이 전장 E1이거나, 또는 구조적 비리온 단백질 캡시드, E3, E2, 6K를 암호화하지 않는 것인, 조성물.
- 제76항에 있어서, 상기 카세트가 아우라 바이러스, 포트 모간 바이러스, 베네수엘라 말 뇌염 바이러스, 로스 리버 바이러스, 셈리키 삼림열 바이러스, 신드비스 바이러스, 또는 마야로 바이러스의 폴리뉴클레오티드 서열 내에서 구조적 비리온 단백질 대신에 삽입되는 것인, 조성물.
- 제71항 또는 제72항에 있어서, 상기 베네수엘라 말 뇌염 바이러스가 서열번호: 3 또는 서열번호: 5의 서열을 포함하는 것인, 조성물.
- 제71항 또는 제72항에 있어서, 상기 베네수엘라 말 뇌염 바이러스가 염기쌍 7544와 11175 사이의 결실을 추가로 포함하는 서열번호: 3 또는 서열번호: 5의 서열을 포함하는 것인, 조성물.
- 제79항에 있어서, 상기 자기-증폭 백본이 서열번호: 6 또는 서열번호: 7에 제시된 서열을 포함하는 것인, 조성물.
- 제79항 또는 제80항에 있어서, 상기 카세트가 서열번호: 3 또는 서열번호: 5의 서열에 제시된 바와 같은 염기쌍 7544와 11175 사이의 결실을 대체하기 위해 위치 7544에 삽입되는 것인, 조성물.
- 제77항 내지 제81항에 있어서, 상기 카세트의 삽입이 nsP1-4 유전자 및 적어도 하나의 핵산 서열을 포함하는 폴리시스트로닉 RNA의 전사를 제공하고, 상기 nsP1-4 유전자 및 적어도 하나의 핵산 서열이 별도의 오픈 리딩 프레임에 있는 것인, 조성물.
- 제29항, 제30항, 제32항 내지 제48항, 또는 제58항 내지 제82항 중 어느 한 항에 있어서, 상기 적어도 하나의 프로모터 뉴클레오티드 서열이 자기-복제 RNA 바이러스에 의해 암호화된 천연 프로모터 뉴클레오티드 서열이고, 임의적으로 상기 천연 프로모터 뉴클레오티드 서열이 서브게놈 프로모터 뉴클레오티드 서열인, 조성물.
- 제29항, 제30항, 제32항 내지 제48항, 또는 제58항 내지 제82항 중 어느 한 항에 있어서, 상기 적어도 하나의 프로모터 뉴클레오티드 서열이 외인성 RNA 프로모터인, 조성물.
- 제29항, 제30항, 제32항 내지 제48항, 또는 제58항 내지 제84항 중 어느 한 항에 있어서, 상기 제2 프로모터 뉴클레오티드 서열이 서브게놈 프로모터 뉴클레오티드 서열인, 조성물.
- 제29항, 제30항, 제32항 내지 제48항, 또는 제58항 내지 제84항 중 어느 한 항에 있어서, 상기 제2 프로모터 뉴클레오티드 서열이 다중 서브게놈 프로모터 뉴클레오티드 서열을 포함하고, 각각의 서브게놈 프로모터 뉴클레오티드 서열이 별도의 오픈 리딩 프레임 중 하나 이상의 전사를 제공하는 것인, 조성물.
- 제1항 내지 제86항 중 어느 한 항에 있어서, 상기 하나 이상의 SAM 벡터가 각각 적어도 300nt 크기인, 조성물.
- 제1항 내지 제87항 중 어느 한 항에 있어서, 상기 하나 이상의 SAM 벡터가 각각 적어도 1kb 크기인, 조성물.
- 제1항 내지 제88항 중 어느 한 항에 있어서, 상기 하나 이상의 SAM 벡터가 각각 2kb 크기인, 조성물.
- 제1항 내지 제89항 중 어느 한 항에 있어서, 상기 SAM 벡터가 각각 5kb 미만의 크기인, 조성물.
- 제29항 내지 제48항, 또는 제58항 내지 제90항 중 어느 한 항에 있어서, 상기 적어도 하나의 항원-암호화 핵산 서열이 2개 이상의 항원-암호화 핵산 서열을 포함하는 것인, 조성물.
- 제91항에 있어서, 각각의 항원-암호화 핵산 서열이 서로 직접적으로 연결되는 것인, 조성물.
- 제29항 내지 제48항, 또는 제58항 내지 제92항 중 어느 한 항에 있어서, 각각의 항원-암호화 핵산 서열이 링커를 암호화하는 핵산 서열과 별개의 항원-암호화 핵산 서열에 연결되는 것인, 조성물.
- 제93항에 있어서, 상기 링커가 2개의 MHC 클래스 I 에피토프-암호화 핵산 서열 또는 MHC 클래스 I 에피토프-암호화 핵산 서열을 MHC 클래스 II 에피토프-암호화 핵산 서열에 연결하는 것인, 조성물.
- 제94항에 있어서, 상기 링커가 (1) 적어도 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개 잔기 길이의 연속 글리신 잔기; (2) 적어도 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개 잔기 길이의 연속 알라닌 잔기; (3) 2개의 아르기닌 잔기(RR); (4) 알라닌, 알라닌, 티로신(AAY); (5) 포유류 프로테아좀에 의해 효율적으로 처리되는 적어도 2, 3, 4, 5, 6, 7, 8 , 9, 또는 10개 아미노산 잔기 길이의 공통 서열; 및 (6) 기원의 동족 단백질로부터 유래된 항원 옆에 있고 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20개, 또는 2-20개 아미노산 잔기 길이인 하나 이상의 천연 서열로 이루어진 군으로부터 선택되는 것인, 조성물.
- 제93항에 있어서, 상기 링커가 2개의 MHC 클래스 II 에피토프-암호화 핵산 서열 또는 MHC 클래스 II 서열을 MHC 클래스 I 에피토프-암호화 핵산 서열에 연결하는 것인, 조성물.
- 제96항에 있어서, 상기 링커가 서열 GPGPG를 포함하는 것인, 조성물.
- 제29항 내지 제48항, 또는 제58항 내지 제97항 중 어느 한 항에 있어서, 상기 항원-암호화 핵산 서열이 에피토프-암호화 핵산 서열의 발현, 안정성, 세포 교류, 처리 및 제시, 및/또는 면역원성을 향상시키는 별도의 또는 연속 서열에 작동가능하게 또는 직접적으로 연결되는 것인, 조성물.
- 제98항에 있어서, 상기 별도의 또는 연속 서열이 유비퀴틴 서열, 프로테아좀 표적화를 증가시키도록 변형된 유비퀴틴 서열(예를 들어, 유비퀴틴 서열은 위치 76에 Gly에서 Ala로의 치환을 함유함), 면역글로불린 신호 서열(예를 들어, IgK), 주요 조직적합성 클래스 I 서열, 리소좀-연관 막 단백질(LAMP)-1, 인간 수지상 세포 리소좀-연관 막 단백질, 및 주요 조직적합성 클래스 II 서열 중 적어도 하나를 포함하고; 임의적으로 프로테아좀 표적화를 증가시키도록 변형된 유비퀴틴 서열이 A76인, 조성물.
- 제29항 내지 제48항, 또는 제58항 내지 제99항 중 어느 한 항에 있어서, 상기 적어도 하나의 항원-암호화 핵산 서열이 적어도 2-10개, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개의 항원-암호화 핵산 서열을 포함하고, 임의적으로 각각의 항원-암호화 핵산 서열이 별개의 항원-암호화 핵산 서열을 암호화하는 것인, 조성물.
- 제29항 내지 제48항, 또는 제58항 내지 제99항 중 어느 한 항에 있어서, 상기 적어도 하나의 항원-암호화 핵산 서열이 적어도 11-20개, 15-20개, 11-100개, 11-200개, 11-300개, 11-400개, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20개 또는 최대 400개의 항원-암호화 핵산 서열을 포함하고, 임의적으로 각각의 항원-암호화 핵산 서열이 별개의 항원-암호화 핵산 서열을 암호화하는 것인, 조성물.
- 제29항 내지 제48항, 또는 제58항 내지 제99항 중 어느 한 항에 있어서, 상기 적어도 하나의 항원-암호화 핵산 서열이 적어도 11-20개, 15-20개, 11-100개, 11-200개, 11-300개, 11-400개, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20개 또는 최대 400개의 항원-암호화 핵산 서열을 포함하는 것인, 조성물.
- 제29항 내지 제48항, 또는 제58항 내지 제99항 중 어느 한 항에 있어서, 상기 적어도 하나의 항원-암호화 핵산 서열이 적어도 2-400개의 항원-암호화 핵산 서열을 포함하고, 상기 항원-암호화 핵산 서열 중 적어도 2개가 세포 표면 상의 MHC 클래스 I에 의해 제시되는 에피토프 서열 또는 이의 부분을 암호화하는 것인, 조성물.
- 제29항 내지 제48항, 또는 제58항 내지 제99항 중 어느 한 항에 있어서, 각각의 항원-암호화 핵산 서열이 독립적으로 적어도 2-10개, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개의 에피토프-암호화 핵산 서열을 포함하고, 임의적으로 각각의 에피토프-암호화 핵산 서열이 별개의 에피토프-암호화 핵산 서열을 암호화하는 것인, 조성물.
- 제29항 내지 제48항, 또는 제58항 내지 제99항 중 어느 한 항에 있어서, 각각의 항원-암호화 핵산 서열이 독립적으로 적어도 11-20개, 15-20개, 11-100개, 11-200개, 11-300개, 11-400개, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20개 또는 최대 400개의 에피토프-암호화 핵산 서열을 포함하고, 임의적으로 각각의 에피토프-암호화 핵산 서열이 별개의 에피토프-암호화 핵산 서열을 암호화하는 것인, 조성물.
- 제29항 내지 제48항, 또는 제58항 내지 제99항 중 어느 한 항에 있어서, 각각의 항원-암호화 핵산 서열이 독립적으로 적어도 11-20개, 15-20개, 11-100개, 11-200개, 11-300개, 11-400개, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20개 또는 최대 400개의 에피토프-암호화 핵산 서열을 포함하는 것인, 조성물.
- 제29항 내지 제48항, 또는 제58항 내지 제99항 중 어느 한 항에 있어서, 각각의 항원-암호화 핵산 서열이 독립적으로 적어도 2-400개의 에피토프-암호화 핵산 서열을 포함하고 상기 에피토프-암호화 핵산 서열 중 적어도 2개가 세포 표면 상의 MHC 클래스 I에 의해 제시되는 에피토프 서열 또는 이의 부분을 암호화하는 것인, 조성물.
- 제49항에 있어서, 상기 MHC 클래스 I 에피토프 중 적어도 2개가 세포 표면, 임의적으로 종양 세포 표면 또는 감염된 세포 표면 상의 MHC 클래스 I에 의해 제시되는 것인, 조성물.
- 제29항 내지 제48항, 또는 제58항 내지 제108항 중 어느 한 항에 있어서, 상기 에피토프-암호화 핵산 서열이 적어도 하나의 MHC 클래스 I 에피토프-암호화 핵산 서열을 포함하고, 각각의 항원-암호화 핵산 서열이 8 내지 35개 아미노산 길이, 임의적으로 9-17개, 9-25개, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34 또는 35개 아미노산 길이의 폴리펩티드 서열을 암호화하는 것인, 조성물.
- 제46항 내지 제48항, 또는 제58항 내지 제109항 중 어느 한 항에 있어서, 상기 적어도 하나의 MHC 클래스 II 에피토프-암호화 핵산 서열이 존재하는 것인, 조성물.
- 제46항 내지 제48항, 또는 제58항 내지 제109항 중 어느 한 항에 있어서, 상기 적어도 하나의 MHC 클래스 II 에피토프-암호화 핵산 서열이 존재하고, 야생형 핵산 서열에 의해 암호화된 상응하는 펩티드 서열과 구별되는 암호화된 에피토프 서열을 만드는 적어도 하나의 변경을 포함하는 적어도 하나의 MHC 클래스 II 에피토프-암호화 핵산 서열을 포함하는 것인, 조성물.
- 제29항 내지 제48항, 또는 제58항 내지 제111항 중 어느 한 항에 있어서, 상기 에피토프-암호화 핵산 서열이 MHC 클래스 II 에피토프-암호화 핵산 서열을 포함하고, 각각의 항원-암호화 핵산 서열이 12-20개, 12, 13, 14, 15, 16, 17, 18, 19, 20, 또는 20-40개 아미노산 길이인 폴리펩티드 서열을 암호화하는 것인, 조성물.
- 제29항 내지 제48항, 또는 제58항 내지 제112항 중 어느 한 항에 있어서, 상기 에피토프-암호화 핵산 서열이 MHC 클래스 II 에피토프-암호화 핵산 서열을 포함하고, 상기 적어도 하나의 MHC 클래스 II 에피토프-암호화 핵산 서열이 존재하고, 상기 적어도 하나의 MHC 클래스 II 에피토프-암호화 핵산 서열이 적어도 하나의 범용 MHC 클래스 II 에피토프-암호화 핵산 서열을 포함하고, 임의적으로 상기 적어도 하나의 범용 서열이 파상풍 톡소이드 및 PADRE 중 적어도 하나를 포함하는 것인, 조성물.
- 제29항, 제30항, 제32항 내지 제48항, 또는 제58항 내지 제113항 중 어느 한 항에 있어서, 상기 적어도 하나의 프로모터 뉴클레오티드 서열 또는 제2 프로모터 뉴클레오티드 서열이 유도성인, 조성물.
- 제29항, 제30항, 제32항 내지 제48항, 또는 제58항 내지 제113항 중 어느 한 항에 있어서, 상기 적어도 하나의 프로모터 뉴클레오티드 서열 또는 제2 프로모터 뉴클레오티드 서열이 비유도성인, 조성물.
- 제29항, 제30항, 제32항 내지 제48항, 또는 제58항 내지 제115항 중 어느 한 항에 있어서, 상기 적어도 하나의 폴리(A) 서열이 자기-복제 바이러스에 고유한 폴리(A) 서열을 포함하는 것인, 조성물.
- 제29항, 제30항, 제32항 내지 제48항, 또는 제58항 내지 제115항 중 어느 한 항에 있어서, 상기 적어도 하나의 폴리(A) 서열이 자기-복제 바이러스에 외인성인 폴리(A) 서열을 포함하는 것인, 조성물.
- 제29항, 제30항, 제32항 내지 제48항, 또는 제58항 내지 제117항 중 어느 한 항에 있어서, 상기 적어도 하나의 폴리(A) 서열이 적어도 하나의 핵산 서열 중 적어도 하나에 작동가능하게 연결되는 것인, 조성물.
- 제29항, 제30항, 제32항 내지 제48항, 또는 제58항 내지 제118항 중 어느 한 항에 있어서, 상기 적어도 하나의 폴리(A) 서열이 적어도 20개, 적어도 30개, 적어도 40개, 적어도 50개, 적어도 60개, 적어도 70개, 적어도 80개, 적어도 90개, 적어도 100개, 적어도 110개, 또는 적어도 120개의 연속 A 뉴클레오티드인, 조성물.
- 제29항, 제30항, 제32항 내지 제48항, 또는 제58항 내지 제118항 중 어느 한 항에 있어서, 상기 적어도 하나의 폴리(A) 서열이 적어도 80개의 연속 A 뉴클레오티드인, 조성물.
- 제29항 내지 제48항, 또는 제58항 내지 제120항 중 어느 한 항에 있어서, 상기 에피토프-암호화 핵산 서열이 MHC 클래스 I 에피토프-암호화 핵산 서열을 포함하고, 상기 MHC 클래스 I 에피토프-암호화 핵산 서열이 하기 단계 (a), (b), 및 (c)를 수행함으로써 선택되는 것인, 조성물:
(a) 종양, 감염된 세포, 또는 감염성 질환 유기체로부터 엑솜, 전사체, 또는 전체 게놈 뉴클레오티드 서열분석 데이터 중 적어도 하나를 수득하는 단계로, 상기 뉴클레오티드 서열분석 데이터는 각각의 에피토프 세트의 펩티드 서열을 나타내는 데이터를 수득하는 데 사용되는 것인, 단계;
(b) 각각의 에피토프의 펩티드 서열을 제시 모델에 입력하여 각각의 에피토프가 세포 표면, 임의적으로 종양 세포 표면 또는 감염된 세포 표면 상의 MHC 대립유전자 중 하나 이상에 의해 제시되는, 적어도 수신된 질량 분광법 데이터에 기반하여 식별된 수치 가능성 세트를 생성하는 단계; 및
(c) 수치 가능성 세트에 기반한 에피토프 세트의 서브세트를 선택하여 MHC 클래스 I 에피토프-암호화 핵산 서열을 생성하는 데 사용되는 선택된 에피토프 세트를 생성하는 단계. - 제49항에 있어서, 각각의 MHC 클래스 I 에피토프-암호화 핵산 서열이 하기 단계 (a), (b), 및 (c)를 수행함으로써 선택되는 것인, 조성물:
(a) 종양, 감염된 세포, 또는 감염성 질환 유기체로부터 엑솜, 전사체, 또는 전체 게놈 뉴클레오티드 서열분석 데이터 중 적어도 하나를 수득하는 단계로, 상기 뉴클레오티드 서열분석 데이터는 각각의 에피토프 세트의 펩티드 서열을 나타내는 데이터를 수득하는 데 사용되는 것인, 단계;
(b) 각각의 에피토프의 펩티드 서열을 제시 모델에 입력하여 각각의 에피토프가 세포 표면, 임의적으로 종양 세포 표면 또는 감염된 세포 표면 상의 MHC 대립유전자 중 하나 이상에 의해 제시되는, 적어도 수신된 질량 분광법 데이터에 기반하여 식별된 수치 가능성 세트를 생성하는 단계; 및
(c) 수치 가능성 세트에 기반한 에피토프 세트의 서브세트를 선택하여 적어도 20개의 MHC 클래스 I 에피토프-암호화 핵산 서열을 생성하는 데 사용되는 선택된 에피토프 세트를 생성하는 단계. - 제121항에 있어서, 상기 선택된 에피토프 세트의 수가 2 내지 20인, 조성물.
- 제121항 내지 제123항 중 어느 한 항에 있어서, 상기 제시 모델이 하기 (a)와 (b) 사이의 의존성을 나타내는 것인, 조성물:
(a) 펩티드 서열의 특정 위치에서 MHC 대립유전자 중 특정한 하나 및 특정 아미노산의 쌍의 존재; 및
(b) 상기 쌍의 MHC 대립유전자의 특정한 하나에 의한, 특정 위치에 특정 아미노산을 포함하는 이러한 펩티드 서열의 세포 표면, 임의적으로 종양 세포 표면 또는 감염된 세포 표면 상의 제시 가능성. - 제121항 내지 제124항 중 어느 한 항에 있어서, 상기 선택된 에피토프 세트를 선택하는 단계가 제시 모델에 기반한 선택되지 않은 에피토프에 비해, 세포 표면, 임의적으로 종양 세포 표면 또는 감염된 세포 표면 상에 제시될 가능성이 증가된 에피토프를 선택하는 것을 포함하는 것인, 조성물.
- 제121항 내지 제125항 중 어느 한 항에 있어서, 상기 선택된 에피토프 세트를 선택하는 단계가 제시 모델에 기반한 선택되지 않은 에피토프에 비해, 대상체에서 종양-특이적 또는 감염성 질환 유기체-특이적 면역 반응을 자극할 수 있는 가능성이 증가된 에피토프를 선택하는 것을 포함하는 것인, 조성물.
- 제121항 내지 제126항 중 어느 한 항에 있어서, 상기 선택된 에피토프 세트를 선택하는 단계가 제시 모델에 기반한 선택되지 않은 에피토프에 비해, 전문 항원 제시 세포(APC)에 의해 미처리 T 세포에 제시될 수 있는 가능성이 증가된 에피토프를 선택하는 것을 포함하고, 임의적으로 상기 APC가 수지상 세포(DC)인, 조성물.
- 제121항 내지 제127항 중 어느 한 항에 있어서, 상기 선택된 에피토프 세트를 선택하는 단계가 제시 모델에 기반한 선택되지 않은 에피토프에 비해, 중추 또는 말초 관용을 통한 억제를 대상체가 겪을 가능성이 감소된 에피토프를 선택하는 것을 포함하는 것인, 조성물.
- 제121항 내지 제128항 중 어느 한 항에 있어서, 상기 선택된 에피토프 세트를 선택하는 단계가 제시 모델에 기반한 선택되지 않은 에피토프에 비해, 대상체에서 정상 조직에 대한 자가면역 반응을 자극할 수 있는 가능성이 감소된 에피토프를 선택하는 것을 포함하는 것인, 조성물.
- 제121항 내지 제129항 중 어느 한 항에 있어서, 상기 엑솜 또는 전사체 뉴클레오티드 서열분석 데이터가 종양 세포 또는 조직, 감염된 세포, 또는 감염성 질환 유기체 상에서 서열분석을 수행함으로써 수득되는 것인, 조성물.
- 제130항에 있어서, 상기 서열분석이 차세대 서열분석(NGS) 또는 임의의 대규모 병렬 서열분석 접근법인, 조성물.
- 하기 단계 a), b), c), 및 d)를 포함하는 자기-증폭 발현 시스템을 생산하는 방법:
a) DNA 주형을 제공하는 단계로, 각각의 요소는 5'에서 3'으로 연결되며, 하기 화학식으로 기재되는 것인, 단계:
P-N1-N2-NV
상기 식에서, P는 뉴클레오티드 위치 + 1에서 첫번째 뉴클레오티드 및 뉴클레오티드 위치 +2에서 두번째 뉴클레오티드를 갖는 전사 시작 부위를 포함하는 RNA 전사 프로모터 영역을 포함하고,
N1은 자기-복제 RNA 바이러스의 첫번째 내인성 5' 뉴클레오티드에 상응하는 자기-증폭 백본의 첫번째 뉴클레오티드이고,
N2는 자기-복제 RNA 바이러스의 두번째 내인성 5' 뉴클레오티드에 상응하는 자기-증폭 백본의 두번째 뉴클레오티드이고,
NV는 (1) 자기-증폭 백본의 하나 이상의 추가의 핵산 서열, 및 (2) 전달을 위한 적어도 하나의 외인성 핵산 서열을 포함하는 카세트를 포함하고, 임의적으로 상기 적어도 하나의 외인성 핵산 서열은 폴리펩티드-암호화 핵산 서열을 포함하고, 임의적으로 상기 폴리펩티드-암호화 핵산 서열은 항원-암호화 핵산 서열이고, 상기 카세트는 자기-증폭 백본에 작동가능하게 연결되거나 또는 작동가능하게 삽입됨;
b) 핵산 서열을 포함하는 개시 캡핑된 올리고뉴클레오티드 프라이머를 제공하는 단계로, 각각의 요소는 5'에서 3'으로 연결되며, 하기 화학식으로 기재되는 것인, 단계:
m7G-ppp-N1'-N2'
상기 식에서
m7G는 7-메틸구아닐레이트(m7G) 캡이고,
ppp는 트리포스페이트 가교이고,
N1'은 DNA 주형의 N1에 상응하는 뉴클레오티드이고,
N2'는 DNA 주형의 N2에 상응하는 뉴클레오티드임, 및
c) RNA 전사 프로모터 영역으로부터 전사를 개시할 수 있는 RNA 폴리머라제를 제공하는 단계
d) 핵산 서열을 포함하는 자기-증폭 발현 시스템을 생산하기에 충분한 조건 하에 DNA 주형, 개시 캡핑된 올리고뉴클레오티드 프라이머, 및 RNA 폴리머라제 폴리머라제를 접촉시키는 단계로, 각각의 요소는 5'에서 3'으로 연결되며, 화학식 m7G-ppp-N1'-N2'-NV로 기재되는 것인, 단계. - 제132항에 있어서, 상기 RNA 전사 프로모터 영역이 임의적으로 뉴클레오티드 서열 TAATACGACTCACTATA 또는 TAATACGACTCACTATT인 T7 프로모터 서열, 임의적으로 뉴클레오티드 서열 ATTTAGGTGACACTATA인 SP6 프로모터 서열, 또는 임의적으로 뉴클레오티드 서열 AATTAGGGCACACTATA인 K11 RNAP 프로모터 서열을 포함하는 것인, 방법.
- 제132항 또는 제133항에 있어서, 상기 DNA 주형이 서열번호: 57에 제시된 서열을 포함하고,
상기 카세트가 서열번호: 3 또는 서열번호: 5의 서열에 제시된 바와 같은 염기쌍 7544와 11175 사이의 결실을 대체하기 위해 서열번호: 6의 서열에 제시된 바와 같은 위치 7544에 삽입되는 것인, 방법. - 제132항 내지 제134항 중 어느 한 항에 있어서, 상기 N1'이 변형된 뉴클레오티드이고, 임의적으로 상기 변형된 뉴클레오티드가 변형된 당, 변형된 뉴클레오시드, 뉴클레오시드 유사체, 또는 이의 조합으로 이루어진 군으로부터 선택된 변형을 포함하고, 임의적으로 상기 변형된 당이 변형된 리보스인, 방법.
- 제132항 내지 제135항 중 어느 한 항에 있어서, 상기 N2'이 변형된 뉴클레오티드이고, 임의적으로 상기 변형된 뉴클레오티드가 변형된 당, 변형된 뉴클레오시드, 뉴클레오시드 유사체, 또는 이의 조합으로 이루어진 군으로부터 선택된 변형을 포함하고, 임의적으로 상기 변형된 당이 변형된 리보스인, 방법.
- 제132항 내지 제136항 중 어느 한 항에 있어서, 상기 N1'이 아데노신 또는 변형된 아데노신이고, 임의적으로 상기 변형된 아데노신이 변형된 당, 변형된 뉴클레오시드, 뉴클레오시드 유사체, 또는 이의 조합으로 이루어진 군으로부터 선택된 변형을 포함하고, 임의적으로 상기 변형된 당이 변형된 리보스인, 방법.
- 제132항 내지 제137항 중 어느 한 항에 있어서, 상기 N2'이 우리딘 또는 변형된 우리딘이고, 임의적으로 상기 변형된 우리딘이 변형된 당, 변형된 뉴클레오시드, 뉴클레오시드 유사체, 또는 이의 조합으로 이루어진 군으로부터 선택된 변형을 포함하고, 임의적으로 상기 변형된 당이 변형된 리보스인, 방법.
- 제132항 내지 제138항 중 어느 한 항에 있어서, 상기 N1'이 변형된 아데노신이고, 임의적으로 상기 변형된 아데노신이 변형된 당, 변형된 뉴클레오시드, 뉴클레오시드 유사체, 또는 이의 조합으로 이루어진 군으로부터 선택된 변형을 포함하고, 임의적으로 상기 변형된 당이 변형된 리보스이고, N2'이 우리딘인, 방법.
- 제140항에 있어서, 상기 R3이 플루오린, -CF3, -OCF3 및 -OCH2CH2OCH3으로 이루어진 군으로부터 선택되는 것인, 방법.
- 자기-증폭 발현 시스템의 전달을 위한 조성물을 대상체에게 투여하는 단계를 포함하는, 대상체에서 면역 반응을 자극하는 방법으로서,
상기 자기-증폭 발현 시스템은 자기-증폭 백본을 포함하고,
상기 자기-증폭 백본은 자기-복제 RNA 바이러스의 하나 이상의 폴리뉴클레오티드 서열을 포함하고;
상기 자기-증폭 발현 시스템은 핵산 서열을 포함하고,
각각의 요소는 5'에서 3'으로 연결되며, 하기 식으로 기재되는 것인, 방법:
m7G-ppp-N1-N2-NV
상기 식에서
m7G은 7-메틸구아닐레이트(m7G) 캡이고,
ppp는 트리포스페이트 가교이고,
N1은 자기-복제 RNA 바이러스의 첫번째 내인성 5' 뉴클레오티드에 상응하는 자기-증폭 백본의 첫번째 뉴클레오티드이고,
N2는 자기-복제 RNA 바이러스의 두번째 내인성 5' 뉴클레오티드에 상응하는 자기-증폭 백본의 두번째 뉴클레오티드이고,
NV는 (1) 자기-증폭 백본의 하나 이상의 추가의 핵산 서열, 및 (2) 전달을 위한 적어도 하나의 외인성 핵산 서열을 포함하는 카세트를 포함하고, 임의적으로 상기 적어도 하나의 외인성 핵산 서열은 폴리펩티드-암호화 핵산 서열을 포함하고, 임의적으로 상기 폴리펩티드-암호화 핵산 서열은 항원-암호화 핵산 서열이고, 상기 카세트는 자기-증폭 백본에 작동가능하게 연결되거나 또는 작동가능하게 삽입됨. - 제143항에 있어서,
상기 자기-증폭 발현 시스템의 전달을 위한 조성물이 하기 (A) 및 (B)를 포함하는 것인, 방법:
(A) 하기 (a) 및 (b)를 포함하는 하나 이상의 자기-증폭 mRNA(SAM) 벡터를 포함하는 자기-증폭 발현 시스템:
(a) 하기 (i) 및 (ii)를 포함하는 자기-증폭 백본:
(i) 적어도 하나의 프로모터 뉴클레오티드 서열,
(ii) 적어도 하나의 폴리아데닐화(폴리(A)) 서열, 및
(b) 임의적으로 하기 (i), (ii), 또는 (iii) 중 하나 이상을 포함하는 카세트:
(i) 하기 a, b, 및 c를 포함하는 적어도 하나의 항원-암호화 핵산 서열:
a. 임의적으로, (1) 야생형 핵산 서열에 의해 암호화된 상응하는 펩티드 서열과 구별되는 암호화된 에피토프 서열을 만드는 적어도 하나의 변경, 또는 (2) 병원체-유래 펩티드, 바이러스-유래 펩티드, 박테리아-유래 펩티드, 진균-유래 펩티드, 및 기생충-유래 펩티드로 이루어진 군으로부터 선택된 감염성 질환 유기체 펩티드를 암호화하는 핵산 서열을 포함하는, 에피토프-암호화 핵산 서열,
b. 임의적으로 5' 링커 서열, 및
c. 임의적으로 3' 링커 서열;
(ii) 적어도 하나의 항원-암호화 핵산 서열에 작동가능하게 연결된 제2 프로모터 뉴클레오티드 서열; 또는
(iii) 임의적으로, 자기-복제 RNA 바이러스에 대한 천연 폴리(A) 서열 또는 외인성 폴리(A) 서열인 적어도 하나의 제2 폴리(A) 서열; 및
(B) 임의적으로, 자기-증폭 발현 시스템을 캡슐화하는 지질-나노입자(LNP). - 제143항에 있어서,
상기 자기-증폭 발현 시스템의 전달을 위한 조성물이 하기 (A) 및 (B)를 포함하는 것인, 방법:
(A) 하기 (a) 및 (b)를 포함하는, 하나 이상의 자기-증폭 mRNA(SAM) 벡터를 포함하는 자기-증폭 발현 시스템:
(a) 서열번호: 6에 제시된 핵산 서열을 포함하는 자기-증폭 백본으로서, 상기 자기-증폭 백본 서열은 서브게놈 프로모터 뉴클레오티드 서열 및 폴리(A) 서열을 포함하고, 상기 서브게놈 프로모터 서열은 자기-복제 RNA 바이러스에 내인성이고, 상기 폴리(A) 서열은 자기-증폭 백본에 내인성인 자기-증폭 백본; 및
(b) 서브게놈 프로모터 뉴클레오티드 서열과 폴리(A) 서열 사이에 통합되고, 서브게놈 프로모터 뉴클레오티드 서열에 작동가능하게 연결되고, 임의적으로 하기 a, b, 및 c를 포함하는 적어도 하나의 항원-암호화 핵산 서열을 포함하는, 카세트:
a. 임의적으로, (1) 야생형 핵산 서열에 의해 암호화된 상응하는 펩티드 서열과 구별되는 암호화된 에피토프 서열을 만드는 적어도 하나의 변경, 또는 (2) 병원체-유래 펩티드, 바이러스-유래 펩티드, 박테리아-유래 펩티드, 진균-유래 펩티드, 및 기생충-유래 펩티드로 이루어진 군으로부터 선택된 감염성 질환 유기체 펩티드를 암호화하는 핵산 서열을 포함하는, 에피토프-암호화 핵산 서열,
b. 임의적으로 5' 링커 서열, 및
c. 임의적으로 3' 링커 서열; 및
(B) 임의적으로, 자기-증폭 발현 시스템을 캡슐화하는 지질-나노입자(LNP). - 제143항 내지 제145항 중 어느 한 항에 있어서, 상기 N1이 변형된 뉴클레오티드이고, 임의적으로 상기 변형된 뉴클레오티드가 변형된 당, 변형된 뉴클레오시드, 뉴클레오시드 유사체, 또는 이의 조합으로 이루어진 군으로부터 선택된 변형을 포함하고, 임의적으로 상기 변형된 당이 변형된 리보스인, 방법.
- 제143항 내지 제145항 중 어느 한 항에 있어서, 상기 N2가 변형된 뉴클레오티드이고, 임의적으로 상기 변형된 뉴클레오티드가 변형된 당, 변형된 뉴클레오시드, 뉴클레오시드 유사체, 또는 이의 조합으로 이루어진 군으로부터 선택된 변형을 포함하고, 임의적으로 상기 변형된 당이 변형된 리보스인, 방법.
- 제143항 내지 제145항 중 어느 한 항에 있어서, 상기 N1 및 N2가 변형된 뉴클레오티드이고, 임의적으로 상기 변형된 뉴클레오티드가 각각 독립적으로 변형된 당, 변형된 뉴클레오시드, 뉴클레오시드 유사체, 또는 이의 조합으로 이루어진 군으로부터 선택된 변형을 포함하고, 임의적으로 상기 변형된 당이 변형된 리보스인, 방법.
- 제143항 내지 제148항 중 어느 한 항에 있어서, 상기 N1이 아데노신 또는 변형된 아데노신이고, 임의적으로 상기 변형된 아데노신이 변형된 당, 변형된 뉴클레오시드, 뉴클레오시드 유사체, 또는 이의 조합으로 이루어진 군으로부터 선택된 변형을 포함하고, 임의적으로 상기 변형된 당이 변형된 리보스인, 방법.
- 제143항 내지 제149항 중 어느 한 항에 있어서, 상기 N2가 우리딘 또는 변형된 우리딘이고, 임의적으로 상기 변형된 우리딘이 변형된 당, 변형된 뉴클레오시드, 뉴클레오시드 유사체, 또는 이의 조합으로 이루어진 군으로부터 선택된 변형을 포함하고, 임의적으로 상기 변형된 당이 변형된 리보스인, 방법.
- 제143항 내지 제150항 중 어느 한 항에 있어서, 상기 N1이 변형된 아데노신이고, 임의적으로 상기 변형된 아데노신이 변형된 당, 변형된 뉴클레오시드, 뉴클레오시드 유사체, 또는 이의 조합으로 이루어진 군으로부터 선택된 변형을 포함하고, 임의적으로 상기 변형된 당이 변형된 리보스이고, N2가 우리딘인, 방법.
- 제152항에 있어서, 상기 R3이 플루오린, -CF3, -OCF3 및 -OCH2CH2OCH3으로 이루어진 군으로부터 선택되는 것인, 방법.
- 제143항 내지 제154항 중 어느 한 항에 있어서, 상기 자기-증폭 발현 시스템이 시험관내 전사에 의해 생산되는 것인, 방법.
- 제155항에 있어서, 상기 시험관내 전사 과정이 제143항 내지 제154항 중 어느 한 항의 m7G-ppp-N1-N2를 포함하는 개시 캡핑된 올리고뉴클레오티드의 사용을 포함하는 것인, 방법.
- 제143항 내지 제156항 중 어느 한 항에 있어서, 상기 자기-증폭 발현 시스템의 전달을 위한 조성물에서 카세트의 각각의 요소의 정렬된 순서가 5'에서 3'으로, 하기를 포함하는 화학식으로 기재되는 것인, 방법:
Pa-(L5b-Nc-L3d)X-(G5e-Uf)Y-G3g
상기 식에서 P는 제2 프로모터 뉴클레오티드 서열을 포함하고, 여기서 a = 0 또는 1이고,
N은 에피토프-암호화 핵산 서열 중 하나를 포함하고, 상기 에피토프-암호화 핵산 서열은 MHC 클래스 I 에피토프-암호화 핵산 서열을 포함하고, 여기서 c = 1이고,
L5는 5' 링커 서열을 포함하고, 여기서 b = 0 또는 1이고,
L3은 3' 링커 서열을 포함하고, 여기서 d = 0 또는 1이고,
G5는 GPGPG 아미노산 링커를 암호화하는 적어도 하나의 핵산 서열 중 하나를 포함하고, 여기서 e = 0 또는 1이고,
G3은 GPGPG 아미노산 링커를 암호화하는 적어도 하나의 핵산 서열 중 하나를 포함하고, 여기서 g = 0 또는 1이고,
U는 적어도 하나의 MHC 클래스 II 에피토프-암호화 핵산 서열 중 하나를 포함하고, 여기서 f = 1이고,
X = 1 내지 400이며, 여기서 각각의 X에 대해 상응하는 Nc는 MHC 클래스 I 에피토프-암호화 핵산 서열이고,
Y = 0, 1, 또는 2이며, 여기서 각각의 Y에 대해 상응하는 Uf는 MHC 클래스 II 에피토프-암호화 핵산 서열임. - 제157항에 있어서, 각각의 X에 대해 상응하는 Nc가 별개의 MHC 클래스 I 에피토프-암호화 핵산 서열인, 방법.
- 제157항 또는 제158항에 있어서, 각각의 Y에 대해 상응하는 Uf가 별개의 MHC 클래스 II 에피토프-암호화 핵산 서열인, 방법.
- 제157항 내지 제159항 중 어느 한 항에 있어서,
상기 a = 0, b = 1, d = 1, e = 1, g = 1, h = 1, X = 10, Y = 2이고,
적어도 하나의 프로모터 뉴클레오티드 서열이 자기-증폭 백본에 의해 제공되는 단일 서브게놈 프로모터 뉴클레오티드 서열이고,
적어도 하나의 폴리아데닐화 폴리(A) 서열이 자기-증폭 백본에 의해 제공되는 적어도 80개의 연속 A 뉴클레오티드의 폴리(A) 서열이고,
카세트가 서브게놈 프로모터 뉴클레오티드 서열과 폴리(A) 서열 사이에 통합되고, 서브게놈 프로모터 뉴클레오티드 서열 및 폴리(A) 서열에 작동가능하게 연결되고,
각각의 N이 7-15개 아미노산 길이의 MHC 클래스 I 에피토프를 암호화하고,
L5가 MHC I 에피토프의 천연 N-말단 아미노산 서열을 암호화하는 천연 5' 링커 서열이고, 상기 5' 링커 서열은 적어도 3개 아미노산 길이인 펩티드를 암호화하고,
L3이 MHC I 에피토프의 천연 C-말단 아미노산 서열을 암호화하는 천연 3' 링커 서열이고, 상기 3' 링커 서열은 적어도 3개 아미노산 길이인 펩티드를 암호화하고,
U가 각각의 PADRE 클래스 II 서열 및 파상풍 톡소이드 MHC 클래스 II 서열이고,
자기-증폭 백본이 서열번호: 6에 제시된 서열이고,
각각의 MHC 클래스 I 에피토프-암호화 핵산 서열이 13 내지 25개 아미노산 길이인 폴리펩티드를 암호화하는 것인, 방법. - 제143항 내지 제156항 중 어느 한 항에 있어서, 상기 전달을 위한 적어도 하나의 외인성 핵산 서열이 폴리펩티드-암호화 핵산 서열을 포함하는 것인, 방법.
- 제161항에 있어서, 상기 폴리펩티드-암호화 핵산 서열이 항원-암호화 핵산 서열을 암호화하는 것인, 방법.
- 제162항에 있어서, 상기 항원-암호화 핵산 서열이 MHC 클래스 I 에피토프, MHC 클래스 II 에피토프, B 세포 반응을 자극할 수 있는 에피토프, 또는 이의 조합을 포함하는 것인, 방법.
- 제162항 또는 제163항에 있어서, 상기 항원-암호화 핵산 서열이 전장 단백질, 단백질 서브유닛, 단백질 도메인, 또는 이의 조합을 암호화하는 서열을 포함하는 것인, 방법.
- 제161항에 있어서, 상기 폴리펩티드-암호화 핵산 서열이 전장 단백질 또는 이의 기능적 부분을 암호화하는 것인, 방법.
- 제165항에 있어서, 상기 전장 단백질 또는 이의 기능적 부분이 항체, 사이토카인, 키메라 항원 수용체(CAR), T-세포 수용체, 및 게놈-편집 시스템 뉴클레아제로 이루어진 군으로부터 선택되는 것인, 방법.
- 제143항 내지 제156항 중 어느 한 항에 있어서, 상기 전달을 위한 적어도 하나의 외인성 핵산 서열이 비코딩 핵산 서열을 포함하는 적어도 하나의 핵산 서열을 포함하는 것인, 방법.
- 제167항에 있어서, 상기 비코딩 핵산 서열이 RNA 간섭(RNAi) 폴리뉴클레오티드 또는 게놈-편집 시스템 폴리뉴클레오티드인, 방법.
- 제1항 내지 제168항 중 어느 한 항에 있어서, 상기 LNP가 이온화가능한 아미노 지질, 포스파티딜콜린, 콜레스테롤, PEG-기반 코트 지질, 또는 이의 조합으로 이루어진 군으로부터 선택된 지질을 포함하는 것인, 방법.
- 제1항 내지 제169항 중 어느 한 항에 있어서, 상기 LNP가 이온화가능한 아미노 지질, 포스파티딜콜린, 콜레스테롤, 및 PEG-기반 코트 지질을 포함하는 것인, 방법.
- 제169항 또는 제170항에 있어서, 상기 이온화가능한 아미노 지질이 MC3-유사(디리놀레일메틸-4-디메틸아미노부티레이트) 분자를 포함하는 것인, 방법.
- 제1항 내지 제171항 중 어느 한 항에 있어서, 상기 LNP-캡슐화된 발현 시스템이 약 60 내지 140nm의 직경을 갖는 것인, 방법.
- 제1항 내지 제172항 중 어느 한 항에 있어서, 상기 자기-증폭 발현 시스템의 전달을 위한 조성물이 근육내(IM), 피내(ID), 피하(SC), 유리체내(IVT), 척추강내, 또는 정맥내(IV) 투여를 위해 제형화되는 것인, 방법.
- 제1항 내지 제173항 중 어느 한 항에 있어서, 상기 자기-증폭 발현 시스템의 전달을 위한 조성물이 근육내(IM) 투여를 위해 제형화되는 것인, 방법.
- 제143항, 제144항, 제146항 내지 제159항, 또는 제169항 내지 제174항 중 어느 한 항에 있어서, 상기 카세트가 적어도 하나의 프로모터 뉴클레오티드 서열과 적어도 하나의 폴리(A) 서열 사이에 통합되는 것인, 방법.
- 제143항, 제144항, 제146항 내지 제159항, 또는 제169항 내지 제175항 중 어느 한 항에 있어서, 상기 적어도 하나의 프로모터 뉴클레오티드 서열이 카세트에 작동가능하게 연결되는 것인, 방법.
- 제143항, 제144항, 제146항 내지 제159항, 또는 제169항 내지 제176항 중 어느 한 항에 있어서, 상기 하나 이상의 SAM 벡터가 하나 이상의 양성-가닥 RNA 벡터를 포함하는 것인, 방법.
- 제143항, 제144항, 제146항 내지 제159항, 또는 제169항 내지 제177항 중 어느 한 항에 있어서, 상기 하나 이상의 SAM 벡터가 하나 이상의 음성-가닥 RNA 벡터를 포함하는 것인, 방법.
- 제178항에 있어서, 상기 하나 이상의 음성-가닥 RNA 벡터가 홍역 바이러스 또는 랍도바이러스의 적어도 하나의 폴리뉴클레오티드 서열을 포함하는 것인, 방법.
- 제143항, 제144항, 제146항 내지 제159항, 또는 제169항 내지 제179항 중 어느 한 항에 있어서, 상기 하나 이상의 SAM 벡터가 포유류 세포 내에서 자기-증폭되는 것인, 방법.
- 제142항, 제144항, 제146항 내지 제159항, 또는 제169항 내지 제180항 중 어느 한 항에 있어서, 상기 자기-증폭 백본이 알파바이러스; 플라비바이러스, 홍역, 및 랍도바이러스로 이루어진 군으로부터 선택된 자기-복제 RNA 바이러스의 적어도 하나의 폴리뉴클레오티드 서열을 포함하는 것인, 방법.
- 제142항, 제144항, 제146항 내지 제159항, 또는 제169항 내지 제180항 중 어느 한 항에 있어서, 상기 자기-증폭 백본이 알파바이러스의 적어도 하나의 폴리뉴클레오티드 서열을 포함하고, 임의적으로 상기 알파바이러스가 아우라 바이러스, 포트 모간 바이러스, 베네수엘라 말 뇌염 바이러스, 로스 리버 바이러스, 셈리키 삼림열 바이러스, 신드비스 바이러스, 및 마야로 바이러스로 이루어진 군으로부터 선택되는 것인, 방법.
- 제143항, 제144항, 제146항 내지 제159항, 또는 제169항 내지 제180항 중 어느 한 항에 있어서, 상기 자기-증폭 백본이 베네수엘라 말 뇌염 바이러스의 적어도 하나의 뉴클레오티드 서열을 포함하는 것인, 방법.
- 제182항 또는 제183항에 있어서, 상기 자기-증폭 백본이 아우라 바이러스, 포트 모간 바이러스, 베네수엘라 말 뇌염 바이러스, 로스 리버 바이러스, 셈리키 삼림열 바이러스, 신드비스 바이러스, 또는 마야로 바이러스의 뉴클레오티드 서열에 의해 암호화된 적어도 비구조적 단백질-매개 증폭을 위한 서열, 서브게놈 프로모터 서열, 폴리(A) 서열, 비구조적 단백질 1(nsP1) 유전자, nsP2 유전자, nsP3 유전자, 및 nsP4 유전자를 포함하는 것인, 방법.
- 제182항 또는 제183항에 있어서, 상기 자기-증폭 백본이 아우라 바이러스, 포트 모간 바이러스, 베네수엘라 말 뇌염 바이러스, 로스 리버 바이러스, 셈리키 삼림열 바이러스, 신드비스 바이러스, 또는 마야로 바이러스의 뉴클레오티드 서열에 의해 암호화된 적어도 비구조적 단백질-매개 증폭을 위한 서열, 서브게놈 프로모터 서열, 및 폴리(A) 서열을 포함하는 것인, 방법.
- 제184항 또는 제185항에 있어서, 상기 비구조적 단백질-매개 증폭을 위한 서열이 알파바이러스 5' UTR, 51-nt CSE, 24-nt CSE, 26S 서브게놈 프로모터 서열, 19-nt CSE, 알파바이러스 3' UTR, 또는 이의 조합으로 이루어진 군으로부터 선택되는 것인, 방법.
- 제184항 내지 제186항 중 어느 한 항에 있어서, 상기 자기-증폭 백본이 구조적 비리온 단백질 캡시드, E2 및 E1을 암호화하지 않으며, 임의적으로 상기 E1이 전장 E1이거나, 또는 구조적 비리온 단백질 캡시드, E3, E2, 6K를 암호화하지 않는 것인, 방법.
- 제187항에 있어서, 상기 카세트가 아우라 바이러스, 포트 모간 바이러스, 베네수엘라 말 뇌염 바이러스, 로스 리버 바이러스, 셈리키 삼림열 바이러스, 신드비스 바이러스, 또는 마야로 바이러스의 폴리뉴클레오티드 서열 내에서 구조적 비리온 단백질 대신에 삽입되는 것인, 방법.
- 제182항 또는 제183항에 있어서, 상기 베네수엘라 말 뇌염 바이러스가 서열번호: 3 또는 서열번호: 5의 서열을 포함하는 것인, 방법.
- 제182항 또는 제183항에 있어서, 상기 베네수엘라 말 뇌염 바이러스가 염기쌍 7544와 11175 사이의 결실을 추가로 포함하는 서열번호: 3 또는 서열번호: 5의 서열을 포함하는 것인, 방법.
- 제190항에 있어서, 상기 자기-증폭 백본이 서열번호: 6 또는 서열번호: 7에 제시된 서열을 포함하는 것인, 방법.
- 제190항 또는 제191항에 있어서, 상기 카세트가 서열번호: 3 또는 서열번호: 5의 서열에 제시된 바와 같은 염기쌍 7544와 11175 사이의 결실을 대체하기 위해 위치 7544에 삽입되는 것인, 방법.
- 제188항 내지 192항에 있어서, 상기 카세트의 삽입이 nsP1-4 유전자 및 적어도 하나의 핵산 서열을 포함하는 폴리시스트로닉 RNA의 전사를 제공하고, 상기 nsP1-4 유전자 및 적어도 하나의 핵산 서열이 별도의 오픈 리딩 프레임에 있는 것인, 방법.
- 제143항, 제144항, 제146항 내지 제159항, 또는 제169항 내지 제193항 중 어느 한 항에 있어서, 상기 적어도 하나의 프로모터 뉴클레오티드 서열이 자기-증폭 백본에 의해 암호화된 천연 프로모터 뉴클레오티드 서열이고, 임의적으로 상기 천연 프로모터 뉴클레오티드 서열이 서브게놈 프로모터 뉴클레오티드 서열인, 방법.
- 제143항, 제144항, 제146항 내지 제159항, 또는 제169항 내지 제193항 중 어느 한 항에 있어서, 상기 적어도 하나의 프로모터 뉴클레오티드 서열이 외인성 RNA 프로모터인, 방법.
- 제143항, 제144항, 제146항 내지 제159항, 또는 제169항 내지 제195항 중 어느 한 항에 있어서, 상기 제2 프로모터 뉴클레오티드 서열이 서브게놈 프로모터 뉴클레오티드 서열인, 방법.
- 제143항, 제144항, 제146항 내지 제159항, 또는 제169항 내지 제195항 중 어느 한 항에 있어서, 상기 제2 프로모터 뉴클레오티드 서열이 다중 서브게놈 프로모터 뉴클레오티드 서열을 포함하고, 각각의 서브게놈 프로모터 뉴클레오티드 서열이 별도의 오픈 리딩 프레임 중 하나 이상의 전사를 제공하는 것인, 방법.
- 제1항 내지 제197항 중 어느 한 항에 있어서, 상기 하나 이상의 SAM 벡터가 각각 적어도 300nt 크기인, 방법.
- 제1항 내지 제198항 중 어느 한 항에 있어서, 상기 하나 이상의 SAM 벡터가 각각 적어도 1kb 크기인, 방법.
- 제1항 내지 제199항 중 어느 한 항에 있어서, 상기 하나 이상의 SAM 벡터가 각각 2kb 크기인, 방법.
- 제1항 내지 제200항 중 어느 한 항에 있어서, 상기 하나 이상의 SAM 벡터가 각각 5kb 미만의 크기인, 방법.
- 제143항 내지 제159항, 또는 제169항 내지 제201항 중 어느 한 항에 있어서, 상기 적어도 하나의 항원-암호화 핵산 서열이 2개 이상의 항원-암호화 핵산 서열을 포함하는 것인, 방법.
- 제202항에 있어서, 각각의 항원-암호화 핵산 서열이 서로 직접적으로 연결되는 것인, 방법.
- 제143항 내지 제159항, 또는 제169항 내지 제203항 중 어느 한 항에 있어서, 각각의 항원-암호화 핵산 서열이 링커를 암호화하는 핵산 서열과 별개의 항원-암호화 핵산 서열에 연결되는 것인, 방법.
- 제204항에 있어서, 상기 링커가 2개의 MHC 클래스 I 에피토프-암호화 핵산 서열 또는 MHC 클래스 I 에피토프-암호화 핵산 서열을 MHC 클래스 II 에피토프-암호화 핵산 서열에 연결하는 것인, 방법.
- 제205항에 있어서, 상기 링커가 (1) 적어도 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개 잔기 길이의 연속 글리신 잔기; (2) 적어도 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개 잔기 길이의 연속 알라닌 잔기; (3) 2개의 아르기닌 잔기(RR); (4) 알라닌, 알라닌, 티로신(AAY); (5) 포유류 프로테아좀에 의해 효율적으로 처리되는 적어도 2, 3, 4, 5, 6, 7, 8 , 9, 또는 10개 아미노산 잔기 길이의 공통 서열; 및 (6) 기원의 동족 단백질로부터 유래된 항원 옆에 있고 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20개, 또는 2-20개 아미노산 잔기 길이인 하나 이상의 천연 서열로 이루어진 군으로부터 선택되는 것인, 방법.
- 제204항에 있어서, 상기 링커가 2개의 MHC 클래스 II 에피토프-암호화 핵산 서열 또는 MHC 클래스 II 서열을 MHC 클래스 I 에피토프-암호화 핵산 서열에 연결하는 것인, 방법.
- 제207항에 있어서, 상기 링커가 서열 GPGPG를 포함하는 것인, 방법.
- 제143항 내지 제159항, 또는 제169항 내지 제208항 중 어느 한 항에 있어서, 상기 항원-암호화 핵산 서열이 에피토프-암호화 핵산 서열의 발현, 안정성, 세포 교류, 처리 및 제시, 및/또는 면역원성을 향상시키는 별도의 또는 연속 서열에 작동가능하게 또는 직접적으로 연결되는 것인, 방법.
- 제209항에 있어서, 상기 별도의 또는 연속 서열이 유비퀴틴 서열, 프로테아좀 표적화를 증가시키도록 변형된 유비퀴틴 서열(예를 들어, 유비퀴틴 서열은 위치 76에 Gly에서 Ala로의 치환을 함유함), 면역글로불린 신호 서열(예를 들어, IgK), 주요 조직적합성 클래스 I 서열, 리소좀-연관 막 단백질(LAMP)-1, 인간 수지상 세포 리소좀-연관 막 단백질, 및 주요 조직적합성 클래스 II 서열 중 적어도 하나를 포함하고; 임의적으로 상기 프로테아좀 표적화를 증가시키도록 변형된 유비퀴틴 서열이 A76인, 방법.
- 제143항 내지 제159항, 또는 제169항 내지 제210항 중 어느 한 항에 있어서, 상기 적어도 하나의 항원-암호화 핵산 서열이 적어도 2-10개, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개의 항원-암호화 핵산 서열을 포함하고, 임의적으로 각각의 항원-암호화 핵산 서열이 별개의 항원-암호화 핵산 서열을 암호화하는 것인, 방법.
- 제143항 내지 제159항, 또는 제169항 내지 제210항 중 어느 한 항에 있어서, 상기 적어도 하나의 항원-암호화 핵산 서열이 적어도 11-20개, 15-20개, 11-100개, 11-200개, 11-300개, 11-400개, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20개 또는 최대 400개의 항원-암호화 핵산 서열을 포함하고, 임의적으로 각각의 항원-암호화 핵산 서열이 별개의 항원-암호화 핵산 서열을 암호화하는 것인, 방법.
- 제143항 내지 제159항, 또는 제169항 내지 제210항 중 어느 한 항에 있어서, 상기 적어도 하나의 항원-암호화 핵산 서열이 적어도 11-20개, 15-20개, 11-100개, 11-200개, 11-300개, 11-400개, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20개 또는 최대 400개의 항원-암호화 핵산 서열을 포함하는 것인, 조성물.
- 제143항 내지 제159항, 또는 제169항 내지 제210항 중 어느 한 항에 있어서, 상기 적어도 하나의 항원-암호화 핵산 서열이 적어도 2-400개의 항원-암호화 핵산 서열을 포함하고 상기 항원-암호화 핵산 서열 중 적어도 2개가 세포 표면 상의 MHC 클래스 I에 의해 제시되는 에피토프 서열 또는 이의 부분을 암호화하는 것인, 방법.
- 제143항 내지 제159항, 또는 제169항 내지 제210항 중 어느 한 항에 있어서, 각각의 항원-암호화 핵산 서열이 독립적으로 적어도 2-10개, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개의 에피토프-암호화 핵산 서열을 포함하고, 임의적으로 각각의 에피토프-암호화 핵산 서열이 별개의 에피토프-암호화 핵산 서열을 암호화하는 것인, 방법.
- 제143항 내지 제159항, 또는 제169항 내지 제210항 중 어느 한 항에 있어서, 각각의 항원-암호화 핵산 서열이 독립적으로 적어도 11-20개, 15-20개, 11-100개, 11-200개, 11-300개, 11-400개, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20개 또는 최대 400개의 에피토프-암호화 핵산 서열을 포함하고, 임의적으로 각각의 에피토프-암호화 핵산 서열이 별개의 에피토프-암호화 핵산 서열을 암호화하는 것인, 방법.
- 제143항 내지 제159항, 또는 제169항 내지 제210항 중 어느 한 항에 있어서, 각각의 항원-암호화 핵산 서열이 독립적으로 적어도 11-20개, 15-20개, 11-100개, 11-200개, 11-300개, 11-400개, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20개 또는 최대 400개의 에피토프-암호화 핵산 서열을 포함하는 것인, 조성물.
- 제143항 내지 제159항, 또는 제169항 내지 제210항 중 어느 한 항에 있어서, 각각의 항원-암호화 핵산 서열이 독립적으로 적어도 2-400개의 에피토프-암호화 핵산 서열을 포함하고 상기 에피토프-암호화 핵산 서열 중 적어도 2개가 세포 표면 상의 MHC 클래스 I에 의해 제시되는 에피토프 서열 또는 이의 부분을 암호화하는 것인, 방법.
- 제160항에 있어서, 상기 MHC 클래스 I 에피토프 중 적어도 2개가 세포 표면, 임의적으로 종양 세포 표면 또는 감염된 세포 표면 상의 MHC 클래스 I에 의해 제시되는 것인, 방법.
- 제143항 내지 제159항, 또는 제169항 내지 제219항 중 어느 한 항에 있어서, 상기 에피토프-암호화 핵산 서열이 적어도 하나의 MHC 클래스 I 에피토프-암호화 핵산 서열을 포함하고, 각각의 항원-암호화 핵산 서열이 8 내지 35개 아미노산 길이, 임의적으로 9-17개, 9-25개, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34 또는 35개 아미노산 길이의 폴리펩티드 서열을 암호화하는 것인, 방법.
- 제157항 내지 제159항, 또는 제169항 내지 제220항 중 어느 한 항에 있어서, 상기 적어도 하나의 MHC 클래스 II 에피토프-암호화 핵산 서열이 존재하는 것인, 방법.
- 제157항 내지 제159항, 또는 제169항 내지 제220항 중 어느 한 항에 있어서, 상기 적어도 하나의 MHC 클래스 II 에피토프-암호화 핵산 서열이 존재하고 야생형 핵산 서열에 의해 암호화된 상응하는 펩티드 서열과 구별되는 암호화된 에피토프 서열을 만드는 적어도 하나의 변경을 포함하는 적어도 하나의 MHC 클래스 II 에피토프-암호화 핵산 서열을 포함하는 것인, 방법.
- 제143항 내지 제159항, 또는 제169항 내지 제222항 중 어느 한 항에 있어서, 상기 에피토프-암호화 핵산 서열이 MHC 클래스 II 에피토프-암호화 핵산 서열을 포함하고 각각의 항원-암호화 핵산 서열이 12-20개, 12, 13, 14, 15, 16, 17, 18, 19, 20, 또는 20-40개 아미노산 길이인 폴리펩티드 서열을 암호화하는 것인, 방법.
- 제143항 내지 제159항, 또는 제169항 내지 제223항 중 어느 한 항에 있어서, 상기 에피토프-암호화 핵산 서열이 MHC 클래스 II 에피토프-암호화 핵산 서열을 포함하고, 상기 적어도 하나의 MHC 클래스 II 에피토프-암호화 핵산 서열이 존재하고, 상기 적어도 하나의 MHC 클래스 II 에피토프-암호화 핵산 서열이 적어도 하나의 범용 MHC 클래스 II 에피토프-암호화 핵산 서열을 포함하고, 임의적으로 상기 적어도 하나의 범용 서열이 파상풍 톡소이드 및 PADRE 중 적어도 하나를 포함하는 것인, 방법.
- 제143항, 제144항, 제146항 내지 제159항, 또는 제169항 내지 제224항 중 어느 한 항에 있어서, 상기 적어도 하나의 프로모터 뉴클레오티드 서열 또는 제2 프로모터 뉴클레오티드 서열이 유도성인, 방법.
- 제143항, 제144항, 제146항 내지 제159항, 또는 제169항 내지 제224항 중 어느 한 항에 있어서, 상기 적어도 하나의 프로모터 뉴클레오티드 서열 또는 제2 프로모터 뉴클레오티드 서열이 비유도성인, 방법.
- 제143항, 제144항, 제146항 내지 제159항, 또는 제169항 내지 제226항 중 어느 한 항에 있어서, 상기 적어도 하나의 폴리(A) 서열이 자기-복제 RNA에 고유한 폴리(A) 서열을 포함하는 것인, 방법.
- 제143항, 제144항, 제146항 내지 제159항, 또는 제169항 내지 제226항 중 어느 한 항에 있어서, 상기 적어도 하나의 폴리(A) 서열이 자기-복제 RNA에 외인성인 폴리(A) 서열을 포함하는 것인, 방법.
- 제143항, 제144항, 제146항 내지 제159항, 또는 제169항 내지 제228항 중 어느 한 항에 있어서, 상기 적어도 하나의 폴리(A) 서열이 적어도 하나의 핵산 서열 중 적어도 하나에 작동가능하게 연결되는 것인, 방법.
- 제143항, 제144항, 제146항 내지 제159항, 또는 제169항 내지 제229항 중 어느 한 항에 있어서, 상기 적어도 하나의 폴리(A) 서열이 적어도 20개, 적어도 30개, 적어도 40개, 적어도 50개, 적어도 60개, 적어도 70개, 적어도 80개, 적어도 90개, 적어도 100개, 적어도 110개, 또는 적어도 120개의 연속 A 뉴클레오티드인, 방법.
- 제143항, 제144항, 제146항 내지 제159항, 또는 제169항 내지 제229항 중 어느 한 항에 있어서, 상기 적어도 하나의 폴리(A) 서열이 적어도 80개의 연속 A 뉴클레오티드인, 방법.
- 제143항 내지 제159항, 또는 제169항 내지 제231항 중 어느 한 항에 있어서, 상기 에피토프-암호화 핵산 서열이 MHC 클래스 I 에피토프-암호화 핵산 서열을 포함하고, 상기 MHC 클래스 I 에피토프-암호화 핵산 서열이 하기 단계 (a), (b), 및 (c)를 수행함으로써 선택되는 것인, 방법:
(a) 종양, 감염된 세포, 또는 감염성 질환 유기체로부터 엑솜, 전사체, 또는 전체 게놈 뉴클레오티드 서열분석 데이터 중 적어도 하나를 수득하는 단계로, 상기 뉴클레오티드 서열분석 데이터는 각각의 에피토프 세트의 펩티드 서열을 나타내는 데이터를 수득하는 데 사용되는 것인, 단계;
(b) 각각의 에피토프의 펩티드 서열을 제시 모델에 입력하여 각각의 에피토프가 세포 표면, 임의적으로 종양 세포 표면 또는 감염된 세포 표면 상의 MHC 대립유전자 중 하나 이상에 의해 제시되는, 적어도 수신된 질량 분광법 데이터에 기반하여 식별된 수치 가능성 세트를 생성하는 단계; 및
(c) 수치 가능성 세트에 기반한 에피토프 세트의 서브세트를 선택하여 MHC 클래스 I 에피토프-암호화 핵산 서열을 생성하는 데 사용되는 선택된 에피토프 세트를 생성하는 단계. - 제160항에 있어서, 각각의 MHC 클래스 I 에피토프-암호화 핵산 서열이 하기 단계 (a), (b), 및 (c)를 수행함으로써 선택되는 것인, 방법:
(a) 종양, 감염된 세포, 또는 감염성 질환 유기체로부터 엑솜, 전사체, 또는 전체 게놈 뉴클레오티드 서열분석 데이터 중 적어도 하나를 수득하는 단계로, 상기 뉴클레오티드 서열분석 데이터는 각각의 에피토프 세트의 펩티드 서열을 나타내는 데이터를 수득하는 데 사용되는 것인, 단계;
(b) 각각의 에피토프의 펩티드 서열을 제시 모델에 입력하여 각각의 에피토프가 세포 표면, 임의적으로 종양 세포 표면 또는 감염된 세포 표면 상의 MHC 대립유전자 중 하나 이상에 의해 제시되는, 적어도 수신된 질량 분광법 데이터에 기반하여 식별된 수치 가능성 세트를 생성하는 단계; 및
(c) 수치 가능성 세트에 기반한 에피토프 세트의 서브세트를 선택하여 적어도 20개의 MHC 클래스 I 에피토프-암호화 핵산 서열을 생성하는 데 사용되는 선택된 에피토프 세트를 생성하는 단계. - 제232항에 있어서, 상기 선택된 에피토프 세트의 수가 2 내지 20인, 방법.
- 제232항 내지 제234항 중 어느 한 항에 있어서, 상기 제시 모델이 하기 (a)와 (b) 사이의 의존성을 나타내는 것인, 방법:
(a) 펩티드 서열의 특정 위치에서 MHC 대립유전자 중 특정한 하나 및 특정 아미노산의 쌍의 존재; 및
(b) 상기 쌍의 MHC 대립유전자 중 특정한 하나에 의한, 특정 위치에 특정 아미노산을 포함하는 이러한 펩티드 서열의 세포 표면, 임의적으로 종양 세포 표면 또는 감염된 세포 표면 상의 제시 가능성. - 제232항 내지 제235항 중 어느 한 항에 있어서, 상기 선택된 에피토프 세트를 선택하는 단계가 제시 모델에 기반한 선택되지 않은 에피토프에 비해, 세포 표면, 임의적으로 종양 세포 표면 또는 감염된 세포 표면 상에 제시될 가능성이 증가된 에피토프를 선택하는 것을 포함하는 것인, 방법.
- 제232항 내지 제236항 중 어느 한 항에 있어서, 상기 선택된 에피토프 세트를 선택하는 단계가 제시 모델에 기반한 선택되지 않은 에피토프에 비해, 대상체에서 종양-특이적 또는 감염성 질환 유기체-특이적 면역 반응을 자극할 수 있는 가능성이 증가된 에피토프를 선택하는 것을 포함하는 것인, 방법.
- 제232항 내지 제237항 중 어느 한 항에 있어서, 상기 선택된 에피토프 세트를 선택하는 단계가 제시 모델에 기반한 선택되지 않은 에피토프에 비해, 전문 항원 제시 세포(APC)에 의해 미처리 T 세포에 제시될 수 있는 가능성이 증가된 에피토프를 선택하는 것을 포함하고, 임의적으로 상기 APC가 수지상 세포(DC)인, 방법.
- 제232항 내지 제238항 중 어느 한 항에 있어서, 상기 선택된 에피토프 세트를 선택하는 단계가 제시 모델에 기반한 선택되지 않은 에피토프에 비해, 중추 또는 말초 관용을 통해 억제를 겪을 가능성이 감소된 에피토프를 선택하는 것을 포함하는 것인, 방법.
- 제232항 내지 제239항 중 어느 한 항에 있어서, 상기 선택된 에피토프 세트를 선택하는 단계가 제시 모델에 기반한 선택되지 않은 에피토프에 비해, 대상체에서 정상 세포에 대한 자가면역 반응을 자극할 수 있는 가능성이 감소된 에피토프를 선택하는 것을 포함하는 것인, 방법.
- 제232항 내지 제240항 중 어느 한 항에 있어서, 상기 엑솜 또는 전사체 뉴클레오티드 서열분석 데이터가 종양 세포 또는 조직, 감염된 세포, 또는 감염성 질환 유기체 상에서 서열분석을 수행함으로써 수득되는 것인, 방법.
- 제241항에 있어서, 상기 서열분석이 차세대 서열분석(NGS) 또는 임의의 대규모 병렬 서열분석 접근법인, 방법.
- 제143항 내지 제242항 중 어느 한 항에 있어서, 상기 자기-증폭 발현 시스템의 전달을 위한 조성물이 프라이밍 백신으로서 투여되는 것인, 방법.
- 제143항 내지 제243항 중 어느 한 항에 있어서, 상기 방법이 제2 조성물을 투여하는 단계를 추가로 포함하고, 임의적으로 상기 제2 조성물이 백신 조성물인, 방법.
- 제244항에 있어서, 상기 제2 조성물이 자기-증폭 발현 시스템의 전달을 위한 조성물 전에 투여되는 것인, 방법.
- 제244항에 있어서, 상기 제2 조성물이 자기-증폭 발현 시스템의 전달을 위한 조성물의 투여 이후에 투여되는 것인, 방법.
- 제244항 내지 제246항 중 어느 한 항에 있어서, 상기 제2 조성물이 자기-증폭 발현 시스템의 전달을 위한 조성물과 동일한 것인, 방법.
- 제244항 내지 제246항 중 어느 한 항에 있어서, 상기 제2 조성물이 자기-증폭 발현 시스템의 전달을 위한 조성물과 상이한 것인, 방법.
- 제248항에 있어서, 상기 제2 조성물이 자기-증폭 발현 시스템의 카세트를 포함하고, 임의적으로 상기 제2 조성물이 자기-증폭 발현 시스템의 카세트를 암호화하는 침팬지 아데노바이러스 벡터를 포함하는 것인, 방법.
- 제244항 내지 제249항 중 어느 한 항에 있어서, 상기 2개 이상의 제2 조성물이 투여되고, 임의적으로 상기 자기-증폭 발현 시스템의 전달을 위한 조성물이 프라이밍 백신으로서 투여되는 것인, 방법.
- 제143항 내지 제250항 중 어느 한 항에 있어서, 상기 자기-증폭 발현 시스템의 전달을 위한 조성물이 근육내(IM), 피내(ID), 피하(SC), 유리체내(IVT), 척추강내, 또는 정맥내(IV) 투여되는 것인, 방법.
- 제143항 내지 제251항 중 어느 한 항에 있어서, 상기 방법이 면역 조절제를 투여하는 단계를 추가로 포함하고, 임의적으로 상기 면역 조절제가 항-CTLA4 항체 또는 이의 항원-결합 단편, 항-PD-1 항체 또는 이의 항원-결합 단편, 항-PD-L1 항체 또는 이의 항원-결합 단편, 항-4-1BB 항체 또는 이의 항원-결합 단편, 항-OX-40 항체 또는 이의 항원-결합 단편, 또는 사이토카인이고, 임의적으로 상기 사이토카인이 IL-2, IL-7, IL-12, IL-15, 또는 IL-21 중 적어도 하나 또는 이의 변이체인, 방법.
- 제143항 내지 제252항 중 어느 한 항에 있어서, 상기 방법이 애쥬번트를 투여하는 단계를 추가로 포함하는 것인, 방법.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063013456P | 2020-04-21 | 2020-04-21 | |
US63/013,456 | 2020-04-21 | ||
US202063020473P | 2020-05-05 | 2020-05-05 | |
US63/020,473 | 2020-05-05 | ||
PCT/US2021/028486 WO2021216776A2 (en) | 2020-04-21 | 2021-04-21 | Capping compounds, compositions and methods of use thereof |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230015914A true KR20230015914A (ko) | 2023-01-31 |
Family
ID=78269927
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227040442A KR20230015914A (ko) | 2020-04-21 | 2021-04-21 | 캡핑 화합물, 조성물 및 이의 사용 방법 |
Country Status (9)
Country | Link |
---|---|
US (1) | US20230303614A1 (ko) |
EP (1) | EP4138854A2 (ko) |
JP (1) | JP2023523414A (ko) |
KR (1) | KR20230015914A (ko) |
CN (1) | CN115768437A (ko) |
AU (1) | AU2021260932A1 (ko) |
CA (1) | CA3173803A1 (ko) |
IL (1) | IL296855A (ko) |
WO (1) | WO2021216776A2 (ko) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113603739A (zh) * | 2021-08-27 | 2021-11-05 | 上海兆维科技发展有限公司 | 一种加帽类似物及其应用 |
WO2023081935A2 (en) * | 2021-11-08 | 2023-05-11 | Gritstone Bio, Inc. | Self-amplifying rna compositions and methods of use thereof |
WO2023147352A1 (en) * | 2022-01-27 | 2023-08-03 | Trilink Biotechnologies, Llc | Trinucleotide cap analogs and methods of use thereof |
CN115260264B (zh) * | 2022-02-28 | 2023-06-09 | 广州市恒诺康医药科技有限公司 | 用于rna加帽的化合物及其应用 |
WO2023220693A1 (en) * | 2022-05-12 | 2023-11-16 | SunVax mRNA Therapeutics Inc. | Synthetic self-amplifying mrna molecules with secretion antigen and immunomodulator |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3954224A1 (en) * | 2015-09-21 | 2022-02-16 | TriLink BioTechnologies, LLC | Compositions and methods for synthesizing 5'-capped rnas |
US10967057B2 (en) * | 2016-06-02 | 2021-04-06 | Glaxosmithkline Biologicals S.A. | Zika viral antigen constructs |
RU2019119272A (ru) * | 2016-11-23 | 2020-12-24 | Гритстоун Онколоджи, Инк. | Вирусная доставка неоантигенов |
-
2021
- 2021-04-21 CN CN202180044091.7A patent/CN115768437A/zh active Pending
- 2021-04-21 AU AU2021260932A patent/AU2021260932A1/en active Pending
- 2021-04-21 IL IL296855A patent/IL296855A/en unknown
- 2021-04-21 JP JP2022563870A patent/JP2023523414A/ja active Pending
- 2021-04-21 KR KR1020227040442A patent/KR20230015914A/ko active Search and Examination
- 2021-04-21 EP EP21792935.5A patent/EP4138854A2/en active Pending
- 2021-04-21 WO PCT/US2021/028486 patent/WO2021216776A2/en unknown
- 2021-04-21 CA CA3173803A patent/CA3173803A1/en active Pending
-
2022
- 2022-10-20 US US18/048,407 patent/US20230303614A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
AU2021260932A1 (en) | 2022-12-01 |
IL296855A (en) | 2022-11-01 |
CA3173803A1 (en) | 2021-10-28 |
US20230303614A1 (en) | 2023-09-28 |
JP2023523414A (ja) | 2023-06-05 |
WO2021216776A2 (en) | 2021-10-28 |
WO2021216776A3 (en) | 2022-01-06 |
EP4138854A2 (en) | 2023-03-01 |
CN115768437A (zh) | 2023-03-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2023123766A (ja) | アルファウイルス新生抗原ベクター | |
KR20210013105A (ko) | 공유 항원 | |
AU2019204982B2 (en) | Recombinant HCMV and RhCMV Vectors and Uses Thereof | |
KR20190098147A (ko) | 신생항원의 바이러스성 전달 | |
KR20220016137A (ko) | 변형된 아데노바이러스 | |
KR20230015914A (ko) | 캡핑 화합물, 조성물 및 이의 사용 방법 | |
KR20210090650A (ko) | 알파바이러스 신생항원 벡터 및 인터페론 억제제 | |
KR102535670B1 (ko) | 아데노바이러스 폴리뉴클레오티드 및 폴리펩티드 | |
AU2013295647B2 (en) | Multimeric fusion protein vaccine and immunotherapeutic | |
KR20210030973A (ko) | 조작된 면역자극성 박테리아 균주 및 이의 용도 | |
KR20180034589A (ko) | 면역 반응을 유도하기 위한 신규한 방법 | |
KR20210013589A (ko) | 면역 체크포인트 억제제 공동-발현 벡터 | |
KR20220041844A (ko) | Hiv 항원 및 mhc 복합체 | |
KR20220098379A (ko) | 공유 네오항원을 표적으로 하는 항원-결합 단백질 | |
KR20230046313A (ko) | 다중에피토프 백신 카세트 | |
KR20230014694A (ko) | 항원-코딩 카세트 | |
KR20170102002A (ko) | 에볼라 바이러스 백신접종을 위한 방법 및 조성물 | |
JP2000505299A (ja) | 合成hiv遺伝子 | |
KR20240019791A (ko) | 원형 rna 조성물 및 방법 | |
KR100873109B1 (ko) | 신규 발현 벡터 및 이의 용도 | |
CN114340664A (zh) | 乙型肝炎病毒(HBV)疫苗和靶向HBV的RNAi的组合 | |
KR20230019450A (ko) | 캡슐화된 rna 레플리콘 및 사용 방법 | |
KR20230006825A (ko) | 전염성 질병 항원 및 백신 | |
WO2012149566A2 (en) | Anti-hiv group i introns and a uses thereof in treating hiv infections | |
CN114340663A (zh) | 乙型肝炎病毒(HBV)疫苗和靶向HBV的RNAi的组合 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination |