KR20230145051A - 아데노바이러스 유전자 치료 벡터 - Google Patents
아데노바이러스 유전자 치료 벡터 Download PDFInfo
- Publication number
- KR20230145051A KR20230145051A KR1020237024788A KR20237024788A KR20230145051A KR 20230145051 A KR20230145051 A KR 20230145051A KR 1020237024788 A KR1020237024788 A KR 1020237024788A KR 20237024788 A KR20237024788 A KR 20237024788A KR 20230145051 A KR20230145051 A KR 20230145051A
- Authority
- KR
- South Korea
- Prior art keywords
- vector
- fiber
- sequence
- genome
- cells
- Prior art date
Links
- 239000013598 vector Substances 0.000 title claims abstract description 342
- 238000001415 gene therapy Methods 0.000 title claims abstract description 48
- 241000701161 unidentified adenovirus Species 0.000 title claims description 128
- 238000001727 in vivo Methods 0.000 claims abstract description 20
- 210000004027 cell Anatomy 0.000 claims description 380
- 108090000623 proteins and genes Proteins 0.000 claims description 173
- 239000000835 fiber Substances 0.000 claims description 165
- 238000000034 method Methods 0.000 claims description 98
- 150000007523 nucleic acids Chemical class 0.000 claims description 96
- 102100031573 Hematopoietic progenitor cell antigen CD34 Human genes 0.000 claims description 85
- 101000777663 Homo sapiens Hematopoietic progenitor cell antigen CD34 Proteins 0.000 claims description 85
- 108020004414 DNA Proteins 0.000 claims description 79
- 239000003795 chemical substances by application Substances 0.000 claims description 73
- 102000039446 nucleic acids Human genes 0.000 claims description 70
- 108020004707 nucleic acids Proteins 0.000 claims description 69
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 65
- 102000004169 proteins and genes Human genes 0.000 claims description 62
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 58
- 229920001184 polypeptide Polymers 0.000 claims description 57
- 230000003612 virological effect Effects 0.000 claims description 54
- 238000004806 packaging method and process Methods 0.000 claims description 53
- 238000011282 treatment Methods 0.000 claims description 43
- 108091033409 CRISPR Proteins 0.000 claims description 39
- 108010019670 Chimeric Antigen Receptors Proteins 0.000 claims description 38
- 210000003958 hematopoietic stem cell Anatomy 0.000 claims description 35
- 239000003550 marker Substances 0.000 claims description 32
- 101000800116 Homo sapiens Thy-1 membrane glycoprotein Proteins 0.000 claims description 28
- 102100033523 Thy-1 membrane glycoprotein Human genes 0.000 claims description 28
- 102000004190 Enzymes Human genes 0.000 claims description 27
- 108090000790 Enzymes Proteins 0.000 claims description 27
- 239000004055 small Interfering RNA Substances 0.000 claims description 26
- CXURGFRDGROIKG-UHFFFAOYSA-N 3,3-bis(chloromethyl)oxetane Chemical compound ClCC1(CCl)COC1 CXURGFRDGROIKG-UHFFFAOYSA-N 0.000 claims description 24
- NTIZESTWPVYFNL-UHFFFAOYSA-N Methyl isobutyl ketone Chemical compound CC(C)CC(C)=O NTIZESTWPVYFNL-UHFFFAOYSA-N 0.000 claims description 22
- 238000010362 genome editing Methods 0.000 claims description 22
- 210000000234 capsid Anatomy 0.000 claims description 17
- 239000007924 injection Substances 0.000 claims description 17
- 238000002347 injection Methods 0.000 claims description 17
- 108091027967 Small hairpin RNA Proteins 0.000 claims description 16
- 108091032955 Bacterial small RNA Proteins 0.000 claims description 15
- 102000053602 DNA Human genes 0.000 claims description 14
- 230000001419 dependent effect Effects 0.000 claims description 13
- 108040008770 methylated-DNA-[protein]-cysteine S-methyltransferase activity proteins Proteins 0.000 claims description 12
- 239000008194 pharmaceutical composition Substances 0.000 claims description 12
- 102100025825 Methylated-DNA-protein-cysteine methyltransferase Human genes 0.000 claims description 11
- 108091008874 T cell receptors Proteins 0.000 claims description 10
- 108010017070 Zinc Finger Nucleases Proteins 0.000 claims description 9
- 206010053138 Congenital aplastic anaemia Diseases 0.000 claims description 8
- 208000006110 Wiskott-Aldrich syndrome Diseases 0.000 claims description 7
- DLGOEMSEDOSKAD-UHFFFAOYSA-N Carmustine Chemical compound ClCCNC(=O)N(N=O)CCCl DLGOEMSEDOSKAD-UHFFFAOYSA-N 0.000 claims description 6
- 201000004939 Fanconi anemia Diseases 0.000 claims description 6
- 102000016266 T-Cell Antigen Receptors Human genes 0.000 claims description 6
- 102000055025 Adenosine deaminases Human genes 0.000 claims description 5
- 102100025621 Cytochrome b-245 heavy chain Human genes 0.000 claims description 5
- 108010049137 Member 1 Subfamily D ATP Binding Cassette Transporter Proteins 0.000 claims description 5
- 208000002903 Thalassemia Diseases 0.000 claims description 5
- 208000016532 chronic granulomatous disease Diseases 0.000 claims description 5
- 230000007812 deficiency Effects 0.000 claims description 5
- 239000003018 immunosuppressive agent Substances 0.000 claims description 5
- 229940125721 immunosuppressive agent Drugs 0.000 claims description 5
- 208000002491 severe combined immunodeficiency Diseases 0.000 claims description 5
- 208000007056 sickle cell anemia Diseases 0.000 claims description 5
- 101710169336 5'-deoxyadenosine deaminase Proteins 0.000 claims description 4
- 102100022641 Coagulation factor IX Human genes 0.000 claims description 4
- 208000034737 hemoglobinopathy Diseases 0.000 claims description 4
- 201000006417 multiple sclerosis Diseases 0.000 claims description 4
- 201000000596 systemic lupus erythematosus Diseases 0.000 claims description 4
- 201000011452 Adrenoleukodystrophy Diseases 0.000 claims description 3
- 201000003883 Cystic fibrosis Diseases 0.000 claims description 3
- 208000009292 Hemophilia A Diseases 0.000 claims description 3
- 201000011442 Metachromatic leukodystrophy Diseases 0.000 claims description 3
- 206010002026 amyotrophic lateral sclerosis Diseases 0.000 claims description 3
- 208000036556 autosomal recessive T cell-negative B cell-negative NK cell-negative due to adenosine deaminase deficiency severe combined immunodeficiency Diseases 0.000 claims description 3
- 206010001881 Alveolar proteinosis Diseases 0.000 claims description 2
- 208000024827 Alzheimer disease Diseases 0.000 claims description 2
- 208000023328 Basedow disease Diseases 0.000 claims description 2
- 208000033932 Blackfan-Diamond anemia Diseases 0.000 claims description 2
- 102100026735 Coagulation factor VIII Human genes 0.000 claims description 2
- 206010062759 Congenital dyskeratosis Diseases 0.000 claims description 2
- 201000004449 Diamond-Blackfan anemia Diseases 0.000 claims description 2
- 201000003542 Factor VIII deficiency Diseases 0.000 claims description 2
- 208000015023 Graves' disease Diseases 0.000 claims description 2
- 101000911390 Homo sapiens Coagulation factor VIII Proteins 0.000 claims description 2
- 208000022559 Inflammatory bowel disease Diseases 0.000 claims description 2
- 208000018737 Parkinson disease Diseases 0.000 claims description 2
- 208000031845 Pernicious anaemia Diseases 0.000 claims description 2
- 201000011252 Phenylketonuria Diseases 0.000 claims description 2
- 208000013544 Platelet disease Diseases 0.000 claims description 2
- 108700014121 Pyruvate Kinase Deficiency of Red Cells Proteins 0.000 claims description 2
- 208000022292 Tay-Sachs disease Diseases 0.000 claims description 2
- 208000006682 alpha 1-Antitrypsin Deficiency Diseases 0.000 claims description 2
- 208000014759 blood platelet disease Diseases 0.000 claims description 2
- 208000009356 dyskeratosis congenita Diseases 0.000 claims description 2
- 201000007382 factor V deficiency Diseases 0.000 claims description 2
- 201000007386 factor VII deficiency Diseases 0.000 claims description 2
- 208000009429 hemophilia B Diseases 0.000 claims description 2
- 201000006938 muscular dystrophy Diseases 0.000 claims description 2
- 229910052760 oxygen Inorganic materials 0.000 claims description 2
- 206010039073 rheumatoid arthritis Diseases 0.000 claims description 2
- 102000009030 Member 1 Subfamily D ATP Binding Cassette Transporter Human genes 0.000 claims 2
- 208000031277 Amaurotic familial idiocy Diseases 0.000 claims 1
- 238000010354 CRISPR gene editing Methods 0.000 claims 1
- 108010034791 Heterochromatin Proteins 0.000 claims 1
- 208000002537 Neuronal Ceroid-Lipofuscinoses Diseases 0.000 claims 1
- 208000027276 Von Willebrand disease Diseases 0.000 claims 1
- 208000005017 glioblastoma Diseases 0.000 claims 1
- 210000004458 heterochromatin Anatomy 0.000 claims 1
- 208000017476 juvenile neuronal ceroid lipofuscinosis Diseases 0.000 claims 1
- 201000007607 neuronal ceroid lipofuscinosis 3 Diseases 0.000 claims 1
- 208000012137 von Willebrand disease (hereditary or acquired) Diseases 0.000 claims 1
- 230000001225 therapeutic effect Effects 0.000 abstract description 55
- 238000010361 transduction Methods 0.000 abstract description 10
- 230000026683 transduction Effects 0.000 abstract description 10
- 210000003995 blood forming stem cell Anatomy 0.000 abstract 1
- 230000014509 gene expression Effects 0.000 description 100
- 208000015181 infectious disease Diseases 0.000 description 80
- 239000000203 mixture Substances 0.000 description 72
- 241000700605 Viruses Species 0.000 description 63
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 59
- 239000002773 nucleotide Substances 0.000 description 59
- 125000003729 nucleotide group Chemical group 0.000 description 57
- 235000018102 proteins Nutrition 0.000 description 57
- 230000027455 binding Effects 0.000 description 53
- 239000002245 particle Substances 0.000 description 52
- 239000012634 fragment Substances 0.000 description 49
- -1 genomes Substances 0.000 description 49
- 239000000047 product Substances 0.000 description 41
- 102100039619 Granulocyte colony-stimulating factor Human genes 0.000 description 35
- 201000010099 disease Diseases 0.000 description 35
- 102000018120 Recombinases Human genes 0.000 description 34
- 108010091086 Recombinases Proteins 0.000 description 34
- 238000009472 formulation Methods 0.000 description 33
- 229960002169 plerixafor Drugs 0.000 description 33
- YIQPUIGJQJDJOS-UHFFFAOYSA-N plerixafor Chemical compound C=1C=C(CN2CCNCCCNCCNCCC2)C=CC=1CN1CCCNCCNCCCNCC1 YIQPUIGJQJDJOS-UHFFFAOYSA-N 0.000 description 33
- 108091026890 Coding region Proteins 0.000 description 32
- 108091028043 Nucleic acid sequence Proteins 0.000 description 32
- 101710163270 Nuclease Proteins 0.000 description 31
- 230000010354 integration Effects 0.000 description 31
- 125000005647 linker group Chemical group 0.000 description 31
- 102100039620 Granulocyte-macrophage colony-stimulating factor Human genes 0.000 description 29
- 108010017080 Granulocyte Colony-Stimulating Factor Proteins 0.000 description 28
- 241000282414 Homo sapiens Species 0.000 description 28
- 102000008579 Transposases Human genes 0.000 description 28
- 108010020764 Transposases Proteins 0.000 description 28
- 238000004458 analytical method Methods 0.000 description 27
- 230000001105 regulatory effect Effects 0.000 description 27
- 108020005004 Guide RNA Proteins 0.000 description 25
- 235000001014 amino acid Nutrition 0.000 description 24
- 150000001413 amino acids Chemical class 0.000 description 24
- 208000035475 disorder Diseases 0.000 description 24
- 230000000694 effects Effects 0.000 description 24
- 102000005962 receptors Human genes 0.000 description 24
- 108020003175 receptors Proteins 0.000 description 24
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 23
- 239000003814 drug Substances 0.000 description 21
- 239000012636 effector Substances 0.000 description 21
- 108091005886 Hemoglobin subunit gamma Proteins 0.000 description 20
- 102100038617 Hemoglobin subunit gamma-2 Human genes 0.000 description 20
- 206010028980 Neoplasm Diseases 0.000 description 20
- 230000000875 corresponding effect Effects 0.000 description 19
- 230000035897 transcription Effects 0.000 description 19
- 238000013518 transcription Methods 0.000 description 19
- 108010017213 Granulocyte-Macrophage Colony-Stimulating Factor Proteins 0.000 description 18
- 108020004459 Small interfering RNA Proteins 0.000 description 18
- 108060003196 globin Proteins 0.000 description 18
- 238000004519 manufacturing process Methods 0.000 description 18
- 230000001483 mobilizing effect Effects 0.000 description 18
- 230000035772 mutation Effects 0.000 description 18
- 238000010186 staining Methods 0.000 description 18
- 230000009258 tissue cross reactivity Effects 0.000 description 18
- 239000013612 plasmid Substances 0.000 description 17
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 16
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 16
- 108700019146 Transgenes Proteins 0.000 description 16
- 108700005077 Viral Genes Proteins 0.000 description 16
- 230000004048 modification Effects 0.000 description 16
- 238000012986 modification Methods 0.000 description 16
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 15
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 15
- 102100020880 Kit ligand Human genes 0.000 description 15
- 240000007019 Oxalis corniculata Species 0.000 description 15
- 201000011510 cancer Diseases 0.000 description 15
- 238000012217 deletion Methods 0.000 description 15
- 239000005090 green fluorescent protein Substances 0.000 description 15
- 108020004999 messenger RNA Proteins 0.000 description 15
- 108091005904 Hemoglobin subunit beta Proteins 0.000 description 14
- 101710177504 Kit ligand Proteins 0.000 description 14
- 238000011529 RT qPCR Methods 0.000 description 14
- 101000941926 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) Carboxypeptidase Y inhibitor Proteins 0.000 description 14
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 14
- 125000003275 alpha amino acid group Chemical group 0.000 description 14
- 239000000427 antigen Substances 0.000 description 14
- 108091007433 antigens Proteins 0.000 description 14
- 102000036639 antigens Human genes 0.000 description 14
- 230000037430 deletion Effects 0.000 description 14
- 230000006870 function Effects 0.000 description 14
- 102000040430 polynucleotide Human genes 0.000 description 14
- 108091033319 polynucleotide Proteins 0.000 description 14
- 239000002157 polynucleotide Substances 0.000 description 14
- 229940124597 therapeutic agent Drugs 0.000 description 14
- 102100021519 Hemoglobin subunit beta Human genes 0.000 description 13
- 238000012228 RNA interference-mediated gene silencing Methods 0.000 description 13
- 102100029215 Signaling lymphocytic activation molecule Human genes 0.000 description 13
- 238000003776 cleavage reaction Methods 0.000 description 13
- 230000005782 double-strand break Effects 0.000 description 13
- 230000009368 gene silencing by RNA Effects 0.000 description 13
- 230000003834 intracellular effect Effects 0.000 description 13
- 229920000642 polymer Polymers 0.000 description 13
- 230000007017 scission Effects 0.000 description 13
- 239000013603 viral vector Substances 0.000 description 13
- 238000000338 in vitro Methods 0.000 description 12
- 238000003780 insertion Methods 0.000 description 12
- 230000037431 insertion Effects 0.000 description 12
- 238000002360 preparation method Methods 0.000 description 12
- 208000024891 symptom Diseases 0.000 description 12
- 102100032816 Integrin alpha-6 Human genes 0.000 description 11
- 239000003937 drug carrier Substances 0.000 description 11
- 102000018146 globin Human genes 0.000 description 11
- 230000004068 intracellular signaling Effects 0.000 description 11
- 230000004044 response Effects 0.000 description 11
- 108010038379 sargramostim Proteins 0.000 description 11
- 230000011664 signaling Effects 0.000 description 11
- 239000000243 solution Substances 0.000 description 11
- 101710199622 tRNA-specific adenosine deaminase Proteins 0.000 description 11
- 230000008685 targeting Effects 0.000 description 11
- 210000001519 tissue Anatomy 0.000 description 11
- 108091079001 CRISPR RNA Proteins 0.000 description 10
- 241000725303 Human immunodeficiency virus Species 0.000 description 10
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 10
- 230000004913 activation Effects 0.000 description 10
- 210000004369 blood Anatomy 0.000 description 10
- 239000008280 blood Substances 0.000 description 10
- 230000001965 increasing effect Effects 0.000 description 10
- 230000001404 mediated effect Effects 0.000 description 10
- 230000006798 recombination Effects 0.000 description 10
- 238000005215 recombination Methods 0.000 description 10
- 229960002530 sargramostim Drugs 0.000 description 10
- 230000000139 costimulatory effect Effects 0.000 description 9
- 230000001939 inductive effect Effects 0.000 description 9
- 239000004615 ingredient Substances 0.000 description 9
- 239000003112 inhibitor Substances 0.000 description 9
- 239000002679 microRNA Substances 0.000 description 9
- 239000000546 pharmaceutical excipient Substances 0.000 description 9
- 230000002829 reductive effect Effects 0.000 description 9
- 239000002904 solvent Substances 0.000 description 9
- 238000013519 translation Methods 0.000 description 9
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 8
- 108090000565 Capsid Proteins Proteins 0.000 description 8
- 102100023321 Ceruloplasmin Human genes 0.000 description 8
- 102100031780 Endonuclease Human genes 0.000 description 8
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 8
- 108010029961 Filgrastim Proteins 0.000 description 8
- 241000282412 Homo Species 0.000 description 8
- 101000994365 Homo sapiens Integrin alpha-6 Proteins 0.000 description 8
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 8
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 8
- 230000008901 benefit Effects 0.000 description 8
- 230000001086 cytosolic effect Effects 0.000 description 8
- 230000000977 initiatory effect Effects 0.000 description 8
- 239000000178 monomer Substances 0.000 description 8
- 230000010076 replication Effects 0.000 description 8
- 125000006850 spacer group Chemical group 0.000 description 8
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 8
- 102100024222 B-lymphocyte antigen CD19 Human genes 0.000 description 7
- 102100031650 C-X-C chemokine receptor type 4 Human genes 0.000 description 7
- 108010031325 Cytidine deaminase Proteins 0.000 description 7
- 229940113491 Glycosylase inhibitor Drugs 0.000 description 7
- 102100027685 Hemoglobin subunit alpha Human genes 0.000 description 7
- 101000980825 Homo sapiens B-lymphocyte antigen CD19 Proteins 0.000 description 7
- 101000922348 Homo sapiens C-X-C chemokine receptor type 4 Proteins 0.000 description 7
- 101001078158 Homo sapiens Integrin alpha-1 Proteins 0.000 description 7
- 101000994375 Homo sapiens Integrin alpha-4 Proteins 0.000 description 7
- 101000935040 Homo sapiens Integrin beta-2 Proteins 0.000 description 7
- 101000633786 Homo sapiens SLAM family member 6 Proteins 0.000 description 7
- 101000633780 Homo sapiens Signaling lymphocytic activation molecule Proteins 0.000 description 7
- 102100025323 Integrin alpha-1 Human genes 0.000 description 7
- 102100032818 Integrin alpha-4 Human genes 0.000 description 7
- 102100025390 Integrin beta-2 Human genes 0.000 description 7
- 241001465754 Metazoa Species 0.000 description 7
- 102100029197 SLAM family member 6 Human genes 0.000 description 7
- 102100028785 Tumor necrosis factor receptor superfamily member 14 Human genes 0.000 description 7
- 108010067390 Viral Proteins Proteins 0.000 description 7
- 230000004520 agglutination Effects 0.000 description 7
- 230000015556 catabolic process Effects 0.000 description 7
- 230000001413 cellular effect Effects 0.000 description 7
- 230000002950 deficient Effects 0.000 description 7
- 238000006731 degradation reaction Methods 0.000 description 7
- 229960004177 filgrastim Drugs 0.000 description 7
- 239000000499 gel Substances 0.000 description 7
- 230000002068 genetic effect Effects 0.000 description 7
- 150000003839 salts Chemical class 0.000 description 7
- 239000000126 substance Substances 0.000 description 7
- 238000011144 upstream manufacturing Methods 0.000 description 7
- 229940035893 uracil Drugs 0.000 description 7
- 239000003981 vehicle Substances 0.000 description 7
- 108010079649 APOBEC-1 Deaminase Proteins 0.000 description 6
- WVDDGKGOMKODPV-UHFFFAOYSA-N Benzyl alcohol Chemical compound OCC1=CC=CC=C1 WVDDGKGOMKODPV-UHFFFAOYSA-N 0.000 description 6
- 102100040397 C->U-editing enzyme APOBEC-1 Human genes 0.000 description 6
- 102100026846 Cytidine deaminase Human genes 0.000 description 6
- 101001046687 Homo sapiens Integrin alpha-E Proteins 0.000 description 6
- 101000971538 Homo sapiens Killer cell lectin-like receptor subfamily F member 1 Proteins 0.000 description 6
- 101000961414 Homo sapiens Membrane cofactor protein Proteins 0.000 description 6
- 101000716102 Homo sapiens T-cell surface glycoprotein CD4 Proteins 0.000 description 6
- 102100022341 Integrin alpha-E Human genes 0.000 description 6
- 102100021458 Killer cell lectin-like receptor subfamily F member 1 Human genes 0.000 description 6
- 102100039373 Membrane cofactor protein Human genes 0.000 description 6
- 102100038082 Natural killer cell receptor 2B4 Human genes 0.000 description 6
- DNIAPMSPPWPWGF-UHFFFAOYSA-N Propylene glycol Chemical compound CC(O)CO DNIAPMSPPWPWGF-UHFFFAOYSA-N 0.000 description 6
- 102000000574 RNA-Induced Silencing Complex Human genes 0.000 description 6
- 108010016790 RNA-Induced Silencing Complex Proteins 0.000 description 6
- 102100027744 Semaphorin-4D Human genes 0.000 description 6
- 108010074687 Signaling Lymphocytic Activation Molecule Family Member 1 Proteins 0.000 description 6
- 102100036011 T-cell surface glycoprotein CD4 Human genes 0.000 description 6
- 108700009124 Transcription Initiation Site Proteins 0.000 description 6
- 108091023040 Transcription factor Proteins 0.000 description 6
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 6
- 150000001875 compounds Chemical class 0.000 description 6
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 6
- 239000000463 material Substances 0.000 description 6
- 108091070501 miRNA Proteins 0.000 description 6
- 241000894007 species Species 0.000 description 6
- 238000002560 therapeutic procedure Methods 0.000 description 6
- 230000005945 translocation Effects 0.000 description 6
- 241000894006 Bacteria Species 0.000 description 5
- 102100027207 CD27 antigen Human genes 0.000 description 5
- 101150013553 CD40 gene Proteins 0.000 description 5
- 108020004705 Codon Proteins 0.000 description 5
- 108010047041 Complementarity Determining Regions Proteins 0.000 description 5
- 102000004127 Cytokines Human genes 0.000 description 5
- 108090000695 Cytokines Proteins 0.000 description 5
- 108020001738 DNA Glycosylase Proteins 0.000 description 5
- 102000028381 DNA glycosylase Human genes 0.000 description 5
- 108010042407 Endonucleases Proteins 0.000 description 5
- 102000001690 Factor VIII Human genes 0.000 description 5
- 108010054218 Factor VIII Proteins 0.000 description 5
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 5
- 108091005902 Hemoglobin subunit alpha Proteins 0.000 description 5
- 101000903703 Homo sapiens B-cell lymphoma/leukemia 11A Proteins 0.000 description 5
- 101000914511 Homo sapiens CD27 antigen Proteins 0.000 description 5
- 101000935043 Homo sapiens Integrin beta-1 Proteins 0.000 description 5
- 101001043809 Homo sapiens Interleukin-7 receptor subunit alpha Proteins 0.000 description 5
- 108010061833 Integrases Proteins 0.000 description 5
- 102100022338 Integrin alpha-M Human genes 0.000 description 5
- 102100022297 Integrin alpha-X Human genes 0.000 description 5
- 102100025304 Integrin beta-1 Human genes 0.000 description 5
- 102100021593 Interleukin-7 receptor subunit alpha Human genes 0.000 description 5
- 108010064548 Lymphocyte Function-Associated Antigen-1 Proteins 0.000 description 5
- 108700011259 MicroRNAs Proteins 0.000 description 5
- 208000002678 Mucopolysaccharidoses Diseases 0.000 description 5
- 241000699666 Mus <mouse, genus> Species 0.000 description 5
- KRWMERLEINMZFT-UHFFFAOYSA-N O6-benzylguanine Chemical compound C=12NC=NC2=NC(N)=NC=1OCC1=CC=CC=C1 KRWMERLEINMZFT-UHFFFAOYSA-N 0.000 description 5
- 102100021669 Stromal cell-derived factor 1 Human genes 0.000 description 5
- 210000001744 T-lymphocyte Anatomy 0.000 description 5
- 108091028113 Trans-activating crRNA Proteins 0.000 description 5
- 102100040245 Tumor necrosis factor receptor superfamily member 5 Human genes 0.000 description 5
- 239000007864 aqueous solution Substances 0.000 description 5
- 239000011230 binding agent Substances 0.000 description 5
- 239000000872 buffer Substances 0.000 description 5
- 230000008859 change Effects 0.000 description 5
- 230000000295 complement effect Effects 0.000 description 5
- 229940121384 cxc chemokine receptor type 4 (cxcr4) antagonist Drugs 0.000 description 5
- 230000029087 digestion Effects 0.000 description 5
- 239000006185 dispersion Substances 0.000 description 5
- 239000002552 dosage form Substances 0.000 description 5
- 229940079593 drug Drugs 0.000 description 5
- 230000001605 fetal effect Effects 0.000 description 5
- 238000000684 flow cytometry Methods 0.000 description 5
- 102000037865 fusion proteins Human genes 0.000 description 5
- 108020001507 fusion proteins Proteins 0.000 description 5
- 230000001976 improved effect Effects 0.000 description 5
- 238000001802 infusion Methods 0.000 description 5
- 239000007788 liquid Substances 0.000 description 5
- 206010028093 mucopolysaccharidosis Diseases 0.000 description 5
- 230000003472 neutralizing effect Effects 0.000 description 5
- 239000000843 powder Substances 0.000 description 5
- 239000000523 sample Substances 0.000 description 5
- 210000002966 serum Anatomy 0.000 description 5
- 239000011780 sodium chloride Substances 0.000 description 5
- 239000003381 stabilizer Substances 0.000 description 5
- 230000002463 transducing effect Effects 0.000 description 5
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 4
- 102100039398 C-X-C motif chemokine 2 Human genes 0.000 description 4
- 108010062802 CD66 antigens Proteins 0.000 description 4
- 238000010453 CRISPR/Cas method Methods 0.000 description 4
- 108010077544 Chromatin Proteins 0.000 description 4
- 108010054147 Hemoglobins Proteins 0.000 description 4
- 102000001554 Hemoglobins Human genes 0.000 description 4
- 101001035237 Homo sapiens Integrin alpha-D Proteins 0.000 description 4
- 101000738771 Homo sapiens Receptor-type tyrosine-protein phosphatase C Proteins 0.000 description 4
- 101000946860 Homo sapiens T-cell surface glycoprotein CD3 epsilon chain Proteins 0.000 description 4
- 101000934341 Homo sapiens T-cell surface glycoprotein CD5 Proteins 0.000 description 4
- 229940076838 Immune checkpoint inhibitor Drugs 0.000 description 4
- 102100034343 Integrase Human genes 0.000 description 4
- 102100039904 Integrin alpha-D Human genes 0.000 description 4
- 108010008212 Integrin alpha4beta1 Proteins 0.000 description 4
- 102100034170 Interferon-induced, double-stranded RNA-activated protein kinase Human genes 0.000 description 4
- 101710089751 Interferon-induced, double-stranded RNA-activated protein kinase Proteins 0.000 description 4
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 4
- 241000829100 Macaca mulatta polyomavirus 1 Species 0.000 description 4
- 108010061593 Member 14 Tumor Necrosis Factor Receptors Proteins 0.000 description 4
- 239000002202 Polyethylene glycol Substances 0.000 description 4
- 102000014128 RANK Ligand Human genes 0.000 description 4
- 108010025832 RANK Ligand Proteins 0.000 description 4
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 4
- 102100037422 Receptor-type tyrosine-protein phosphatase C Human genes 0.000 description 4
- 102100027208 T-cell antigen CD7 Human genes 0.000 description 4
- 102100035794 T-cell surface glycoprotein CD3 epsilon chain Human genes 0.000 description 4
- 102100025244 T-cell surface glycoprotein CD5 Human genes 0.000 description 4
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 4
- 102000040945 Transcription factor Human genes 0.000 description 4
- 102100022153 Tumor necrosis factor receptor superfamily member 4 Human genes 0.000 description 4
- 239000002253 acid Substances 0.000 description 4
- 239000000556 agonist Substances 0.000 description 4
- 230000001580 bacterial effect Effects 0.000 description 4
- UCMIRNVEIXFBKS-UHFFFAOYSA-N beta-alanine Chemical compound NCCC(O)=O UCMIRNVEIXFBKS-UHFFFAOYSA-N 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 210000003483 chromatin Anatomy 0.000 description 4
- 239000000539 dimer Substances 0.000 description 4
- 239000002612 dispersion medium Substances 0.000 description 4
- 239000003623 enhancer Substances 0.000 description 4
- 235000019441 ethanol Nutrition 0.000 description 4
- 229960000301 factor viii Drugs 0.000 description 4
- 238000013467 fragmentation Methods 0.000 description 4
- 238000006062 fragmentation reaction Methods 0.000 description 4
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 4
- 239000012274 immune-checkpoint protein inhibitor Substances 0.000 description 4
- 230000005847 immunogenicity Effects 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 239000003446 ligand Substances 0.000 description 4
- 238000005259 measurement Methods 0.000 description 4
- 239000012528 membrane Substances 0.000 description 4
- 210000000056 organ Anatomy 0.000 description 4
- 229920001223 polyethylene glycol Polymers 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- RXWNCPJZOCPEPQ-NVWDDTSBSA-N puromycin Chemical compound C1=CC(OC)=CC=C1C[C@H](N)C(=O)N[C@H]1[C@@H](O)[C@H](N2C3=NC=NC(=C3N=C2)N(C)C)O[C@@H]1CO RXWNCPJZOCPEPQ-NVWDDTSBSA-N 0.000 description 4
- 238000011084 recovery Methods 0.000 description 4
- 230000008439 repair process Effects 0.000 description 4
- 108091008146 restriction endonucleases Proteins 0.000 description 4
- 238000012552 review Methods 0.000 description 4
- 238000007920 subcutaneous administration Methods 0.000 description 4
- WYWHKKSPHMUBEB-UHFFFAOYSA-N tioguanine Chemical compound N1C(N)=NC(=S)C2=C1N=CN2 WYWHKKSPHMUBEB-UHFFFAOYSA-N 0.000 description 4
- 238000011200 topical administration Methods 0.000 description 4
- 230000029812 viral genome replication Effects 0.000 description 4
- NOIRDLRUNWIUMX-UHFFFAOYSA-N 2-amino-3,7-dihydropurin-6-one;6-amino-1h-pyrimidin-2-one Chemical compound NC=1C=CNC(=O)N=1.O=C1NC(N)=NC2=C1NC=N2 NOIRDLRUNWIUMX-UHFFFAOYSA-N 0.000 description 3
- FFKUHGONCHRHPE-UHFFFAOYSA-N 5-methyl-1h-pyrimidine-2,4-dione;7h-purin-6-amine Chemical compound CC1=CNC(=O)NC1=O.NC1=NC=NC2=C1NC=N2 FFKUHGONCHRHPE-UHFFFAOYSA-N 0.000 description 3
- 101150052384 50 gene Proteins 0.000 description 3
- 208000030507 AIDS Diseases 0.000 description 3
- 102100024643 ATP-binding cassette sub-family D member 1 Human genes 0.000 description 3
- 229930024421 Adenine Natural products 0.000 description 3
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 3
- 108010052875 Adenine deaminase Proteins 0.000 description 3
- 102100022976 B-cell lymphoma/leukemia 11A Human genes 0.000 description 3
- 102000036365 BRCA1 Human genes 0.000 description 3
- 108700020463 BRCA1 Proteins 0.000 description 3
- 101150072950 BRCA1 gene Proteins 0.000 description 3
- 108700020462 BRCA2 Proteins 0.000 description 3
- 102000052609 BRCA2 Human genes 0.000 description 3
- 102000015081 Blood Coagulation Factors Human genes 0.000 description 3
- 108010039209 Blood Coagulation Factors Proteins 0.000 description 3
- 101150008921 Brca2 gene Proteins 0.000 description 3
- 108010056102 CD100 antigen Proteins 0.000 description 3
- 108010017009 CD11b Antigen Proteins 0.000 description 3
- 102100024263 CD160 antigen Human genes 0.000 description 3
- 102100038077 CD226 antigen Human genes 0.000 description 3
- 102100027217 CD82 antigen Human genes 0.000 description 3
- 101710139831 CD82 antigen Proteins 0.000 description 3
- 102100024533 Carcinoembryonic antigen-related cell adhesion molecule 1 Human genes 0.000 description 3
- 102100025064 Cellular tumor antigen p53 Human genes 0.000 description 3
- 102100028233 Coronin-1A Human genes 0.000 description 3
- 108010080611 Cytosine Deaminase Proteins 0.000 description 3
- 102000000311 Cytosine Deaminase Human genes 0.000 description 3
- FBPFZTCFMRRESA-KVTDHHQDSA-N D-Mannitol Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-KVTDHHQDSA-N 0.000 description 3
- 230000004568 DNA-binding Effects 0.000 description 3
- 241000588724 Escherichia coli Species 0.000 description 3
- 108091029865 Exogenous DNA Proteins 0.000 description 3
- 102000018233 Fibroblast Growth Factor Human genes 0.000 description 3
- 108050007372 Fibroblast Growth Factor Proteins 0.000 description 3
- 108010010803 Gelatin Proteins 0.000 description 3
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 3
- 102100031249 H/ACA ribonucleoprotein complex subunit DKC1 Human genes 0.000 description 3
- 102100038614 Hemoglobin subunit gamma-1 Human genes 0.000 description 3
- 101000761938 Homo sapiens CD160 antigen Proteins 0.000 description 3
- 101000884298 Homo sapiens CD226 antigen Proteins 0.000 description 3
- 101000860852 Homo sapiens Coronin-1A Proteins 0.000 description 3
- 101000844866 Homo sapiens H/ACA ribonucleoprotein complex subunit DKC1 Proteins 0.000 description 3
- 101001031977 Homo sapiens Hemoglobin subunit gamma-1 Proteins 0.000 description 3
- 101001046683 Homo sapiens Integrin alpha-L Proteins 0.000 description 3
- 101001046668 Homo sapiens Integrin alpha-X Proteins 0.000 description 3
- 101001015037 Homo sapiens Integrin beta-7 Proteins 0.000 description 3
- 101001137987 Homo sapiens Lymphocyte activation gene 3 protein Proteins 0.000 description 3
- 101001109503 Homo sapiens NKG2-C type II integral membrane protein Proteins 0.000 description 3
- 101001109501 Homo sapiens NKG2-D type II integral membrane protein Proteins 0.000 description 3
- 101000589305 Homo sapiens Natural cytotoxicity triggering receptor 2 Proteins 0.000 description 3
- 101000873418 Homo sapiens P-selectin glycoprotein ligand 1 Proteins 0.000 description 3
- 101000692259 Homo sapiens Phosphoprotein associated with glycosphingolipid-enriched microdomains 1 Proteins 0.000 description 3
- 101000633778 Homo sapiens SLAM family member 5 Proteins 0.000 description 3
- 101000633784 Homo sapiens SLAM family member 7 Proteins 0.000 description 3
- 101000934346 Homo sapiens T-cell surface antigen CD2 Proteins 0.000 description 3
- 101000596234 Homo sapiens T-cell surface protein tactile Proteins 0.000 description 3
- 101000800312 Homo sapiens TERF1-interacting nuclear factor 2 Proteins 0.000 description 3
- 101000611183 Homo sapiens Tumor necrosis factor Proteins 0.000 description 3
- 101000795169 Homo sapiens Tumor necrosis factor receptor superfamily member 13C Proteins 0.000 description 3
- 101000648507 Homo sapiens Tumor necrosis factor receptor superfamily member 14 Proteins 0.000 description 3
- 101000801234 Homo sapiens Tumor necrosis factor receptor superfamily member 18 Proteins 0.000 description 3
- 101000679857 Homo sapiens Tumor necrosis factor receptor superfamily member 3 Proteins 0.000 description 3
- 108010091358 Hypoxanthine Phosphoribosyltransferase Proteins 0.000 description 3
- 102100022339 Integrin alpha-L Human genes 0.000 description 3
- 108010041100 Integrin alpha6 Proteins 0.000 description 3
- 108010030465 Integrin alpha6beta1 Proteins 0.000 description 3
- 102100033016 Integrin beta-7 Human genes 0.000 description 3
- 108010064593 Intercellular Adhesion Molecule-1 Proteins 0.000 description 3
- 102100037877 Intercellular adhesion molecule 1 Human genes 0.000 description 3
- 108010002350 Interleukin-2 Proteins 0.000 description 3
- 108090001005 Interleukin-6 Proteins 0.000 description 3
- 102000002791 Interleukin-8B Receptors Human genes 0.000 description 3
- 108010018951 Interleukin-8B Receptors Proteins 0.000 description 3
- 208000015439 Lysosomal storage disease Diseases 0.000 description 3
- 241000124008 Mammalia Species 0.000 description 3
- 241000713869 Moloney murine leukemia virus Species 0.000 description 3
- 101100236305 Mus musculus Ly9 gene Proteins 0.000 description 3
- 101100494762 Mus musculus Nedd9 gene Proteins 0.000 description 3
- 102100022683 NKG2-C type II integral membrane protein Human genes 0.000 description 3
- 102100022680 NKG2-D type II integral membrane protein Human genes 0.000 description 3
- 108010004217 Natural Cytotoxicity Triggering Receptor 1 Proteins 0.000 description 3
- 108010004222 Natural Cytotoxicity Triggering Receptor 3 Proteins 0.000 description 3
- 102100032870 Natural cytotoxicity triggering receptor 1 Human genes 0.000 description 3
- 102100032851 Natural cytotoxicity triggering receptor 2 Human genes 0.000 description 3
- 102100032852 Natural cytotoxicity triggering receptor 3 Human genes 0.000 description 3
- 101710141230 Natural killer cell receptor 2B4 Proteins 0.000 description 3
- 108700020796 Oncogene Proteins 0.000 description 3
- 102100034925 P-selectin glycoprotein ligand 1 Human genes 0.000 description 3
- 102100026066 Phosphoprotein associated with glycosphingolipid-enriched microdomains 1 Human genes 0.000 description 3
- 108091000080 Phosphotransferase Proteins 0.000 description 3
- 101710089372 Programmed cell death protein 1 Proteins 0.000 description 3
- 102100040678 Programmed cell death protein 1 Human genes 0.000 description 3
- 102100032617 Pulmonary surfactant-associated protein B Human genes 0.000 description 3
- 241000700159 Rattus Species 0.000 description 3
- 235000011449 Rosa Nutrition 0.000 description 3
- 241000714474 Rous sarcoma virus Species 0.000 description 3
- 102100029216 SLAM family member 5 Human genes 0.000 description 3
- 102100029198 SLAM family member 7 Human genes 0.000 description 3
- 108020004682 Single-Stranded DNA Proteins 0.000 description 3
- 101710088580 Stromal cell-derived factor 1 Proteins 0.000 description 3
- 102100025237 T-cell surface antigen CD2 Human genes 0.000 description 3
- 102100035268 T-cell surface protein tactile Human genes 0.000 description 3
- 102100033085 TERF1-interacting nuclear factor 2 Human genes 0.000 description 3
- BPEGJWRSRHCHSN-UHFFFAOYSA-N Temozolomide Chemical compound O=C1N(C)N=NC2=C(C(N)=O)N=CN21 BPEGJWRSRHCHSN-UHFFFAOYSA-N 0.000 description 3
- 108020004566 Transfer RNA Proteins 0.000 description 3
- 102100040247 Tumor necrosis factor Human genes 0.000 description 3
- 102100029690 Tumor necrosis factor receptor superfamily member 13C Human genes 0.000 description 3
- 102100033728 Tumor necrosis factor receptor superfamily member 18 Human genes 0.000 description 3
- 102100033733 Tumor necrosis factor receptor superfamily member 1B Human genes 0.000 description 3
- 101710187830 Tumor necrosis factor receptor superfamily member 1B Proteins 0.000 description 3
- 102100022156 Tumor necrosis factor receptor superfamily member 3 Human genes 0.000 description 3
- 101710165473 Tumor necrosis factor receptor superfamily member 4 Proteins 0.000 description 3
- 108010073929 Vascular Endothelial Growth Factor A Proteins 0.000 description 3
- 102000005789 Vascular Endothelial Growth Factors Human genes 0.000 description 3
- 108010019530 Vascular Endothelial Growth Factors Proteins 0.000 description 3
- 238000010521 absorption reaction Methods 0.000 description 3
- 229960000643 adenine Drugs 0.000 description 3
- 230000003321 amplification Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 238000002869 basic local alignment search tool Methods 0.000 description 3
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 3
- 239000003114 blood coagulation factor Substances 0.000 description 3
- 210000001185 bone marrow Anatomy 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 239000000969 carrier Substances 0.000 description 3
- 239000002771 cell marker Substances 0.000 description 3
- 230000036755 cellular response Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000015271 coagulation Effects 0.000 description 3
- 238000005345 coagulation Methods 0.000 description 3
- 238000000576 coating method Methods 0.000 description 3
- 229940104302 cytosine Drugs 0.000 description 3
- 231100000433 cytotoxic Toxicity 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 230000004069 differentiation Effects 0.000 description 3
- 239000003085 diluting agent Substances 0.000 description 3
- 230000029142 excretion Effects 0.000 description 3
- 229940126864 fibroblast growth factor Drugs 0.000 description 3
- 239000012530 fluid Substances 0.000 description 3
- 239000008273 gelatin Substances 0.000 description 3
- 229920000159 gelatin Polymers 0.000 description 3
- 235000019322 gelatine Nutrition 0.000 description 3
- 235000011852 gelatine desserts Nutrition 0.000 description 3
- 238000012239 gene modification Methods 0.000 description 3
- 239000008103 glucose Substances 0.000 description 3
- 229940088597 hormone Drugs 0.000 description 3
- 239000005556 hormone Substances 0.000 description 3
- 210000002865 immune cell Anatomy 0.000 description 3
- 230000028993 immune response Effects 0.000 description 3
- 230000002637 immunotoxin Effects 0.000 description 3
- 239000002596 immunotoxin Substances 0.000 description 3
- 231100000608 immunotoxin Toxicity 0.000 description 3
- 229940051026 immunotoxin Drugs 0.000 description 3
- 230000002779 inactivation Effects 0.000 description 3
- 239000007972 injectable composition Substances 0.000 description 3
- 239000007928 intraperitoneal injection Substances 0.000 description 3
- 238000001990 intravenous administration Methods 0.000 description 3
- 238000011835 investigation Methods 0.000 description 3
- 239000007951 isotonicity adjuster Substances 0.000 description 3
- 210000004962 mammalian cell Anatomy 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 3
- 238000003199 nucleic acid amplification method Methods 0.000 description 3
- 210000005259 peripheral blood Anatomy 0.000 description 3
- 239000011886 peripheral blood Substances 0.000 description 3
- 125000004437 phosphorous atom Chemical group 0.000 description 3
- 102000020233 phosphotransferase Human genes 0.000 description 3
- 239000002504 physiological saline solution Substances 0.000 description 3
- 239000003755 preservative agent Substances 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000011321 prophylaxis Methods 0.000 description 3
- 102000027426 receptor tyrosine kinases Human genes 0.000 description 3
- 108091008598 receptor tyrosine kinases Proteins 0.000 description 3
- 230000007115 recruitment Effects 0.000 description 3
- 230000000717 retained effect Effects 0.000 description 3
- 150000003384 small molecules Chemical class 0.000 description 3
- 230000009870 specific binding Effects 0.000 description 3
- 239000007929 subcutaneous injection Substances 0.000 description 3
- 239000000758 substrate Substances 0.000 description 3
- 239000004094 surface-active agent Substances 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 229960004964 temozolomide Drugs 0.000 description 3
- 230000005030 transcription termination Effects 0.000 description 3
- 230000002103 transcriptional effect Effects 0.000 description 3
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 3
- VBICKXHEKHSIBG-UHFFFAOYSA-N 1-monostearoylglycerol Chemical compound CCCCCCCCCCCCCCCCCC(=O)OCC(O)CO VBICKXHEKHSIBG-UHFFFAOYSA-N 0.000 description 2
- 101150000874 11 gene Proteins 0.000 description 2
- 101150082072 14 gene Proteins 0.000 description 2
- 101150076401 16 gene Proteins 0.000 description 2
- QRBLKGHRWFGINE-UGWAGOLRSA-N 2-[2-[2-[[2-[[4-[[2-[[6-amino-2-[3-amino-1-[(2,3-diamino-3-oxopropyl)amino]-3-oxopropyl]-5-methylpyrimidine-4-carbonyl]amino]-3-[(2r,3s,4s,5s,6s)-3-[(2s,3r,4r,5s)-4-carbamoyl-3,4,5-trihydroxy-6-(hydroxymethyl)oxan-2-yl]oxy-4,5-dihydroxy-6-(hydroxymethyl)- Chemical compound N=1C(C=2SC=C(N=2)C(N)=O)CSC=1CCNC(=O)C(C(C)=O)NC(=O)C(C)C(O)C(C)NC(=O)C(C(O[C@H]1[C@@]([C@@H](O)[C@H](O)[C@H](CO)O1)(C)O[C@H]1[C@@H]([C@](O)([C@@H](O)C(CO)O1)C(N)=O)O)C=1NC=NC=1)NC(=O)C1=NC(C(CC(N)=O)NCC(N)C(N)=O)=NC(N)=C1C QRBLKGHRWFGINE-UGWAGOLRSA-N 0.000 description 2
- 101150042997 21 gene Proteins 0.000 description 2
- 101150002210 34 gene Proteins 0.000 description 2
- 101150084399 37 gene Proteins 0.000 description 2
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 2
- TVZGACDUOSZQKY-LBPRGKRZSA-N 4-aminofolic acid Chemical compound C1=NC2=NC(N)=NC(N)=C2N=C1CNC1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 TVZGACDUOSZQKY-LBPRGKRZSA-N 0.000 description 2
- 108020003589 5' Untranslated Regions Proteins 0.000 description 2
- 102100025915 5' exonuclease Apollo Human genes 0.000 description 2
- SLXKOJJOQWFEFD-UHFFFAOYSA-N 6-aminohexanoic acid Chemical compound NCCCCCC(O)=O SLXKOJJOQWFEFD-UHFFFAOYSA-N 0.000 description 2
- 101150101112 7 gene Proteins 0.000 description 2
- 102100022712 Alpha-1-antitrypsin Human genes 0.000 description 2
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 2
- 102100023635 Alpha-fetoprotein Human genes 0.000 description 2
- 102100026882 Alpha-synuclein Human genes 0.000 description 2
- 101100243447 Arabidopsis thaliana PER53 gene Proteins 0.000 description 2
- 102100022146 Arylsulfatase A Human genes 0.000 description 2
- 102100027203 B-cell antigen receptor complex-associated protein beta chain Human genes 0.000 description 2
- 102100038080 B-cell receptor CD22 Human genes 0.000 description 2
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 2
- 101100284398 Bos taurus BoLA-DQB gene Proteins 0.000 description 2
- 101001069913 Bos taurus Growth-regulated protein homolog beta Proteins 0.000 description 2
- 102100035875 C-C chemokine receptor type 5 Human genes 0.000 description 2
- 101710149870 C-C chemokine receptor type 5 Proteins 0.000 description 2
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 2
- 102100024217 CAMPATH-1 antigen Human genes 0.000 description 2
- 102100038078 CD276 antigen Human genes 0.000 description 2
- 101710185679 CD276 antigen Proteins 0.000 description 2
- 102000017420 CD3 protein, epsilon/gamma/delta subunit Human genes 0.000 description 2
- 108050005493 CD3 protein, epsilon/gamma/delta subunit Proteins 0.000 description 2
- 108010065524 CD52 Antigen Proteins 0.000 description 2
- 102100035793 CD83 antigen Human genes 0.000 description 2
- 101150018129 CSF2 gene Proteins 0.000 description 2
- 101150069031 CSN2 gene Proteins 0.000 description 2
- 102100039319 Calcium release-activated calcium channel protein 1 Human genes 0.000 description 2
- 108010036867 Cerebroside-Sulfatase Proteins 0.000 description 2
- 101710163595 Chaperone protein DnaK Proteins 0.000 description 2
- 102100038215 Chromodomain-helicase-DNA-binding protein 7 Human genes 0.000 description 2
- 208000035473 Communicable disease Diseases 0.000 description 2
- RGSFGYAAUTVSQA-UHFFFAOYSA-N Cyclopentane Chemical compound C1CCCC1 RGSFGYAAUTVSQA-UHFFFAOYSA-N 0.000 description 2
- 102100027816 Cytotoxic and regulatory T-cell molecule Human genes 0.000 description 2
- FBPFZTCFMRRESA-FSIIMWSLSA-N D-Glucitol Natural products OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-FSIIMWSLSA-N 0.000 description 2
- FBPFZTCFMRRESA-JGWLITMVSA-N D-glucitol Chemical compound OC[C@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-JGWLITMVSA-N 0.000 description 2
- 102100040263 DNA dC->dU-editing enzyme APOBEC-3A Human genes 0.000 description 2
- 230000005778 DNA damage Effects 0.000 description 2
- 231100000277 DNA damage Toxicity 0.000 description 2
- 102100033195 DNA ligase 4 Human genes 0.000 description 2
- 102100029094 DNA repair endonuclease XPF Human genes 0.000 description 2
- 102100034484 DNA repair protein RAD51 homolog 3 Human genes 0.000 description 2
- 102100027830 DNA repair protein XRCC2 Human genes 0.000 description 2
- 102000052510 DNA-Binding Proteins Human genes 0.000 description 2
- 108700020911 DNA-Binding Proteins Proteins 0.000 description 2
- 102100020986 DNA-binding protein RFX5 Human genes 0.000 description 2
- 102100021044 DNA-binding protein RFXANK Human genes 0.000 description 2
- 102100022204 DNA-dependent protein kinase catalytic subunit Human genes 0.000 description 2
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 2
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 2
- 102100036912 Desmin Human genes 0.000 description 2
- 102100024746 Dihydrofolate reductase Human genes 0.000 description 2
- 102000016607 Diphtheria Toxin Human genes 0.000 description 2
- 108010053187 Diphtheria Toxin Proteins 0.000 description 2
- 206010059866 Drug resistance Diseases 0.000 description 2
- 108010069091 Dystrophin Proteins 0.000 description 2
- 102000001039 Dystrophin Human genes 0.000 description 2
- 101150029662 E1 gene Proteins 0.000 description 2
- 102100022822 E3 ubiquitin-protein ligase RFWD3 Human genes 0.000 description 2
- 102100022207 E3 ubiquitin-protein ligase parkin Human genes 0.000 description 2
- 102100025137 Early activation antigen CD69 Human genes 0.000 description 2
- 102100023226 Early growth response protein 1 Human genes 0.000 description 2
- 108700041152 Endoplasmic Reticulum Chaperone BiP Proteins 0.000 description 2
- 102100021451 Endoplasmic reticulum chaperone BiP Human genes 0.000 description 2
- 102100039328 Endoplasmin Human genes 0.000 description 2
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 2
- 102100031690 Erythroid transcription factor Human genes 0.000 description 2
- LYCAIKOWRPUZTN-UHFFFAOYSA-N Ethylene glycol Chemical compound OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 description 2
- 108010076282 Factor IX Proteins 0.000 description 2
- 108010067741 Fanconi Anemia Complementation Group N protein Proteins 0.000 description 2
- 102100034553 Fanconi anemia group J protein Human genes 0.000 description 2
- 102100023371 Forkhead box protein N1 Human genes 0.000 description 2
- 102000003688 G-Protein-Coupled Receptors Human genes 0.000 description 2
- 108090000045 G-Protein-Coupled Receptors Proteins 0.000 description 2
- 102100031181 Glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- 208000032003 Glycogen storage disease due to glucose-6-phosphatase deficiency Diseases 0.000 description 2
- 206010018464 Glycogen storage disease type I Diseases 0.000 description 2
- 208000031886 HIV Infections Diseases 0.000 description 2
- 208000037357 HIV infectious disease Diseases 0.000 description 2
- 101150112743 HSPA5 gene Proteins 0.000 description 2
- 101710178376 Heat shock 70 kDa protein Proteins 0.000 description 2
- 101710152018 Heat shock cognate 70 kDa protein Proteins 0.000 description 2
- 102100029360 Hematopoietic cell signal transducer Human genes 0.000 description 2
- 108091005880 Hemoglobin F Proteins 0.000 description 2
- 108090000100 Hepatocyte Growth Factor Proteins 0.000 description 2
- 102100021866 Hepatocyte growth factor Human genes 0.000 description 2
- 101000720953 Homo sapiens 5' exonuclease Apollo Proteins 0.000 description 2
- 101000834898 Homo sapiens Alpha-synuclein Proteins 0.000 description 2
- 101000914491 Homo sapiens B-cell antigen receptor complex-associated protein beta chain Proteins 0.000 description 2
- 101000884305 Homo sapiens B-cell receptor CD22 Proteins 0.000 description 2
- 101000901683 Homo sapiens Battenin Proteins 0.000 description 2
- 101000889128 Homo sapiens C-X-C motif chemokine 2 Proteins 0.000 description 2
- 101000946856 Homo sapiens CD83 antigen Proteins 0.000 description 2
- 101100382122 Homo sapiens CIITA gene Proteins 0.000 description 2
- 101000883739 Homo sapiens Chromodomain-helicase-DNA-binding protein 7 Proteins 0.000 description 2
- 101000964378 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3A Proteins 0.000 description 2
- 101000927810 Homo sapiens DNA ligase 4 Proteins 0.000 description 2
- 101001132271 Homo sapiens DNA repair protein RAD51 homolog 3 Proteins 0.000 description 2
- 101000649306 Homo sapiens DNA repair protein XRCC2 Proteins 0.000 description 2
- 101001075432 Homo sapiens DNA-binding protein RFX5 Proteins 0.000 description 2
- 101001075464 Homo sapiens DNA-binding protein RFXANK Proteins 0.000 description 2
- 101000619536 Homo sapiens DNA-dependent protein kinase catalytic subunit Proteins 0.000 description 2
- 101000756779 Homo sapiens E3 ubiquitin-protein ligase RFWD3 Proteins 0.000 description 2
- 101000619542 Homo sapiens E3 ubiquitin-protein ligase parkin Proteins 0.000 description 2
- 101000934374 Homo sapiens Early activation antigen CD69 Proteins 0.000 description 2
- 101001049697 Homo sapiens Early growth response protein 1 Proteins 0.000 description 2
- 101001066268 Homo sapiens Erythroid transcription factor Proteins 0.000 description 2
- 101000848171 Homo sapiens Fanconi anemia group J protein Proteins 0.000 description 2
- 101000990188 Homo sapiens Hematopoietic cell signal transducer Proteins 0.000 description 2
- 101001009007 Homo sapiens Hemoglobin subunit alpha Proteins 0.000 description 2
- 101001031961 Homo sapiens Hemoglobin subunit gamma-2 Proteins 0.000 description 2
- 101000962530 Homo sapiens Hyaluronidase-1 Proteins 0.000 description 2
- 101001046686 Homo sapiens Integrin alpha-M Proteins 0.000 description 2
- 101001002634 Homo sapiens Interleukin-1 alpha Proteins 0.000 description 2
- 101001047640 Homo sapiens Linker for activation of T-cells family member 1 Proteins 0.000 description 2
- 101000583811 Homo sapiens Mitotic spindle assembly checkpoint protein MAD2B Proteins 0.000 description 2
- 101000578059 Homo sapiens Non-homologous end-joining factor 1 Proteins 0.000 description 2
- 101001103036 Homo sapiens Nuclear receptor ROR-alpha Proteins 0.000 description 2
- 101000801640 Homo sapiens Phospholipid-transporting ATPase ABCA3 Proteins 0.000 description 2
- 101000772905 Homo sapiens Polyubiquitin-B Proteins 0.000 description 2
- 101000617536 Homo sapiens Presenilin-1 Proteins 0.000 description 2
- 101000617546 Homo sapiens Presenilin-2 Proteins 0.000 description 2
- 101000720958 Homo sapiens Protein artemis Proteins 0.000 description 2
- 101001086862 Homo sapiens Pulmonary surfactant-associated protein B Proteins 0.000 description 2
- 101000612671 Homo sapiens Pulmonary surfactant-associated protein C Proteins 0.000 description 2
- 101001100327 Homo sapiens RNA-binding protein 45 Proteins 0.000 description 2
- 101000712958 Homo sapiens Ras association domain-containing protein 1 Proteins 0.000 description 2
- 101001075466 Homo sapiens Regulatory factor X-associated protein Proteins 0.000 description 2
- 101000605835 Homo sapiens Serine/threonine-protein kinase PINK1, mitochondrial Proteins 0.000 description 2
- 101000617130 Homo sapiens Stromal cell-derived factor 1 Proteins 0.000 description 2
- 101000702606 Homo sapiens Structure-specific endonuclease subunit SLX4 Proteins 0.000 description 2
- 101000914496 Homo sapiens T-cell antigen CD7 Proteins 0.000 description 2
- 101000738413 Homo sapiens T-cell surface glycoprotein CD3 gamma chain Proteins 0.000 description 2
- 101000738335 Homo sapiens T-cell surface glycoprotein CD3 zeta chain Proteins 0.000 description 2
- 101000946843 Homo sapiens T-cell surface glycoprotein CD8 alpha chain Proteins 0.000 description 2
- 101000809875 Homo sapiens TYRO protein tyrosine kinase-binding protein Proteins 0.000 description 2
- 101000851376 Homo sapiens Tumor necrosis factor receptor superfamily member 8 Proteins 0.000 description 2
- 101000934996 Homo sapiens Tyrosine-protein kinase JAK3 Proteins 0.000 description 2
- 101001047681 Homo sapiens Tyrosine-protein kinase Lck Proteins 0.000 description 2
- 101000818543 Homo sapiens Tyrosine-protein kinase ZAP-70 Proteins 0.000 description 2
- 101001103033 Homo sapiens Tyrosine-protein kinase transmembrane receptor ROR2 Proteins 0.000 description 2
- 101001135589 Homo sapiens Tyrosine-protein phosphatase non-receptor type 22 Proteins 0.000 description 2
- 101000837581 Homo sapiens Ubiquitin-conjugating enzyme E2 T Proteins 0.000 description 2
- 101001061851 Homo sapiens V(D)J recombination-activating protein 2 Proteins 0.000 description 2
- 101150090950 Hsc70-1 gene Proteins 0.000 description 2
- 102100039283 Hyaluronidase-1 Human genes 0.000 description 2
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 2
- 102100029098 Hypoxanthine-guanine phosphoribosyltransferase Human genes 0.000 description 2
- 102000026633 IL6 Human genes 0.000 description 2
- 102000037982 Immune checkpoint proteins Human genes 0.000 description 2
- 108091008036 Immune checkpoint proteins Proteins 0.000 description 2
- 206010061598 Immunodeficiency Diseases 0.000 description 2
- 208000029462 Immunodeficiency disease Diseases 0.000 description 2
- 102000037984 Inhibitory immune checkpoint proteins Human genes 0.000 description 2
- 108091008026 Inhibitory immune checkpoint proteins Proteins 0.000 description 2
- 229930010555 Inosine Natural products 0.000 description 2
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 2
- 108010001127 Insulin Receptor Proteins 0.000 description 2
- 102100036721 Insulin receptor Human genes 0.000 description 2
- 108090000174 Interleukin-10 Proteins 0.000 description 2
- 102000003814 Interleukin-10 Human genes 0.000 description 2
- 108010065805 Interleukin-12 Proteins 0.000 description 2
- 102000013462 Interleukin-12 Human genes 0.000 description 2
- 108090000176 Interleukin-13 Proteins 0.000 description 2
- 102000003816 Interleukin-13 Human genes 0.000 description 2
- 102000004388 Interleukin-4 Human genes 0.000 description 2
- 108090000978 Interleukin-4 Proteins 0.000 description 2
- 108091092195 Intron Proteins 0.000 description 2
- 239000007760 Iscove's Modified Dulbecco's Medium Substances 0.000 description 2
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 2
- FBOZXECLQNJBKD-ZDUSSCGKSA-N L-methotrexate Chemical compound C=1N=C2N=C(N)N=C(N)C2=NC=1CN(C)C1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 FBOZXECLQNJBKD-ZDUSSCGKSA-N 0.000 description 2
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 2
- 108010020246 Leucine-Rich Repeat Serine-Threonine Protein Kinase-2 Proteins 0.000 description 2
- 102100032693 Leucine-rich repeat serine/threonine-protein kinase 2 Human genes 0.000 description 2
- 102100024032 Linker for activation of T-cells family member 1 Human genes 0.000 description 2
- 102100020862 Lymphocyte activation gene 3 protein Human genes 0.000 description 2
- 102100026371 MHC class II transactivator Human genes 0.000 description 2
- 108700002010 MHC class II transactivator Proteins 0.000 description 2
- 102100030955 Mitotic spindle assembly checkpoint protein MAD2B Human genes 0.000 description 2
- 101001037757 Mus musculus Heat shock 70 kDa protein 1A Proteins 0.000 description 2
- GXCLVBGFBYZDAG-UHFFFAOYSA-N N-[2-(1H-indol-3-yl)ethyl]-N-methylprop-2-en-1-amine Chemical compound CN(CCC1=CNC2=C1C=CC=C2)CC=C GXCLVBGFBYZDAG-UHFFFAOYSA-N 0.000 description 2
- 102100035488 Nectin-2 Human genes 0.000 description 2
- 229930193140 Neomycin Natural products 0.000 description 2
- 102100028156 Non-homologous end-joining factor 1 Human genes 0.000 description 2
- 108700027851 ORAI1 Proteins 0.000 description 2
- 241000283973 Oryctolagus cuniculus Species 0.000 description 2
- 108010011536 PTEN Phosphohydrolase Proteins 0.000 description 2
- 102000014160 PTEN Phosphohydrolase Human genes 0.000 description 2
- 102100037499 Parkinson disease protein 7 Human genes 0.000 description 2
- 102100040884 Partner and localizer of BRCA2 Human genes 0.000 description 2
- LTQCLFMNABRKSH-UHFFFAOYSA-N Phleomycin Natural products N=1C(C=2SC=C(N=2)C(N)=O)CSC=1CCNC(=O)C(C(O)C)NC(=O)C(C)C(O)C(C)NC(=O)C(C(OC1C(C(O)C(O)C(CO)O1)OC1C(C(OC(N)=O)C(O)C(CO)O1)O)C=1NC=NC=1)NC(=O)C1=NC(C(CC(N)=O)NCC(N)C(N)=O)=NC(N)=C1C LTQCLFMNABRKSH-UHFFFAOYSA-N 0.000 description 2
- 108010035235 Phleomycins Proteins 0.000 description 2
- 102100033623 Phospholipid-transporting ATPase ABCA3 Human genes 0.000 description 2
- 108091007412 Piwi-interacting RNA Proteins 0.000 description 2
- 108010038512 Platelet-Derived Growth Factor Proteins 0.000 description 2
- 102000010780 Platelet-Derived Growth Factor Human genes 0.000 description 2
- 102100030432 Polyubiquitin-B Human genes 0.000 description 2
- WCUXLLCKKVVCTQ-UHFFFAOYSA-M Potassium chloride Chemical compound [Cl-].[K+] WCUXLLCKKVVCTQ-UHFFFAOYSA-M 0.000 description 2
- 102100022033 Presenilin-1 Human genes 0.000 description 2
- 102100022036 Presenilin-2 Human genes 0.000 description 2
- 108010032428 Protein Deglycase DJ-1 Proteins 0.000 description 2
- 102100025918 Protein artemis Human genes 0.000 description 2
- 102100024267 Proton-coupled folate transporter Human genes 0.000 description 2
- 102100040971 Pulmonary surfactant-associated protein C Human genes 0.000 description 2
- 102000013009 Pyruvate Kinase Human genes 0.000 description 2
- 108020005115 Pyruvate Kinase Proteins 0.000 description 2
- 102000001195 RAD51 Human genes 0.000 description 2
- 102000001183 RAG-1 Human genes 0.000 description 2
- 108060006897 RAG1 Proteins 0.000 description 2
- 230000006819 RNA synthesis Effects 0.000 description 2
- 102100038823 RNA-binding protein 45 Human genes 0.000 description 2
- 108090000292 RNA-binding protein FUS Proteins 0.000 description 2
- 102000003890 RNA-binding protein FUS Human genes 0.000 description 2
- 108010068097 Rad51 Recombinase Proteins 0.000 description 2
- 102100033243 Ras association domain-containing protein 1 Human genes 0.000 description 2
- 102100021043 Regulatory factor X-associated protein Human genes 0.000 description 2
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 2
- 108010083644 Ribonucleases Proteins 0.000 description 2
- 102000006382 Ribonucleases Human genes 0.000 description 2
- 108010000605 Ribosomal Proteins Proteins 0.000 description 2
- 108091007566 SLC46A1 Proteins 0.000 description 2
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 2
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 2
- 101100111629 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) KAR2 gene Proteins 0.000 description 2
- 101100150366 Schizosaccharomyces pombe (strain 972 / ATCC 24843) sks2 gene Proteins 0.000 description 2
- 238000012300 Sequence Analysis Methods 0.000 description 2
- 102100038376 Serine/threonine-protein kinase PINK1, mitochondrial Human genes 0.000 description 2
- 108010003723 Single-Domain Antibodies Proteins 0.000 description 2
- 102000039471 Small Nuclear RNA Human genes 0.000 description 2
- 102100025750 Sphingosine 1-phosphate receptor 1 Human genes 0.000 description 2
- 101710155454 Sphingosine 1-phosphate receptor 1 Proteins 0.000 description 2
- 229920002472 Starch Polymers 0.000 description 2
- 241000194017 Streptococcus Species 0.000 description 2
- 102000004094 Stromal Interaction Molecule 1 Human genes 0.000 description 2
- 108090000532 Stromal Interaction Molecule 1 Proteins 0.000 description 2
- 102100031003 Structure-specific endonuclease subunit SLX4 Human genes 0.000 description 2
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 2
- 229930006000 Sucrose Natural products 0.000 description 2
- 108010021188 Superoxide Dismutase-1 Proteins 0.000 description 2
- 102100038836 Superoxide dismutase [Cu-Zn] Human genes 0.000 description 2
- 102100037911 T-cell surface glycoprotein CD3 gamma chain Human genes 0.000 description 2
- 102100037906 T-cell surface glycoprotein CD3 zeta chain Human genes 0.000 description 2
- 102100034922 T-cell surface glycoprotein CD8 alpha chain Human genes 0.000 description 2
- 238000010459 TALEN Methods 0.000 description 2
- 102100040347 TAR DNA-binding protein 43 Human genes 0.000 description 2
- 101150014554 TARDBP gene Proteins 0.000 description 2
- 101150080074 TP53 gene Proteins 0.000 description 2
- 102100038717 TYRO protein tyrosine kinase-binding protein Human genes 0.000 description 2
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical class OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 2
- 102000006601 Thymidine Kinase Human genes 0.000 description 2
- 108020004440 Thymidine kinase Proteins 0.000 description 2
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 2
- 102100036857 Tumor necrosis factor receptor superfamily member 8 Human genes 0.000 description 2
- 102100025387 Tyrosine-protein kinase JAK3 Human genes 0.000 description 2
- 102100024036 Tyrosine-protein kinase Lck Human genes 0.000 description 2
- 102100021125 Tyrosine-protein kinase ZAP-70 Human genes 0.000 description 2
- 102100039616 Tyrosine-protein kinase transmembrane receptor ROR2 Human genes 0.000 description 2
- 102100033138 Tyrosine-protein phosphatase non-receptor type 22 Human genes 0.000 description 2
- 102100039933 Ubiquilin-2 Human genes 0.000 description 2
- 101710173440 Ubiquilin-2 Proteins 0.000 description 2
- 102100028705 Ubiquitin-conjugating enzyme E2 T Human genes 0.000 description 2
- 102100029591 V(D)J recombination-activating protein 2 Human genes 0.000 description 2
- 108091008605 VEGF receptors Proteins 0.000 description 2
- 108010000134 Vascular Cell Adhesion Molecule-1 Proteins 0.000 description 2
- 102000009484 Vascular Endothelial Growth Factor Receptors Human genes 0.000 description 2
- 102100023543 Vascular cell adhesion protein 1 Human genes 0.000 description 2
- 108010015940 Viomycin Proteins 0.000 description 2
- OZKXLOZHHUHGNV-UHFFFAOYSA-N Viomycin Natural products NCCCC(N)CC(=O)NC1CNC(=O)C(=CNC(=O)N)NC(=O)C(CO)NC(=O)C(CO)NC(=O)C(NC1=O)C2CC(O)NC(=N)N2 OZKXLOZHHUHGNV-UHFFFAOYSA-N 0.000 description 2
- 108010084455 Zeocin Proteins 0.000 description 2
- 101710185494 Zinc finger protein Proteins 0.000 description 2
- 102100023597 Zinc finger protein 816 Human genes 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 239000013543 active substance Substances 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000033289 adaptive immune response Effects 0.000 description 2
- 229960005305 adenosine Drugs 0.000 description 2
- 230000002411 adverse Effects 0.000 description 2
- 235000004279 alanine Nutrition 0.000 description 2
- 230000000735 allogeneic effect Effects 0.000 description 2
- 150000001408 amides Chemical class 0.000 description 2
- 125000000539 amino acid group Chemical group 0.000 description 2
- 229960003896 aminopterin Drugs 0.000 description 2
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 2
- 229960000723 ampicillin Drugs 0.000 description 2
- 239000003242 anti bacterial agent Substances 0.000 description 2
- 239000003963 antioxidant agent Substances 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 235000019445 benzyl alcohol Nutrition 0.000 description 2
- SESFRYSPDFLNCH-UHFFFAOYSA-N benzyl benzoate Chemical compound C=1C=CC=CC=1C(=O)OCC1=CC=CC=C1 SESFRYSPDFLNCH-UHFFFAOYSA-N 0.000 description 2
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 229930189065 blasticidin Natural products 0.000 description 2
- 210000000601 blood cell Anatomy 0.000 description 2
- 239000006227 byproduct Substances 0.000 description 2
- AIYUHDOJVYHVIT-UHFFFAOYSA-M caesium chloride Chemical compound [Cl-].[Cs+] AIYUHDOJVYHVIT-UHFFFAOYSA-M 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 108020001778 catalytic domains Proteins 0.000 description 2
- 230000003915 cell function Effects 0.000 description 2
- 210000000170 cell membrane Anatomy 0.000 description 2
- 238000002659 cell therapy Methods 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 239000002576 chemokine receptor CXCR4 antagonist Substances 0.000 description 2
- 238000002512 chemotherapy Methods 0.000 description 2
- 108010072917 class-I restricted T cell-associated molecule Proteins 0.000 description 2
- 238000011284 combination treatment Methods 0.000 description 2
- 230000003750 conditioning effect Effects 0.000 description 2
- 101150055601 cops2 gene Proteins 0.000 description 2
- 230000001472 cytotoxic effect Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000001784 detoxification Methods 0.000 description 2
- 235000005911 diet Nutrition 0.000 description 2
- 230000037213 diet Effects 0.000 description 2
- 108020001096 dihydrofolate reductase Proteins 0.000 description 2
- 238000010494 dissociation reaction Methods 0.000 description 2
- 230000005593 dissociations Effects 0.000 description 2
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 description 2
- 230000011559 double-strand break repair via nonhomologous end joining Effects 0.000 description 2
- 239000012039 electrophile Substances 0.000 description 2
- 150000002148 esters Chemical class 0.000 description 2
- MMXKVMNBHPAILY-UHFFFAOYSA-N ethyl laurate Chemical compound CCCCCCCCCCCC(=O)OCC MMXKVMNBHPAILY-UHFFFAOYSA-N 0.000 description 2
- 230000001747 exhibiting effect Effects 0.000 description 2
- 239000000945 filler Substances 0.000 description 2
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 108010038853 gamma-Globins Proteins 0.000 description 2
- BTCSSZJGUNDROE-UHFFFAOYSA-N gamma-aminobutyric acid Chemical compound NCCCC(O)=O BTCSSZJGUNDROE-UHFFFAOYSA-N 0.000 description 2
- 230000005017 genetic modification Effects 0.000 description 2
- 235000013617 genetically modified food Nutrition 0.000 description 2
- 231100000024 genotoxic Toxicity 0.000 description 2
- 230000001738 genotoxic effect Effects 0.000 description 2
- 108010017007 glucose-regulated proteins Proteins 0.000 description 2
- 150000004676 glycans Chemical class 0.000 description 2
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 2
- 235000011187 glycerol Nutrition 0.000 description 2
- 201000004541 glycogen storage disease I Diseases 0.000 description 2
- 230000013595 glycosylation Effects 0.000 description 2
- 238000006206 glycosylation reaction Methods 0.000 description 2
- 230000012010 growth Effects 0.000 description 2
- 239000003102 growth factor Substances 0.000 description 2
- 239000001963 growth medium Substances 0.000 description 2
- 101150028578 grp78 gene Proteins 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 238000002744 homologous recombination Methods 0.000 description 2
- 230000006801 homologous recombination Effects 0.000 description 2
- 208000033519 human immunodeficiency virus infectious disease Diseases 0.000 description 2
- 230000003463 hyperproliferative effect Effects 0.000 description 2
- 230000007813 immunodeficiency Effects 0.000 description 2
- 238000002650 immunosuppressive therapy Methods 0.000 description 2
- 238000002513 implantation Methods 0.000 description 2
- 230000000415 inactivating effect Effects 0.000 description 2
- 208000018337 inherited hemoglobinopathy Diseases 0.000 description 2
- 229960003786 inosine Drugs 0.000 description 2
- 102000006495 integrins Human genes 0.000 description 2
- 108010044426 integrins Proteins 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 238000001361 intraarterial administration Methods 0.000 description 2
- 238000010255 intramuscular injection Methods 0.000 description 2
- 239000007927 intramuscular injection Substances 0.000 description 2
- 238000007912 intraperitoneal administration Methods 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 239000008101 lactose Substances 0.000 description 2
- 239000002502 liposome Substances 0.000 description 2
- 210000004698 lymphocyte Anatomy 0.000 description 2
- 210000003712 lysosome Anatomy 0.000 description 2
- 230000001868 lysosomic effect Effects 0.000 description 2
- 235000010355 mannitol Nutrition 0.000 description 2
- 230000013011 mating Effects 0.000 description 2
- 239000002609 medium Substances 0.000 description 2
- 229960000485 methotrexate Drugs 0.000 description 2
- 238000009126 molecular therapy Methods 0.000 description 2
- JJVZSYKFCOBILL-MKMRYRNGSA-N motixafortide Chemical compound NCCCC[C@@H]1NC(=O)[C@H](CCCNC(N)=O)NC(=O)[C@H](Cc2ccc(O)cc2)NC(=O)[C@H](CSSC[C@H](NC(=O)[C@H](CCCNC(N)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](Cc2ccc(O)cc2)NC(=O)[C@@H]2CCCN2C(=O)[C@H](CCCCN)NC1=O)C(=O)N[C@@H](CCCNC(N)=N)C(N)=O)NC(=O)[C@H](Cc1ccc2ccccc2c1)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCCNC(N)=N)NC(=O)c1ccc(F)cc1 JJVZSYKFCOBILL-MKMRYRNGSA-N 0.000 description 2
- 208000022018 mucopolysaccharidosis type 2 Diseases 0.000 description 2
- 208000011045 mucopolysaccharidosis type 3 Diseases 0.000 description 2
- 208000025919 mucopolysaccharidosis type 7 Diseases 0.000 description 2
- 229960004927 neomycin Drugs 0.000 description 2
- 210000000440 neutrophil Anatomy 0.000 description 2
- 108091027963 non-coding RNA Proteins 0.000 description 2
- 102000042567 non-coding RNA Human genes 0.000 description 2
- 101150060735 orai1 gene Proteins 0.000 description 2
- 238000007911 parenteral administration Methods 0.000 description 2
- 230000010412 perfusion Effects 0.000 description 2
- 101150079312 pgk1 gene Proteins 0.000 description 2
- 230000000144 pharmacologic effect Effects 0.000 description 2
- CWCMIVBLVUHDHK-ZSNHEYEWSA-N phleomycin D1 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC[C@@H](N=1)C=1SC=C(N=1)C(=O)NCCCCNC(N)=N)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C CWCMIVBLVUHDHK-ZSNHEYEWSA-N 0.000 description 2
- 229910052698 phosphorus Inorganic materials 0.000 description 2
- 230000008488 polyadenylation Effects 0.000 description 2
- 229920000728 polyester Polymers 0.000 description 2
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 2
- 230000035755 proliferation Effects 0.000 description 2
- 229950010131 puromycin Drugs 0.000 description 2
- 102000016914 ras Proteins Human genes 0.000 description 2
- 108010014186 ras Proteins Proteins 0.000 description 2
- 230000001177 retroviral effect Effects 0.000 description 2
- 239000008159 sesame oil Substances 0.000 description 2
- 235000011803 sesame oil Nutrition 0.000 description 2
- 108091006024 signal transducing proteins Proteins 0.000 description 2
- 102000034285 signal transducing proteins Human genes 0.000 description 2
- 108091029842 small nuclear ribonucleic acid Proteins 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 229960002920 sorbitol Drugs 0.000 description 2
- 239000003549 soybean oil Substances 0.000 description 2
- 235000012424 soybean oil Nutrition 0.000 description 2
- DUYSYHSSBDVJSM-KRWOKUGFSA-N sphingosine 1-phosphate Chemical compound CCCCCCCCCCCCC\C=C\[C@@H](O)[C@@H](N)COP(O)(O)=O DUYSYHSSBDVJSM-KRWOKUGFSA-N 0.000 description 2
- 235000019698 starch Nutrition 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 238000010254 subcutaneous injection Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 239000005720 sucrose Substances 0.000 description 2
- 235000000346 sugar Nutrition 0.000 description 2
- 150000008163 sugars Chemical class 0.000 description 2
- 239000000829 suppository Substances 0.000 description 2
- 239000000375 suspending agent Substances 0.000 description 2
- 239000000725 suspension Substances 0.000 description 2
- 230000009897 systematic effect Effects 0.000 description 2
- 230000009885 systemic effect Effects 0.000 description 2
- 239000000454 talc Substances 0.000 description 2
- 229910052623 talc Inorganic materials 0.000 description 2
- 108010057210 telomerase RNA Proteins 0.000 description 2
- 229940104230 thymidine Drugs 0.000 description 2
- 229960003087 tioguanine Drugs 0.000 description 2
- 230000000699 topical effect Effects 0.000 description 2
- 230000001988 toxicity Effects 0.000 description 2
- 231100000419 toxicity Toxicity 0.000 description 2
- 238000001890 transfection Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 102000035160 transmembrane proteins Human genes 0.000 description 2
- 108091005703 transmembrane proteins Proteins 0.000 description 2
- 229940124676 vascular endothelial growth factor receptor Drugs 0.000 description 2
- GXFAIFRPOKBQRV-GHXCTMGLSA-N viomycin Chemical compound N1C(=O)\C(=C\NC(N)=O)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)C[C@@H](N)CCCN)CNC(=O)[C@@H]1[C@@H]1NC(=N)N[C@@H](O)C1 GXFAIFRPOKBQRV-GHXCTMGLSA-N 0.000 description 2
- 229950001272 viomycin Drugs 0.000 description 2
- 210000002845 virion Anatomy 0.000 description 2
- 108010073629 xeroderma pigmentosum group F protein Proteins 0.000 description 2
- DIGQNXIGRZPYDK-WKSCXVIASA-N (2R)-6-amino-2-[[2-[[(2S)-2-[[2-[[(2R)-2-[[(2S)-2-[[(2R,3S)-2-[[2-[[(2S)-2-[[2-[[(2S)-2-[[(2S)-2-[[(2R)-2-[[(2S,3S)-2-[[(2R)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[2-[[(2S)-2-[[(2R)-2-[[2-[[2-[[2-[(2-amino-1-hydroxyethylidene)amino]-3-carboxy-1-hydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1,5-dihydroxy-5-iminopentylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]hexanoic acid Chemical compound C[C@@H]([C@@H](C(=N[C@@H](CS)C(=N[C@@H](C)C(=N[C@@H](CO)C(=NCC(=N[C@@H](CCC(=N)O)C(=NC(CS)C(=N[C@H]([C@H](C)O)C(=N[C@H](CS)C(=N[C@H](CO)C(=NCC(=N[C@H](CS)C(=NCC(=N[C@H](CCCCN)C(=O)O)O)O)O)O)O)O)O)O)O)O)O)O)O)N=C([C@H](CS)N=C([C@H](CO)N=C([C@H](CO)N=C([C@H](C)N=C(CN=C([C@H](CO)N=C([C@H](CS)N=C(CN=C(C(CS)N=C(C(CC(=O)O)N=C(CN)O)O)O)O)O)O)O)O)O)O)O)O DIGQNXIGRZPYDK-WKSCXVIASA-N 0.000 description 1
- IPVFGAYTKQKGBM-BYPJNBLXSA-N 1-[(2r,3s,4r,5r)-3-fluoro-4-hydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-iodopyrimidine-2,4-dione Chemical compound F[C@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(I)=C1 IPVFGAYTKQKGBM-BYPJNBLXSA-N 0.000 description 1
- UEUPDYPUTTUXLJ-UHFFFAOYSA-N 1-[[4-(1,4,8,11-tetrazacyclotetradec-1-ylmethyl)phenyl]methyl]-1,4,8,11-tetrazacyclotetradecane;octahydrochloride Chemical compound Cl.Cl.Cl.Cl.Cl.Cl.Cl.Cl.C=1C=C(CN2CCNCCCNCCNCCC2)C=CC=1CN1CCCNCCNCCCNCC1 UEUPDYPUTTUXLJ-UHFFFAOYSA-N 0.000 description 1
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 1
- IIZPXYDJLKNOIY-JXPKJXOSSA-N 1-palmitoyl-2-arachidonoyl-sn-glycero-3-phosphocholine Chemical compound CCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCC\C=C/C\C=C/C\C=C/C\C=C/CCCCC IIZPXYDJLKNOIY-JXPKJXOSSA-N 0.000 description 1
- 108010093960 2-((1-(3,5-dichlorobenzenesulfonyl)pyrrolidine-2-carbonyl)amino)-4-(4-methyl-2-(methyl-(2-(4-(3-o-tolylureido)phenyl)acetyl)amino)pentanoylamino)butyric acid Proteins 0.000 description 1
- 102100031599 2-(3-amino-3-carboxypropyl)histidine synthase subunit 1 Human genes 0.000 description 1
- XWNJMSJGJFSGRY-UHFFFAOYSA-N 2-(benzylamino)-3,7-dihydropurin-6-one Chemical compound N1C=2N=CNC=2C(=O)N=C1NCC1=CC=CC=C1 XWNJMSJGJFSGRY-UHFFFAOYSA-N 0.000 description 1
- QZDDFQLIQRYMBV-UHFFFAOYSA-N 2-[3-nitro-2-(2-nitrophenyl)-4-oxochromen-8-yl]acetic acid Chemical compound OC(=O)CC1=CC=CC(C(C=2[N+]([O-])=O)=O)=C1OC=2C1=CC=CC=C1[N+]([O-])=O QZDDFQLIQRYMBV-UHFFFAOYSA-N 0.000 description 1
- MZZYGYNZAOVRTG-UHFFFAOYSA-N 2-hydroxy-n-(1h-1,2,4-triazol-5-yl)benzamide Chemical compound OC1=CC=CC=C1C(=O)NC1=NC=NN1 MZZYGYNZAOVRTG-UHFFFAOYSA-N 0.000 description 1
- 108010060188 4-fluorobenzoyl-TN-14003 Proteins 0.000 description 1
- 102100022464 5'-nucleotidase Human genes 0.000 description 1
- OYMNPJXKQVTQTR-UHFFFAOYSA-N 5-[4-phenyl-5-(trifluoromethyl)-2-thiophenyl]-3-[3-(trifluoromethyl)phenyl]-1,2,4-oxadiazole Chemical compound FC(F)(F)C=1SC(C=2ON=C(N=2)C=2C=C(C=CC=2)C(F)(F)F)=CC=1C1=CC=CC=C1 OYMNPJXKQVTQTR-UHFFFAOYSA-N 0.000 description 1
- 108010004483 APOBEC-3G Deaminase Proteins 0.000 description 1
- 101150084229 ATXN1 gene Proteins 0.000 description 1
- 241000251468 Actinopterygii Species 0.000 description 1
- 102100025976 Adenosine deaminase 2 Human genes 0.000 description 1
- 101710142940 Adenosine deaminase 2 Proteins 0.000 description 1
- 108700040115 Adenosine deaminases Proteins 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- 102100027211 Albumin Human genes 0.000 description 1
- 108010088751 Albumins Proteins 0.000 description 1
- 102100035028 Alpha-L-iduronidase Human genes 0.000 description 1
- 102100034561 Alpha-N-acetylglucosaminidase Human genes 0.000 description 1
- 102100022749 Aminopeptidase N Human genes 0.000 description 1
- 239000004382 Amylase Substances 0.000 description 1
- 102000013142 Amylases Human genes 0.000 description 1
- 108010065511 Amylases Proteins 0.000 description 1
- 101100449747 Aneurinibacillus migulanus gsp gene Proteins 0.000 description 1
- 108010049777 Ankyrins Proteins 0.000 description 1
- 102000008102 Ankyrins Human genes 0.000 description 1
- 108020005544 Antisense RNA Proteins 0.000 description 1
- 206010002961 Aplasia Diseases 0.000 description 1
- 102000013918 Apolipoproteins E Human genes 0.000 description 1
- 108010025628 Apolipoproteins E Proteins 0.000 description 1
- 101100281515 Arabidopsis thaliana FOX1 gene Proteins 0.000 description 1
- 101100233567 Arabidopsis thaliana ISPG gene Proteins 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- 102000004452 Arginase Human genes 0.000 description 1
- 108700024123 Arginases Proteins 0.000 description 1
- 240000003291 Armoracia rusticana Species 0.000 description 1
- 235000011330 Armoracia rusticana Nutrition 0.000 description 1
- 102100031491 Arylsulfatase B Human genes 0.000 description 1
- 241000416162 Astragalus gummifer Species 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 102100027205 B-cell antigen receptor complex-associated protein alpha chain Human genes 0.000 description 1
- 108010074708 B7-H1 Antigen Proteins 0.000 description 1
- 241000193830 Bacillus <bacterium> Species 0.000 description 1
- 241000606125 Bacteroides Species 0.000 description 1
- 102100022440 Battenin Human genes 0.000 description 1
- 102100026189 Beta-galactosidase Human genes 0.000 description 1
- 102100026031 Beta-glucuronidase Human genes 0.000 description 1
- 102100022548 Beta-hexosaminidase subunit alpha Human genes 0.000 description 1
- 102100037674 Bis(5'-adenosyl)-triphosphatase Human genes 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 108090000715 Brain-derived neurotrophic factor Proteins 0.000 description 1
- 102000004219 Brain-derived neurotrophic factor Human genes 0.000 description 1
- 102100031151 C-C chemokine receptor type 2 Human genes 0.000 description 1
- 101710149815 C-C chemokine receptor type 2 Proteins 0.000 description 1
- 102100024167 C-C chemokine receptor type 3 Human genes 0.000 description 1
- 101710149862 C-C chemokine receptor type 3 Proteins 0.000 description 1
- 102100036305 C-C chemokine receptor type 8 Human genes 0.000 description 1
- 102100025618 C-X-C chemokine receptor type 6 Human genes 0.000 description 1
- 108010049990 CD13 Antigens Proteins 0.000 description 1
- 101150075764 CD4 gene Proteins 0.000 description 1
- 102100036008 CD48 antigen Human genes 0.000 description 1
- 102100037904 CD9 antigen Human genes 0.000 description 1
- 102100027652 COP9 signalosome complex subunit 2 Human genes 0.000 description 1
- 108010040467 CRISPR-Associated Proteins Proteins 0.000 description 1
- 101150119033 CSE2 gene Proteins 0.000 description 1
- 101150053778 CSF1R gene Proteins 0.000 description 1
- 101150017047 CSM3 gene Proteins 0.000 description 1
- 101150110592 CTS1 gene Proteins 0.000 description 1
- 108050006947 CXC Chemokine Proteins 0.000 description 1
- 102000019388 CXC chemokine Human genes 0.000 description 1
- 101100381481 Caenorhabditis elegans baz-2 gene Proteins 0.000 description 1
- 101100364669 Caenorhabditis elegans lin-18 gene Proteins 0.000 description 1
- 241000589876 Campylobacter Species 0.000 description 1
- 241000282465 Canis Species 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 102100025466 Carcinoembryonic antigen-related cell adhesion molecule 3 Human genes 0.000 description 1
- 102100024965 Caspase recruitment domain-containing protein 11 Human genes 0.000 description 1
- 108090000994 Catalytic RNA Proteins 0.000 description 1
- 102000053642 Catalytic RNA Human genes 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 229940122444 Chemokine receptor antagonist Drugs 0.000 description 1
- 102100034927 Cholecystokinin receptor type A Human genes 0.000 description 1
- 241000251730 Chondrichthyes Species 0.000 description 1
- 102100035371 Chymotrypsin-like elastase family member 1 Human genes 0.000 description 1
- 101710138848 Chymotrypsin-like elastase family member 1 Proteins 0.000 description 1
- 108010005939 Ciliary Neurotrophic Factor Proteins 0.000 description 1
- 102100031614 Ciliary neurotrophic factor Human genes 0.000 description 1
- 108091062157 Cis-regulatory element Proteins 0.000 description 1
- 206010053567 Coagulopathies Diseases 0.000 description 1
- 206010010099 Combined immunodeficiency Diseases 0.000 description 1
- 108700040183 Complement C1 Inhibitor Proteins 0.000 description 1
- 102000055157 Complement C1 Inhibitor Human genes 0.000 description 1
- 102100025680 Complement decay-accelerating factor Human genes 0.000 description 1
- 108010024682 Core Binding Factor Alpha 1 Subunit Proteins 0.000 description 1
- 102000015775 Core Binding Factor Alpha 1 Subunit Human genes 0.000 description 1
- 229920002261 Corn starch Polymers 0.000 description 1
- 108010051219 Cre recombinase Proteins 0.000 description 1
- 241000938605 Crocodylia Species 0.000 description 1
- 101150074775 Csf1 gene Proteins 0.000 description 1
- 108010069514 Cyclic Peptides Proteins 0.000 description 1
- 102000001189 Cyclic Peptides Human genes 0.000 description 1
- 102100024458 Cyclin-dependent kinase inhibitor 2A Human genes 0.000 description 1
- CMSMOCZEIVJLDB-UHFFFAOYSA-N Cyclophosphamide Chemical compound ClCCN(CCCl)P1(=O)NCCCO1 CMSMOCZEIVJLDB-UHFFFAOYSA-N 0.000 description 1
- 108010076010 Cystathionine beta-lyase Proteins 0.000 description 1
- 108010079245 Cystic Fibrosis Transmembrane Conductance Regulator Proteins 0.000 description 1
- UHDGCWIWMRVCDJ-CCXZUQQUSA-N Cytarabine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@@H](O)[C@H](O)[C@@H](CO)O1 UHDGCWIWMRVCDJ-CCXZUQQUSA-N 0.000 description 1
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 1
- 241000701022 Cytomegalovirus Species 0.000 description 1
- QNAYBMKLOCPYGJ-UWTATZPHSA-N D-alanine Chemical compound C[C@@H](N)C(O)=O QNAYBMKLOCPYGJ-UWTATZPHSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-UHFFFAOYSA-N D-alpha-Ala Natural products CC([NH3+])C([O-])=O QNAYBMKLOCPYGJ-UHFFFAOYSA-N 0.000 description 1
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 1
- 102100038076 DNA dC->dU-editing enzyme APOBEC-3G Human genes 0.000 description 1
- 238000012270 DNA recombination Methods 0.000 description 1
- 230000033616 DNA repair Effects 0.000 description 1
- 230000008265 DNA repair mechanism Effects 0.000 description 1
- 230000004543 DNA replication Effects 0.000 description 1
- 230000007018 DNA scission Effects 0.000 description 1
- 108010044052 Desmin Proteins 0.000 description 1
- BWGNESOTFCXPMA-UHFFFAOYSA-N Dihydrogen disulfide Chemical compound SS BWGNESOTFCXPMA-UHFFFAOYSA-N 0.000 description 1
- 108010049959 Discoidins Proteins 0.000 description 1
- 241000255581 Drosophila <fruit fly, genus> Species 0.000 description 1
- 101100285903 Drosophila melanogaster Hsc70-2 gene Proteins 0.000 description 1
- 101100261976 Drosophila melanogaster trk gene Proteins 0.000 description 1
- 241001269524 Dura Species 0.000 description 1
- 102100025682 Dystroglycan 1 Human genes 0.000 description 1
- 108010071885 Dystroglycans Proteins 0.000 description 1
- 101150005585 E3 gene Proteins 0.000 description 1
- 102100035813 E3 ubiquitin-protein ligase CBL Human genes 0.000 description 1
- 108050002772 E3 ubiquitin-protein ligase Mdm2 Proteins 0.000 description 1
- 102000012199 E3 ubiquitin-protein ligase Mdm2 Human genes 0.000 description 1
- 101150066038 E4 gene Proteins 0.000 description 1
- 102000001301 EGF receptor Human genes 0.000 description 1
- 102000012545 EGF-like domains Human genes 0.000 description 1
- 108050002150 EGF-like domains Proteins 0.000 description 1
- LVGKNOAMLMIIKO-UHFFFAOYSA-N Elaidinsaeure-aethylester Natural products CCCCCCCCC=CCCCCCCCC(=O)OCC LVGKNOAMLMIIKO-UHFFFAOYSA-N 0.000 description 1
- 101710099240 Elastase-1 Proteins 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 102100037241 Endoglin Human genes 0.000 description 1
- 108010036395 Endoglin Proteins 0.000 description 1
- 102000004533 Endonucleases Human genes 0.000 description 1
- 241000305071 Enterobacterales Species 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 101000585551 Equus caballus Pregnancy-associated glycoprotein Proteins 0.000 description 1
- 101100007792 Escherichia coli (strain K12) casB gene Proteins 0.000 description 1
- 241000702191 Escherichia virus P1 Species 0.000 description 1
- 102100029951 Estrogen receptor beta Human genes 0.000 description 1
- 239000001856 Ethyl cellulose Substances 0.000 description 1
- ZZSNKZQZMQGXPY-UHFFFAOYSA-N Ethyl cellulose Chemical compound CCOCC1OC(OC)C(OCC)C(OCC)C1OC1C(O)C(O)C(OC)C(CO)O1 ZZSNKZQZMQGXPY-UHFFFAOYSA-N 0.000 description 1
- 241000186394 Eubacterium Species 0.000 description 1
- 101710196289 Eukaryotic translation initiation factor 2-alpha kinase 1 Proteins 0.000 description 1
- 208000024720 Fabry Disease Diseases 0.000 description 1
- 108010021468 Fc gamma receptor IIA Proteins 0.000 description 1
- 108010087819 Fc receptors Proteins 0.000 description 1
- 102000009109 Fc receptors Human genes 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 108090000386 Fibroblast Growth Factor 1 Proteins 0.000 description 1
- 102100031706 Fibroblast growth factor 1 Human genes 0.000 description 1
- 102100024785 Fibroblast growth factor 2 Human genes 0.000 description 1
- 108090000379 Fibroblast growth factor 2 Proteins 0.000 description 1
- 102100037362 Fibronectin Human genes 0.000 description 1
- 108010067306 Fibronectins Proteins 0.000 description 1
- 206010016654 Fibrosis Diseases 0.000 description 1
- 241000589565 Flavobacterium Species 0.000 description 1
- 102100023416 G-protein coupled receptor 15 Human genes 0.000 description 1
- 102100022360 GATOR complex protein NPRL2 Human genes 0.000 description 1
- 102100022086 GRB2-related adapter protein 2 Human genes 0.000 description 1
- 102400000500 GRO-beta(5-73) Human genes 0.000 description 1
- 101150000435 GSS gene Proteins 0.000 description 1
- 102100037948 GTP-binding protein Di-Ras3 Human genes 0.000 description 1
- 102100029974 GTPase HRas Human genes 0.000 description 1
- 102100039788 GTPase NRas Human genes 0.000 description 1
- 241000287828 Gallus gallus Species 0.000 description 1
- 208000015872 Gaucher disease Diseases 0.000 description 1
- 208000034826 Genetic Predisposition to Disease Diseases 0.000 description 1
- 108090000495 Glia Maturation Factor Proteins 0.000 description 1
- 102100039289 Glial fibrillary acidic protein Human genes 0.000 description 1
- 101710193519 Glial fibrillary acidic protein Proteins 0.000 description 1
- 241000032681 Gluconacetobacter Species 0.000 description 1
- 102000009127 Glutaminase Human genes 0.000 description 1
- 108010073324 Glutaminase Proteins 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 208000032007 Glycogen storage disease due to acid maltase deficiency Diseases 0.000 description 1
- 206010053185 Glycogen storage disease type II Diseases 0.000 description 1
- 102000003886 Glycoproteins Human genes 0.000 description 1
- 108090000288 Glycoproteins Proteins 0.000 description 1
- 229920002683 Glycosaminoglycan Polymers 0.000 description 1
- UYTPUPDQBNUYGX-UHFFFAOYSA-N Guanine Natural products O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 1
- 102000029812 HNH nuclease Human genes 0.000 description 1
- 108060003760 HNH nuclease Proteins 0.000 description 1
- 239000012981 Hank's balanced salt solution Substances 0.000 description 1
- 208000031220 Hemophilia Diseases 0.000 description 1
- 102100039991 Heparan-alpha-glucosaminide N-acetyltransferase Human genes 0.000 description 1
- 102100034458 Hepatitis A virus cellular receptor 2 Human genes 0.000 description 1
- 101710083479 Hepatitis A virus cellular receptor 2 homolog Proteins 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 102100022132 High affinity immunoglobulin epsilon receptor subunit gamma Human genes 0.000 description 1
- 102100026122 High affinity immunoglobulin gamma Fc receptor I Human genes 0.000 description 1
- 102100022103 Histone-lysine N-methyltransferase 2A Human genes 0.000 description 1
- 101000866191 Homo sapiens 2-(3-amino-3-carboxypropyl)histidine synthase subunit 1 Proteins 0.000 description 1
- 101000678236 Homo sapiens 5'-nucleotidase Proteins 0.000 description 1
- 101000924577 Homo sapiens Adenomatous polyposis coli protein Proteins 0.000 description 1
- 101001019502 Homo sapiens Alpha-L-iduronidase Proteins 0.000 description 1
- 101000923070 Homo sapiens Arylsulfatase B Proteins 0.000 description 1
- 101000914489 Homo sapiens B-cell antigen receptor complex-associated protein alpha chain Proteins 0.000 description 1
- 101000947120 Homo sapiens Beta-casein Proteins 0.000 description 1
- 101000765010 Homo sapiens Beta-galactosidase Proteins 0.000 description 1
- 101000933465 Homo sapiens Beta-glucuronidase Proteins 0.000 description 1
- 101000716063 Homo sapiens C-C chemokine receptor type 8 Proteins 0.000 description 1
- 101000856683 Homo sapiens C-X-C chemokine receptor type 6 Proteins 0.000 description 1
- 101100005238 Homo sapiens CARTPT gene Proteins 0.000 description 1
- 101000716130 Homo sapiens CD48 antigen Proteins 0.000 description 1
- 101000738354 Homo sapiens CD9 antigen Proteins 0.000 description 1
- 101000726004 Homo sapiens COP9 signalosome complex subunit 2 Proteins 0.000 description 1
- 101000914337 Homo sapiens Carcinoembryonic antigen-related cell adhesion molecule 3 Proteins 0.000 description 1
- 101000761179 Homo sapiens Caspase recruitment domain-containing protein 11 Proteins 0.000 description 1
- 101000946804 Homo sapiens Cholecystokinin receptor type A Proteins 0.000 description 1
- 101000856022 Homo sapiens Complement decay-accelerating factor Proteins 0.000 description 1
- 101000746783 Homo sapiens Cytochrome b-c1 complex subunit 6, mitochondrial Proteins 0.000 description 1
- 101000928044 Homo sapiens Desmin Proteins 0.000 description 1
- 101000851181 Homo sapiens Epidermal growth factor receptor Proteins 0.000 description 1
- 101001010910 Homo sapiens Estrogen receptor beta Proteins 0.000 description 1
- 101000907576 Homo sapiens Forkhead box protein N1 Proteins 0.000 description 1
- 101000829794 Homo sapiens G-protein coupled receptor 15 Proteins 0.000 description 1
- 101000900690 Homo sapiens GRB2-related adapter protein 2 Proteins 0.000 description 1
- 101000951235 Homo sapiens GTP-binding protein Di-Ras3 Proteins 0.000 description 1
- 101000584633 Homo sapiens GTPase HRas Proteins 0.000 description 1
- 101000744505 Homo sapiens GTPase NRas Proteins 0.000 description 1
- 101001035092 Homo sapiens Heparan-alpha-glucosaminide N-acetyltransferase Proteins 0.000 description 1
- 101000824104 Homo sapiens High affinity immunoglobulin epsilon receptor subunit gamma Proteins 0.000 description 1
- 101000913074 Homo sapiens High affinity immunoglobulin gamma Fc receptor I Proteins 0.000 description 1
- 101000898505 Homo sapiens Histatin-3 Proteins 0.000 description 1
- 101001045846 Homo sapiens Histone-lysine N-methyltransferase 2A Proteins 0.000 description 1
- 101000962526 Homo sapiens Hyaluronidase-2 Proteins 0.000 description 1
- 101000840540 Homo sapiens Iduronate 2-sulfatase Proteins 0.000 description 1
- 101000606465 Homo sapiens Inactive tyrosine-protein kinase 7 Proteins 0.000 description 1
- 101000599951 Homo sapiens Insulin-like growth factor I Proteins 0.000 description 1
- 101001076418 Homo sapiens Interleukin-1 receptor type 1 Proteins 0.000 description 1
- 101001055144 Homo sapiens Interleukin-2 receptor subunit alpha Proteins 0.000 description 1
- 101000945339 Homo sapiens Killer cell immunoglobulin-like receptor 2DS2 Proteins 0.000 description 1
- 101000716729 Homo sapiens Kit ligand Proteins 0.000 description 1
- 101000777628 Homo sapiens Leukocyte antigen CD37 Proteins 0.000 description 1
- 101000608935 Homo sapiens Leukosialin Proteins 0.000 description 1
- 101001064870 Homo sapiens Lon protease homolog, mitochondrial Proteins 0.000 description 1
- 101000917858 Homo sapiens Low affinity immunoglobulin gamma Fc region receptor III-A Proteins 0.000 description 1
- 101000917839 Homo sapiens Low affinity immunoglobulin gamma Fc region receptor III-B Proteins 0.000 description 1
- 101001051093 Homo sapiens Low-density lipoprotein receptor Proteins 0.000 description 1
- 101001090688 Homo sapiens Lymphocyte cytosolic protein 2 Proteins 0.000 description 1
- 101000934372 Homo sapiens Macrosialin Proteins 0.000 description 1
- 101001012669 Homo sapiens Melanoma inhibitory activity protein 2 Proteins 0.000 description 1
- 101000946889 Homo sapiens Monocyte differentiation antigen CD14 Proteins 0.000 description 1
- 101001133056 Homo sapiens Mucin-1 Proteins 0.000 description 1
- 101001030211 Homo sapiens Myc proto-oncogene protein Proteins 0.000 description 1
- 101000934338 Homo sapiens Myeloid cell surface antigen CD33 Proteins 0.000 description 1
- 101001066305 Homo sapiens N-acetylgalactosamine-6-sulfatase Proteins 0.000 description 1
- 101000829992 Homo sapiens N-acetylglucosamine-6-sulfatase Proteins 0.000 description 1
- 101000651201 Homo sapiens N-sulphoglucosamine sulphohydrolase Proteins 0.000 description 1
- 101000998623 Homo sapiens NADH-cytochrome b5 reductase 3 Proteins 0.000 description 1
- 101001124867 Homo sapiens Peroxiredoxin-1 Proteins 0.000 description 1
- 101000738940 Homo sapiens Proline-rich nuclear receptor coactivator 1 Proteins 0.000 description 1
- 101000876829 Homo sapiens Protein C-ets-1 Proteins 0.000 description 1
- 101000898093 Homo sapiens Protein C-ets-2 Proteins 0.000 description 1
- 101000585703 Homo sapiens Protein L-Myc Proteins 0.000 description 1
- 101000695187 Homo sapiens Protein patched homolog 1 Proteins 0.000 description 1
- 101001000998 Homo sapiens Protein phosphatase 1 regulatory subunit 12C Proteins 0.000 description 1
- 101000702132 Homo sapiens Protein spinster homolog 1 Proteins 0.000 description 1
- 101001061518 Homo sapiens RNA-binding protein FUS Proteins 0.000 description 1
- 101000632270 Homo sapiens Semaphorin-3B Proteins 0.000 description 1
- 101001059454 Homo sapiens Serine/threonine-protein kinase MARK2 Proteins 0.000 description 1
- 101000595531 Homo sapiens Serine/threonine-protein kinase pim-1 Proteins 0.000 description 1
- 101000821100 Homo sapiens Synapsin-1 Proteins 0.000 description 1
- 101000839339 Homo sapiens Synaptotagmin-8 Proteins 0.000 description 1
- 101000800488 Homo sapiens T-cell leukemia homeobox protein 1 Proteins 0.000 description 1
- 101000946863 Homo sapiens T-cell surface glycoprotein CD3 delta chain Proteins 0.000 description 1
- 101000914484 Homo sapiens T-lymphocyte activation antigen CD80 Proteins 0.000 description 1
- 101000658622 Homo sapiens Testis-specific Y-encoded-like protein 2 Proteins 0.000 description 1
- 101000837626 Homo sapiens Thyroid hormone receptor alpha Proteins 0.000 description 1
- 101000891649 Homo sapiens Transcription elongation factor A protein-like 1 Proteins 0.000 description 1
- 101000813738 Homo sapiens Transcription factor ETV6 Proteins 0.000 description 1
- 101000636213 Homo sapiens Transcriptional activator Myb Proteins 0.000 description 1
- 101000659267 Homo sapiens Tumor suppressor candidate 2 Proteins 0.000 description 1
- 101000912503 Homo sapiens Tyrosine-protein kinase Fgr Proteins 0.000 description 1
- 101001022129 Homo sapiens Tyrosine-protein kinase Fyn Proteins 0.000 description 1
- 101001054878 Homo sapiens Tyrosine-protein kinase Lyn Proteins 0.000 description 1
- 101000607560 Homo sapiens Ubiquitin-conjugating enzyme E2 variant 3 Proteins 0.000 description 1
- 101000740759 Homo sapiens Voltage-dependent calcium channel subunit alpha-2/delta-2 Proteins 0.000 description 1
- 101000621371 Homo sapiens WD and tetratricopeptide repeats protein 1 Proteins 0.000 description 1
- 101000892274 Human adenovirus C serotype 2 Adenovirus death protein Proteins 0.000 description 1
- 241000700588 Human alphaherpesvirus 1 Species 0.000 description 1
- 241000701041 Human betaherpesvirus 7 Species 0.000 description 1
- 241000701044 Human gammaherpesvirus 4 Species 0.000 description 1
- 102100039285 Hyaluronidase-2 Human genes 0.000 description 1
- 102100031612 Hypermethylated in cancer 1 protein Human genes 0.000 description 1
- 101710133850 Hypermethylated in cancer 1 protein Proteins 0.000 description 1
- 206010021143 Hypoxia Diseases 0.000 description 1
- 102100029199 Iduronate 2-sulfatase Human genes 0.000 description 1
- 108010003381 Iduronidase Proteins 0.000 description 1
- 102000004627 Iduronidase Human genes 0.000 description 1
- 108010054477 Immunoglobulin Fab Fragments Proteins 0.000 description 1
- 102000001706 Immunoglobulin Fab Fragments Human genes 0.000 description 1
- 206010062016 Immunosuppression Diseases 0.000 description 1
- 102100039813 Inactive tyrosine-protein kinase 7 Human genes 0.000 description 1
- 108090000191 Inhibitor of growth protein 1 Proteins 0.000 description 1
- 102000003781 Inhibitor of growth protein 1 Human genes 0.000 description 1
- 102000012330 Integrases Human genes 0.000 description 1
- 102100025306 Integrin alpha-IIb Human genes 0.000 description 1
- 101710149643 Integrin alpha-IIb Proteins 0.000 description 1
- 102100037872 Intercellular adhesion molecule 2 Human genes 0.000 description 1
- 101710148794 Intercellular adhesion molecule 2 Proteins 0.000 description 1
- 102000004289 Interferon regulatory factor 1 Human genes 0.000 description 1
- 108090000890 Interferon regulatory factor 1 Proteins 0.000 description 1
- 102000006992 Interferon-alpha Human genes 0.000 description 1
- 108010047761 Interferon-alpha Proteins 0.000 description 1
- 102000003996 Interferon-beta Human genes 0.000 description 1
- 108090000467 Interferon-beta Proteins 0.000 description 1
- 102000008070 Interferon-gamma Human genes 0.000 description 1
- 108010074328 Interferon-gamma Proteins 0.000 description 1
- 102000014150 Interferons Human genes 0.000 description 1
- 108010050904 Interferons Proteins 0.000 description 1
- 108010002352 Interleukin-1 Proteins 0.000 description 1
- 102100026016 Interleukin-1 receptor type 1 Human genes 0.000 description 1
- 108090000177 Interleukin-11 Proteins 0.000 description 1
- 102000003815 Interleukin-11 Human genes 0.000 description 1
- 102100026878 Interleukin-2 receptor subunit alpha Human genes 0.000 description 1
- 108010002386 Interleukin-3 Proteins 0.000 description 1
- 108010002616 Interleukin-5 Proteins 0.000 description 1
- 108090001007 Interleukin-8 Proteins 0.000 description 1
- 102000004890 Interleukin-8 Human genes 0.000 description 1
- 108010002335 Interleukin-9 Proteins 0.000 description 1
- 102000000585 Interleukin-9 Human genes 0.000 description 1
- 108060005987 Kallikrein Proteins 0.000 description 1
- 102000001399 Kallikrein Human genes 0.000 description 1
- 102100033630 Killer cell immunoglobulin-like receptor 2DS2 Human genes 0.000 description 1
- 102000017578 LAG3 Human genes 0.000 description 1
- 108091008555 LTK receptors Proteins 0.000 description 1
- 108010000851 Laminin Receptors Proteins 0.000 description 1
- 102000002297 Laminin Receptors Human genes 0.000 description 1
- 241000589248 Legionella Species 0.000 description 1
- 208000007764 Legionnaires' Disease Diseases 0.000 description 1
- 241000713666 Lentivirus Species 0.000 description 1
- 241000255777 Lepidoptera Species 0.000 description 1
- 102100031586 Leukocyte antigen CD37 Human genes 0.000 description 1
- 102100039564 Leukosialin Human genes 0.000 description 1
- 102100031955 Lon protease homolog, mitochondrial Human genes 0.000 description 1
- 102100029204 Low affinity immunoglobulin gamma Fc region receptor II-a Human genes 0.000 description 1
- 102100029185 Low affinity immunoglobulin gamma Fc region receptor III-B Human genes 0.000 description 1
- 102100024640 Low-density lipoprotein receptor Human genes 0.000 description 1
- 102100034709 Lymphocyte cytosolic protein 2 Human genes 0.000 description 1
- 206010025323 Lymphomas Diseases 0.000 description 1
- 102100033448 Lysosomal alpha-glucosidase Human genes 0.000 description 1
- 108700012912 MYCN Proteins 0.000 description 1
- 101150022024 MYCN gene Proteins 0.000 description 1
- 241000282560 Macaca mulatta Species 0.000 description 1
- 206010050183 Macrocephaly Diseases 0.000 description 1
- 102100025136 Macrosialin Human genes 0.000 description 1
- 229930195725 Mannitol Natural products 0.000 description 1
- 208000005767 Megalencephaly Diseases 0.000 description 1
- 102100029778 Melanoma inhibitory activity protein 2 Human genes 0.000 description 1
- 102000003792 Metallothionein Human genes 0.000 description 1
- 108090000157 Metallothionein Proteins 0.000 description 1
- 102100035877 Monocyte differentiation antigen CD14 Human genes 0.000 description 1
- 102100025751 Mothers against decapentaplegic homolog 2 Human genes 0.000 description 1
- 102100025725 Mothers against decapentaplegic homolog 4 Human genes 0.000 description 1
- 102100034256 Mucin-1 Human genes 0.000 description 1
- 108010063954 Mucins Proteins 0.000 description 1
- 206010056893 Mucopolysaccharidosis VII Diseases 0.000 description 1
- 208000025915 Mucopolysaccharidosis type 6 Diseases 0.000 description 1
- 206010073148 Multiple endocrine neoplasia type 2A Diseases 0.000 description 1
- 101100437777 Mus musculus Bmpr1a gene Proteins 0.000 description 1
- 101100240347 Mus musculus Nectin2 gene Proteins 0.000 description 1
- 101000596402 Mus musculus Neuronal vesicle trafficking-associated protein 1 Proteins 0.000 description 1
- 101100364671 Mus musculus Ryk gene Proteins 0.000 description 1
- 101000800539 Mus musculus Translationally-controlled tumor protein Proteins 0.000 description 1
- 101100268066 Mus musculus Zap70 gene Proteins 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 102100038895 Myc proto-oncogene protein Human genes 0.000 description 1
- 241000204031 Mycoplasma Species 0.000 description 1
- 102100025243 Myeloid cell surface antigen CD33 Human genes 0.000 description 1
- 241000608621 Myotis lucifugus Species 0.000 description 1
- 101001055320 Myxine glutinosa Insulin-like growth factor Proteins 0.000 description 1
- 108700026495 N-Myc Proto-Oncogene Proteins 0.000 description 1
- 102100031688 N-acetylgalactosamine-6-sulfatase Human genes 0.000 description 1
- 102100023282 N-acetylglucosamine-6-sulfatase Human genes 0.000 description 1
- 102100030124 N-myc proto-oncogene protein Human genes 0.000 description 1
- 102100027661 N-sulphoglucosamine sulphohydrolase Human genes 0.000 description 1
- 102100033153 NADH-cytochrome b5 reductase 3 Human genes 0.000 description 1
- 102100023064 Nectin-1 Human genes 0.000 description 1
- 101710043845 Nectin-1 Proteins 0.000 description 1
- 241000588653 Neisseria Species 0.000 description 1
- 108010025020 Nerve Growth Factor Proteins 0.000 description 1
- 101100385413 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) csm-3 gene Proteins 0.000 description 1
- 101100462611 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) prr-1 gene Proteins 0.000 description 1
- 108090000742 Neurotrophin 3 Proteins 0.000 description 1
- 230000005913 Notch signaling pathway Effects 0.000 description 1
- 101150074217 Nprl2 gene Proteins 0.000 description 1
- 101710087110 ORF6 protein Proteins 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 241000276569 Oryzias latipes Species 0.000 description 1
- 102000003982 Parathyroid hormone Human genes 0.000 description 1
- 108090000445 Parathyroid hormone Proteins 0.000 description 1
- 108010071083 Patched-2 Receptor Proteins 0.000 description 1
- 235000019483 Peanut oil Nutrition 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 102000010292 Peptide Elongation Factor 1 Human genes 0.000 description 1
- 108010077524 Peptide Elongation Factor 1 Proteins 0.000 description 1
- 102000002508 Peptide Elongation Factors Human genes 0.000 description 1
- 108010068204 Peptide Elongation Factors Proteins 0.000 description 1
- 102000011755 Phosphoglycerate Kinase Human genes 0.000 description 1
- ABLZXFCXXLZCGV-UHFFFAOYSA-N Phosphorous acid Chemical class OP(O)=O ABLZXFCXXLZCGV-UHFFFAOYSA-N 0.000 description 1
- 101100088247 Picea mariana RPL13A gene Proteins 0.000 description 1
- 206010035226 Plasma cell myeloma Diseases 0.000 description 1
- 239000004952 Polyamide Substances 0.000 description 1
- 229920002732 Polyanhydride Polymers 0.000 description 1
- 239000004698 Polyethylene Substances 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- 101710101148 Probable 6-oxopurine nucleoside phosphorylase Proteins 0.000 description 1
- HCBIBCJNVBAKAB-UHFFFAOYSA-N Procaine hydrochloride Chemical compound Cl.CCN(CC)CCOC(=O)C1=CC=C(N)C=C1 HCBIBCJNVBAKAB-UHFFFAOYSA-N 0.000 description 1
- 102100024216 Programmed cell death 1 ligand 1 Human genes 0.000 description 1
- 102100038277 Prostaglandin G/H synthase 1 Human genes 0.000 description 1
- 108050003243 Prostaglandin G/H synthase 1 Proteins 0.000 description 1
- 102100038280 Prostaglandin G/H synthase 2 Human genes 0.000 description 1
- 108050003267 Prostaglandin G/H synthase 2 Proteins 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 229940079156 Proteasome inhibitor Drugs 0.000 description 1
- 102100035251 Protein C-ets-1 Human genes 0.000 description 1
- 102100021890 Protein C-ets-2 Human genes 0.000 description 1
- 102100030128 Protein L-Myc Human genes 0.000 description 1
- 102100028588 Protein ZNRD2 Human genes 0.000 description 1
- 102100028680 Protein patched homolog 1 Human genes 0.000 description 1
- 102100036894 Protein patched homolog 2 Human genes 0.000 description 1
- 102100035620 Protein phosphatase 1 regulatory subunit 12C Human genes 0.000 description 1
- 108010014608 Proto-Oncogene Proteins c-kit Proteins 0.000 description 1
- 102000016971 Proto-Oncogene Proteins c-kit Human genes 0.000 description 1
- 241000709748 Pseudomonas phage PRR1 Species 0.000 description 1
- 108010007131 Pulmonary Surfactant-Associated Protein B Proteins 0.000 description 1
- 102000030764 Purine-nucleoside phosphorylase Human genes 0.000 description 1
- 241000219492 Quercus Species 0.000 description 1
- 108020005067 RNA Splice Sites Proteins 0.000 description 1
- 102100028469 RNA-binding protein FUS Human genes 0.000 description 1
- 241000270942 Rana pipiens Species 0.000 description 1
- 101100372762 Rattus norvegicus Flt1 gene Proteins 0.000 description 1
- 101100517381 Rattus norvegicus Ntrk1 gene Proteins 0.000 description 1
- 101000820656 Rattus norvegicus Seminal vesicle secretory protein 4 Proteins 0.000 description 1
- 108091005682 Receptor kinases Proteins 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 1
- 241000605947 Roseburia Species 0.000 description 1
- 101150019443 SMAD4 gene Proteins 0.000 description 1
- 102000001332 SRC Human genes 0.000 description 1
- 108060006706 SRC Proteins 0.000 description 1
- 235000019485 Safflower oil Nutrition 0.000 description 1
- 101100379247 Salmo trutta apoa1 gene Proteins 0.000 description 1
- 101000781972 Schizosaccharomyces pombe (strain 972 / ATCC 24843) Protein wos2 Proteins 0.000 description 1
- 101100537955 Schizosaccharomyces pombe (strain 972 / ATCC 24843) trk1 gene Proteins 0.000 description 1
- 102100027979 Semaphorin-3B Human genes 0.000 description 1
- 102100028904 Serine/threonine-protein kinase MARK2 Human genes 0.000 description 1
- 101001010097 Shigella phage SfV Bactoprenol-linked glucose translocase Proteins 0.000 description 1
- 208000000859 Sickle cell trait Diseases 0.000 description 1
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 1
- 108010052160 Site-specific recombinase Proteins 0.000 description 1
- 201000001828 Sly syndrome Diseases 0.000 description 1
- 108700032504 Smad2 Proteins 0.000 description 1
- 101150102611 Smad2 gene Proteins 0.000 description 1
- 108700031298 Smad4 Proteins 0.000 description 1
- 108020003224 Small Nucleolar RNA Proteins 0.000 description 1
- 102000042773 Small Nucleolar RNA Human genes 0.000 description 1
- 102100032889 Sortilin Human genes 0.000 description 1
- 241000191940 Staphylococcus Species 0.000 description 1
- 108010039445 Stem Cell Factor Proteins 0.000 description 1
- 241000193996 Streptococcus pyogenes Species 0.000 description 1
- 101710172711 Structural protein Proteins 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 102100021905 Synapsin-1 Human genes 0.000 description 1
- 230000024932 T cell mediated immunity Effects 0.000 description 1
- 229940126547 T-cell immunoglobulin mucin-3 Drugs 0.000 description 1
- 102100033111 T-cell leukemia homeobox protein 1 Human genes 0.000 description 1
- 102100035891 T-cell surface glycoprotein CD3 delta chain Human genes 0.000 description 1
- 102100027222 T-lymphocyte activation antigen CD80 Human genes 0.000 description 1
- 101150003725 TK gene Proteins 0.000 description 1
- 102100034917 Testis-specific Y-encoded-like protein 2 Human genes 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- 206010043395 Thalassaemia sickle cell Diseases 0.000 description 1
- 101001099217 Thermotoga maritima (strain ATCC 43589 / DSM 3109 / JCM 10099 / NBRC 100826 / MSB8) Triosephosphate isomerase Proteins 0.000 description 1
- 108010022394 Threonine synthase Proteins 0.000 description 1
- 208000007536 Thrombosis Diseases 0.000 description 1
- 108060008245 Thrombospondin Proteins 0.000 description 1
- 102000002938 Thrombospondin Human genes 0.000 description 1
- 102100028702 Thyroid hormone receptor alpha Human genes 0.000 description 1
- 102100030951 Tissue factor pathway inhibitor Human genes 0.000 description 1
- 101001009610 Toxoplasma gondii Dense granule protein 5 Proteins 0.000 description 1
- 229920001615 Tragacanth Polymers 0.000 description 1
- 102100040250 Transcription elongation factor A protein-like 1 Human genes 0.000 description 1
- 102100039580 Transcription factor ETV6 Human genes 0.000 description 1
- 102100030780 Transcriptional activator Myb Human genes 0.000 description 1
- 108050008367 Transmembrane emp24 domain-containing protein 7 Proteins 0.000 description 1
- 102100021728 Transmembrane reductase CYB561D2 Human genes 0.000 description 1
- 241000589886 Treponema Species 0.000 description 1
- 241000254113 Tribolium castaneum Species 0.000 description 1
- 108010023649 Tripartite Motif Proteins Proteins 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 244000098338 Triticum aestivum Species 0.000 description 1
- 102000018252 Tumor Protein p73 Human genes 0.000 description 1
- 108010091356 Tumor Protein p73 Proteins 0.000 description 1
- 108700025716 Tumor Suppressor Genes Proteins 0.000 description 1
- 102000044209 Tumor Suppressor Genes Human genes 0.000 description 1
- 108010078814 Tumor Suppressor Protein p53 Proteins 0.000 description 1
- 102100036129 Tumor suppressor candidate 2 Human genes 0.000 description 1
- 102100026150 Tyrosine-protein kinase Fgr Human genes 0.000 description 1
- 102100035221 Tyrosine-protein kinase Fyn Human genes 0.000 description 1
- 102100026857 Tyrosine-protein kinase Lyn Human genes 0.000 description 1
- 102100037236 Tyrosine-protein kinase receptor UFO Human genes 0.000 description 1
- 102100039936 Ubiquitin-conjugating enzyme E2 variant 3 Human genes 0.000 description 1
- 101710095001 Uncharacterized protein in nifU 5'region Proteins 0.000 description 1
- 108091023045 Untranslated Region Proteins 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 241000607598 Vibrio Species 0.000 description 1
- 108020000999 Viral RNA Proteins 0.000 description 1
- 102100037058 Voltage-dependent calcium channel subunit alpha-2/delta-2 Human genes 0.000 description 1
- 102000013814 Wnt Human genes 0.000 description 1
- 108050003627 Wnt Proteins 0.000 description 1
- 230000004156 Wnt signaling pathway Effects 0.000 description 1
- 101001038499 Yarrowia lipolytica (strain CLIB 122 / E 150) Lysine acetyltransferase Proteins 0.000 description 1
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 239000003070 absorption delaying agent Substances 0.000 description 1
- 239000000370 acceptor Substances 0.000 description 1
- 229960000583 acetic acid Drugs 0.000 description 1
- 235000011054 acetic acid Nutrition 0.000 description 1
- DPXJVFZANSGRMM-UHFFFAOYSA-N acetic acid;2,3,4,5,6-pentahydroxyhexanal;sodium Chemical compound [Na].CC(O)=O.OCC(O)C(O)C(O)C(O)C=O DPXJVFZANSGRMM-UHFFFAOYSA-N 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 125000002015 acyclic group Chemical group 0.000 description 1
- 150000001266 acyl halides Chemical class 0.000 description 1
- 201000009628 adenosine deaminase deficiency Diseases 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 229960003767 alanine Drugs 0.000 description 1
- 150000001298 alcohols Chemical class 0.000 description 1
- 235000010443 alginic acid Nutrition 0.000 description 1
- 239000000783 alginic acid Substances 0.000 description 1
- 229920000615 alginic acid Polymers 0.000 description 1
- 229960001126 alginic acid Drugs 0.000 description 1
- 150000004781 alginic acids Chemical class 0.000 description 1
- 125000001931 aliphatic group Chemical group 0.000 description 1
- 150000001350 alkyl halides Chemical class 0.000 description 1
- 125000005600 alkyl phosphonate group Chemical group 0.000 description 1
- 229940100198 alkylating agent Drugs 0.000 description 1
- 239000002168 alkylating agent Substances 0.000 description 1
- 230000000172 allergic effect Effects 0.000 description 1
- 108010050122 alpha 1-Antitrypsin Proteins 0.000 description 1
- 229940024142 alpha 1-antitrypsin Drugs 0.000 description 1
- 108010026331 alpha-Fetoproteins Proteins 0.000 description 1
- 108010009380 alpha-N-acetyl-D-glucosaminidase Proteins 0.000 description 1
- 201000008333 alpha-mannosidosis Diseases 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- WNROFYMDJYEPJX-UHFFFAOYSA-K aluminium hydroxide Chemical compound [OH-].[OH-].[OH-].[Al+3] WNROFYMDJYEPJX-UHFFFAOYSA-K 0.000 description 1
- 150000001412 amines Chemical class 0.000 description 1
- 235000019418 amylase Nutrition 0.000 description 1
- 108700024685 ancestim Proteins 0.000 description 1
- 238000010171 animal model Methods 0.000 description 1
- 230000000844 anti-bacterial effect Effects 0.000 description 1
- 230000001093 anti-cancer Effects 0.000 description 1
- 230000003302 anti-idiotype Effects 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 229940121375 antifungal agent Drugs 0.000 description 1
- 239000003429 antifungal agent Substances 0.000 description 1
- 239000002246 antineoplastic agent Substances 0.000 description 1
- 229940045719 antineoplastic alkylating agent nitrosoureas Drugs 0.000 description 1
- 230000006907 apoptotic process Effects 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 150000001502 aryl halides Chemical class 0.000 description 1
- 125000004429 atom Chemical group 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 208000010668 atopic eczema Diseases 0.000 description 1
- 108010014874 balixafortide Proteins 0.000 description 1
- 230000033590 base-excision repair Effects 0.000 description 1
- XMQFTWRPUQYINF-UHFFFAOYSA-N bensulfuron-methyl Chemical compound COC(=O)C1=CC=CC=C1CS(=O)(=O)NC(=O)NC1=NC(OC)=CC(OC)=N1 XMQFTWRPUQYINF-UHFFFAOYSA-N 0.000 description 1
- 229960002903 benzyl benzoate Drugs 0.000 description 1
- 229940000635 beta-alanine Drugs 0.000 description 1
- 201000006486 beta-mannosidosis Diseases 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 230000031018 biological processes and functions Effects 0.000 description 1
- 230000008512 biological response Effects 0.000 description 1
- 108010005713 bis(5'-adenosyl)triphosphatase Proteins 0.000 description 1
- 210000002798 bone marrow cell Anatomy 0.000 description 1
- 229960001467 bortezomib Drugs 0.000 description 1
- GXJABQQUPOEUTA-RDJZCZTQSA-N bortezomib Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)B(O)O)NC(=O)C=1N=CC=NC=1)C1=CC=CC=C1 GXJABQQUPOEUTA-RDJZCZTQSA-N 0.000 description 1
- 108010006025 bovine growth hormone Proteins 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 239000008366 buffered solution Substances 0.000 description 1
- 239000006172 buffering agent Substances 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 125000001369 canonical nucleoside group Chemical group 0.000 description 1
- 125000002837 carbocyclic group Chemical group 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 239000001768 carboxy methyl cellulose Substances 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 230000022131 cell cycle Effects 0.000 description 1
- 230000004663 cell proliferation Effects 0.000 description 1
- 108091092328 cellular RNA Proteins 0.000 description 1
- 239000001913 cellulose Substances 0.000 description 1
- 229920002678 cellulose Polymers 0.000 description 1
- 229920002301 cellulose acetate Polymers 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 239000002738 chelating agent Substances 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 239000002559 chemokine receptor antagonist Substances 0.000 description 1
- 230000001767 chemoprotection Effects 0.000 description 1
- 230000035605 chemotaxis Effects 0.000 description 1
- 235000013330 chicken meat Nutrition 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 230000007665 chronic toxicity Effects 0.000 description 1
- 231100000160 chronic toxicity Toxicity 0.000 description 1
- 230000007882 cirrhosis Effects 0.000 description 1
- 208000019425 cirrhosis of liver Diseases 0.000 description 1
- DQLATGHUWYMOKM-UHFFFAOYSA-L cisplatin Chemical compound N[Pt](N)(Cl)Cl DQLATGHUWYMOKM-UHFFFAOYSA-L 0.000 description 1
- 229960004316 cisplatin Drugs 0.000 description 1
- RAURUSFBVQLAPW-DNIKMYEQSA-N clocinnamox Chemical compound N1([C@@H]2CC3=CC=C(C=4O[C@@H]5[C@](C3=4)([C@]2(CCC5=O)NC(=O)\C=C\C=2C=CC(Cl)=CC=2)CC1)O)CC1CC1 RAURUSFBVQLAPW-DNIKMYEQSA-N 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 230000035602 clotting Effects 0.000 description 1
- 101150100788 cmr3 gene Proteins 0.000 description 1
- 101150040342 cmr4 gene Proteins 0.000 description 1
- 101150095330 cmr5 gene Proteins 0.000 description 1
- 101150034961 cmr6 gene Proteins 0.000 description 1
- 229940105774 coagulation factor ix Drugs 0.000 description 1
- 229940105778 coagulation factor viii Drugs 0.000 description 1
- 108700032673 cocaine- and amphetamine-regulated transcript Proteins 0.000 description 1
- 229940110456 cocoa butter Drugs 0.000 description 1
- 235000019868 cocoa butter Nutrition 0.000 description 1
- 238000002648 combination therapy Methods 0.000 description 1
- 230000001447 compensatory effect Effects 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 230000004154 complement system Effects 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 239000003184 complementary RNA Substances 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 235000005687 corn oil Nutrition 0.000 description 1
- 239000002285 corn oil Substances 0.000 description 1
- 239000008120 corn starch Substances 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000004940 costimulation Effects 0.000 description 1
- 235000012343 cottonseed oil Nutrition 0.000 description 1
- 239000002385 cottonseed oil Substances 0.000 description 1
- 101150085344 csa5 gene Proteins 0.000 description 1
- 101150088639 csm4 gene Proteins 0.000 description 1
- 101150022488 csm5 gene Proteins 0.000 description 1
- 101150064365 csm6 gene Proteins 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 125000000113 cyclohexyl group Chemical group [H]C1([H])C([H])([H])C([H])([H])C([H])(*)C([H])([H])C1([H])[H] 0.000 description 1
- 229960004397 cyclophosphamide Drugs 0.000 description 1
- 229960000684 cytarabine Drugs 0.000 description 1
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 1
- 102000003675 cytokine receptors Human genes 0.000 description 1
- 108010057085 cytokine receptors Proteins 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 229940127089 cytotoxic agent Drugs 0.000 description 1
- 230000007402 cytotoxic response Effects 0.000 description 1
- 230000003013 cytotoxicity Effects 0.000 description 1
- 231100000135 cytotoxicity Toxicity 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 230000009615 deamination Effects 0.000 description 1
- 238000006481 deamination reaction Methods 0.000 description 1
- 101150060629 def gene Proteins 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 210000005045 desmin Anatomy 0.000 description 1
- 229910003460 diamond Inorganic materials 0.000 description 1
- 239000010432 diamond Substances 0.000 description 1
- 102000004419 dihydrofolate reductase Human genes 0.000 description 1
- 238000000375 direct analysis in real time Methods 0.000 description 1
- 239000007884 disintegrant Substances 0.000 description 1
- 239000002270 dispersing agent Substances 0.000 description 1
- 239000012153 distilled water Substances 0.000 description 1
- NAGJZTKCGNOGPW-UHFFFAOYSA-N dithiophosphoric acid Chemical class OP(O)(S)=S NAGJZTKCGNOGPW-UHFFFAOYSA-N 0.000 description 1
- 239000000890 drug combination Substances 0.000 description 1
- 238000012377 drug delivery Methods 0.000 description 1
- 238000012063 dual-affinity re-targeting Methods 0.000 description 1
- 108010011867 ecallantide Proteins 0.000 description 1
- 230000009881 electrostatic interaction Effects 0.000 description 1
- 239000003995 emulsifying agent Substances 0.000 description 1
- 230000008519 endogenous mechanism Effects 0.000 description 1
- 210000002889 endothelial cell Anatomy 0.000 description 1
- 238000001976 enzyme digestion Methods 0.000 description 1
- 229940125532 enzyme inhibitor Drugs 0.000 description 1
- 108060002566 ephrin Proteins 0.000 description 1
- 102000012803 ephrin Human genes 0.000 description 1
- 210000003743 erythrocyte Anatomy 0.000 description 1
- 210000000267 erythroid cell Anatomy 0.000 description 1
- 230000000925 erythroid effect Effects 0.000 description 1
- 235000019325 ethyl cellulose Nutrition 0.000 description 1
- 229920001249 ethyl cellulose Polymers 0.000 description 1
- LVGKNOAMLMIIKO-QXMHVHEDSA-N ethyl oleate Chemical compound CCCCCCCC\C=C/CCCCCCCC(=O)OCC LVGKNOAMLMIIKO-QXMHVHEDSA-N 0.000 description 1
- 229940093471 ethyl oleate Drugs 0.000 description 1
- VJJPUSNTGOMMGY-MRVIYFEKSA-N etoposide Chemical compound COC1=C(O)C(OC)=CC([C@@H]2C3=CC=4OCOC=4C=C3[C@@H](O[C@H]3[C@@H]([C@@H](O)[C@@H]4O[C@H](C)OC[C@H]4O3)O)[C@@H]3[C@@H]2C(OC3)=O)=C1 VJJPUSNTGOMMGY-MRVIYFEKSA-N 0.000 description 1
- 229960005420 etoposide Drugs 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 230000005713 exacerbation Effects 0.000 description 1
- 210000000887 face Anatomy 0.000 description 1
- 229960004222 factor ix Drugs 0.000 description 1
- 210000002950 fibroblast Anatomy 0.000 description 1
- 235000013312 flour Nutrition 0.000 description 1
- 239000007850 fluorescent dye Substances 0.000 description 1
- 229960003692 gamma aminobutyric acid Drugs 0.000 description 1
- IRSCQMHQWWYFCW-UHFFFAOYSA-N ganciclovir Chemical compound O=C1NC(N)=NC2=C1N=CN2COC(CO)CO IRSCQMHQWWYFCW-UHFFFAOYSA-N 0.000 description 1
- 229960002963 ganciclovir Drugs 0.000 description 1
- 238000012246 gene addition Methods 0.000 description 1
- 238000003209 gene knockout Methods 0.000 description 1
- 238000010363 gene targeting Methods 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 210000005046 glial fibrillary acidic protein Anatomy 0.000 description 1
- YQEMORVAKMFKLG-UHFFFAOYSA-N glycerine monostearate Natural products CCCCCCCCCCCCCCCCCC(=O)OC(CO)CO YQEMORVAKMFKLG-UHFFFAOYSA-N 0.000 description 1
- SVUQHVRAGMNPLW-UHFFFAOYSA-N glycerol monostearate Natural products CCCCCCCCCCCCCCCCC(=O)OCC(O)CO SVUQHVRAGMNPLW-UHFFFAOYSA-N 0.000 description 1
- 229960002449 glycine Drugs 0.000 description 1
- 201000004502 glycogen storage disease II Diseases 0.000 description 1
- 150000002334 glycols Chemical class 0.000 description 1
- 210000003714 granulocyte Anatomy 0.000 description 1
- 210000003128 head Anatomy 0.000 description 1
- 210000003709 heart valve Anatomy 0.000 description 1
- 208000019691 hematopoietic and lymphoid cell neoplasm Diseases 0.000 description 1
- 230000011132 hemopoiesis Effects 0.000 description 1
- DMEGYFMYUHOHGS-UHFFFAOYSA-N heptamethylene Natural products C1CCCCCC1 DMEGYFMYUHOHGS-UHFFFAOYSA-N 0.000 description 1
- 125000001072 heteroaryl group Chemical group 0.000 description 1
- 210000003630 histaminocyte Anatomy 0.000 description 1
- 239000000710 homodimer Substances 0.000 description 1
- 102000055151 human KITLG Human genes 0.000 description 1
- 102000048638 human UQCRH Human genes 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- WGCNASOHLSPBMP-UHFFFAOYSA-N hydroxyacetaldehyde Natural products OCC=O WGCNASOHLSPBMP-UHFFFAOYSA-N 0.000 description 1
- 208000013403 hyperactivity Diseases 0.000 description 1
- HOMGKSMUEGBAAB-UHFFFAOYSA-N ifosfamide Chemical compound ClCCNP1(=O)OCCCN1CCCl HOMGKSMUEGBAAB-UHFFFAOYSA-N 0.000 description 1
- 229960001101 ifosfamide Drugs 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 230000036039 immunity Effects 0.000 description 1
- 230000002163 immunogen Effects 0.000 description 1
- 230000001506 immunosuppresive effect Effects 0.000 description 1
- 239000012678 infectious agent Substances 0.000 description 1
- 230000002458 infectious effect Effects 0.000 description 1
- 208000000509 infertility Diseases 0.000 description 1
- 230000036512 infertility Effects 0.000 description 1
- 208000021267 infertility disease Diseases 0.000 description 1
- 108091006086 inhibitor proteins Proteins 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 230000015788 innate immune response Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 239000012212 insulator Substances 0.000 description 1
- 229940125798 integrin inhibitor Drugs 0.000 description 1
- 229940079322 interferon Drugs 0.000 description 1
- 229960003130 interferon gamma Drugs 0.000 description 1
- 230000010468 interferon response Effects 0.000 description 1
- 229960001388 interferon-beta Drugs 0.000 description 1
- 108090000237 interleukin-24 Proteins 0.000 description 1
- 102000003898 interleukin-24 Human genes 0.000 description 1
- 102000008371 intracellularly ATP-gated chloride channel activity proteins Human genes 0.000 description 1
- 238000007917 intracranial administration Methods 0.000 description 1
- 238000007918 intramuscular administration Methods 0.000 description 1
- 238000007913 intrathecal administration Methods 0.000 description 1
- 238000010253 intravenous injection Methods 0.000 description 1
- 150000002540 isothiocyanates Chemical class 0.000 description 1
- 239000000644 isotonic solution Substances 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- VBGWSQKGUZHFPS-VGMMZINCSA-N kalbitor Chemical compound C([C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(N[C@@H](CC=2C=CC=CC=2)C(=O)N[C@H](C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]2C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=3C=CC=CC=3)C(=O)N[C@H](C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)NCC(=O)NCC(=O)N[C@H]3CSSC[C@H](NC(=O)[C@@H]4CCCN4C(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC=4C=CC=CC=4)NC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@H](CC=4C=CC=CC=4)NC(=O)[C@H](CO)NC(=O)[C@H](CC=4NC=NC=4)NC(=O)[C@H](CCSC)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O)CSSC[C@H](NC(=O)[C@H](CCSC)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC=4C=CC=CC=4)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)CNC(=O)[C@H](CCC(O)=O)NC3=O)CSSC2)C(=O)N[C@@H]([C@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=2NC=NC=2)C(=O)N2CCC[C@H]2C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=2C3=CC=CC=C3NC=2)C(=O)N[C@@H](CC=2C=CC=CC=2)C(=O)N1)[C@@H](C)CC)[C@H](C)O)=O)[C@@H](C)CC)C1=CC=CC=C1 VBGWSQKGUZHFPS-VGMMZINCSA-N 0.000 description 1
- 229940018902 kalbitor Drugs 0.000 description 1
- 239000000787 lecithin Substances 0.000 description 1
- 235000010445 lecithin Nutrition 0.000 description 1
- 229940067606 lecithin Drugs 0.000 description 1
- 229940087875 leukine Drugs 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 108010013555 lipoprotein-associated coagulation inhibitor Proteins 0.000 description 1
- 239000008297 liquid dosage form Substances 0.000 description 1
- 239000006193 liquid solution Substances 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 244000144972 livestock Species 0.000 description 1
- 230000033001 locomotion Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000004777 loss-of-function mutation Effects 0.000 description 1
- 230000001926 lymphatic effect Effects 0.000 description 1
- 210000002540 macrophage Anatomy 0.000 description 1
- VTHJTEIRLNZDEV-UHFFFAOYSA-L magnesium dihydroxide Chemical compound [OH-].[OH-].[Mg+2] VTHJTEIRLNZDEV-UHFFFAOYSA-L 0.000 description 1
- 239000000347 magnesium hydroxide Substances 0.000 description 1
- 229910001862 magnesium hydroxide Inorganic materials 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000003211 malignant effect Effects 0.000 description 1
- 239000000594 mannitol Substances 0.000 description 1
- 230000003061 melanogenesis Effects 0.000 description 1
- 230000001394 metastastic effect Effects 0.000 description 1
- 206010061289 metastatic neoplasm Diseases 0.000 description 1
- 239000004530 micro-emulsion Substances 0.000 description 1
- 230000033607 mismatch repair Effects 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 230000020654 modulation by virus of host translation Effects 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 108010032806 molgramostim Proteins 0.000 description 1
- 229960003063 molgramostim Drugs 0.000 description 1
- 201000002273 mucopolysaccharidosis II Diseases 0.000 description 1
- 208000005340 mucopolysaccharidosis III Diseases 0.000 description 1
- 208000000690 mucopolysaccharidosis VI Diseases 0.000 description 1
- 206010051747 multiple endocrine neoplasia Diseases 0.000 description 1
- 238000002887 multiple sequence alignment Methods 0.000 description 1
- 210000003205 muscle Anatomy 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 201000000050 myeloid neoplasm Diseases 0.000 description 1
- 230000003039 myelosuppressive effect Effects 0.000 description 1
- 239000002105 nanoparticle Substances 0.000 description 1
- 229960005027 natalizumab Drugs 0.000 description 1
- 210000000822 natural killer cell Anatomy 0.000 description 1
- 229940071846 neulasta Drugs 0.000 description 1
- 229940029345 neupogen Drugs 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- OSTGTTZJOCZWJG-UHFFFAOYSA-N nitrosourea Chemical compound NC(=O)N=NO OSTGTTZJOCZWJG-UHFFFAOYSA-N 0.000 description 1
- 230000006780 non-homologous end joining Effects 0.000 description 1
- 239000002736 nonionic surfactant Substances 0.000 description 1
- 230000000683 nonmetastatic effect Effects 0.000 description 1
- 231100000252 nontoxic Toxicity 0.000 description 1
- 230000003000 nontoxic effect Effects 0.000 description 1
- 239000012038 nucleophile Substances 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 239000003921 oil Substances 0.000 description 1
- 235000019198 oils Nutrition 0.000 description 1
- 239000004006 olive oil Substances 0.000 description 1
- 235000008390 olive oil Nutrition 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 238000006213 oxygenation reaction Methods 0.000 description 1
- 239000000199 parathyroid hormone Substances 0.000 description 1
- 229960001319 parathyroid hormone Drugs 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 239000000312 peanut oil Substances 0.000 description 1
- 108010044644 pegfilgrastim Proteins 0.000 description 1
- 229940090048 pen injector Drugs 0.000 description 1
- 210000004976 peripheral blood cell Anatomy 0.000 description 1
- 229940021222 peritoneal dialysis isotonic solution Drugs 0.000 description 1
- 230000002688 persistence Effects 0.000 description 1
- 229940124531 pharmaceutical excipient Drugs 0.000 description 1
- 239000000825 pharmaceutical preparation Substances 0.000 description 1
- 150000002989 phenols Chemical class 0.000 description 1
- 239000008363 phosphate buffer Substances 0.000 description 1
- 150000008298 phosphoramidates Chemical class 0.000 description 1
- 150000008299 phosphorodiamidates Chemical class 0.000 description 1
- 230000010399 physical interaction Effects 0.000 description 1
- 230000006461 physiological response Effects 0.000 description 1
- 239000006187 pill Substances 0.000 description 1
- 229920002647 polyamide Polymers 0.000 description 1
- 229920000515 polycarbonate Polymers 0.000 description 1
- 239000004417 polycarbonate Substances 0.000 description 1
- 229920000573 polyethylene Polymers 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 229920005862 polyol Polymers 0.000 description 1
- 150000003077 polyols Chemical class 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 229920000136 polysorbate Polymers 0.000 description 1
- 229950008882 polysorbate Drugs 0.000 description 1
- 239000001103 potassium chloride Substances 0.000 description 1
- 235000011164 potassium chloride Nutrition 0.000 description 1
- 229920001592 potato starch Polymers 0.000 description 1
- 229940071643 prefilled syringe Drugs 0.000 description 1
- 229960001309 procaine hydrochloride Drugs 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- QQONPFPTGQHPMA-UHFFFAOYSA-N propylene Natural products CC=C QQONPFPTGQHPMA-UHFFFAOYSA-N 0.000 description 1
- 125000004805 propylene group Chemical group [H]C([H])([H])C([H])([*:1])C([H])([H])[*:2] 0.000 description 1
- 239000003207 proteasome inhibitor Substances 0.000 description 1
- 235000004252 protein component Nutrition 0.000 description 1
- 230000002685 pulmonary effect Effects 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 239000002510 pyrogen Substances 0.000 description 1
- 230000007420 reactivation Effects 0.000 description 1
- 108700015048 receptor decoy activity proteins Proteins 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 239000013643 reference control Substances 0.000 description 1
- 230000037425 regulation of transcription Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000241 respiratory effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 108091092562 ribozyme Proteins 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 102220005330 rs34956202 Human genes 0.000 description 1
- 235000005713 safflower oil Nutrition 0.000 description 1
- 239000003813 safflower oil Substances 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 241001507086 salmonid fish Species 0.000 description 1
- 230000003248 secreting effect Effects 0.000 description 1
- 239000008299 semisolid dosage form Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 230000019491 signal transduction Effects 0.000 description 1
- 239000000741 silica gel Substances 0.000 description 1
- 229910002027 silica gel Inorganic materials 0.000 description 1
- 230000005783 single-strand break Effects 0.000 description 1
- 235000020183 skimmed milk Nutrition 0.000 description 1
- 201000002859 sleep apnea Diseases 0.000 description 1
- 230000008410 smoothened signaling pathway Effects 0.000 description 1
- 239000007974 sodium acetate buffer Substances 0.000 description 1
- 235000019812 sodium carboxymethyl cellulose Nutrition 0.000 description 1
- 229920001027 sodium carboxymethylcellulose Polymers 0.000 description 1
- RYYKJJJTJZKILX-UHFFFAOYSA-M sodium octadecanoate Chemical compound [Na+].CCCCCCCCCCCCCCCCCC([O-])=O RYYKJJJTJZKILX-UHFFFAOYSA-M 0.000 description 1
- 239000007909 solid dosage form Substances 0.000 description 1
- 210000001082 somatic cell Anatomy 0.000 description 1
- 239000000600 sorbitol Substances 0.000 description 1
- 235000010356 sorbitol Nutrition 0.000 description 1
- 230000021595 spermatogenesis Effects 0.000 description 1
- 201000003624 spinocerebellar ataxia type 1 Diseases 0.000 description 1
- 210000000952 spleen Anatomy 0.000 description 1
- 230000002269 spontaneous effect Effects 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 239000008174 sterile solution Substances 0.000 description 1
- 239000008223 sterile water Substances 0.000 description 1
- 230000001954 sterilising effect Effects 0.000 description 1
- 238000004659 sterilization and disinfection Methods 0.000 description 1
- 230000004936 stimulating effect Effects 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 150000005846 sugar alcohols Polymers 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 230000002459 sustained effect Effects 0.000 description 1
- 238000013268 sustained release Methods 0.000 description 1
- 239000012730 sustained-release form Substances 0.000 description 1
- 210000004243 sweat Anatomy 0.000 description 1
- 230000008961 swelling Effects 0.000 description 1
- 208000011580 syndromic disease Diseases 0.000 description 1
- 238000010189 synthetic method Methods 0.000 description 1
- 239000003826 tablet Substances 0.000 description 1
- 210000001138 tear Anatomy 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- 150000003573 thiols Chemical class 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 210000002105 tongue Anatomy 0.000 description 1
- 231100000167 toxic agent Toxicity 0.000 description 1
- 239000003440 toxic substance Substances 0.000 description 1
- 239000003053 toxin Substances 0.000 description 1
- 231100000765 toxin Toxicity 0.000 description 1
- 108700012359 toxins Proteins 0.000 description 1
- 239000000196 tragacanth Substances 0.000 description 1
- 235000010487 tragacanth Nutrition 0.000 description 1
- 229940116362 tragacanth Drugs 0.000 description 1
- SBUXRMKDJWEXRL-ZWKOTPCHSA-N trans-body Chemical compound O=C([C@@H]1N(C2=O)[C@H](C3=C(C4=CC=CC=C4N3)C1)CC)N2C1=CC=C(F)C=C1 SBUXRMKDJWEXRL-ZWKOTPCHSA-N 0.000 description 1
- 108091008023 transcriptional regulators Proteins 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 230000010474 transient expression Effects 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
- 238000011269 treatment regimen Methods 0.000 description 1
- 230000004614 tumor growth Effects 0.000 description 1
- 230000007306 turnover Effects 0.000 description 1
- 238000005199 ultracentrifugation Methods 0.000 description 1
- 241001529453 unidentified herpesvirus Species 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- 229960005486 vaccine Drugs 0.000 description 1
- 238000001291 vacuum drying Methods 0.000 description 1
- 238000009777 vacuum freeze-drying Methods 0.000 description 1
- NQPDZGIKBAWPEJ-UHFFFAOYSA-N valeric acid Chemical group CCCCC(O)=O NQPDZGIKBAWPEJ-UHFFFAOYSA-N 0.000 description 1
- 230000002792 vascular Effects 0.000 description 1
- 229960004914 vedolizumab Drugs 0.000 description 1
- 235000015112 vegetable and seed oil Nutrition 0.000 description 1
- 239000008158 vegetable oil Substances 0.000 description 1
- 230000023898 viral genome packaging Effects 0.000 description 1
- 230000001018 virulence Effects 0.000 description 1
- 210000001260 vocal cord Anatomy 0.000 description 1
- 108010047303 von Willebrand Factor Proteins 0.000 description 1
- 239000011701 zinc Substances 0.000 description 1
- 229910052725 zinc Inorganic materials 0.000 description 1
Images
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/0008—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition
- A61K48/0016—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition wherein the nucleic acid is delivered as a 'naked' nucleic acid, i.e. not combined with an entity such as a cationic lipid
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K31/00—Medicinal preparations containing organic active ingredients
- A61K31/70—Carbohydrates; Sugars; Derivatives thereof
- A61K31/7088—Compounds having three or more nucleosides or nucleotides
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K31/00—Medicinal preparations containing organic active ingredients
- A61K31/70—Carbohydrates; Sugars; Derivatives thereof
- A61K31/7088—Compounds having three or more nucleosides or nucleotides
- A61K31/7105—Natural ribonucleic acids, i.e. containing only riboses attached to adenine, guanine, cytosine or uracil and having 3'-5' phosphodiester links
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
- A61K38/16—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- A61K38/17—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- A61K38/177—Receptors; Cell surface antigens; Cell surface determinants
- A61K38/1774—Immunoglobulin superfamily (e.g. CD2, CD4, CD8, ICAM molecules, B7 molecules, Fc-receptors, MHC-molecules)
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
- A61K38/16—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- A61K38/43—Enzymes; Proenzymes; Derivatives thereof
- A61K38/46—Hydrolases (3)
- A61K38/465—Hydrolases (3) acting on ester bonds (3.1), e.g. lipases, ribonucleases
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/005—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/0008—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition
- A61K48/0025—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition wherein the non-active part clearly interacts with the delivered nucleic acid
- A61K48/0041—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition wherein the non-active part clearly interacts with the delivered nucleic acid the non-active part being polymeric
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/10011—Adenoviridae
- C12N2710/10022—New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/10011—Adenoviridae
- C12N2710/10041—Use of virus, viral particle or viral elements as a vector
- C12N2710/10043—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/10011—Adenoviridae
- C12N2710/10071—Demonstrated in vivo effect
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/10011—Adenoviridae
- C12N2710/10311—Mastadenovirus, e.g. human or simian adenoviruses
- C12N2710/10322—New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/10011—Adenoviridae
- C12N2710/10311—Mastadenovirus, e.g. human or simian adenoviruses
- C12N2710/10332—Use of virus as therapeutic agent, other than vaccine, e.g. as cytolytic agent
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/10011—Adenoviridae
- C12N2710/10311—Mastadenovirus, e.g. human or simian adenoviruses
- C12N2710/10341—Use of virus, viral particle or viral elements as a vector
- C12N2710/10343—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biochemistry (AREA)
- Medicinal Chemistry (AREA)
- Zoology (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Public Health (AREA)
- Pharmacology & Pharmacy (AREA)
- Veterinary Medicine (AREA)
- Animal Behavior & Ethology (AREA)
- Epidemiology (AREA)
- Virology (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Microbiology (AREA)
- Gastroenterology & Hepatology (AREA)
- Physics & Mathematics (AREA)
- Immunology (AREA)
- Cell Biology (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Peptides Or Proteins (AREA)
Abstract
본 개시내용은 예를 들면 생체내 유전자 치료를 위한 HSC의 효과적인 형질도입을 특징으로 하는 아데노바이러스 벡터를 포함한다. 본 개시내용은, 다른 것들 중에서, Ad3, Ad7, Ad11, Ad14, Ad16, Ad21, Ad34, Ad37 및 Ad50 벡터 및 게놈을 포함한다. 본 개시내용의 Ad3, Ad7, Ad11, Ad14, Ad16, Ad21, Ad34, Ad37 및 Ad50 벡터 및 게놈은 치료학적 페이로드를 포함할 수 있다.
Description
우선권 출원
본 출원은 2020년 12월 22일에 출원된 미국 가출원 제63/129,233호의 이익을 주장하고, 이의 내용은 본원에 의해 그 전체가 본원에 참고로 포함된다.
많은 의학 병태는 유전 돌연변이에 의해 야기되고/되거나 적어도 부분적으로 유전자 치료에 의해 치료 가능하다. 일부 병태는 특히 조혈 줄기 세포(HSC: hematopoietic stem cell)의 변형에 의해 치료 가능하다. HSC 유전자 치료에 대한 조성물 및 방법이 따라서 필요하다.
유전자 치료는 제한 없이 헤모글로빈병증, 면역 결핍 및 암을 포함하는 유전 성분을 갖는 많은 병태를 치료할 수 있다. 다양한 유전자 치료에서, 조혈 줄기 세포(HSC)는 중요한 표적이다. 그러나, HSC를 변형시키기 위한 현재의 방법 및 조성물은 제한된다. 예를 들면, 유전자 치료에 대한 일부 벡터, 예컨대 렌티바이러스는 비교적 제한된 페이로드 용량을 갖는다. 아데노바이러스 혈청형 5와 같은 다른 것은 실질적인 페이로드 용량을 특징으로 하지만, 인간의 상당한 비율이 벡터 단백질에 대항하여 지향된 항체를 가지며 충분히 널리 퍼져 있고, 이들 항체 중 일부는 중화일 수 있다. 더욱이, 상이한 바이러스 벡터는 다양한 세포 유형, 예컨대 HSC에 대한 구별되는 형질도입 효율을 특징으로 한다. 본 개시내용은 HSC에 대한 높은 페이로드 용량 및 높은 형질도입 효율을 특징으로 하는 아데노바이러스 혈청형을 확인하였다.
본 개시내용은, 다른 것들 중에서, Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 벡터 및 Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 게놈(예를 들면, "재조합" 또는 "조작된" 아데노바이러스 벡터 및 아데노바이러스 게놈)을 포함한다. 본 개시내용의 Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 벡터 및 게놈은 다양한 페이로드를 포함할 수 있다. 다양한 실시형태에서, 페이로드는 CRISPR 시스템, 염기 편집 시스템, 프라임 편집 시스템 또는 다른 발현 산물을 암호화하는 핵산 서열 중 하나 이상을 포함할 수 있다. 본 개시내용은, 다른 것들 중에서, 질환 또는 병태의 치료에 함께 기여하는 복수의 발현 산물을 암호화하는 핵산 서열을 포함하는 조합 아데노바이러스 벡터 및 아데노바이러스 게놈을 포함한다. 본 개시내용은 핵산 페이로드의 표적 세포 게놈으로의 통합을 위해, 다른 것들 중에서, Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 아데노바이러스 벡터 및 Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 아데노바이러스 게놈을 포함한다. 본 개시내용은, 다른 것들 중에서, Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 공여자 벡터, Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 아데노바이러스 공여자 게놈, 헬퍼 의존적 Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 아데노바이러스 공여자 벡터, 헬퍼 의존적 Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 아데노바이러스 공여자 게놈, 지지 벡터, 지지 게놈, Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 헬퍼 벡터, 및 Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 헬퍼 게놈을 포함한다. 의심을 피하기 위해, "Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50"과 같은 혈청형의 목록은 대안적으로 "Ad3, Ad7, Ad11, Ad14, Ad16, Ad21, Ad34, Ad37 또는 Ad50"으로 써질 수 있다.
적어도 하나의 양태에서, 본 개시내용은 포유류 대상체에서의 생체내 유전자 치료의 방법을 제공하고, 상기 방법은 대상체에게 아데노바이러스 벡터를 투여하는 단계를 포함하고, 아데노바이러스 벡터는 (a) Ad3, Ad7, Ad11, Ad14, Ad16, Ad21, Ad34, Ad37 또는 Ad50 혈청형(예를 들면, 혈청형의 기준 폴리펩타이드와 적어도 80%의 서열 동일성을 가짐)의 하나 이상의 바이러스 폴리펩타이드를 포함하는 캡시드(여기서, 하나 이상의 바이러스 폴리펩타이드는 (i) 섬유 매듭(fiber knob); (ii) 섬유 샤프트; (iii) 섬유 꼬리; (iv) 펜톤; 및 (v) 헥손 중 하나 이상을 포함함); 및 (b) 이종성 핵산 페이로드를 포함하는 이중 가닥 DNA 게놈을 포함한다. 다양한 실시형태에서, 게놈은 추가로 (a) 3' ITR 및 5' ITR(여기서, 3' ITR 및 5' ITR의 각각은 바이러스 폴리펩타이드 혈청형을 가짐(예를 들면, 바이러스 폴리펩타이드의 혈청형과 동일한 혈청형의 기준 서열과 적어도 80%의 서열 동일성을 가짐)), (b) 패키징 서열(여기서, 패킹 서열은 바이러스 폴리펩타이드 혈청형을 가짐)을 포함한다. 다양한 실시형태에서, 상기 방법은 아데노바이러스 벡터의 투여 전에 대상체의 조혈 줄기 세포의 동원을 포함한다. 다양한 실시형태에서, 이종성 핵산 페이로드는 선택 가능한 마커를 포함하고, 선택적으로 선택 가능한 마커는 MGMTP140K이다. 다양한 실시형태에서, 상기 방법은 대상체에게 선택 제제를 투여하는 단계를 포함하고, 선택적으로 선택 제제는 O6BG 및/또는 BCNU를 포함한다. 다양한 실시형태에서, 상기 방법은 대상체에게 하나 이상의 면역억제 제제를 투여하는 단계를 포함하고, 선택적으로 하나 이상의 면역억제 제제의 투여는 아데노바이러스 벡터의 투여 전이다.
적어도 하나의 양태에서, 본 개시내용은 (a) Ad3, Ad7, Ad11, Ad14, Ad16, Ad21, Ad34, Ad37 또는 Ad50 혈청형의 하나 이상의 바이러스 폴리펩타이드를 포함하는 캡시드(여기서, 하나 이상의 바이러스 폴리펩타이드는 (i) 섬유 매듭; (ii) 섬유 샤프트; (iii) 섬유 꼬리; (iv) 펜톤; 및 (v) 헥손 중 하나 이상을 포함함); 및 (b) 이종성 핵산 페이로드를 포함하는 이중 가닥 DNA 게놈을 포함하는 아데노바이러스 공여자 벡터를 제공한다. 다양한 실시형태에서, 게놈은 추가로 (a) 3' ITR 및 5' ITR(여기서, 3' ITR 및 5' ITR의 각각은 바이러스 폴리펩타이드 혈청형을 가짐); 및 (b) 패키징 서열(여기서, 패킹 서열은 바이러스 폴리펩타이드 혈청형을 가짐)을 포함한다. 다양한 실시형태에서, 이종성 핵산 페이로드는 선택 가능한 마커를 포함하고, 선택적으로 선택 가능한 마커는 MGMTP140K이다.
본 개시내용에 의해 제공된 양태의 다양한 실시형태에서, 하나 이상의 바이러스 폴리펩타이드는 (a) 섬유 매듭 및 섬유 샤프트; (b) 섬유 매듭 및 섬유 꼬리; (c) 섬유 매듭 및 펜톤; (d) 섬유 매듭 및 헥손; (e) 섬유 매듭, 헥손 및 펜톤; (f) 섬유 샤프트 및 섬유 꼬리; (g) 섬유 샤프트 및 펜톤; (h) 섬유 샤프트 및 헥손; (i) 섬유 샤프트, 헥손 및 펜톤; (j) 섬유 꼬리 및 펜톤; (k) 섬유 꼬리 및 헥손; (l) 섬유 꼬리, 헥손 및 펜톤; (m) 섬유 매듭, 섬유 샤프트 및 섬유 꼬리; (n) 섬유 매듭, 섬유 샤프트 및 펜톤; (o) 섬유 매듭, 섬유 샤프트 및 헥손; (p) 섬유 매듭, 섬유 샤프트, 헥손 및 펜톤; (q) 섬유 매듭, 섬유 샤프트, 섬유 꼬리 및 펜톤; (r) 섬유 매듭, 섬유 샤프트, 섬유 꼬리, 펜톤 및 헥손; 또는 (s) 펜톤 및 헥손을 포함한다.
본 개시내용에 의해 제공된 양태의 다양한 실시형태에서, 섬유 매듭은 서열 번호 14, 30, 46, 62, 78, 94, 110, 126 및 142로부터 선택된 서열과 적어도 80%의 동일성을 갖는 서열을 갖는다. 본 개시내용에 의해 제공된 양태의 다양한 실시형태에서, 섬유 샤프트는 서열 번호 13, 29, 45, 61, 77, 93, 109, 125 및 141로부터 선택된 서열과 적어도 80%의 동일성을 갖는 서열을 갖는다. 본 개시내용에 의해 제공된 양태의 다양한 실시형태에서, 섬유 꼬리는 서열 번호 157, 158, 159, 160, 161, 162, 163, 164 및 165로부터 선택된 서열과 적어도 80%의 동일성을 갖는 서열을 갖는다. 본 개시내용에 의해 제공된 양태의 다양한 실시형태에서, 펜톤은 서열 번호 15, 31, 47, 63, 79, 95, 111, 127 및 143으로부터 선택된 서열과 적어도 80%의 동일성을 갖는 서열을 갖는다. 본 개시내용에 의해 제공된 양태의 다양한 실시형태에서, 헥손은 서열 번호 16, 32, 48, 64, 80, 96, 112, 128 및 144로부터 선택된 서열과 적어도 80%의 동일성을 갖는 서열을 갖는다. 본 개시내용에 의해 제공된 양태의 다양한 실시형태에서, 아데노바이러스 벡터는 바이러스 펩타이드의 혈청형의 섬유를 포함한다. 본 개시내용에 의해 제공된 양태의 다양한 실시형태에서, 섬유는 서열 번호 12, 28, 44, 60, 76, 92, 108, 124 및 140으로부터 선택된 서열과 적어도 80%의 동일성을 갖는 서열을 갖는다.
본 개시내용에 의해 제공된 양태의 다양한 실시형태에서, 아데노바이러스 벡터는 캡시드가 바이러스 펩타이드의 혈청형을 갖지 않는 섬유 매듭, 섬유 샤프트, 섬유 꼬리, 헥손 또는 펜톤 중 적어도 하나를 포함한다는 점에서 규명된 키메라 벡터이다.
본 개시내용에 의해 제공된 양태의 다양한 실시형태에서, 아데노바이러스 벡터는 헬퍼 의존적 벡터이다.
적어도 하나의 양태에서, 본 개시내용은 (a) 3' ITR 및 5' ITR(여기서, 3' ITR 및 5' ITR은 Ad3, Ad7, Ad11, Ad14, Ad16, Ad21, Ad34, Ad37 또는 Ad50 혈청형으로부터 선택된 동일한 혈청형의 각각임); (b) 패키징 서열(여기서, 패킹 서열은 ITR 혈청형을 가짐); 및 (c) 이종성 핵산 페이로드를 포함하는 아데노바이러스 공여자 벡터 게놈을 제공한다. 특정 실시형태에서, 이종성 핵산 페이로드는 선택 가능한 마커를 포함하고, 선택적으로 선택 가능한 마커는 MGMTP140K이다.
본 개시내용에 의해 제공된 양태의 다양한 실시형태에서, 이종성 핵산 페이로드는 단백질을 암호화한다. 본 개시내용에 의해 제공된 양태의 다양한 실시형태에서, 이종성 핵산 페이로드는 작은 RNA를 암호화하고, 선택적으로 작은 RNA는 shRNA이다. 본 개시내용에 의해 제공된 양태의 다양한 실시형태에서, 이종성 핵산 페이로드는 유전자 편집 효소 또는 시스템을 암호화하고, 유전자 편집은 CRISPR 편집, 염기 편집, 프라임 편집 또는 징크 핑거 뉴클레아제 편집으로부터 선택된다.
본 개시내용에 의해 제공된 양태의 다양한 실시형태에서, 이종성 핵산 페이로드는 헤모글로빈병증, 혈소판 장애, 판코니 빈혈, 알파-1 항트립신 결핍증, 겸상 세포 빈혈, 지중해빈혈, 중간형 지중해빈혈, 폰 빌레브란트 질환, A형 혈우병, B형 혈우병, V 인자 결핍증, VII 인자 결핍증, X 인자 결핍증, XI 인자 결핍증, XII 인자 결핍증, XIII 인자 결핍증, 베르나르 술리에 증후군, 그레이 혈소판 증후군, 점액다당류증, 낭성 섬유증, 테이 삭스병 및 페닐케톤뇨증으로부터 선택된 병태의 치료를 위한 제제를 암호화한다. 본 개시내용에 의해 제공된 양태의 다양한 실시형태에서, 이종성 핵산 페이로드는 그레이브병, 류마티스성 관절염, 악성 빈혈, 다발성 경화증(MS), 염증성 장 질환, 전신 홍반 루푸스(SLE), 아데노신 데아미나제 결핍증(ADA-SCID) 또는 중증 복합 면역결핍 질환(SCID), 비스코트 올드리치 증후군(WAS), 만성 육아종 질환(CGD), 아데노신 데아미나제 2의 결핍증, 판코니 빈혈(FA), 배턴병, 부신백질이영양증(ALD) 또는 이염백질이영양증(MLD), 근이영양증, 폐포 단백증(PAP), 피루베이트 키나제 결핍증, 슈바크만 다이아몬드 블랙판 빈혈, 선천성 각화이상증, 낭성 섬유증, 파킨슨병, 알츠하이머병 및 근위축성 측색 경화증(루게릭병)으로부터 선택된 병태의 치료를 위한 제제를 암호화한다.
본 개시내용에 의해 제공된 양태의 다양한 실시형태에서, 바이러스 폴리펩타이드의 혈청형은 Ad34이다. 본 개시내용에 의해 제공된 양태의 다양한 실시형태에서, 바이러스 폴리펩타이드의 혈청형은 Ad3이다. 본 개시내용에 의해 제공된 양태의 다양한 실시형태에서, 바이러스 폴리펩타이드의 혈청형은 Ad7이다. 본 개시내용에 의해 제공된 양태의 다양한 실시형태에서, 바이러스 폴리펩타이드의 혈청형은 Ad11이다. 본 개시내용에 의해 제공된 양태의 다양한 실시형태에서, 바이러스 폴리펩타이드의 혈청형은 Ad14이다. 본 개시내용에 의해 제공된 양태의 다양한 실시형태에서, 바이러스 폴리펩타이드의 혈청형은 Ad16이다. 본 개시내용에 의해 제공된 양태의 다양한 실시형태에서, 바이러스 폴리펩타이드의 혈청형은 Ad21이다. 본 개시내용에 의해 제공된 양태의 다양한 실시형태에서, 바이러스 폴리펩타이드의 혈청형은 Ad37이다. 본 개시내용에 의해 제공된 양태의 다양한 실시형태에서, 바이러스 폴리펩타이드의 혈청형은 Ad50이다.
다양한 실시형태에서, 본 개시내용은 본 개시내용의 아데노바이러스 벡터를 포함하는 약학 조성물을 제공하고, 약학 조성물은 이를 필요로 하는 대상체에 대한 주사를 위해 제형화된다.
다양한 실시형태에서, 본 개시내용은 아데노바이러스 벡터가 CD34+ 세포, CD34+고 세포, CD34+/CD90+ 세포 및/또는 CD34+고/CD90+ 세포를 감염시키고/시키거나 형질도입하는 방법, 벡터, 게놈 또는 약학 조성물을 제공하고, 선택적으로 세포는 조혈 세포이다.
정의
일, 하나, 이 : 본원에 사용된 것과 같이, "일", "하나" 및 "이"는 하나 또는 하나 초과(즉, 적어도 하나)의 관사의 문법적 목적어를 지칭한다. 예에 의해, "요소"는 정확히 하나의 요소의 실시형태 및 하나 초과의 요소를 포함하는 실시형태를 개시한다.
약 : 본원에 사용된 것과 같이, 용어 "약"은 값을 언급하며 사용될 때 문맥에서 언급된 값과 유사한 값을 지칭한다. 일반적으로, 이 문맥과 친숙한 당업자는 그 맥락에서 "약"에 의해 포함된 관련 변동 정도를 이해할 것이다. 예를 들면, 일부 실시형태에서, 용어 "약"은 언급된 값의 25%, 20%, 19%, 18%, 17%, 16%, 15%, 14%, 13%, 12%, 11%, 10%, 9%, 8%, 7%, 6%, 5%, 4%, 3%, 2%, 1% 또는 미만인 값의 범위를 포함할 수 있다.
투여 : 본원에 사용된 것과 같이, 용어 "투여"는 통상적으로 조성물이거나 조성물에 포함된 제제의 전달을 달성하기 위해 대상체 또는 시스템에 대한 조성물의 투여를 지칭한다.
적응 세포 치료 : 본원에 사용된 것과 같이, "적응 세포 치료" 또는 "ACT"는 대상체, 예를 들면 병태, 장애 또는 질환의 치료를 필요로 하는 대상체로의 치료 활성을 갖는 세포의 운반을 수반한다. 일부 실시형태에서, ACT는 세포의 생체외 및/또는 시험관내 조작 및/또는 팽창 후 세포의 대상체로의 운반을 포함한다.
친화도 : 본원에 사용된 것과 같이, "친화도"는 특정한 결합 제제(예를 들면, 바이러스 벡터) 및/또는 이의 결합 모이어티와 결합 표적(예를 들면, 세포) 사이의 비공유 상호작용의 총 합의 강도를 지칭한다. 달리 표시되지 않는 한, 본원에 사용된 것과 같이, "결합 친화도"는 결합 제제와 이의 결합 표적(예를 들면, 바이러스 벡터와 바이러스 벡터의 표적 세포) 사이의 1:1 상호작용을 지칭한다. 당업자는 친화도의 변경이 기준품에 대한 비교(예를 들면, 기준품에 대한 증가 또는 감소)에 의해 기술될 수 있거나, 숫자로 기술될 수 있다는 것을 이해한다. 친화도는 비제한적인 예로서 평형 해리 상수(KD) 및/또는 평형 회합 상수(KA)를 포함하는 당해 분야에 알려진 다수의 방식으로 측정되고/되거나 표현될 수 있다. KD는 koff/kon의 몫인 반면, KA는 kon/koff의 몫이고, 여기서 kon은 예를 들면 바이러스 벡터와 표적 세포의 회합 속도 상수를 지칭하고, koff는 예를 들면 표적 세포로부터의 바이러스 벡터의 해리를 지칭한다. kon 및 koff는 당업자에게 알려진 기법에 의해 결정될 수 있다.
제제 : 본원에 사용된 것과 같이, 용어 "제제"는 제한 없이 원자, 분자, 화합물, 아미노산, 폴리펩타이드, 뉴클레오타이드, 핵산, 단백질, 단백질 복합체, 액체, 용액, 사카라이드, 폴리사카라이드, 지질, 또는 이들의 조합 또는 복합체 중 임의의 하나 이상을 포함하는 임의의 화학 집합체를 지칭할 수 있다.
동종이계 : 본원에 사용된 것과 같이, 용어 "동종이계"는 또 다른 대상체로 이후 도입된 1명의 대상체로부터 유래된 임의의 재료, 예를 들면 동종이계 HSC 이식을 지칭한다.
사이 또는 로부터 : 본원에 사용된 것과 같이, 용어 "사이"는 표시된 상부와 하부 사이에 또는 경계를 포함하는 제1 경계와 제2 경계 사이에 해당하는 함량을 지칭한다. 유사하게, 용어 "로부터"는 값의 범위의 맥락에서 사용될 때 그 범위가 표시된 상부와 하부 사이에 또는 경계를 포함하는 제1 경계와 제2 경계 사이에 해당하는 함량을 포함한다는 것을 나타낸다.
결합 : 본원에 사용된 것과 같이, 용어 "결합"은 2종 이상의 제제 사이의 또는 중의 비공유 회합을 지칭한다. "직접적인" 결합은 제제 사이의 물리적 접촉을 수반하고; 간접적인 결합은 하나 이상의 중간체 제제와의 물리적 접축에 의한 물리적 상호작용을 수반한다. 2종 이상의 제제 사이의 결합은 상호작용 제제가 단리 시 또는 더 복잡한 시스템의 맥락에서(예를 들면, 공유로 또는 달리 담체 제제와 회합되어 그리고/또는 생물학적 시스템 또는 세포에서) 연구되는 경우를 포함하여 임의의 여러 가지의 맥락에서 생기고/생기거나 평가될 수 있다.
암: 본원에 사용된 것과 같이, 용어 "암"은 세포가 비정상적으로 상승된 증식 속도 및/또는 상당한 세포 증식 제어 소실을 특징으로 하는 비정상 성장 표현형을 나타내도록 세포가 비교적 비정상인, 비제어된 및/또는 자율적인 성장을 나타내는 병태, 장애 또는 질환을 지칭한다. 일부 실시형태에서, 암은 하나 이상의 종양을 포함할 수 있다. 일부 실시형태에서, 암은 전암성(예를 들면, 양성), 악성, 전전이성, 전이성 및/또는 비전이성인 세포이거나 이것을 포함할 수 있다. 일부 실시형태에서, 암은 고형 종양이거나 이것을 포함할 수 있다. 일부 실시형태에서, 암은 혈액학적 종양이거나 이것을 포함할 수 있다.
키메라 항원 수용체 : 본원에 사용된 것과 같이, "키메라 항원 수용체" 또는 "CAR"은 (i) 표적 항원에 결합하는 모이어티를 포함하는 세포외 도메인; (ii) 막관통 도메인; 및 (iii) CAR이 표적 항원과의 세포외 결합 모이어티의 결합에 의해 자극될 때 활성화 신호를 송신하는 세포내 신호전달 도메인을 포함하는 조작된 단백질을 지칭한다. CAR은 또한 키메라 T 세포 수용체 또는 키메라 면역수용체로서 알려져 있다.
조합 치료 : 본원에 사용된 것과 같이, 용어 "조합 치료"는 2종 이상의 제제 또는 요법이 함께 대상체의 병태, 장애 또는 질환을 치료하도록 2종 이상의 제제 또는 요법의 대상체에 대한 투여를 지칭한다. 일부 실시형태에서, 2개 이상의 치료제 또는 요법은 동시에, 순차적으로 또는 중첩하는 투약 요법에서 투여될 수 있다. 당업자는 조합 치료가 2개의 제제 또는 요법이 단일 조성물에서 함께 투여되는 것을 포함하지만 이를 요하지 않고, 동시에 투여되는 것도 요하지 않는다는 것을 이해할 것이다.
제어 발현 또는 활성 : 본원에 사용된 것과 같이, 제1 요소(예를 들면, 단백질, 예컨대 전사 인자 또는 핵산 서열, 예컨대 프로모터)는 제2 요소(예를 들면, 단백질 또는 단백질과 같은 제제를 암호화하는 핵산)의 발현 또는 활성이 적어도 하나의 조건 세트 하에 제1 요소의 상태(예를 들면, 존재, 부재, 형태, 화학 변형, 상호작용 또는 다른 활성)에 따라 전체적으로 또는 부분적으로 달라지면 제2 요소의 발현 또는 활성을 "제어" 또는 "유도"한다. 발현 또는 활성의 제어는 예를 들면 제1 요소의 상태의 변경이 적어도 하나의 조건 세트 하에 기준 대조군과 비교하여 적어도 10%(예를 들면, 적어도 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 2배, 3배, 4배, 5배, 10배, 20배, 30배, 40배, 50배, 100배)의 제2 요소의 발현 또는 활성의 변경을 생성시킬 수 있다는 점에서 실질적인 제어 또는 활성일 수 있다.
상응하는 : 본원에 사용된 것과 같이, 용어 "상응하는"은 적절한 기준 화합물 또는 조성물과의 비교를 통해 화합물 또는 조성물에서 구조 요소의 위치/동일성을 지칭하도록 사용될 수 있다. 예를 들면, 일부 실시형태에서, 중합체에서의 단량체 잔기(예를 들면, 폴리펩타이드에서의 아미노산 잔기 또는 폴리뉴클레오타이드에서의 핵산 잔기)는 적절한 기준 중합체에서의 잔기에 "상응하는" 것으로 확인될 수 있다. 예를 들면, 당업자는 제공된 폴리펩타이드 또는 폴리뉴클레오타이드 서열에서의 잔기가 대개 (예를 들면, 이러한 지칭이 제공된 서열의 글자상 넘버링을 반영하지 않더라도) 관련된 기준 서열의 체계에 따라 지칭(예를 들면, 넘버링 또는 표지)된다는 것을 이해한다. 예시에 의해 기준 서열이 100번 내지 110번 위치에서의 특정한 아미노산 모티프를 포함하고 제2 관련된 서열이 110번 내지 120번 위치에서의 동일한 모티프를 포함하면, 제2 관련된 서열의 모티프 위치는 기준 서열의 100번 내지 110번 위치에 "상응"한다고 말해질 수 있다. 당업자는 상응하는 위치가 예를 들면 서열의 정렬에 의해 용이하게 확인될 수 있고, 이러한 정렬이 제한 없이, 예를 들면 BLAST, CS-BLAST, CUDASW++, DIAMOND, FASTA, GGSEARCH/GLSEARCH, Genoogle, HMMER, HHpred/HHsearch, IDF, Infernal, KLAST, USEARCH, 패러세일(parasail), PSI-BLAST, PSI-Search, ScalaBLAST, Sequilab, SAM, SSEARCH, SWAPHI, SWAPHI-LS, SWIMM 또는 SWIPE와 같은 소프트웨어 프로그램을 포함하는 임의의 여러 가지의 알려진 도구, 전략 및/또는 알고리즘에 의해 흔히 달성된다는 것을 이해한다.
투약 요법: 본원에 사용된 것과 같이, 용어 "투약 요법"은 통상적으로, 각각이 일정 기간에 의해 다른 것의 투여로부터 분리되는, 복수의 단위 용량 투여를 포함하는 대상체에게 투여되는 일련의 하나 이상의 동일한 또는 상이한 단위 용량을 지칭할 수 있다. 다양한 실시형태에서, 투약 요법의 하나 이상 또는 모든 단위 용량은 동일할 수 있거나 변할 수 있다(예를 들면, 시간에 걸쳐 증가하거나, 시간에 걸쳐 감소하거나, 대상체 및/또는 의학 실행자의 결정에 따라 조정될 수 있음). 다양한 실시형태에서, 각각의 용량 사이의 기간의 하나 이상 또는 모두는 동일할 수 있거나 변할 수 있다(예를 들면, 시간에 걸쳐 증가하거나, 시간에 걸쳐 감소하거나, 대상체 및/또는 의학 실행자의 결정에 따라 조정될 수 있음). 일부 실시형태에서, 주어진 치료제는 하나 이상의 용량을 수반할 수 있는 추천된 투약 요법을 갖는다. 통상적으로, 판매되는 약물의 적어도 하나의 추천된 투약 요법은 당업자에게 알려져 있다. 일부 실시형태에서, 투약 요법은 관련 집단에 걸쳐 투여될 때 원하는 또는 유리한 결과와 상관된다(즉, 치료학적 투약 요법임).
하류 및 상류: 본원에 사용된 것과 같이, 용어 "하류"는 제1 DNA 영역이 제2 DNA 영역에 비해 제1 DNA 영역 및 제2 DNA 영역을 포함하는 핵산의 C 말단에 더 가깝다는 것을 의미한다. 본원에 사용된 것과 같이, 용어 "상류"는 제1 DNA 영역이 제2 DNA 영역에 비해 제1 DNA 영역 및 제2 DNA 영역을 포함하는 핵산의 N 말단에 더 가깝다는 것을 의미한다.
유효량: "유효량"은 대상체에서 원하는 생리학적 변화를 생성시키는 데 필요한 제형의 양이다. 유효량은 대개 조사 목적을 위해 투여된다.
조작된 : 본원에 사용된 것과 같이, 용어 "조작된"은 사람 손에 의해 조작되는 양태를 지칭한다. 예를 들면, 폴리뉴클레오타이드는 자연에서 그 순서에서 함께 연결되지 않은 2개 이상의 서열이 조작된 폴리뉴클레오타이드에서 서로에 직접 연결되는 사람 손에 의해 조작될 때 "조작"된다고 여겨진다. 당업자는 "조작된" 핵산 또는 아미노산 서열이 재조합 핵산 또는 아미노산 서열일 수 있고 "유전적으로 조작"된다고 지칭될 수 있다는 것을 이해할 것이다. 일부 실시형태에서, 조작된 폴리뉴클레오타이드는 제1 서열과 자연에서 작동 가능하게 연결된 것으로 발견되지만, 제2 서열과 자연에서 작동 가능하게 연결된 것으로 발견되지 않고, 사람 손에 의해 제2 서열에서 작동 가능하게 연결된 조작된 폴리뉴클레오타이드에 있는, 암호화 서열 및/또는 조절 서열을 포함한다. 일부 실시형태에서, 세포 또는 유기체는 이것이 이의 유전 정보가 변경되도록 조작되면 "조작된" 또는 "유전적으로 조작된" 것으로 여겨진다(예를 들면, 이전에 존재하지 않은 새로운 유전 재료는 예를 들면 형질전환, 메이팅, 체세포 혼성화, 형질주입, 형질도입 또는 다른 기전에 의해 도입되거나 이전에 존재한 유전 재료는 예를 들면 치환, 결실 또는 메이팅에 의해 변경되거나 제거됨). 흔한 실행이고 당업자에 의해 이해되는 것처럼, 조작된 폴리뉴클레오타이드 또는 세포의, 완전 또는 불완전, 자손 또는 카피는 통상적으로 여전히 직접적인 조작이 이전의 집합체이더라도 "조작된" 것으로 지칭된다.
부형제: 본원에 사용된 것과 같이, "부형제"는 예를 들면 원하는 일관성 또는 안정화 효과를 제공하거나 기여하기 위해 약학 조성물에 포함될 수 있는 비치료제를 지칭한다. 일부 실시형태에서, 적합한 약학 부형제는 예를 들면 전분, 글루코스, 락토스, 수크로스, 젤라틴, 맥아, 쌀, 밀가루, 백악, 실리카 겔, 스테아르산나트륨, 글리세롤 모노스테아레이트, 탈크, 염화나트륨, 탈지분유, 글리세롤, 프로필렌, 글리콜, 물, 에탄올 또는 기타를 포함할 수 있다.
발현 : 본원에 사용된 것과 같이, "발현"은 개별적으로 및/또는 누적하여 암호화된 제제, 예컨대 단백질의 핵산 서열로부터의 생성을 발생시키는 하나 이상의 생물학적 과정을 지칭한다. 발현은 구체적으로는 전사 및 번역 중 어느 하나 또는 둘 다를 포함한다.
플랭크 : 본원에 사용된 것과 같이, 제2 요소 및 제3요소와 인접한 서열에 존재하는 제1 요소(예를 들면, 핵산 서열 또는 아미노산 서열)는 이것이 제2 요소와 제3요소 사이의 인접한 서열에 위치하면 제2 요소 및 제3요소에 의해 "플랭킹"된다. 따라서, 이러한 배열에서, 제2 요소 및 제3요소는 제1 요소를 "플랭킹"하는 것으로 지칭될 수 있다. 플랭킹 요소는 플랭킹된 요소에 바로 인접하거나 하나 이상의 관련 단위에 의해 플랭킹된 요소로부터 분리될 수 있다. 각각 인접한 서열이 핵산 또는 아미노산 서열이고, 관련 단위가 염기 또는 아미노산 잔기인 다양한 예에서, 플랭킹된 요소와 독립적으로 제1 플랭킹 요소 및/또는 제2 플랭킹 요소 사이에 있는 인접한 서열에서의 단위의 수는 예를 들면 50개 단위 이하, 예를 들면 50개, 45개, 40개, 35개, 30개, 25개, 20개, 15개, 10개, 5개, 4개, 3개, 2개, 1개 또는 0개 이하의 단위일 수 있다.
단편: 본원에 사용된 것과 같이, "단편"은 기준 제제(때때로 "모" 제제로 지칭됨)의 구별되는 부분을 포함하고/하거나 이들로 이루어진 구조를 지칭한다. 일부 실시형태에서, 단편은 기준 제제에서 발견된 하나 이상의 모이어티가 결여된다. 일부 실시형태에서, 단편은 기준 제제에서 발견된 하나 이상의 모이어티를 포함하거나 이들로 이루어진다. 일부 실시형태에서, 기준 제제는 중합체, 예컨대 폴리뉴클레오타이드 또는 폴리펩타이드이다. 일부 실시형태에서, 중합체의 단편은 기준 중합체의 적어도 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 55개, 60개, 65개, 70개, 75개, 80개, 85개, 90개, 95개, 100개, 110개, 120개, 130개, 140개, 150개, 160개, 170개, 180개, 190개, 200개, 210개, 220개, 230개, 240개, 250개, 275개, 300개, 325개, 350개, 375개, 400개, 425개, 450개, 475개, 500개 이상의 단량체 단위(예를 들면, 잔기)를 포함하거나 이들로 이루어진다. 일부 실시형태에서, 중합체의 단편은 기준 중합체에서 발견된 단량체 단위(예를 들면, 잔기)의 적어도 5%, 10%, 15%, 20%, 25%, 30%, 25%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 이상을 포함하거나 이들로 이루어진다. 기준 중합체의 단편은 기준 중합체의 상응하는 부분과 반드시 동일하지는 않다. 예를 들면, 기준 중합체의 단편은 기준 중합체와 적어도 5%, 10%, 15%, 20%, 25%, 30%, 25%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 이상의 동일성을 갖는 잔기의 서열을 갖는 중합체일 수 있다. 단편은 기준 제제의 물리적 단편화에 의해 생성되거나 생성되지 않을 수 있다. 일부 경우에, 단편은 기준 제제의 물리적 단편화에 의해 생성된다. 일부 경우에, 단편은 기준 제제의 물리적 단편화에 의해 생성되지 않고, 대신에 예를 들면 신생 합성 또는 다른 수단에 의해 제조될 수 있다.
유전자, 전이유전자 : 본원에 사용된 것과 같이, 용어 "유전자"는 선택적으로 암호화 서열의 발현을 제어하는 조절 서열의 일부 또는 전부와 함께 암호화 서열(즉, 발현 산물, 예컨대 RNA 산물 및/또는 폴리펩타이드 산물을 암호화하는 DNA 서열)이거나 이를 포함하는 DNA 서열을 지칭한다. 일부 실시형태에서, 유전자는 비암호화 서열, 예컨대 제한 없이, 인트론을 포함한다. 일부 실시형태에서, 유전자는 암호화 서열(예를 들면, 엑손성) 및 비암호화 서열(예를 들면, 인트론성) 둘 다를 포함할 수 있다. 일부 실시형태에서, 유전자는 프로모터인 조절 서열을 포함한다. 일부 실시형태에서, 유전자는 (i) 소스 게놈과 같은 기준 맥락에서의 암호화 서열의 상류에 뉴클레오타이드의 미리 결정된 수를 연장시키는 DNA 뉴클레오타이드 및 (ii) 소스 게놈과 같은 기준 맥락에서의 암호화 서열의 하류에 뉴클레오타이드의 미리 결정된 수를 연장시키는 DNA 뉴클레오타이드 중 하나 또는 둘 다를 포함한다. 다양한 실시형태에서, 뉴클레오타이드의 미리 결정된 수는 500 bp, 1 kb, 2 kb, 3 kb, 4 kb, 5 kb, 10 kb, 20 kb, 30 kb, 40 kb, 50 kb, 75 kb 또는 100 kb일 수 있다. 본원에 사용된 것과 같이, "전이유전자"는 내인성이 아니거나 유전자가 존재하거나 유전자가 조작에 의해 배치될 수 있는 기준 맥락에 대해 자연적이 아닌 유전자를 지칭한다.
유전자 산물 또는 발현 산물 : 본원에 사용된 것과 같이, 용어 "유전자 산물" 또는 "발현 산물"은 일반적으로 유전자로부터 전사된 RNA(전처리 및/또는 후처리) 또는 유전자로부터 전사된 RNA에 의해 암호화된 폴리펩타이드(변형전 및/또는 변형후)를 지칭한다.
숙주 세포, 표적 세포 : 본원에 사용된 것과 같이, "숙주 세포"는 외인성 DNA(재조합 또는 그 외), 예컨대 전이유전자가 도입된 세포를 지칭한다. 당업자는 "숙주 세포"가 외인성 DNA가 초기에 도입된 세포 및/또는 이의, 완전 또는 불완전, 자손 또는 카피일 수 있다는 것을 이해한다. 일부 실시형태에서, 숙주 세포는 하나 이상의 바이러스 유전자 또는 전이유전자를 포함한다. 일부 실시형태에서, 의도된 또는 잠재적인 숙주 세포는 표적 세포라 지칭될 수 있다.
다양한 실시형태에서, 숙주 세포 또는 표적 세포는 다양한 표면 마커의 존재, 부재 또는 발현 수준에 의해 확인된다.
세포 또는 세포의 집단이 특정한 마커에 "양성"이거나 이를 발현한다는 기술은 특정한 마커의 세포 상의 또는 세포에서의 검출 가능한 존재를 지칭한다. 표면 마커를 지칭할 때, 상기 용어는 유세포 분석법에 의해, 예를 들면 마커에 특이적으로 결합하는 항체에 의한 염색 및 상기 항체의 검출에 의해 검출되는 표면 발현의 존재를 지칭할 수 있고, 염색은 달리 동일한 조건 하에 아이소타입-일치된 제어와 동일한 절차를 수행하는 검출된 염색보다 실질적으로 높은 수준에서 및/또는 마커에 양성인 것으로 알려진 세포에 대한 수준과 실질적으로 유사한 수준에서 및/또는 마커에 음성인 것으로 알려진 세포에 대한 것보다 실질적으로 더 높은 수준에서 유세포 분석법에 의해 검출 가능하다.
세포 또는 세포의 집단이 특정한 마커에 "음성"이거나 마커의 발현이 결여된다는 기술은 특정한 마커의 세포 상의 또는 세포에서의 실질적인 검출 가능한 존재의 부재를 지칭한다. 표면 마커를 지칭할 때, 상기 용어는 유세포 분석법에 의해, 예를 들면 마커에 특이적으로 결합하는 항체에 의한 염색 및 상기 항체의 검출에 의해 검출되는 표면 발현의 부재를 지칭할 수 있고, 염색은 달리 동일한 조건 하에 아이소타입-일치된 제어와 동일한 절차를 수행하는 검출된 염색보다 실질적으로 높은 수준에서 및/또는 마커에 양성인 것으로 알려진 세포에 대한 수준보다 실질적으로 더 낮은 수준에서 및/또는 마커에 음성인 것으로 알려진 세포에 대한 것과 비교하여 실질적으로 유사한 수준에서 유세포 분석법에 의해 검출되지 않는다.
동일성 : 본원에 사용된 것과 같이, 용어 "동일성"은 중합체성 분자 사이의 예를 들면 핵산 분자(예를 들면, DNA 분자 및/또는 RNA 분자) 사이의 및/또는 폴리펩타이드 분자 사이의 전체 관련성을 지칭한다. 2개의 제공된 서열 사이의 퍼센트 동일성의 계산을 위한 방법은 당해 분야에 알려져 있다. 용어 "% 서열 동일성"은 서열을 비교하여 결정된 것과 같은 2개 이상의 서열 사이의 관계를 지칭한다. 당해 분야에서, "동일성"은 또한 이러한 서열의 스트링 사이의 일치에 의해 결정된 것과 같은 단백질과 핵산 서열 사이의 서열 관련성의 정도를 의미한다. "동일성"(대개 "유사성"이라 지칭됨)은 Computational Molecular Biology (Lesk, A. M., ed.) Oxford University Press, NY (1988); Biocomputing: Informatics and Genome Projects (Smith, D. W., ed.) Academic Press, NY (1994); Computer Analysis of Sequence Data, Part I (Griffin, A. M., and Griffin, H. G., eds.) Humana Press, NJ (1994); Sequence Analysis in Molecular Biology (Von Heijne, G., ed.) Academic Press (1987); 및 Sequence Analysis Primer (Gribskov, M. and Devereux, J., eds.) Oxford University Press, NY (1992)에 기재된 것을 포함하는 알려진 방법에 의해 용이하게 계산될 수 있다. 동일성을 결정하기 위한 바람직한 방법은 시험된 서열 사이의 최고의 일치를 생성하도록 설계된다. 동일성 및 유사성을 결정하기 위한 방법은 공중에게 이용 가능한 컴퓨터 프로그램에서 코드화된다. 예를 들면, 2개의 핵산 또는 폴리펩타이드 서열의 퍼센트 동일성의 계산은 예를 들면 최적 비교 목적을 위해 2개의 서열(또는 하나의 또는 둘 다의 서열의 보체)을 정렬함으로써 수행될 수 있다(예를 들면, 갭은 최적 정렬을 위해 제1 서열 및 제2 서열의 하나 또는 둘 다에서 도입될 수 있고 비동일한 서열은 비교 목적을 위해 무시될 수 있다). 상응하는 위치에서의 뉴클레오타이드 또는 아미노산은 이후 비교된다. 제1 서열에서의 위치가 제2 서열에서 상응하는 위치와 동일한 잔기(예를 들면, 뉴클레오타이드 또는 아미노산)에 의해 점유될 때, 그 분자는 그 위치에서 동일하다. 2개의 서열 사이의 퍼센트 동일성은 선택적으로 2개의 서열의 최적 정렬을 위해 도입될 필요가 있을 수 있는 갭의 수 및 각각의 갭의 길이를 고려하여 서열이 공유한 동일한 위치의 수의 함수이다. 2개의 서열 사이의 서열의 비교 및 퍼센트 동일성의 결정은 컴퓨터 알고리즘, 예컨대 BLAST(기본 국소 정렬 조사 도구)를 사용하여 달성될 수 있다. 서열 정렬 및 퍼센트 동일성 계산은 LASERGENE 생물정보학 컴퓨팅 스위트(DNASTAR, Inc., 위스콘신주 매디슨)의 Megalign 프로그램을 사용하여 수행될 수 있다. 다수의 서열 정렬은 또한 디폴트 매개변수(갭 패널티 = 10, 갭 길이 패널티 = 10)로 정렬의 Clustal 방법(Higgins and Sharp CABIOS, 5, 151-153 (1989)을 사용하여 수행될 수 있다. 관련 프로그램은 또한 프로그램의 GCG 스위트(Wisconsin Package Version 9.0, Genetics Computer Group(GCG), 위스콘신주 매디슨); BLASTP, BLASTN, BLASTX(Altschul 등, J. Mol. Biol. 215:403-410 (1990); DNASTAR(DNASTAR, Inc., 위스콘신주 매디슨); 및 Smith-Waterman 알고리즘을 포함하는 FASTA 프로그램(Pearson, Comput. Methods Genome Res., [Proc. Int. Symp.] (1994), Meeting Date 1992, 111-20. 편집자(들): Suhai, Sandor. 출판사: Plenum, New York, N.Y.)을 포함한다. 본 개시내용의 맥락 내에서, 분석에 서열 분석 소프트웨어가 사용되는 경우, 분석의 결과가 언급된 프로그램의 "디폴트 값"에 기초한다는 것을 이해될 것이다. "디폴트 값"은 처음에 초기화될 때 소프트웨어가 원래 로딩된 값 또는 매개변수의 임의의 세트를 의미할 것이다.
" 개선한다 ", " 증가시킨다 ", " 억제한다 " 또는 " 감소시킨다 ": 본원에 사용된 것과 같이, 용어 "개선한다", "증가시킨다", "억제한다" 및 "감소시킨다" 및 이의 문법적 균등물은 기준으로부터의 정성적 차이 또는 정량적 차이를 나타낸다.
단리된: 본원에 사용된 것과 같이, "단리된"은 (1) 초기에 생성될 때(자연에서든 및/또는 실험 설정에서든) 이것이 연관된 성분의 적어도 일부로부터 분리되고/되거나 (2) 사람 손에 의해 설계, 생성, 준비 및/또는 제조된 물질 및/또는 집합체를 지칭한다. 단리된 물질 및/또는 집합체는 이것이 초기에 연관된 다른 성분의 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 99% 초과로부터 분리될 수 있다. 일부 실시형태에서, 단리된 제제는 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 99% 초과 순수하다. 본원에 사용된 것과 같이, 물질은 실질적으로 다른 성분이 없으면 "순수"하다. 일부 실시형태에서, 당업자에 의해 이해되는 것처럼, 물질은 예를 들면 하나 이상의 담체 또는 부형제(예를 들면, 완충액, 용매, 물 등)와 같은 소정의 다른 성분과 배합된 후 여전히 "단리된다" 또는 심지어 "순수하다"고 여겨질 수 있고; 이러한 실시형태에서, 물질의 퍼센트 단리 또는 순도는 이러한 담체 또는 부형제 없이 계산된다. 그러나 하나의 예를 생성하기위해, 일부 실시형태에서, 자연에서 발생하는 생물학적 중합체, 예컨대 폴리펩타이드 또는 폴리뉴클레오타이드는 a) 이의 기원 또는 유래의 소스가 자연에서 이의 자연적 상태에서 이것을 동반하는 성분들 중 일부 또는 전부와 회합되지 않을 때; b) 이것이 자연에서 이것을 생성하는 종으로부터 동일한 종의 다른 폴리펩타이드 또는 핵산이 실질적으로 없을 때; c) 자연에서 이것을 생성하는 종이 아닌 세포 또는 다른 발현 시스템으로부터의 성분에 의해 발현되거나 그렇지 않으면 이것과 회합될 때 "단리된다"고 여겨진다. 따라서, 예를 들면 일부 실시형태에서, 화학적으로 합성되거나 자연에서 이것을 생성하는 것과 상이한 세포 시스템에서 합성된 폴리펩타이드는 "단리된" 폴리펩타이드인 것으로 여겨진다. 대안적으로 또는 추가적으로, 일부 실시형태에서, 하나 이상의 정제 기법으로 처리된 폴리펩타이드는 a) 이것이 자연에서 회합된; 그리고/또는 b) 이것이 초기에 생성될 때 회합된 다른 성분으로터 분리된 정도로 "단리된" 폴리펩타이드인 것으로 여겨질 수 있다.
작동 가능하게 연결된 : 본원에 사용된 것과 같이, "작동 가능하게 연결된" 또는 "작동적으로 연결된"은 성분 요소가 이의 의도된 방식으로 이것이 기능하게 하는 관계에 있도록 적어도 제1 요소 및 제2 요소의 회합을 지칭한다. 예를 들면, 핵산 조절 서열은 조절 서열 및 암호화 서열이 조절 서열에 의해 암호화 서열의 발현의 제어를 허용하는 방식으로 회합되면 핵산 암호화 서열에 "작동 가능하게 연결"된다. 일부 실시형태에서, "작동 가능하게 연결된" 조절 서열은 (예를 들면, 단일 핵산에서) 암호화 서열과 직접적으로 또는 간접적으로 공유로 회합된다. 일부 실시형태에서, 조절 서열은 트랜스로 암호화 서열의 발현을 제어하고, 암호화 서열로서의 동일한 핵산에서의 조절 서열의 포함은 작동 가능한 연결의 필요요건이 아니다.
약학적으로 허용 가능한 : 본원에 사용된 것과 같이, 용어 "약학적으로 허용 가능한"은 본원에 개시된 것과 같은 조성물의 제형에 대한 하나 이상의 또는 모든 성분(들)에 적용되면서 각각의 성분이 조성물의 다른 성분과 상용성이고 이의 수혜자에게 해롭지 않아야 한다는 것을 의미한다.
약학적으로 허용 가능한 담체 : 본원에 사용된 것과 같이, 용어 "약학적으로 허용 가능한 담체"는 제제(예를 들면, 약학 제제)의 제형화가 수월하게 하거나, 제제의 생체이용률을 변형시키거나 대상체의 하나의 장기 또는 부분으로부터 또 다른 장기 또는 부분으로의 이송을 수월하게 하는 약학적으로 허용 가능한 재료, 조성물 또는 비히클, 예컨대 액체 또는 고체 충전제, 희석제, 부형제 또는 용매 캡슐화 재료를 지칭한다. 약학적으로 허용 가능한 담체로서 작용할 수 있는 재료의 일부 예는 당, 예컨대 락토스, 글루코스 및 수크로스; 전분, 예컨대 옥수수 전분 및 감자 전분; 셀룰로스 및 이의 유도체, 예컨대 나트륨 카복시메틸 셀룰로스, 에틸 셀룰로스 및 셀룰로스 아세테이트; 분말화 트라가칸트; 맥아; 젤라틴; 활석; 부형제, 예컨대 코코아 버터 및 좌제 왁스; 오일, 예컨대 낙화생유, 면실유, 홍화유, 참깨유, 올리브유, 옥수수유 및 대두유; 글리콜, 예컨대 프로필렌 글리콜; 폴리올, 예컨대 글리세린, 소르비톨, 만니톨 및 폴리에틸렌 글리콜; 에스테르, 예컨대 에틸 올레에이트 및 에틸 라우레이트; 한천; 완충제, 예컨대 마그네슘 수산화 및 수산화알루미늄; 알긴산; 발열원 비함유 물; 등장성 식염수; 링거액; 에틸 알코올; pH 완충 용액; 폴리에스테르, 폴리카보네이트 및/또는 폴리언하이드라이드; 및 약학 제형에서 사용된 다른 비독성 상용성 물질을 포함한다.
약학 조성물 : 본원에 사용된 것과 같이, 용어 "약학 조성물"은 활성 제제가 하나 이상의 약학적으로 허용 가능한 담체와 함께 제형화된 조성물을 지칭한다.
프로모터 : 본원에 사용된 것과 같이, "프로모터" 또는 "프로모터 서열"은 암호화 서열의 전사의 개시 및/또는 가공성에서 직접적으로 또는 간접적으로(예를 들면, 프로모터 결합된 단백질 또는 물질을 통해) 참여하는 DNA 조절 영역일 수 있다. 프로모터는 적합한 조건 하에 하나 이상의 전사 인자 및/또는 조절 모이어티와 프로모터의 결합 시 암호화 서열의 전사를 개시시킬 수 있다. 암호화 서열의 전사의 개시에 참여하는 프로모터는 암호화 서열에 "작동 가능하게 연결"될 수 있다. 소정의 경우에, 프로모터는 이렇게 지정된 서열이 전사 사건을 개시하는 데 필요한 염기 또는 요소의 최소 수의 하나 또는 둘 다를 포함하도록 전사 개시 부위(이의 3' 말단에서)로부터 상류(5' 방향) 위치로 확장하는 DNA 조절 영역일 수 있거나 이것을 포함할 수 있다. 프로모터는 발현 제어 서열, 예컨대 인핸서 및 리프레서 서열이거나, 이것을 포함하거나, 이것과 작동 가능하게 회합되거나 이것에 작동 가능하게 연결될 수 있다. 일부 실시형태에서, 프로모터는 유도성일 수 있다. 일부 실시형태에서, 프로모터는 구성적 프로모터일 수 있다. 일부 실시형태에서, 조건적(예를 들면, 유도성) 프로모터는 일방향 또는 이방향일 수 있다. 프로모터는 특정한 종의 게놈에서 발생하는 것으로 알려진 서열과 동일한 서열이거나 이것을 포함할 수 있다. 일부 실시형태에서, 프로모터는 전사 조절 영역을 함유하는 서열이 하나의 소스로부터 얻어질 수 있고 전사 개시 영역을 함유하는 서열이 제2 소스로부터 얻어질 수 있는 하이브리드 프로모터이거나 이것을 포함할 수 있다. 전이유전자 내의 암호화 서열에 제어 서열을 연결하기 위한 시스템은 당해 분야에 잘 알려져 있다(일반 분자 생물학적 및 재조합 DNA 기법은 Sambrook, Fritsch, and Maniatis, Molecular Cloning: A Laboratory Manual, Second Edition, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989에 기재되어 있음).
기준: 본원에 사용된 것과 같이, "기준"은 비교가 수행되는 표준품 또는 대조군을 지칭한다. 예를 들면, 일부 실시형태에서, 제제, 샘플, 서열, 대상체, 동물 또는 개체 또는 이들의 집단 또는 이를 대표하는 측정 또는 특징은 기준, 제제, 샘플, 서열, 대상체, 동물 또는 개체 또는 이들의 집단 또는 이를 대표하는 측정 또는 특징과 비교된다. 일부 실시형태에서, 기준은 측정된 값이다. 일부 실시형태에서, 기준은 확립된 표준품 또는 예상된 값이다. 일부 실시형태에서, 기준은 병역학적 기준이다. 기준은 정성적의 정량적일 수 있다. 통상적으로, 당업자에 의해 이해되는 것처럼, 이것이 비교되는 기준 및 값은 필적하는 조건 하에 측정을 나타낸다. 당업자는 충분한 유사성이 의존성 및/또는 비교를 정당화하기 위해 존재할 때를 이해할 것이다. 일부 실시형태에서, 적절한 기준은 예를 들면 하나 이상의 특정한 변수(예를 들면, 제제 또는 조건의 존재 또는 부재) 또는 이를 나타내는 측정 또는 특징을 평가할 목적을 위해 당업자가 필적하는 것으로 인식하는 조건 하에 제제, 샘플, 서열, 대상체, 동물 또는 개체 또는 이들의 집단일 수 있다. 어떠한 특정한 실시형태(들)에 의해 구속되고자 바라지 않으면서, 다양한 실시형태에서 기준 서열은 본원에 제공된 서열 수탁 번호와 연관된 서열일 수 있고, 서열 수탁 번호와 연결된 소정의 서열은 도 40에 제공된다.
조절 서열 : 본원에 사용된 것과 같이 핵산 암호화 서열의 발현의 맥락에서, 조절 서열은 암호화 서열의 발현을 제어하는 핵산 서열이다. 일부 실시형태에서, 조절 서열은 유전자 발현의 하나 이상의 양태(예를 들면, 세포-유형 특이적 발현, 유도성 발현 등)를 조절하거나 이에 영향을 미칠 수 있다.
대상체: 본원에 사용된 것과 같이, 용어 "대상체"는 유기체, 통상적으로 포유류(예를 들면, 인간, 래트 또는 마우스)를 지칭한다. 일부 실시형태에서, 대상체는 질환, 장애 또는 병태를 겪는다. 일부 실시형태에서, 대상체는 질환, 장애 또는 병태에 감수성이다. 일부 실시형태에서, 대상체는 질환, 장애 또는 병태의 하나 이상의 증상 또는 특징을 나타낸다. 일부 실시형태에서, 대상체는 질환, 장애 또는 병태를 겪지 않는다. 일부 실시형태에서, 대상체는 질환, 장애 또는 병태의 임의의 증상 또는 특징을 나타내지 않는다. 일부 실시형태에서, 대상체는 질환, 장애 또는 병태에 대한 감수성 또는 이의 위험의 특징인 하나 이상의 특징을 갖는다. 일부 실시형태에서, 대상체는 질환, 장애 또는 병태에 대해 시험된 및/또는 치료가 투여되는 대상체이다. 일부 경우에, 인간 대상체는 상호교환 가능하게 "환자" 또는 "개체"로 지칭될 수 있다.
치료제 : 본원에 사용된 것과 같이, 용어 "치료제"는 대상체에게 투여될 때 원하는 약물학적 효과를 일으키는 임의의 제제를 지칭한다. 일부 실시형태에서, 제제는 적절한 집단에 걸쳐 통계학적으로 유의미한 효과를 나타내면 치료제인 것으로 여겨진다. 일부 실시형태에서, 적절한 집단은 모델 유기체의 집단 또는 인간 집단일 수 있다. 일부 실시형태에서, 적절한 집단은 다양한 기준, 예컨대 소정의 연령 그룹, 성별, 유전 배경, 기존의 임상 조건 등에 의해 규정될 수 있다. 일부 실시형태에서, 치료제는 질환, 장애 또는 병태의 치료에 사용될 수 있는 물질이다. 일부 실시형태에서, 치료제는 인간에 대한 투여를 위해 시판되기 전에 정부 기관에 의해 허가되거나 허가되는 것이 필요한 제제이다. 일부 실시형태에서, 치료제는 인간에 대한 투여를 위해 의학 처방이 필요한 제제이다.
치료학적 유효량: 본원에 사용된 것과 같이, "치료학적 유효량"은 이것이 투여된 원하는 효과를 생성하는 양을 지칭한다. 일부 실시형태에서, 상기 용어는 질환, 장애 및/또는 병태를 치료하기 위해 치료학적 투약 요법에 따라 질환, 장애 및/또는 병태로 고통을 받거나 이에 민감한 집단에게 투여될 때 충분한 양을 지칭한다. 일부 실시형태에서, 치료학적 유효량은 질환, 장애 및/또는 병태의 하나 이상의 증상의 발생률 및/또는 중증도를 감소시키고/시키거나, 이의 발병을 지연시키는 것이다. 당업자는 용어 "치료학적 유효량"이 사실 성공적인 치료가 특정한 개체에서 달성될 것을 요하지 않는다는 것을 이해할 것이다. 오히려, 치료학적 유효량은 이러한 치료를 필요로 하는 환자에 투여될 때 대상체의 상당한 수에서의 특정한 원하는 약물학적 반응을 제공하는 양일 수 있다. 일부 실시형태에서, 치료학적 유효량의 언급은 하나 이상의 특정 조직(예를 들면, 질환, 장애 또는 병태에 의해 이환된 조직) 또는 유체(예를 들면, 혈액, 타액, 혈청, 땀, 눈물, 소변 등)에서 측정된 양의 언급일 수 있다. 당업자는, 일부 실시형태에서, 특정한 제제 또는 치료제의 치료학적 유효량이 단일 용량으로 제형화되고/되거나 투여될 수 있다는 것을 이해할 것이다. 일부 실시형태에서, 치료학적으로 효과적인 제제는 예를 들면 투약 요법의 일부로서 복수의 용량으로 제형화되고/되거나 투여될 수 있다.
치료 : 본원에 사용된 것과 같이, 용어 "치료"(또한 "치료한다" 또는 "치료하는")는 특정한 질환, 장애 또는 병태의 하나 이상의 증상, 특징 및/또는 원인을 부분적으로 또는 완전히 완화하고/하거나 개선하고/하거나 경감시키고/시키거나 억제하고/하거나 이의 발병을 지연시키고/시키거나 이의 중증도를 감소시키고/시키거나 이의 발생률을 감소시키거나 임의의 이러한 결과를 달성할 목적을 위해 투여되는 치료의 투여를 지칭한다. 일부 실시형태에서, 이러한 치료는 관련 질환, 장애 또는 병태의 징후를 나타내지 않는 대상체 및/또는 질환, 장애 또는 병태의 오직 초기 징후를 나타내는 대상체일 수 있다. 대안적으로 또는 추가적으로, 이러한 치료는 관련 질환, 장애 및/또는 병태의 하나 이상의 확립된 징후를 나타내는 대상체일 수 있다. 일부 실시형태에서, 치료는 관련 질환, 장애 및/또는 병태를 겪는 것으로 진단된 대상체일 수 있다. 일부 실시형태에서, 치료는 관련 질환, 장애 또는 병태의 발생의 증가된 위험과 통계학적으로 상관된 하나 이상의 감수성 인자를 갖는 것으로 알려진 대상체일 수 있다. "예방학적 치료"는 병태를 발생시킬 위험을 줄이거나 예방하거나 감소시키기 위한 목적을 위해 치료가 투여되도록 치료되는 병태의 징후 또는 증상을 나타내지 않거나 치료되는 병태의 오직 초기 징후 또는 증상을 나타내는 대상체에게 투여되는 치료를 포함한다. 따라서, 예방학적 치료는 병태에 대한 예방적 치료로서 작용한다. "치료학적 치료"는 병태의 증상 또는 징후를 나타내는 대상체에게 투여되고 병태의 중증도 또는 진행을 감소시킬 목적을 위해 대상체에게 투여되는 치료를 포함한다.
단위 용량 : 본원에 사용된 것과 같이, 용어 "단위 용량"은 단일 용량으로서 및/또는 약학 조성물의 물리적으로 구별되는 단위로 투여되는 양을 지칭한다. 많은 실시형태에서, 단위 용량은 미리 결정된 분량의 활성 제제, 예를 들면 미리 결정된 바이러스 역가(소정의 부피의 바이러스, 비리온 또는 바이러스 입자의 수)를 함유한다. 일부 실시형태에서, 단위 용량은 제제의 전체 단일 용량을 함유한다. 일부 실시형태에서, 1개 초과의 단위 용량은 총 단일 용량을 달성하도록 투여된다. 일부 실시형태에서, 다수의 단위 용량의 투여는 의도된 효과를 달성하기 위해 필요하거나 필요한 것으로 예상된다. 단위 용량은 예를 들면 하나 이상의 치료학적 모이어티의 미리 결정된 분량을 함유하는 액체(예를 들면, 허용 가능한 담체)의 부피, 고체 형태의 하나 이상의 치료학적 모이어티의 미리 결정된 양, 하나 이상의 치료학적 모이어티의 미리 결정된 양을 함유하는 서방형 제형 또는 약물 전달 장치 등일 수 있다. 단위 용량이 치료학적 모이어티(들) 이외의 임의의 여러 가지의 성분을 포함하는 제형에 존재할 수 있는 것으로 이해될 것이다. 예를 들면, 허용 가능한 담체(예를 들면, 약학적으로 허용 가능한 담체), 희석제, 안정화제, 완충제, 보존제 등이 포함될 수 있다. 당업자에 의해, 많은 실시형태에서, 특정한 치료제의 총 적절한 1일 투여량이 단위 용량의 일부 또는 복수를 포함할 수 있고, 예를 들면 충분한 의학적 판단의 범위 내에 의학 실행자에 의해 결정될 수 있는 것으로 이해될 것이다. 일부 실시형태에서, 임의의 특정한 대상체 또는 유기체에 대한 특정 유효 용량 수준은 치료되는 장애 및 장애의 중증도; 사용된 특정 활성 화합물의 활성; 사용된 특정 조성물; 대상체의 연령, 체중, 일반 건강, 성별 및 식이; 사용된 특정 활성 화합물의 투여 시간 및 배설률; 치료의 기간, 사용된 특정 화합물(들)과 조합으로 또는 우연히 사용된 약물 및/또는 추가 치료제 및 의학 분야에 잘 알려진 유사한 인자를 포함하는 다양한 인자에 따라 달라질 수 있다.
도 1은 표시된 아데노바이러스 혈청형에 의한 세포의 감염 후 3시간에 CD34+ 세포의 항-헥손 염색의 결과를 보여주는 차트이다. 세포를 세포당 5,000개의 바이러스 입자 또는 세포당 2,000개의 바이러스 입자로 감염시켰다. 각각의 시험된 혈청형에 대해, 차트는 데이터의 2개의 반복실험을 포함하고, 각각의 반복실험은 표시된 순서로 세포당 5,000개의 바이러스 입자 및 세포당 2,000개의 바이러스 입자로 분석의 결과를 포함한다. 데이터는 감염 효율을 나타낸다.
도 2는 표시된 아데노바이러스 혈청형으로 감염된 CD34+ 세포에서 아데노바이러스 DNA의 qPCR 분석의 결과를 보여주는 차트이다. 세포를 세포당 5,000개의 바이러스 입자 또는 세포당 2,000개의 바이러스 입자로 감염시켰다. 각각의 시험된 혈청형에 대해, 차트는 데이터의 2개의 반복실험을 포함하고, 각각의 반복실험은 표시된 순서로 세포당 5,000개의 바이러스 입자 및 세포당 2,000개의 바이러스 입자로 분석의 결과를 포함한다. 데이터는 상대 감염 효율을 나타낸다.
도 3은 표시된 아데노바이러스 혈청형에 의한 세포의 감염 후 3시간에 공여자 1로부터의 CD34+ 세포의 항-헥손 염색의 결과를 보여주는 차트이다. 세포를 세포당 2,000개의 바이러스 입자로 감염시켰다. 각각의 시험된 혈청형에 대해, 차트는 데이터의 2개의 반복실험을 포함한다. 데이터는 감염 효율을 나타낸다.
도 4는 표시된 아데노바이러스 혈청형에 의한 세포의 감염 후 6시간에 공여자 1로부터의 CD34+ 세포의 항-헥손 염색의 결과를 보여주는 차트이다. 세포를 세포당 2,000개의 바이러스 입자로 감염시켰다. 각각의 시험된 혈청형에 대해, 차트는 데이터의 2개의 반복실험을 포함한다. 데이터는 감염 효율을 나타낸다.
도 5는 표시된 아데노바이러스 혈청형에 의한 세포의 감염 후 3시간에 공여자 1로부터의 CD34+ 세포의 항-헥손 염색의 결과를 보여주는 차트이다. 세포를 세포당 5,000개의 바이러스 입자로 감염시켰다. 각각의 시험된 혈청형에 대해, 차트는 데이터의 2개의 반복실험을 포함한다. 데이터는 감염 효율을 나타낸다.
도 6은 표시된 아데노바이러스 혈청형에 의한 세포의 감염 후 6시간에 공여자 1로부터의 CD34+ 세포의 항-헥손 염색의 결과를 보여주는 차트이다. 세포를 세포당 5,000개의 바이러스 입자로 감염시켰다. 각각의 시험된 혈청형에 대해, 차트는 데이터의 2개의 반복실험을 포함한다. 데이터는 감염 효율을 나타낸다.
도 7은 표시된 아데노바이러스 혈청형에 의한 세포의 감염 후 3시간에 공여자 2로부터의 CD34+ 세포의 항-헥손 염색의 결과를 보여주는 차트이다. 세포를 세포당 2,000개의 바이러스 입자로 감염시켰다. 각각의 시험된 혈청형에 대해, 차트는 데이터의 2개의 반복실험을 포함한다. 데이터는 감염 효율을 나타낸다. 혈청형 F35의 2개의 반복실험 제제를 시험하였다. GLN은 표시된 아데노바이러스 벡터가 GFP 발광 리포터를 암호화하는 발현 카세트를 포함한다는 것을 나타낸다.
도 8은 표시된 아데노바이러스 혈청형에 의한 세포의 감염 후 6시간에 공여자 2로부터의 CD34+ 세포의 항-헥손 염색의 결과를 보여주는 차트이다. 세포를 세포당 2,000개의 바이러스 입자로 감염시켰다. 각각의 시험된 혈청형에 대해, 차트는 데이터의 3개의 반복실험을 포함한다. 데이터는 감염 효율을 나타낸다.
도 9는 표시된 아데노바이러스 혈청형에 의한 세포의 감염 후 3시간에 공여자 2로부터의 CD34+ 세포의 항-헥손 염색의 결과를 보여주는 차트이다. 세포를 세포당 5,000개의 바이러스 입자로 감염시켰다. 각각의 시험된 혈청형에 대해, 차트는 데이터의 3개의 반복실험을 포함한다. 데이터는 감염 효율을 나타낸다.
도 10은 표시된 아데노바이러스 혈청형에 의한 세포의 감염 후 6시간에 공여자 2로부터의 CD34+ 세포의 항-헥손 염색의 결과를 보여주는 차트이다. 세포를 세포당 5,000개의 바이러스 입자로 감염시켰다. 각각의 시험된 혈청형에 대해, 차트는 데이터의 3개의 반복실험을 포함한다. 데이터는 감염 효율을 나타낸다.
도 11은 표시된 아데노바이러스 혈청형에 의한 세포의 감염 후 3시간에 공여자 3으로부터의 CD34+ 세포의 항-헥손 염색의 결과를 보여주는 차트이다. 세포를 세포당 2,000개의 바이러스 입자로 감염시켰다. 각각의 시험된 혈청형에 대해, 차트는 데이터의 3개의 반복실험을 포함한다. 데이터는 감염 효율을 나타낸다.
도 12는 표시된 아데노바이러스 혈청형에 의한 세포의 감염 후 6시간에 공여자 3으로부터의 CD34+ 세포의 항-헥손 염색의 결과를 보여주는 차트이다. 세포를 세포당 2,000개의 바이러스 입자로 감염시켰다. 각각의 시험된 혈청형에 대해, 차트는 데이터의 2개 또는 3개의 반복실험을 포함한다. 데이터는 감염 효율을 나타낸다.
도 13은 표시된 아데노바이러스 혈청형에 의한 세포의 감염 후 3시간 또는 6시간에 공여자 3으로부터의 CD34+ 세포의 항-헥손 염색의 결과를 보여주는 차트이다. 세포를 세포당 5,000개의 바이러스 입자로 감염시켰다. 각각의 시험된 혈청형에 대해, 차트는 데이터의 2개의 반복실험을 포함하고, 각각의 반복실험은 표시된 순서로 감염 후 3시간 및 6시간에 분석의 결과를 포함한다. 데이터는 감염 효율을 나타낸다.
도 14는 표시된 아데노바이러스 혈청형에 의한 세포의 감염 후 3시간에 공여자 1로부터의 CD34+ 세포에서의 아데노바이러스 DNA의 qPCR 분석의 결과를 보여주는 차트이다. 세포를 세포당 2,000개의 바이러스 입자로 감염시켰다. 각각의 시험된 혈청형에 대해, 차트는 데이터의 2개의 반복실험을 포함한다. 오차 막대는 기술적 반복실험을 나타낸다. 데이터는 상대 감염 효율을 나타낸다.
도 15는 표시된 아데노바이러스 혈청형에 의한 세포의 감염 후 6시간에 공여자 1로부터의 CD34+ 세포에서의 아데노바이러스 DNA의 qPCR 분석의 결과를 보여주는 차트이다. 세포를 세포당 2,000개의 바이러스 입자로 감염시켰다. 각각의 시험된 혈청형에 대해, 차트는 데이터의 2개의 반복실험을 포함한다. 데이터는 상대 감염 효율을 나타낸다.
도 16은 표시된 아데노바이러스 혈청형에 의한 세포의 감염 후 3시간에 공여자 1로부터의 CD34+ 세포에서의 아데노바이러스 DNA의 qPCR 분석의 결과를 보여주는 차트이다. 세포를 세포당 5,000개의 바이러스 입자로 감염시켰다. 각각의 시험된 혈청형에 대해, 차트는 데이터의 2개의 반복실험을 포함한다. 오차 막대는 기술적 반복실험을 나타낸다. 데이터는 상대 감염 효율을 나타낸다.
도 17은 표시된 아데노바이러스 혈청형에 의한 세포의 감염 후 6시간에 공여자 1로부터의 CD34+ 세포에서의 아데노바이러스 DNA의 qPCR 분석의 결과를 보여주는 차트이다. 세포를 세포당 5,000개의 바이러스 입자로 감염시켰다. 각각의 시험된 혈청형에 대해, 차트는 데이터의 2개의 반복실험을 포함한다. 데이터는 상대 감염 효율을 나타낸다.
도 18은 표시된 아데노바이러스 혈청형에 의한 세포의 감염 후 3시간에 공여자 2로부터의 CD34+ 세포에서의 아데노바이러스 DNA의 qPCR 분석의 결과를 보여주는 차트이다. 세포를 세포당 2,000개의 바이러스 입자로 감염시켰다. 각각의 시험된 혈청형에 대해, 차트는 데이터의 2개의 반복실험을 포함한다. 오차 막대는 기술적 반복실험을 나타낸다. 데이터는 상대 감염 효율을 나타낸다.
도 19는 표시된 아데노바이러스 혈청형에 의한 세포의 감염 후 6시간에 공여자 2로부터의 CD34+ 세포에서의 아데노바이러스 DNA의 qPCR 분석의 결과를 보여주는 차트이다. 세포를 세포당 2,000개의 바이러스 입자로 감염시켰다. 각각의 시험된 혈청형에 대해, 차트는 데이터의 3개의 반복실험을 포함한다. 오차 막대는 기술적 반복실험을 나타낸다. 데이터는 상대 감염 효율을 나타낸다.
도 20은 표시된 아데노바이러스 혈청형에 의한 세포의 감염 후 3시간에 공여자 2로부터의 CD34+ 세포에서의 아데노바이러스 DNA의 qPCR 분석의 결과를 보여주는 차트이다. 세포를 세포당 5,000개의 바이러스 입자로 감염시켰다. 각각의 시험된 혈청형에 대해, 차트는 데이터의 3개의 반복실험을 포함한다. 오차 막대는 기술적 반복실험을 나타낸다. 데이터는 상대 감염 효율을 나타낸다.
도 21은 표시된 아데노바이러스 혈청형에 의한 세포의 감염 후 6시간에 공여자 2로부터의 CD34+ 세포에서의 아데노바이러스 DNA의 qPCR 분석의 결과를 보여주는 차트이다. 세포를 세포당 5,000개의 바이러스 입자로 감염시켰다. 각각의 시험된 혈청형에 대해, 차트는 데이터의 3개의 반복실험을 포함한다. 오차 막대는 기술적 반복실험을 나타낸다. 데이터는 상대 감염 효율을 나타낸다.
도 22는 표시된 아데노바이러스 혈청형에 의한 세포의 감염 후 3시간에 공여자 3으로부터의 CD34+ 세포에서의 아데노바이러스 DNA의 qPCR 분석의 결과를 보여주는 차트이다. 세포를 세포당 2,000개의 바이러스 입자로 감염시켰다. 각각의 시험된 혈청형에 대해, 차트는 데이터의 3개의 반복실험을 포함한다. 오차 막대는 기술적 반복실험을 나타낸다. 데이터는 상대 감염 효율을 나타낸다.
도 23은 표시된 아데노바이러스 혈청형에 의한 세포의 감염 후 6시간에 공여자 3으로부터의 CD34+ 세포에서의 아데노바이러스 DNA의 qPCR 분석의 결과를 보여주는 차트이다. 세포를 세포당 2,000개의 바이러스 입자로 감염시켰다. 각각의 시험된 혈청형에 대해, 차트는 데이터의 2개 또는 3개의 반복실험을 포함한다. 오차 막대는 기술적 반복실험을 나타낸다. 데이터는 상대 감염 효율을 나타낸다.
도 24는 표시된 아데노바이러스 혈청형에 의한 세포의 감염 후 3시간 또는 6시간에 공여자 2로부터의 CD34+ 세포에서의 아데노바이러스 DNA의 qPCR 분석의 결과를 보여주는 차트이다. 세포를 세포당 5,000개의 바이러스 입자로 감염시켰다. 각각의 시험된 혈청형에 대해, 차트는 데이터의 2개의 반복실험을 포함하고, 각각의 반복실험은 표시된 순서로 감염 후 3시간 및 6시간에 분석의 결과를 포함한다. 오차 막대는 기술적 반복실험을 나타낸다. 데이터는 상대 감염 효율을 나타낸다.
도 25는 혈청형 Ad11의 제1 세대 아데노바이러스 게놈을 포함하는 플라스미드로 형질주입된 HEK293 세포로부터 제조된 Ad 조제물로부터 얻은 혈청형 Ad11의 제1 세대 아데노바이러스 게놈의 분해를 보여주는 겔의 영상이다. 도면에 포함된 표에 표시된 것과 같이, 정제된 아데노바이러스 게놈을 BspHI(레인 3) 또는 SmaI(레인 5) 중 어느 하나로 분해하는 한편, 모 플라스미드를 또한 비교를 위해 분해하였다(각각 레인 2 및 레인 4). Ad 게놈 및 플라스미드의 서열에 기초한 예측된 분해 단편의 표시가 또한 도시되어 있다.
도 26은 혈청형 Ad34의 제1 세대 아데노바이러스 게놈을 포함하는 플라스미드로 형질주입된 HEK293 세포로부터 제조된 Ad 조제물로부터 얻은 혈청형 Ad34의 제1 세대 아데노바이러스 게놈의 분해를 보여주는 겔의 영상이다. 도면에 포함된 표에 표시된 것과 같이, 정제된 아데노바이러스 게놈을 SmaI(레인 2) 또는 SspI(레인 3) 중 어느 하나로 분해하였다. Ad 게놈의 서열에 기초한 예측된 분해 단편의 표시가 또한 도시되어 있다.
도 27은 제1 세대 Ad35++ 게놈을 포함하는 플라스미드로 형질주입된 HEK293 세포로부터 제조된 Ad 조제물로부터 얻은 제1 세대 Ad35++ 게놈의 분해를 보여주는 겔의 영상이다. 도면에 포함된 표에 표시된 것과 같이, 정제된 아데노바이러스 게놈을 BspHI(레인 2)로 분해하는 한편, 모 플라스미드를 또한 비교를 위해 분해하였다(레인 3). Ad 게놈 및 플라스미드의 서열에 기초한 예측된 분해 단편의 표시가 또한 도시되어 있다. *은 반복된 샘플을 갖는 레인을 나타낸다.
도 28은 제1 세대 Ad35++ 게놈을 포함하는 플라스미드로 형질주입된 HEK293 세포로부터 제조된 Ad 조제물로부터 얻은 제1 세대 Ad35++ 게놈의 분해를 보여주는 겔의 영상이다. 겔 표지된 관찰된 #1을 큰 DNA 단편을 해상하기 위해 더 긴 기간 동안 전기영동하는 반면, 겔 표지된 관찰된 #2를 더 짧은 DNA 단편을 해상하기 위해 더 짧은 기간 동안 전기영동하였다. 도면에 포함된 표에 표시된 것과 같이, 정제된 아데노바이러스 게놈을 SmaI(레인 2)로 분해하는 한편, 모 플라스미드를 또한 비교를 위해 분해하였다(레인 3). Ad 게놈 및 플라스미드의 서열에 기초한 예측된 분해 단편의 표시가 또한 도시되어 있다.
도 29는 표시된 아데노바이러스 혈청형의 제1 세대 아데노바이러스 벡터에 의한 세포의 감염 후 25시간에 HEK293 세포의 GFP 분석의 결과를 보여주는 차트이다. 세포를 세포당 100개, 200개, 500개 및 1,000개의 바이러스 입자로 감염시켰다. 데이터는 감염 효율을 나타낸다. NTC는 비처리된 대조군을 나타낸다.
도 30은 표시된 아데노바이러스 혈청형의 제1 세대 아데노바이러스 벡터에 의한 세포의 감염 후 24시간에 HEK293 세포의 GFP 분석의 결과를 보여주는 차트이다. 세포를 세포당 100개, 200개, 500개, 1,000개 및 2,000개의 바이러스 입자로 감염시켰다. 데이터는 감염 효율을 나타낸다.
도 31은 표시된 아데노바이러스 혈청형의 제1 세대 아데노바이러스 벡터에 의한 세포의 감염 후 24시간에 K562 세포의 GFP 분석의 결과를 보여주는 차트이다. 세포를 세포당 100개, 200개, 500개, 1,000개 및 2,000개의 바이러스 입자로 감염시켰다. 데이터는 감염 효율을 나타낸다.
도 32는 표시된 아데노바이러스 혈청형의 제1 세대 아데노바이러스 벡터에 의한 세포의 감염 후 48시간에 공여자 2로부터의 CD34+ 세포의 GFP 분석의 결과를 보여주는 차트이다. 세포를 세포당 500개, 2,000개 및 5,000개의 바이러스 입자로 감염시켰다. 세포당 2,000개 및 5,000개의 바이러스 입자를 사용하는 조건에 대해, 차트는 데이터의 2개의 반복실험을 포함한다. 데이터는 감염 효율을 나타낸다.
도 33은 유세포 분석법을 사용한 분석 CD34+ 및 CD34+/CD90+ 집단에 대해 사용된 게이팅을 도시한다. 정제된 CD34+ 세포를 항-CD34 및 항-CD90 항체로 염색하고, 형질도입 효율을 CD34+고/CD90+ 세포에서 측정하였다. 박스는 세포의 집단을 정의하기 위해 사용된 게이트를 나타낸다. 하나의 선도로부터 또 다른 선도로의 화살표는 제1 선도에서의 게이팅된 집단이 제2 선도에서 디스플레이된다는 것을 나타낸다. 백분율은 각각의 표시된 게이트에 의해 함유된 세포의 퍼센트를 나타낸다. 이 도면에 도시된 데이터는 세포당 5,000개의 바이러스 입자에서의 혈청형 Ad34의 제1 세대 아데노바이러스 벡터에 의한 세포의 감염 후 46시간에 공여자 1로부터의 CD34+ 세포에 상응한다.
도 34는 표시된 아데노바이러스 혈청형의 제1 세대 아데노바이러스 벡터에 의한 세포의 감염 후 46시간에 공여자 1로부터의 CD34+ 세포 및 CD34+/CD90+ 세포의 GFP 분석의 결과를 보여주는 차트이다. GFP 양성인 세포의 백분율이 도시되어 있다. 세포를 세포당 2,000개 및 5,000개의 바이러스 입자로 감염시켰다. 데이터는 감염 효율을 나타낸다. *은 표시된 조건에 대해 수집된 데이터의 부재를 나타낸다.
도 35는 표시된 아데노바이러스 혈청형의 제1 세대 아데노바이러스 벡터에 의한 세포의 감염 후 46시간에 공여자 3으로부터의 CD34+ 세포 및 CD34+/CD90+ 세포의 GFP 분석의 결과를 보여주는 차트이다. GFP 양성인 세포의 백분율이 도시되어 있다. 세포를 세포당 500개, 2,000개 및 5,000개의 바이러스 입자로 감염시켰다. 데이터는 감염 효율을 나타낸다.
도 36은 표시된 아데노바이러스 혈청형의 제1 세대 아데노바이러스 벡터에 의한 세포의 감염 후 46시간에 공여자 1로부터의 CD34+ 세포 및 CD34+/CD90+ 세포의 GFP 분석의 결과를 보여주는 차트이다. GFP 양성 세포에 대한 GFP의 기하 평균 형광 강도(MFI)가 도시되어 있다. 세포를 세포당 2,000개 및 5,000개의 바이러스 입자로 감염시켰다. 데이터는 감염 효율을 나타낸다. *은 표시된 조건에 대해 수집된 데이터의 부재를 나타낸다.
도 37은 표시된 아데노바이러스 혈청형의 제1 세대 아데노바이러스 벡터에 의한 세포의 감염 후 46시간에 공여자 3으로부터의 CD34+ 세포 및 CD34+/CD90+ 세포의 GFP 분석의 결과를 보여주는 차트이다. GFP 양성 세포에 대한 GFP의 기하 평균 형광 강도(MFI)가 도시되어 있다. 세포를 세포당 500개, 2,000개 및 5,000개의 바이러스 입자로 감염시켰다. 데이터는 감염 효율을 나타낸다.
도 38은 표시된 아데노바이러스 혈청형에 의한 세포의 감염 후 3시간에 HEK293 세포에서의 아데노바이러스 DNA의 qPCR 분석의 결과를 보여주는 차트이다. 세포를 세포당 100개 및 500개의 바이러스 입자로 감염시켰다. 데이터는 상대 감염 효율을 나타낸다.
도 39는 표시된 아데노바이러스 혈청형에 의한 세포의 감염 후 3시간에 공여자 2로부터의 CD34+ 세포에서의 아데노바이러스 DNA의 qPCR 분석의 결과를 보여주는 차트이다. 세포를 세포당 500개, 2,000개 및 5,000개의 바이러스 입자로 감염시켰다. 세포당 2,000개 및 5,000개의 바이러스 입자를 사용하는 조건에 대해, 차트는 데이터의 2개의 반복실험을 포함한다. 데이터는 상대 감염 효율을 나타낸다.
도 40은 공중에게 이용 가능한 서열 수탁 번호에 상응하는 핵산 서열 및 아미노산 서열의 목록이고, 소정의 서열 및/또는 서열 수탁 번호는 본 개시내용에서 전체로 및/또는 부분적으로 포함되고/되거나 사용되고 그리고/또는 소정의 서열 및/또는 서열 수탁 번호는 본원에 참고로 포함된다.
도 2는 표시된 아데노바이러스 혈청형으로 감염된 CD34+ 세포에서 아데노바이러스 DNA의 qPCR 분석의 결과를 보여주는 차트이다. 세포를 세포당 5,000개의 바이러스 입자 또는 세포당 2,000개의 바이러스 입자로 감염시켰다. 각각의 시험된 혈청형에 대해, 차트는 데이터의 2개의 반복실험을 포함하고, 각각의 반복실험은 표시된 순서로 세포당 5,000개의 바이러스 입자 및 세포당 2,000개의 바이러스 입자로 분석의 결과를 포함한다. 데이터는 상대 감염 효율을 나타낸다.
도 3은 표시된 아데노바이러스 혈청형에 의한 세포의 감염 후 3시간에 공여자 1로부터의 CD34+ 세포의 항-헥손 염색의 결과를 보여주는 차트이다. 세포를 세포당 2,000개의 바이러스 입자로 감염시켰다. 각각의 시험된 혈청형에 대해, 차트는 데이터의 2개의 반복실험을 포함한다. 데이터는 감염 효율을 나타낸다.
도 4는 표시된 아데노바이러스 혈청형에 의한 세포의 감염 후 6시간에 공여자 1로부터의 CD34+ 세포의 항-헥손 염색의 결과를 보여주는 차트이다. 세포를 세포당 2,000개의 바이러스 입자로 감염시켰다. 각각의 시험된 혈청형에 대해, 차트는 데이터의 2개의 반복실험을 포함한다. 데이터는 감염 효율을 나타낸다.
도 5는 표시된 아데노바이러스 혈청형에 의한 세포의 감염 후 3시간에 공여자 1로부터의 CD34+ 세포의 항-헥손 염색의 결과를 보여주는 차트이다. 세포를 세포당 5,000개의 바이러스 입자로 감염시켰다. 각각의 시험된 혈청형에 대해, 차트는 데이터의 2개의 반복실험을 포함한다. 데이터는 감염 효율을 나타낸다.
도 6은 표시된 아데노바이러스 혈청형에 의한 세포의 감염 후 6시간에 공여자 1로부터의 CD34+ 세포의 항-헥손 염색의 결과를 보여주는 차트이다. 세포를 세포당 5,000개의 바이러스 입자로 감염시켰다. 각각의 시험된 혈청형에 대해, 차트는 데이터의 2개의 반복실험을 포함한다. 데이터는 감염 효율을 나타낸다.
도 7은 표시된 아데노바이러스 혈청형에 의한 세포의 감염 후 3시간에 공여자 2로부터의 CD34+ 세포의 항-헥손 염색의 결과를 보여주는 차트이다. 세포를 세포당 2,000개의 바이러스 입자로 감염시켰다. 각각의 시험된 혈청형에 대해, 차트는 데이터의 2개의 반복실험을 포함한다. 데이터는 감염 효율을 나타낸다. 혈청형 F35의 2개의 반복실험 제제를 시험하였다. GLN은 표시된 아데노바이러스 벡터가 GFP 발광 리포터를 암호화하는 발현 카세트를 포함한다는 것을 나타낸다.
도 8은 표시된 아데노바이러스 혈청형에 의한 세포의 감염 후 6시간에 공여자 2로부터의 CD34+ 세포의 항-헥손 염색의 결과를 보여주는 차트이다. 세포를 세포당 2,000개의 바이러스 입자로 감염시켰다. 각각의 시험된 혈청형에 대해, 차트는 데이터의 3개의 반복실험을 포함한다. 데이터는 감염 효율을 나타낸다.
도 9는 표시된 아데노바이러스 혈청형에 의한 세포의 감염 후 3시간에 공여자 2로부터의 CD34+ 세포의 항-헥손 염색의 결과를 보여주는 차트이다. 세포를 세포당 5,000개의 바이러스 입자로 감염시켰다. 각각의 시험된 혈청형에 대해, 차트는 데이터의 3개의 반복실험을 포함한다. 데이터는 감염 효율을 나타낸다.
도 10은 표시된 아데노바이러스 혈청형에 의한 세포의 감염 후 6시간에 공여자 2로부터의 CD34+ 세포의 항-헥손 염색의 결과를 보여주는 차트이다. 세포를 세포당 5,000개의 바이러스 입자로 감염시켰다. 각각의 시험된 혈청형에 대해, 차트는 데이터의 3개의 반복실험을 포함한다. 데이터는 감염 효율을 나타낸다.
도 11은 표시된 아데노바이러스 혈청형에 의한 세포의 감염 후 3시간에 공여자 3으로부터의 CD34+ 세포의 항-헥손 염색의 결과를 보여주는 차트이다. 세포를 세포당 2,000개의 바이러스 입자로 감염시켰다. 각각의 시험된 혈청형에 대해, 차트는 데이터의 3개의 반복실험을 포함한다. 데이터는 감염 효율을 나타낸다.
도 12는 표시된 아데노바이러스 혈청형에 의한 세포의 감염 후 6시간에 공여자 3으로부터의 CD34+ 세포의 항-헥손 염색의 결과를 보여주는 차트이다. 세포를 세포당 2,000개의 바이러스 입자로 감염시켰다. 각각의 시험된 혈청형에 대해, 차트는 데이터의 2개 또는 3개의 반복실험을 포함한다. 데이터는 감염 효율을 나타낸다.
도 13은 표시된 아데노바이러스 혈청형에 의한 세포의 감염 후 3시간 또는 6시간에 공여자 3으로부터의 CD34+ 세포의 항-헥손 염색의 결과를 보여주는 차트이다. 세포를 세포당 5,000개의 바이러스 입자로 감염시켰다. 각각의 시험된 혈청형에 대해, 차트는 데이터의 2개의 반복실험을 포함하고, 각각의 반복실험은 표시된 순서로 감염 후 3시간 및 6시간에 분석의 결과를 포함한다. 데이터는 감염 효율을 나타낸다.
도 14는 표시된 아데노바이러스 혈청형에 의한 세포의 감염 후 3시간에 공여자 1로부터의 CD34+ 세포에서의 아데노바이러스 DNA의 qPCR 분석의 결과를 보여주는 차트이다. 세포를 세포당 2,000개의 바이러스 입자로 감염시켰다. 각각의 시험된 혈청형에 대해, 차트는 데이터의 2개의 반복실험을 포함한다. 오차 막대는 기술적 반복실험을 나타낸다. 데이터는 상대 감염 효율을 나타낸다.
도 15는 표시된 아데노바이러스 혈청형에 의한 세포의 감염 후 6시간에 공여자 1로부터의 CD34+ 세포에서의 아데노바이러스 DNA의 qPCR 분석의 결과를 보여주는 차트이다. 세포를 세포당 2,000개의 바이러스 입자로 감염시켰다. 각각의 시험된 혈청형에 대해, 차트는 데이터의 2개의 반복실험을 포함한다. 데이터는 상대 감염 효율을 나타낸다.
도 16은 표시된 아데노바이러스 혈청형에 의한 세포의 감염 후 3시간에 공여자 1로부터의 CD34+ 세포에서의 아데노바이러스 DNA의 qPCR 분석의 결과를 보여주는 차트이다. 세포를 세포당 5,000개의 바이러스 입자로 감염시켰다. 각각의 시험된 혈청형에 대해, 차트는 데이터의 2개의 반복실험을 포함한다. 오차 막대는 기술적 반복실험을 나타낸다. 데이터는 상대 감염 효율을 나타낸다.
도 17은 표시된 아데노바이러스 혈청형에 의한 세포의 감염 후 6시간에 공여자 1로부터의 CD34+ 세포에서의 아데노바이러스 DNA의 qPCR 분석의 결과를 보여주는 차트이다. 세포를 세포당 5,000개의 바이러스 입자로 감염시켰다. 각각의 시험된 혈청형에 대해, 차트는 데이터의 2개의 반복실험을 포함한다. 데이터는 상대 감염 효율을 나타낸다.
도 18은 표시된 아데노바이러스 혈청형에 의한 세포의 감염 후 3시간에 공여자 2로부터의 CD34+ 세포에서의 아데노바이러스 DNA의 qPCR 분석의 결과를 보여주는 차트이다. 세포를 세포당 2,000개의 바이러스 입자로 감염시켰다. 각각의 시험된 혈청형에 대해, 차트는 데이터의 2개의 반복실험을 포함한다. 오차 막대는 기술적 반복실험을 나타낸다. 데이터는 상대 감염 효율을 나타낸다.
도 19는 표시된 아데노바이러스 혈청형에 의한 세포의 감염 후 6시간에 공여자 2로부터의 CD34+ 세포에서의 아데노바이러스 DNA의 qPCR 분석의 결과를 보여주는 차트이다. 세포를 세포당 2,000개의 바이러스 입자로 감염시켰다. 각각의 시험된 혈청형에 대해, 차트는 데이터의 3개의 반복실험을 포함한다. 오차 막대는 기술적 반복실험을 나타낸다. 데이터는 상대 감염 효율을 나타낸다.
도 20은 표시된 아데노바이러스 혈청형에 의한 세포의 감염 후 3시간에 공여자 2로부터의 CD34+ 세포에서의 아데노바이러스 DNA의 qPCR 분석의 결과를 보여주는 차트이다. 세포를 세포당 5,000개의 바이러스 입자로 감염시켰다. 각각의 시험된 혈청형에 대해, 차트는 데이터의 3개의 반복실험을 포함한다. 오차 막대는 기술적 반복실험을 나타낸다. 데이터는 상대 감염 효율을 나타낸다.
도 21은 표시된 아데노바이러스 혈청형에 의한 세포의 감염 후 6시간에 공여자 2로부터의 CD34+ 세포에서의 아데노바이러스 DNA의 qPCR 분석의 결과를 보여주는 차트이다. 세포를 세포당 5,000개의 바이러스 입자로 감염시켰다. 각각의 시험된 혈청형에 대해, 차트는 데이터의 3개의 반복실험을 포함한다. 오차 막대는 기술적 반복실험을 나타낸다. 데이터는 상대 감염 효율을 나타낸다.
도 22는 표시된 아데노바이러스 혈청형에 의한 세포의 감염 후 3시간에 공여자 3으로부터의 CD34+ 세포에서의 아데노바이러스 DNA의 qPCR 분석의 결과를 보여주는 차트이다. 세포를 세포당 2,000개의 바이러스 입자로 감염시켰다. 각각의 시험된 혈청형에 대해, 차트는 데이터의 3개의 반복실험을 포함한다. 오차 막대는 기술적 반복실험을 나타낸다. 데이터는 상대 감염 효율을 나타낸다.
도 23은 표시된 아데노바이러스 혈청형에 의한 세포의 감염 후 6시간에 공여자 3으로부터의 CD34+ 세포에서의 아데노바이러스 DNA의 qPCR 분석의 결과를 보여주는 차트이다. 세포를 세포당 2,000개의 바이러스 입자로 감염시켰다. 각각의 시험된 혈청형에 대해, 차트는 데이터의 2개 또는 3개의 반복실험을 포함한다. 오차 막대는 기술적 반복실험을 나타낸다. 데이터는 상대 감염 효율을 나타낸다.
도 24는 표시된 아데노바이러스 혈청형에 의한 세포의 감염 후 3시간 또는 6시간에 공여자 2로부터의 CD34+ 세포에서의 아데노바이러스 DNA의 qPCR 분석의 결과를 보여주는 차트이다. 세포를 세포당 5,000개의 바이러스 입자로 감염시켰다. 각각의 시험된 혈청형에 대해, 차트는 데이터의 2개의 반복실험을 포함하고, 각각의 반복실험은 표시된 순서로 감염 후 3시간 및 6시간에 분석의 결과를 포함한다. 오차 막대는 기술적 반복실험을 나타낸다. 데이터는 상대 감염 효율을 나타낸다.
도 25는 혈청형 Ad11의 제1 세대 아데노바이러스 게놈을 포함하는 플라스미드로 형질주입된 HEK293 세포로부터 제조된 Ad 조제물로부터 얻은 혈청형 Ad11의 제1 세대 아데노바이러스 게놈의 분해를 보여주는 겔의 영상이다. 도면에 포함된 표에 표시된 것과 같이, 정제된 아데노바이러스 게놈을 BspHI(레인 3) 또는 SmaI(레인 5) 중 어느 하나로 분해하는 한편, 모 플라스미드를 또한 비교를 위해 분해하였다(각각 레인 2 및 레인 4). Ad 게놈 및 플라스미드의 서열에 기초한 예측된 분해 단편의 표시가 또한 도시되어 있다.
도 26은 혈청형 Ad34의 제1 세대 아데노바이러스 게놈을 포함하는 플라스미드로 형질주입된 HEK293 세포로부터 제조된 Ad 조제물로부터 얻은 혈청형 Ad34의 제1 세대 아데노바이러스 게놈의 분해를 보여주는 겔의 영상이다. 도면에 포함된 표에 표시된 것과 같이, 정제된 아데노바이러스 게놈을 SmaI(레인 2) 또는 SspI(레인 3) 중 어느 하나로 분해하였다. Ad 게놈의 서열에 기초한 예측된 분해 단편의 표시가 또한 도시되어 있다.
도 27은 제1 세대 Ad35++ 게놈을 포함하는 플라스미드로 형질주입된 HEK293 세포로부터 제조된 Ad 조제물로부터 얻은 제1 세대 Ad35++ 게놈의 분해를 보여주는 겔의 영상이다. 도면에 포함된 표에 표시된 것과 같이, 정제된 아데노바이러스 게놈을 BspHI(레인 2)로 분해하는 한편, 모 플라스미드를 또한 비교를 위해 분해하였다(레인 3). Ad 게놈 및 플라스미드의 서열에 기초한 예측된 분해 단편의 표시가 또한 도시되어 있다. *은 반복된 샘플을 갖는 레인을 나타낸다.
도 28은 제1 세대 Ad35++ 게놈을 포함하는 플라스미드로 형질주입된 HEK293 세포로부터 제조된 Ad 조제물로부터 얻은 제1 세대 Ad35++ 게놈의 분해를 보여주는 겔의 영상이다. 겔 표지된 관찰된 #1을 큰 DNA 단편을 해상하기 위해 더 긴 기간 동안 전기영동하는 반면, 겔 표지된 관찰된 #2를 더 짧은 DNA 단편을 해상하기 위해 더 짧은 기간 동안 전기영동하였다. 도면에 포함된 표에 표시된 것과 같이, 정제된 아데노바이러스 게놈을 SmaI(레인 2)로 분해하는 한편, 모 플라스미드를 또한 비교를 위해 분해하였다(레인 3). Ad 게놈 및 플라스미드의 서열에 기초한 예측된 분해 단편의 표시가 또한 도시되어 있다.
도 29는 표시된 아데노바이러스 혈청형의 제1 세대 아데노바이러스 벡터에 의한 세포의 감염 후 25시간에 HEK293 세포의 GFP 분석의 결과를 보여주는 차트이다. 세포를 세포당 100개, 200개, 500개 및 1,000개의 바이러스 입자로 감염시켰다. 데이터는 감염 효율을 나타낸다. NTC는 비처리된 대조군을 나타낸다.
도 30은 표시된 아데노바이러스 혈청형의 제1 세대 아데노바이러스 벡터에 의한 세포의 감염 후 24시간에 HEK293 세포의 GFP 분석의 결과를 보여주는 차트이다. 세포를 세포당 100개, 200개, 500개, 1,000개 및 2,000개의 바이러스 입자로 감염시켰다. 데이터는 감염 효율을 나타낸다.
도 31은 표시된 아데노바이러스 혈청형의 제1 세대 아데노바이러스 벡터에 의한 세포의 감염 후 24시간에 K562 세포의 GFP 분석의 결과를 보여주는 차트이다. 세포를 세포당 100개, 200개, 500개, 1,000개 및 2,000개의 바이러스 입자로 감염시켰다. 데이터는 감염 효율을 나타낸다.
도 32는 표시된 아데노바이러스 혈청형의 제1 세대 아데노바이러스 벡터에 의한 세포의 감염 후 48시간에 공여자 2로부터의 CD34+ 세포의 GFP 분석의 결과를 보여주는 차트이다. 세포를 세포당 500개, 2,000개 및 5,000개의 바이러스 입자로 감염시켰다. 세포당 2,000개 및 5,000개의 바이러스 입자를 사용하는 조건에 대해, 차트는 데이터의 2개의 반복실험을 포함한다. 데이터는 감염 효율을 나타낸다.
도 33은 유세포 분석법을 사용한 분석 CD34+ 및 CD34+/CD90+ 집단에 대해 사용된 게이팅을 도시한다. 정제된 CD34+ 세포를 항-CD34 및 항-CD90 항체로 염색하고, 형질도입 효율을 CD34+고/CD90+ 세포에서 측정하였다. 박스는 세포의 집단을 정의하기 위해 사용된 게이트를 나타낸다. 하나의 선도로부터 또 다른 선도로의 화살표는 제1 선도에서의 게이팅된 집단이 제2 선도에서 디스플레이된다는 것을 나타낸다. 백분율은 각각의 표시된 게이트에 의해 함유된 세포의 퍼센트를 나타낸다. 이 도면에 도시된 데이터는 세포당 5,000개의 바이러스 입자에서의 혈청형 Ad34의 제1 세대 아데노바이러스 벡터에 의한 세포의 감염 후 46시간에 공여자 1로부터의 CD34+ 세포에 상응한다.
도 34는 표시된 아데노바이러스 혈청형의 제1 세대 아데노바이러스 벡터에 의한 세포의 감염 후 46시간에 공여자 1로부터의 CD34+ 세포 및 CD34+/CD90+ 세포의 GFP 분석의 결과를 보여주는 차트이다. GFP 양성인 세포의 백분율이 도시되어 있다. 세포를 세포당 2,000개 및 5,000개의 바이러스 입자로 감염시켰다. 데이터는 감염 효율을 나타낸다. *은 표시된 조건에 대해 수집된 데이터의 부재를 나타낸다.
도 35는 표시된 아데노바이러스 혈청형의 제1 세대 아데노바이러스 벡터에 의한 세포의 감염 후 46시간에 공여자 3으로부터의 CD34+ 세포 및 CD34+/CD90+ 세포의 GFP 분석의 결과를 보여주는 차트이다. GFP 양성인 세포의 백분율이 도시되어 있다. 세포를 세포당 500개, 2,000개 및 5,000개의 바이러스 입자로 감염시켰다. 데이터는 감염 효율을 나타낸다.
도 36은 표시된 아데노바이러스 혈청형의 제1 세대 아데노바이러스 벡터에 의한 세포의 감염 후 46시간에 공여자 1로부터의 CD34+ 세포 및 CD34+/CD90+ 세포의 GFP 분석의 결과를 보여주는 차트이다. GFP 양성 세포에 대한 GFP의 기하 평균 형광 강도(MFI)가 도시되어 있다. 세포를 세포당 2,000개 및 5,000개의 바이러스 입자로 감염시켰다. 데이터는 감염 효율을 나타낸다. *은 표시된 조건에 대해 수집된 데이터의 부재를 나타낸다.
도 37은 표시된 아데노바이러스 혈청형의 제1 세대 아데노바이러스 벡터에 의한 세포의 감염 후 46시간에 공여자 3으로부터의 CD34+ 세포 및 CD34+/CD90+ 세포의 GFP 분석의 결과를 보여주는 차트이다. GFP 양성 세포에 대한 GFP의 기하 평균 형광 강도(MFI)가 도시되어 있다. 세포를 세포당 500개, 2,000개 및 5,000개의 바이러스 입자로 감염시켰다. 데이터는 감염 효율을 나타낸다.
도 38은 표시된 아데노바이러스 혈청형에 의한 세포의 감염 후 3시간에 HEK293 세포에서의 아데노바이러스 DNA의 qPCR 분석의 결과를 보여주는 차트이다. 세포를 세포당 100개 및 500개의 바이러스 입자로 감염시켰다. 데이터는 상대 감염 효율을 나타낸다.
도 39는 표시된 아데노바이러스 혈청형에 의한 세포의 감염 후 3시간에 공여자 2로부터의 CD34+ 세포에서의 아데노바이러스 DNA의 qPCR 분석의 결과를 보여주는 차트이다. 세포를 세포당 500개, 2,000개 및 5,000개의 바이러스 입자로 감염시켰다. 세포당 2,000개 및 5,000개의 바이러스 입자를 사용하는 조건에 대해, 차트는 데이터의 2개의 반복실험을 포함한다. 데이터는 상대 감염 효율을 나타낸다.
도 40은 공중에게 이용 가능한 서열 수탁 번호에 상응하는 핵산 서열 및 아미노산 서열의 목록이고, 소정의 서열 및/또는 서열 수탁 번호는 본 개시내용에서 전체로 및/또는 부분적으로 포함되고/되거나 사용되고 그리고/또는 소정의 서열 및/또는 서열 수탁 번호는 본원에 참고로 포함된다.
본 개시내용은 HSC를 표적화하는 유전자 치료에 유리한 아데노바이러스 벡터를 포함하는 방법 및 조성물을 제공한다. 본 개시내용의 방법 및 조성물은 적어도 부분적으로 혈청형 3, 7, 11, 14, 16, 21, 34, 37 및 50의 아데노바이러스 벡터가 적어도 하나 이상의 기준 아데노바이러스 벡터(예를 들면, Ad5 벡터 또는 Ad5/35 벡터)와 비교하여 HSC를 표적화하는 유전자 치료에 대한 소정의 유리한 특성을 나타낸다는 관찰에 기초한다. 아데노바이러스(또는, 상호교환 가능하게, "아데노바이러스") 벡터는 하나 이상의 아데노바이러스 단백질 서열을 특징으로 하는 바이러스 입자를 포함하고, 선택적으로 아데노바이러스 게놈을 포함한다. 아데노바이러스 게놈은 (a) 핵산 서열(조건적 패키징을 포함)을 아데노바이러스 벡터로 지지 패키징하고, (b) 암호화 서열을 발현하기에 충분한 아데노바이러스 서열을 포함하는 핵산 서열을 포함한다. 아데노바이러스 게놈은 선형, 이중 가닥 DNA 서열 및/또는 분자일 수 있다. 당업자가 이해하는 것처럼, 선형 게놈, 예컨대 아데노바이러스 게놈은 예를 들면 바이러스 제조 목적을 위해 원형 플라스미드에 존재할 수 있다. 천연 아데노바이러스 게놈은 혈청형에 따라 26 kb 내지 45 kb 길이의 범위이다.
본 개시내용은 조작된 아데노바이러스 벡터 및 아데노바이러스 게놈을 포함하는 방법 및 조성물을 포함한다. 아데노바이러스 벡터는 조작된 아데노바이러스 단백질 또는 조작된 아데노바이러스 게놈을 포함하는 조작된 아데노바이러스 벡터를 포함한다. 조작된 아데노바이러스 게놈은 예를 들면 기준 서열과 비교하여 아데노바이러스 게놈 서열을 첨가하거나 제거하도록 조작될 수 있다.
아데노바이러스 중에는, 57개의 알려진 인간 혈청형이 있다. 하나의 특히 아데노바이러스 혈청형 5(Ad5)는 유전자 치료 조사 및 아데노바이러스 벡터 작제물에 역사적으로 광범위하게 사용되었다. 섬유가 Ad5 섬유 꼬리, Ad35 섬유 샤프트 및 Ad35 섬유 매듭을 포함한다는 점에서 이것이 키메라인 것을 제외하고는 Ad5 캡시드 단백질을 포함하는 HDAd5/35 벡터를 사용하여 소정의 조사가 수행되었고(예를 들면, Shayakhmetov 등 2000 J. Virol 74(6):2567-2583 참조), 선택적으로 Ad35 섬유 매듭은 CD46(예를 들면, Ad5/35++)에 대한 증가된 친화도를 위해 돌연변이된다. 특정한 실시형태에서, Ad5/35++ 벡터는 돌연변이체 Ad35++ 섬유 매듭을 갖는 키메라 Ad5/35 벡터이다(예를 들면, 특히 섬유 매듭 돌연변이와 관련하여 본원에 그 전문이 참고로 포함된 Wang 등 2008 J. Virol. 82(21):10567-79 참조). 다양한 실시형태에서, Ad35++ 돌연변이체 섬유 매듭은 예를 들면 Ad35++ 돌연변이체 섬유 매듭이 예를 들면 더 낮은 감염 다중도(MOI)에서 세포 형질도입 효율을 증가시키도록 예를 들면 25배만큼 CD46에 대한 친화도를 증가시키도록 돌연변이된 Ad35 섬유 매듭이다(Li and Lieber, FEBS Letters, 593(24): 3623-3648, 2019). 특정 실시형태에서, 아데노바이러스 벡터는 섬유가 Ad5 섬유 꼬리, Ad35 섬유 샤프트 및 Ad35 섬유 매듭을 포함한다는 점에서 이것이 키메라인 것을 제외하고는 모든 단백질이 Ad5 단백질인 키메라 "F35" 벡터이고(예를 들면, Shayakhmetov 2000 J Virol. 74(6): 2567-2583에 기재된 것과 같음), Ad35 섬유 매듭은 CD46에 대한 친화도를 증가시키는 돌연변이 D207G 및 T245A를 포함하는 돌연변이체 Ad35 섬유 매듭이고(예를 들면, Wang 2008 J Virol. 82(21):10567-79 참조), 선택적으로 Ad5/35 벡터를 암호화하는 게놈은 E1 결실을 포함한다. 그러나, 대부분의 인간은 Ad5 캡시드를 포함하는 아데노바이러스 벡터, 예컨대 HDAd5/35 벡터에 의한 생체내 형질도입을 차단할 수 있는 Ad5 캡시드 단백질에 대항한 중화 혈청 항체를 갖는다. Ad5 캡시드 단백질에 대항한 중화 혈청 항체의 존재가 Ad5 캡시드를 포함하는 아데노바이러스 벡터의 치료 가치를 무효화하지 않지만, Ad5 캡시드를 포함하지 않는 아데노바이러스 벡터는 추가 이익을 제공할 것이다. 이 이익에 대한 적어도 하나의 이유는 Ad5 벡터가 Ad5 캡시드 단백질에 대항한 혈청 항체를 갖는 대상체에서 임상적으로 유의미한 면역 반응을 야기할 수 있다는 것이고(예를 들면, Somanathan 등 2020 Mol. Ther. 28(3): 784-793 참조), Ad5 캡시드 단백질은 없는 혈청형은 이러한 면역 반응을 덜 야기할 수 있을 것이다. 적어도 두번째의 이유는 Ad5 캡시드 단백질에 대항한 중화 혈청 항체가 벡터 입자를 불활화함으로써 Ad5 유전자 치료 벡터의 치료 효능을 감소시킬 수 있다는 것이고, Ad5 캡시드 단백질이 없는 혈청형은 덜 불활화될 수 있을 것이다.
본 개시내용은 기준 아데노바이러스 혈청형, 예를 들면 Ad5 및/또는 Ad5/35와 비교하여 다양한 실시형태에서 HSC의 증가된 감염을 포함하는 표적 HSC의 감염을 나타내고, 따라서 HSC의 형질도입을 위한 아데노바이러스 벡터의 제조에 유용한 아데노바이러스 혈청형을 포함한다. 본 개시내용의 방법 및 조성물은 혈청형 3, 7, 11, 14, 16, 21, 34, 37 및 50의 아데노바이러스 벡터를 포함하였다.
I. 유전자 치료 벡터
1(A). 아데노바이러스 벡터
본 개시내용은 유전자 치료에 유용한 아데노바이러스 벡터 및 아데노바이러스 게놈를 포함한다. 아데노바이러스는 큰 이십면체 형상의 비봉입된 바이러스이다. 천연 아데노바이러스 캡시드는 섬유, 펜톤 및 헥손의 단백질의 3가지 유형을 포함한다. 헥손은 대부분의 바이러스 캡시드를 구성하여서, 20개의 삼각형 면을 형성한다. 펜톤 염기는 캡시드의 12개의 정점의 각각에 배치되고, 섬유(매듭 섬유로도 지칭됨)는 각각의 펜톤 염기로부터 돌출한다. 펜톤 및 섬유 및 특히 섬유 매듭은 캡시드의 숙주 세포에 대한 부착을 수월하게 하므로 수용체 결합 및 내재화에서 특히 중요하다.
아데노바이러스 게놈은 바이러스 게놈 복제 및 패키징에 기여하거나 이것에 필요한 시스 요소인 것으로 이해되는 혈청형 특이적 도립 말단 반복부(ITR: inverted terminal repea)에 의해 양 말단에서 플랭킹된 아데노바이러스 DNA를 포함한다. 혈청형에 따라, ITR은 대략 100개 내지 200개의 염기 쌍(예를 들면, 약 160개의 염기 쌍) 길이일 수 있고, 아데노바이러스 게놈 말단에 가장 가까운 뉴클레오타이드 위치(예를 들면, 약 50개의 염기 쌍)에서 보존이 가장 높다. 아데노바이러스 게놈은 또한 바이러스 게놈의 바이러스 벡터로의 패키징을 수월하게 할 수 있는 패키징 서열(예를 들면, 조건적 패키징 서열 또는 비조건적 패키징 서열)을 포함한다. 패키징 서열은 게놈의 왼쪽 부분에 위치한다.
천연 아데노바이러스 게놈은 아데노바이러스 벡터의 구조적 단백질 성분을 암호화하는 초기 전사 단위, E1, E2, E3 및 E4 및 후기 전사 단위를 포함하는 몇몇 단백질을 암호화한다. 초기(E) 전사 및 후기(L) 전사는 바이러스 게놈 복제의 시작에 의해 나눠진다. E1 영역(E1A 및 E1B)은 바이러스 게놈의 전사의 조절을 담당하는 단백질을 암호화한다. E2 영역(E2A 및 E2B)의 발현은 바이러스 게놈 복제를 위한 단백질의 합성을 발생시킨다. 이 단백질은 DNA 복제, 후기 유전자 발현 및 숙주 세포 셧 오프에 관여된다. 대부분의 바이러스 캡시드 단백질을 포함하는 후기 유전자의 산물은 주요 후기 프로모터(MLP)에 의해 제기된 단일 1차 전사체의 상당한 가공 후 오직 발현된다. MLP는 감염의 후기 단계 동안 특히 효과적이다. 이 프로모터를 사용하여 전사된 mRNA는 번역을 수월하게 하는 5'-3부분 리더(TPL) 서열을 포함할 수 있다.
1(B). Ad3, 7, 11, 14, 16, 21, 34, 37 및 50 유전자 치료 벡터
본 개시내용은 Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 게놈을 포함한다. 다양한 실시형태에서, Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 게놈은 Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 벡터의 ITR(예를 들면, 서열 번호 1, 17, 33, 49, 65, 81, 97, 113 또는 129에 따른 5' ITR 및 서열 번호 2, 18, 34, 50, 66, 82, 98, 114 또는 130에 따른 3' ITR) 또는 개별적으로 및/또는 함께 이에 대한 적어도 75%의 서열 동일성(예를 들면, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%의 동일성)을 갖는 ITR을 포함하는 단일 가닥 또는 이중 가닥 DNA 서열이다. 다양한 실시형태에서, Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 게놈은 Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 벡터의 패키징 서열(예를 들면, 서열 번호 3, 19, 35, 51, 67, 83, 99, 115 또는 131에 따른 패키징 서열) 또는 이에 대한 적어도 75%의 서열 동일성(예를 들면, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%의 동일성)을 갖는 패키징 서열을 포함하는 단일 가닥 또는 이중 가닥 DNA 서열이다. 다양한 실시형태에서, Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 게놈은 기준 Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 게놈(예를 들면, 서열 번호 145, 146, 147, 148, 149, 150, 151, 152 또는 153)의 전부, 일부 또는 인접한 상응하는 부분 또는 비인접한 상응하는 부분과 적어도 75%의 서열 동일성(예를 들면, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%의 동일성)을 갖는 서열을 포함하는 단일 가닥 또는 이중 가닥 DNA 서열이다.
다양한 실시형태에서, Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 게놈은 Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 벡터의 ITR(예를 들면, 서열 번호 1, 17, 33, 49, 65, 81, 97, 113 또는 129에 따른 5' ITR 및 서열 번호 2, 18, 34, 50, 66, 82, 98, 114 또는 130에 따른 3' ITR) 또는 개별적으로 및/또는 함께 이에 대한 적어도 75%의 서열 동일성(예를 들면, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%의 동일성)을 갖는 ITR을 적어도 포함하는 임의의 뉴클레오타이드 서열이다. 다양한 실시형태에서, Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 게놈은 하나 이상의 뉴클레오타이드, 암호화 서열 및/또는 유전자가 기준 서열과 비교하여 완전히 또는 부분적으로 결실된 Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 게놈이다. 예를 들면, 일부 실시형태에서, Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 게놈은 E1, E2, E3 및 E4 중 하나 이상을 포함하지 않는 게놈일 수 있다. 특정 실시형태에서, Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 게놈은 Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 게놈의 임의의 암호화 서열을 포함하지 않는 게놈이다(예를 들면, Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 게놈 ITR과 적어도 75%의 서열 동일성을 갖는 ITR을 포함하지만 기준 Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 게놈에 존재하는 암호화 서열 중 어느 것도 포함하지 않는 "가틀리스(gutless)" 벡터).
다양한 실시형태에서, Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 게놈은 서열 번호 4, 20, 36, 52, 68, 84, 100, 116 또는 132에 따른 E1 서열 또는 이에 대한 적어도 75%의 서열 동일성(예를 들면, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%의 동일성)을 갖는 서열을 포함하거나, 포함하지 않거나, 이의 전부 또는 일부의 결실을 포함한다.
다양한 실시형태에서, Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 게놈은 서열 번호 5, 21, 37, 53, 69, 85, 101, 117 또는 133에 따른 E2 서열 또는 이에 대한 적어도 75%의 서열 동일성(예를 들면, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%의 동일성)을 갖는 서열을 포함하거나, 포함하지 않거나, 이의 전부 또는 일부의 결실을 포함한다.
다양한 실시형태에서, Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 게놈은 서열 번호 4 6, 22, 38, 54, 70, 86, 102, 118 또는 134에 따른 E3 서열 또는 이에 대한 적어도 75%의 서열 동일성(예를 들면, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%의 동일성)을 갖는 서열을 포함하거나, 포함하지 않거나, 이의 전부 또는 일부의 결실을 포함한다.
다양한 실시형태에서, Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 게놈은 섬유를 암호화하는 서열을 포함하거나 포함하지 않고, 서열은 서열 번호 7, 23, 39, 55, 71, 87, 103, 119 또는 135와 적어도 75%의 서열 동일성(예를 들면, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%의 동일성)을 갖는다.
다양한 실시형태에서, Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 게놈은 섬유 샤프트를 암호화하는 서열을 포함하거나 포함하지 않고, 서열은 서열 번호 8, 24, 40, 56, 72, 88, 104, 120 또는 136과 적어도 75%의 서열 동일성(예를 들면, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%의 동일성)을 갖는다.
다양한 실시형태에서, Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 게놈은 섬유 매듭을 암호화하는 서열을 포함하거나 포함하지 않고, 서열은 서열 번호 9, 25, 41, 57, 73, 89, 105, 121 또는 137과 적어도 75%의 서열 동일성(예를 들면, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%의 동일성)을 갖는다.
다양한 실시형태에서, Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 게놈은 섬유 꼬리를 암호화하는 서열을 포함하거나 포함하지 않고, 서열은 서열 번호 7, 23, 39, 55, 71, 87, 103, 119 또는 135의 섬유 꼬리(예를 들면, 섬유 샤프트를 암호화하는 서열의 5'인 모든 뉴클레오타이드를 포함하고/하거나 섬유 샤프트에 대한 섬유 N 말단의 부분을 암호화하는 모든 뉴클레오타이드를 포함하는 섬유 서열의 부분)와 적어도 75%의 서열 동일성(예를 들면, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%의 동일성)을 갖는다.
다양한 실시형태에서, Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 게놈은 펜톤을 암호화하는 서열을 포함하거나 포함하지 않고, 서열은 서열 번호 10, 26, 42, 58, 74, 90, 106, 122 또는 138과 적어도 75%의 서열 동일성(예를 들면, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%의 동일성)을 갖는다.
다양한 실시형태에서, Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 게놈은 헥손을 암호화하는 서열을 포함하거나 포함하지 않고, 서열은 서열 번호 11, 27, 43, 59, 75, 91, 107, 123 또는 139와 적어도 75%의 서열 동일성(예를 들면, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%의 동일성)을 갖는다.
본 개시내용은 Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 섬유(예를 들면, 서열 번호 12, 28, 44, 60, 76, 92, 108, 124 또는 140에 따른 섬유)와 적어도 75%의 서열 동일성(예를 들면, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%의 동일성)을 갖는 섬유를 포함하는 Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 벡터를 포함한다.
본 개시내용은 Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 섬유 꼬리(예를 들면, 서열 번호 12, 28, 44, 60, 76, 92, 108, 124 또는 140에 따른 섬유의 섬유 꼬리, 예를 들면 여기서 섬유 꼬리는 섬유 샤프트에 N 말단인 모든 아미노산을 포함하는 섬유의 부분임)와 적어도 75%의 서열 동일성(예를 들면, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%의 동일성)을 갖는 섬유 꼬리를 포함하는 Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 벡터를 포함한다.
본 개시내용은 Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 섬유 샤프트(예를 들면, 서열 번호 13, 29, 45, 61, 77, 93, 109, 125 또는 141에 따른 섬유 샤프트)와 적어도 75%의 서열 동일성(예를 들면, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%의 동일성)을 갖는 섬유 샤프트를 포함하는 Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 벡터를 포함한다.
본 개시내용은 Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 섬유 매듭(예를 들면, 서열 번호 14, 30, 46, 62, 78, 94, 110, 126 또는 142에 따른 섬유 매듭)와 적어도 75%의 서열 동일성(예를 들면, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%의 동일성)을 갖는 섬유 매듭을 포함하는 Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 벡터를 포함한다.
본 개시내용은 Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 펜톤(예를 들면, 서열 번호 15, 31, 47, 63, 79, 95, 111, 127 또는 143에 따른 펜톤)과 적어도 75%의 서열 동일성(예를 들면, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%의 동일성)을 갖는 펜톤을 포함하는 Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 벡터를 포함한다.
본 개시내용은 Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 헥손(예를 들면, 서열 번호 16, 32, 48, 64, 80, 96, 112, 128 또는 144에 따른 헥손)과 적어도 75%의 서열 동일성(예를 들면, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%의 동일성)을 갖는 헥손을 포함하는 Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 벡터를 포함한다.
다양한 실시형태에서, Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 벡터는 Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 섬유(예를 들면, 서열 번호 12, 28, 44, 60, 76, 92, 108, 124 또는 140에 따른 섬유)와 적어도 75%의 서열 동일성(예를 들면, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%의 동일성)을 갖는 섬유를 적어도 포함하는 임의의 아데노바이러스 벡터이다.
다양한 실시형태에서, Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 벡터는 Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 섬유 꼬리(예를 들면, 서열 번호 12, 28, 44, 60, 76, 92, 108, 124 또는 140에 따른 섬유의 섬유 꼬리, 예를 들면 여기서 섬유 꼬리는 섬유 샤프트에 N 말단인 모든 아미노산을 포함하는 섬유의 부분임)와 적어도 75%의 서열 동일성(예를 들면, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%의 동일성)을 갖는 섬유 꼬리를 적어도 포함하는 임의의 아데노바이러스 벡터이다.
다양한 실시형태에서, Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 벡터는 Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 섬유 샤프트(예를 들면, 서열 번호 13, 29, 45, 61, 77, 93, 109, 125 또는 141에 따른 섬유 샤프트)와 적어도 75%의 서열 동일성(예를 들면, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%의 동일성)을 갖는 섬유 샤프트를 적어도 포함하는 임의의 아데노바이러스 벡터이다.
다양한 실시형태에서, Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 벡터는 Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 섬유 매듭(예를 들면, 서열 번호 14, 30, 46, 62, 78, 94, 110, 126 또는 142에 따른 섬유 매듭)와 적어도 75%의 서열 동일성(예를 들면, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%의 동일성)을 갖는 섬유 매듭을 적어도 포함하는 임의의 아데노바이러스 벡터이다.
다양한 실시형태에서, Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 벡터는 Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 펜톤(예를 들면, 서열 번호 15, 31, 47, 63, 79, 95, 111, 127 또는 143에 따른 펜톤)과 적어도 75%의 서열 동일성(예를 들면, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%의 동일성)을 갖는 펜톤을 적어도 포함하는 임의의 아데노바이러스 벡터이다.
다양한 실시형태에서, Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 벡터는 Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 헥손(예를 들면, 서열 번호 16, 32, 48, 64, 80, 96, 112, 128, 144에 따른 헥손)과 적어도 75%의 서열 동일성(예를 들면, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%의 동일성)을 갖는 헥손을 적어도 포함하는 임의의 아데노바이러스 벡터이다.
따라서, Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 벡터는 Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 섬유 매듭와 적어도 75%의 서열 동일성(예를 들면, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%의 동일성)을 갖는 섬유 매듭 및 상이한 아데노바이러스 혈청형과 적어도 75%의 서열 동일성(예를 들면, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%의 동일성)을 갖는 적어도 하나의 단백질 또는 이의 일부(예컨대, 섬유 샤프트, 섬유 꼬리, 펜톤 또는 헥손)를 적어도 포함하는 키메라 아데노바이러스 벡터일 수 있다.
Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 벡터는 Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 섬유 샤프트와 적어도 75%의 서열 동일성(예를 들면, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%의 동일성)을 갖는 섬유 샤프트 및 상이한 아데노바이러스 혈청형과 적어도 75%의 서열 동일성(예를 들면, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%의 동일성)을 갖는 적어도 하나의 단백질 또는 이의 일부(예컨대, 섬유 매듭, 섬유 꼬리, 펜톤 또는 헥손)를 적어도 포함하는 키메라 아데노바이러스 벡터일 수 있다.
Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 벡터는 Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 섬유 꼬리와 적어도 75%의 서열 동일성(예를 들면, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%의 동일성)을 갖는 섬유 꼬리 및 상이한 아데노바이러스 혈청형과 적어도 75%의 서열 동일성(예를 들면, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%의 동일성)을 갖는 적어도 하나의 단백질 또는 이의 일부(예컨대, 섬유 매듭, 섬유 샤프트, 펜톤 또는 헥손)를 적어도 포함하는 키메라 아데노바이러스 벡터일 수 있다.
Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 벡터는 Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 펜톤과 적어도 75%의 서열 동일성(예를 들면, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%의 동일성)을 갖는 펜톤 및 상이한 아데노바이러스 혈청형과 적어도 75%의 서열 동일성(예를 들면, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%의 동일성)을 갖는 적어도 하나의 단백질 또는 이의 일부(예컨대, 섬유 매듭, 섬유 샤프트, 섬유 꼬리 또는 헥손)를 적어도 포함하는 키메라 아데노바이러스 벡터일 수 있다.
Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 벡터는 Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 헥손과 적어도 75%의 서열 동일성(예를 들면, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%의 동일성)을 갖는 헥손 및 상이한 아데노바이러스 혈청형과 적어도 75%의 서열 동일성(예를 들면, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%의 동일성)을 갖는 적어도 하나의 단백질 또는 이의 일부(예컨대, 섬유 매듭, 섬유 샤프트, 섬유 꼬리 또는 펜톤)를 적어도 포함하는 키메라 아데노바이러스 벡터일 수 있다.
Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 성분(예를 들면, ITR, 패키징 서열, 유전자 및 단백질)의 예시적인 서열은 하기 표에 제공된다. 바이러스 폴리펩타이드는 바이러스 벡터의 성분 및 예를 들면 섬유, 섬유 매듭, 섬유 샤프트, 섬유 꼬리, 펜톤 또는 헥손을 포함하는 이의 일부 또는 단편인 단백질을 포함한다.
표 1 내지 표 18에 표시된 것과 같이 서열 번호 145, 146, 147, 148, 149, 150, 151, 152 및/또는 153이라 본원에 지칭되는 수탁 서열을 예를 들면 포함하는 본원에 개시된 수탁 번호에 상응하는 다양한 서열은 도 40에서 본원에 제공된다. 당업자는 도 40에 개시된 서열을 포함하는 이러한 서열이 (예를 들면, 수탁 번호에 의해) 전체적으로 또는 (예를 들면, 뉴클레오타이드 위치 및/또는 서열의 뉴클레오타이드 위치 및/또는 수탁 번호의 세트 또는 범위를 참조하여) 부분적으로 언급될 수 있다는 것을 이해할 것이다.
다양한 실시형태에서, Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 벡터 또는 게놈은 수혜자에서 바이러스의 복제를 감소시키고/시키거나 제거하는 변형을 포함한다. 광범위하게는, 수혜자에서 바이러스의 복제를 감소시키고/시키거나 제거하도록 조작된 아데노바이러스 벡터 및 게놈의 3개의 인정된 "세대"가 있다. 본 개시내용의 아데노바이러스 벡터는 임의의 이들 3개의 세대에 따른 벡터를 포함할 수 있다.
다양한 실시형태에서, Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 게놈은 적어도 조절 E1 유전자(E1a 및 E1b)가 Ad 게놈으로부터 제거된다("제1 세대" 벡터 변형)는 점에서 기준 Ad 서열(예를 들면, 관심 있는 혈청형의 아데노바이러스의 하나 이상의 정규, 대표적인, 예시적인 또는 야생형 서열)과 다르다. E1a 및 E1b는 아데노바이러스 복제 주기 동안 생성된 제1 전사 조절 인자이다. E1 결실은 E1에 의해 제어된 소정의 바이러스 유전자의 발현을 감소시키거나 제거하고, E1 결실된 헬퍼 바이러스는 복제 결함이다. 따라서, 제1 세대 Ad 벡터는 수혜자에서의 복제에 대해 결핍된다. 일부 실시형태에서, 제1 세대 아데노바이러스 벡터는 E1 유전자 및 E3 유전자를 제거하도록 조작된다. 기준 게놈의 보유된 부분은 기준 게놈과 서열이 동일할 수 있거나, 기준 게놈과 100% 미만의 동일성, 예를 들면 적어도 99%, 98%, 97%, 96%, 95%, 90%, 85%, 80% 또는 75%의 동일성을 가질 수 있다. 아데노바이러스 벡터는 이들 E1(또는 E1 및 E3) 유전자 없이는 스스로 복제할 수 없고, (예를 들면, 동일한 혈청형의) E1 또는 소정의 바이러스 유전자의 발현을 복원하기에 충분한 또 다른 단백질을 발현하는 포유류 세포주에서 생성될 수 있다. 예시를 위해, E1 결핍 Ad5 벡터가 Ad5 E4orf6을 암호화하는 경우, 헬퍼 벡터는 Ad5 E1을 발현하는 세포주에서 전파될 수 있다. 아데노바이러스 벡터 생성을 위한 하나의 예시적인 세포 유형에서, HEK293 세포는 Ad5 E4 단백질 ORF6과 복합체를 형성하는 것으로 알려진 Ad5 E1b55k를 발현한다.
다양한 실시형태에서, Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 게놈은 적어도 E1 유전자(E1a 및 E1b) 및 비구조적 유전자 E2, E3 및/또는 E4 중 하나 이상이 결실된다는 점에서 기준 Ad 서열("제2 세대" 변형)과 다르다. 제2 세대 Ad는 제1 세대 Ad보다 더 큰 페이로드 용량을 갖고, 제1 세대 바이러스보다 복제에 더 결핍된다. 일부 실시형태에서, 제2 세대 아데노바이러스 벡터는 E1/E3 제거 이외에 비구조적 유전자 E2 및 E4를 제거하도록 조작되어서 용량을 증가시키고 면역원성을 감소시킨다. 기준 게놈의 보유된 부분은 기준 게놈과 서열이 동일할 수 있거나, 기준 게놈과 100% 미만의 동일성, 예를 들면 적어도 99%, 98%, 97%, 96%, 95%, 90%, 85%, 80% 또는 75%의 동일성을 가질 수 있다.
다양한 실시형태에서, Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 게놈은 적어도 이것이 Ad 게놈으로부터의 모든 바이러스 암호화 서열을 제거하고 게놈의 ITR 및 게놈의 패키징 서열 또는 이의 기능적 단편을 오직 보유하도록 조작된다("제3 세대" 변형)는 점에서 기준 Ad 서열과 다르다. 제3 세대 아데노바이러스 벡터는 가틀리스, 고용량 아데노바이러스 벡터 또는 헬퍼 의존적 아데노바이러스 벡터(HdAd)라고도 지칭될 수 있다. 기준 게놈의 보유된 부분은 기준 게놈과 서열이 동일할 수 있거나, 기준 게놈과 100% 미만의 동일성, 예를 들면 적어도 99%, 98%, 97%, 96%, 95%, 90%, 85%, 80% 또는 75%의 동일성을 가질 수 있다.
제3 세대 Ad 게놈이 바이러스 생성에 필요한 단백질을 암호화하지 않으므로, 이것은 헬퍼 의존적이고: 헬퍼 의존적 게놈은 이것이 바이러스 단백질을 트랜스로 제공하는 핵산 서열을 포함하는 세포에 존재하면 벡터로 오직 패키징될 수 있다. 이 헬퍼 의존적 벡터는 또한 제1 세대 및 제2 세대 벡터보다 여전히 더 높은 용량 및 감소된 면역원성을 특징으로 한다. HDAd 벡터가 벡터로서 사용될 때 바이러스 유전자를 발현하지 않으므로, 수혜자에서의 세포독성 또는 인터페론 반응의 위험은 감소된다.
모든 바이러스 암호화 서열을 결여시키도록 조작된 헬퍼 의존적 아데노바이러스 벡터(HDAd)는 매우 다양한 세포 유형을 효과적으로 형질도입할 수 있고, 무시할만한 만성 독성으로 장기간 전이유전자 발현을 매개할 수 있다. 바이러스 암호화 서열을 결실시키고 게놈 복제(ITR) 및 패키징(ψ)에 필요한 시스 작용 요소를 오직 남김으로써, Ad 벡터에 대한 세포 면역 반응은 감소된다. HDAd 벡터는 큰 페이로드의 전달을 허용하는 것까지의 큰 클로닝 용량을 갖는다. 이 페이로드는 전이유전자 발현을 향상시키고 연장하고 조절하기 위해 큰 치료학적 유전자 또는 심지어 다수의 전이유전자 및 큰 조절 성분을 포함할 수 있다. 소정의 HDAd 벡터 게놈이 적어도 최소 총 길이, 예를 들면 적어도 20 kb(예를 들면, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34 또는 35 kb)의 총 길이까지의 최소를 가질 때 게놈이 가장 효과적으로 패키징될 수 있다는 것이 또한 관찰되었고, 그 길이는 예를 들면 치료학적 페이로드 및/또는 "스터퍼" 서열을 포함할 수 있다. 페이로드가 아데노바이러스 게놈이 적어도 표적 길이를 갖게 하는 다수의 뉴클레오타이드를 사용하지 않는 경우, 스터퍼 서열은 표적 길이를 달성하거나 능가하도록 사용될 수 있다. 본 개시내용은 임의의 표적 길이의 충족이 유리할 수 있도록 효과적인 패키징을 위한 최소 길이가 본원에 제공된 벡터의 유리한 사용에 필요하지 않고 본원에 제공된 조성물 및 방법의 사용에 필요하지 않다는 것을 포함한다. 통상적인 HDAd 게놈은 다른 아데노바이러스 벡터와 같이 일반적으로 에피솜으로 남아 있고 숙주 게놈과 통합하지 않는다.
HDAd 벡터가 바이러스 입자를 생성하는 데 필요한 바이러스 단백질을 암호화하지 않으므로, 바이러스 단백질은 트랜스로 제공되고, 예를 들면 HDAd 게놈이 존재하는 세포에서 발현되고/되거나 세포에 의해 발현된다. 일부 HDAd 벡터 시스템에서, 하나의 바이러스 게놈(헬퍼 게놈)은 복제에 필요한 모든 단백질(예를 들면, 모든 구조적 바이러스 단백질)을 암호화하지만 패키징 서열에서 조건적 결함을 가져서, 이것이 소정의 벡터 생성 조건 하에 (예를 들면, 조건적으로 결함인 패키징 서열의 기능을 감소시키는 제제의 존재 하에) 벡터로 덜 패키징되게 만들 것이다. 따라서, HDAd 공여자 바이러스 게놈은 Ad ITR, 페이로드(예를 들면, 치료학적 페이로드) 및 HDAd 공여자 바이러스 게놈이 헬퍼 벡터 게놈으로부터 발현된 구조적 성분으로부터 생성된 HDAd 바이러스 벡터로 선택적으로 패키징되게 하는 기능적 패키징 서열(예를 들면, 야생형 패키징 서열 또는 이의 기능적 단편)을 포함한다(예를 들면, 오직 이들을 포함한다). 바꾸어 말하면, Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 헬퍼 벡터는 Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 공여자 벡터의 생성에 사용될 수 있다. HD Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 벡터의 생성은 HDAd 벡터 게놈 및 구조적 바이러스 단백질 및 비구조적 바이러스 단백질을 제공하는 패키징 결함 헬퍼 바이러스를 함유하는 플라스미드의 동시형질주입을 포함할 수 있다. 헬퍼 바이러스 게놈은 Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 공여자 벡터의 전파를 구제할 수 있고, Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 공여자 벡터는 예를 들면 대규모로 생성되고 단리될 수 있다. 다양한 프로토콜은 당해 분야에 예를 들면 Palmer 등, 2009 Gene Therapy Protocols. Methods in Molecular Biology, Volume 433. Humana Press; Totowa, NJ: 2009. pp. 33-53에서 알려져 있다. 일부 실시형태에서, 헬퍼 게놈은 E1-결핍이다.
일부 HDAd 벡터 시스템에서, 헬퍼 게놈은 조건적 패키징을 위해 재조합효소 시스템(예를 들면, Cre/loxP 시스템)을 사용한다. 소정의 이러한 HDAd 벡터 시스템에서, 헬퍼 게놈은 재조합효소(예를 들면, loxP) 부위에 의해 플랭킹된 패키징 서열 또는 이의 기능적 단편(예를 들면, 패키징에 충분하거나 패키징에 필요하거나 Ad 게놈의 캡시드로의 효과적인 패키징에 필요한 패키징 서열의 단편)를 포함할 수 있어서 상응하는 재조합효소(예를 들면, Cre 재조합효소)와의 접촉은 재조합효소 부위(예를 들면, loxP 부위) 사이의 재조합효소 매개된(예를 들면, Cre 매개된) 부위 특이적 재조합에 의해 헬퍼 게놈으로부터 패키징 서열 또는 이의 기능적 단편을 절제한다. 본 개시내용은, 다른 것들 중에서, 패키징 서열 또는 이의 기능적 단편을 플랭킹하는 2개의 재조합 부위를 포함하는 Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 헬퍼 벡터 및 게놈을 포함하고, 2개의 재조합 부위는 동일한 재조합효소에(즉, 이것에 대해 또는 이에 의해 작용된) 상응하는 부위이다.
다양한 실시형태에서, 헬퍼 게놈은 E1의 결실을 포함할 수 있고, 예를 들면 여기서 E1 발현 산물이 생성자 세포주의 게놈으로부터의 상보성 발현에 의해 공급될 수 있으므로 헬퍼 게놈은 E1을 제외하고 모든 바이러스 유전자를 포함한다. 일부 실시형태에서, 생성자 세포에 존재하는 헬퍼 및 HDAd 공여자 게놈 사이의 상동성 재조합의 결과로서 복제 유능 Ad(RCA)의 생성을 방지하기 위해, "스터퍼(stuffer)" 서열은 E3 영역으로 삽입될 수 있어서 임의의 재조합체가 패키징되고/되거나 효과적으로 패키징되기에 너무 크게 한다.
HDAd 벡터의 생성을 위해, HDAd 공여자 게놈은 헬퍼 벡터의 조건적 패키징 서열의 절제를 위한 재조합효소를 발현하는 세포(예를 들면, Cre 재조합효소를 발현하는 293 세포(HEK293))로 전달될 수 있고, 선택적으로 HDAd 공여자 게놈은 비바이러스 벡터 형태, 예컨대 박테리아 플라스미드 형태로 세포로 전달된다(예를 들면, HDAd 공여자 게놈은 박테리아 플라스미드(pHDAd)에 존재하고/하거나 제한 효소 분해에 의해 방출됨). 동일한 세포는 재조합효소 부위(예를 들면, loxP 부위)에 의해 플랭킹된 패키징 서열 또는 이의 기능적 단편을 포함하는 헬퍼 게놈에 의해 형질도입될 수 있다. 따라서, 생성자 세포는 HDAd 공여자 게놈에 의해 형질주입되고, 재조합효소 부위(예를 들면, loxP 부위)에 의해 플랭킹된 패키징 서열 또는 이의 기능적 단편을 보유하는 헬퍼 게놈에 의해 형질도입될 수 있고, 세포는 재조합효소 부위에 상응하는 재조합효소(예를 들면, Cre)를 발현하여서 패키징 서열 또는 이의 기능적 단편의 절제가 헬퍼 바이러스 게놈이 패키징에 결핍이게(예를 들면, 패키징 불가능하게) 하지만, HDAd 공여자 게놈을 포함하는 HDAd 공여자 벡터의 생성을 위해 모든 필요한 트랜스 작용 인자를 여전히 제공한다.
유사한 HDAd 생성 시스템은 FLP(예를 들면, FLPe)/frt 부위 특이적 재조합을 사용하여 개발되었고, 헬퍼 게놈의 패키징 서열 또는 이의 기능적 단편을 플랭킹하는 frt 부위 사이의 FLP 매개된 재조합은 FLP를 발현하는 생성자 세포에서 헬퍼 게놈의 패키징을 감소시키거나 제거한다.
페이로드를 포함하는 공여자 벡터 게놈을 포함하는 HDAd 벡터는 생성자 세포로부터 단리될 수 있다. HDAd 공여자 벡터는 추가로 물리적 수단에 의해 헬퍼 벡터로부터 정제될 수 있다. 일반적으로, HDAd 바이러스 벡터 및 HDAd 바이러스 벡터 제형에서의 헬퍼 벡터 및/또는 헬퍼 게놈의 약간의 오염이 발생할 수 있고 관용될 수 있다.
HDAd3, 7, 11, 14, 16, 21, 34, 37 및 50 공여자 벡터, 공여자 게놈, 헬퍼 벡터 및 헬퍼 게놈은 또한 본원에 제공된 조성물을 예시하고, 본 개시내용의 다양한 방법에 사용될 수 있다. An HDAd3, 7, 11, 14, 16, 21, 34, 37 또는 50 벡터 또는 게놈은 헬퍼 의존적 Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 벡터 또는 게놈이다. Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 헬퍼 벡터는 조건적으로 발현된(예를 들면, frt-부위 또는 loxP-부위 플랭킹된) 패키징 서열 또는 이의 단편을 포함하고, 공여자 게놈이 패키징될 수 있는 Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 비리온의 생성을 위한 모든 필요한 트랜스 작용 인자를 암호화하는 헬퍼 게놈을 포함하는 벡터이다.
본 개시내용은 추가로 HDAd3, 7, 11, 14, 16, 21, 34, 37 또는 50 공여자 게놈 및 Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 헬퍼 게놈을 포함하는 세포를 포함하는 HDAd3, 7, 11, 14, 16, 21, 34, 37 또는 50 공여자 벡터 생성 시스템을 포함한다. 소정의 이러한 세포에서, 헬퍼 게놈에 의해 암호화되고 발현된 바이러스 단백질은 HDAd3, 7, 11, 14, 16, 21, 34, 37 또는 50 공여자 게놈이 패키징된 HDAd3, 7, 11, 14, 16, 21, 34, 37 또는 50 공여자 벡터의 생성에 사용될 수 있다. 따라서, 본 개시내용은 HDAd3, 7, 11, 14, 16, 21, 34, 37 또는 50 공여자 게놈 및 Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 헬퍼 게놈을 포함하는 세포를 배양함으로써 HDAd3, 7, 11, 14, 16, 21, 34, 37 또는 50 공여자 벡터의 생성의 방법을 포함한다. 일부 실시형태에서 세포는 Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 헬퍼 벡터의 패키징 서열을 플랭킹하는 재조합효소 직접 반복부에 상응하는 재조합효소를 암호화하고 발현한다. 일부 실시형태에서, Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 헬퍼 게놈의 플랭킹된 패키징 서열은 절제된다.
일부 실시형태에서 Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 헬퍼 게놈은 모든 Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 암호화 서열을 암호화한다. 일부 실시형태에서 Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 헬퍼 게놈은 E1 및/또는 E3 암호화 서열 및/또는 E4 암호화 서열의 하나 이상의 암호화 서열을 제외하고 모든 Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 암호화 서열을 암호화하고/하거나 발현한다. 다양한 실시형태에서, Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 E1 유전자를 암호화하고/하거나 발현하지 않는 헬퍼 게놈은 Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 E4 유전자를 암호화하고/하거나 발현하지 않는다. 다양한 실시형태에서, 당업자에 의해 이해되는 것처럼, HDAd 공여자 벡터의 제조를 위한 조성물 및 방법의 세포는 E1 발현 산물을 발현하는 세포일 수 있다.
본 개시내용은, 다른 것들 중에서, Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 ITR을 포함하는 HDAd3, 7, 11, 14, 16, 21, 34, 37 또는 50 공여자 벡터 및 게놈(5' Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 ITR 및 동일한 혈청형의 3' ITR)을 포함하고, 예를 들면 여기서 2개의 Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 ITR은 패키징 서열 및 페이로드를 플랭킹한다. 본 개시내용은, 다른 것들 중에서, E1 또는 이의 단편이 결실된 HDAd3, 7, 11, 14, 16, 21, 34, 37 또는 50 공여자 벡터 및 게놈을 포함한다. 본 개시내용은, 다른 것들 중에서, E3 또는 이의 단편이 결실된 HDAd3, 7, 11, 14, 16, 21, 34, 37 또는 50 벡터 및 게놈을 포함한다.
다양한 실시형태에서, Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 헬퍼 게놈으로부터의 패키징 서열 또는 이의 기능적 단편의 절제는 예를 들면 적어도 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99.5%, 99.9% 또는 100%만큼 벡터의 전파를 감소시키고(예를 들면, 20%, 30%, 40%, 50%, 60%, 70%의 하한 및 60%, 70%, 80%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99.5%, 99.9% 또는 100%의 상한을 갖는 백분율만큼 벡터의 전파를 감소시키고), 선택적으로 퍼센트 전파는 필적하는 조건 하에 완전한 벡터(재조합효소 부위 플랭킹된 서열이 절제되지 않은 벡터)와 비교하여 또는 야생형 Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 벡터와 비교하여 절제된 벡터(재조합효소 부위 플랭킹된 서열이 절제된 벡터)의 전파에 의해 제조된 바이러스 입자의 수로서 측정된다.
추가의 선택적 조작 고려사항은 원심분리에 의해, 예를 들면 CsCl 초원심분리에 의해 HDAd3, 7, 11, 14, 16, 21, 34, 37 또는 50 공여자 벡터로부터의 헬퍼 벡터의 분리를 허용하는 크기를 갖는 헬퍼 게놈의 조작일 수 있다. 이 결과를 달성하는 하나의 수단은 통상적인 Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 게놈과 비교하여 헬퍼 게놈의 크기를 증가시키는 것이다. 특히, 아데노바이러스 게놈은 조작에 의해 야생형 길이의 적어도 104%로 증가될 수 있다. 본 개시내용의 소정의 헬퍼 벡터는 페이로드 및/또는 스터퍼 서열을 수용할 수 있다.
본 개시내용은 다양한 실시형태에서 본 개시내용의 벡터 또는 게놈이 단일 특정한 혈청형의 상응하는 서열로부터 각각 선택되거나 이것과 적어도 75%의 서열 동일성(예를 들면, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%의 동일성)을 갖는 성분의 선택을 포함할 수 있다는 것을 포함한다. 예시적인 예를 제공하기 위해, 모든 성분은 다르게 표시된 서열(예를 들면, 페이로드, 예를 들면 이종성 페이로드)을 제외하고 Ad34에 상응할 수 있다(예를 들면, 이것의 서열과 적어도 75%의 서열 동일성을 가질 수 있음).
I(C). Ad3, 7, 11, 14, 16, 21, 34, 37 및 50 유전자 치료 벡터 페이로드
본 개시내용의 Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 공여자 벡터 및 게놈은 하나 이상의 발현 산물을 암호화하는 하나 이상의 암호화 서열, 암호화 서열에 작동 가능하게 연결된 하나 이상의 조절 서열, 하나 이상의 스터퍼 서열 및 기타 중 어느 것을 포함할 수 있는 여러 가지의 이종성 핵산 페이로드를 포함할 수 있다. 다양한 실시형태에서, 페이로드는 치료학적 관심 있는 서열 변형을 생성하기 위해 원하는 결과, 예컨대 숙주 세포 또는 시스템에서의 치료학적 효과, 예를 들면 치료학적 관심 있는 단백질의 발현 또는 유전자 편집 시스템, 예를 들면 CRISPR/Cas 시스템 또는 염기 편집 시스템의 발현을 달성하기 위해 조작된다.
일부 실시형태에서, 페이로드는 유전자를 포함할 수 있다. 유전자는 암호화 서열뿐만 아니라 조절 영역, 예컨대 프로모터, 인핸서, 종결 영역, 좌위 제어 영역(LCR), 종결 및 폴리아데닐화 신호 요소, 스플라이싱 신호 요소, 사일런서, 인설레이터 및 기타를 포함할 수 있다. 유전자는 인트론 및 발현된 mRNA 전사체로부터 스플라이싱된 다른 DNA 서열을 대안적인 스플라이스 부위로부터 생긴 변이체와 함께 포함할 수 있다. 암호화 서열은 또한 특정 유기체 또는 표적 세포 유형의 코돈 선호도에 따라 기준 서열과 비교하여 대안적인 동위 코돈 용법, 예를 들면 기준과 비교하여 변형된 코돈 용법을 포함할 수 있다.
페이로드는 단일 유전자 또는 다수의 유전자를 포함할 수 있다. 페이로드는 단일 암호화 서열 또는 복수의 암호화 서열을 포함할 수 있다. 페이로드는 단일 조절 서열 또는 복수의 조절 서열을 포함할 수 있다. 페이로드는 복수의 암호화 서열을 포함할 수 있고, 암호화 서열의 개별 발현 산물은 예를 들면 엔도뉴클레아제 및 가이드 RNA의 경우에서처럼 함께 기능하거나, 예를 들면 직접적으로 또는 간접적으로 결합하지 않는 2개의 별개의 단백질로서 독립적으로 기능한다. 당업자에 의해 이해되는 것처럼, 기준 야생형 Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 게놈에 의해 암호화되지 않은 임의의 페이로드 또는 페이로드 성분(예를 들면, 페이로드 암호화된 발현 산물 또는 조절 서열)은 본원에서 이종성 발현 산물이라 지칭될 수 있다.
의심을 피하기 위해, 본 개시내용은 본원에 제공된 아미노산 및 핵산 서열의 변이체를 포함한다. 변이체는 본원에 기재되거나 개시된 단백질 및 핵산 서열과 적어도 70%의 서열 동일성, 80%의 서열 동일성, 85%의 서열, 90%의 서열 동일성, 95%의 서열 동일성, 96%의 서열 동일성, 97%의 서열 동일성, 98%의 서열 동일성 또는 99%의 서열 동일성을 갖는 서열을 포함하고, 변이체는 실질적으로 유사하거나 개선된 생물학적 기능을 나타낸다.
I(C)(i). 페이로드 발현 산물
본 개시내용의 아데노바이러스 공여자 벡터 또는 아데노바이러스 공여자 게놈의 페이로드는 임의의 여러 가지의 발현 산물을 암호화하는 하나 이상의 암호화 서열을 포함할 수 있다. 예시적인 발현 산물은 기준 수준과 비교하여 생물학적으로 활성인 단백질의 낮은 발현 또는 활성을 특징으로 하는 질환 또는 병태의 치료를 위해 제한 없이 대체 치료 단백질을 포함하는 단백질을 포함한다. 예시적인 발현 산물은 CRISPR/Cas, 염기 에디터 및 프라임 에디터 시스템을 포함한다. 예시적인 발현 산물은 항체, CAR 및 TCR을 포함한다. 예시적인 발현 산물은 작은 RNA를 포함한다. 다양한 실시형태에서, 공여자 벡터 또는 게놈의 표적 세포로의 전달이 의도된 효과 또는 표적 효과를 생성하기 위해 숙주 세포 게놈으로의 공여자 벡터 페이로드의 전부 또는 일부의 통합은 필요하지 않고, 예를 들면 소정의 경우에 여기서 의도된 효과 또는 표적 효과는 CRISPR, 염기 에디터 또는 프라임 에디터 시스템에 의해 숙주 세포 게놈의 편집을 포함한다. 다양한 실시형태에서, 공여자 벡터 또는 게놈의 표적 세포로의 전달이 의도된 효과 또는 표적 효과를 생성하기 위해 공여자 벡터 페이로드의 전부 또는 일부의 통합은 필요하거나 바람직하고, 예를 들면 여기서 형질도입된 표적 세포의 자손 세포에서 페이로드 암호화된 발현 산물의 발현이 원해진다. 다양한 실시형태에서, 페이로드는 예를 들면 재조합 또는 전위에 의해 숙주 세포 게놈("통합 요소")으로의 통합을 위해 조작된 핵산 서열을 포함할 수 있다.
하나 이상의 치료학적 단백질을 암호화하는 유전자 서열은 관련 아미노산 서열로부터 합성 방법 또는 재조합 방법에 의해 용이하게 제조될 수 있다. 특정한 실시형태에서, 임의의 이들 서열을 암호화하는 유전자 서열은 서열을 암호화하는 유전자 서열의 상이한 서열을 암호화하는 또 다른 유전자 서열에 의한 용이한 절제 및 대체를 제공하기 위해 암호화 서열의 5' 말단 및/또는 3' 말단에서의 하나 이상의 제한 효소 부위를 또한 가질 수 있다. 특정한 실시형태에서, 서열을 암호화하는 유전자 서열은 포유류 세포에서의 발현을 위해 코돈 최적화될 수 있다.
치료학적 유전자 및/또는 발현 산물의 특정한 예는 γ-글로빈, VIII 인자, γC, JAK3, IL7RA, RAG1, RAG2, DCLRE1C, PRKDC, LIG4, NHEJ1, CD3D, CD3E, CD3Z, CD3G, PTPRC, ZAP70, LCK, AK2, ADA, PNP, WHN, CHD7, ORAI1, STIM1, CORO1A, CIITA, RFXANK, RFX5, RFXAP, RMRP, DKC1, TERT, TINF2, DCLRE1B, SLC46A1, FANC 패밀리 유전자(예를 들면, FancA, FancB, FancC, FancD1(BRCA2), FancD2, FancE, FancF, FancG, FancI, FancJ(BRIP1), FancL, FancM, FancN(PALB2), FancO(RAD51C), FancP(SLX4), FancQ(ERCC4), FancR(RAD51), FancS(BRCA1), FancT(UBE2T), FancU(XRCC2), FancV(MAD2L2) 및 FancW(RFWD3)), 가용성 CD40, CTLA, Fas L, (예를 들면, CD4, CD5, CD7, CD52, IL1, IL2, IL6, TNF, P53, PTPN22 또는 DRB1*1501/DQB1*0602에 특이적으로 결합하는) 항체, 자가반응성 T 세포에 특이적으로 존재하는 TCR에 대한 항체, IL4, IL10, IL12, IL13, IL1Ra, sIL1RI, sIL1RII, sTNFRI, sTNFRII, 글로빈 패밀리 유전자, WAS, phox, 디스트로핀, 피루베이트 키나제, CLN3, ABCD1, 아릴설파타제 A, SFTPB, SFTPC, NLX2.1, ABCA3, GATA1, 리보솜 단백질 유전자, TERT, TERC, DKC1, TINF2, CFTR, LRRK2, PARK2, PARK7, PINK1, SNCA, PSEN1, PSEN2, APP, SOD1, TDP43, FUS, 유비퀼린 2, C9ORF72 및 본원에 기재된 다른 치료학적 유전자 및/또는 발현 산물을 포함한다.
치료학적 유전자는 적혈구와 관련된 질환 및 응고에 대해 치료학적으로 효과적인 반응을 제공하도록 선택될 수 있다. 특정한 실시형태에서, 질환은 지중해빈혈과 같은 이상헤모글로빈증 또는 겸상 세포 질환/특질이다. 치료학적 유전자는 예를 들면 신체에서 헤모글로빈의 생성을 유도하거나 증가시키거나; β-글로빈, γ-글로빈 또는 α-글로빈의 생성을 유도하거나 증가시키거나; 세포에 대한 산소의 이용가능성을 증가시키는 유전자일 수 있다. 치료학적 유전자는 예를 들면 HBB 또는 CYB5R3일 수 있다. 예시적인 효과적인 치료는 예를 들면 환자에서 혈액 세포 수를 증가시키거나, 혈액 세포 기능을 개선하거나, 세포의 산소화를 증가시킬 수 있다. 또 다른 특정한 실시형태에서, 질환은 혈우병이다. 치료학적 유전자는 예를 들면 VIII 응집/응고 인자 또는 IX 응집/응고 인자의 생성을 증가시키거나, VIII 응집 인자 또는 IX 응집 인자의 정상 버전의 생성을 야기하는 유전자, VIII 응집/응고 인자 또는 IX 응집/응고 인자에 대한 항체의 생성을 감소시키는 유전자 또는 혈전의 적절한 형성을 야기하는 유전자일 수 있다. 예시적인 치료학적 유전자는 F8 및 F9를 포함한다. 예시적인 효과적인 치료는 예를 들면 대상체에서 VIII 및 IX 응집/응고 인자의 생성을 증가시키거나 유도하거나; VIII 및 IX 응집/응고 인자의 기능을 개선하거나 응고 시간을 감소시킬 수 있다.
본 개시내용의 다양한 실시형태에서, 공여자 벡터는 글로빈 유전자를 암호화하고, 글로빈 유전자에 의해 암호화된 글로빈 단백질은 γ-글로빈, β-글로빈 및/또는 α-글로빈으로부터 선택된다. 본 개시내용의 글로빈 유전자는 예를 들면 하나 이상의 조절 서열, 예컨대 글로빈 단백질을 암호화하는 핵산 서열에 작동 가능하게 연결된 프로모터를 포함할 수 있다. 당업자가 이해하는 것처럼, 각각의 γ-글로빈, β-글로빈 및/또는 α-글로빈은 태아 및/또는 성인 헤모글로빈의 성분이고, 따라서 본원에 개시된 다양한 벡터에서 유용하다.
다양한 실시형태에서, 글로빈 단백질의 발현의 증가는 (i) 특정한 서열을 갖는 글로빈 단백질의 세포 또는 시스템에서의 양, 농도 또는 발현(예를 들면, 암호화하는 핵산의 전사 또는 번역)의 증가; (ii) 서로에 대한 단백질의 서열과 관련 없이 특정한 유형의 글로빈 단백질의 세포 또는 시스템에서의 양, 농도 또는 발현(예를 들면, 암호화하는 핵산의 전사 또는 번역)(예를 들면, 당업자에 의해 또는 본 명세서에 제시된 것과 같이 γ-글로빈(또는 대안적으로 β-글로빈 또는 α-글로빈)으로서 확인된 모든 단백질의 총 양)의 증가; 및/또는 (iii) 세포 또는 시스템에서 이종성 글로빈 단백질, 예를 들면 유전자 치료 전에 숙주 세포에 의해 암호화되지 않은 글로빈 단백질의 발현 중 임의의 하나 이상을 지칭할 수 있다.
하기 참고번호는 기능적 글로빈 유전자의 특정한 예시적인 서열을 기재한다. 참고번호 1-4는 α-유형 글로빈 서열을 지칭하고, 참고번호 4-12는 β-유형 글로빈 서열(β 및 γ 글로빈 서열을 포함)을 지칭하고, 이의 서열은 본원에 참고로 포함된다: (1) GenBank 수탁 번호 Z84721(Mar. 19, 1997); (2) GenBank 수탁 번호 NM_000517(Oct. 31, 2000); (3) Hardison 등, J. Mol. Biol. (1991) 222(2):233-249; (4) A Syllabus of Human Hemoglobin Variants (1996), 저자 Titus 외, 발행 The Sickle Cell Anemia Foundation in Augusta, Ga. (온라인 globin.cse.psu.edu에서 이용 가능); (5) GenBank 수탁 번호 J00179(Aug. 26, 1993) 또는 U01317.1; (6) Tagle 등, Genomics (1992) 13(3):741-760; (7) Grovsfeld 등, Cell (1987) 51(6):975-985; (8) Li 등, Blood (1999) 93(7):2208-2216; (9) Gorman 등, J. Biol. Chem. (2000) 275(46):35914-35919; (10) Slightom 등, Cell (1980) 21(3):627-638; (11) Fritsch 등, Cell (1980) 19(4): 959-972; (12) Marotta 등, J. Biol. Chem. (1977) 252(14):5040-5053. 글로빈을 암호화하는 유전자의 추가의 암호화 영역 및 비암호화 영역에 대해, 예를 들면, Marotta 등, Prog. Nucleic Acid Res. Mol. Biol. 19, 165-175, 1976, Lawn 등, Cell 21 (3), 647-651, 1980 및 Sadelain 등, PNAS.; 92:6728-6732, 1995를 참조한다. 일부 실시형태에서 글로빈 유전자는 G16D 감마 글로빈 변이체를 암호화한다.
헤모글로빈 아단위 β의 예시적인 아미노산 서열은 예를 들면 NCBI 수탁 번호 P68871에서 제공된다. β-글로빈에 대한 예시적인 아미노산 서열은 예를 들면 NCBI 수탁 번호 NP_000509에서 제공된다.
전이유전자는 치료학적 유전자 및/또는 유전자 산물 이외에 또한 치료 분자, 예컨대 관문 억제제 시약, 하나 이상의 암 항원에 특이적인 키메라 항원 수용체 분자 및/또는 하나 이상의 암 항원에 특이적인 T-세포 수용체를 암호화할 수 있다.
또 다른 예로서, 치료학적 유전자는 리소좀 저장 장애에 대해 치료학적으로 효과적인 반응을 제공하도록 선택될 수 있다. 특정한 실시형태에서, 리소좀 저장 장애는 점액다당류증(MPS), I형; MPS II 또는 헌터 증후군; MPS III 또는 산필리포 증후군; MPS IV 또는 모로퀴오 증후군; MPS V; MPS VI 또는 마르토/라미 증후군(Maroteaux-Lamy syndrome); MPS VII 또는 슬라이 증후군; α-만노시드증; β-만노시드증; GSDI, 폰기르케씨병(von Gierke disease) 또는 테이 삭스(Tay Sachs)로도 알려진 글리코겐 저장 질환 I형; 폼페병; 고셔병; 또는 파브리병이다. 치료학적 유전자는 예를 들면 효소의 생성을 암호화하거나 유도하거나 그렇지 않으면 리소좀에서 점액폴리사카라이드의 분해를 야기하는 유전자일 수 있다. 예시적인 치료학적 유전자는 IDUA 또는 이두로니다제, IDS, GNS, HGSNAT, SGSH, NAGLU, GUSB, GALNS, GLB1, ARSB 및 HYAL1을 포함한다. 리소좀 저장 장애에 대한 예시적인 효과적인 유전자 치료는 예를 들면 리소좀에서 다양한 물질의 분해를 담당하는 효소의 생성을 암호화하거나 유도하거나; 두부(대두증 제외), 간, 비장, 혀 또는 성대를 포함하는 다양한 장기에서의 종창을 감소시키거나 제거하거나 예방하거나 지연시키거나; 뇌에서의 유체를 감소시키거나; 심장 판막 비정상을 감소시키거나; 좁은 기도를 예방하거나 확장시키고 감염 및 수면 무호흡증과 같은 관련된 상부 호흡기 병태를 예방하거나; 뉴런의 파괴 및/또는 연관된 증상을 감소시키거나 제거하거나 예방하거나 지연시킬 수 있다.
또 다른 예로서, 치료학적 유전자는 과증식성 질환에 대해 치료학적으로 효과적인 반응을 제공하도록 선택될 수 있다. 특정한 실시형태에서, 과증식성 질환은 암이다. 치료학적 유전자는 예를 들면 종양 억제자 유전자, 아폽토시스를 유도하는 유전자, 효소를 암호화하는 유전자, 항체를 암호화하는 유전자 또는 호르몬을 암호화하는 유전자일 수 있다. 예시적인 치료학적 유전자 및 유전자 산물은 (본원에 어딘가에 열거된 것 이외에) 101F6, 123F2(RASSF1), 53BP2, abl, ABLI, ADP, aFGF, APC, ApoAI, ApoAIV, ApoE, ATM, BAI-1, BDNF, Beta*(BLU), bFGF, BLC1, BLC6, BRCA1, BRCA2, CBFA1, CBL, C-CAM, CNTF, COX-1, CSFIR, CTS-1, 시토신 데아미나제, DBCCR-1, DCC, Dp, DPC-4, E1A, E2F, EBRB2, erb, ERBA, ERBB, ETS1, ETS2, ETV6, Fab, FCC, FGF, FGR, FHIT, fms, FOX, FUS1, FYN, G-CSF, GDAIF, 유전자 21(NPRL2), 유전자 26(CACNA2D2), GM-CSF, GMF, gsp, HCR, HIC-1, HRAS, hst, IGF, IL-1, IL-2, IL-3, IL-5, IL-6, IL-7, IL-8, IL-9, IL-11, ING1, 인터페론 α, 인터페론 β, 인터페론 γ, IRF-1, JUN, KRAS, LUCA-1(HYAL1), LUCA-2(HYAL2), LYN, MADH4, MADR2, MCC, mda7, MDM2, MEN-I, MEN-II, MLL, MMAC1, MYB, MYC, MYCL1, MYCN, neu, NF-1, NF-2, NGF, NOEY1, NOEY2, NRAS, NT3, NT5, OVCA1, p16, p21, p27, p57, p73, p300, PGS, PIM1, PL6, PML, PTEN, raf, Rap1A, ras, Rb, RB1, RET, rks-3, ScFv, scFV ras, SEM A3, SRC, TALI, TCL3, TFPI, 트롬보스폰딘, 티미딘 키나제, TNF, TP53, trk, T-VEC, VEGF, VHL, WT1, WT-1, YES 및 zac1을 포함한다. 예시적인 효과적인 유전자 치료는 종양을 억제하거나 제거하거나, 암 세포의 수를 감소시키거나, 종양 크기를 감소시키거나, 종양 성장을 느리게 하거나 제거하거나, 종양에 의해 야기된 증상을 경감할 수 있다.
또 다른 예로서, 치료학적 유전자는 감염성 질환에 대해 치료학적으로 효과적인 반응을 제공하도록 선택될 수 있다. 특정한 실시형태에서, 감염성 질환은 인간 면역결핍 바이러스(HIV)이다. 치료학적 유전자는 예를 들면 면역 세포가 HIV 감염에 내성이게 하거나, 면역 세포가 면역 재구성을 통해 바이러스를 효과적으로 중화시키는 것이 가능하게 하는 유전자, 면역 세포에 의해 발현된 단백질을 암호화하는 유전자의 다형, 환자에서 발현되지 않은 감염과 싸우기 위해 유리한 유전자, 감염성 제제, 수용체 또는 공동수용체를 암호화하는 유전자; 수용체 또는 공동수용체에 대한 리간드를 암호화하는 유전자; 소정의 전사 인자의 작용을 차단하기 위해 리보자임, 안티센스 RNA, 소형 간섭 RNA(siRNA) 또는 디코이 RNA를 암호화하는 유전자를 포함하는 바이러스 복제에 필수적인 바이러스 및 세포 유전자; 우성 음성 바이러스 단백질, 세포내 항체, 인트라카인을 암호화하는 유전자 및 자살 유전자일 수 있다. 예시적인 치료학적 유전자 및 유전자 산물은 α2β1; αvβ3; αvβ5; αvβ63; BOB/GPR15; Bonzo/STRL-33/TYMSTR; CCR2; CCR3; CCR5; CCR8; CD4; CD46; CD55; CXCR4; 아미노펩티다제-N; HHV-7; ICAM; ICAM-1; PRR2/HveB; HveA; α-디스트로글리칸; LDLR/α2MR/LRP; PVR; PRR1/HveC; 및 라미닌 수용체를 포함한다. HIV의 치료를 위한 치료학적 유효량은 예를 들면 HIV에 대한 대상체의 면역력을 증가시키거나, AIDS 또는 HIV와 연관된 증상을 개선하거나, HIV에 대해 대상체에서 선천성 면역 반응 또는 적응 면역 반응을 유도한다. HIV에 대한 면역 반응은 항체 생성을 포함할 수 있고, AIDS를 예방하고/하거나 대상체의 AIDS 또는 HIV 감염의 증상을 개선하거나, HIV 감염성 및/또는 독력을 감소시키거나 제거한다.
I(C)(i)(a). 결합 도메인, 항체, CAR 및 TCR 페이로드 발현 산물
본 개시내용은 임의의 여러 가지의 결합 도메인을 암호화하는 서열을 포함할 수 있는 페이로드를 포함한다. 결합 도메인을 암호화하는 서열은 예를 들면 항체, 키메라 항원 수용체, TCR 또는 다른 결합 폴리펩타이드를 암호화할 수 있다.
항체 및 항체 단편은 결합 도메인의 예시이다. 용어 "항체"는 특정한 항원에 특이적 결합을 부여하기에 충분한 하나 이상의 정규 면역글로빈 서열 요소(예를 들면, 중쇄 가변 도메인, 경쇄 가변 도메인 및/또는 하나 이상의 CDR)를 포함하는 폴리펩타이드를 지칭할 수 있다. 따라서, 용어 항체는, 제한 없이, 인간 항체, 비인간 항체, 합성 항체 및/또는 조작된 항체, 이의 단편 및 이를 포함하는 제제를 포함한다. 항체는 천연 발생 면역글로빈(예를 들면, 항원과 반응하는 유기체에 의해 생성됨)일 수 있다. 합성 항체, 비천연 발생 항체 또는 조작된 항체는 재조합 조작, 화학 합성 또는 당업자에게 알려진 다른 인공 시스템 또는 방법론에 의해 제조될 수 있다.
당해 분야에 잘 알려진 것처럼, 통상적인 인간 면역글로빈은 "Y-형상"의 구조로 흔히 지칭되는 구조를 형성하기 위해 서로 회합된 2개의 동일한 중(H)쇄 폴리펩타이드(각각 약 50 kD) 및 2개의 동일한 경(L)쇄 폴리펩타이드(각각 약 25 kD)를 포함하는 대략 150 kD 사합체 제제이다. 통상적으로, 각각의 중쇄는 중쇄 가변 도메인(VH) 및 중쇄 불변 도메인(CH)을 포함한다. 중쇄 불변 도메인은 CH1, CH2 및 CH3인 3개의 CH 도메인을 포함한다. "스위치"로 알려진 짧은 영역은 중쇄 가변 및 불변 영역을 연결한다. "힌지"는 CH2 및 CH3 도메인을 면역글로빈의 나머지에 연결한다. 각각의 경쇄는 또 다른 "스위치"에 의해 서로 분리된 경쇄 가변 도메인(VL) 및 경쇄 불변 도메인(CL)을 포함한다. 각각의 가변 도메인은 "상보성 결정 영역"(CDR1, CDR2 및 CDR3)으로 알려진 3개의 초가변 루프 및 4개의 어느 정도 비변이체인 "프레임워크" 영역(FR1, FR2, FR3 및 FR4)을 함유한다. 각각의 VH 및 VL에서, 3개의 CDR 및 4개의 FR은 FR1, CDR1, FR2, CDR2, FR3, CDR3 및 FR4의 순서로 아미노 말단으로부터 카복시 말단으로 배열된다. 중쇄 및/또는 경쇄의 가변 영역은 통상적으로 항원과 상호작용할 수 있는 결합 모이어티를 제공하는 것으로 이해된다. 불변 도메인은 다양한 면역계 세포(예를 들면, 효과기 세포 및/또는 세포독성을 매개하는 세포), 수용체 및 보체 시스템의 요소에 대한 항체의 결합을 매개할 수 있다. 중쇄 및 경쇄는 단일 디설파이드 결합에 의해 서로에 연결되고, 2개의 다른 디설파이드 결합은 중쇄 힌지 영역을 서로에 연결하여서, 이합체는 서로에 연결되고 사합체가 형성된다. 천연 면역글로빈이 폴딩할 때, FR 영역은 도메인에 대한 구조적 프레임워크를 제공하는 베타 시트를 형성하고, 중쇄 및 경쇄 둘 다로부터의 CDR 루프 영역은 3차원 공간에 함께 있어서, 이들은 Y 구조의 선단에 위치한 단일 초가변 항원 결합 부위를 생성한다.
일부 실시형태에서, 항체는 다중클론, 단일클론, 단일특이적 또는 다중특이적 항체(이중특이적 항체를 포함)이다. 일부 실시형태에서, 항체는 적어도 하나의 경쇄 단량체 또는 이합체, 적어도 하나의 중쇄 단량체 또는 이합체, 적어도 하나의 중쇄-경쇄 이합체 또는 2개의 중쇄 단량체와 2개의 경쇄 단량체를 포함하는 사합체를 포함한다. 더욱이, 용어 "항체"는 (달리 기술되거나 맥락으로부터 명확하지 않는 한) 제한 없이 인트라바디, 도메인 항체, 항체 모방체, Zybody®, Fab 단편, Fab' 단편, F(ab')2 단편, Fd' 단편, Fd 단편, 단리된 CDR 또는 이의 세트, 단일 사슬 항체, 단일 사슬 Fv(scFv), 디설파이드-연결된 Fv(sdFv), 폴리펩타이드-Fc 융합, 단일 도메인 항체(예를 들면, 상어 단일 도메인 항체, 예컨대 IgNAR 또는 이의 단편), 낙타과 항체, 낙타화된 항체, 마스킹된 항체(예를 들면, Probody®), 아피바디, 항-이디오타입(항-Id) 항체(예를 들면, 항-항-Id 항체를 포함), 작은 모듈식 면역의약품(Small Modular ImmunoPharmaceuticals)("SMIPsTM"), 단일 사슬 또는 탠덤 디아바디(TandAb®), VHH, Anticalin®, Nanobody® 미니바디, BiTE®, 안키린 반복부 단백질 또는 DARPIN®, Avimer®, DART, TCR 유사 항체, Adnectin®, Affilin®, Trans-body®, Affibody®, TrimerX®, MicroProtein, Fynomer®, Centyrin® 및 KALBITOR®, CAR, 조작된 TCR 및 임의의 상기의 항원 결합 단편을 포함하는 항체 구조적 특징 및/또는 기능적 특징을 이용하는 임의의 분야-알려진 작제물 또는 형식을 포함할 수 있다.
다양한 실시형태에서, 항체는 상보성 결정 영역(CDR) 또는 가변 도메인으로서 당업자에 의해 인정된 하나 이상의 구조적 요소를 포함한다. 일부 실시형태에서, 항체는 공유 변형된("접합된") 항체(예를 들면, 특정한 항원에 대한 특이적 결합을 부여하기에 충분한 하나 이상의 정규 면역글로빈 서열 요소를 포함하는 폴리펩타이드를 포함하는 항체, 여기서 폴리펩타이드는 치료제, 검출 가능한 모이어티, 또 다른 폴리펩타이드, 글리칸 또는 폴리에틸렌 글리콜 분자 중 하나 이상과 공유 연결됨)일 수 있다. 일부 실시형태에서, 항체 서열 요소는 당해 분야에 알려진 것처럼 인간화되거나, 영장류화되거나, 키메라이거나, 기타 등등이다.
중쇄 불변 도메인을 포함하는 항체는 중쇄 불변 도메인 아미노산 서열(예를 들면, 알파(α), 델타(δ), 엡실론(ε), 감마(γ) 및 뮤(μ))에 기초하여 제한 없이 비제한적인 예로서 IgA, 분비 IgA, IgG, IgE 및 IgM을 포함하는 임의의 알려진 종류의 항체일 수 있다. IgG 하위종류는 당업자에게 또한 잘 알려져 있고, 인간 IgG1, IgG2, IgG3 및 IgG4를 포함하지만, 이들로 제한되지는 않는다. "아이소타입"은 중쇄 불변 영역 유전자에 의해 암호화된 Ab 종류 또는 하위종류(예를 들면, IgM 또는 IgG1)를 지칭한다. 본원에 사용된 것과 같이, "경쇄"는 경쇄 불변 도메인의 아미노산 서열에 기초하여 구별되는 유형, 예를 들면 카파(κ) 또는 람다(λ)일 수 있다. 일부 실시형태에서, 항체는 마우스, 토끼, 영장류 또는 인간 면역글로빈의 특징인 불변 영역 서열을 갖는다. 자연적으로 생성된 면역글로빈은 통상적으로 CH2 도메인에서 글리코실화된다. 당해 분야에 알려진 것처럼, Fc 수용체에 대한 Fc 영역의 친화도 및/또는 다른 결합 속성은 글리코실화 또는 다른 변형을 통해 조절될 수 있다. 일부 실시형태에서, 항체는 자연적으로 생성되면 가질 수 있는 것보다 공유 변형(예를 들면, 글리칸의 부착)이 결여될 수 있다. 일부 실시형태에서, 본 발명에 따라 제조되고/되거나 사용된 항체는 변형된 또는 조작된 이러한 글리코실화를 갖는 Fc 도메인을 포함하는 글리코실화된 Fc 도메인을 포함한다.
용어 "항체 단편"은 본원에 기재된 것과 같은 항체의 부분 또는 항체 제제를 지칭할 수 있고, 통상적으로 항원 결합 부분 또는 이의 가변 영역을 포함하는 부분을 지칭한다. 항체 단편은 임의의 수단에 의해 제조될 수 있다. 예를 들면, 일부 실시형태에서, 항체 단편은 온전한 항체 또는 항체 제제의 단편화에 의해 효소적으로 또는 화학적으로 제조될 수 있다. 대안적으로, 일부 실시형태에서, 항체 단편은 재조합으로(즉, 조작된 핵산 서열의 발현에 의해) 제조될 수 있다. 일부 실시형태에서, 항체 단편은 전체적으로 또는 부분적으로 합성으로 제조될 수 있다. 일부 실시형태에서, 항체 단편(특히 항원 결합 항체 단편)은 적어도 약 50개, 60개, 70개, 80개, 90개, 100개, 110개, 120개, 130개, 140개, 150개, 160개, 170개, 180개, 190개 이상의 아미노산, 일부 실시형태에서 적어도 약 200개의 아미노산의 길이를 가질 수 있다.
일부 경우에, 결합 도메인이 이것이 궁극적으로 사용되는 동일한 종으로부터 유래되는 것이 유리하다. 예를 들면, 인간에서의 사용을 위해, 항원 결합 도메인이 인간 항체, 인간화된 항체 또는 이의 단편 또는 조작된 형태를 포함하는 것이 유리할 수 있다. 인간 기원으로부터의 항체 또는 인간화된 항체는 인간에서 낮아진 면역원성을 갖거나 면역원성을 갖지 않고, 비인간 항체와 비교하여 비면역원성 에피토프의 더 낮은 수를 갖는다. 항체 및 이의 조작된 단편은 일반적으로 인간 대상체에서 감소된 수준의 항원성을 갖거나 항원성을 갖지 않도록 선택될 것이다.
다양한 실시형태에서, 페이로드는 면역 관문 단백질에 특이적으로 결합하는 항체와 같은 관문 억제제인 결합 제제를 암호화할 수 있다. 다수의 면역 관문 억제제가 알려져 있다. 면역 관문 억제제는 펩타이드, 항체, 핵산 분자 및 소분자를 포함할 수 있다. 면역 관문의 예는 PD-1, PD-L1, 림프구 활성화 유전자-3(LAG-3) 및 T 세포 면역글로빈 및 뮤신 도메인 함유 분자 3(TIM-3)을 포함한다.
본 개시내용은 CD4, CD5, CD7, CD52 등에 결합하는 항체 및 다른 결합 도메인; 항체; IL1, IL2, IL6에 대한 항체; 자가반응성 T 세포에 특이적으로 존재하는 TCR에 대한 항체; IL4; IL10; IL12; IL13; IL1Ra; sIL1RI; sIL1RII; TNF에 대한 항체; ABCA3; ABCD1; ADA; AK2; APP; 아르기나제; 아릴설파타제 A; A1AT; CD3D; CD3E; CD3G; CD3Z; CFTR; CHD7; 키메라 항원 수용체(CAR); CIITA; CLN3; 보체 인자, CORO1A; CTLA; C1 억제제; C9ORF72; DCLRE1B; DCLRE1C; 데코이 수용체; DKC1; DRB1*1501/DQB1*0602; 디스트로핀; 효소; VIII 인자, FANC 패밀리 유전자(FancA, FancB, FancC, FancD1(BRCA2), FancD2, FancE, FancF, FancG, FancI, FancJ(BRIP1), FancL, FancM, FancN(PALB2), FancO(RAD51C), FancP(SLX4), FancQ(ERCC4), FancR(RAD51), FancS(BRCA1), FancT(UBE2T), FancU(XRCC2), FancV(MAD2L2) 및 FancW(RFWD3)); Fas L; FUS; GATA1; 글로빈 패밀리 유전자(즉, γ-글로빈); F8; 글루타미나제; HBA1; HBA2; HBB; IL7RA; JAK3; LCK; LIG4; LRRK2; NHEJ1; NLX2.1; 중화 항체; ORAI1; PARK2; PARK7; phox; PINK1; PNP; PRKDC; PSEN1; PSEN2; PTPN22; PTPRC; P53; 피루베이트 키나제; RAG1; RAG2; RFXANK; RFXAP; RFX5; RMRP; 리보솜 단백질 유전자; SFTPB; SFTPC; SOD1; 가용성 CD40; STIM1; sTNFRI; sTNFRII; SLC46A1; SNCA; TDP43; TERT; TERC; TINF2; 유비퀼린 2; WAS; WHN; ZAP70; γC; 및 본원에 기재된 다른 치료학적 유전자를 추가로 포함한다.
HSC는 키메라 항원 수용체(CAR) 작제물을 암호화하고/하거나 발현하도록 조작될 수 있다. CAR은 세포가 표적 세포, 예컨대 암 세포를 인식하고 사멸하게 할 수 있는 몇몇 구별되는 하위성분을 포함할 수 있다. 하위성분은 적어도 세포외 성분 및 세포내 성분을 포함한다.
세포외 CAR 성분은 원치 않는 세포의 표면에 우선적으로 존재하는 마커에 특이적으로 결합하는 결합 도메인을 포함할 수 있다. 결합 도메인이 이러한 마커에 결합할 때, 세포내 성분은 세포가 결합된 암 세포를 파괴하도록 지시한다. 결합 도메인은 통상적으로 단일클론 항체(mAb)로부터 유래된 단일 사슬 가변 단편(scFv)이지만, 이것은 항체 유사 항원 결합 부위를 포함하는 다른 형식에 기초할 수 있다.
세포내 CAR 성분은 효과기 도메인의 포함에 기초하여 활성화 신호를 제공한다. 제1 세대 CAR은 효과기 도메인으로서 CD3ξ의 세포질 영역을 이용하였다. 제2 세대 CAR은 분화 클러스터 28(CD28) 또는 4-1BB(CD137)와 조합되어 CD3ξ를 이용하는 한편, 제3 세대 CAR은 세포내 효과기 도메인 내에 CD28 및 401BB와 조합되어 CD3ξ를 이용하였다.
CAR의 세포내 또는 그 외 세포질 신호전달 성분은 CAR이 발현된 세포의 활성화를 담당한다. 용어 "세포내 신호전달 성분" 또는 "세포내 성분"은 따라서 활성화 신호를 형질도입하기에 충분한 세포내 도메인의 임의의 부분을 포함하도록 의도된다. 발현된 CAR의 세포내 성분은 효과기 도메인을 포함할 수 있다. 효과기 도메인은 적절한 신호를 수신할 때 세포에서 생물학적 반응 또는 생리학적 반응을 직접적으로 또는 간접적으로 촉진할 수 있는 융합 단백질 또는 수용체의 세포내 부분이다. 특정 실시형태에서, 효과기 도메인은 결합할 때 신호를 수신하는 단백질 또는 단백질 복합체의 부분이고, 이것은 효과기 도메인으로부터 신호를 촉발하는 표적 분자에 직접적으로 결합한다. 효과기 도메인은 이것이 하나 이상의 신호전달 도메인 또는 모티프, 예컨대 면역수용체 티로신 기반 활성화 모티프(ITAM)를 함유할 때 세포 반응을 직접적으로 촉진할 수 있다. 다른 실시형태에서, 효과기 도메인은 세포 반응을 직접적으로 촉진하는 하나 이상의 다른 단백질, 예컨대 공동자극 도메인과의 회합에 의해 세포 반응을 간접적으로 촉질할 것이다.
효과기 도메인은 암 세포에 의해 발현된 세포 마커에 대한 결합 시 변형된 세포의 적어도 하나의 기능의 활성화를 제공할 수 있다. 변형된 세포의 활성화는 분화, 증식 및/또는 활성화 또는 다른 효과기 기능 중 하나 이상을 포함할 수 있다. 특정한 실시형태에서, 효과기 도메인은 T 세포 수용체 및 공동수용체 또는 공동자극 분자로부터의 세포질 서열을 포함할 수 있는 공동자극 도메인을 포함하는 세포내 신호전달 성분을 포함할 수 있다.
효과기 도메인은 1개, 2개, 3개 이상의 수용체 신호전달 도메인, 세포내 신호전달 성분(예를 들면, 세포질 신호전달 서열), 공동자극 도메인 또는 이들의 조합을 포함할 수 있다. 예시적인 효과기 도메인은 4-1BB(CD137), CARD11, CD3γ, CD3δ, CD3ε, CD3ξ, CD27, CD28, CD79A, CD79B, DAP10, FcRα, FcRβ(FcεR1b), FcRγ, Fyn, HVEM(LIGHTR), ICOS, LAG3, LAT, Lck, LRP, NKG2D, NOTCH1, pTα, PTCH2, OX40, ROR2, Ryk, SLAMF1, Slp76, TCRα, TCRβ, TRIM, Wnt, Zap70 또는 임의의 이들의 조합으로부터 선택된 신호전달 및 자극 도메인을 포함한다. 특정한 실시형태에서, 예시적인 효과기 도메인은 CD86, FcγRIIa, DAP12, CD30, CD40, PD-1, 림프구 기능 연관된 항원-1(LFA-1), CD2, CD7, LIGHT, NKG2C, B7-H3, CD83과 특이적으로 결합하는 리간드, CDS, ICAM-1, GITR, BAFFR, SLAMF7, NKp80(KLRF1), CD127, CD160, CD19, CD4, CD8α, CD8β, IL2Rβ, IL2Rγ, IL7Rα, ITGA4, VLA1, CD49a, IA4, CD49D, ITGA6, VLA-6, CD49f, ITGAD, CD11d, ITGAE, CD103, ITGAL, CD11a, ITGAM, CD11b, ITGAX, CD11c, ITGB1, CD29, ITGB2, CD18, ITGB7, TNFR2, TRANCE/RANKL, DNAM1(CD226), SLAMF4(CD244, 2B4), CD84, CD96(촉각), CEACAM1, CRTAM, Ly9(CD229), PSGL1, CD100(SEMA4D), CD69, SLAMF6(NTB-A, Ly108), SLAM(CD150, IPO-3), BLAME(SLAMF8), SELPLG(CD162), LTBR, GADS, PAG/Cbp, NKp44, NKp30 또는 NKp46으로부터 선택된 신호전달 및 공동자극 도메인을 포함한다.
자극 방식으로 작용하는 세포내 신호전달 성분 서열은 iTAM을 포함할 수 있다. 1차 세포질 신호전달 서열을 포함하는 iTAM의 예는 CD3γ, CD3δ, CD3ε, CD3ξ, CD5, CD22, CD66d, CD79a, CD79b 및 공통 FcRγ(FCER1G), FcγRlla, FcRβ(Fcε Rib), DAP10 및 DAP12로부터 유래된 것을 포함한다. 특정한 실시형태에서, CD3ξ의 변이체는 적어도 1개, 2개, 3개의 또는 모든 ITAM 영역을 보유한다.
특정한 실시형태에서, 효과기 도메인은 세포질 신호전달 단백질과 회합하는 세포질 부분을 포함하고, 세포질 신호전달 단백질은 림프구 수용체 또는 이의 신호전달 도메인, 복수의 ITAM을 포함하는 단백질, 공동자극 도메인 또는 임의의 이들의 조합이다.
세포내 신호전달 성분의 추가 예는 결합 도메인 관여 후 신호 형질도입을 개시시키도록 함께 작용하는 CD3ξ 사슬의 세포질 서열 및/또는 공동수용체을 포함한다.
공동자극 도메인은 세포 마커 결합에 대한 효과적인 림프구 반응에 활성화가 필요할 수 있는 도메인이다. 일부 분자는 세포내 신호전달 성분 또는 공동자극 도메인으로서 상호교환 가능하다. 공동자극 도메인의 예는 CD27, CD28, 4-1BB(CD 137), OX40, CD30, CD40, PD-1, ICOS, 림프구 기능 연관된 항원-1(LFA-1), CD2, CD7, LIGHT, NKG2C, B7-H3 및 CD83과 특이적으로 결합하는 리간드를 포함한다. 예를 들면, CD27 공동자극은 시험관내 인간 CART 세포의 확장, 효과기 기능 및 생존을 향상시키고 생체내 인간 T 세포 지속성 및 항암 활성을 증강시키는 것으로 입증되었다(Song 등 Blood. 2012; 119(3):696-706). 이러한 공동자극 도메인 분자의 추가 예는 CDS, ICAM-1, GITR, BAFFR, HVEM(LIGHTR), SLAMF7, NKp80(KLRF1), NKp44, NKp30, NKp46, CD160, CD19, CD4, CD8α, CD8β, IL2Rβ, IL2Rγ, IL7Rα, ITGA4, VLA1, CD49a, ITGA4, IA4, CD49D, ITGA6, VLA-6, CD49f, ITGAD, CDlld, ITGAE, CD103, ITGAL, CDlla, ITGAM, CDl lb, ITGAX, CDllc, ITGBl, CD29, ITGB2, CD18, ITGB7, TNFR2, TRANCE/RANKL, DNAM1(CD226), SLAMF4(CD244, 2B4), CD84, CD96(촉각), NKG2D, CEACAM1, CRTAM, Ly9(CD229), PSGL1, CD100(SEMA4D), CD69, SLAMF6(NTB-A, Lyl08), SLAM(SLAMF1, CD150, IPO-3), BLAME(SLAMF8), SELPLG(CD162), LTBR, LAT, GADS, SLP-76, PAG/Cbp 및 CD19a를 포함한다.
특정한 실시형태에서, 세포내 신호전달 성분의 아미노산 서열은 CD3ξ의 변이체 및 4-1BB 세포내 신호전달 성분의 부분을 포함한다.
특정한 실시형태에서, 세포내 신호전달 성분은 (i) CD3ξ의 신호전달 도메인의 전부 또는 일부, (ii) 4-1BB의 신호전달 도메인의 전부 또는 일부 또는 (iii) CD3ξ 및 4-1BB의 신호전달 도메인의 전부 또는 일부를 포함한다.
세포내 성분은 또한 Wnt 신호전달 경로(예를 들면, LRP, Ryk 또는 ROR2), NOTCH 신호전달 경로(예를 들면, NOTCH1, NOTCH2, NOTCH3 또는 NOTCH4), 헤지호그 신호전달 경로(예를 들면, PTCH 또는 SMO), 수용체 티로신 키나제(RTK)(예를 들면, 표피 성장 인자(EGF) 수용체 패밀리, 섬유아세포 성장 인자(FGF) 수용체 패밀리, 간세포 성장 인자(HGF) 수용체 패밀리, 인슐린 수용체(IR) 패밀리, 혈소판 유래 성장 인자(PDGF) 수용체 패밀리, 혈관 내피 성장 인자(VEGF) 수용체 패밀리, 트로포마이신 수용체 키나제(Trk) 수용체 패밀리, 에프린(Eph) 수용체 패밀리, AXL 수용체 패밀리, 백혈구 티로신 키나제(LTK) 수용체 패밀리, 면역글로빈 유사 및 EGF 유사 도메인 1을 갖는 트로신 키나제(TIE) 수용체 패밀리, 수용체 티로신 키나제 유사 고아(ROR) 수용체 패밀리, 디스코이딘 도메인(DDR) 수용체 패밀리, 형질주입 동안 재배열된(RET) 수용체 패밀리, 티로신-단백질 키나제 유사(PTK7) 수용체 패밀리, 수용체 티로신 키나제와 관련된(RYK) 수용체 패밀리 또는 근육 특이적 키나제(MuSK) 수용체 패밀리); G-단백질 결합 수용체, GPCR(꼬불꼬불한 또는 평탄해진); 세린/트레오닌 키나제 수용체(BMPR 또는 TGFR); 또는 사이토카인 수용체(IL1R, IL2R, IL7R 또는 IL15R)의 단백질 중 하나 이상을 포함할 수 있다.
CAR은 일반적으로 또한 분자 내에 여러 가지의 목적을 위해 사용된 하나 이상의 링커 서열을 포함한다. 예를 들면, 막관통 도메인은 CAR의 세포외 성분을 세포내 성분에 연결하도록 사용될 수 있다. 결합 도메인에 막 근위인 스페이서 영역이라 대개 지칭되는 가요성 링커 서열은 결합 도메인과 세포막 사이의 추가 거리를 생성하도록 사용될 수 있다. 이는 막에 대한 근위성에 기초하여 결합에 대한 입체 장애를 감소시키는 데 유리할 수 있다. 이 목적에 사용된 흔한 스페이서 영역은 IgG4 링커이다. 더 촘촘한 스페이서 또는 더 긴 스페이서는 표적화된 세포 마커에 따라 사용될 수 있다. 다른 잠재적인 CAR 하위성분은 본원에서 어딘가에 더 자세히 기재되어 있다. CAR의 성분은 이제 하기와 같이 추가로 자세히 기재되어 있다: (a) 결합 도메인; (b) 세포내 신호전달 성분; (c) 링커; (d) 막관통 도메인; (e) 연접 아미노산; 및 (f) 태그 카세트를 포함하는 제어 특징.
CAR 분자 내의 막관통 도메인은 대개 세포막을 통해 세포외 성분 및 세포내 성분을 연결하도록 작용한다. 막관통 도메인은 변형된 세포의 막에서 발현된 분자를 앵커링할 수 있다.
막관통 도메인은 천연 원천 및/또는 합성 원천으로부터 유래될 수 있다. 원천이 천연일 때, 막관통 도메인은 임의의 막 결합된 단백질 또는 막관통 단백질로부터 유래될 수 있다. 막관통 도메인은 T-세포 수용체, CD28, CD27, CD3 epsilon, CD45, CD4, CD5, CD8, CD9, CD16, CD22; CD33, CD37, CD64, CD80, CD86, CD134, CD137 및 CD154의 α, β 또는 ξ 사슬의 적어도 막관통 영역(들)을 포함할 수 있다. 특정한 실시형태에서, 막관통 도메인은 예를 들면 KIRDS2, OX40, CD2, CD27, LFA-1(CD 11a, CD18), ICOS(CD278), 4-1BB(CD137), GITR, CD40, BAFFR, HVEM(LIGHTR), SLAMF7, NKp80(KLRF1), NKp44, NKp30, NKp46, CD160, CD19, IL2Rβ, IL2Rγ, IL7R a, ITGA1, VLA1, CD49a, ITGA4, IA4, CD49D, ITGA6, VLA-6, CD49f, ITGAD, CDl ld, ITGAE, CD103, ITGAL, CDl la, ITGAM, CDl lb, ITGAX, CDl lc, ITGB1, CD29, ITGB2, CD18, ITGB7, TNFR2, DNAM1(CD226), SLAMF4(CD244, 2B4), CD84, CD96(촉각), CEACAM1, CRT AM, Ly9(CD229), PSGL1, CD100(SEMA4D), SLAMF6(NTB-A, Lyl08), SLAM(SLAMF1, CD150, IPO-3), BLAME(SLAMF8), SELPLG(CD162), LTBR, PAG/Cbp, NKG2D 또는 NKG2C의 막관통 영역(들)을 적어도 포함할 수 있다. 특정한 실시형태에서, 또한 인간 Ig(면역글로빈) 힌지(예를 들면, IgG4 힌지, IgD 힌지), GS 링커(예를 들면, 본원에 기재된 GS 링커), KIR2DS2 힌지 또는 CD8a 힌지를 포함하여 여러 가지의 인간 힌지가 사용될 수 있다.
TCR은 천연 발생 T 세포 수용체를 지칭한다. 본 개시내용의 페이로드는 TCR 또는 TCR의 요소와 CAR의 요소를 포함하는 CAR/TCR 하이브리드를 암호화할 수 있다. 예를 들면, CAR/TCR 하이브리드는 TCR 결합 도메인이 자연적으로 회합되지 않은 효과기 도메인을 갖는 천연 발생 TCR 결합 도메인을 가질 수 있다. CAR/TCR 하이브리드는 돌연변이된 TCR 결합 도메인 및 ITAM 신호전달 도메인을 가질 수 있다. CAR/TCR 하이브리드는 삽입된 비천연 발생 스페이서 영역 또는 막관통 도메인을 갖는 천연 발생 TCR을 가질 수 있다.
I(C)(i)(b). 유전자 편집 시스템 및 성분
다양한 실시형태에서, 본 개시내용의 페이로드는 유전자 편집 시스템의 적어도 하나의 성분 또는 모든 성분을 암호화한다. 본 개시내용의 유전자 편집 시스템은 CRISPR 시스템, 염기 편집 및 프라임 편집 시스템을 포함한다. 광범위하게는, 유전자 편집 시스템은 CRISPR 연관된 RNA-가이드 엔도뉴클레아제, 염기 편집 효소 및 프라임 편집 효소 및 적어도 하나의 gRNA로부터 선택된 유전자 편집 효소를 포함하는 복수의 성분을 포함할 수 있다. 따라서, 본 개시내용의 유전자 편집 시스템은 (i) CRISPR 시스템의 경우에 CRISPR 연관된 RNA-가이드 엔도뉴클레아제 및 적어도 하나의 가이드 RNA(gRNA)인 CRISPR 효소, (ii) 염기 편집 시스템의 경우에 염기 편집 효소 및 적어도 하나의 gRNA, 또는 (iii) 프라임 편집 시스템의 경우에 적어도 하나의 프라임 편집 gRNA를 포함할 수 있다. 본원에 개시된 것과 같은 유전자 편집 시스템을 암호화하는 뉴클레오타이드 서열은 통상적으로 많은 제한된 용량 벡터 시스템에서의 포함에는 너무 크지만, 아데노바이러스 벡터의 큰 용량은 본 개시내용의 아데노바이러스 벡터 및 게놈에서의 이러한 서열의 포함을 허용한다. 본 개시내용의 유전자 편집 시스템 또는 성분을 암호화하는 페이로드를 갖는 아데노바이러스 벡터 및 게놈의 추가 이점은 아데노바이러스 게놈이 숙주 세포 게놈으로 자연적으로 통합하지 않는다는 것인데, 이는 예를 들면 면역원성 및/또는 유전독성을 피하기 위해 바람직할 수 있는 유전자 편집 시스템 및 성분의 일시적 발현이 수월하게 한다.
다른 실시형태에서, 유전자 편집 시스템은 조작된 징크 핑거 뉴클레아제(ZFN)를 포함할 수 있다. 예를 들면, ZFN은 FokI 제한 효소의 절단 도메인에 융합된 설계된 징크 핑거 단백질(ZFP)로 이루어진 인공 엔도뉴클레아제이다. ZFN은 새로운 서열 특이성을 갖는 ZFP를 개발함으로써 새로운 표적을 절단하도록 재설계될 수 있다. 게놈 조작을 위해, ZFN은 선택된 게놈 서열을 절단하도록 표적화된다. ZFN에 의해 유도된 절단 사건은 세포 회복 과정을 촉발하고, 이는 결국 표적화된 좌위의 효과적인 변형을 매개한다. ZFN 유도된 절단 사건이 비상동성 말단 연결을 통해 해결되면, 이는 작은 결실 또는 삽입을 생성시킬 수 있어서, 효과적으로 유전자 넉아웃으로 이어진다. 조사자 제공된 공여자의 존재 하에 상동성 기반 과정을 통해 파괴가 해결되면, 작은 변경 또는 전체 전이유전자는 대개 선택 없이 염색체로 운반될 수 있고; 이는 각각 '유전자 수정' 및 '유전자 부가'로 지칭된다.
일부 실시형태에서 유전자 편집 시스템(예를 들면, CRISPR 시스템, 염기 편집 시스템 또는 프라임 편집 시스템)은 예를 들면 γ-글로빈의 발현을 증가시키기 위해 γ-글로빈을 암호화하는 핵산 서열을 변형시키도록 조작된다. 헤모글로빈의 주요 태아 형태인 헤모글로빈 F(HbF)는 γ-글로빈 폴리펩타이드 아단위와 α-글로빈 폴리펩타이드 아단위의 쌍 짓기에 의해 형성된다. 인간 태아 γ -글로빈 유전자(HBG1 및 HBG2; 진화 중복에 의해 생성된 2개의 고도로 상동성인 유전자)는 출생 근처에서 보통 침묵화되지만, 성인 β-글로빈 유전자 발현(HBB 및 HBD)의 발현은 증가한다. 생애에 걸쳐 태아 γ-글로빈의 지속적인 발현을 야기하거나 허용하는 돌연변이는 β-글로빈 결핍증의 표현형을 개선할 수 있다. 따라서, 태아 γ-글로빈 유전자의 재활성화는 특히 β-글로빈 결핍증을 갖는 대상체에서 치료학적으로 유리할 수 있다. γ-글로빈의 증가된 발현을 야기하는 여러 가지의 돌연변이는 당해 분야에 알려져 있다(예를 들면, γ-글로빈의 발현을 증가시키는 돌연변이와 관련하여 본원에 그 전체가 참고로 포함된 Wienert, Trends in Genetics 34(12): 927-940, 2018 참조). 소정의 이러한 돌연변이는 HBG1 프로모터 또는 HBG2 프로모터에서 발견된다.
다양한 실시형태에서, γ-글로빈의 발현을 증가시키도록 설계된 유전자 편집 시스템은 BCL11A 리프레서 단백질 결합 부위의 변형 및/또는 불활성화에 의해 암호화하는 γ-글로빈의 발현을 증가시키도록 설계된 HBG1/2 프로모터 표적화된 gRNA를 포함한다. 다양한 실시형태에서, γ-글로빈의 발현은 증가시키도록 설계된 유전자 편집 시스템은 적혈구 세포에서 BCL11A 리프레서 단백질 발현을 감소시키기 위해 적혈구 bcl11a 인핸서의 변형 및/또는 불활성화에 의해 γ-글로빈의 발현을 증가시키도록 설계된 bcl11a 표적화된 gRNA를 포함한다. 다양한 실시형태에서, γ-글로빈의 발현을 증가시키도록 설계된 유전자 편집 시스템은 BCL11A를 암호화하는 유전자에서 기능 소실 돌연변이를 야기하도록 표적화된 gRNA를 포함한다.
I(C)(i)(b)(1). CRISPR 페이로드 발현 산물
CRISPR(클러스터링된 규칙적으로 이격된 짧은 회문 반복부)/Cas(CRISPR 연관된 단백질) 뉴클레아제 시스템은 박테리아 시스템에 기초한 유전 조작에 사용된 조작된 뉴클레아제 시스템이다. 이것은 부분적으로 많은 박테리아 및 고세균의 적응 면역 반응에 기초한다. 바이러스 또는 플라스미드가 박테리아를 침범할 때, 침범자의 DNA의 분절은 박테리아의 "면역" 반응에 의해 CRISPR RNA(crRNA)로 전환된다. 이후, crRNA는 부분 상보성의 영역을 통해 "프로토스페이서"라 칭하는 표적 DNA에서 crRNA에 동종성인 영역에 Cas 뉴클레아제를 가이드하기 위해 tracrRNA라 칭하는 RNA의 또 다른 유형과 회합한다. Cas 뉴클레아제는 crRNA 전사체 내에 함유된 20-뉴클레오타이드 상보성 가닥 서열에 의해 규정된 부위에서 이중 가닥 파괴에서 무딘 말단을 생성하도록 DNA를 절단한다. 일부 경우에, Cas 뉴클레아제는 부위 특이적 DNA 인식 및 절단을 위해 crRNA 및 tracrRNA 둘 다를 요한다.
가이드 RNA(gRNA)는 표적화 요소의 하나의 예이다. gRNA는 이의 가장 단순한 형태에서 상보성에 기초하여 게놈 내의 부위를 표적화하는 서열(예를 들면, crRNA)을 제공한다. 그러나, 하기에 설명된 것처럼, gRNA는 또한 추가 성분을 포함할 수 있다. 예를 들면, 특정한 실시형태에서, gRNA는 표적화 서열(예를 들면, crRNA) 및 표적화 서열을 절단 요소에 연결하기 위한 성분을 포함할 수 있다. 이 연결 성분은 tracrRNA일 수 있다. 특정한 실시형태에서, crRNA 및 tracrRNA를 포함하는 gRNA는 단일 gRNA(sgRNA)라 지칭되는 단일 분자로서 발현될 수 있다. gRNA는 또한 다른 기전을 통해, 예컨대 나노입자를 통해 또는 이중 목적 또는 다중 목적 분자의 발현 또는 작제를 통해 절단 요소에 연결될 수 있다. 당업자는 예를 들면 본 개시내용의 아데노바이러스 공여자 벡터 또는 게놈의 숙주 세포에서 선택된 핵산 서열 수정 또는 변형을 생성하기 위한 gRNA 또는 다른 표적화 요소가 예를 들면 이용 가능한 서열 정보에 기초하여 용이하게 설계되고 실행될 수 있다는 것을 이해할 것이다.
특정한 실시형태에서, 표적화 요소(예를 들면, gRNA)는 새로운 또는 향상된 특징(예를 들면, 개선된 안정성)을 갖는 핵산을 제공하도록 하나 이상의 변형(예를 들면, 염기 변형, 골격 변형)을 포함할 수 있다. 변형된 골격은 골격에서 인 원자를 보유하는 것 및 골격에서 인 원자를 갖지 않는 것을 포함할 수 있다. 인 원자를 함유하는 적합한 변형된 골격은 예를 들면 포스포로티오에이트, 키랄 포스포로티오에이트, 포스포로디티오에이트, 포스포트리에스테르, 아미노알킬포스포트리에스테르, 3'-알킬렌 포스포네이트, 5'-알킬렌 포스포네이트, 키랄 포스포네이트와 같은 메틸 및 다른 알킬 포스포네이트, 포스피네이트, 3'-아미노 포스포르아미데이트 및 아미노알킬포스포르아미데이트를 포함하는 포스포르아미데이트, 일반 3'-5' 연결을 갖는 포스포로디아미데이트, 티오노포스포르아미데이트, 티오노알킬포스포네이트, 티오노알킬포스포트리에스테르, 셀레노포스페이트 및 보라노포스페이트, 2'-5' 연결된 유사체, 및 반전 극성을 갖는 것(여기서, 하나 이상의 뉴클레오타이드간 연결은 3'에서 3' 연결, 5'에서 5' 연결 또는 2'에서 2' 연결임)을 포함할 수 있다. 반전 극성을 갖는 적합한 표적화 요소는 3'-가장 가까운 뉴클레오타이드간 연결에서 단일 3'에서 3' 연결(즉, 핵염기가 분실되거나 이것 대신에 하이드록실 기를 갖는 단일 반전된 뉴클레오사이드 잔기)을 포함할 수 있다. 다양한 염(예를 들면, 염화칼륨 또는 염화나트륨), 혼합 염 및 유리 산 형태가 또한 포함될 수 있다.
절단 요소의 예는 뉴클레아제를 포함한다. CRISPR-Cas 좌위는 50개 초과의 유전자 패밀리를 갖고 엄격하게 보편적인 유전자가 없어서, 좌위 구성의 신속한 진화 및 극도의 다양성을 나타낸다. 예시적인 Cas 뉴클레아제는 Casl, CaslB, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9(Csnl 및 Csxl2로도 알려짐), CaslO, Cpfl, C2c3, C2c2 및 C2clCsyl, Csy2, Csy3, Csel, Cse2, Cscl, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmrl, Cmr3, Cmr4, Cmr5, Cmr6, Cpfl, Csbl, Csb2, Csb3, Csxl7, Csxl4, CsxlO, Csxl6, CsaX, Csx3, Csxl, Csxl5, Csfl, Csf2, Csf3 및 Csf4를 포함한다.
Cas 뉴클레아제의 3개의 주요 형태(I형, II형 및 III)형 및 5개의 I형, 3개의 II형 및 2개의 III형 단백질을 포함하는 10개의 하위유형이 있다(예를 들면, Hochstrasser and Doudna, Trends Biochem Sci, 2015:40(l):58-66 참조). II형 Cas 뉴클레아제는 Casl, Cas2, Csn2 및 Cas9를 포함한다. 이 Cas 뉴클레아제는 당업자에게 알려져 있다. 예를 들면, 스트렙토코커스 피요게네스 야생형 Cas9 폴리펩타이드의 아미노산 서열은 예를 들면 NCBI 기준 서열 번호 NP 269215에 기재되어 있고, 스트렙토코커스 써모필로스 야생형 Cas9 폴리펩타이드의 아미노산 서열은 예를 들면 NCBI 기준 서열 번호 WP_011681470에 기재되어 있다.
특정한 실시형태에서, Cas9는 RNA-가이드 이중 가닥 DNA 결합 뉴클레아제 단백질 또는 닉카제 단백질을 지칭한다. 야생형 Cas9 뉴클레아제는 상이한 DNA 가닥을 절단하는 2개의 기능적 도메인, 예를 들면 RuvC 및 HNH를 갖는다. Cas9는 기능적 도메인 둘 다가 활성일 때 게놈 DNA(표적 DNA)에서 이중 가닥 파괴를 유도할 수 있다. Cas9 효소는, 일부 실시형태에서, 코리네박터, 수테렐라, 레지오넬라, 트레포네마, 필리프 악터, 유박테륨, 스트렙토코커스, 박토바실러스, 마이코플라스마, 박테로이데스, 플라비볼라, 플라보박테륨, 스페로체타, 아조필릴륨, 글루코나세토박터, 나이세리아, 로세부리아, 파르비바큘륨, 스타필로코커스, 니트라티프락터 및 캄필로박터와 같은 박테리아로부터 유래된 Cas9 단백질의 하나 이상의 촉매 도메인을 포함한다. 일부 실시형태에서, Cas9는 융합 단백질이고, 예를 들면 2개의 촉매 도메인은 상이한 박테리아 종으로부터 유래된다.
일부 실시형태에서, crRNA 및 tracrRNA는 단일 gRNA(sgRNA)라 칭하는 1개의 분자로 조합될 수 있다. 이 조작된 접근법에서, sgRNA는 Cas를 가이드하여 임의의 원하는 서열을 표적화한다(예를 들면, Jinek 등, Science 337:816-821, 2012; Jinek 등, eLife 2:e00471, 2013; Segal, eLife 2:e00563, 2013 참조). 따라서, CRISPR/Cas 시스템은 세포의 게놈에서 원하는 표적에서 이중 가닥 파괴를 생성하고 HDR 또는 NHEJ에 의한 유도된 파괴를 회복하는 세포의 내인성 기전을 이용하도록 조작될 수 있다. 본원에 기재된 특정한 실시형태는 한정된 통합 부위에서 HDR을 촉진하도록 상동성 아암을 이용한다.
다양한 실시형태에서, Cas9 뉴클레아제의 변이체는 단일 불활성 촉매 도메인, 예컨대 RuvC" 또는 HNH" 효소 또는 닉카제를 포함한다. Cas9 닉카제는 오직 하나의 활성 기능적 도메인을 갖고, 일부 실시형태에서, 표적 DNA의 오직 하나의 가닥을 절단하여서, 단일 가닥 파괴 또는 닉을 생성한다. 일부 실시형태에서, 적어도 D10A 돌연변이를 갖는 돌연변이체 Cas9 뉴클레아제는 Cas9 닉카제이다. 다른 실시형태에서, 적어도 H840A 돌연변이를 갖는 돌연변이체 Cas9 뉴클레아제는 Cas9 닉카제이다. Cas9 닉카제에 존재하는 돌연변이의 다른 예는 N854A 및 N863 A를 포함한다. 이중 가닥 파괴는 반대의 DNA 가닥을 표적화하는 적어도 2개의 DNA 표적화 RNA가 사용되면 Cas9 닉카제를 사용하여 도입된다. 이중 닉킹된 유도된 이중 가닥 파괴는 HDR 또는 NHEJ에 의해 회복된다. 이 유전자 편집 전략은 일반적으로 HDR을 선호하고 오프 표적 DNA 부위에서 삽입-결실 돌연변이의 빈도를 감소시킨다. Cas9 뉴클레아제 또는 닉카제는, 일부 실시형태에서, 표적 세포 또는 표적 유기체에 대해 코돈 최적화된다.
I(C)(i)(b)(2). 염기 에디터 페이로드 발현 산물
본 개시내용은, 다른 것들 중에서, 염기 편집 제제 및 이를 암호화하는 핵산을 포함하고, 예를 들면 염기 편집 제제 또는 이를 암호화하는 핵산은 아데노바이러스 벡터 또는 게놈에 존재한다. 염기 편집 시스템은 이의 성분으로서 염기 편집 효소 및/또는 적어도 하나의 gRNA를 포함할 수 있다. 소정의 특정한 실시형태에서, 본 개시내용의 염기 편집 제제 및/또는 염기 편집 시스템은 Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 아데노바이러스 벡터에 존재한다.
염기 편집은 게놈 DNA 또는 세포 RNA 내의 염기 또는 염기 쌍을 상이한 염기 또는 염기 쌍으로 전환함으로써 핵산 서열의 선택적 변형을 지칭한다(Rees & Liu, Nature Reviews Genetics, 19:770-788, 2018). (i) 구아닌-시토신 염기 쌍을 티민-아데닌 염기 쌍으로 전환하는 시토신 염기 에디터(CBE) 및 (ii) 아데닌-티민 염기 쌍을 구아닌 시토신 염기 쌍으로 전환하는 아데닌 염기 에디터(ABE)인 DNA 염기 에디터의 2개의 일반 종류가 있다. 특정한 실시형태에서, CRISPR 시스템으로부터의 성분은, 예를 들면 돌연변이된 핵산에서 하나 이상의 이중 가닥 파괴를 만들거나 야기하거나 생성하지 않으면서, 예를 들면 DNA 또는 RNA로 핵산에서의 점 돌연변이와 같은 돌연변이를 직접적으로 설치하거나 야기하거나 생성하기 위해 다른 효소 또는 이의 생물학적 활성 단편과 조합된다. 성분의 소정의 이러한 조합은 염기 에디터로 알려져 있다.
DNA 염기 에디터는 핵염기 데아미나제 효소 및 일부 경우에 DNA 글리코실라제 억제제에 융합된 촉매적으로 불가능해진 뉴클레아제를 포함할 수 있다. RNA 염기 에디터는 RNA를 염기 변형시키는 성분을 사용하여 유사한 변경을 달성한다.
DNA에서의 이의 표적 좌위에 대한 결합 시, 가이드 RNA와 표적 DNA 가닥 사이의 염기 쌍 짓기는 단일 가닥 DNA의 작은 분절의 대체로 이어진다. 이 단일 가닥 DNA 버블 내의 DNA 염기는 데아미나제 효소에 의해 변형될 수 있다. 특정 실시형태에서, 진핵 세포에서의 효율을 개선하기 위해, 촉매적으로 불가능해진 뉴클레아제는 또한 비편집된 DNA 가닥에서 닉을 생성하여서, 세포가 주형으로서 편집된 가닥을 사용하여 비편집된 가닥을 회복하게 유도한다.
CBE에 대해, CRISPR 기반 에디터는 시토신 데아미나제를 Cas 닉카제, 예를 들면 Cas9 닉카제(nCas9)에 의해 연결함으로써 생성될 수 있다. 하나의 예를 제공하기 위해, nCas9는 단일 가닥을 절단함으로써 표적 DNA에서 닉을 생성할 수 있어서, 이중 가닥 파괴를 요하는 방법과 비교하여 결정적인 삽입-결실 형성의 가능성을 감소시킨다. CBE는 DNA와의 결합 후 표적 시토신(C)을 우라실(U) 염기로 탈아미노화한다. 나중에 생성된 U-G 쌍은 세포 미스매치 회복 기계에 의해 회복되어서 우라실 글리코실라제에 의해 매개된 염기 절제 회복에 의해 원래의 C-G 쌍이 T-A로 전환되거나 원래의 C-G로 재전환되게 한다. 다양한 실시형태에서, 페이로드에 존재하는 우라실 글리코실라제 억제제(UGI), 예를 들면 UGI의 발현은 제2 결과의 발생을 감소시키고 T-A 염기 쌍 형성의 생성을 증가시킨다.
아데노신 염기 에디터(ABE)에 대해, 아데닌 염기 편집에 대해 DNA에 작용할 수 있는 예시적인 아데노신 데아미나제는 이의 기질로서 DNA를 수용하는 돌연변이체 TadA 아데노신 데아미나제(TadA*)를 포함한다. 이. 콜라이 TadA는 통상적으로 운반 RNA(tRNA)에서 아데노신을 탈아미노화하는 동종이합체로서 작용한다. TadA* 데아미나제는 세포 중합효소에 의해 'G'로서 처리되는 표적 'A'의 'I'(이노신)로의 전환을 촉매화한다. 후속하여, 원래의 게놈 A-T 염기 쌍은 G-C 쌍으로 전환될 수 있다. 세포 이노신 절제 회복이 우라실 절제만큼 활성이 아니므로, ABE는 CBE에서 UGI와 같은 임의의 추가 억제제 단백질을 요하지 않는다. 일부 실시형태에서, 통상적인 ABE는 염기 편집 동안 구조적 역할을 할 수 있는 야생형 이. 콜라이 tRNA 특이적 아데노신 데아미나제(TadA) 단량체, 데옥시아데노신 탈아미노화를 촉매화하는 TadA* 돌연변이체 TadA 단량체 및 Cas 닉카제, 예컨대 Cas9(D10A)를 포함하는 3개의 성분을 포함할 수 있다. 특정 실시형태에서, TadA와 TadA* 사이에 배치된 링커가 있고, 특정 실시형태에서 TadA*와 Cas 닉카제 사이에 배치된 링커가 있다. 다양한 실시형태에서, 1개 또는 둘 다의 링커는 적어도 6개의 아미노산, 예를 들면 적어도 5개, 6개, 7개, 8개, 9개, 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개 또는 50개의 아미노산을 포함한다(예를 들면, 5개, 6개, 7개, 8개, 9개, 10개 또는 15개의 아미노산의 하한 및 20개, 25개, 30개, 35개, 40개, 45개 또는 50개의 아미노산의 상한을 가짐). 다양한 실시형태에서, 1개 또는 둘 다의 링커는 32개의 아미노산을 포함한다. 일부 실시형태에서, 1개 또는 둘 다의 링커는 (SGGS)2-XTEN-(SGGS)2에 따른 서열 또는 당업자에게 달리 알려진 서열을 갖는다.
염기 에디터는 1개의 염기 또는 염기 쌍을 또 다른 염기 또는 염기 쌍으로 직접적으로 전환할 수 있어서, 과도한 원치 않는 편집 부산물, 예컨대 삽입 및 결실(삽입-결실)을 생성하지 않으면서 비분열 세포에서의 점 돌연변이의 효율적인 설치가 가능하게 한다. 예를 들면, 염기 에디터는 10%, 9%, 8%, 7%, 6%, 5.5%, 5%, 4.5%, 4%, 3.5%, 3%, 2.5%, 2%, 1.5%, 1%, 0.5% 또는 0.1% 미만의 삽입-결실을 생성할 수 있다.
DNA 염기 에디터는 이중 가닥 파괴를 생성하지 않으면서 비분열 세포에서 이러한 점 돌연변이를 삽입할 수 있다. 이중 가닥 파괴의 결여로 인해, 염기 에디터는 과도한 원치 않는 편집 부산물, 예컨대 삽입 및 결실(삽입-결실)을 생성시키지 않는다. 예를 들면, 염기 에디터는 이중 가닥 파괴에 의존하는 기술과 비교하여 10%, 9%, 8%, 7%, 6%, 5.5%, 5%, 4.5%, 4%, 3.5%, 3%, 2.5%, 2%, 1.5%, 1%, 0.5% 또는 0.1%보다 적은 삽입-결실을 생성할 수 있다.
대부분의 염기-편집 시스템의 성분은 (1) 표적화된 DNA 결합 단백질, (2) 핵염기 데아미나제 효소 및 (3) DNA 글리코실라제 억제제를 포함한다.
CRISPR 시스템의 임의의 뉴클레아제는 불가능해지고 염기 편집 시스템 내에 사용될 수 있다. 예시적인 Cas 뉴클레아제는 Casl, CaslB, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9(또한 알려진 as Csnl 및 Csxl2), CaslO, Cpfl, C2c3, C2c2 및 C2clCsyl, Csy2, Csy3, Csel, Cse2, Cscl, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmrl, Cmr3, Cmr4, Cmr5, Cmr6, Cpfl, Csbl, Csb2, Csb3, Csxl7, Csxl4, CsxlO, Csxl6, CsaX, Csx3, Csxl, Csxl5, Csf1, Csf2, Csf3, Csf4 및 이들의 돌연변이를 포함한다.
특정한 실시형태는 촉매적으로 불가능해진 뉴클레아제로서 뉴클레아제-불활성 Cas9(dCas9)를 사용한다. 그러나, CRISPR 시스템의 임의의 뉴클레아제(이들 중 많은 것은 상기에 기재되어 있음)는 불가능해지고 염기 편집 시스템 내에 사용될 수 있다. 특정한 실시형태에서, 높은 신뢰도를 갖는 Cas9 도메인이 선택되고, Cas9 도메인은 야생형 Cas9 도메인과 비교하여 Cas9 도메인과 DNA의 당-포스페이트 골격 사이에 감소된 정전 상호작용을 나타낸다. 일부 실시형태에서, Cas9 도메인(예를 들면, 야생형 Cas9 도메인)은 Cas9 도메인과 DNA의 당-포스페이트 골격 사이의 회합을 감소시키는 하나 이상의 돌연변이를 포함한다. 높은 신뢰도를 갖는 Cas9 도메인은 당업자에게 알려져 있다. 예를 들면, 높은 신뢰도를 갖는 Cas9 도메인은 Kleinstiver, 등, Nature 529, 490-495, 2016; 및 Slaymaker 등, Science 351, 84-88, 2015에 기재되어 있다.
다른 유전자-편집 시스템으로부터의 뉴클레아제가 또한 사용될 수 있다. 예를 들면, 염기-편집 시스템은 징크 핑거 뉴클레아제(ZFN)(Urnov 등, Nat Rev Genet., 11(9):636-46, 2010) 및 전사 활성자 유사 효과기 뉴클레아제(TALEN)(Joung 등, Nat Rev Mol Cell Biol. 14(1):49-55, 2013)를 이용할 수 있다. DNA 결합 뉴클레아제에 대한 추가 정보에 대해, US2018/0312825A1을 참조한다.
특정한 실시형태에서, 핵염기 데아미나제 효소는 시티딘 데아미나제 도메인 또는 아데닌 데아미나제 도메인을 포함한다.
특정한 실시형태는 핵염기 데아미나제 효소로서 시티딘 데아미나제 도메인을 이용한다. 특정한 실시형태는 핵염기 데아미나제 효소로서 아데닌 데아미나제 도메인을 이용한다. 추가로, 특정한 실시형태는 글리코실라제 억제제로서 우라실 글리코실라제 억제제(UGI)를 이용한다. 예를 들면, 특정한 실시형태에서, dCas9 또는 Cas9 닉카제는 시티딘 데아미나제 도메인에 융합될 수 있다. 시티딘 데아미나제 도메인에 융합된 dCas9 또는 Cas9 닉카제는 하나 이상의 UGI 도메인에 융합될 수 있다. 1개 초과의 UGI 도메인을 갖는 염기 에디터는 더 적은 삽입-결실을 생성할 수 있고 더 효율적으로 표적 핵산을 탈아미노화한다.
특정한 실시형태에서, 데아미나제 도메인(시티딘 및/또는 아데닌)은 촉매적으로 불가능해진 뉴클레아제의 N 말단에 융합된다. 이는 Cas9의 N 말단에 융합된 시티딘 데아미나제 도메인이 다른 구성과 비교할 때 개선된 염기-편집 효율을 가질 수 있기 때문이다. 이들 실시형태에서, 글리코실라제 억제제(예를 들면, UGI 도메인)는 촉매적으로 불가능해진 뉴클레아제의 C 말단에 융합될 수 있다. 다수의 글리코실라제 억제제가 사용될 때, 각각은 촉매적으로 불가능해진 뉴클레아제의 C 말단에 융합될 수 있다.
특정한 실시형태에서, 시티딘 데아미나제 도메인을 이용하는 CBE는 우라실을 생성하도록 시토신의 엑소사이클릭 아민을 탈아미노화함으로써 구아닌-시토신 염기 쌍을 티민-아데닌 염기 쌍으로 전환한다. 시토신 데아미나제 효소의 예는 APOBEC1, APOBEC3A, APOBEC3G, CDA1 및 AID를 포함한다. APOBEC1은 특히 기질로서 단일 가닥 (ss)DNA를 수용하지만 이중 가닥 (ds)DNA에 작용할 수 없다.
대부분의 염기-편집 시스템은 또한 의도된 염기 편집을 달리 회복시키는 천연 DNA 회복 기전을 중단시키도록 작용하는 DNA 글리코실라제 억제제를 포함한다. 특정한 실시형태에서, DNA 글리코실라제 억제제는 우라실 글리코실라제 억제제, 예컨대 Wang 등 (Gene 99, 31-37, 1991)에 기재된 우라실 DNA 글리코실라제 억제제 단백질(UGI)을 포함한다.
염기 에디터의 성분은 직접적으로(예를 들면, 직접적인 공유 결합에 의해) 또는 링커를 통해 융합될 수 있다. 예를 들면, 촉매적으로 불가능해진 뉴클레아제는 링커를 통해 데아미나제 효소 및/또는 글리코실라제 억제제에 융합될 수 있다. 다수의 글리코실라제 억제제는 또한 링커를 통해 융합될 수 있다. 당업자에 의해 이해되는 것처럼, 링커는 임의의 펩타이드 또는 이의 일부를 연결하도록 사용될 수 있다.
예시적인 링커는 중합체성 링커(예를 들면, 폴리에틸렌, 폴리에틸렌 글리콜, 폴리아미드, 폴리에스테르); 아미노산 링커; 탄소-질소 결합 아미드 링커; 사이클릭 또는 비사이클릭, 치환된 또는 비치환된, 분지된 또는 비분지된 지방족 또는 헤테로지방족 링커; 단량체성, 이합체성 또는 중합체성 아미노알칸산 링커; 아미노알칸산(예를 들면, 글리신, 에탄산, 알라닌, β-알라닌, 3-아미노프로판산, 4-아미노부탄산, 5-펜탄산) 링커; 단량체성, 이합체성 또는 중합체성 아미노헥산산(Ahx) 링커; 카보사이클릭 모이어티(예를 들면, 사이클로펜탄, 사이클로헥산) 링커; 아릴 또는 헤테로아릴 모이어티 링커; 및 페닐 고리 링커를 포함한다.
링커는 또한 펩타이드로부터의 친핵체(예를 들면, 티올, 아미노)의 링커로의 부착을 수월하게 하도록 기능화된 모이어티를 포함할 수 있다. 임의의 친전자체는 링커의 일부로서 사용될 수 있다. 예시적인 친전자체는 활성화된 에스테르, 활성화된 아미드, 마이클(Michael) 억셉터, 알킬 할라이드, 아릴 할라이드, 아실 할라이드 및 이소티오시아네이트를 포함한다.
특정한 실시형태에서, 링커는 4개 내지 100개의 아미노산 길이 범위이다. 특정한 실시형태에서, 링커는 4개의 아미노산, 9개의 아미노산, 14개의 아미노산, 16개의 아미노산, 32개의 아미노산 또는 100개의 아미노산이다.
표적화된 DNA 결합 단백질을 시티딘 데아미나제 효소 및 DNA 글리코실라제 억제제(예를 들면, UGI)와 연결함으로써 형성된 많은 염기-편집(BE) 시스템이 기재되어 있다. 이 복합체는 예를 들면 BE1([APOBEC1-16 아미노산(aa) 링커-Sp dCas9(D10A, H840A)] Komer 등, Nature, 533, 420-424, 2016), BE2([APOBEC1-16aa 링커-Sp dCas9(D10A, H840A)-4aa 링커-UGI] 상기 Komer 등, 2016 참조), BE3([APOBEC1-16aa 링커-Sp nCas9(D10A)-4aa 링커-UGI] 상기 Komer 등, 참조), HF-BE3([APOBEC1-16aa 링커-HF nCas9(D10A)-4aa 링커-UGI] Rees 등, Nat. Comm un. 8, 15790, 2017), BE4, BE4max([APOBEC1-32aa 링커-Sp nCas9(D10A)-9aa 링커-UGI-9aa 링커-UGI] Koblan 등, Nat. Biotechnol 10.1038/nbt.4172, 2018; Komer 등, Sci. Adv., 3, eaao4774, 2017), BE4-GAM([Gam-16aa 링커-APOBEC1-32aa 링커-Sp nCas9(D10A)-9aa 링커-UGI-9aa 링커-UGI] 상기 Komer 등, 2017 참조), YE1-BE3([APOBEC1(W90Y, R126E)-16aa 링커-Sp nCas9(D10A)-4aa 링커-UGI] Kim 등, Nat. Biotechnol. 35, 475-480, 2017), EE-BE3([APOBEC1(R126E, R132E)-16aa 링커-Sp nCas9(D10A)-4aa 링커-UGI] 상기 Kim 등, 2017 참조), YE2-BE3([APOBEC1(W90Y, R132E)-16aa 링커-Sp nCas9(D10A)-4aa 링커-UGI] 상기 Kim 등, 2017 참조), YEE-BE3([APOBEC1(W90Y, R126E, R132E)-16aa 링커-Sp nCas9(D10A)-4aa 링커-UGI] 상기 Kim 등, 2017 참조), VQR-BE3([APOBEC1-16aa 링커-Sp VQR nCas9(D10A)-4aa 링커-UGI] 상기 Kim 등, 2017 참조), VRER-BE3([APOBEC1-16aa 링커-Sp VRER nCas9(D10A)-4aa 링커-UGI] Kim 등, Nat. Biotechnol. 35, 475-480, 2017), Sa-BE3([APOBEC1-16aa 링커-Sa nCas9(D10A)-4aa 링커-UGI] 상기 Kim 등, 2017 참조), SA-BE4([APOBEC1-32aa 링커-Sa nCas9(D10A)-9aa 링커-UGI-9aa 링커-UGI] 상기 Komer 등, 2017 참조), SaBE4-Gam([Gam-16aa 링커-APOBEC1-32aa 링커-Sa nCas9(D10A)-9aa 링커-UGI-9aa 링커-UGI] 상기 Komer 등, 2017 참조), SaKKH-BE3([APOBEC1-16aa 링커-Sa KKH nCas9(D10A)-4aa 링커-UGI] 상기 Kim 등, 2017 참조), Cas12a-BE([APOBEC1-16aa 링커-dCas12a-14aa 링커-UGI], Li 등, Nat. Biotechnol. 36, 324-327, 2018), 표적-AID([Sp nCas9(D10A)-100aa 링커-CDA1-9aa 링커-UGI] Nishida 등, Science, 353, 10.1126/science.aaf8729, 2016), 표적-AID-NG([Sp nCas9(D10A)-NG-100aa 링커-CDA1-9aa 링커-UGI] Nishimasu 등, Science, 361(6408): 1259-1262, 2018), xBE3([APOBEC1-16aa 링커-xCas9(D10A)-4aa 링커-UGI] Hu 등, Nature, 556, 57-63, 2018), eA3A-BE3([APOBEC3A(N37G)-16aa 링커-Sp nCas9(D10A)-4aa 링커-UGI] Gerkhe 등, Nat. Biotechnol., 10.1038/nbt.4199, 2018), A3A-BE3([hAPOBEC3A-16aa 링커-Sp nCas9(D10A)-4aa 링커-UGI] Wang 등, Nat. Biotechnol. 10.1038/nbt.4198, 2018) 및 BE-PLUS([10X GCN4-Sp nCas9(D10A) / ScFv-rAPOBEC1-UGI] Jiang 등, Cell. Res, 10.1038/s41422-018-0052-4, 2018)를 포함한다. 아데닌 데아미나제 염기 에디터를 포함하는 BE 복합체의 추가 예에 대해 Rees & Liu Nat. Rev Genet. 19(12): 770-788, 2018을 참조한다.
염기 에디터에 관한 추가 정보를 위해, US2018/0312825A1, WO2018/165629A, Urnov 등, Nat Rev Genet. 11(9):636-46, 2010; Joung 등, Nat Rev Mol Cell Biol. 14(1):49-55, 2013; Charpentier 등, Nature.; 495(7439):50-1, 2013; Seo & Kim, Nature Medicine, 24, 1493-1495, 2018 및 Rees & Liu, Nature Reviews Genetics, 19, 770-78, 2018을 참조하고, 이들의 각각은 특히 염기 에디터와 관련하여 본원에 그 전문이 참고로 포함된다. 본 개시내용의 다양한 실시형태에서 사용될 수 있는 소정의 염기 에디터 작제물은 Zafra 등, Nat Biotech, 36(9):888-893, 2018 및 Koblan 등, Nat Biotech 36(9):843-846, 2018에 기재되어 있고, 이들의 각각은 특히 염기 에디터 작제물과 관련하여 본원에 그 전문이 참고로 포함된다.
I(C)(i)(b)(3). 프라임 에디터 페이로드 발현 산물
프라임 편집은 정확하고 표적화된 방식으로 모든 가능한 유형의 점 돌연변이, 작은 삽입 및 작은 결실을 도입할 수 있다. 프라임 에디터는 Cas9 닉카제 도메인(예를 들면, 불활성화된 HNH 뉴클레아제) 및 조작된 역전사효소 도메인을 포함하는 융합 단백질이다. 프라임 에디터 효소는 이의 스페이서 서열에서 표적 부위를 규정할 뿐만 아니라 통상적으로 pegRNA의 3' 말단에 있는 연장부에서 원하는 편집을 암호화하는 조작된 프라임 편집 gRNA(pegRNA)에 의해 편집 부위로 표적화된다.
적어도 3개의 프라임 에디터 시스템이 규명되었다. PE1은 Cas9 닉카제와 야생형 몰로니 쥣과 백혈병 바이러스(M-MLV) 역전사효소(RT)의 융합을 포함한다. PE2는 PE1과 유사하지만 편집 효율을 약 3배만큼 증가시키는 조작된 펜타돌연변이체 M-MLV RT를 포함한다. PE3은 PE2 융합 단백질 및 pegRNA를 닉킹을 위해 비편집된 가닥을 표적화하는 추가 sgRNA와 조합한다. PE3b라 칭하는 PE3 시스템의 변이체는 오직 편집된 서열을 표적화하는 닉킹 sgRNA를 포함하여서 다른 가닥이 편집된 서열로 전환될 때까지 비편집된 DNA 가닥의 닉킹을 방지함으로써 삽입-결실 산물의 수준을 감소시킨다.
I(C)(i)(c). 작은 RNA 페이로드 발현 산물
작은 RNA는 유전자 발현을 조절하는 역할을 하는 짧은 비암호화 RNA 분자이다. 특정한 실시형태에서, 작은 RNA는 200개 미만의 뉴클레오타이드 길이이다. 특정한 실시형태에서, 작은 RNA는 100개 미만의 뉴클레오타이드 길이이다. 특정한 실시형태에서, 작은 RNA는 50개, 45개, 40개, 35개, 30개, 25개 또는 20개 미만의 뉴클레오타이드 길이이다. 특정한 실시형태에서, 작은 RNA는 20개 미만의 뉴클레오타이드 길이이다. 다양한 실시형태에서 작은 RNA는 5개, 10개, 15개, 20개, 25개 또는 30개의 뉴클레오타이드의 하한 및 20개, 25개, 30개, 35개, 40개, 45개, 50개, 75개 또는 100개의 뉴클레오타이드의 상한을 갖는 길이를 갖는다. 작은 RNA는 마이크로RNA(miRNA, 피위(Piwi)-상호작용 RNA(piRNA), 소형 간섭 RNA(siRNA), 작은 핵 RNA(snoRNA), tRNA 유래된 작은 RNA(tsRNA) 작은 rDNA 유래된 RNA(srRNA) 및 작은 핵 RNA를 포함하지만, 이들로 제한되지는 않는다. 작은 RNA의 추가 종류는 계속해서 발견된다.
특정한 실시형태에서, 표적 mRNA에 상동성이거나 간섭 RNA가 혼성화할 수 있는 간섭 RNA 분자는 RNA 간섭(RNAi)이라 지칭되는 과정인 표적 mRNA 분자의 분해 또는 표적 mRNA의 감소된 번역으로 이어질 수 있다(Carthew, Curr. Opin. Cell. Biol. 13: 244-248, 2001). RNAi는 세포에서 외래 RNA(예를 들면, 바이러스 RNA)를 제거하도록 자연적으로 발생한다. 일부 경우에, 천연 RNAi는 유리 이중 가닥 RNA(dsRNA)로부터 절단된 단편을 통해 진행하고, 이는 다른 유사한 RNA 서열에 대한 분해 기전을 지시한다. 대안적으로, RNAi는 예를 들면 표적 유전자의 발현을 침묵화하도록 제조될 수 있다. 예시적인 RNAi 분자는 작은 헤어핀 RNA(shRNA, 짧은 헤어핀 RNA로도 지칭된) 및 소형 간섭 RNA(siRNA)를 포함한다.
본 개시내용을 제한하지 않으면서 그리고 이론에 의해 구속되지 않으면서, 자연에서 및/또는 일부 실시형태에서 RNA 간섭은 통상적으로 2단계 과정이다. 제1 단계인 개시 단계에서, 유입 dsRNA는 아마도 ATP 의존적 방식으로 (직접적으로 또는 전이유전자 또는 바이러스를 통해 도입된) dsRNA를 가공하는(절단하는) dsRNA 특이적 리보뉴클레아제의 리보뉴클레아제(RNAe) III 패밀리의 구성원인 다이서(Dicer)의 작용에 의해 21개 내지 23개 뉴클레오타이드(nt) siRNA로 분해된다. 계속적인 절단 사건은 RNA를 각각 2-뉴클레오타이드 3' 오버행을 갖는 19개 내지 21개 염기 쌍(bp) 듀플렉스(siRNA)로 절단한다.
제2 단계인 효과기 단계에서, siRNA 듀플렉스는 뉴클레아제 복합체에 결합하여 RNA 유도된 침묵화 복합체(RISC)를 형성한다. siRNA 듀플렉스의 ATP 의존적 풀림은 RISC의 활성화에 필요하다. 이후, 활성 RISC는 염기 쌍 짓기 상호작용에 의해 상동성 전사체를 표적화하고, 통상적으로 mRNA를 siRNA의 3' 말단으로부터 12개의 뉴클레오타이드 단편으로 절단한다. 조사는 각각의 RISC가 단일 siRNA 및 RNAe를 함유한다는 것을 나타낸다.
RNAi의 현저한 효력 때문에, RNAi 경로 내의 증폭 단계가 제안되었다. 더 많은 siRNA를 생성하는 유입 dsRNA의 카피 또는 형성된 siRNA의 복제에 의해 증폭이 발생할 수 있다. 대안적으로 또는 추가적으로, 증폭은 RISC의 다수의 턴오버 사건에 의해 실행될 수 있다.
ShRNA는 헤어핀 루프 구조를 갖는 단일 가닥 폴리뉴클레오타이드이다. 단일 가닥 폴리뉴클레오타이드는 이중 가닥 영역에서의 하나의 가닥의 3' 말단 및 이중 가닥 영역에서의 다른 가닥의 5' 말단을 연결하는 루프 분절을 갖는다. 이중 가닥 영역은 표적 서열에 혼성화 가능한 제1 서열, 예컨대 전이유전자를 암호화하는 폴리뉴클레오타이드 및 제1 서열에 상보성인 제2 서열로부터 형성되어서, 제1 서열 및 제2 서열은 헤어핀 루프 구조를 형성하기 위해 연결 서열이 말단을 연결하는 이중 가닥 영역을 형성한다. 제1 서열은 전이유전자를 암호화하는 폴리뉴클레오타이드의 임의의 부분에 혼성화 가능할 수 있다. shRNA의 이중 가닥 줄기 도메인은 제한 엔도뉴클레아제 부위를 포함할 수 있다.
shRNA의 전사는 중합효소 III(Pol III) 프로모터에서 개시되고, 4-5-티민 전사 종결 부위의 2번 위치에서 종결되는 것으로 생각된다. shRNA는 발현 시 3' UU-오버행을 갖는 줄기-루프 구조로 폴딩하는 것으로 생각되고; 후속하여 이들 shRNA의 말단은 가공되어서, shRNA를 21개 내지 23개 뉴클레오타이드의 siRNA 유사 분자로 전환한다.
shRNA의 줄기-루프 구조는 선택적인 뉴클레오타이드 오버행, 예컨대 2-bp 오버행, 예를 들면 3' UU 오버행을 가질 수 있다. 변이가 있을 수 있지만, 줄기는 통상적으로 15 내지 49, 15 내지 35, 19 내지 35, 21 내지 31 bp 또는 21 내지 29 bp의 범위이고, 루프는 4 내지 30 bp, 예를 들면 4 내지 23 bp의 범위일 수 있다. 특정한 실시형태에서, shRNA 서열은 45-65 bp; 50-60 bp; 또는 51, 52, 53, 54, 55, 56, 57, 58 또는 59 bp를 포함한다. 특정한 실시형태에서, shRNA 서열은 52 또는 55 bp를 포함한다. 특정한 실시형태에서 siRNA는 15-25 bp를 갖는다. 특정한 실시형태에서 siRNA는 16, 17, 18, 19, 20, 21, 22, 23 또는 24 bp를 갖는다. 특정한 실시형태에서 siRNA는 19 bp를 갖는다. 그러나, 당업자는 16개 미만의 뉴클레오타이드 또는 24개 초과의 뉴클레오타이드의 길이를 갖는 siRNA가 또한 RNAi를 매개하도록 작용할 수 있다는 것을 이해할 것이다. 더 긴 RNAi 제제는 바람직하지 않을 수 있는 소정의 포유류 세포에서 인터페론 또는 단백질 키나제 R(PKR) 반응을 일으키는 것으로 입증되었다. 바람직하게는 RNAi 제제는 PKR 반응을 일으키지 않는다(즉, 충분히 짧은 길이를 가짐). 그러나, 더 긴 RNAi 제제는 예를 들면 PKR 반응이 대안적인 수단에 의해 하향조절되거나 축소되는 상황에서 유리할 수 있다.
소정의 예시적인 실시형태에서, 본 개시내용은 BCL11A를 암호화하는 유전자에 표적화된 shRNA를 암호화하는 아데노바이러스 벡터 페이로드를 포함하고, shRNA는 BCL11A의 감소된 번역을 야기한다.
I(C)(ii). 페이로드 조절 서열
I(C)(ii)(a). 프로모터 조절 서열
프로모터는 RNA 중합효소가 전사를 개시시키기 전에 결합하는 관련 암호화 서열에 보통 상류(5')인 비암호화 게놈 DNA 서열일 수 있다. 이 결합은 RNA 중합효소를 정렬시켜서, 특이적 전사 개시 부위에서 전사가 개시할 것이다. 프로모터의 뉴클레오타이드 서열은 효소 및 이것에 부착하는 다른 관련된 단백질 인자의 성질 및 RNA 합성의 속도를 결정한다. RNA는 암호화된 폴리펩타이드의 아미노산 서열로의 RNA 서열의 번역을 위한 주형으로서 작용하는 메신저 RNA(mRNA)를 생성하도록 가공된다. 5' 비번역된 리더 서열은 mRNA의 개시 및 번역에서 역할을 할 수 있는 암호화 영역의 상류에서의 mRNA의 영역이다. 3' 전사 종결/폴리아데닐화 신호는 RNA 합성의 종결 및 폴리아데닐레이트 뉴클레오타이드의 3' 말단에 대한 첨가를 야기하도록 식물 세포에서 기능하는 암호화 영역의 하류에서의 비번역된 영역이다.
프로모터는 일반 프로모터, 조직 특이적 프로모터, 세포 특이적 프로모터 및/또는 세포질에 특이적인 프로모터를 포함할 수 있다. 프로모터는 강한 프로모터, 약한 프로모터, 구성적 발현 프로모터 및/또는 유도성 (조건적) 프로모터를 포함할 수 있다. 유도성 프로모터는 소정의 조건, 신호 또는 세포 사건에 반응하여 발현을 지시하거나 제어한다. 예를 들면, 프로모터는 프로모터로부터의 전사를 실행하도록 특정한 리간드, 소분자, 전사 인자, 호르몬 또는 호르몬 단백질을 요하는 유도성 프로모터일 수 있다. 프로모터의 특정한 예는 AFP(α-태아단백질) 프로모터, 아밀라제 1C 프로모터, 아쿠아스포린-5(AP5) 프로모터, αl -항트립신 프로모터, β-act 프로모터, β-글로빈 프로모터, β-Kin 프로모터, B29 프로모터, CCKAR 프로모터, CD14 프로모터, CD43 프로모터, CD45 프로모터, CD68 프로모터, CEA 프로모터, c-erbB2 프로모터, COX-2 프로모터, CXCR4 프로모터, 데스민 프로모터, E2F-1 프로모터, 인간 연장 인자 lα 프로모터(EFlα), CMV(사이토메갈로바이러스 바이러스) 프로모터, minCMV 프로모터, SV40(유인원 바이러스 40) 즉시 초기 프로모터, EGR1 프로모터, eIF4A1 프로모터, 엘라스타제-1 프로모터, 엔도글린 프로모터, FerH 프로모터, FerL 프로모터, 피브로넥틴 프로모터, Flt-1 프로모터, GAPDH 프로모터, GFAP 프로모터, GPIIb 프로모터, GRP78 프로모터, GRP94 프로모터, HE4 프로모터, hGR1/1 프로모터, hNIS 프로모터, Hsp68 프로모터, Hsp68 최소 프로모터(proHSP68), HSP70 프로모터, HSV-1 바이러스 TK 유전자 프로모터, hTERT 프로모터, ICAM-2 프로모터, 칼리크레인 프로모터, LP 프로모터, 주요 후기 프로모터(MLP), Mb 프로모터, Rho 프로모터, MT(메탈로티오네인) 프로모터, MUC1 프로모터, NphsI 프로모터, OG-2 프로모터, PGK(포스포 글리세레이트 키나제) 프로모터, PGK-1 프로모터, 중합효소 III(Pol III) 프로모터, PSA 프로모터, ROSA 프로모터, SP-B 프로모터, Survivn 프로모터, SYN1 프로모터, SYT8 유전자 프로모터, TRP1 프로모터, Tyr 프로모터, 유비퀴틴 B 프로모터, WASP 프로모터 및 라우스 육종 바이러스(RSV) 긴 말단 반복부(LTR) 프로모터를 포함한다.
프로모터는 자연적 프로모터 또는 복합 프로모터로서 얻어질 수 있다. 자연적 프로모터 또는 최소 프로모터는 소정의 유전자의 5' 영역으로부터의 뉴클레오타이드 서열을 포함하는 프로모터를 지칭한다. 자연적 프로모터는 코어 프로모터 및 이의 천연 5'UTR을 포함한다. 특정한 실시형태에서, 5'UTR은 인트론을 포함한다. 복합 프로모터는 상이한 기원의 프로모터 요소를 조합함으로써 또는 원위 인핸서를 동일한 기원 또는 상이한 기원의 최소 프로모터와 조합함으로써 유래된 프로모터를 지칭한다.
특정한 실시형태에서, 프로모터는 야생형 프로모터 서열 및 야생형 프로모터에 비해 소정의 위치에서 선택적인 변경(삽입, 점 돌연변이 또는 결실을 포함)을 갖는 서열을 포함한다. 특정한 실시형태에서, 프로모터는 20개의 뉴클레오타이드 스트레치당 1개의 변경, 20개의 뉴클레오타이드 스트레치당 2개의 변경, 20개의 뉴클레오타이드 스트레치당 3개의 변경, 20개의 뉴클레오타이드 스트레치당 4개의 변경 또는 20개의 뉴클레오타이드 스트레치당 5개의 변경을 가짐으로써 천연 발생 프로모터로부터 변한다. 특정한 실시형태에서, 천연 서열은 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 10개의 염기에서 변경될 것이다. 프로모터는 다른 바이러스 서열과 함께 또는 이것 없이 LTR 서열의 50개의 뉴클레오타이드 내지 LTR 서열의 100개, 200개, 250개 또는 350개의 뉴클레오타이드를 포함하여 길이가 변할 수 있다.
일부 프로모터는 조직 또는 세포에 특이적이고, 일부 프로모터는 조직 또는 세포에 비특이적이다. 포유류 세포에서의 각각의 유전자는 이의 자체의 프로모터를 갖고, 일부 프로모터는 소정의 세포 유형에서 오직 활성화될 수 있다. 비특이적 프로모터 또는 편재한 프로모터는 넓은 범위의 세포, 조직 및 세포 주기에서 프로모터 서열에 작동 가능하게 연결된 유전자 또는 뉴클레오타이드 서열의 전사의 개시를 보조한다. 특정한 실시형태에서, 프로모터는 비특이적 프로모터이다. 특정한 실시형태에서, 비특이적 프로모터는 CMV 프로모터, RSV 프로모터, SV40 프로모터, 포유류 연장 인자 1α(EF1α) 프로모터, β-act 프로모터, EGR1 프로모터, eIF4A1 프로모터, FerH 프로모터, FerL 프로모터, GAPDH 프로모터, GRP78 프로모터, GRP94 프로모터, HSP70 프로모터, β-Kin 프로모터, PGK-1 프로모터, ROSA 프로모터 및/또는 유비퀴틴 B 프로모터를 포함한다.
특이적 프로모터는 프로모터 서열에 작동 가능하게 연결된 뉴클레오타이드 서열의 세포 특이적 발현을 보조한다.
I(C)(ii)(b). 마이크로 RNA 부위 조절 서열
다양한 실시형태에서, 마이크로RNA(또는 miRNA) 제어 시스템은 유전자의 발현이 마이크로RNA 부위(예를 들면, 마이크로RNA가 상호작용할 수 있는 핵산 서열)의 존재에 의해 조절되는 방법 또는 조성물을 지칭할 수 있다. 다양한 실시형태에서, 본 개시내용은 발현 산물의 발현이 존재, 수준, 활성 및/또는 상응하는 miRNA와의 접촉에 의해 제어되도록 발현 산물을 암호화하는 핵산 서열이 miRNA 표적 부위에 작동 가능하게 연결되어서 페이로드를 포함하는 아데노바이러스 공여자 벡터를 포함한다. 의심을 피하기 위해 본 개시내용은 예를 들면 본원에 개시된 것과 같은 miRNA 부위와 작동 가능하게 연결된 핵산 서열이 예를 들면 본원에 제공된 임의의 하나 이상의 발현 산물을 암호화하는 핵산 서열일 수 있다는 것을 고려한다.
I(C)(iii). 선택 서열
특정한 실시형태에서 벡터는 선택 카세트를 포함하는 선택 요소를 포함한다. 특정한 실시형태에서, 선택 카세트는 프로모터, 선택 제제에 대한 내성을 부가하거나 부여하는 cDNA 및 이 독립적 전사 요소의 전사의 중단이 가능하게 하는 폴리 A 서열을 포함한다.
선택 카세트는 (a) 항생제 또는 다른 독소에 내성을 부여하거나, (b) 영양요구성 결핍을 보완하거나, (c) 복합 배지로부터 이용 가능하지 않은 중요한 영양소, 예를 들면 바실러스에 대한 D-알라닌 라세마제를 암호화하는 유전자를 공급하는 하나 이상의 단백질을 암호화할 수 있다. 임의의 수의 선택 시스템은 형질전환된 세포주를 회수하도록 사용될 수 있다. 특정한 실시형태에서, 양성 선택 카세트는 네오마이신, 하이그로마이신, 암피실린, 퓨로마이신, 플레오마이신, 제오마이신, 블라스티시딘 또는 비오마이신에 대한 내성 유전자를 포함한다. 특정한 실시형태에서, 양성 선택 카세트는 메토트렉세이트에 대한 내성을 제공하는 DHFR(디하이드로폴레이트 환원효소) 유전자, O6BG/BCNU에 대한 내성을 담당하는 MGMTP140K 유전자, HAT 선택 배지에 존재하는 특정 염기(아미노프테린, 하이폭산틴, 티미딘)의 형질전환을 담당하는 HPRT(하이폭산틴포스포리보실 전환효소) 유전자 및 일부 약물과 관련하여 해독을 위한 다른 유전자를 포함한다. 특정한 실시형태에서, 선택 제제는 네오마이신, 하이그로마이신, 퓨로마이신, 플레오마이신, 제오마이신, 블라스티시딘, 비오마이신, 암피실린, O6BG/BCNU, 메토트렉세이트, 테트라사이클린, 아미노프테린, 하이폭산틴, 티미딘 키나제, DHFR, Gln 합성효소 또는 ADA를 포함한다.
특정한 실시형태에서, 음성 선택 카세트는 유전자를 발현하는 세포에 대한 독성 물질로 배양 배지에 존재하는 기질의 형질전환을 위한 유전자를 포함한다. 이 분자는 디프테리아 독소(DTA)의 해독 유전자(Yagi 등, Anal Biochem. 214(1):77-86, 1993; Yanagawa 등, Transgenic Res. 8(3):215-221, 1999), 간시클로버의 존재에 민감한 헤르페스 바이러스의 키나제 티미딘 유전자(HSV TK) 또는 FIAU를 포함한다. HPRT 유전자는 또한 배지로의 6-티오구아닌(6TG)의 첨가에 의해 음성 선택으로서 사용될 수 있고, 모든 양성 선택 및 음성 선택에 대해 가장 전통적인 것인 상이한 기원으로부터의 폴리 A 전사 종결 서열은 SV40 폴리 A 또는 진핵 유전자 폴리 A(소 성장 호르몬, 토끼 β-글로빈 등)로부터 유래된다.
특정한 실시형태에서, 선택 카세트는 Olszko 등 (Gene Therapy 22: 591-595, 2015)에 기재된 것과 같은 MGMTP140K를 포함한다. 특정한 요소에서, 선택 제제는 O6BG/BCNU를 포함한다.
인간 알킬 구아닌 전환효소(hAGT)를 암호화하는 약물 내성 유전자 MGMT는 알킬화 제제, 예컨대 니트로소우레아 및 테모졸로마이드(TMZ)의 세포독성 효과에 대한 내성을 부여하는 DNA 회복 단백질이다. 6-벤질구아닌(6-BG)은 니트로소우레아 독성을 강화하고 이 제제의 세포독성 효과를 강화하도록 TMZ와 공통투여되는 AGT의 억제제이다. AGT의 변이체를 암호화하는 MGMT의 몇몇 돌연변이체 형태는 6-BG에 의한 불활화에 대해 고도로 내성이지만, DNA 손상을 회복하는 이의 능력을 보유한다(Maze 등, J. Pharmacol. Exp. Ther. 290: 1467-1474, 1999). MGMTP140K 기반 약물 내성 유전자 치료는 마우스, 개과, 레서스 마카크 및 인간 세포, 구체적으로는 조혈 세포에 대한 화학보호를 부여하는 것으로 나타났다(Zielske 등, J. Clin. Invest. 112: 1561-1570, 2003; Pollok 등, Hum. Gene Ther. 14: 1703-1714, 2003; Gerull 등, Hum. Gene Ther. 18: 451-456, 2007; Neff 등, Blood 105: 997-1002, 2005; Larochelle 등, J. Clin. Invest. 119: 1952-1963, 2009; Sawai 등, Mol. Ther. 3: 78-87, 2001).
특정한 실시형태에서, 생체내 선택 카세트와의 조합은 유전자 수정된 세포의 선택적 이익 없이 질환에 대한 중요한 성분일 것이다. 예를 들면, SCID 및 일부 다른 면역결핍증 및 FA에서, 수정된 세포는 이점을 갖고, 오직 치료학적 유전자를 "몇몇" HSPC로 형질도입하는 것이 치료 효능에 충분하다. 치료학적으로 변형된 세포가 경쟁적 이점을 나타내지 않는 헤모글로빈병증(즉, 겸상 세포 질환 및 지중해빈혈)과 같은 다른 질환에 대해, 예를 들면 생체내 선택 카세트, 예컨대 MGMTP140K의 발현을 위해 변형된 세포의 생체내 선택은 몇몇 형질도입된 HSPC에 대해 선택할 것이고, 이는 유전자 수정된 세포의 증가를 허용하고 치료 효능을 달성할 것이다. 이 접근법은 또한 생체외 유전 변형보다는 생체내 HIV에 대해 HSPC를 내성으로 만듦으로써 HIV에 적용될 수 있다.
I(C)(iv). 스터퍼 서열
특정한 실시형태에서, 벡터는 스터퍼 서열을 포함한다. 특정한 실시형태에서, 스터퍼 서열은 게놈이 야생형 길이의 크기 근처의 크기가 되게 하도록 첨가될 수 있다. 스터퍼는 게놈의 길이를 연장시키도록 의도된 기능적으로 불활성인 서열을 정의하도록 의도된 당해 분야에서 일반적으로 인정된 용어이다.
스터퍼 서열은 벡터의 효과적인 패키징 및 안정성을 달성하도록 사용된다. 특정한 실시형태에서, 스터퍼 서열은 게놈 크기가 야생형 바이러스의 것의 70% 내지 110%가 되게 하도록 사용된다.
스터퍼 서열은 바람직하게는 포유류 기원의 임의의 DNA일 수 있다. 본 발명의 바람직한 실시형태에서, 스터퍼 서열은 포유류 기원의 비암호화 서열, 예를 들면 인트론 단편이다.
스터퍼 서열은 벡터의 크기를 미리 결정된 크기로 유지시키기 위해 사용될 때 임의의 비암호화 서열 또는 분열 세포 또는 비분열 세포에서 게놈이 안정하게 있게 하는 서열일 수 있다. 이 서열은 다른 바이러스 게놈(예를 들면, 엡스테인 바 바이러스) 또는 유기체(예를 들면, 효모)로부터 유래될 수 있다. 예를 들면, 이 서열은 센트로머 및/또는 텔로머의 기능적 부분일 수 있다.
I(C)(v). 페이로드 통합 및 지지 벡터
유전자 치료는 대개 표적 세포의 게놈으로의 원하는 핵산 페이로드의 통합을 요한다. 여러 가지의 시스템은 숙주 또는 표적 세포 게놈으로의 페이로드의 통합을 위해 설계되고/되거나 사용될 수 있다. 다양한 이러한 시스템은 소정의 페이로드 서열 특징 및 지지 벡터 및 지지 게놈(지지 게놈) 중 하나 이상을 포함할 수 있다.
페이로드를 숙주 세포 게놈으로 통합하는 아데노바이러스 벡터를 조작하는 하나의 수단은 통합하는 바이러스 하이브리드 벡터를 생성하는 것이었다. 통합하는 바이러스 하이브리드 벡터는 표적 세포를 효율적으로 형질도입하는 벡터의 유전 요소를 이의 벡터 페이로드를 안정하게 통합하는 벡터의 유전 요소와 조합한다. 예를 들면, 아데노바이러스 벡터와 조합하여 사용하기 위한 관심 있는 통합 요소는 박테리오파지 인터그라제 PHiC31, 레트로트랜스포손, (예를 들면, LTR 매개된 또는 레트로바이러스 인터그레이트 매개된) 레트로바이러스, 징크 핑거 뉴클레아제, DNA 결합 도메인-레트로바이러스 인터그라제 융합 단백질, AAV(예를 들면, AAV-ITR 또는 AAV-Rep 단백질 매개된) 및 슬리핑 뷰티(SB) 트랜스포사제의 것을 포함한다.
본원에 기재된 Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 벡터는 트랜스포사제 및 트랜스포손을 포함하는 전위 가능한 요소를 선택적으로 포함할 수 있다. 트랜스포사제는 레트로트랜스포손으로부터의 또는 레트로바이러스 기원의 인터그라제뿐만 아니라 전위를 할 수 있고 전위를 매개하는 기능적 핵산-단백질 복합체의 성분인 효소를 포함할 수 있다. 전위 반응은 트랜스포손 및 트랜스포사제 또는 인터그라제 효소를 포함한다. 특정한 실시형태에서, 통합의 효율, 통합될 수 있는 DNA 서열의 크기 및 게놈으로 통합될 수 있는 DNA 서열의 카피의 수는 이러한 전위 가능한 요소를 사용함으로써 개선될 수 있다. 트랜스포손은 DNA의 더 큰 분절의 상류 및 하류에 말단 반복부 서열을 갖는 짧은 핵산 서열을 포함한다. 트랜스포사제는 말단 반복부 서열에 결합하고, 게놈의 또 다른 부분으로의 트랜스포손의 이동을 촉매화한다.
인간을 포함하는 척추동물의 게놈으로의 핵산의 삽입을 수월하게 하는 다수의 트랜스포사제가 당해 분야에 기재되어 있다. 이러한 트랜스포사제의 예는 슬리핑 뷰티(예를 들면, 살모니드 어류의 게놈으로부터 유래된 "SB"); 피기백(예를 들면, 인시목 세포 및/또는 미오티스 루시푸구스(Myotis lucifugus)로부터 유래됨); 마리너(예를 들면, 드로소필라로부터 유래됨); 개구리 왕자(예를 들면, 라나 피피엔스(Rana pipiens)로부터 유래됨); Tol1; Tol2(예를 들면, 메다카 어류(medaka fish)로부터 유래됨); TcBuster(예를 들면, 거짓쌀도둑거저리 트리보리움 카스타네움(Tribolium castaneum)으로부터 유래됨), Helraiser, Himar1, Passport, Minos, Ac/Ds, PIF, Harbinger, Harbinger3-DR, HSmar1 및 spinON을 포함한다.
PiggyBac(PB) 트랜스포사제는 예를 들면 Fraser 등, Insect Mol. Biol., 1996, 5, 141-51; Mitra 등, EMBO J., 2008, 27, 1097-1109; Ding 등, Cell, 2005, 122, 473-83; 및 미국 특허 제6,218,185호; 제6,551,825호; 제6,962,810호; 제7,105,343호; 및 제7,932,088호에 기재된 작은 기능적 트랜스포사제 단백질이다. 과활성 piggyBac 트랜스포사제는 US 제10,131,885호에 기재되어 있다.
DNA 트랜스포손에 대한 추가 정보는 예를 들면 Munoz-Lopez & Garcia Perez, Curr Genomics, 11(2):115-128, 2010에서 찾아볼 수 있다.
슬리핑 뷰티는 Ivics 등 Cell 91, 501-510, 1997; Izsvak 등, J. Mol. Biol., 302(1):93-102, 2000; Geurts 등, Molecular Therapy, 8(1): 108-117, 2003; Mates 등 Nature Genetics 41:753-761, 2009; 및 미국 특허 제6,489,458호; 제7,148,203호; 및 제7,160,682호; 미국 공보 제2011/117072호; 제2004/077572호; 및 제2006/252140호에 기재되어 있다. 특정 실시형태에서, 슬리핑 뷰티 트랜스포사제 효소는 과활성 슬리핑 뷰티 SB100x 트랜스포사제 효소이다. SB 트랜스포손은 원형화된 핵산 분자에 존재할 때 가장 효율적으로 전위된다(Yant 등, Nature Biotechnology, 20: 999-1005, 2002).
SB 트랜스포사제의 활성을 증가시키도록 체계적 돌연변이유발 연구가 수행되었다. 예를 들면, Yant 등은 알라닌에 대한 SB 트랜스포사제의 N 말단 95 AA의 체계적 교환을 수행하였다(Mol. Cell Biol. 24: 9239-9247, 2004). 이들 치환의 10개는 기준으로서 SB10과 비교하여 200% 내지 400%의 과활성을 야기하였다. Baus 등 (Mol. Therapy 12: 1148-1156, 2005)에 기재된 SB16은 SB10과 비교하여 16배 활성을 갖는 것으로 보고되었다. 추가 과활성 SB 변이체는 Zayed 등 (Molecular Therapy 9(2):292-304, 2004) 및 US 제9,840,696호에 기재되어 있다.
SB 트랜스포사제는 SB ITR 사이에 배치된 핵산 트랜스포손 페이로드를 전위시킨다. 다양한 SB ITR은 당해 분야에 알려져 있다. 일부 실시형태에서, SB ITR은 트랜스포사제에 대한 인식 신호로서 작용하는 32 bp 길이의 불완전 직접 반복부를 포함하는 230 bp 서열이다.
다양한 실시형태에서, Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 공여자 벡터 또는 게놈은 β-글로빈 발현 산물 또는 γ-글로빈 발현 산물을 암호화하는 적어도 하나의 암호화 서열을 포함하는 통합 요소를 플랭킹하는 SB100x 트랜스포손 도립된 반복부를 포함하는 페이로드를 포함한다.
다양한 실시형태에서, 아데노바이러스 전위 시스템은 트랜스포손 도립된 반복부에 의해 플랭킹된 통합 요소를 포함하는 Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 공여자 벡터 또는 게놈을 포함하고, 아데노바이러스 지지 벡터 또는 지지 게놈을 추가로 포함할 수 있다. 다양한 실시형태에서, 지지 벡터는 (i) 아데노바이러스 캡시드; 및 (ii) 통합 요소를 플랭킹하는 도립된 반복부에 상응하는 트랜스포사제를 암호화하는 핵산 서열을 포함하는 아데노바이러스 지지 게놈을 포함한다. 따라서, 다양한 실시형태에서, 지지 벡터 또는 지지 게놈의 적어도 하나의 기능은 표적 세포에 투여된 공여자 벡터에 존재하는 통합 요소의 전위를 위해 트랜스포사제를 암호화하고/하거나 발현하고/하거나 표적 세포에 전달하도록 사용될 수 있다. 예를 들면, 일부 실시형태에서, Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 공여자 벡터 또는 게놈은 β-글로빈 발현 산물 또는 γ-글로빈 발현 산물을 암호화하는 적어도 하나의 암호화 서열을 포함하는 통합 요소를 플랭킹하는 SB100x 트랜스포손 도립된 반복부를 포함하고, 지지 벡터 또는 지지 게놈은 SB100x 트랜스포사제를 암호화하는 암호화 서열을 포함한다. 특정 실시형태에서, 통합 요소는 재조합효소 직접 반복부에 의해 플랭킹되고, 예를 들면 여기서 통합 요소는 트랜스포손 도립된 반복부에 의해 플랭킹되고, 트랜스포손 도립된 반복부는 재조합효소 직접 반복부에 의해 플랭킹된다. 소정의 이러한 실시형태에서, 지지 벡터 또는 지지 게놈의 적어도 하나의 기능은 표적 세포에 투여된 공여자 벡터에 존재하는 재조합효소 부위의 재조합을 위해 재조합효소를 암호화하고/하거나 발현하고/하거나 표적 세포에 전달하는 것일 수 있다. 다양한 실시형태에서, 지지 벡터 또는 지지 게놈은 표적 세포에 투여된 공여자 벡터에 존재하는 재조합효소 부위의 재조합을 위해 재조합효소를 암호화하고/하거나 발현하고/하거나 표적 세포에 전달하고, 또한 표적 세포에 투여된 공여자 벡터에 존재하는 통합 요소의 전위를 위해 트랜스포사제를 암호화하고/하거나 발현하고/하거나 표적 세포에 전달할 수 있다.
본원에 개시된 특정한 실시형태는 또한 부위 특이적 재조합효소 시스템을 사용한다. 이들 실시형태에서, 트랜스포사제 인식된 도립된 반복부를 포함하는 트랜스포손은 적어도 하나의 치료학적 유전자 이외에 또한 적어도 하나의 재조합효소 인식된 부위를 포함한다. 따라서, 특정한 실시형태에서, 본 개시내용은 또한 (a) 치료학적 유전자를 포함하는 트랜스포손(여기서, 치료학적 유전자는 (i) 트랜스포사제에 의해 인식된 도립된 반복부 서열 및 (ii) 재조합효소 인식된 부위에 의해 플랭킹됨); 및 b) 플라스미드, 에피솜 또는 전이유전자로부터 치료학적 유전자를 절제하도록 작용하고 치료학적 유전자를 게놈으로 통합하도록 작용하는 트랜스포사제 및 재조합효소를 투여하는 단계를 포함하는 치료학적 유전자를 게놈으로 통합하는 방법을 제공한다. 일부 실시형태에서, (b)의 단백질(들)은 단백질(들)을 암호화하는 핵산으로서 투여된다. 일부 실시형태에서, (b)의 단백질(들)을 암호화하는 트랜스포손 및 핵산은 별개의 벡터에 존재한다. 일부 실시형태에서, (b)의 단백질(들)을 암호화하는 트랜스포손 및 핵산은 동일한 벡터에 존재한다. (b)의 단백질(들)을 암호화하는 벡터의 부분은 동일한 벡터에 존재할 때 (a)의 트랜스포손을 보유하는 부분 밖에 위치한다. 바꾸어 말하면, 트랜스포사제 및/또는 재조합효소 암호화 영역은 도립된 반복부 및/또는 재조합효소-인식 부위에 의해 플랭킹된 영역의 외부에 위치한다. 상기 언급된 방법에서, 트랜스포사제 단백질은 삽입된 핵산, 예컨대 표적 세포 게놈으로 도입되어야 하는 핵산을 플랭킹하는 도립된 반복부를 인식한다. 재조합효소 및 재조합효소 인식된 부위의 사용은 추가로 게놈으로 통합될 수 있는 트랜스포손의 크기를 증가시킬 수 있다.
재조합효소 시스템의 예는 Flp/Frt 시스템, Cre/loxP 시스템, Dre/rox 시스템, Vika/vox 시스템 및 PhiC31 시스템을 포함한다. Flp/Frt DNA 재조합효소 시스템은 사카로마이세스 세레비시아에로부터 단리되었다. Flp/Frt 시스템은 이의 Frt 인식 부위에서 DNA-재조합을 촉매화하는 재조합효소 Flp(플립파제)를 포함한다. Flp 단백질의 변이체는 GenBank: ABD57356.1) 및 GenBank: ANW61888.1을 포함한다.
Cre/loxP 시스템은 예를 들면 EP 02200009B1에 기재되어 있다. Cre은 박테리오파지 P1로부터 단리된 부위 특이적 DNA 재조합효소이다. Cre 단백질의 인식 부위는 loxP 부위인 34개의 염기 쌍의 뉴클레오타이드 서열이다. Cre은 13개의 염기 쌍 도립된 반복부에 결합하고 가닥 절단 및 스페이서 영역 내의 재결찰을 촉매화함으로써 34 bp loxP DNA 서열을 재조합한다. 스페이서 영역에서 Cre에 의해 이루어진 지그재그 DNA 절단은 6개의 염기 쌍에 의해 분리되어 동일한 오버랩 영역을 갖는 재조합 부위만이 재조합하는 것을 보장하도록 상동성 센서로서 작용하는 오버랩 영역을 생성시킨다. 또한 사용될 수 있는 lox 인식 부위의 변이체는 lox2272; lox511; lox66; lox71; loxM2; 및 lox5171을 포함한다. VCre/VloxP 재조합효소 시스템은 비브리오 플라스미드 p0908로부터 단리되었다. sCre/SloxP 시스템은 WO 2010/143606에 기재되어 있다. Dre/rox 시스템은 US 제7,422,889호 및 US 제7,915,037B2호에 기재되어 있다. 이것은 일반적으로 엔테로 박테리아파지 D6 및 rox 인식 부위로부터 단리된 Dre 재조합효소를 포함한다. Vika/vox 시스템은 US 특허 제10,253,332호에 기재되어 있다. 추가적으로, PhiC31 재조합효소는 AttB/AttP 결합 부위를 인식한다.
트랜스포손(도립된 반복부 및/또는 재조합효소 인식 부위를 포함함)을 포함하는 벡터 핵산의 양 및 다양한 실시형태에서 세포로 도입된 트랜스포사제 및/또는 재조합효소를 암호화하는 벡터 핵산의 양은 원하는 절제 및 트랜스포손 핵산의 표적 세포 게놈으로의 삽입을 제공하기에 충분하다. 그러므로, 도입된 벡터 핵산의 양은 트랜스포사제 활성 및/또는 재조합효소 활성의 충분한 양 및 표적 세포 게놈으로 삽입되는 것이 원해지는 트랜스포손의 충분한 카피 수를 제공해야 한다. 특정한 실시형태는 트랜스포손 대 트랜스포사제/재조합효소의 1:1; 1:2; 또는 1:3 비를 포함한다.
해당 방법은 표적 세포 게놈으로의 핵산의 안정한 통합을 생성시킨다. 안정한 통합이란 핵산이 일시적 보다 긴 기간 동안 표적 세포 게놈에 존재하여 있고 염색체 유전 재료의 일부를 표적 세포의 자손으로 넘겨준다는 것을 의미한다.
이전에 표시된 것과 같이, 특정한 실시형태는 상동성 지시된 회복을 이용하여 유전 작제물의 표적화된 삽입이 수월하게 하도록 상동성 아암을 이용한다. 상동성 아암은 HDR을 이것과 이것이 상동성을 보유하는 게놈 서열 사이에 지지하기 위해, 예를 들면 절단 부위의 50개 이하의 염기 내에, 예를 들면 30개의 염기 내에, 15개의 염기 내에, 10개의 염기 내에, 5개의 염기 내에 또는 절단 부위를 바로 플랭킹하여 절단 부위에서의 게놈 서열과 충분한 상동성, 예를 들면 절단 부위를 플랭킹하는 뉴클레오타이드 서열과 70%, 80%, 85%, 90%, 95% 또는 100%의 상동성을 갖는 임의의 길이일 수 있다. 상동성 아암은 일반적으로 게놈 서열, 예를 들면 이중 가닥 파괴(DSB)가 발생하는 게놈 영역과 동일하다. 그러나, 표시된 것처럼, 절대 동일성이 필요하지 않다.
특정한 실시형태는 상동성 지시된 회복 주형과 표적화된 게놈 서열(또는 10개 내지 200개의 뉴클레오타이드 또는 초과의 임의의 통합 값) 사이의 25개, 50개, 100개 또는 200개의 뉴클레오타이드(nt) 또는 200 nt 초과의 서열 상동성을 갖는 상동성 아암을 이용할 수 있다. 특정한 실시형태에서, 상동성 아암은 40 내지 1000 nt 길이이다. 특정한 실시형태에서, 상동성 아암은 500개 내지 2500개의 염기 쌍, 700개 내지 2000개의 염기 쌍 또는 800개 내지 1800개의 염기 쌍이다. 특정한 실시형태에서, 상동성 아암은 적어도 800개의 염기 쌍 또는 적어도 850개의 염기 쌍을 포함한다. 상동성 아암의 길이는 또한 대칭적 또는 비대칭적일 수 있다.
특정한 실시형태는 표적 게놈의 상응하는 단편과 서열 동일성 또는 상동성을 갖는 적어도 25개, 50개, 100개, 200개, 400개, 600개, 800개, 1,000개, 1,200개, 1,400개, 1,600개, 1,800개, 2,000개, 2,500개 또는 3,000개 또는 초과의 뉴클레오타이드를 각각 포함하는 제1 상동성 아암 및/또는 제2 상동성 아암을 이용할 수 있다. 일부 실시형태에서, 제1 상동성 아암 및/또는 제2 상동성 아암은 각각 25개, 50개, 100개, 200개, 400개, 600개, 800개, 1,000개, 1,200개, 1,400개, 1,600개 또는 1,800개의 뉴클레오타이드의 하한 및 1,000개, 1,200개, 1,400개, 1,600개, 1,800개, 2,000개, 2,500개 또는 3,000개의 뉴클레오타이드의 상한을 갖는 표적 게놈의 상응하는 단편과 서열 동일성 또는 상동성을 갖는 다수의 뉴클레오타이드를 포함한다. 일부 실시형태에서, 제1 상동성 아암 및/또는 제2 상동성 아암은 각각 40개 내지 1,000개의 뉴클레오타이드, 500개 내지 2,500개의 뉴클레오타이드, 700개 내지 2,000개의 뉴클레오타이드 또는 800개 내지 1800개의 뉴클레오타이드이거나 적어도 800개의 뉴클레오타이드 또는 적어도 850개의 뉴클레오타이드의 길이를 갖는 표적 게놈의 상응하는 단편과 서열 동일성 또는 상동성을 갖는 다수의 뉴클레오타이드를 포함한다. 제1 상동성 아암 및 제2 상동성 아암은 동일한 길이, 유사한 길이 또는 상이한 길이를 가질 수 있다.
상동성 아암에 관한 추가 정보를 위해, Richardson 등, Nat Biotechnol. 34(3):339-44, 2016을 참조한다.
특정한 실시형태에서, 유전 작제물(예를 들면, 세포 내의 치료 생성물의 발현으로 이어지는 유전자)는 게놈 안전 항구 내에 정확히 삽입된다. 게놈 안전 항구 부위는 숙주 세포에 대한 불리한 효과 없이 새로 통합된 DNA의 예측 가능한 발현을 수용할 수 있는 게놈의 유전자내 영역 또는 유전자외 영역이다. 유용한 안전 항구는 암호화된 단백질의 원하는 수준을 생성하도록 충분한 전이유전자 발현을 허용해야 한다. 게놈 안전 항구 부위는 또한 세포 기능을 변경하지 않아야 한다. 게놈 안전 항구 부위를 확인하는 방법은 Sadelain 등, Nature Reviews 12:51-58, 2012; 및 Papapetrou 등, Nat Biotechnol. 29(1):73-8, 2011에 기재되어 있다. 특정한 실시형태에서, 게놈 안전 항구 부위는 (i) 임의의 게놈의 5' 말단으로부터의 적어도 50 kb의 거리, (ii) 임의의 암 관련된 유전자로부터의 적어도 300 kb의 거리, (iii) (천연 뉴클레아제 또는 조작된 뉴클레아제에 의한 DNA 절단에 의해 측정된) 개방/접근 가능한 염색질 구조 내, (iv) 유전자 전사 단위 밖의 위치 및 (v) 게놈의 초보존된 영역(UCR), 마이크로RNA 또는 긴 비암호화 RNA 밖의 위치의 기준 중 1개 이상(1개, 2개, 3개, 4개 또는 5개)을 충족한다.
특정한 실시형태에서, 게놈 안전 항구의 기준을 충족시키기 위해, 염색질 부위는 알려진 종양유전자로부터 150 kb 초과로 멀고, 알려진 전사 시작 부위로부터 30 kb 초과로 멀고; 암호화 mRNA와 중첩을 갖지 않아야 한다. 특정한 실시형태에서, 게놈 안전 항구의 기준을 충족시키기 위해, 염색질 부위는 알려진 종양유전자로부터 200 kb 초과로 멀고, 알려진 전사 시작 부위로부터 40 kb 초과로 멀고; 암호화 mRNA와 중첩을 갖지 않아야 한다. 특정한 실시형태에서, 게놈 안전 항구의 기준을 충족시키기 위해, 염색질 부위는 알려진 종양유전자로부터 300 kb 초과로 멀고, 알려진 전사 시작 부위로부터 50 kb 초과로 멀고; 암호화 mRNA와 중첩을 갖지 않아야 한다. 특정한 실시형태에서, 게놈 안전 항구는 이전의 기준(알려진 전사 시작 부위로부터 150 kb 초과, 200 kb 초과 또는 300 kb 초과로 멀고; 암호화 mRNA와 중첩을 갖지 않고, 암호화 mRNA와 중첩을 갖지 않는 알려진 전사 시작 부위로부터 40 kb 초과 또는 50 kb 초과로 멈)을 충족시키고, 추가적으로 관련 발견의 신속한 임상 번역을 허용하도록 관련 동물 모델의 동물과 인간 게놈 사이에 100% 상동성이다.
특정한 실시형태에서, 게놈 안전 항구는 본원에 기재된 기준을 충족시키고, 또한 렌티바이러스 통합의 1:1 비의 정방향:역방향 배향을 나타내고, 이는 좌위가 둘러싼 유전 재료에 영향을 미치지 않는다는 것을 추가로 나타낸다.
특정한 게놈 안전 항구 부위는 CCR5, HPRT, AAVS1, Rosa 및 알부민을 포함한다. 또한, 예를 들면 적절한 게놈 안전 항구 통합 부위에 대한 추가 정보 및 옵션을 위해 미국 특허 제7,951,925호 및 제8,110,379호; 미국 공보 제2008/0159996호; 제2010/00218264호; 제2012/0017290호; 제2011/0265198호; 제2013/0137104호; 제2013/0122591호; 제2013/0177983호 및 제2013/0177960호를 참조한다.
당해 분야에 알려진 다양한 기법은 특이적 게놈 좌위, 예컨대 게놈 안전 항구에서의 통합 요소의 통합을 지시하도록 사용될 수 있다. 예를 들면, AAV 매개된 유전자 표적화뿐만 아니라 부위 특이적 엔도뉴클레아제 (징크 핑거 뉴클레아제, 메가뉴클레아제, 전사 활성자 유사 효과기(TALE) 뉴클레아제) 및 CRISPR/Cas 시스템을 사용한 DNA 이중 가닥 파괴의 도입에 의해 향상된 상동성 재조합은 모두 미리 결정된 게놈 좌위, 예컨대 게놈 안전 항구에서의 외래 DNA의 표적화된 삽입을 매개할 수 있다.
특정 실시형태에서, 특이적 게놈 좌위, 예컨대 게놈 안전 항구에서의 통합 요소의 통합은 표적 게놈의 CRISPR 효소 매개된 절단을 사용한 상동성 지시된 통합을 포함할 수 있다. CRISPR 효소(예를 들면, Cas9)는 가이드 RNA(gRNA)에 의해 규정된 부위에서 이중 가닥 DNA를 절단한다. 공여자 주형(예컨대, 왼쪽 상동성 아암 및 오른쪽 상동성 아암을 포함하는 Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 페이로드 통합 요소)이 존재할 때 이중 가닥 파괴는 상동성 지시된 회복(HDR)에 의해 회복될 수 있다. 다양한 이러한 방법에서, 통합 요소는 이것이 절단된 표적 게놈으로의 삽입을 위해 (예를 들면, 500 내지 3,000 bp의) 왼쪽 상동성 아암 및 오른쪽 상동성 아암을 포함한다는 점에서 "회복 주형"이다. CRISPR 매개된 유전자 삽입은 DNA 주형의 자발적인 재조합과 비교하여 더 효과적인 규모의 몇 자리수일 수 있고, 이는 CRISPR 매개된 유전자 삽입이 게놈 편집에 대한 효과적인 도구일 수 있다는 것을 나타낸다. 규정된 게놈 좌위로의 핵산 서열의 상동성 지시된 통합의 예시적인 방법은 당해 분야에서 예를 들면 Richardson 등 (Nat Biotechnol. 34(3):339-44, 2016)에서 알려져 있다.
II. 표적 세포 집단
다양한 실시형태에서, 본 개시내용의 공여자 벡터 및 게놈은 조혈 줄기 세포(HSC)를 형질도입할 수 있다. HSC는 CD46에 결합함으로써 생체내 유전 변형에 대해 표적화될 수 있다. HSC 또는 이의 하위집단은 또한 CD34+; Lin-/CD34+/CD38-/CD45RA-/CD90+/CD49f+(HSC1); CD34+/CD38-/CD45RA-/CD90-/CD49f+/(HSC2)인 임의의 마커 프로파일에 의해 확인될 수 있다. 다양한 실시형태에서, 인간 HSC1은 CD34+/CD38-/CD45RA-/CD90+ 또는 CD34+/CD45RA-/CD90+인 임의의 프로파일에 의해 확인될 수 있고, 마우스 LT-HSC는 Lin-/Sca1+/ckit+/CD150+/CD48-/Flt3-/CD34-에 의해 확인될 수 있다(여기서 Lin은 CD3, Cd4, CD8, CD11b, CD11c, NK1.1, Gr1 및 TER119를 포함하는 성숙 세포의 임의의 마커의 발현의 부재를 나타낸다). 특정한 실시형태에서, HSC는 CD164+ 프로파일에 의해 확인된다. 특정한 실시형태에서, HSC는 CD34+/CD164+ 프로파일에 의해 확인된다. HSC 마커 프로파일에 관한 추가 정보를 위해, WO2017/218948호를 참조한다.
의심을 피하기 위해, 다양한 실시형태에서, 본 개시내용의 공여자 벡터 및 게놈은 CD34+ 조혈 세포를 감염시키고/시키거나 형질도입할 수 있다. 다양한 실시형태에서, 본 개시내용의 공여자 벡터 및 게놈은 CD34+/CD90+ 세포를 감염시키고/시키거나 형질도입할 수 있다. 다양한 실시형태에서, CD34+ 세포 및/또는 CD34+ 표현형은 예를 들면 실시예 6 및/또는 도 33에 제시된 것과 같이 표지된 항-CD34 항체와의 세포의 결합에 기초하여 예를 들면 CD34+를 발현하는 것으로 발견된 세포를 지칭할 수 있다. 다양한 실시형태에서, CD90+ 세포 및/또는 CD90+ 표현형은 예를 들면 실시예 6 및/또는 도 33에 제시된 것과 같이 표지된 항-CD90 항체와의 세포의 결합에 기초하여 예를 들면 CD90+를 발현하는 것으로 발견된 세포를 지칭할 수 있다. 다양한 실시형태에서, CD34+ 세포 및/또는 CD34+ 표현형은 CD34+에 지시된 라벨에 의해 가장 튼튼하게 표지된(예를 들면, 표지된 항-CD34 항체에 의해 가장 튼튼하게 표지된) 샘플 또는 집단에서의 세포를 지칭할 수 있다. 예를 들면, 샘플 또는 집단이 CD34+에 지시된 라벨에 의해 표지된 세포를 포함하는 다양한 실시형태에서, CD34+ 세포 및/또는 CD34+ 표현형은 (i) CD34%에 지시된 라벨에 의해 표지된 모든 세포를 지칭할 수 있거나, (ii) CD34에 지시된 라벨에 의해 가장 튼튼하게 표지된 세포의 99%, 98%, 97%, 96%, 95%, 90%, 85%, 80%, 75%, 70%, 65%, 60%, 55%, 50%, 45%, 40%, 35%, 30%, 25%, 20%, 15%, 10%, 5%, 4%, 3%, 2% 또는 1%를 지칭할 수 있고, CD34+ 세포는 선택적으로 CD34+고 세포로 지칭될 수 있다. 다양한 실시형태에서, 표지 및/또는 표지의 튼튼함은 제한 없이 라벨의 상대 존재, 예컨대 형광 라벨의 형광을 포함하는 당해 분야에 알려진 임의의 여러 가지의 방법에 의해 결정될 수 있다. 다양한 실시형태에서, 표지 및/또는 표지의 튼튼함은 형광 활성화 세포 분류(FACS)와 같은 방법을 포함하는 기법에 의해 측정될 수 있다. 따라서, 다양한 실시형태에서, CD34+/CD90+ 세포는 (i) CD34+ 세포이고/이거나 CD34+ 표현형을 갖는 것으로 결정되고, (ii) CD90+ 세포이고/이거나 CD90+ 표현형을 갖는 것으로 결정된 세포의 집단을 지칭할 수 있다. 다양한 실시형태에서, CD34+/CD90+ 세포는 (i) CD34+고 세포이고/이거나 CD34+고 표현형을 갖는 것으로 결정되고, (ii) CD90+ 세포이고/이거나 CD90+ 표현형을 갖는 것으로 결정된 CD34+고/CD90+ 세포의 집단을 지칭할 수 있다. 다양한 이러한 실시형태에서, 세포는 조혈 세포일 수 있다. 다양한 실시형태에서, 세포는 CD45RA-일 수 있다. 다양한 실시형태에서, 세포는 CD45RA+일 수 있다.
어떠한 특정한 과학적 이론에 의해 구속되고자 바라지 않으면서, 본 개시내용은 CD34+의 발현(예를 들면, CD34의 표지 및/또는 표지의 튼튼함)이 예를 들면 조혈 세포에서 본 개시내용의 벡터에 의한 CD46 발현 및/또는 감염에 대한 감수성 및/또는 형질도입과 상관할 수 있다는 것을 포함한다. 어떠한 특정한 과학적 이론에 의해 구속되고자 바라지 않으면서, 본 개시내용은 본원에 개시된 벡터가 CD34+ 세포, CD34+고 세포, CD34+/CD90+ 세포 및/또는 CD34+고/CD90+ 세포를 감염시키고/시키거나 형질도입하는 데 있어서 특히 유리하다(예를 들면, CD34+ 세포, CD34+고 세포, CD34+/CD90+ 세포 및/또는 CD34+고/CD90+ 세포를 선택적으로 감염시키고/시키거나 형질도입할 수 있음)는 것을 포함하고, 예를 들면 세포는 조혈 세포이다.
HSC는 제한 없이 TCR 및 CAR을 포함하는 본원에 제공된 다양한 페이로드를 암호화하고/하거나 발현하도록 야기될 수 있다(예를 들면, Gschweng 등 Immunol Rev. 2014 Jan; 257(1): 237-249 참조).
III. 투여량, 제형 및 투여
벡터는 이것이 세포 또는 동물, 예를 들면 인간에 대한 투여에 약학적으로 허용 가능하도록 제형화될 수 있다. 벡터는 시험관내, 생체외 또는 생체내 투여될 수 있다. 본원에 기재된 아데노바이러스 벡터는 대상체에 대한 투여를 위해 제형화될 수 있다. 제형은 치료제를 암호화하는 아데노바이러스 벡터 및 하나 이상의 약학적으로 허용 가능한 담체를 포함한다.
본원에 개시된 것과 같이, 벡터는 당해 분야에 알려진 임의의 형태일 수 있다. 이러한 형태는 예를 들면 액체, 반고체 및 고체 투여량 형태, 예컨대 액체 용액(예를 들면, 주사용 및 주입용 용액), 분산액 또는 현탁액, 정제, 환제, 산제, 리포솜 및 좌제를 포함한다.
임의의 특정한 형태의 선택 또는 사용은 부분적으로 의도된 투여 방식 및 치료 분야에 따라 달라질 수 있다. 예를 들면, 전신 전달 또는 국소 전달에 의도된 조성물을 함유하는 조성물은 주사용 또는 주입용 용액의 형태일 수 있다. 따라서, 벡터는 비경구 방식(예를 들면, 정맥내, 피하, 복강내 또는 근육내 주사)에 의한 투여를 위해 제형화될 수 있다. 본원에 사용된 것과 같이, 비경구 투여는 보통 주사에 의한 장관 투여 및 국소 투여 이외의 투여 방식을 지칭하고, 제한 없이, 정맥내, 비강내, 안와내, 폐, 근육내, 동맥내, 척추강내, 피막내, 안와내, 심장내, 진피내, 폐내, 복강내,경기관, 피하, 표피하, 관절내, 피막하, 지주막하, 척수내, 경막, 대뇌내, 두개내, 경동맥내 및 수조내 주사 및 주입을 포함한다. 비경구 투여 방식은 예를 들면 주사, 경비 투여, 폐경유 투여 또는 경피 투여에 의한 투여일 수 있다. 투여는 정맥내 주사, 근육내 주사, 복강내 주사, 피하 주사에 의해 전신 또는 국소일 수 있다.
다양한 실시형태에서, 본 발명의 벡터는 용액, 마이크로에멀션, 분산액, 리포솜 또는 높은 농도에서의 안정한 저장에 적합한 다른 순서화된 구조로서 제형화될 수 있다. 멸균 주사용 용액은 적절한 용매 중의 필요한 양의 본원에 기재된 조성물을 필요한 바대로 상기 열거된 성분 중 하나 또는 이들의 조합으로 혼입한 후, 멸균 여과하여 제조될 수 있다. 일반적으로, 분산액은 상기 열거된 것으로부터 염기성 분산 매질 및 필요한 다른 성분을 함유하는 멸균 비히클로 본원에 기재된 조성물을 혼입하여 제조된다. 멸균 주사용 용액의 제조를 위한 멸균 분말의 경우에, 제조 방법은 진공 건조 및 동결 건조를 포함하고, 이는 이의 이전에 멸균 여과된 용액으로부터 본원에 기재된 조성물과 임의의 추가 원하는 성분(하기 참조)의 분말을 생성시킨다. 용액의 적절한 유동성은 예를 들면 레시틴과 같은 코팅의 사용에 의해, 분산액의 경우에 필요한 입자 크기의 유지에 의해 및 계면활성제의 사용에 의해 유지될 수 있다. 주사용 조성물의 연장된 흡수는 조성물에 흡수를 지연시키는 시약, 예를 들면 모노스테아레이트 염 및 젤라틴을 포함시켜 일어날 수 있다.
벡터는 물 또는 또 다른 약학적으로 허용 가능한 액체에서 멸균 용액 또는 현탁액을 포함하는 주사용 제형의 형태로 비경구로 투여될 수 있다. 예를 들면, 벡터는 치료 분자를 약학적으로 허용 가능한 비히클 또는 배지, 예컨대 멸균수 및 생리학적 식염수, 식물성 오일, 유화제, 현탁 제제, 계면활성제, 안정화제, 향료 부형제, 희석제, 비히클, 보존제, 결합제와 적합하게 배합한 후, 일반적으로 허용된 약학 실행에 필요한 단위 용량 형태로 혼합함으로써 제형화될 수 있다. 약학 조제물에 포함된 벡터의 양은 지정된 범위 내의 적합한 용량이 제공되는 것이다. 유성 액체의 비제한적인 예는 참깨유 및 대두유를 포함하고, 이것은 가용화제로서 벤질 벤조에이트 또는 벤질 알코올과 배합될 수 있다. 포함될 수 있는 다른 항목은 완충액, 예컨대 포스페이트 완충액 또는 아세트산나트륨 완충액, 수딩제, 예컨대 프로카인 하이드로클로라이드, 안정화제, 예컨대 벤질 알코올 또는 페놀 및 항산화제이다. 제형화된 주사는 적합한 앰플에서 패키징될 수 있다.
다양한 실시형태에서, 피하 투여는 주사기, 프리필드 주사기, 자동 주사장치(예를 들면, 일회용 또는 재사용용), 펜 주사장치, 패치 주사장치, 착용형 주사장치, 피하 주입 세트를 갖는 보행 주사기 주입 펌프 또는 피하 주사를 위한 다른 장치와 같은 장치에 의해 달성될 수 있다.
일부 실시형태에서, 본원에 기재된 벡터는 국소 투여에 의해 대상체에게 치료학적으로 전달될 수 있다. 본원에 사용된 것과 같이, "국소 투여" 또는 "국소 전달"은 혈관계를 통한 의도된 표적 조직 또는 부위로의 벡터 또는 벡터의 수송에 의존하지 않는 전달을 지칭할 수 있다. 예를 들면, 벡터는 조성물 또는 제제의 주사 또는 이식에 의해 또는 조성물 또는 제제를 함유하는 장치의 주사 또는 이식에 의해 전달될 수 있다. 특정 실시형태에서, 표적 조직 또는 부위 근처의 국소 투여 이후에, 조성물 또는 제제 또는 이의 하나 이상의 성분은 투여 부위가 아닌 의도된 표적 조직 또는 부위로 확산할 수 있다.
일부 실시형태에서, 본원에 제공된 조성물은 단위 투여량 형태로 존재하고, 단위 투여량 형태는 자가 투여에 적합할 수 있다. 이러한 단위 투여량 형태는 컨테이너, 통상적으로, 예를 들면 바이알, 카트리지, 프리필드 주사기 또는 일회용 펜 내에 제공될 수 있다. US 제6,302,855호에 기재된 투입기 장치와 같은 투입기는 또한 예를 들면 본원에 기재된 것과 같은 주사 시스템과 사용될 수 있다.
주사에 적합한 벡터 제형의 약학 형태는 멸균 수성 용액 또는 분산액을 포함한다. 제형은 멸균일 수 있고, 주사기 내 및 밖으로의 적절한 흐름을 허용하는 유체이어야 한다. 제형은 또한 제조 및 저장의 조건 하에 안정할 수 있다. 담체는 예를 들면 물 및 식염수 또는 완충 수성 용액을 함유하는 용매 또는 분산 매질일 수 있다. 바람직하게는, 등장화제, 예를 들면 당 또는 염화나트륨은 제형에서 사용될 수 있다.
본원에 기재된 벡터의 적합한 용량은 예를 들면 치료되는 대상체의 연령, 성별 및 체중, 치료되는 병태 또는 질환 및 사용된 특정한 벡터를 포함하는 여러 가지의 인자에 따라 달라질 수 있다. 대상체에게 투여되는 용량에 영향을 미치는 다른 인자는 예를 들면 병태 또는 질환의 유형 또는 중증도를 포함한다. 다른 인자는 예를 들면 대상체에게 동시에 또는 이전에 영향을 미치는 다른 의학 장애, 대상체의 일반 건강, 대상체의 유전 소인, 식이, 투여 시간, 배설률, 약물 조합 및 대상체에게 투여되는 임의의 다른 추가 치료제를 포함할 수 있다. 벡터의 투여의 적합한 수단은 치료되는 병태 또는 질환 및 대상체의 연령 및 컨디션에 기초하여 선택될 수 있다. 투여의 용량 및 방법은 환자의 체중, 연령, 컨디션 및 기타에 따라 변할 수 있고, 당업자에 의해 필요한 바대로 적합하게 선택될 수 있다. 임의의 특정한 대상체에 대한 특정 투여량 및 치료 요법은 의학 실행자의 판단에 기초하여 조정될 수 있다.
다양한 경우에, 벡터는 약학적으로 허용 가능한 담체 또는 부형제를 포함하도록 제형화될 수 있다. 약학적으로 허용 가능한 담체의 예는, 제한 없이, 임의의 및 모든 용매, 분산 매질, 코팅, 항박테리아제 및 항진균제, 등장화제 및 흡수 지연제 및 생리학적으로 상용성인 기타를 포함한다. 본 발명의 조성물은 약학적으로 허용 가능한 염, 예를 들면 산 부가염 또는 염기 부가염을 포함할 수 있다.
예시적인 일반적으로 사용된 약학적으로 허용 가능한 담체는 임의의 및 모든 흡수 지연제, 항산화제, 결합제, 완충제, 벌크화제 또는 충전제, 킬레이트화제, 코팅, 붕괴제, 분산 매질, 겔, 등장화제, 활택제, 보존제, 염, 용매 또는 공용매, 안정화제, 계면활성제 및/또는 전달 비히클을 포함한다.
다양한 실시형태에서, 본원에 기재된 것과 같은 벡터를 포함하는 조성물, 예를 들면 주사용 멸균 제형은 비히클로서의 주사용 증류수를 사용하여 종래의 약학 실행에 따라 제형화될 수 있다. 예를 들면, 글루코스 및 다른 보충제, 예컨대 D-소르비톨, D-만노스, D-만니톨 및 염화나트륨을 함유하는 생리학적 식염수 또는 등장성 용액은 선택적으로 적합한 가용화제, 예를 들면 알코올, 예컨대 에탄올 및 폴리알코올, 예컨대 프로필렌 글리콜 또는 폴리에틸렌 글리콜 및 비이온성 계면활성제, 예컨대 폴리소르베이트 80™, HCO-50 및 기타와 조합되어 주사용 수성 용액으로서 사용될 수 있다.
본원에 개시된 제형은 예를 들면 주사에 의한 투여를 위해 제형화될 수 있다. 주사를 위해, 제형은 예컨대 행크액, 링거액 또는 생리학적 식염수를 포함하는 완충액 중에 또는 배양 배지, 예컨대 Iscove 변형 둘베코 배지(IMDM) 중에 수성 용액으로서 제형화될 수 있다. 수성 용액은 제형화제, 예컨대 현탁제, 안정화제 및/또는 분산제를 포함할 수 있다. 대안적으로, 제형은 사용 전에 적합한 비히클, 예를 들면 멸균 발열원-비함유 물과 구성을 위해 동결건조된 형태 및/또는 분말 형태일 수 있다.
본원에 개시된 임의의 제형은 투여의 이익을 능가하는 불리한 반응, 알레르기 반응 또는 다른 뜻밖의 반응을 상당히 생성하지 않는 것을 포함하는 임의의 다른 약학적으로 허용 가능한 담체를 유리하게 포함할 수 있다. 예시적인 약학적으로 허용 가능한 담체 및 제형은 Remington's Pharmaceutical Sciences, 18th Ed. Mack Printing Company, 1990에 개시되어 있다. 더욱이, 제형은 미국 FDA 생물학적 표준 사무소(US FDA Office of Biological Standards) 및/또는 다른 관련 외국 규제 기관이 필요로 하는 것처럼 멸균성, 발열성, 일반 안전성 및 순도 표준을 충족하도록 제조될 수 있다.
치료학적 유전자와 연관된 아데노바이러스 벡터의 치료학적 유효량은 예를 들면 1 x 107 내지 50 x 108 감염 단위(IU) 또는 5 x 107 내지 20 x 108 IU의 범위의 용량을 포함할 수 있다. 다른 예에서, 용량은 5 x 107 IU, 6 x 107 IU, 7 x 107 IU, 8 x 107 IU, 9 x 107 IU, 1 x 108 IU, 2 x 108 IU, 3 x 108 IU, 4 x 108 IU, 5 x 108 IU, 6 x 108 IU, 7 x 108 IU, 8 x 108 IU, 9 x 108 IU, 10 x 108 IU 또는 초과를 포함할 수 있다. 특정한 실시형태에서, 치료학적 유전자와 연관된 아데노바이러스 벡터의 치료학적 유효량은 4 x 108 IU를 포함한다. 특정한 실시형태에서, 치료학적 유전자와 연관된 아데노바이러스 벡터의 치료학적 유효량은 피하로 또는 정맥내로 투여될 수 있다. 특정한 실시형태에서, 치료학적 유전자와 연관된 아데노바이러스 벡터의 치료학적 유효량은 하나 이상의 동원 인자에 의한 투여 후 투여될 수 있다.
본 개시내용의 다양한 실시형태에서, 생체내 유전자 치료는 적어도 하나의 면역 억제 요법과 조합되어 대상체에 대한 적어도 하나의 바이러스 유전자 치료 벡터의 투여를 포함한다. 지지 벡터인 제2 벡터와 조합된 지지된 바이러스 유전자 치료 벡터인 제1 벡터와 같은 1개 초과의 벡터를 포함하는 생체내 유전자 치료에서, 제1 벡터 및 제2 벡터는 단일 제형 또는 투여량 형태로 또는 2개의 별개의 제형 또는 투여량 형태로 투여될 수 있다. 다양한 실시형태에서, 제1 벡터 및 제2 벡터는 예를 들면 동일한 1시간 기간 동안 또는 비중첩하는 1시간 기간 동안 동일한 시간에 또는 상이한 시간에 투여될 수 있다. 다양한 실시형태에서, 제1 벡터 및 제2 벡터는 예를 들면 동일한 일자에 또는 상이한 일자에 동일한 시간에 또는 상이한 시간에 투여될 수 있다. 다양한 실시형태에서, 제1 벡터 및 제2 벡터는 동일한 투여량으로 또는 상이한 투여량으로 투여될 수 있고, 예를 들면 여기서 투여량은 바이러스 입자의 총 수로서 또는 대상체의 1 킬로그램당 바이러스 입자의 총 수로서 측정된다. 다양한 실시형태에서, 제1 벡터 및 제2 벡터는 미리 정의된 비로 투여될 수 있다. 다양한 실시형태에서, 그 비는 2:1 내지 1:2의 범위, 예를 들면 1:1이다.
다양한 실시형태에서, 벡터는 단일 일자에 단일 총 용량으로 대상체에게 투여된다. 다양한 실시형태에서 벡터는 함께 총 용량을 구성하는 2개, 3개, 4개 또는 초과의 단위 용량으로 투여된다. 다양한 실시형태에서, 벡터의 1개의 단위 용량은 1일, 2일, 3일, 4일 또는 초과의 연속 일자의 각각에 매일 대상체에게 투여된다. 다양한 실시형태에서, 벡터의 2개의 단위 용량은 1일, 2일, 3일, 4일 또는 초과의 연속 일자의 각각에 매일 대상체에게 투여된다. 따라서, 다양한 실시형태에서, 매일의 용량은 하루에 걸쳐 대상체가 받는 벡터의 용량을 지칭할 수 있다. 다양한 실시형태에서, 상기 용어는 24시간 기간, 예컨대 제1 달력 일자의 자정으로부터 다음의 달력 일자의 자정까지의 24시간 기간을 지칭한다.
다양한 실시형태에서, 벡터, 예컨대 바이러스 유전자 치료 벡터 또는 지지 벡터의 단위 용량, 매일의 용량 또는 총 용량 또는 바이러스 유전자 치료 벡터와 지지 벡터의 총 조합 용량은 1 킬로그램당 적어도 1E8, 5E8, 1E9, 5E9, 1E10, 5E10, 1E11, 5E11, 1E12, 5E12, 1E13, 5E13, 1E14 또는 1E15 바이러스 입자(vp/kg)일 수 있다. 다양한 실시형태에서, 벡터, 예컨대 바이러스 유전자 치료 벡터 또는 지지 벡터의 단위 용량, 매일의 용량 또는 총 용량 또는 바이러스 유전자 치료 벡터와 지지 벡터의 총 조합 용량은 1E8, 5E8, 1E9, 5E9, 1E10, 5E10, 1E11, 5E11, 1E12, 5E12, 1E13, 5E13, 1E14 또는 1E15 vp/kg로부터 선택된 하한 및 1E8, 5E8, 1E9, 5E9, 1E10, 5E10, 1E11, 5E11, 1E12, 5E12, 1E13, 5E13, 1E14 또는 1E15 vp/kg로부터 선택된 상한을 갖는 범위 내에 해당할 수 있다.
다양한 실시형태에서, 바이러스 유전자 치료 벡터는 적어도 1E10, 5E10, 1E11, 5E11, 1E12, 5E12, 1E13, 5E13, 1E14 또는 1E15 vp/kg의 단위 용량, 매일의 용량 또는 총 용량으로 투여되고, 지지 벡터는 적어도 1E8, 5E8, 1E9, 5E9, 1E10, 5E10, 1E11 및 5E11 vp/kg의 단위 용량, 매일의 용량 또는 총 용량으로 투여되고, 선택적으로 여기서 바이러스 유전자 치료 벡터의 단위 용량, 매일의 용량 또는 총 용량은 1E10, 5E10, 1E11, 5E11, 1E12 및 5E12, vp/kg로부터 선택된 하한 및 1E11, 5E11, 1E12, 5E12, 1E13, 5E13, 1E14 및 1E15 vp/kg로부터 선택된 상한을 갖는 범위 내이고 그리고/또는 지지 벡터의 단위 용량, 매일의 용량 또는 총 용량은 1E8, 5E8, 1E9, 5E9, 1E10 및 5E10 vp/kg로부터 선택된 하한 및 1E9, 5E9, 1E10, 5E10, 1E11 및 5E11 vp/kg로부터 선택된 상한을 갖는 범위 내이다.
다양한 실시형태에서, 지지 벡터는 적어도 1E10, 5E10, 1E11, 5E11, 1E12, 5E12, 1E13, 5E13, 1E14 또는 1E15 vp/kg의 단위 용량, 매일의 용량 또는 총 용량으로 투여되고, 지지된 바이러스 유전자 치료 벡터는 적어도 1E8, 5E8, 1E9, 5E9, 1E10, 5E10, 1E11 및 5E11 vp/kg의 단위 용량, 매일의 용량 또는 총 용량으로 투여되고, 선택적으로 여기서 지지 벡터의 단위 용량, 매일의 용량 또는 총 용량은 1E10, 5E10, 1E11, 5E11, 1E12 및 5E12, vp/kg로부터 선택된 하한 및 1E11, 5E11, 1E12, 5E12, 1E13, 5E13, 1E14 및 1E15 vp/kg로부터 선택된 상한을 갖는 범위 내이고 그리고/또는 지지된 바이러스 유전자 치료 벡터의 단위 용량, 매일의 용량 또는 총 용량은 1E8, 5E8, 1E9, 5E9, 1E10 및 5E10 vp/kg로부터 선택된 하한 및 1E9, 5E9, 1E10, 5E10, 1E11 및 5E11 vp/kg로부터 선택된 상한을 갖는 범위 내이다. 다양한 실시형태에서, 지지된 바이러스 유전자 치료 벡터 및 지지 벡터는 미리 정의된 비로 투여된다. 다양한 실시형태에서, 그 비는 2:1 내지 1:2의 범위, 예를 들면 1:1이다.
IV. 분야
본원에 제공된 방법 및 조성물은 적어도 부분적으로 생체내 유전자 치료에서의 사용에 대해 개시되어 있다. 그러나, 의심을 피하기 위해, 본 개시내용은 세포 및/또는 조직의 생체외 조작을 위한 본원에 제공된 조성물 및 방법의 용도뿐만 아니라 조사 목적을 위한 세포 및/또는 조직의 조작을 포함하는 시험관내 용도를 명확히 포함한다. 유전자 치료는 외인성 DNA를 숙주 세포(예컨대, 표적 세포) 및/또는 핵산(예컨대, 표적 핵산, 예컨대 표적 게놈, 예를 들면 표적 세포의 게놈)으로 도입하는 방법에서의 본 개시내용의 벡터, 게놈 또는 시스템의 용도를 포함한다. 본 개시내용은 생체내, 시험관내 및 생체외 치료에 관한 조성물 및 방법의 설명 및 예시화를 포함하고, 당업자는 본원에 제공된 다양한 방법 및 조성물이 일반적으로 핵산 페이로드의 대상체, 예를 들면 숙주 또는 표적 세포로의 도입에 적용 가능하다는 것을 이해할 것이다. 이러한 조성물 및 방법이 예를 들면 유전자 치료에서 일반적인 유용성을 가지므로, 이들은 일반적으로 유전자 치료에서의 도구 및 본원에 제공된 것을 포함하는 다양한 특정한 병태에서의 도구 둘 다로서 유용하다.
IV(A). 생체내 유전자 치료
환자에 대한 바이러스 벡터의 직접적인 전달을 포함하는 생체내 유전자 치료를 사용한 치료가 탐구되었다. 생체내 유전자 치료는 매력적인 접근법인데, 왜냐하면 이것이 어떠한 유전독성 컨디셔닝도 요하지 않을 수 있고(또는 더 적은 유전독성 컨디셔닝을 요할 수 있고), 생체외 세포 가공도 요하지 않을 수 있고, 따라서 백신의 전달을 위해 이미 세계적으로 수행된 것과 유사하게 치료가 주사를 통해 투여될 수 있으므로 개발도상국에서의 것을 포함하여 세계적으로 많은 협회에서 채택될 수 있기 때문이다. 다양한 실시형태에서 본 개시내용의 아데노바이러스 벡터에 의한 생체내 유전자 치료의 방법은 (i) 표적 세포 동원, (ii) 면역억제, (iii) 본원에 제공된 벡터, 게놈, 시스템 또는 제형의 투여 및/또는 (iv) 형질도입된 세포 및/또는 아데노바이러스 벡터 또는 게놈의 페이로드의 통합 요소가 통합된 세포의 선택 중 하나 이상의 단계를 포함할 수 있다.
본원에 개시된 아데노바이러스 벡터 제형은 대상체(인간, 수의 동물(개, 고양이, 파충류, 조류 등), 가축(말, 소, 염소, 돼지, 닭 등) 및 조사 동물(원숭이, 래트, 마우스, 어류 등)을 치료하기 위해 사용될 수 있다. 대상체를 치료하는 것은 본 개시내용의 하나 이상의 벡터, 게놈 또는 시스템의 치료학적 유효량을 전달하는 것을 포함한다. 치료학적 유효량은 유효량, 예방학적 치료 및/또는 치료학적 치료를 제공하는 것을 포함한다.
본원에 기재된 벡터는 동원 인자와 합동으로 투여될 수 있다. 특정 실시형태에서, 본원에 기재된 아데노바이러스 벡터 제형은 HSPC 동원과 연합하여 투여될 수 있다. 특정한 실시형태에서, 아데노바이러스 공여자 벡터의 투여는 하나 이상의 동원 인자의 투여와 동시에 발생한다. 특정한 실시형태에서, 아데노바이러스 공여자 벡터의 투여는 하나 이상의 동원 인자의 투여 후이다. 특정한 실시형태에서, 아데노바이러스 공여자 벡터의 투여는 제1 하나 이상의 동원 인자의 투여 후이고, 제2 하나 이상의 동원 인자의 투여와 동시에 발생한다. HSPC 동원을 위한 제제는 예를 들면 과립구-콜로니 자극 인자(G-CSF), 과립구 대식세포 콜로니 자극 인자(GM-CSF), AMD3100, SCF, S-CSF, CXCR4 길항제, CXCR2 효능제 및 Gro-Beta(GRO-β)를 포함한다. 다양한 실시형태에서, CXCR4 길항제는 AMD3100이고/이거나 CXCR2 효능제는 GRO-β이다.
G-CSF는 HSPC 동원에서의 기능이 과립구 팽창 및 부착 분자의 프로테아제 의존적 악화 및 독립적 악화 둘 다의 촉진 및 SDF-1/CXCR4 축의 파괴를 포함할 수 있는 사이토카인이다. 특정한 실시형태에서, 당업자에게 알려진 G-CSF의 임의의 상업적으로 입수 가능한 형태는 본원에 개시된 것과 같은 방법 및 제형, 예를 들면 필그라스팀(Filgrastim)(Neupogen®, Amgen Inc., 캘리포니아주 사우전드 오크) 및 PEG화된 필그라스팀(Pegfilgrastim, NEULASTA®, Amgen Inc., 캘리포니아주 사우전드 오크)에서 사용될 수 있다.
GM-CSF는 사이토카인으로서 기능하고 대식세포, T 세포, 비만 세포, 자연 살해 세포, 내피 세포 및 섬유아세포에 의해 자연적으로 분비된 콜로니 자극 인자 2(CSF2)로도 알려진 단량체성 당단백질이다. 특정한 실시형태에서, 당업자에게 알려진 GM-CSF의 임의의 상업적으로 입수 가능한 형태는 본원에 개시된 것과 같은 방법 및 제형, 예를 들면 Sargramostim(사르그라모스팀)(Leukine, Bayer Healthcare Pharmaceuticals, 워싱턴주 시애틀) 및 몰그라모스팀(molgramostim)(Schering-Plough, 뉴저지주 케닐워스)에서 사용될 수 있다.
바이사이클람 종류의 합성 유기 분자인 AMD3100(MOZOBIL™, PLERIXAFOR™; Sanofi-Aventis, 프랑스 파리)은 케모카인 수용체 길항제이고 CXCR4에 대한 SDF-1 결합을 가역적으로 억제하여서 HSPC 동원을 촉진한다. AMD3100은 골수종 및 림프종을 갖는 환자에서 HSPC 동원을 위해 G-CSF와 조합되어 사용되는 것으로 허가되었다. AMD3100의 구조는 하기이다:
.
KIT 리간드, KL 또는 스틸 인자로도 알려진 SCF는 c-kit 수용체(CD117)에 결합하는 사이토카인이다. SCF는 막관통 단백질 및 가용성 단백질 둘 다로서 존재할 수 있다. 이 사이토카인은 혈액생성, 정자생성 및 멜라닌생성에서 중요한 역할을 한다. 특정한 실시형태에서, 당업자에게 알려진 SCF의 임의의 상업적으로 입수 가능한 형태는 본원에 개시된 것과 같은 방법 및 제형, 예를 들면 재조합 인간 SCF(안세스팀, STEMGEN®, Amgen Inc., 캘리포니아주 사우전드 오크)에서 사용될 수 있다.
집중 골수억제 치료에서 사용된 화학요법은 또한 화학요법 유도된 무형성 이후에 보상성 중성구 생성의 결과로서 말초혈로 HSPC를 동원한다. 특정한 실시형태에서, HSPC의 동원에 사용될 수 있는 화학치료제는 사이클로포스파미드, 에토포사이드, 이포스파미드, 시스플라틴 및 사이타라빈을 포함한다.
세포 동원에 사용될 수 있는 추가 제제는 CXCL12/CXCR4 조절제(예를 들면, CXCR4 길항제: POL6326(폴리포르, 스위스 알슈빌), CXCR4를 가역적으로 억제하는 합성 사이클릭 펩타이드; BKT-140(4F-벤조일-TN14003; Biokine Therapeutics, 이스라엘 레호비트); TG-0054(Taigen Biotechnology, 대만 타이페이); CXCL12 중화제 NOX-A12(NOXXON Pharma, 독일 베를린), SDF-1에 결합함, CXCR4에 대한 이의 결합을 억제함); 스핑고신-1-포스페이트(S1P) 효능제(예를 들면, SEW2871, Juarez 등 Blood 119: 707-716, 2012); 혈관 세포 부착 분자-1(VCAM) 또는 매우 후기 항원 4(VLA-4) 억제제(예를 들면, 나탈리주맙, VLA-4의 α4 아단위에 대한 재조합 인간화된 단일클론 항체(Zohren 등 Blood 111: 3893-3895, 2008); VLA-4의 소분자 억제제인 BIO5192(Ramirez 등 Blood 114: 1340-1343, 2009)); 부갑상선 호르몬(Brunner 등 Exp Hematol. 36: 1157-1166, 2008); 프로테아솜 억제제(예를 들면, 보르테조밉, Ghobadi 등 ASH Annual Meeting Abstracts. p. 583, 2012); CXCR2 수용체에 대한 결합에 의해 화학주성 및 중성구의 활성화를 자극하는 CXC 케모카인 패밀리의 구성원인 Groβ(예를 들면, SB-251353, King 등 Blood 97: 1534-1542, 2001); 저산소증 유도성 인자(HIF)의 안정화(예를 들면, FG-4497, Forristal 등 ASH Annual Meeting Abstracts. p. 216, 2012); α4β1 및 α4β7 인테그린 억제제(α4β1/7)인 피라테그라스트(Kim 등 Blood 128: 2457-2461, 2016); α4β7 인테그린에 대한 인간화된 단일클론 항체인 베돌리주맙(Rosario 등 Clin Drug Investig 36: 913-923, 2016); 및 인테그린 α9β1/α4β1을 표적화하는 BOP(N-(벤젠설포닐)-L-프롤릴-L-O-(1-피롤리디닐카보닐) 티로신)(Cao 등 Nat Commun 7: 11007, 2016)을 포함한다. HSPC 동원에 사용될 수 있는 추가 제제는 예를 들면 Richter R 등 Transfus Med Hemother 44:151-164, 2017, Bendall & Bradstock, Cytokine & Growth Factor Reviews 25: 355-367, 2014, WO 2003043651호, WO 2005017160호, WO 2011069336호, US 제5,637,323호, US 제7,288,521호, US 제9,782,429호, US 제2002/0142462호 및 US 제2010/02268호에 기재되어 있다.
특정한 실시형태에서, G-CSF의 치료학적 유효량은 0.1 μg/kg 내지 100 μg/kg를 포함한다. 특정한 실시형태에서, G-CSF의 치료학적 유효량은 0.5 μg/kg 내지 50 μg/kg를 포함한다. 특정한 실시형태에서, G-CSF의 치료학적 유효량은 0.5 μg/kg, 1 μg/kg, 2 μg/kg, 3 μg/kg, 4 μg/kg, 5 μg/kg, 6 μg/kg, 7 μg/kg, 8 μg/kg, 9 μg/kg, 10 μg/kg, 11 μg/kg, 12 μg/kg, 13 μg/kg, 14 μg/kg, 15 μg/kg, 16 μg/kg, 17 μg/kg, 18 μg/kg, 19 μg/kg, 20 μg/kg 또는 초과를 포함한다. 특정한 실시형태에서, G-CSF의 치료학적 유효량은 5 μg/kg를 포함한다. 특정한 실시형태에서, G-CSF는 피하로 또는 정맥내로 투여될 수 있다. 특정한 실시형태에서, G-CSF는 1일, 연속 2일, 연속 3일, 연속 4일, 연속 5일 또는 초과 동안 투여될 수 있다. 특정한 실시형태에서, G-CSF는 연속 4일 동안 투여될 수 있다. 특정한 실시형태에서, G-CSF는 연속 5일 동안 투여될 수 있다. 특정한 실시형태에서, 단일 제제로서, G-CSF는 아데노바이러스 전달 전 3일, 4일, 5일, 6일, 7일 또는 8일에 개시되어 매일 피하로 10μg/kg의 용량으로 사용될 수 있다. 특정한 실시형태에서, G-CSF는 단일 제제로서 투여된 후, 또 다른 동원 인자와 동시 투여될 수 있다. 특정한 실시형태에서, G-CSF는 단일 제제로서 투여된 후, AMD3100과 동시 투여될 수 있다. 특정한 실시형태에서, 치료 프로토콜은 5일 치료를 포함하고, 여기서 G-CSF는 제1일, 제2일, 제3일 및 제4일 및 제5일에 투여될 수 있고, G-CSF 및 AMD3100은 아데노바이러스 투여 전 6시간 내지 8시간에 투여된다.
투여하는 GM-CSF의 치료학적 유효량은 예를 들면 0.1 내지 50 μg/kg 또는 0.5 내지 30 μg/kg의 범위의 용량을 포함할 수 있다. 특정한 실시형태에서, GM-CSF가 투여될 수 있는 용량은 0.5 μg/kg, 1 μg/kg, 2 μg/kg, 3 μg/kg, 4 μg/kg, 5 μg/kg, 6 μg/kg, 7 μg/kg, 8 μg/kg, 9 μg/kg, 10 μg/kg, 11 μg/kg, 12 μg/kg, 13 μg/kg, 14 μg/kg, 15 μg/kg, 16 μg/kg, 17 μg/kg, 18 μg/kg, 19 μg/kg, 20 μg/kg 또는 초과를 포함한다. 특정한 실시형태에서, GM-CSF는 1일, 연속 2일, 연속 3일, 연속 4일, 연속 5일 또는 초과 동안 피하로 투여될 수 있다. 특정한 실시형태에서, GM-CSF는 피하로 또는 정맥내로 투여될 수 있다. 특정한 실시형태에서, 단일 제제로서, GM-CSF는 아데노바이러스 전달 전 3일, 4일, 5일, 6일, 7일 또는 8일에 개시되어 매일 피하로 10μg/kg의 용량으로 투여될 수 있다. 특정한 실시형태에서, GM-CSF는 단일 제제로서 투여된 후, 또 다른 동원 인자와 동시 투여될 수 있다. 특정한 실시형태에서, GM-CSF는 단일 제제로서 투여된 후, AMD3100과 동시 투여될 수 있다. 특정한 실시형태에서, 치료 프로토콜은 5일 치료를 포함하고, 여기서 GM-CSF는 제1일, 제2일, 제3일 및 제4일 및 제5일에 투여될 수 있고, GM-CSF 및 AMD3100은 아데노바이러스 투여 전 6시간 내지 8시간에 투여된다. 사르그라모스팀에 대한 투약 요법은 200 μg/m2, 210 μg/m2, 220 μg/m2, 230 μg/m2, 240 μg/m2, 250 μg/m2, 260 μg/m2, 270 μg/m2, 280 μg/m2, 290 μg/m2, 300 μg/m2 또는 초과를 포함할 수 있다. 특정한 실시형태에서, 사르그라모스팀은 1일, 연속 2일, 연속 3일, 연속 4일, 연속 5일 또는 초과 동안 투여될 수 있다. 특정한 실시형태에서, 사르그라모스팀은 피하로 또는 정맥내로 투여될 수 있다. 특정한 실시형태에서, 사르그라모스팀에 대한 투약 요법은 정맥내 또는 피하 250 μg/m2/일을 포함할 수 있고, 표적화된 세포 양이 말초혈에서 도달될 때까지 계속될 수 있거나 5일 동안 계속될 수 있다. 특정한 실시형태에서, 사르그라모스팀은 단일 제제로서 투여된 후, 또 다른 동원 인자와 동시 투여될 수 있다. 특정한 실시형태에서, 사르그라모스팀은 단일 제제로서 투여된 후, AMD3100과 동시 투여될 수 있다. 특정한 실시형태에서, 치료 프로토콜은 5일 치료를 포함하고, 여기서 사르그라모스팀은 제1일, 제2일, 제3일 및 제4일 및 제5일에 투여될 수 있고, 사르그라모스팀 및 AMD3100은 아데노바이러스 투여 전 6시간 내지 8시간에 투여된다.
특정한 실시형태에서, AMD3100의 치료학적 유효량은 0.1 mg/kg 내지 100 mg/kg를 포함한다. 특정한 실시형태에서, AMD3100의 치료학적 유효량은 0.5 mg/kg 내지 50 mg/kg를 포함한다. 특정한 실시형태에서, AMD3100의 치료학적 유효량은 0.5 mg/kg, 1 mg/kg, 2 mg/kg, 3 mg/kg, 4 mg/kg, 5 mg/kg, 6 mg/kg, 7 mg/kg, 8 mg/kg, 9 mg/kg, 10 mg/kg, 11 mg/kg, 12 mg/kg, 13 mg/kg, 14 mg/kg, 15 mg/kg, 16 mg/kg, 17 mg/kg, 18 mg/kg, 19 mg/kg, 20 mg/kg 또는 초과를 포함한다. 특정한 실시형태에서, AMD3100의 치료학적 유효량은 4 mg/kg를 포함한다. 특정한 실시형태에서, AMD3100의 치료학적 유효량은 5 mg/kg를 포함한다. 특정한 실시형태에서, AMD3100의 치료학적 유효량은 10 μg/kg 내지 500 μg/kg 또는 50 μg/kg 내지 400 μg/kg를 포함한다. 특정한 실시형태에서, AMD3100의 치료학적 유효량은 100 μg/kg, 150 μg/kg, 200 μg/kg, 250 μg/kg, 300 μg/kg, 350 μg/kg 또는 초과를 포함한다. 특정한 실시형태에서, AMD3100은 피하로 또는 정맥내로 투여될 수 있다. 특정한 실시형태에서, AMD3100은 아데노바이러스 전달 전 6시간 내지 11시간에 160 내지 240 μg/kg로 피하로 또는 정맥내로 투여될 수 있다. 특정한 실시형태에서, AMD3100의 치료학적 유효량은 또 다른 동원 인자의 투여와 동시에 투여될 수 있다. 특정한 실시형태에서, AMD3100의 치료학적 유효량은 또 다른 동원 인자의 투여 후 투여될 수 있다. 특정한 실시형태에서, AMD3100의 치료학적 유효량은 G-CSF의 투여 후 투여될 수 있다. 특정한 실시형태에서, 치료 프로토콜은 5일 치료를 포함하고, 여기서 G-CSF는 제1일, 제2일, 제3일 및 제4일 및 제5일에 투여되고, G-CSF 및 AMD3100은 아데노바이러스 주사 전 6시간 내지 8시간에 투여된다.
투여하는 SCF의 치료학적 유효량은 예를 들면 0.1 내지 100 μg/kg/일 또는 0.5 내지 50 μg/kg/일의 범위의 용량을 포함할 수 있다. 특정한 실시형태에서, SCF가 투여될 수 있는 용량은 0.5 μg/kg/일, 1 μg/kg/일, 2 μg/kg/일, 3 μg/kg/일, 4 μg/kg/일, 5 μg/kg/일, 6 μg/kg/일, 7 μg/kg/일, 8 μg/kg/일, 9 μg/kg/일, 10 μg/kg/일, 11 μg/kg/일, 12 μg/kg/일, 13 μg/kg/일, 14 μg/kg/일, 15 μg/kg/일, 16 μg/kg/일, 17 μg/kg/일, 18 μg/kg/일, 19 μg/kg/일, 20 μg/kg/일, 21 μg/kg/일, 22 μg/kg/일, 23 μg/kg/일, 24 μg/kg/일, 25 μg/kg/일, 26 μg/kg/일, 27 μg/kg/일, 28 μg/kg/일, 29 μg/kg/일, 30 μg/kg/일 또는 초과를 포함한다. 특정한 실시형태에서, SCF는 1일, 연속 2일, 연속 3일, 연속 4일, 연속 5일 또는 초과 동안 투여될 수 있다. 특정한 실시형태에서, SCF는 피하로 또는 정맥내로 투여될 수 있다. 특정한 실시형태에서, SCF는 20 μg/kg/일에서 피하로 주사될 수 있다. 특정한 실시형태에서, SCF는 단일 제제로서 투여된 후, 또 다른 동원 인자와 동시 투여될 수 있다. 특정한 실시형태에서, SCF는 단일 제제로서 투여된 후, AMD3100과 동시 투여될 수 있다. 특정한 실시형태에서, 치료 프로토콜은 5일 치료를 포함하고, 여기서 SCF는 제1일, 제2일, 제3일 및 제4일 및 제5일에 투여될 수 있고, SCF 및 AMD3100은 아데노바이러스 투여 전 6시간 내지 8시간에 투여된다.
특정한 실시형태에서, 성장 인자 GM-CSF 및 G-CSF는 혈액에서 순환하는 HSPC의 분율을 증가시키기 위해 골수 틈새에서의 HSPC를 순환 말초혈로 동원하기 위해 투여될 수 있다. 특정한 실시형태에서, 동원은 G-CSF/필그라스팀(Amgen) 및/또는 AMD3100(Sigma)의 투여에 의해 달성될 수 있다. 특정한 실시형태에서, 동원은 GM-CSF/사르그라모스팀(Amgen) 및/또는 AMD3100(Sigma)의 투여에 의해 달성될 수 있다. 특정한 실시형태에서, 동원은 SCF/안세스팀(Amgen) 및/또는 AMD3100(Sigma)의 투여에 의해 달성될 수 있다. 특정한 실시형태에서, G-CSF/필그라스팀의 투여는 AMD3100의 투여에 선행한다. 특정한 실시형태에서, G-CSF/필그라스팀의 투여는 AMD3100의 투여와 동시에 발생한다. 특정한 실시형태에서, G-CSF/필그라스팀의 투여는 AMD3100의 투여에 선행한 후, G-CSF/필그라스팀 및 AMD3100이 동시에 투여된다. US 제20140193376호는 S1P 수용체 1(S1PR1) 조절제 제제와 CXCR4 길항제를 사용하는 동원 프로토콜을 기재한다. US 제20110044997호는 혈관 내피 성장 인자 수용체(VEGFR) 효능제와 CXCR4 길항제를 사용하는 동원 프로토콜을 기재한다.
아데노바이러스 벡터(예를 들면, Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 벡터)는 HSPC 동원과 연합되어 투여될 수 있는 벡터의 예시이다. 특정한 실시형태에서, 아데노바이러스 벡터의 투여는 하나 이상의 동원 인자의 투여와 동시에 발생한다. 특정한 실시형태에서, 아데노바이러스 벡터의 투여는 하나 이상의 동원 인자의 투여에 후행한다. 특정한 실시형태에서, 아데노바이러스 벡터의 투여는 제1 하나 이상의 동원 인자의 투여 후이고, 제2 하나 이상의 동원 인자의 투여와 동시에 발생한다.
특정한 실시형태에서, HSC 농후화제, 예컨대 CD19 면역독소 또는 5-FU는 HSPC를 농후화하도록 투여될 수 있다. CD19 면역독소는 골수 세포의 30%를 차지하는 모든 CD19 계통 세포를 고갈시키도록 사용할 수 있다. 고갈은 골수로부터의 배출을 장려한다. (예를 들면, 5-FU의 CD19 면역독소를 통해서든) HSPC를 증식하도록 강제함으로써, 이는 이의 분화 및 골수로부터의 배출을 자극하고 말초혈 세포에서의 전이유전자 마킹을 증가시킨다.
HSC 동원 인자 및/또는 HSC 농후화제의 치료학적 유효량은 임의의 적절한 투여 경로를 통해, 예컨대 주사, 주입, 관류에 의해 및 더 구체적으로는 골수, 정맥내, 진피내, 동맥내, 결절내, 림프내, 복강내 주사, 주입 또는 관류 중 하나 이상에 의한 투여에 의해 투여될 수 있다.
특정한 실시형태에서, 본 개시내용의 방법은 선택 마커(예를 들면, 6-BG에 의한 불활성화에 내성이지만, DNA 손상을 회복하는 능력을 보유하는 MGMT의 돌연변이체 형태)를 발현하도록 변형된 세포에 대한 선택을 포함할 수 있다. 예를 들면, 특정한 실시형태는 동원(예를 들면, 본원에 기재된 동원 프로토콜)을 본원에 기재된 아데노바이러스 벡터의 투여 및 MGMTP140K 선택 마커를 포함하는 아데노바이러스 벡터의 경우에 BCNU 또는 벤질구아닌 및 테모졸로마이드의 투여와 조합하는 요법을 포함한다. 특정한 실시형태에서, 생체내 선택 마커는 Olszko 등, GeneTherapy 22: 591-595, 2015에 기재된 것과 같은 MGMTP140K를 포함할 수 있다. 따라서, MGMTP140K를 발현하는 세포에 대한 선택은 형질도입된 세포를 선택하고/하거나 치료 효능에 기여할 수 있다.
아데노바이러스 벡터는 하나 이상의 면역억제 제제 또는 면역억제 요법의 투여와 동시에 또는 투여 후에 투여될 수 있다.
IV(B). 시험관내 및 생체외 유전자 치료
시험관내 유전자 치료는 외인성 DNA를 숙주 세포(예컨대, 표적 세포) 및/또는 핵산(예컨대, 표적 핵산, 예컨대 표적 게놈)으로 도입하는 방법에서의 본 개시내용의 벡터, 게놈 또는 시스템의 용도를 포함하고, 숙주 세포 또는 핵산은 (예를 들면, 실험실에서) 다세포 유기체에 존재하지 않는다. 일부 실시형태에서, 표적 세포 또는 핵산은 다세포 유기체, 예컨대 포유류(예를 들면, 마우스, 래트, 인간 또는 비인간 영장류)로부터 유래된다. 다세포 유기체로부터 유래된 세포의 시험관내 조작은 생체외 조작으로 지칭될 수 있고, 생체외 치료에 사용될 수 있다. 다양한 실시형태에서, 본 개시내용의 방법 및 조성물은 제1 다세포 유기체로부터 유래된 표적 세포 또는 핵산을 변형시키도록 예를 들면 본원에 개시된 것처럼 이용되고, 이후 조작된 표적 세포 또는 핵산은 예를 들면 적응 세포 치료의 방법에서 제2 다세포 유기체, 예컨대 포유류(예를 들면, 마우스, 래트, 인간 또는 비인간 영장류)에게 투여된다. 일부 경우에, 제1 유기체 및 제2 유기체는 동일한 단일 대상체 유기체이다. 재료가 유래된 대상체에 대한 시험관내 조작된 재료의 반환은 자가유래 치료일 수 있다. 일부 경우에, 제1 유기체 및 제2 유기체는 상이한 유기체(예를 들면, 동일한 종의 2종의 유기체, 예를 들면 동일한 종의 2종의 마우스, 2종의 래트, 2종의 인간 또는 2종의 비인간 영장류)이다. 제1 대상체로부터 유래된 조작된 재료의 제2 상이한 대상체로의 운반은 동종이계 치료일 수 있다.
생체외 세포 치료는 환자 또는 일반 공여자로부터의 줄기, 조상 또는 분화된 세포의 단리, 유전 조작과 함께 또는 유전 조작 없이 생체외 단리된 세포의 확장 및 주입된 세포 및/또는 이의 자손의 일시적인 그래프트 또는 안정한 그래프트를 확립하기 위한 대상체에 대한 세포의 투여를 포함할 수 있다. 이러한 생체외 접근법은 예를 들면 유전된, 감염성 또는 신생물 질환을 치료하기 위해, 조직을 재생하기 위해 또는 치료제를 질환 부위로 전달하기 위해 사용될 수 있다. 다양한 생체외 치료에서, 유전자 운반 벡터에 대한 대상체의 직접적인 노출이 없고, 형질도입의 표적 세포는 효능 및 안전성을 개선하기 위해 임의의 유전 조작 전에 또는 후에 선택되고/되거나 확장되고/되거나 분화될 수 있다.
생체외 치료는 조혈 줄기 세포(HSC) 이식(HCT)을 포함한다. 자가유래 HSC 유전자 치료는 혈액계 및 면역계의 몇몇 단일유전자 질환뿐만 아니라 저장 장애에 대한 치료 옵션을 나타내고, 이것은 선택된 질환 조건에 대한 제1선 치료 옵션이 될 수 있다.
생체외 치료의 분야는 기능이상 세포 계통을 재구성하는 것을 포함한다. 결함성 또는 부재 세포 계통을 특징으로 하는 유전된 질환에 대해, 그 계통은 일반 공여자로부터 유래되거나 결핍을 수정하기 위해 생체외 유전자 운반으로 처리된 자가유래 세포로부터 유래된 기능적 조상 세포에 의해 재생될 수 있다. 예는 몇몇 유전자 중 어느 하나에서의 결핍이 성숙 림프성 세포의 발생을 차단하는 SCID에 의해 제공된다. 숙주에서의 다양한 계통의 공여자 유래 기능적 조혈 세포의 생성을 허용할 수 있는 비조작된 일반 공여자 HSC의 이식은 SCID뿐만 아니라 혈액계 및 면역계에 영향을 미치는 많은 다른 질환에 대한 치료 옵션을 나타낸다. 이식된 조혈 줄기/조상 세포(HSPC)에서 그리고 HCT와 유사하게 결함성 유전자의 기능적 카피를 대체하는 것을 포함할 수 있는 자가유래 HSC 유전자 치료는 기능적 자손의 꾸준한 공급을 제공할 수 있고, 이식편 대 숙주 질환(GvHD)의 위험의 감소, 이식편 거부의 위험의 감소 및 이식후 면역억제의 필요성의 감소를 포함하는 몇몇 이점을 가질 수 있다.
생체외 치료의 분야는 치료학적 유전자 투여량을 증강시키는 것을 포함한다. 일부 분야에서, HSC 유전자 치료는 동종이계 HCT의 치료 효능을 증강시킬 수 있다. 치료학적 유전자 투여량은 이식된 세포에서의 정상보다 높은 수준으로 조작될 수 있다.
생체외 치료의 분야는 신규의 기능의 도입 및 유전자 치료의 표적화를 포함한다. 생체외 유전자 치료는 HSC 또는 이의 자손에 대한 신규의 기능, 예컨대 고용량 항종양 화학요법 섭생의 투여를 허용하는 약물 내성을 확립하는 것 또는 RNA 기반 제제(예를 들면, 리보자임, RNA 데코이, 안티센스 RNA, RNA 압타머 및 소형 간섭 RNA) 및 단백질 기반 제제(예를 들면, 우성-음성 돌연변이체 바이러스 단백질, 융합 억제제 및 병원균의 게놈을 표적화하는 조작된 뉴클레아제)를 발현시킴으로써 바이러스, 예컨대 HIV 또는 다른 병원균에 의한 미리 확립된 감염에 대한 내성을 확립하는 것을 부여할 수 있다.
IV(C). 유전자 치료에 의해 치료 가능한 병태
적어도 부분적으로 본 개시내용의 아데노바이러스 벡터(예를 들면, Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 벡터)가 숙주 및/또는 표적 세포의 생체내, 시험관내 또는 생체외 사용될 수 있으므로 그리고 추가로 아데노바이러스 벡터가 넓은 여러 가지의 발현 산물을 암호화하는 페이로드를 포함할 수 있으므로, 본 명세서로부터 본원에 제공된 다양한 기법이 넓은 이용가능성을 갖고, 넓은 여러 가지의 병태를 치료하기 위해 사용될 수 있다는 것이 명확할 것이다. 본 개시내용의 아데노바이러스 벡터, 게놈 또는 시스템의 투여에 의해 치료 가능한 병태의 예는, 제한 없이, 헤모글로빈병증, 면역결핍증, 점 돌연변이 병태, 암, 단백질 결핍증, 감염성 질환 및 염증성 병태를 포함한다.
특정 실시형태에서, 본원에 개시된 벡터, 게놈, 시스템 및 제형은 대상체(인간, 수의 동물(개, 고양이, 파충류, 조류 등), 가축(말, 소, 염소, 돼지, 닭 등) 및 조사 동물(원숭이, 래트, 마우스, 어류 등))를 치료하기 위해 사용될 수 있다. 대상체를 치료하는 것은 치료학적 유효량을 전달하는 것을 포함한다. 치료학적 유효량은 유효량, 예방학적 치료 및/또는 치료학적 치료를 제공하는 것을 포함한다.
특정한 실시형태에서, 본원에 개시된 방법 및 제형은 혈액 장애를 치료하기 위해 사용될 수 있다. 특정한 실시형태에서, 제형은 혈우병, 주요 β-지중해빈혈, 다이아몬드 블랙판 빈혈(DBA), 발작성 야간 혈색소뇨증(PNH), 순적혈구무형성증(PRCA), 불응성 빈혈, 중증 무형성 빈혈 및/또는 혈액 암, 예컨대 백혈병, 림프종 및 골수종을 치료하기 위해 대상체에게 투여된다.
헤모글로빈병증은 불균형 결과로 세계 건강 부담을 나타낸다. 헤모글로빈 단백질 또는 글로빈 유전자의 발현의 결핍은 헤모글로빈병증이라 칭하는 질환을 생성시킬 수 있다. 세계적으로 가장 흔한 유전 장애 중에 헤모글로빈병증이 있다.
매년 세계적으로 110만건의 출생은 헤모글로빈병증에 대한 위험에 있고, 이는 헤모글로빈(Hb) 유전 변이에 의해 부여된 말라리아 감염에 의한 자연 내성으로 인해 말라리아 팔시파룸이 성행하는 지리학적 지역에서 1,000건의 출생마다 25건처럼 많이 영향을 미친다. 개발된 지역에서, 환자는 만성 수혈로부터 철분 과부하의 위험에 있다. 덜 개발된 지역에서, 생존률은 상당히 더 낮다. 예를 들면, 아프리카에서, 아동 사망률은 모든 아동에서의 16%와 비교하여 헤모글로빈병증을 갖는 환자에서 40%이다.
글로빈 유전자의 돌연변이는 겸상 세포 질환(SCD) 및 헤모글로빈 C, D 및 E 질환에서처럼 헤모글로빈의 비정상 형태를 생성할 수 있거나, α 또는 β 폴리펩타이드의 생성을 감소시킬 수 있고, 따라서 세포에서의 글로빈 사슬의 불균형을 생성시킨다. 이 후자의 병태는 글로빈 사슬이 손상되는지에 따라 α-지중해빈혈 또는 β-지중해빈혈이라 칭한다. 세계 집단의 5%는 단연코 가장 흔한(보균자의 40%) b-글로빈(HBB) 유전자의 겸상 세포 돌연변이(글루타메이트의 발린으로의 전환; 역사학적으로 E6V, 동시에 E7V)를 갖는 상당한 헤모글로빈 변이체를 보균한다. 헤모글로빈 장애의 높은 유병율 및 중증도는 실질적인 부담을 제시하여서, 오래 사는 환자 관리가 비용이 많이 드므로 이환된 사람의 삶뿐만 아니라 건강 관리 시스템에 영향을 미친다.
2개의 알파(α) 및 2개의 감마(γ) 사슬을 포함하는 태아(HbF) 및 2개의 α 및 2개의 베타(β) 사슬을 포함하는 성인(HbA)인 헤모글로빈의 2개의 형태가 있다. HbF로부터의 HbA로의 자연적 스위치는 출생 직후 발생하고, bcl11a인 마스터 조절제를 포함하는 인자에 의해 γ 글로빈 유전자의 전사 억제에 의해 조절된다. 중요하게는, 여러 가지의 임상 관찰은 β-헤모글로빈병증, 예컨대 겸상 세포 질환 및 β-지중해빈혈의 중증도가 HbF의 증가된 생성에 의해 개선된다는 것을 나타낸다.
특정한 실시형태에서, 치료학적으로 효과적인 치료는 HbF의 발현을 유도하거나 증가시키고/증가시키거나, 헤모글로빈의 생성을 유도하거나 증가시키고/증가시키거나, β-글로빈의 생성을 유도하거나 증가시킨다. 특정한 실시형태에서, 치료학적으로 효과적인 치료는 혈액 세포 기능을 개선하고/하거나 세포의 산소화를 증가시킨다.
다양한 실시형태에서, 본 개시내용은 혈액 장애의 치료를 위해 단백질 또는 제제를 암호화하는 암호화 핵산 서열을 포함하는 본 개시내용의 아데노바이러스 공여자 벡터를 사용한 혈액 장애의 치료를 포함한다. 다양한 실시형태에서, 혈액 장애는 지중해빈혈이고, 단백질은 β-글로빈 또는 γ-글로빈 단백질 또는 달리 β-글로빈 또는 γ-글로빈을 부분적으로 또는 완전히 기능적으로 대체하는 단백질이다. 다양한 실시형태에서, 혈액 장애는 혈우병이고, 단백질은 ET3 또는 달리 VIII 인자를 부분적으로 또는 완전히 기능적으로 대체하는 단백질이다. 다양한 실시형태에서, 혈액 장애는 점 돌연변이 질환, 예컨대 겸상 세포 빈혈이고, 제제는 유전자 편집 단백질이다.
ET3은 서열 번호 154의 하기 아미노산 서열을 갖거나 포함할 수 있다. 다양한 실시형태에서, VIII 인자 대체 단백질은 서열 번호 154(MQLELSTCVFLCLLPLGFSAIRRYYLGAVELSWDYRQSELLRELHVDTRFPATAPGALPLGPSVLYKKTVFVEFTDQLFSVARPRPPWMGLLGPTIQAEVYDTVVVTLKNMASHPVSLHAVGVSFWKSSEGAEYEDHTSQREKEDDKVLPGKSQTYVWQVLKENGPTASDPPCLTYSYLSHVDLVKDLNSGLIGALLVCREGSLTRERTQNLHEFVLLFAVFDEGKSWHSARNDSWTRAMDPAPARAQPAMHTVNGYVNRSLPGLIGCHKKSVYWHVIGMGTSPEVHSIFLEGHTFLVRHHRQASLEISPLTFLTAQTFLMDLGQFLLFCHISSHHHGGMEAHVRVESCAEEPQLRRKADEEEDYDDNLYDSDMDVVRLDGDDVSPFIQIRSVAKKHPKTWVHYIAAEEEDWDYAPLVLAPDDRSYKSQYLNNGPQRIGRKYKKVRFMAYTDETFKTREAIQHESGILGPLLYGEVGDTLLIIFKNQASRPYNIYPHGITDVRPLYSRRLPKGVKHLKDFPILPGEIFKYKWTVTVEDGPTKSDPRCLTRYYSSFVNMERDLASGLIGPLLICYKESVDQRGNQIMSDKRNVILFSVFDENRSWYLTENIQRFLPNPAGVQLEDPEFQASNIMHSINGYVFDSLQLSVCLHEVAYWYILSIGAQTDFLSVFFSGYTFKHKMVYEDTLTLFPFSGETVFMSMENPGLWILGCHNSDFRNRGMTALLKVSSCDKNTGDYYEDSYEDISAYLLSKNNAIEPRSFAQNSRPPSASAPKPPVLRRHQRDISLPTFQPEEDKMDYDDIFSTETKGEDFDIYGEDENQDPRSFQKRTRHYFIAAVEQLWDYGMSESPRALRNRAQNGEVPRFKKVVFREFADGSFTQPSYRGELNKHLGLLGPYIRAEVEDNIMVTFKNQASRPYSFYSSLISYPDDQEQGAEPRHNFVQPNETRTYFWKVQHHMAPTEDEFDCKAWAYFSDVDLEKDVHSGLIGPLLICRANTLNAAHGRQVTVQEFALFFTIFDETKSWYFTENVERNCRAPCHLQMEDPTLKENYRFHAINGYVMDTLPGLVMAQNQRIRWYLLSMGSNENIHSIHFSGHVFSVRKKEEYKMAVYNLYPGVFETVEMLPSKVGIWRIECLIGEHLQAGMSTTFLVYSKKCQTPLGMASGHIRDFQITASGQYGQWAPKLARLHYSGSINAWSTKEPFSWIKVDLLAPMIIHGIKTQGARQKFSSLYISQFIIMYSLDGKKWQTYRGNSTGTLMVFFGNVDSSGIKHNIFNPPIIARYIRLHPTHYSIRSTLRMELMGCDLNSCSMPLGMESKAISDAQITASSYFTNMFATWSPSKARLHLQGRSNAWRPQVNNPKEWLQVDFQKTMKVTGVTTQGVKSLLTSMYVKEFLISSSQDGHQWTLFFQNGKVKVFQGNQDSFTPVVNSLDPPLLTRYLRIHPQSWVHQIALRMEVLGCEAQDLYV)에 대한 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 동일성을 갖는 아미노산 서열을 가질 수 있다.
β-글로빈은 서열 번호 155의 하기 아미노산 서열을 갖거나 포함할 수 있다. 다양한 실시형태에서, β-글로빈 대체 단백질은 서열 번호 155(MVHLTPEEKSAVTALWGKVNVDEVGGEALGRLLVVYPWTQRFFESFGDLSTPDAVMGNPKVKAHGKKVLGAFSDGLAHLDNLKGTFATLSELHCDKLHVDPENFRLLGNVLVCVLAHHFGKEFTPPVQAAYQKVVAGVANALAHKYH)에 대한 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 동일성을 갖는 아미노산 서열을 가질 수 있다.
γ-글로빈은 서열 번호 156의 하기 아미노산 서열을 갖거나 포함할 수 있다. 다양한 실시형태에서, γ-글로빈 대체 단백질은 서열 번호 156(MGHFTEEDKATITSLWGKVNVEDAGGETLGRLLVVYPWTQRFFDSFGNLSSASAIMGNPKVKAHGKKVLTSLGDATKHLDDLKGTFAQLSELHCDKLHVDPENFKLLGNVLVTVLAIHFGKEFTPEVQASWQKMVTAVASALSSRYH)에 대한 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 동일성을 갖는 아미노산 서열을 가질 수 있다.
80개 초과의 원발성 면역 결핍 질환은 세계 보건 기구에 의해 인정된다. 이들 질환은 일부 경우에 감염에 대해 임의의 또는 충분한 항체를 생성할 수 없는 면역계에서의 고유한 결함을 특징으로 한다. 다른 경우에, 세포는 적절히 작용하도록 감염 실패와 싸우는 것을 방어한다. 통상적으로, 원발성 면역 결핍은 유전 장애이다.
속발성 또는 획득, 면역 결핍은 유전된 유전 비정상의 결과가 아니고, 오히려 면역계가 면역계 밖의 인자에 의해 손상된 개체에서 발생한다. 예는 외상, 바이러스, 화학요법, 독소 및 오염을 포함한다. 획득 면역결핍 증후군(AIDS)은 T 림프구의 고갈이 신체가 감염과 싸울 수 없게 하는 인간 면역결핍 바이러스(HIV)인 바이러스에 의해 야기된 속발성 면역 결핍 장애의 예이다.
X 연결 중증 복합 면역결핍(SCID-X1)은 T 및 자연 살해(NK) 림프구의 부재 및 비기능적 B 림프구의 존재를 생성시키는 공통 감마 사슬 유전자(γC)의 돌연변이에 의해 야기된 세포 면역 고갈 및 체액 면역 고갈 둘 다이다. SCID-X1은 면역계가 예를 들면 골수 이식(BMT) 또는 유전자 치료를 통해 재구성되지 않으면 생애 처음 2년에 치명적이다.
대부분의 개체는 BMT 또는 비자가유래 유전자 치료에 대한 일치된 공여자가 부족하므로, 성숙 T 세포가 고갈된 반일치 모 골수가 대개 사용되지만, 합병증은 장기간 면역글로빈 대체를 따라서 요하는 적절한 항체를 만드는 것의 실패인 이식편 대 숙주 질환(GVHD), 조혈 줄기 및 조상 세포(HSPC)를 이식하는 것의 실패로 인한 T 세포의 후기 손실, 만성 사마귀 및 림프구 조절이상을 포함한다.
판코니 빈혈(FA)은 골수 실패로 이어지는 유전된 혈액 장애이다. 이것은 부분적으로 결핍 DNA-회복 기전을 특징으로 한다. FA를 갖는 환자의 적어도 20%는 암, 예컨대 급성 골수성 백혈병 및 피부, 간, 위장관 및 부인과계의 암을 발생시킨다. 피부 및 위장 종양은 보통 편평 세포 암종이다. 암을 발생시킨 환자의 평균 연령은 백혈병에 대해서는 15세이고, 간 종양에 대해서는 16세이고, 다른 종양에 대해서는 23세이다.
치료학적 유전자는 특정한 실시형태에서 유전되는 병태에 대한 치료학적으로 효과적인 반응을 제공하도록 선택될 수 있다. 특정한 실시형태에서, 병태는 그레이브병, 류마티스성 관절염, 악성 빈혈, 다발성 경화증(MS), 염증성 장 질환, 전신 홍반 루푸스(SLE), 아데노신 데아미나제 결핍증(ADA-SCID) 또는 중증 복합 면역결핍 질환(SCID), 비스코트-알드리히 증후군(WAS), 만성 육아종 질환(CGD),, 판코니 빈혈(FA), 배턴병, 부신백질이영양증(ALD) 또는 이염백질이영양증(MLD), 근이영양증, 폐포 단백질증(PAP), 피루베이트 키나제 결핍증, 슈바크만 다이아몬드 블랙판 빈혈, 선천성 각화이상증, 낭성 섬유증, 파킨슨병, 알츠하이머병 또는 근위축성 측색 경화증(루게릭병)일 수 있다. 특정한 실시형태에서, 병태에 따라, 치료학적 유전자는 단백질을 암호화하는 유전자 및/또는 기능이 중단된 유전자일 수 있다.
특정한 실시형태에서, 본원에 개시된 방법 및 제형은 암을 치료하기 위해 사용될 수 있다. 특정한 실시형태에서, 제형은 급성 림프아구성 백혈병(ALL), 급성 골수성 백혈병(AML), 만성 림프구성 백혈병(CLL), 만성 골수성 백혈병(CML), 만성 골수단핵구성 백혈병, 미만성 대형 B-세포 림프종, 소포성 림프종, 호지킨 림프종, 연소성 골수단핵구성 백혈병, 다발성 골수종, 골수이형성증 및/또는 비호지킨 림프종을 치료하기 위해 대상체에게 투여된다.
치료될 수 있는 추가 예시적인 암은 성상세포종, 비정형 기형종 횡문근양 종양, 뇌 및 중추 신경계(CNS) 암, 유방암, 암육종, 연골육종, 척삭종, 맥락총 암종, 맥락총 유두종, 연조직의 투명 세포 육종, 미만성 대형 B-세포 림프종, 상의세포종, 상피모양 육종, 생식샘외 종자 세포 종양, 신외성 횡문근양 종양, 유잉 육종, 위장관 기질 종양, 교모세포종, HBV 유도된 간세포 암종, 두경부암, 신장암, 폐암, 악성 횡문근양 종양, 수모세포종, 흑색종, 뇌수막종, 중피종, 다발성 골수종, 신경아교 종양, 달리 명시되지 않은(NOS) 육종, 핍지교성상세포종, 핍지교종, 골육종, 난소암, 난소 투명 세포 선암종, 난소 난소 자궁내막모양 선암종, 난소 장액 선암종, 췌장암, 췌장 도관 선암종, 췌장 내분비 종양, 솔방울샘모세포종, 전립선암, 신장 세포 암종, 신장 수질 암종, 횡문근육종, 육종, 신경초종, 피부 편평 세포 암종 및 줄기 세포 암을 포함한다. 다양한 특정한 실시형태에서, 암은 난소암이다. 다양한 특정한 실시형태에서, 암은 유방암이다. 특정한 실시형태, 제형은 암 재발생을 예방하거나 지연시키거나 고위험 생식선 돌연변이의 보균자에서 암 발생을 예방하거나 지연시키기 위해 대상체에게 투여된다.
암의 맥락에서, 치료학적 유효량은 종양 세포의 수를 감소시키고/시키거나, 전이의 수를 감소시키고/시키거나, 종양 부피를 감소시키고/시키거나, 기대 수명을 증가시키고/시키거나, 암 세포의 아폽토시스를 유도하고/하거나, 암 세포사를 유도하고/하거나, 암 세포에서의 약물민감성 또는 방사선 민감성을 유도하고/하거나, 암 세포 근처의 혈관신생을 억제하고/하거나, 암 세포 증식을 억제하고/하거나, 종양 성장을 억제하고/하거나, 전이를 예방하고/하거나, 대상체의 삶을 연장시키고/시키거나, 암 연관된 통증을 감소시키고/시키거나, 전이의 수를 감소시키고/시키거나, 치료 후의 암의 재발 또는 재발생을 감소시킬 수 있다.
특정한 실시형태에서, 본원에 개시된 방법 및 제형은 점 돌연변이 병태를 치료하기 위해 사용될 수 있다. 특정한 실시형태에서, 제형은 겸상 세포 질환, 낭성 섬유증, 테이 삭스병 및/또는 페닐케톤뇨증을 치료하기 위해 대상체에게 투여된다. 다양한 실시형태에서, 본 개시내용의 트랜스포손 페이로드는 핵산 병소의 수정 편집을 위해 CRISPR-Cas를 암호화한다. 다양한 실시형태에서, 본 개시내용의 트랜스포손 페이로드는 핵산 병소의 수정 편집을 위해 염기 에디터를 암호화한다. 다양한 실시형태에서, 본 개시내용의 트랜스포손 페이로드는 핵산 병소의 수정 편집을 위해 프라임 에디터를 암호화한다.
특정한 실시형태에서, 본원에 개시된 방법 및 제형은 특정한 효소 결핍증을 치료하기 위해 사용될 수 있다. 특정한 실시형태에서, 제형은 헐러 증후군, 선택적 IgA 결핍증, 하이퍼 IgM, IgG 하위종류 결핍증, 니만-픽병, 테이 삭스병, 고셔병, 파브리병, 크라베병, 갈락토스혈증, 메이플 시럽 뇨증, 페닐케톤뇨증, 글리코겐 저장 질환, 프레드리히 운동실조, 젤웨거 증후군, 부신백질이영양증, 보체 장애 및/또는 점액다당류증을 치료하기 위해 대상체에게 투여된다.
치료학적 유효량은 면역 및 다른 혈액 세포 및/또는 미세아교 세포에 대한 기능을 제공할 수 있거나, 대안적으로 치료된 병태에 따라 림프구 활성화를 억제하고/하거나, 림프구에서의 아폽토시스를 유도하고/하거나, 림프구의 다양한 하위집단을 제거하고/하거나, T 세포 활성화를 억제하고/하거나, 자가반응성 T 세포를 제거하거나 억제하고/하거나, Th-2 또는 Th-1 림프구 활성을 억제하고/하거나, IL-1 또는 TNF를 길항하고/하거나, 염증을 감소시키고/시키거나, 조장 제제(inciting agent)에 대한 선택적 관용성을 유도하고/하거나, 면역 매개된 병태를 감소시키거나 제거하고/하거나, 면역 매개된 병태의 증상을 감소시키거나 제거할 수 있다. 치료학적 유효량은 또한 기능적 DNA 회복 기전; 계면활성제 단백질 발현; 텔로머 유지; 리소좀 기능; 지질 또는 다른 단백질, 예컨대 아밀로이드의 파괴를 제공하고/하거나, 리보솜 기능을 허용하고/하거나, 성숙 혈액 계통의 발생을 허용할 수 있고, 이는 그렇지 않으면 예컨대 대식세포 다른 백혈구 유형을 발생시키지 않을 것이다.
특정한 실시형태에서, 본 개시내용의 방법은 이를 필요로 하는 대상체에서 T-세포 매개된 면역 반응을 복원할 수 있다. T-세포 매개된 면역 반응의 복원은 흉선 배출을 복원하는 것 및/또는 정상 T 림프구 발생을 복원하는 것을 포함할 수 있다.
특정한 실시형태에서, 흉선 배출을 복원하는 것은 대조군 집단으로부터 유래된 기준 수준의 것과 필적하는 수준으로 말초혈에서의 CD45RA를 발현하는 CD3+ T 세포의 빈도를 복원하는 것을 포함할 수 있다. 특정한 실시형태에서, 흉선 배출을 복원하는 것은 대조군 집단으로부터 유래된 기준 수준의 것과 필적하는 수준으로 106개의 성숙 T 세포당 T 세포 수용체 절제 주기(TREC)의 수를 복원하는 것을 포함할 수 있다. 106개의 성숙 T 세포당 TREC의 수는 Kennedy 등, Vet Immunol Immunopathol 142: 36-48, 2011에 기재된 것처럼 결정될 수 있다.
특정한 실시형태에서, 정상 T 림프구 발생을 복원하는 것은 CD4+ 세포: CD8+ 세포의 비를 2로 복원하는 것을 포함한다. 특정한 실시형태에서, 정상 T 림프구 발생을 복원하는 것은 순환 T-림프구에서의 αβ TCR의 존재를 검출하는 것을 포함한다. 순환 T-림프구에서의 αβ TCR의 존재는 예를 들면 TCR의 α 및/또는 β 사슬에 결합하는 항체를 사용한 유세포분석법에 의해 검출될 수 있다. 특정한 실시형태에서, 정상 T 림프구 발생을 복원하는 것은 대조군 집단으로부터 유래된 기준 수준의 것과 필적하는 다양한 TCR 레퍼터리의 존재를 검출하는 것을 포함한다. TCR 다양성은 TCRβ 유전자의 가변 영역의 유전 재배열을 분석하는 TCRVβ 스펙트라타이핑(spectratyping)에 의해 평가될 수 있다. 강건한 정상 스펙트라타입 프로파일은 TCRVβ 분절의 17개의 패밀리에 걸쳐 크기화된 단편의 가우스 분포를 특징으로 할 수 있다. 특정한 실시형태에서, 정상 T 림프구 발생을 복원하는 것은 T-세포 특이적 신호전달 경로를 복원하는 것을 포함한다. T-세포 특이적 신호전달 경로를 복원하는 것은 T 세포 미토겐 피토헤마글루티닌(PHA)에 대한 노출 후에 림프구 증식에 의해 평가될 수 있다. 특정한 실시형태에서, 정상 T 림프구 발생을 복원하는 것은 대조군 집단으로부터 유래된 기준 수준과 필적하는 수준으로 백혈구 수, 중성구 세포 수, 단핵구 세포 수, 림프구 세포 수 및/또는 혈소판 세포 수를 복원하는 것을 포함한다.
특정한 실시형태에서, 본 개시내용의 방법은 이를 필요로 하는 대상체에서 림프구 재구성의 역학 및/또는 클론 다중성을 개선할 수 있다. 특정한 실시형태에서, 림프구 재구성의 역할을 개선하는 것은 대조군 집단으로부터 유래된 기준 수준의 범위 내로 순환 T 림프구의 수를 증가시키는 것을 포함할 수 있다. 특정한 실시형태에서, 림프구 재구성의 역학을 개선하는 것은 대조군 집단으로부터 유래된 기준 수준의 범위 내로 절대 CD3+ 림프구 수를 증가시키는 것을 포함할 수 있다. 범위는 소정의 매개변수에 대해 정상(즉, 면역 비손상된) 대상체에서 관찰되거나 나타난 값의 범위일 수 있다. 특정한 실시형태에서, 림프구 재구성의 역학을 개선하는 것은 본원에 기재된 치료가 투여되지 않은 이를 필요로 하는 대상체와 비교하여 정상 림프구 수에 도달하는 데 필요한 시간을 감소시키는 것을 포함할 수 있다. 특정한 실시형태에서, 림프구 재구성의 역학을 개선하는 것은 본원에 기재된 치료가 투여되지 않은 이를 필요로 하는 대상체와 비교하여 유전자 수정된 림프구의 빈도를 증가시키는 것을 포함할 수 있다. 특정한 실시형태에서, 림프구 재구성의 역학을 개선하는 것은 본원에 기재된 유전자 치료가 투여되지 않은 이를 필요로 하는 대상체와 비교하여 대상체에서 유전자 수정된 림프구의 클론 레퍼토리의 다양성을 증가시키는 것을 포함할 수 있다. 유전자 수정된 림프구의 클론 레퍼토리의 다양성을 증가시키는 것을 RIS 분석에 의해 측정된 것과 같이 고유한 레트로바이러스 통합 부위(RIS) 클론의 수를 증가시키는 것을 포함할 수 있다.
특정한 실시형태에서, 본 개시내용의 방법은 이를 필요로 하는 대상체에서 골수 기능을 복원할 수 있다. 특정한 실시형태에서, 골수 기능을 복원하는 것은 본원에 기재된 치료가 투여되지 않은 이를 필요로 하는 대상체와 비교하여 유전자 수정된 세포에 의해 골수 재증식을 개선하는 것을 포함할 수 있다. 유전자 수정된 세포에 의해 골수 재증식을 개선하는 것은 유전자 수정된 세포의 백분율을 증가시키는 것을 포함할 수 있다. 특정한 실시형태에서, 세포는 백혈구 및 골수 유래 세포로부터 선택된다. 특정한 실시형태에서, 유전자 수정된 세포의 백분율은 정량적 실시간 PCR 및 유세포분석법으로부터 선택된 검정을 사용하여 측정될 수 있다.
특정한 실시형태에서, 본 개시내용의 방법은 이를 필요로 하는 대상체에서 1차 항체 반응 및 2차 항체 반응을 정상화할 수 있다. 면역화에 대한 1차 항체 반응 및 2차 항체 반응을 정상화하는 것은 클래스 스위칭 및 항원에 대한 기억 반응에서 기능하는 B-세포 및/또는 T-세포 사이토카인 신호전달 프로그램을 복원하는 것을 포함할 수 있다. 면역화에 대한 1차 항체 반응 및 2차 항체 반응을 정상화하는 것은 박테리오파지 면역화 검정에 의해 측정될 수 있다. 특정한 실시형태에서, B-세포 및/또는 T-세포 사이토카인 신호전달 프로그램의 복원은 T-세포 의존적 신생항원 박테리오파지 ψX174에 의한 면역화 후 분석될 수 있다. 특정한 실시형태에서, 면역화에 대한 1차 항체 반응 및 2차 항체 반응을 정상화하는 것은 대조군 집단으로부터 유래된 기준 수준과 필적하는 수준으로 이를 필요로 하는 대상체에서의 IgA, IgM 및/또는 IgG의 수준을 증가시키는 것을 포함할 수 있다. 특정한 실시형태에서, 면역화에 대한 1차 항체 반응 및 2차 항체 반응을 정상화하는 것은 본원에 기재된 유전자 치료가 투여되지 않은 이를 필요로 하는 대상체의 것보다 높은 수준으로 이를 필요로 하는 대상체에서의 IgA, IgM 및/또는 IgG의 수준을 증가시키는 것을 포함할 수 있다. IgA, IgM 및/또는 IgG의 수준은 예를 들면 면역글로빈 시험에 의해 측정될 수 있다. 특정한 실시형태에서, 면역글로빈 시험은 IgG, IgA, IgM, 카파 경쇄, 람다 경쇄 및/또는 중쇄에 결합하는 항체를 포함한다. 특정한 실시형태에서, 면역글로빈 시험은 혈청 단백질 전기영동, 면역전기영동, 방사 면역확산, 비탁분석법 및 비탁법을 포함한다. 상업적으로 입수 가능한 면역글로빈 시험 키트는 MININEPH™(Binding site, 영국 버밍햄) 및 Dako(덴마크) 및 Dade Behring(독일 마르부르크)으로부터의 면역글로빈 시험 시스템을 포함한다. 특정한 실시형태에서, 면역글로빈 수준을 측정하기 위해 사용될 수 있는 샘플은 혈액 샘플, 혈장 샘플, 뇌척수액 샘플 및 뇨 샘플을 포함한다.
특정한 실시형태에서, 본 개시내용의 방법은 SCID-X1을 치료하기 위해 사용될 수 있다. 특정한 실시형태에서, 본 개시내용의 방법은 SCID(예를 들면, JAK 3 키나제 결핍증 SCID, 퓨린 뉴클레오사이드 포스포릴라제(PNP) 결핍증 SCID, 아데노신 데아미나제(ADA) 결핍증 SCID, MHC 클래스 II 결핍증 또는 재조합효소 활성화 유전자(RAG) 결핍증 SCID)를 치료하기 위해 사용될 수 있다. 특정한 실시형태에서, 림프구 재구성, 클론 다양성 및 가슴샘림프구증식 개선, 감염 감소 및/또는 환자 결과 개선을 통해 치료 효능이 관찰될 수 있다. 체중 증가 및 성장, 위장 기능 개선(예를 들면, 설사 감소), 상부 호흡기 증상 감소, 입의 진균 감염(아구창) 감소, 폐렴의 발생률 및 중증도 감소, 뇌수막염 및 혈류 감염 감소 및 귀 감염 감소 중 하나 이상을 통해 치료 효능이 또한 관찰될 수 있다. 특정한 실시형태에서, 본 개시내용의 방법에 의해 SCIDX-1을 치료하는 것은 γC 의존적 신호전달 경로에 대한 기능성을 복원하는 것을 포함한다. γC 의존적 신호전달 경로의 기능성은 각각 IL-21 및/또는 IL-2에 의한 시험관내 자극 후 효과기 분자 STAT3 및/또는 STAT5의 티로신 인산화를 측정함으로써 분석될 수 있다. STAT3 및/또는 STAT5의 티로신 인산화는 세포내 항체 염색에 의해 측정될 수 있다.
특정한 실시형태에서, 본 개시내용의 방법은 FA를 치료하기 위해 사용될 수 있다. 특정한 실시형태에서, 림프구 재구성, 클론 다양성 및 가슴샘림프구증식 개선, 감염 감소 및/또는 환자 결과 개선을 통해 치료 효능이 관찰될 수 있다. 체중 증가 및 성장, 위장 기능 개선(예를 들면, 설사 감소), 상부 호흡기 증상 감소, 입의 진균 감염(아구창) 감소, 폐렴의 발생률 및 중증도 감소, 뇌수막염 및 혈류 감염 감소 및 귀 감염 감소 중 하나 이상을 통해 치료 효능이 또한 관찰될 수 있다. 특정한 실시형태에서, 본 개시내용의 방법에 의해 FA를 치료하는 것은 미토마이신 C(MMC)에 대한 골수 유래 세포의 내성을 증가시키는 것을 포함한다. 특정한 실시형태에서, MMC에 대한 골수 유래 세포의 내성은 메틸셀룰로스 및 MMC에서의 세포 생존 검정에 의해 측정될 수 있다.
특정한 실시형태에서, 본 개시내용의 방법은 저감마글로빈혈증을 치료하기 위해 사용될 수 있다. 저감마글로빈혈증은 B-림프구의 결여에 의해 야기되고, 혈액에서의 낮은 수준의 항체를 특징으로 한다. 저감마글로빈혈증은 백혈병 관련된 면역 기능이상 및 치료 관련된 면역억제 둘 다의 결과로서 만성 림프구성 백혈병(CLL), 다발성 골수종(MM), 비호지킨 림프종(NHL) 및 다른 관련 악성상태를 갖는 환자에서 발생할 수 있다. 이러한 혈액학적 악성상태에 속발성인 획득 저감마글로빈혈증을 갖는 환자 및 HSPC 후 이식을 받은 환자는 박테리아 감염에 감수성이다. 체액 면역의 결핍은 대체로 특히 캡슐화된 미생물에 의해 이들 환자에서 감염 관련된 이환률 및 감염율의 증가된 위험의 원인이다. 예를 들면, 스트렙토코커스 뉴모니아에, 헤모필루스 인플루엔자에 및 스타필로코거스 아우레우스뿐만 아니라 레지오넬라 및 노카르디아 종은 CLL을 갖는 환자에서 폐렴을 야기하는 흔한 박테리아 병원균이다. 기회 감염, 예컨대 뉴모시스티스 카리니, 진균, 바이러스 및 마이코박테리아가 또한 관찰되었다. 이들 환자에서의 감염의 수 및 중증도는 면역 글로빈의 투여에 의해 상당히 감소될 수 있다(Griffiths 등 Blood 73: 366-368, 1989; Chapel 등 Lancet 343: 1059-1063, 1994).
특정한 실시형태에서, 제형은 급성 림프아구성 백혈병(ALL), 급성 골수성 백혈병(AML), 부신백질이영양증, 원인불명 골수 화생, 무거핵구성/선천성 혈소판감소증, 모세혈관확장성 실조증, β-지중해빈혈, 만성 육아종 질환, 만성 림프구성 백혈병(CLL), 만성 골수성 백혈병(CML), 만성 골수단핵구성 백혈병, 공통 가변 면역 결핍(CVID), 보체 장애, 선천성 무감마글로빈혈증, 다이아몬드 블랙판 빈혈(DBA), 미만성 대형 B-세포 림프종, 가족성 적혈구탐식성 림프조직증식증, 소포성 림프종, 호지킨 림프종, 헐러 증후군, 하이퍼 IgM, IgG 하위종류 결핍증, 연소성 골수단핵구성 백혈병, 이염백질이영양증, 점액다당류증, 다발성 골수종, 골수이형성증, 비호지킨 림프종, 발작성 야간혈색소 요증(PNH), 원발성 면역결핍 질환, 순적혈구 무형성증, 불응성 빈혈, 슈와크만-다이아몬드 증후군, 선택적 IgA 결핍증, 중증 무형성 빈혈, 겸상 세포 질환, 특이적 항체 결핍증, 비스코트-알드리치 증후군 및/또는 X 연결 무감마글로빈혈증(XLA)을 치료하기 위해 대상체에게 투여된다.
특정한 실시형태는 속발성 또는 획득, 면역 결핍, 예컨대 외상, 바이러스, 화학요법, 독소 및 오염에 의해 야기된 면역 결핍의 치료를 포함한다. 이전에 표시된 것처럼, 획득 면역결핍 증후군(AIDS)은 T 림프구의 고갈이 신체가 감염과 싸울 수 없게 하는 인간 면역결핍 바이러스(HIV)인 바이러스에 의해 야기된 속발성 면역 결핍 장애의 예이다. 따라서, 또 다른 예로서, 유전자는 감염성 질환에 대해 치료학적으로 효과적인 반응을 제공하도록 선택될 수 있다. 특정한 실시형태에서, 감염성 질환은 인간 면역결핍 바이러스(HIV)이다. 치료학적 유전자는 예를 들면 면역 세포가 HIV 감염에 내성이게 하거나, 면역 세포가 면역 재구성을 통해 바이러스를 효과적으로 중화시키는 것이 가능하게 하는 유전자, 면역 세포에 의해 발현된 단백질을 암호화하는 유전자의 다형, 환자에서 발현되지 않은 감염과 싸우기 위해 유리한 유전자, 감염성 제제, 수용체 또는 공동수용체를 암호화하는 유전자; 수용체 또는 공동수용체에 대한 리간드를 암호화하는 유전자; 소정의 전사 인자의 작용을 차단하기 위해 리보자임, 안티센스 RNA, 소형 간섭 RNA(siRNA) 또는 디코이 RNA를 암호화하는 유전자를 포함하는 바이러스 복제에 필수적인 바이러스 및 세포 유전자; 우성 음성 바이러스 단백질, 세포내 항체, 인트라카인을 암호화하는 유전자 및 자살 유전자일 수 있다. 예시적인 치료학적 유전자 및 유전자 산물은 α2β1; αvβ3; αvβ5; αvβ63; BOB/GPR15; Bonzo/STRL-33/TYMSTR; CCR2; CCR3; CCR5; CCR8; CD4; CD46; CD55; CXCR4; 아미노펩티다제-N; HHV-7; ICAM; ICAM-1; PRR2/HveB; HveA; α-디스트로글리칸; LDLR/α2MR/LRP; PVR; PRR1/HveC; 및 라미닌 수용체를 포함한다. HIV의 치료를 위한 치료학적 유효량은 예를 들면 HIV에 대한 대상체의 면역력을 증가시키거나, AIDS 또는 HIV와 연관된 증상을 개선하거나, HIV에 대해 대상체에서 선천성 면역 반응 또는 적응 면역 반응을 유도한다. HIV에 대한 면역 반응은 항체 생성을 포함할 수 있고, AIDS를 예방하고/하거나 대상체의 AIDS 또는 HIV 감염의 증상을 개선하거나, HIV 감염성 및/또는 독력을 감소시키거나 제거한다.
MGMT 발현 종양을 갖는 환자는 MGMTP140K 생체내 선택 카세트와 조합된 치료학적 페이로드(예컨대, CAR, TCR 또는 관문 억제제)에 의해 아데노바이러스 벡터(예를 들면, Ad3, 7, 11, 14, 16, 21, 34, 37 또는 50 벡터)의 투여로부터 이익일 것이다. 생체외 접근법은 이 접근법의 이용가능성을 나타냈다. 특정한 실시형태에서, 치료학적 양의 TMZ 및 벤질구아닌 또는 BCNU는 종양 부담 또는 부피를 감소시키기 위해 투여된다.
특정한 실시형태에서, 치료학적 유효량은 면역 및 다른 혈액 세포에 대한 기능을 제공하고/하거나, 면역 매개된 병태를 감소시키거나 제거하고/하거나, 면역 매개된 병태의 증상을 감소시키거나 제거할 수 있다.
본원에 제공된 예시적인 실시형태 및 실시예(들)는 본 개시내용의 특정한 실시형태를 나타내도록 포함된다. 당업자는 본 개시내용의 견지에서 많은 변화가 본원에 개시된 특정 실시형태에 이루어질 수 있고, 본 개시내용의 정신 및 범위로부터 벗어남이 없이 비슷하거나 유사한 결과를 여전히 얻을 수 있다는 것을 인식해야 한다.
실시예
본 실시예는 소정의 아데노바이러스 혈청형이 CD34+ 세포, 예컨대 HSC의 감염에 특히 효과적이라는 것을 입증한다. HSC가 유전자 치료에 대한 치료학적으로 중요한 표적이므로, CD34+ 세포의 형질도입에 효과적인 벡터의 확인이 실질적으로 임상적으로 중요하다. 소정의 시험된 아데노바이러스 혈청형은 Ad5 및 Ad5/35++와 같은 유전자 치료 실험 및 조사와 흔히 연관된 다른 것보다 CD34+ 세포의 감염에 유사하게 또는 더 효과적이었다.
실시예 1: 항-헥손 염색에 의한 CD34+ 세포의 아데노바이러스 벡터 감염의 분석
본 실시예는 다양한 아데노바이러스 벡터에 의한 CD34+ 세포의 감염을 측정하기 위해 항-헥손 염색을 이용한다. 이 실시예의 실험에 사용된 혈청형은 Ad3, Ad5, Ad7, Ad11, Ad14, Ad16, Ad21, Ad26, Ad34, Ad35, Ad37, Ad48, Ad50 및 Ad52뿐만 아니라 E1 결실("F35")을 포함하는 Ad5/35++ 벡터를 포함하였다. 벡터는 달리 언급된 것을 제외하고는 야생형 인간 아데노바이러스 벡터였다.
인간 CD34+ 세포(REF: 4Y-101C, 로트: 3038009, 공여자 ID: 15846)를 세포당 5,000개 또는 2,000개의 바이러스 입자(vp/c)로 야생형 인간 아데노바이러스(Ad 유형 수에 의해 확인됨)에 의해 감염시켰다. 항온처리 후 3시간에, 세포를 처음에 인산염 완충 식염수(PBS)로 세척하고, 빠르게 트립신화하여 모든 세포외 바이러스 입자를 제거하고, PBS로 세척하였다. 이후, 세척된 세포를 각각 본 실시예에서 항-헥손 염색에 의해 세포내 아데노바이러스 입자의 분석을 위해 사용되고 실시예 2에서 qPCR에 의해 아데노바이러스 DNA 내재화의 분석을 위해 사용된 2개의 분취액으로 나눴다. CD34+ 세포가 세포당 2,000개, 10,000개 및 20,000개의 바이러스 입자(vp/c)로 감염된 복제 실험을 추가로 수행하였다.
본 실시예에서, 세포를 처음에 실온에서 15분 동안 고정 배지(Thermofisher)로 고정하였다. PBS 세척 단계 후, 세포를 투과 배지(Thermofisher)에 재현탁시켰다. 항-아데노바이러스 헥손 항체(클론 20/11, MAB8052, Sigma)를 투과 배지에 첨가하고, 밤새 4℃에서 항온처리하였다. 둘째날에, 세포를 PBS로 2회 세척하고, 투과 배지에서 Alexa Fluor 488 표지된 2차 항체(카탈로그 # A-21121, Thermofisher)로 염색하였다. 염색을 2개의 PBS 세척 단계에 의해 중단시키고, 세포를 Beckman Coulter Gallios Flow Cytometer에서 분석하였다. 마우스 IgG1 아이소타입 대조군 항체(Sigma, REF: M5284-.1MG, 클론: MOPC 21)를 사용한 염색을 지칭하는 아이소타입 대조군을 분석함으로써 배경 신호를 얻었다. FITC 양성 세포의 백분율은 도 1에 표시되어 있다. 각각의 바이러스에 대해 2개의 샘플은 각각의 바이러스 용량에 대해 도시되어 있다.
항-헥손 염색의 결과는 도 1에 제공된다. 도 1에 도시된 것과 같은 이 실시예에서의 기준 혈청형은 대개 사용된, 예를 들면 유전자 치료 조사 또는 아데노바이러스 벡터 작제물에 사용된 Ad5 및 Ad5/35++(F35) 혈청형을 포함한다. 예상치 못하게, 몇몇 아데노바이러스 벡터 혈청형은 지속적으로 CD34+ 세포로의 내재화에 대해 이 기준 혈청형을 능가하였다. 이것은 Ad3, 7, 11, 14, 16, 21, 34, 35 및 50을 포함하였다. 반대로, 혈청형 Ad26, Ad37, Ad48 및 Ad52는 지속적으로 CD34+ 세포로의 내재화에 대해 기준 혈청형을 능가하지 않았다. 이 데이터는 Ad3, 7, 11, 14, 16, 21, 34, 35 및 50이 CD34+ 세포, 예컨대 HSC의 형질도입을 위한 벡터의 조작에 특히 그리고 예상치 못하게 유용하다는 것을 입증한다.
실시예 2: qPCR에 의한 CD34+ 세포로의 아데노바이러스 입자의 내재화의 분석
본 실시예는 다양한 아데노바이러스 혈청형에 의한 아데노바이러스 입자의 CD34+ 세포로의 내재화를 측정하기 위해 qPCR을 이용한다. 이 실시예의 실험에 사용된 혈청형은 Ad3, Ad5, Ad7, Ad11, Ad14, Ad16, Ad21, Ad26, Ad34, Ad37, Ad35, Ad48, Ad50 및 Ad52뿐만 아니라 E1 결실("F35")을 포함하는 Ad5/35++ 벡터를 포함하였다. 사용된 바이러스는 달리 언급된 것을 제외하고는 정제된 야생형 인간 아데노바이러스였다. 세포를 실시예 1에 기재된 것처럼 준비하였다.
본 실시예에서, 총 게놈 DNA를 Monarch® Genomic DNA Purification Kit(NEB)를 사용하여 단리하였다. qPCR 분석을 위해, 샘플을 제1 실험에서 Ad3, 7, 11, 14, 16, 21, 34, 35 및 50; 및 제2 실험에서 Ad26, Ad37, Ad48, Ad52, Ad5 및 F35인 2개의 실험으로 분할하였다. 제1 실험에서, DNA 중합효소를 표적화하는 프라이머 및 프로브를 증폭에 사용하고, 표준 곡선을 생성하기 위해 Ad35 게놈을 함유하는 정제된 플라스미드(pAd35)를 사용하였다. 제2 실험에서, 헥손을 표적화하는 프라이머 및 프로브를 증폭에 사용하고, 표준 곡선을 생성하기 위해 Ad5 게놈을 함유하는 정제된 플라스미드(pAd5)를 사용하였다. 정규화를 위해, 유전자 hB2M을 증폭시키는 프라이머를 적용하였다.
이 실시예의 qPCR 분석의 결과는 도 2에 제공된다. 광범위하게는, 세포당 바이러스 카피 수는 Ad7, Ad11, Ad14, Ad16, Ad21, Ad34, Ad35, Ad50 및 F35를 사용하여 가장 높았다. 세포당 바이러스 카피는 또한 Ad3, Ad37, Ad48, Ad52 및 Ad5에 대해 검출되었다. 세포당 바이러스 카피 수는 Ad26에 대해 가장 낮았다.
실시예 3: 항-헥손 염색에 의한 CD34+ 세포의 아데노바이러스 벡터 감염의 분석
본 실시예는 다양한 아데노바이러스 벡터에 의한 CD34+ 세포의 감염을 측정하기 위해 항-헥손 염색을 이용한다. 이 실시예의 실험에 사용된 혈청형은 Ad3, Ad5, Ad7, Ad11, Ad14, Ad16, Ad21, Ad26, Ad34, Ad35, Ad37, Ad48, Ad50 및 Ad52뿐만 아니라 E1 결실("F35")을 포함하는 Ad5/35++ 벡터를 포함하였다. 벡터는 달리 언급된 것을 제외하고는 야생형 인간 아데노바이러스 벡터였다.
3명의 공여자로부터의 인간 CD34+ 세포를 세포당 5,000개 또는 2,000개의 바이러스 입자(vp/c)로 야생형 인간 아데노바이러스(Ad 유형 수에 의해 확인됨)에 의해 감염시켰다. 공여자 1 세포(Lonza, REF: 4Y-101C, 로트: 3038009, 공여자 ID: 15846) 및 공여자 2 세포(Lonza, REF: 4Y-101E, 로트: 3046829, 공여자 ID: 14538)는 G-CSF에 의한 조혈 줄기 세포(HSC)의 동원으로 처리된 공여자 유래인 한편; 공여자 3 세포(Hemacare, REF: M34C-MOZ-1, 로트: 20063998)는 플레리사포르에 의한 HSC 동원으로 처리된 공여자 유래였다. 항온처리 후 3시간 또는 6시간에, 세포를 처음에 인산염 완충 식염수(PBS)로 세척하고, 빠르게 트립신화하여 모든 세포외 바이러스 입자를 제거하고, PBS로 세척하였다. 이후, 세척된 세포를 각각 본 실시예에서 항-헥손 염색에 의해 세포내 아데노바이러스 입자의 분석을 위해 사용되고(이 실시예), qPCR에 의해 아데노바이러스 DNA 내재화의 분석을 위해 사용된 2개의 분취액으로 나눴다(실시예 4).
본 실시예에서, 세포를 처음에 실온에서 15분 동안 고정 배지(Thermofisher)로 고정하였다. PBS 세척 단계 후, 세포를 투과 배지(Thermofisher)에 재현탁시켰다. 항-아데노바이러스 헥손 항체(클론 20/11, MAB8052, Sigma)를 투과 배지에 첨가하고, 밤새 4℃에서 항온처리하였다. 둘째날에, 세포를 PBS로 2회 세척하고, 투과 배지에서 Alexa Fluor 488 표지된 2차 항체(카탈로그 # A-21121, Thermofisher)로 염색하였다. 염색을 2개의 PBS 세척 단계에 의해 중단시키고, 세포를 Beckman Coulter Gallios Flow Cytometer에서 분석하였다. 샘플과 동일한 항체에 의해 염색된 비감염된 세포를 지칭하는 음성 대조군 및/또는 마우스 IgG1 아이소타입 대조군 항체(Sigma, REF: M5284-.1MG, 클론: MOPC 21)를 사용한 염색을 지칭하는 아이소타입 대조군을 분석함으로써 배경 신호를 얻었다. FITC 양성 세포의 백분율은 도 3 내지 도 13에 표시되어 있다. 각각의 바이러스에 대해 2개 또는 3개의 샘플은 각각의 바이러스 용량에 대해 도시되어 있다.
항-헥손 염색의 결과는 도 3 내지 도 13에 제공된다. 도 3 내지 도 13에 도시된 것과 같은 이 실시예에서의 기준 혈청형은 대개 사용된, 예를 들면 유전자 치료 조사 또는 아데노바이러스 벡터 작제물에 사용된 Ad5 및 Ad5/35++(F35) 혈청형을 포함한다. 예상치 못하게, 몇몇 아데노바이러스 혈청형은 지속적으로 CD34+ 세포로의 내재화에 대해 기준 Ad5 혈청형을 능가하고, 일부 경우에 또한 기준 F35 혈청형을 능가하였다. 이것은 Ad3, 7, 11, 14, 16, 21, 34, 35, 37 및 50을 포함하였다. 혈청형 Ad37은 공여자 1이 아니라 공여자 2 및 공여자 3으로부터의 CD34+ 세포로의 내재화에 대해 기준 혈청형 Ad5를 능가하였다. 반대로, 혈청형 Ad26, Ad48 및 Ad52는 지속적으로 CD34+ 세포로의 내재화에 대해 기준 혈청형을 능가하지 않았다. 이 데이터는 Ad3, 7, 11, 14, 16, 21, 34, 35, 37 및 50이 CD34+ 세포, 예컨대 HSC의 형질도입을 위한 벡터의 조작에 특히 그리고 예상치 못하게 유용하다는 것을 입증한다.
실시예 4: qPCR에 의한 CD34+ 세포로의 아데노바이러스 입자의 내재화의 분석
본 실시예는 다양한 아데노바이러스 혈청형에 의한 아데노바이러스 입자의 CD34+ 세포로의 내재화를 측정하기 위해 qPCR을 이용한다. 이 실시예의 실험에 사용된 혈청형은 Ad3, Ad5, Ad7, Ad11, Ad14, Ad16, Ad21, Ad26, Ad34, Ad37, Ad35, Ad48, Ad50 및 Ad52뿐만 아니라 E1 결실("F35")을 포함하는 Ad5/35++ 벡터를 포함하였다. 사용된 바이러스는 달리 언급된 것을 제외하고는 정제된 야생형 인간 아데노바이러스였다. 세포를 실시예 3에 기재된 것처럼 준비하였다.
본 실시예에서, 총 게놈 DNA를 Monarch® Genomic DNA Purification Kit(NEB)를 사용하여 단리하였다. qPCR 분석을 위해, 샘플을 제1 실험에서 Ad3, 7, 11, 14, 16, 21, 34, 35 및 50; 및 제2 실험에서 Ad26, Ad37, Ad48, Ad52, Ad5 및 F35인 2개의 실험으로 분할하였다. 제1 실험에서, DNA 중합효소를 표적화하는 프라이머 및 프로브를 증폭에 사용하고, 표준 곡선을 생성하기 위해 Ad35 게놈을 함유하는 정제된 플라스미드(pAd35)를 사용하였다. 제2 실험에서, 헥손을 표적화하는 프라이머 및 프로브를 증폭에 사용하고, 표준 곡선을 생성하기 위해 Ad5 게놈을 함유하는 정제된 플라스미드(pAd5)를 사용하였다. 정규화를 위해, 유전자 hB2M을 증폭시키는 프라이머를 적용하였다. 배경 신호를 조사되는 경우 비감염된 세포로부터 단리된 게놈 DNA를 지칭하는 음성 대조군 및/또는 qPCR 반응에서 게놈 DNA 대신에 물을 사용하는 것을 지칭하는 물(H2O) 대조군을 분석함으로써 얻었다.
이 실시예의 qPCR 분석의 결과는 도 14 내지 도 24에 제공된다. 광범위하게는, 세포당 바이러스 카피 수는 Ad3, Ad7, Ad11, Ad14, Ad16, Ad21, Ad34, Ad35, Ad37, Ad50 및 F35를 사용하여 가장 높았다. 세포당 바이러스 카피는 또한 Ad5, Ad26, Ad48 및 Ad52에 대해 검출되었다.
실시예 5: 제1 세대 아데노바이러스 벡터의 제조
본 실시예는 다양한 아데노바이러스 혈청형으로부터의 제1 세대 아데노바이러스 벡터의 제조를 포함한다. 이 실시예의 실험에 사용된 혈청형은 Ad11, Ad34 및 Ad35를 포함하였다. 제1 세대 아데노바이러스 게놈은 Ad 게놈으로부터 제거된 조절 E1 유전자(E1a 및 E1b)에 의해 제조되었다. 추가적으로, 제1 세대 Ad 게놈은 내인성 E4orf6 유전자가 Ad5 혈청형을 갖지 않으면 Ad5 E4orf6 유전자에 의해 내인성 E4orf6 유전자를 대체하도록 조작되었다. 제1 세대 Ad35 게놈은 돌연변이체 Ad35++ 섬유 매듭을 추가로 포함하였고, 섬유 매듭은 본원에서 어딘가에 기재되어 있고, 제1 세대 Ad35 게놈은 본 실시예에서 제1 세대 Ad35++ 게놈으로 지칭된다. 본 실시예의 제1 세대 Ad 게놈은 또한 EF1-알파 프로모터의 제어 하에 암호화 서열로부터 녹색 형광 단백질(GFP)을 발현하고 소 성장 호르몬(BGH) 폴리아데닐화 신호에 작동 가능하게 연결된 핵산 페이로드를 포함하도록 조작되었다. 당업자는 본 실시예 및 본 개시내용으로부터 다른 아데노바이러스 혈청형(예를 들면, Ad3, Ad5, Ad7, Ad14, Ad16, Ad21, Ad26, Ad37, Ad48, Ad50 및 Ad52)이 또한 아데노바이러스 벡터 게놈, 예컨대 제1 세대 아데노바이러스 벡터 게놈 및 본원에 개시된 다른 형태 또는 세대를 제조하도록 사용될 수 있다는 것을 이해할 것이다.
제1 세대 Ad 게놈을 암호화하는 플라스미드는 HEK293 세포로 형질주입되고, 생존 가능 Ad 벡터가 구조될 수 있는지를 결정하도록 증식되었다. 구조된 Ad 벡터는 표준 방법을 사용하여 정제되었다(예를 들면, Su 등 doi:10.1101/pdb.prot095547 Cold Spring Harb Protoc 2019 참조).
정제된 Ad 벡터는 몇몇 접근법을 사용하여 규명되었다. 정제된 바이러스 조제물의 물리적 역가 또는 수율은 분광측광법에 의해 결정되고, 정제된 바이러스 입자의 총 수(vp) 또는 형질주입된 HEK293 세포당 바이러스 입자의 수(vp/세포)로 표현될 수 있다. 표 19는 정제된 제1 세대 Ad 조제물을 규명하기 위한 실험으로부터의 결과를 보여준다.
정제된 Ad 벡터는 정제된 Ad 조제물로부터 단리된 DNA의 제한 효소 분해에 의해 추가적으로 규명되었다. 단리된 DNA는 제한 효소(SmaI, SspI 또는 BspHI)를 사용하여 분해되고, 제한 패턴은 제1 세대 Ad 게놈을 암호화하는 출발 플라스미드의 동일한 제한 효소를 사용한 분해에 의해 얻은 제한 패턴 및/또는 Ad 게놈의 서열에 기초하여 예측된 제한 패턴과 비교되었다. 겔에서의 제한 패턴의 분석은 예상된 밴딩 패턴 및 예상된 밴드 크기를 보여주었고(도 25 내지 도 28), 이는 제1 세대 Ad11, Ad34 및 Ad35++ 벡터의 성공적인 제조를 입증한다.
실시예 6: 세포의 제1 세대 아데노바이러스 벡터 감염의 분석
본 실시예는 다양한 제1 세대 아데노바이러스 벡터에 의한 세포의 감염을 측정하기 위한 GFP 페이로드 발현의 분석을 이용한다. 이 실시예의 실험에 사용된 혈청형은 Ad11, Ad34, Ad35 및 Ad35++(본원에 어딘가에 기재된 것과 같은 돌연변이체 Ad35 섬유 매듭을 갖는 Ad35)를 포함하였다. 벡터는 제1 세대 아데노바이러스 벡터이고, 실시예 5에 기재된 것과 같이 GFP를 암호화하는 핵산 페이로드를 포함하였다.
인간 세포주(HEK293 및 K562) 및 (실시예 3에 제시된 것과 같은 공여자 1, 공여자 2 및 공여자 3 세포로부터의) CD34+ 세포는 세포당 100개 내지 5,000개의 바이러스 입자(vp/c)로 제1 세대 아데노바이러스 벡터(Ad 유형 수에 의해 확인됨)로 감염되었다. 항온처리 후 3시간, 24시간, 25시간 또는 48시간에, 세포를 처음에 인산염 완충 식염수(PBS)로 세척하고, 빠르게 트립신화하여 모든 세포외 바이러스 입자를 제거하고, PBS로 세척하였다. 이후, 세척된 세포를 각각 본 실시예에서 GFP 페이로드 발현의 분석에 의해 세포내 아데노바이러스 입자의 분석을 위해 사용되고(이 실시예), (실시예 7에서) qPCR에 의해 아데노바이러스 DNA 내재화의 분석을 위해 사용된 2개의 분취액으로 나눴다.
본 실시예에서, 세포는 GFP 페이로드 발현을 검출함으로써 Beckman Coulter Gallios Flow Cytometer에서 분석되었다. GFP 페이로드 발현의 분석의 결과는 도 29 내지 도 32에서 GFP 양성 세포의 백분율로서 제공된다. 혈청형 Ad11, Ad34, Ad35 및 Ad35++의 제1 세대 아데노바이러스 벡터는 HEK293 세포로의 내재화에 대해 실질적인 성능을 나타낸다(도 29 및 도 30). 혈청형 Ad34 및 Ad35++의 제1 세대 아데노바이러스 벡터는 K562 세포로의 내재화에 대해 실질적인 성능을 나타낸다(도 31). 혈청형 Ad11, Ad34 및 Ad35++의 제1 세대 아데노바이러스 벡터는 CD34+ 세포로의 내재화에 대해 실질적인 성능을 나타낸다(도 32). 이 데이터는 시험된 혈청형이 인간 세포의 형질도입에 대한 벡터로 조작될 수 있다는 것을 입증하고, 혈청형 Ad11, Ad34 및 Ad35++가 CD34+ 세포, 예컨대 HSC의 형질도입을 위한 벡터로 조작될 수 있다는 것을 추가로 입증한다.
혈청형 Ad11, Ad34, Ad35(제1 세대 Ad35 및 제1 세대 Ad35++)로부터의 제1 세대 아데노바이러스 벡터를 사용한 세포의 감염의 추가 규명은 공여자 1 및 공여자 3으로부터의 CD34+ 세포의 CD34+/CD90+ 하위집단에서의 GFP 페이로드 발현을 조사함으로써 수행되었다. CD34+/CD90+ 하위집단은 HSC의 더 원시적인 하위집단을 한정한다. CD34+/CD90+ 하위집단을 구별하기 위해, 형질도입 후 46시간에 세포는 Fc 수용체 차단 용액(BioLegend, Human TruStain FcX)으로 15분 동안 4℃에서 염색 완충액(PBS 중의 0.5% BSA)에 재현탁되었다. 다음에, 세포는 20분 동안 4℃에서 APC에 접합된 항-CD34 항체(BD Biosciences, REF: 340441, 클론 8G12) 및 BV421에 접합된 항-CD90 항체(BD Biosciences, REF: 562556, 클론 5E10)와 항온처리되었다. 세포는 1회 PBS 중의 0.5% BSA로 세척되고, 이후 유세포분석법에 의해 분석되었다. 유세포분석법 데이터는 CD34+ 세포 및 CD34+/CD90+ 세포를 확인하는 것이었다. 세포의 각각의 집단 내에, GFP 양성 세포는 GFP 양성 세포의 백분율 및 GFP 양성 세포에서의 GFP의 기하 평균 형광 강도(MFI)를 결정하기 위해 확인되었다. 예시적인 게이팅은 도 33에 도시되어 있다. CD34+ 집단과 비교된 CD34+/CD90+ 하위집단에서의 GFP 페이로드 발현의 분석의 결과는 도 34 및 도 35에서 GFP 양성 세포의 백분율로서 제공되고, 도 36 및 도 37에서 GFP 양성 세포에서의 GFP의 기하 MFI로서 제공된다. 혈청형 Ad11, Ad34, Ad35 및 Ad35++의 제1 세대 아데노바이러스 벡터는 세포당 2,000개 및 5,000개의 바이러스 입자로 일반 CD34+ 집단과 비교하여 세포의 CD34+/CD90+ 하위집단의 더 큰 감염성을 나타냈다. 시험된 혈청형은 또한 세포당 5,000개의 바이러스 입자로 일반 CD34+ 집단과 비교하여 세포의 CD34+/CD90+ 하위집단에서의 페이로드 암호화된 GFP의 더 큰 발현을 나타냈다. 이 데이터는 시험된 혈청형이 인간 CD34+ 세포의 형질도입을 위한 벡터로 조작될 수 있고, CD34+/CD90+ 원시적 HSC를 형질도입하는 데 특히 효과적일 수 있다는 것을 입증한다.
실시예 7: qPCR에 의한 세포의 제1 세대 아데노바이러스 벡터 감염의 분석
본 실시예는 다양한 아데노바이러스 혈청형에 의해 (공여자 2로부터의) HEK293 세포 및 CD34+ 세포로의 아데노바이러스 입자의 내재화를 측정하기 위해 qPCR을 이용한다. 이 실시예의 실험에 사용된 혈청형은 Ad11, Ad34 및 Ad35++를 포함하였다. 사용된 바이러스는 정제된 제1 세대 아데노바이러스 벡터이고, 실시예 5에 기재된 것과 같은 GFP를 암호화하는 핵산 페이로드를 포함하였다. 세포를 실시예 6에 기재된 것처럼 준비하였다.
본 실시예에서, 총 게놈 DNA를 Monarch® Genomic DNA Purification Kit(NEB)를 사용하여 단리하였다. qPCR 분석을 위해, DNA 중합효소를 표적화하는 프라이머 및 프로브를 증폭에 사용하고, Ad35 게놈을 함유하는 정제된 플라스미드(pAd35)를 표준 곡선을 생성하기 위해 사용하였다. 정규화를 위해, 유전자 hB2M을 증폭시키는 프라이머를 적용하였다.
이 실시예의 qPCR 분석의 결과는 도 38 내지 도 39에 제공된다. 광범위하게는, 세포당 바이러스 카피 수는 검출되고 Ad11, Ad34 및 Ad35++에 대해 필적하였다.
다른 실시형태
본 발명자들이 다수의 실시형태를 기재하였지만, 본 발명자들의 개시내용 및 실시예가 또한 본원에 기재된 조성물 및 방법에 의해 사용하고 포함되는 다른 실시형태를 제공한다는 것이 자명하다. 따라서, 본 개시내용의 범위가 예에 의해 표현된 특정 실시형태에 의하기보다는 본 개시내용으로부터 이해될 수 있는 것에 의해 정의되어야 하는 것으로 이해될 것이다. 본 개시내용의 하나의 양태와 관련하여 기재된 제한은 특정 실시형태에서 본 개시내용의 다른 양태와 관련하여 실행된다. 예를 들면, 본원에 제시된 소정의 독립항으로부터 직접적으로 또는 간접적으로 의존하는 청구항의 제한은 하나 이상의 다른 독립항의 추가 종속항에 제시된 제한에 대한 뒷받침으로서 작용한다.
SEQUENCE LISTING
<110> ENSOMA, INC.
<120> ADENOVIRAL GENE THERAPY VECTORS
<130> 2013585-0059
<140>
<141>
<150> 63/129,233
<151> 2020-12-22
<160> 175
<170> KoPatentIn 3.0
<210> 1
<211> 136
<212> DNA
<213> Human mastadenovirus B
<400> 1
ctatctatat aatatacctt atagatggaa tggtgccaac atgtaaatga ggtaatttaa 60
aaaagtgcgc gctgtgtggt gattggctgc ggggttaacg gctaaaaggg gcggcgcgac 120
cgtgggaaaa tgacgt 136
<210> 2
<211> 136
<212> DNA
<213> Human mastadenovirus B
<400> 2
acgtcatttt cccacggtcg cgccgcccct tttagccgtt aaccccgcag ccaatcacca 60
cacagcgcgc acttttttaa attacctcat ttacatgttg gcaccattcc atctataagg 120
tatattatat agatag 136
<210> 3
<211> 343
<212> DNA
<213> Human mastadenovirus B
<400> 3
gacttatgtg ggaggagtta tgttgcaagt tattacggta aatgtgacgt aaaacgaggt 60
gtggtttgaa cacggaagta gacagttttc ccacgcttac tgacaggata tgaggtagtt 120
ttgggcggat gcaagtgaaa attctccatt ttcgcgcgaa aactaaatga ggaagtgaat 180
ttctgagtca tttcgcggtt atgccagggt ggagtatttg ccgagggccg agtagacttt 240
gaccgtttac gtggaggttt cgattaccgt gtttttcacc taaatttccg cgtacggtgt 300
caaagttctg tgtttttacg taggtgtcag ctgatcgcta ggg 343
<210> 4
<211> 3439
<212> DNA
<213> Human mastadenovirus B
<400> 4
tatttaaacc tgacgagttc cgtcaagagg ccactcttga gtgccagcga gaagagtttt 60
ctcctccgcg ccgcaagtca gttctgcgct ttgaaaatga gacacctgcg cttcctgcca 120
caggaggtta tctccagtga gaccgggatc gaaatactgg agtttgtggt aaatacccta 180
atgggagacg acccggaacc gccagtgcag cctttcgatc cacctacgct gcacgatctg 240
tatgatttag agatagacgg gccggaggat cccaatgagg aagctgtgaa tgggtttttt 300
actgattcta tgctgctagc tgctgatgaa ggattggaca taaaccctcc tcctgagaca 360
cttgttaccc caggggtggt tgtggaaagc ggcataggtg ggaaaaaatt gcctgatctg 420
ggagcagctg aaatggactt gcgttgttat gaagagggtt ttcctcccag tgatgatgaa 480
gatggggaaa ctgagcagtc catccatacc gcagtaaatg agggagtaaa agctgccagc 540
gatgttttta agttggactg tccggagctg cctggacatg gctgtaagtc ttgtgaattt 600
cacaggaata acactggaat gaaagaacta ttgtgctcgc tttgctatat gagaatgcac 660
tgccacttta tttacagtaa gtgtatttaa gtgaaattta aaggaatagt gtagctattt 720
aataactgtt gaatggtaga tttatgtttt tttcttgcga ttttttgtag gtcctgtgtc 780
tgatgatgag tcaccttctc ctgattcaac tacctcacct cctgaaattc aggcgcccgc 840
acctgcaaac gtatgcaagc ccattcctgt gaagcctaag cctgggaaac gccctgctgt 900
ggataagctt gaggacttgt tggagggtgg ggatggacct ttggacctta gtacccggaa 960
actgccaagg caatgagtgc cctgcagctg tgtttattta atgtgacgtc atgtaataaa 1020
attatgtcag ctgctgagtg ttttattact tcttgggtgg ggacttggat atataagtag 1080
gagcagatct gtgtggttag ctcacagcaa cctgctgcca tccatggagg tttgggctat 1140
cttggaagac ctcagacaga ctaagctact gctagaaaac gcctcggacg gagtctctgg 1200
cctttggaga ttctggttcg gtggtgatct agctaggcta gtgtttagga taaaacagga 1260
ctacagggaa gaatttgaaa agttattgga cgatagtccg ggactttttg aagctcttaa 1320
cttgggtcat caggctcatt ttaaggagaa ggttttatca gttttagatt tttctactcc 1380
tggtagaact gctgctgctg tagcttttct tacttttata ttggataaat ggatccgcca 1440
aactcacttc agcaagggat acgttttgga tttcatagca gcagctttgt ggagaacatg 1500
gaaggctcgc aggatgagga caatcttaga ttactggcca gtgcagcctc tgggagtagc 1560
agggatactg agacacccac cgaccatgcc agcggttctg caggaggagc agcaggagga 1620
caatccgaga gccggcctgg accctccggt ggaggagtag ctgacctgtt tcctgaactg 1680
cgacgggtgc ttactaggtc tacgaccagt ggacagaaca ggggaattaa gagggagagg 1740
aatcctagtg ggaataattc aagaaccgag ttggctttaa gtttaatgag ccgcaggcgt 1800
cctgaaactg tttggtggca tgaggttcag agcgaaggca gggatgaagt ttcaatattg 1860
caggagaaat attcactaga acaacttaag acctgttggt tggaacctga ggatgattgg 1920
gaggtggcca ttaggaatta tgctaagata tctctgaggc ctgataaaca atatagaatt 1980
actaagaaga ttaatattag aaatgcatgc tacatatcag ggaatggggc agaggttata 2040
atagatacac aagataaagc agtttttaga tgttgtatga tgggtatgtg gccaggggtt 2100
gtcggcatgg aagcagtaac acttatgaat attaggttta aaggggatgg gtataatggc 2160
attgtattta tggctaacac taagctgatt ctacatggtt gtagcttttt tgggtttaat 2220
aatacgtgtg tagaagcttg ggggcaagtt agtgtgaggg gttgtagttt ttatgcatgc 2280
tggattgcaa catcaggtag ggtcaagagt cagttgtctg tgaagaaatg catgtttgag 2340
agatgtaatc ttggcatact gaatgaaggt gaagcaaggg tccgccactg cgcagctaca 2400
gaaactggct gcttcattct aataaaggga aatgccagtg tgaagcataa tatgatctgt 2460
ggacattcgg atgagaggcc ttatcagatg ctgacctgcg ctggtggaca ttgcaatatt 2520
cttgctaccg tgcatatcgt ttcacatgca cgcaaaaaat ggcctgtatt tgaacataat 2580
gtgattacca agtgcaccat gcacataggt ggtcgcaggg gaatgtttat gccttaccag 2640
tgtaacatga atcatgtgaa ggtaatgttg gaaccagatg ccttttccag agtgagctta 2700
acaggaatct ttgatatgaa tattcaacta tggaagatcc tgagatatga tgacactaaa 2760
ccaagggtgc gcgcatgcga atgcggaggc aagcatgcta gattccagcc ggtgtgcgtg 2820
gatgtgactg aagacttgag acccgatcat ttggtgcttg cctgcactgg agcggagttc 2880
ggttctagtg gtgaagaaac tgactaaagt gagtagtggg gcaagatgtg gatggggact 2940
ttcaggttgg taaggtgggc agattgggta aattttgtta atttctgtct tgcagctgcc 3000
atgagtggaa gcgcttcttt tgagggggga gtatttagcc cttatctgac gggcaggctc 3060
ccaccatggg caggagttcg tcagaatgtc atgggatcca ctgtggatgg gagacccgtc 3120
cagcccgcca attcctcaac gctgacctat gccactttga gttcgtcacc attggatgca 3180
gctgcagccg ccgccgctac tgctgccgcc aacaccatcc ttggaatggg ctattatgga 3240
agcatcgttg ccaattccag ttcctctaat aacccttcaa ccctggctga ggacaagcta 3300
cttgttctct tggcgcagct cgaggcctta acccaacgct taggcgaact gtctaagcag 3360
gtggcccagt tgcgtgagca aactgagtct gctgttgcca cagcaaagtc taaataaaga 3420
tctcaaatca ataaataaa 3439
<210> 5
<211> 22697
<212> DNA
<213> Human mastadenovirus B
<400> 5
tttaagagtc agcgcgcagt acttgttgaa gagagcctcg gcgtcctcga gagtgcgctg 60
aagttggtct tcgctcttgt gatacaaaca acttctggtg agcgagcgca gagatcggtt 120
ttttactttc agttcctgct cttgcccccg actctgctgg aaaatggcat agagggttgg 180
aaagatccgg ttcctcagct ctctggtctg cgctggctcg ttcgctgtga tcctcagtcc 240
tcctcctggt gcacttgttg tggattttct aactgctggt tttctggtca ccgttgtcgc 300
tgctgtattt ttctgtcggg gttgccggga cttgctgact gcagtagggg ctgtggaggt 360
gacggtagta atgcaagata ttgcggggga agtttacacc gtggtggaag agcaggtatc 420
gccgggtgaa ggatatgttg cccccgcatt catgcaagca ggagatgata gcgtttttat 480
gtccacgcca ggacttgtat ccctgtcgct ccttcttacc ggtcttggaa gcggtggtcg 540
ggtttgggaa tcgcccggtc tcgtcccatc tactgttggg ccgccgctgg gccccccgac 600
ccggagcgga gatggtagcc gtgctgctgt ctggggactt gcttgtctcc gccgccgatg 660
acaactgttt ggcggcggtt gcttcttcca cctcctctgc ctcctcgtct tcctcctcca 720
aactgtcttc ctccaggctg tccacctcct ctgcctggct gtcccaatct tccatctcct 780
cctctgcctg actgtcccag tcttccttca tatcctctgg gggcgacagc tgcaccttca 840
acttcttgct tcctcggcga tgggacatcc tgggggaacc ttgtgttgag ctcctcaccg 900
gtctgagggt caaggtagac cccgtttccc ttttttagca gaaattcttg gcgagatttt 960
tggatggctt gcaattgggc cagaattgct ccctgggtga tgacgcaggc tgagagctcg 1020
actttgggag gatgtgattg gtcctcatag aacctgatct catagggatg gtagtcctcg 1080
gggtgaaact tgcgcaggta ggcggaggtc cacagccccg gtgtcagttt caaactctgc 1140
cccggagaag acccctcgcc tttacttctg ggaccctgca gctcgaaggt gccgataatc 1200
tgggtctcgc tcagcaactg ggggttgcag gcaagggagc ggtggggtgt gcaaagattg 1260
cagcggcagt ggcattccag caggccgtct ccgctcacat cctctataac atccgagtgg 1320
taggagaggt agttggccag gcggaacagg tagcagtggc tccatagcgg cggtgggcac 1380
tcgcggtagg tgagaggcac aaagtcggag ggcagcgcac agcaggtggc aggcaggata 1440
ccggagcgtt ccaggatgaa agagcgaaag ttgttaagca tgctctggct cataaagtct 1500
ggcaggccgt ttcgcagagt aaccctgaga cgctcgggga agatgatgtc tgccaggtcc 1560
gaggcgacgg tgcgctcatc aaaacctgtc cacagggctt tgagggatct ctgcaagagc 1620
ttgtccagct cttttaggtt ctgctcttcc aaacactgtt gccacacacc cataccagtt 1680
tgccaggtat ggcagaggta gaggtagaca cagtctcgga tgtagtcacg gcgggcctcc 1740
cctttaaggg tggtgtgcag gacgctctgc cctagtcggt tctcatgcaa aatgcccatg 1800
taagaaacca ggttggtaag ctccacgttg gagatcttgc atgcctgccg cacgaagcca 1860
tgtctaaagg tgtagtgcag gttctcctct agcttgcgca gggtctcagg gtcggtgaaa 1920
aagcggcgca gacactccag ctccacagtt actagcacta cagccatcat aagcttgcgc 1980
ctctcttcca aatctcgggg ggagttggta cccagccagc gagatagctg ctcgtcactg 2040
actaccggct tgccctcgtc cgaggcgtct ggatcctgca tgttctggtt ttctgaaaga 2100
ggtcttgctc gtttgatgag cagatggtcc atgacagcgc tcataacttt ggggggcagg 2160
ttaacagcgg ggtaggcaaa atgggtgacc acgatactgc gcttgagcac tgcaatccgg 2220
gcattgtcac cctccagttc caccagagcg ctgtggtgtt catccatgtc attctctccc 2280
tgttgcagag catttgcggc ccgtgtctca tcacttccca gaccctcaaa gatctttgga 2340
acctcttcca aggaagctat atcaggtaag cgagctcccg gacccaagtt gagcagggca 2400
tcggcgcggg tgcggttggc gcggcaggag actggaatct tttggttctt gaaaaagatg 2460
tggtaggtgg ccaacacttc ggggatagta aaagctggat agaagttgag tcgagggttg 2520
gcctcgcagg tgccgtttgg ctgccgcttg gggggtacct gaggcgaaaa gaggttcagc 2580
tcgtaggcgc ggctaagctc ttccacactg atgggcactt cagtgagatc gagcaatgcg 2640
tctttaacta tgatcgactg ccttgctaga tgtttgagga gcacgtcctc cccaccaagg 2700
ccggtgaggt agtcggcgac atgatccctg atcccagcct cctggtaaac gccatctgct 2760
tgatgctctg ggcggtcgtc atcctctctg tctagaaagc gtttcagctc ctcctggtgc 2820
tccgccggcg tcacatagcc cgggtcctgc tcgacatctg cctcaatctc ttccgttttc 2880
acattatcct gcgcctgcat ctcctgggct gcgtcgacct cctcctcatc atcgagggta 2940
gaggtggtgg tagcgggact gggtggtggg gtggttaagc tctcctcctc gtcgctgctg 3000
ggggcgaggt gtgatggtgc ttgcagcgat gttggcagtg atggctgagt ttccatgtct 3060
gttgtttctc tgcctaggag aacacaatgg ccagccgcgg aggaaatcag tcaagcgacc 3120
gccaccggga gcacaccccc gaacgcggaa tgagctctgc cagccatccg cctccaaggc 3180
cagaccgcag cccatctcag tcgcctccac ctctgccccc gaagaggaac acctaccgtc 3240
gtgtggggtc cggttcttct accgagagcc aggtggtatt ggtaagcgaa acttcgcagt 3300
catccctgtc tccggagcgg agcaacagtc ctcccccgat ccctcccaag aagaagccca 3360
ggaagaccaa gcatgtccct ctgcaagaca tcagccagga tagtgaagaa gaaagagaac 3420
aggctcagtt ggtggccgtg ggcttcagct accccccggt gcgcatcatt gagaaggatg 3480
gcaagagaag tgttgagaag atcgacaaga atgaccctat agctaaagga gctactttta 3540
ttgctgttag gaatcctttg agtctgcccc tggtatctgc ctgggagaag ggcatggaag 3600
tgatggctgt gctaatggaa aggtacaggc tggataatga tctgagaacc tctttcaagc 3660
tgatgccaga gcagcacgag caatacaagc gtatctgcca ccagtatgtg aacgaggagc 3720
accgtggcat cccgctgaca tttaccagca tgaagacctt gacaacaatg atgggaagat 3780
tcatgcaggg attggtacat tattattctg agatcgccca caataattgg gagtgcaccg 3840
ggtgcgctct gtgggctcat ggatgcaccg attatgaagg caaggtgaaa tgcctgcatg 3900
gcactatcat gatccagaag gaccacatta tcgagatgga tgtggcgagc gagaacgggc 3960
agcgcgctat gaaggagaat ccagacagag ccaagatcac ccaaaaccgc tggggcagaa 4020
atgtggttca gttggccaac aacgatgccc gctgttgtgt gaatgatgcc aactgtacta 4080
ctaatcaatt ttccagcaag tcctgtggga tgttctacac cgagggaagt aaggcccagg 4140
aagcttttaa gcagtacgaa gccttcatga aggctgtgta cccagggata actcccgacc 4200
aagccaggat gatgctgatc cccattcatt gtgattgcaa ccacaagcca ggctgcgctc 4260
ccgtgatggg caggcagaca tgtaagatga ccccctttgg gatggccaat gctgaagact 4320
tggatgtgac taccatcagt gacccaaccg tgttggcaag cgtaagacac ccagcgttga 4380
tagtgttcca gtgttgcaac ccagtgtatc gcaactcccg tgtccagaat gccggcccca 4440
actgtgattt caagatctct gctcctgacc tgcttggcgc tatgcaactg accagaaagt 4500
tgtggcaaga cacctttccc gagattccag ttcccaagct ggtaatcccc gagttcaagt 4560
ggcagaacag gttacagttc cgcaacgtat ccctgcccgc gggtcactct gactcccgcc 4620
agaacccatt cgacttctga gtaaatgatg aaacaaatga gcaaaaccag agcctcagtg 4680
catgtaaaaa taaagtgctg tttattgaac acggttttac atgacttatt gcatatccat 4740
acggtcaaac gcggtggccc tttcaatgcg cgcgcggtga gaacgaaagt aagatgagtg 4800
ggtgtttagg aagcggtata gcacctcctg gttgcggcgc agggtgggct ggacttgggg 4860
tgattggagc atgctgttgg acaccccagt cagcaacttc atggtggggt ttccgtccat 4920
ggggcggtcg ggccagtgca caaaggcatg aaggaacata cagcaaaaaa gtccacaggc 4980
ggctgagcgc ggaccctgca cgctttgggt agacttctcc agggtgatgc agcggtcttt 5040
ggtagcaagg gcactgcgac gcaggagccc ctcgtactca aactggtaaa tctgtttgag 5100
ccgctcatcc gagaacccaa aaggatcaaa aaggtagcag gtgttgtagc gcgggttcca 5160
accaaaagcc agccagtgct ctccccccgt ctcgcgtccg gcagtgttga ctatggcgca 5220
ggcgagcttg tcgggggcca tgaaccccgg gaaacgcttg tcaaaggttc ccaggaaata 5280
gggtccgcag cccaggtctc ggacgatggc tttgagctct tgctcgctgg agccgtttcc 5340
ggacccgcat gtcatggctg cagctgctgc ttgcaagaag caagaggctt cttatgtggt 5400
ggcgttgccg gccgagaacg gtgtgcgcag gtagacggcc tcgatgacgc cgcggtgtgg 5460
ctggtgcact ctgaccacgt cgaagacttc gaaaagaaga taaagcaggg tgggctcatc 5520
catgggatcc acctcaaaag tcatgtccag cgcatgggct gagttggcat agagcatgtt 5580
ctgtcccagg tcggtaaggg cccccatgga catgaagttg ctggagaagg gaatgcgcca 5640
catggtcctg tcgcacagga actttttctg ggtgacactc ttaacggcag tagttccgat 5700
gagcgggtat ggataattgg ctgggtaagg ttccccttgt ctcatagtag gtgcaaggta 5760
ccctacaaag ccagagttgt tgtgttggta tggtaaggtg acggctttgt agtcagtgta 5820
attaacctca tcaaccacct gcctgctcat aggctggaag tttctgaaaa aggagtacat 5880
gcgatccttg tatccctcag ggatgtaaaa gccctggtag ccaatgttgt aattggcaag 5940
catctgaacc aggaaccagt ctttggtcat gttgcattgt gccacgttgt atccttcccc 6000
gtccacagtg cgcttgattt caaactcatt tggactcaac agcctgtcat tgccaggcca 6060
gctgactgag gagtcaaaca tgatggagac cttcttgaaa gtgtggttaa ggtaaaaggt 6120
gccatccagg tagggaatag atccagaata tacgaagtag ggatcgaacc ctgatccaag 6180
agatggagtc tccttggttt tgagtctggt gaaggaccag cccctgaagg ctgcccagtt 6240
gcgagatggg atggaaattg gaatgttggt tgcattggca ggaatggggt aaagcatgtt 6300
agctgcagag aggtagtcgt taaatgactg atcattggta tcgttgcgca gcatggcttc 6360
aagggtggaa gctgtgttgt gagccatggg gaagaaggtg gcatagagat tgatgctggt 6420
gaaacttatg gtagcaccat ccgttctgag gtcatttcca agggaacttt gcaggaccat 6480
gttcacatcc tttcggaagt tccactcgta ggtgtaggag ccaggtagaa gaagtaggtt 6540
cttgacagca aagaatttct gaggcacttg tatgtggaaa ggcacataac gaccatttcc 6600
cagaagcatg gacctgtagc gcagaccagc attgcggtgg tggttgaatg gattcacatt 6660
gtccattggg tcaagagacc acctggcgcc aatgttgatg tatgaatcaa ccagggatgg 6720
ggataccact cgcccgttca tgtactcata ggtgttggtg ttagtgggca aagtaatgtt 6780
aggtggcgtg tacttgtaaa catctggaag gtacaaagcc acattagagt acagaaaact 6840
tctccaaagg ttagcttgga tattaatttc catagccagg ttgttgccta tggttatttc 6900
attagctgga gcaacattag catctttttc ccatccatta gtgtcatcgg ttttaacttt 6960
aatgccttga tatgtgtgcc ctggtcctat gccattcaga ggaaaacagt aattaggcag 7020
ttcatcctcg atgccatgat tttcaataat gcgaacatcg ggatcgtaac tgtccacagc 7080
ctgattccac atgctgaagt atctggttct gtctcccaga gaatcaagca aaagctgata 7140
tgacagttca gtatttctgt cctgcaagtc aaccactgca ttcagttgtg atgcttggcc 7200
agccaaaact cccatatttc cagtactgtt gtagtacatt aggcctacga agttatccct 7260
gaagccaatg taattgggtc tgttaggcat ggcttgttga cccaaatttg catgagagtt 7320
attagacgtt tctggtttat ataccacatg actgtctgga gtttccaaat ttacattttc 7380
cgtataaagc acaatttcag gcgctaaagc tcctgcaaca gcatctctac catcgaaaaa 7440
ttccatatca atatctggtt cctcagtttc aacccctcct tcggttgttg gttttacttt 7500
tctgttttta gcttggcccc cttttatgtt tgtaggtctt gcaaaagacc cgtagcatgg 7560
cttcatgttg gtagctggtt taagggctct tccaccaaac ttttcatttg ttccatcagt 7620
atcagtccat gattcttctc caacttgagg ctctggctga tatgttttat cggcataaat 7680
gggcttttct tctccttcag tagtggtaat gtctttccca atttgcaaac cttctttagt 7740
aatattgtct cccttcatgg aagcaatgcc aaatgtgttt gtggtggtag ttactgcatt 7800
gtccccattt gttgtaacta tccactgaga tgtattgggc gcgcccttag gagcgagtga 7860
attgtaagct gtgccggaat atggcttgaa gctaggacct ctatcaagca ccccccgaat 7920
gtcaaagaat gtgctggcca tgtcaagcac tctgttgtcg cctacagcca gcgtgtagcg 7980
aactttgtaa gagtaggtat tgtcttcccg gtcaacgggc acgaagcgca gcatcaggcg 8040
ctggctacgg tcggtggtca catcgtgggt gggcgccact gtggggtttc taaatttgtt 8100
ccccatactg aagtaggtgt ctgttgcacg ggcgaactgc accagacccg gactgaggta 8160
ctccgaagca tcctgtccgg cgatgtgcat gtatgcccat tggggcatca tcgatggggt 8220
ggccatcttg aaagcaactc agcctcggcg cgcgacctct tcctttctcc tctgctgcgg 8280
cggcgtggtg atgatacata cacacagaca agcaagttaa gcgctactcc atatttaatt 8340
aatagcagcg acggcgcttt acactctgca cgcccagacc cacgatgctg ttcagagtac 8400
tttgccagtt tgctttcggg cgcggtgtgc ccccaggacg cggtctggct acggcgacgg 8460
gctgtacggc ggtgggcttt ctggtagcga caggtttggg aacaggcgcc gcagaagcag 8520
ggggaggagg caagtccaag gtggcgggtc gatgtgactg agaaggtttc atcaccccgg 8580
tagccatgtg agctacaggc ctggtagtgg gcattccgag ctttactgcc tcctcatatg 8640
aagggggctc gtctgcgcgc gtcaccagcg tctgctctag ctcgggtcgc ggacgcttgt 8700
cgccccgctt ttccagcgga ggaagttctt cctccacttc catttcacca ggggttgcgg 8760
gcggcgggtc caggcggctg tttatctgtt tttgtacagc ctggttggcc agatccacta 8820
cgccgttaat accagaggcg atcccatcga ccaccttctg ttggaagttt tgttccttaa 8880
gcttatttct cagagcctgc cctgtgctgc tgttccaagc tttgttccca taggttttta 8940
cggtcgagcc aaaattttta agcccgctcc agatactgct ccaattgaag gcgcccccgt 9000
tcagttggct cgtgccgatg tcgctccagg tgcccatgta cggcctcgtg ccgtgtcgcg 9060
gagccaggga tgaaaaattg atgtcttcca tctctacaaa aacatagtca caggaccagg 9120
agcgtcagag tccattctat tttttattta taagtttttt ccaatgttag tggcgctgcg 9180
aggcctgaac cgccactgaa gctatgcctg gtatcgcccc gatcgctgcg gcgatgatgg 9240
gtataagagc tggcaaaaag ccacccccta atcgtctgct gatagcgcgc cttcgtctgt 9300
ggcggcgcat ccctcgcccc aacatccttc tacggcgcga gtttcttcct cggtagccag 9360
taatggggac gcgaaggcgg caagtgaggg ccatatctgc aaggaggcag cgtcaacagt 9420
cattaagtgg tgatgcttgg atggtagcgc gcgcgcggca gcgtcagagg ttcagcgcga 9480
ccatcgcggt acactctccg caccagggcg gcgggagtca atttgctggc agtgttgcgg 9540
cggcggcgac ggcgagtgcg acttgcaggt ggtttgcggc ggcgagaggt gttgctccgg 9600
tttcgatagt agcgagtgcc tctgtaaccc ggagtgggaa tgatggatgg gtgcagagca 9660
tagttgggca ttagcagact tgctgggccg tactttcgtc gtgatcttcg agtggtgctg 9720
ggggcggcaa cgggcgcggg catccagggt tccgtttgca cctcaattga ggtggtgggt 9780
tttgcaggtt cggtctgcac ttccatggac tcggtgggaa tcttgatgtc gaaggtttgt 9840
actcccaaac ctggcgccac ttccttgata ggtcttactt tgacctcagg ctggatatcg 9900
gcatccactt tcattttctc cagtacgtct tctagcctct ggcgcttggg caccattagc 9960
tgcatggtgg gatataggtc ctcaccctcg cgctttacgc ctctccgcgc aggcacgggc 10020
agcacttgct gcagggtgac tggtttgagg ctgggggtgg gatttccatg atccaaagga 10080
atggacacag cctcctcttt gggactggat ctagtgcgct tgccataagc aaactcgtca 10140
aggcggtctg ccgcctgctc aagaatatcg tcatccccgt acacctcatc ataggaccgt 10200
ttaaaagtag tgctggaacg ctcgccaggt gtaaaaacca cagtggtccc gggtctgagc 10260
acttgacgca ctttgcgccc gcgccactgc acgcgccgtc ttggggcgaa ctcgcgcaca 10320
aactccacca gcccatcatc gtcatcttct tcctttttgt tatttttgac ccgcttgatt 10380
ttgcggggct ttttttcatc cttcaccggc ggaccgtaga tttcaggcgc gatgacctgg 10440
agcatctctt ccttgtattt gcgcttggac atacttgccg ctgggacaca acatcggaga 10500
ctgctcagta tcttctaagt gcgagggggg cgggtgcgca cgggcacgcg ctggccggta 10560
gtggcatcac gcacccagta cacattgcct cttcgcggtt gggccatgtt ggcaatggcc 10620
gctgctgccg ccgtggccgc gcgcctgcgg gacctgccgc tgctggcacc tgaagccgcg 10680
cgtctggccg ctctaagcat ggctcttcgc cccacacgtt tggccctccg cagaatagct 10740
tttgcggctc gcatggcggg agtagccctg tggcgcctgg cgatgcgcct ccttcggctc 10800
ttccggcgag cataggcgcg ggcgtctgcc accacactgt caataactgc atccacagta 10860
gatgtaggcg cagtaggagt ataattacga gcatcggcga ccacctggtc gatcacatca 10920
tcgaccgtgg tccgagtgcg ggtacgaccc ttgagtgcgc cccagggagc gcggaaatga 10980
ccgcgaacgc gcacaggatg ctgggtagag cgcttgcggg cgcctccata catcttggtg 11040
ggcgcataca gtccccaacc ggtattatta ctgggcgaga tgagaatgga catttttttt 11100
ttttttagaa agtgcggctt gaaagaacgc gcggcgcgac tatgcccagg gccttgtaaa 11160
cgtagggaca ggtgcggcgt ctggcgtcag taacggtcac gcgctggact ccccggatac 11220
tgctgcgtaa cggcagggtc ccgtgatctg tgagagcagg aacgttttca ctgacggtgg 11280
taattgtggg cgccggcggg cggatgagga tctggttctc agggaagcgg ttgaagacgt 11340
gcgtgagcga agtggcctgt cggagctgct gagagtacac ggcttgctca ttgtagaaac 11400
tctttgagaa gacgggcata agctctgcac ccaccactgg gtagttgttg acttgtcttg 11460
tggagcggaa ggtgactggg tcttgcatca tgtcagggag cgaccagtag acctgctctg 11520
ccccacaggt gacatctgaa gtggtgagca gtgtccaaga ccttattcct ttctcagggt 11580
taccgtaatt gtaggacagg taccaactgc ggtaggctgt gttgattttg tcttccaaga 11640
cattgtagct tctactcttg ctgtcttttt ctagaggttg gatctttaac tcttttttaa 11700
cttcagcagc tgcagcttca cgtttttgtt tttcagttat ataggtatct cctctagtta 11760
tatcatcatc ttcactagtt tcctctgcaa cagccagtgt ggttgtttca gtagtggtat 11820
cctttttgct ttcctcatag gcagtgacat ccaaaagggc aggaatatta cccccttcaa 11880
gatcttcata catgattttg aaaccctcct ggaatggatg tctcttcctg atgccaagca 11940
agttgctaag tcggctttca gtaaagtcta ccccgcaacc aggcagcaat acaatgtcag 12000
gatggaatgc ctcataagtg tagacacctg gcataatcaa cttagtttcg gggtcccacc 12060
cgagcctgaa atttctagtg tcaaacttaa caccaatgtc actttccagc actccattct 12120
gtctgccaat ttccaggtag ttgtcaatga tggcattgtt catcaggtcg atcgtcatgg 12180
tggctgaaaa gttgccttct ggtaaaatga actcaaacca ctcatacttc aagatatcct 12240
ctttatgatc ataggtgtca tttactgtaa caccttcagg agcttttctg gacaccatca 12300
ccctcgcctt gaacttgttg ctgaacatgt actcgttcac gttgggcatg ttggtgtgca 12360
tgatggtctt cagctgaccg ccccatcgcg accgctcgtc aaagttgatg gtctgggtgc 12420
tagcctccgt gggggtaaag tcattgttct gcaccaccgt ggtcaggaag ttgctgtggt 12480
cgttctgata gttcagggag gcgatgtccg ccgacttgtt gtccaccaga tacaacttgg 12540
tggtatcgta caggggcgac agctccgagt aacgaatgct gtttctccct tccgtaggcg 12600
ccaggtaccg tgggggtacg aagggagcct ccagtggggg ctgtatcatc gccgcctgtt 12660
gctgcatcac gctctcgtaa gaaggaggag gaccctccgg atacaccacc gctccgccta 12720
gcacggctcg tctcctcatc gtactagaca cagataacaa aaaagaacga acgcacgctc 12780
ggtcgccatg gccttggtga gttgcctttt tattttactt tcacttttac aacatgcgcc 12840
cgaatctggg acgcagatga gcgaacgggt tgccccctcc tcttccaccc aagtccaaca 12900
cgctgctatc atcggcagag tcctcatcgt cccacacaag acccatctgc ctgtcgtggc 12960
gctggcgtct acggatcggt ctgcttgtag cccccaagat cctgggctcg tctctgtgat 13020
cctgcgcata ggtcttccat ctactcatct tatccaccag actctctatt ccattgttgg 13080
ggaagttctt ttccctctct ggcctcagca aagagtcatt caagtactca tcctcgccca 13140
tcaagcgcgg gcgggttatt ctccccagtt cactgctgcg aacgctgttt agtgaaaagg 13200
gcaagctagg gaaaggactt gcagcttcgg gcacggtcgc ggcagcacca gccgttccgg 13260
atagcgacac ggaagagtgt cttctatcgc ccccttcctt cttccaaact gtataaccgg 13320
gaggcgggga aaatatgctg ctgtccacat cgtcccacag gaacccgtca ttggggtcgg 13380
gcatgtcgta ctcgccagtg tagaaaccag gtgggggcag ccagtgtggg ttcaggatag 13440
cattggtgaa ataatcagag ttcatggcgg ccgccctgtg caggtagtcc agcagtttgt 13500
taatgaaagg cctgttacta gcatacatgc tgggctccat gtttcgagct gtcatgtcca 13560
gcgcggcggt aggtgtcgcc ccctcctgca tcaggaacag tccaacgctc tgttgcacgt 13620
atctgaggat ccgctcctcc tcagcggtaa gcgcatactg aggagggatc ttctgtgacc 13680
ggttggttag caagaagttc agggtggctt ccaaactgcc cgtgtcttcc tgacccaggg 13740
cgcggctcac ttgggtgatt tcttgatagg tctgctcgtc cacctggctc tgtcctatgg 13800
cctcgcgata caggttaagc aggtagccca agtacgagtt gcggtcaatg ctaccgctgt 13860
cagtaaaggg ggataccagc agcagcagca ggcgggagtt gggagtcagc aagctagaca 13920
cggtcgcgcg atcccctact ggggcgtgca ctccccacag acccttcagg ttcttgaaag 13980
cctgagtcag gttcactgtc tgcaagccct gtctgctggt ctggaagaag taatctggcc 14040
cggactggta cacctcgctc tggggcacct cagctaccat gagtctcaat gcactcaaaa 14100
agtttgtata gtcttgctga ccacggggca cgttggcggg ctgggtgctg aggaaagcgt 14160
ttagcgctac caacgacccc aagttggcgt cgcgctggaa tcgctcgcgc tgagacacgg 14220
cctcgcgcac atcggtcacc atccggtcca ggttggtttg cacgttgctg ctgttgtaac 14280
gggccacgcg ctccaagaga gcattgtata ccagcccggc ctcatcggga cggatggcct 14340
tgttctccac cagcgcgttc acgatagcca ggaccttctc gtgggtgggg ttggagcggg 14400
agggcactac ggcctccagt atggcagaaa ggcggttggc ctggggttgc tgtctaaagg 14460
cttcggggtt gcgggtcgtc agcgccatta tgcgttgcat ggcctgggtc caatcgtccg 14520
aggagttaat gccggacggc tggctctgca gcgccgcccg cattgcgggg tccggtgcct 14580
gctgctgttc catctagcaa aaatacgggt cgcgccatca gtcttccaag tactcgccct 14640
cctcgtcctc gacttcatcc acctcttcta tgtaaggaag ctcacaccct gcagcctcca 14700
tggccctgcg actgggttgc cattgcaaat ccgctcccat gtcaaagtag ttctccccat 14760
cagtcccggc ccccgttaga gctctttgca agctgtgcat aagttctctg tcgctcagct 14820
cgcgcctcct gctggcgctc accgcgcggt gcatcctgtc attgcgatac acccccagat 14880
cgtcgctcag agtcagcacc ttcagagtca tgcgcatgta aaacccatct atcttcacct 14940
ccttgtctat gggtacgtag ggggtcttgt agatcttgcg agcgtagtat ttgcccaggc 15000
tcaagaccga gtagttgata gctgccactt tctcagccaa acccaggcta cgttcctgca 15060
ctataatact ttgcaggatg ttgatcagat catacagcca tctcccatca ggctcggtga 15120
tgttcaacaa cgcctccctg aatgcctcgt tgtccctgct atgttgaacc accagaaaca 15180
gctgagctgt cagtggtttg ctagtggggt tttgggcgat agcctccatc aggtcccaca 15240
gatgcatcag acccagggtc acttcctcgc gggcgatcag ggtgcgcaca tggttgttaa 15300
aagatttttg gaagttgcgc tcctccttca cggtctgctc gtaggccgag actaggttgg 15360
ccgcggccac atgtgcccta gctgggctga tccctgtgac ttcatcgacc tcaaaatcct 15420
cgtcttgcag cacccgtctt cgatccagac cgtggcgcag ctcgcgaccc gcgttaaatc 15480
gagatgctcg catctcctct ggctcctcgc cgctcctgtc cctgaacagg ttctgctggg 15540
gcacgtacgc ctcgcgagag tcctttttta gttgcacccg cgggtgccgc tcgggcgatg 15600
gagcccccag gcgcgccaat ccctcgccct cttccaagtc cagatcatag gcgggctgtc 15660
ccgcgccgct cacggctgca gctgcagtag ttgcaggagc aagaagagcc ttttgtggct 15720
gttgctgaga aggggcctgt tgctgggggc gcatctgtcg cagcactgga tgcatctggg 15780
cgacaaaaac aaaaaaaaaa aaaaaagggc tcgctcccgt aaactggaga agtcggctgg 15840
cggggtcttg gaaataacgg ggctgccaaa ccctcgcttg tcgcggaaac cggccgatac 15900
gagccgcgct taggctccaa ccggggcata ccgcaacgca accctggcga ctgattctcc 15960
agactacggg cgcgagccac tcacggcccg agaactgagc gttctaaagc ttgacgtggc 16020
aatggcacac gtccaggaaa aagcagcaaa aacgactcta ctccgtaccc tggatattcg 16080
tcggctgggt cgagacggga tagccaatac cacgttagcc gcggctccgg ccgatccgag 16140
cgtgatcgct tagctttgga ctcgaaccgg ggtacaccgc gacccaaccc gttcacgttc 16200
ccccagacca cggagtcgag ccgctcatcg ctttcgtttt ctccgtgtct acagagcgtc 16260
aatgactgcg cgcgcctcac tggccagacc gtgcctacca tgaactactt catgccgctg 16320
cgcaacatct ggaaccgcgt gcgcgagttc ccacgtgcat ccaccaccgc ctccggtatc 16380
acctggatgt ccaggtacat ctacggctac caccgcctca tgctggaaga cctcgccccc 16440
ggagccccgg ctacagagcg atggcccctg taccgccagc caccgccaca ctttctcatt 16500
ggctaccagt acctggtgcg cacctgcaac gattacatct ttgacacccg cgcatactcg 16560
cgcctcaagt acaccgagct cgtgcgccct gggcaccaga cagtcaactg gtcagtcatg 16620
gccaactgct cctacacaat caacaccggg gcctaccacc gcttcgtgga ctttgacgac 16680
ttccaagcca ccctcaccca ggtgcagcaa gccatcctcg ccgaaagggt tgtagcggac 16740
ctggcacttg tccagcccat gcgcgggttc gggatcactc gcatgcatgg cagagcgggc 16800
gaagaagaag tgcccgtgga acgactcatg caagactact ataaagatct ggccagatgt 16860
caggataatg cttggggaat ggctcatcgc ctgcgtatcc aacaagccgg acccaaagac 16920
ctggtgctcc tcgccaccat ccgccgtctc aaaactgcct attttaattt catcaccagc 16980
agcatcgtct caccctccca agaggaggaa ggagaagaaa gagagaaccc cgaccgagcg 17040
tctagccgcc cccgcccgca agaaacagtg ctcagcctac cttgcgattg cgactggtta 17100
gacgctttcg tcgaaaggtt ttcagatccc gtggatcttg agacgatcag gtccttgcgc 17160
ggagtaccta cggggcaatt gataaaatgc ataatcagcg cggtgtccct gcccaacgga 17220
gagcctccca gtcaccactt cagggagatg cgcggaggcg tcttcactct gagacccagg 17280
gagaacggtc gtgccgtcac cgagaccatg cgccgccgcc gcggagaggt cattgaaaga 17340
ttcatcgacc gtctgcccgt gcgccgccgg cgtcgccgcg ttccccctcc tcctgcagcc 17400
ccacctgaag aggaagagat gttagtggaa gaagaagaga ttgaggaaga aatcccaggg 17460
gctttcgagc gcgaggtgcg caccaccatc gccgaactta tccgtcttct ggaagaggag 17520
ttgaccgtgt ccgcgcgtaa ctcccagttt tttaactttg ccgtggactt ctacgaggcc 17580
atggagcgct tggaagcgct gggcgatgtc agcgagatgc cgctgagacg atggatcatg 17640
tatttcttcg tcaccgagca catcgccacc acactcaact accttttcca gcgcctatgc 17700
aactatgcgg tcttcacccg ccacgtggag ctcaacctcg cccaggtggt catgcgcgcg 17760
agagatcccg tgggggctgt ggtctacagc cgcgtctgga acgaggcggg catgaatgca 17820
ttctctcaac tcattgggcg catctccaac gacctcgcgg ccaccgtcga gagagcgggc 17880
cgcggagatc ttcaagagga agagatcgag cagttcatgg ccgagatcgc ctaccaggac 17940
aactctggcg acgtgcaaga aatccttagg caagccgccg tcaacgatac cgagattgat 18000
tctgttgaac tctctttcag gttcaagctc acggggccgg tagctttcac ccagaggcgt 18060
cagatccagg atgtcaaccg ccgcgtcgtc gcgcatgcga gtcttctcag ggcgcagtac 18120
cagaacctac ccgcgcgcgg cgccgacgta ccactgccag ccatgccgcc gggtcccgag 18180
ccgcccctgc cgcccggtgc gcgccctcga caccgcttct aaacatgcaa gaagcaacag 18240
agccaccgcc gtccaaaatg aaaaacaagg gcacggtggt agcgcccaag ggacacggaa 18300
ccctgcaagc catcgacatc tccaccaacg gacccgttga gatcaagtac tatctgaacc 18360
tccctcacgc cctccaaaag atcatgcaag ttaatctcct gacactgcct actaacctga 18420
ctccgcagcg tctcaggacc ctggacagct ccggcctgcg cgctctcgtc ctcgagctcc 18480
gcccctgccg cgccgaggtc tggacttgcc tcccgcgagg gctcgtcagc atgaccacca 18540
tcgagacaga agatggtcat gccgatgcag acaacatagt aaagcgcgag gtacaagcgc 18600
caggcctcaa ttttccactg aaatttctcg tcaaaggaag tcaggtacaa ctcattcata 18660
aggtgcatcc cgtgaatcgc tgcgagtact gcggccgtct gtacaagcac aagcatgaat 18720
gctcggcgcg tcgcagggag ttctacttcc atcacatcaa cagccattcc tccaactggt 18780
ggcaggagat ccagttcttc ccgattggct ctcatcctcg cacagaaagg ctctttctca 18840
cctacgatgt ggaaacctac acctggatgg ggtcctttgg caagcagcta atccccttca 18900
tgctggtcat gaaactctct ggagaccagc ggctcgtcaa catcgcctat gacctcgcca 18960
taaaactcaa gtgggatcgc tggcggcagg acccccaaac cttctattgc gtcaccccag 19020
aaaagatggc agtcggacag cattttcgtc agtaccggga ccagttacaa acagcactgg 19080
cagtggacct ctggtcctcc ttccttaaag cgaaccctca cgtgcacgaa tgggccctcg 19140
aacactatgc tctcactgac cctacagatc tcacttttga agaactcaag aagctgcctc 19200
atgtcagggg cacccctcga ttcttagaac tgtacatagt ggggcacaac atcaatggct 19260
ttgatgagat cgtcttggcc gctcaggtta tcaataaccg agcagaggtt cctcagcctt 19320
tcaaaatcac ccgaaatttc atgcccaggg ccggcaagat cctcttcaat gatgttactt 19380
tcgctttgcc caaccccgcc tacaagaagc gggtggactt ccaactctgg gaacaggggg 19440
cctgtgatga catcgacttc aagtatcaat tcctcaaagt catggtcagg gacacttttg 19500
ccctcactca tacctcgctg cgcaatgcag cccaagcata ctctctccca gtggagaagg 19560
gatgctgtcc ctacaaggca gtcaatcagt tctacatgtt gggctcttac cgtgcagaaa 19620
aagacgggtt tcccctcgaa gagtactgga aggatcacga agaatacctt ctcaaccgcg 19680
agctgtggga aaagaaaagc caaccgcgtt atgacatcat ccaggaaact ctcgactact 19740
gtgccctgga tgtactcatc accgccgagc tggtagccaa gctgcaagag tcatatgccc 19800
acttcataag ggactctgta ggcttacctc atgcccattt taacatattc cagagaccta 19860
ctatctcttc caattcccat gccatctttc gccagatcgt ttacagggcg gaaaaaccca 19920
accgcaccaa tctgggcccg ggtcttcttg ccccctcaca tgaactctat gactatgtgc 19980
gagcaagcat cagagggggg cgatgttatc ccacttacat cggcatcctc gaagagcccc 20040
tctatgtcta cgatatctgt ggcatgtatg cctccgcgct cacccacccc atgccctggg 20100
gcacccctct taacccctat gagcgcgcgc tggcagttcg agaatggcag atgaccttgg 20160
atgatcccgc caccatcagc tattttgaca aagatttgct accgggaata tttaccatag 20220
atgcggaccc ccctgatgag ttcatgctag accccctccc ccctttctgt tcaagaaaag 20280
gaggtcgact ctgctggacc aatgagcccc tccgaggcga ggtggccacc agtgtggatc 20340
tgataaccct gcacaatagg ggatggcgaa tcagaatagt tccggatgaa ctgacaacca 20400
tctttcctga atggaaatgt gtggcgcgcg agtacgtcca gcttaacatc accgccaagg 20460
agcgcgcgga caaggaaaag aaccaaacca tgcgctccat cgccaagctt ctatccaatg 20520
ccctctatgg atcatttgcc accaagctgg acaacaagaa gattgtgttt tctgaccaga 20580
tggacgagag tcttatgaaa ggcatctctg ctggtactgt caatatcaaa tcctcctcgt 20640
tcctagaaac tgacaacctg agtgcagagg tcatgcccgc cttcgagagg gaatacctac 20700
cccaacagct ggcgctcctg gacagcgatc cggaagacag tgaggacgaa cagaggcccg 20760
ccccctttta tacccccccg gcggggaccc ctggtcacgt ggcctacact tacaagccaa 20820
tcacattctt ggatgtggag gagggggaca tgtgtttaca taccgtagag aaggtggacc 20880
ccctggttga caacgaccgc tacccctccc acgtggcctc ctttgtgctg gcctggacac 20940
gcgcttttgt atcagagtgg gctgggttcc tctacgaaga ggaccgaggc actccgctcg 21000
aggacaggcc cataaagtcg gtctacgggg acacggacag cctctttgtc acccagcggg 21060
gacacgaact catggaaacc aaaggtaaga aacgcatcaa aaaacatggc ggaaaacttg 21120
tttttgaccc cgatgagccg gatctgacct ggctcgtgga gtgcgaaacc gtctgcgcct 21180
cctgcggtgc ggatgcatac tcccccgaat ccattttcct cgcgcccaag ttgtatgccc 21240
tcaaatgtat ctactgcccc gcctgccata aaacttccaa aggtaagctc cgtgccaaag 21300
gccacgcggc cgaggcgctc aactacgaac tcatggtaaa ctgctacctg gccgacatgc 21360
agggcgccaa tcggcagcgg ttctcgacca gcaggatgag tctgaagcgc accctcgcaa 21420
gcgcccaacc aggcgcgcac cccttcaccg tgacggaaac aaccctgact cggacgctgc 21480
gaccatggaa ggatcggacc ctggcagcgc tggacgccca tcgtctgatt ccctactcca 21540
ggagccgtcc caacccgcga aacgaggagg tctgctggat cgagatgcca tagagcacat 21600
caccgagctc tgggaccggc tcgagctctt gcaacagact ctttccaaaa tgcccatggc 21660
tgacgggctg aagccgctga aaaacttctc ctcgctccag gagcttctat cccttggggg 21720
agagcgcctc ctaacggact tggtgcggga aaatatccat gtaagggaaa tgatgaacga 21780
agtggccccc ctgctccggg aggacggcag ctgtcgttcc ctaaactacc atctgcaacc 21840
cgtaattggg gtcatttacg gtcccactgg gtgcggcaag tctcagctgc ttaggaattt 21900
gctctcgtcc cagttaatca ccccggctcc agaaacggta ttttttatag ccccgcaggt 21960
ggacatgatc cccccctctg aactgaaagc ctgggaaatg caaatatgtg agggaaacta 22020
tgctcccggg ccagagggaa ctttcatccc ccaatctggc accctccgcc caaagtttat 22080
taaaatggct tatgatgacc tgactcagga gcataactat gatgtttcag acccccggaa 22140
cgtgttcgcc cgtgccgctg cccacggccc catcgctatc attatggatg agtgcatgga 22200
gaatctgggg ggtcacaaag gcgtctccaa attttttcat gcttttccct ctaagctgca 22260
tgataaattt cccaagtgca ccggatacac tgtcttggtg gtcctgcaca atatgaaccc 22320
gagacgggat ctaggcggca acattgccaa cctcaagatc cagtccaaaa tgcatataat 22380
ttcaccccgg atgcacccgt cccagctcaa cagatttgta aacacctaca ctaagggcct 22440
ccccgttgca attagtctgc tcctaaaaga tattgtgcaa caccatgcac tccgaccttg 22500
ctatgactgg gtgatttata acactacccc ggagcaagag gctcttcaat ggagctatct 22560
ccacccccga gacggactaa tgcccatgta tctaaacatt caatcccacc tttacagggt 22620
actggaaaag atccaccgcg ttctcaatga tcgagaccga tggtccaggg cataccgcgc 22680
gcgaaaaatc aaataaa 22697
<210> 6
<211> 4102
<212> DNA
<213> Human mastadenovirus B
<400> 6
tataaaacgc ctggtgatta gaggccgagg tatccagctc aacgacgagt cggttagctc 60
ttcgcttggt ctgcgaccag acggagtctt ccaaatcgcc ggctgtggga gatcttcctt 120
cactcctcgt caggctgtgc tgactttgga gagttcgtcc tcgcagcccc gctcgggcgg 180
cattggaact ctccagtttg tggaggagtt tactccctct gtctacttca accccttctc 240
cggctctcct ggccagtacc cggacgagtt cataccaaac ttcgacgcaa tcagcgagtc 300
agtggatggc tatgattgat gtctaatggt ggtgcggctg agctagctcg actgcgacac 360
ctagaccact gccgccgctt tcgctgcttc gcccgggaac tcaccgagtt catctacttc 420
gaactctccg aggagcaccc tcagggtccg gcccacggag tgcggattac catcgaaggg 480
ggaatagact ctcgcctgca tcgcatcttc tcccagcggc ccgtgctaat tgaacgcgac 540
cagggaaata caaccatctc catctactgc atctgtaacc accccggatt gcatgaaagc 600
ctttgctgtc ttgtttgtgc tgagtttaat aaaaactgag ttaagaccct cctacggact 660
accgcttctt caatcaggac tttacaacac caaccagatc ttccagaaga cccagaccct 720
tcctcctttc atccaggact ctaactctac cttaccagca ccctccacta ctaaccttcc 780
cgaaacaaac aagcttgcat ctcatctgca acaccgcctt tcacgaagcc ttctttctgc 840
caatactacc actcccaaaa ccggaggtga gctccgcggt cttcctactg acgacccctg 900
ggtggtagcg ggttttgtaa cgttaggagt agttgcgggt gggcttgtgc tgatcctttg 960
ctacctatac acaccttgct gtgcatattt agtcatattg tgctgttggt ttaagaaatg 1020
ggggccatac tagtcgtgct tgctttactt tcgcttttgg gtctgggctc tgctaatctc 1080
aatcctctcg atcacgatcc atgtttagac ttcgacccag aaaactgcac acttactttt 1140
gcacccgaca caagccgtct ctgtggagtt cttattaagt gcggatggga ctgcaggtcc 1200
gttgaaatta cacataataa caaaacatgg aacaatacct tatccaccac atgggagcca 1260
ggagttcccc agtggtatac tgtctctgtc cgaggtcctg acggttccat ccgcattagt 1320
aacaacactt tcattttttc tgaaatgtgc gatctggcca tgttcatgag cagacagtat 1380
gacctatggc ctcccagcaa agagaacatt gtggcatttt ccattgctta ttgcttggta 1440
acatgcatca tcactgctat catttgtgtg tgcatacact tgcttatagt tattcgccct 1500
agacaaagca atgaggaaaa agagaaaatg ccttaacctt tttcctcata ccttttcttt 1560
acagcatggc ttctgttaca gctctaatta ttgccagcat tgtcactgtc gctcacgggc 1620
aaacaattgt ccatattacc ttaggacata atcacactct tgtagggccc ccaattactt 1680
cagaggttat ttggaccaaa cttggaagtg ttgattattt tgatataatt tgcaacaaaa 1740
ctaaaccaat atttgtaatc tgtaacagac aaaatctcac gttaattaat gttagcaaaa 1800
tttataacgg ttactattat ggttatgaca gatccagtag tcaatataaa aattacttag 1860
ttcgcataac tcagcccaaa ttaacagtgc caactatgac aataattaaa atggctaata 1920
aagcattaga aaattttaca tcaccaacaa cacccaatga aaaaaacatt ccaaattcaa 1980
tgattgcaat tattgcggcg gtggcattgg gaatggcact aataataata tgcatgctcc 2040
tatatgcttg ttactataaa aagtttcaac ataaacagga tccactacta aattttaaca 2100
tttaattttt tatacagatg atttccacta caatttttat cattactagc cttgcagctg 2160
taacttatgg ccgttcacac ctaactgtac ctgttggctc aacatgtaca ctacaaggac 2220
cccaagaagg ctatgtcact tggtggagaa tatatgataa tggagggttc gctagaccat 2280
gtgatcagcc tggtacaaaa ttttcatgca acggaagaga cttgaccatt attaacataa 2340
catcaaatga gcaaggcttc tattatggaa ccaactataa aaatagttta gattacaaca 2400
ttattgtagt gccagccacc acttctgctc cccgcaaatc cactttctct agcagcagtg 2460
ccaaagcaag cacaattcct aaaacagctt ctgctatgtt aaagcttcca aaaatcgctt 2520
taagtaattc cacagccgct cccaatacaa ttcctaaatc aacaattggc atcattactg 2580
ccgtggtagt gggattaatg attatatttt tgtgtataat gtactacgcc tgctgctata 2640
gaaaacatga acaaaaaggt gatgcattac taaattttga tatttaattt tttatagaat 2700
tatgatattg tttcaatcaa ataccactac ctcctatgca tacacaaaca ttcagcctaa 2760
atacgctatg caactagaaa tcacaatact aattgtaatt ggaattctta tactatctgt 2820
tattctttat tttatattct gccgtcaaat acccaatgtt catagaaatt ctaaaagacg 2880
tcccatctat tctcctatga ttagtcgtcc ccatatggct ctgaatgaaa tctaagatct 2940
tttttttttt ctcttacagt atggtgaaca tcaatcatga tccctagaaa tttcttcttc 3000
accatactca tctgtgcttt taatgtctgt gctactttca cagcagtagc cactgcaagc 3060
ccagactgta taggaccatt tgcttcctat gcactttttg ccttcgttac ttgcatctgc 3120
gtgtgtagca tagtctgcct ggttattaat tttttccaac tggtagactg gatctttgtg 3180
cgaattgcct acctacgtca ccatcccgaa taccgcaatc aaaatgttgc ggcacttctt 3240
aggcttattt aaaaccatgc aggctatgct accagtcatt ttaattttgc tactaccctg 3300
cattccccta gcttccaccg ccactcgcgc tacacctgaa caacttagaa aatgcaaatt 3360
tcaacaacca tggtcatttc ttgattgcta ccatgaaaaa tctgattttc ccacatactg 3420
gatagtgatt gttggaataa ttaacatact ttcatgtacc tttttctcaa tcacaatata 3480
ccccacattt aattttgggt ggaattctcc caatgcactg ggttacccac aagaaccaga 3540
tgaacatatt ccactacaac acatacaaca accactagca ctggtacagt atgaaaatga 3600
gccacaacct tcactgcccc ctgccattag ttacttcaac ctaaccggcg gagatgactg 3660
acccaatcgc cacatcatcc accgctgcca aggagctgct ggacatggac ggacgtgcct 3720
cagaacagcg actcatccaa ctacgcattc gtcagcagca ggaacgagca gtaaaagagc 3780
taagggatgc cattgggatt caccagtgca aaaaaggcat attctgctta gtaaaacaat 3840
ccaaaatctc ctacgagatc accgctactg accatcgtct ctcatacgag ctcggtccgc 3900
agcgacaaaa attcacctgc atggtgggaa tcaaccccat agttatcacc cagcagtctg 3960
gagatactaa gggttgtatc cagtgttcct gtgattccac cgagtgcatc tacacactgc 4020
tgaagaccct ctgcggcctt cgagacctcc tacccatgaa ctaatcattg cccctacctt 4080
acccaatcaa aatattaata aa 4102
<210> 7
<211> 960
<212> DNA
<213> Human mastadenovirus B
<400> 7
atggccaagc gagctcggct aagcacttcc ttcaacccgg tgtaccctta tgaagatgaa 60
agcagctcac aacacccatt tataaatcct ggtttcattt cccctgacgg gttcacacaa 120
agtccaaacg gggttttaag tcttaaatgt gttaatccac ttaccactgc aagcggctcc 180
ctccaactta aagtgggaag tggtcttaca gtagacacta ctgatggatc cttagaagaa 240
aacatcaaag ttaacacccc cctaacaaag tcaaaccatt ctataaattt accaatagga 300
aacggtttgc aaatagaaca aaacaaactt tgcagtaaac tcggaaatgg tcttacattt 360
gactcttcca attctattgc actgaaaaat aacactttat ggacaggtcc aaaaccagaa 420
gccaactgca taattgaata cgggaaacaa aacccagata gcaaactaac tttaatcctt 480
gtaaaaaatg gaggaattgt taatggatat gtaacgctaa tgggagcctc agactacgtt 540
aacaccttat ttaaaaacaa aaatgtctcc attaatgtag aactatactt tgatgccact 600
ggtcatatat taccagactc atcttctctt aaaacagatc tagaactaaa atacaagcaa 660
accgctgact ttagtgcaag aggttttatg ccaagtacta cagcgtatcc atttgtcctt 720
cctaatgcgg gaacacataa tgaaaattat atttttggtc aatgctacta caaagcaagc 780
gatggtgccc tttttccgtt ggaagttact gttatgctta ataaacgcct gccagatagt 840
cgcacatcct atgttatgac ttttttatgg tccttgaatg ctggtctagc tccagaaact 900
actcaggcaa ccctcataac ctccccattt accttttcct atattagaga agatgactga 960
<210> 8
<211> 270
<212> DNA
<213> Human mastadenovirus B
<400> 8
aacggggttt taagtcttaa atgtgttaat ccacttacca ctgcaagcgg ctccctccaa 60
cttaaagtgg gaagtggtct tacagtagac actactgatg gatccttaga agaaaacatc 120
aaagttaaca cccccctaac aaagtcaaac cattctataa atttaccaat aggaaacggt 180
ttgcaaatag aacaaaacaa actttgcagt aaactcggaa atggtcttac atttgactct 240
tccaattcta ttgcactgaa aaataacact 270
<210> 9
<211> 561
<212> DNA
<213> Human mastadenovirus B
<400> 9
ttatggacag gtccaaaacc agaagccaac tgcataattg aatacgggaa acaaaaccca 60
gatagcaaac taactttaat ccttgtaaaa aatggaggaa ttgttaatgg atatgtaacg 120
ctaatgggag cctcagacta cgttaacacc ttatttaaaa acaaaaatgt ctccattaat 180
gtagaactat actttgatgc cactggtcat atattaccag actcatcttc tcttaaaaca 240
gatctagaac taaaatacaa gcaaaccgct gactttagtg caagaggttt tatgccaagt 300
actacagcgt atccatttgt ccttcctaat gcgggaacac ataatgaaaa ttatattttt 360
ggtcaatgct actacaaagc aagcgatggt gccctttttc cgttggaagt tactgttatg 420
cttaataaac gcctgccaga tagtcgcaca tcctatgtta tgactttttt atggtccttg 480
aatgctggtc tagctccaga aactactcag gcaaccctca taacctcccc atttaccttt 540
tcctatatta gagaagatga c 561
<210> 10
<211> 1635
<212> DNA
<213> Human mastadenovirus B
<400> 10
atgaggagac gagccgtgct aggcggagcg gtggtgtatc cggagggtcc tcctccttct 60
tacgagagcg tgatgcagca acaggcggcg atgatacagc ccccactgga ggctcccttc 120
gtacccccac ggtacctggc gcctacggaa gggagaaaca gcattcgtta ctcggagctg 180
tcgcccctgt acgataccac caagttgtat ctggtggaca acaagtcggc ggacatcgcc 240
tccctgaact atcagaacga ccacagcaac ttcctgacca cggtggtgca gaacaatgac 300
tttaccccca cggaggctag cacccagacc atcaactttg acgagcggtc gcgatggggc 360
ggtcagctga agaccatcat gcacaccaac atgcccaacg tgaacgagta catgttcagc 420
aacaagttca aggcgagggt gatggtgtcc agaaaagctc ctgaaggtgt tacagtaaat 480
gacacctatg atcataaaga ggatatcttg aagtatgagt ggtttgagtt cattttacca 540
gaaggcaact tttcagccac catgacgatc gacctgatga acaatgccat cattgacaac 600
tacctggaaa ttggcagaca gaatggagtg ctggaaagtg acattggtgt taagtttgac 660
actagaaatt tcaggctcgg gtgggacccc gaaactaagt tgattatgcc aggtgtctac 720
acttatgagg cattccatcc tgacattgta ttgctgcctg gttgcggggt agactttact 780
gaaagccgac ttagcaactt gcttggcatc aggaagagac atccattcca ggagggtttc 840
aaaatcatgt atgaagatct tgaagggggt aatattcctg cccttttgga tgtcactgcc 900
tatgaggaaa gcaaaaagga taccactact gaaacaacca cactggctgt tgcagaggaa 960
actagtgaag atgatgatat aactagagga gatacctata taactgaaaa acaaaaacgt 1020
gaagctgcag ctgctgaagt taaaaaagag ttaaagatcc aacctctaga aaaagacagc 1080
aagagtagaa gctacaatgt cttggaagac aaaatcaaca cagcctaccg cagttggtac 1140
ctgtcctaca attacggtaa ccctgagaaa ggaataaggt cttggacact gctcaccact 1200
tcagatgtca cctgtggggc agagcaggtc tactggtcgc tccctgacat gatgcaagac 1260
ccagtcacct tccgctccac aagacaagtc aacaactacc cagtggtggg tgcagagctt 1320
atgcccgtct tctcaaagag tttctacaat gagcaagccg tgtactctca gcagctccga 1380
caggccactt cgctcacgca cgtcttcaac cgcttccctg agaaccagat cctcatccgc 1440
ccgccggcgc ccacaattac caccgtcagt gaaaacgttc ctgctctcac agatcacggg 1500
accctgccgt tacgcagcag tatccgggga gtccagcgcg tgaccgttac tgacgccaga 1560
cgccgcacct gtccctacgt ttacaaggcc ctgggcatag tcgcgccgcg cgttctttca 1620
agccgcactt tctaa 1635
<210> 11
<211> 2835
<212> DNA
<213> Human mastadenovirus B
<400> 11
atggccaccc catcgatgat gccccaatgg gcatacatgc acatcgccgg acaggatgct 60
tcggagtacc tcagtccggg tctggtgcag ttcgcccgtg caacagacac ctacttcagt 120
atggggaaca aatttagaaa ccccacagtg gcgcccaccc acgatgtgac caccgaccgt 180
agccagcgcc tgatgctgcg cttcgtgccc gttgaccggg aagacaatac ctactcttac 240
aaagttcgct acacgctggc tgtaggcgac aacagagtgc ttgacatggc cagcacattc 300
tttgacattc ggggggtgct tgatagaggt cctagcttca agccatattc cggcacagct 360
tacaattcac tcgctcctaa gggcgcgccc aatacatctc agtggatagt tacaacaaat 420
ggggacaatg cagtaactac caccacaaac acatttggca ttgcttccat gaagggagac 480
aatattacta aagaaggttt gcaaattggg aaagacatta ccactactga aggagaagaa 540
aagcccattt atgccgataa aacatatcag ccagagcctc aagttggaga agaatcatgg 600
actgatactg atggaacaaa tgaaaagttt ggtggaagag cccttaaacc agctaccaac 660
atgaagccat gctacgggtc ttttgcaaga cctacaaaca taaaaggggg ccaagctaaa 720
aacagaaaag taaaaccaac aaccgaagga ggggttgaaa ctgaggaacc agatattgat 780
atggaatttt tcgatggtag agatgctgtt gcaggagctt tagcgcctga aattgtgctt 840
tatacggaaa atgtaaattt ggaaactcca gacagtcatg tggtatataa accagaaacg 900
tctaataact ctcatgcaaa tttgggtcaa caagccatgc ctaacagacc caattacatt 960
ggcttcaggg ataacttcgt aggcctaatg tactacaaca gtactggaaa tatgggagtt 1020
ttggctggcc aagcatcaca actgaatgca gtggttgact tgcaggacag aaatactgaa 1080
ctgtcatatc agcttttgct tgattctctg ggagacagaa ccagatactt cagcatgtgg 1140
aatcaggctg tggacagtta cgatcccgat gttcgcatta ttgaaaatca tggcatcgag 1200
gatgaactgc ctaattactg ttttcctctg aatggcatag gaccagggca cacatatcaa 1260
ggcattaaag ttaaaaccga tgacactaat ggatgggaaa aagatgctaa tgttgctcca 1320
gctaatgaaa taaccatagg caacaacctg gctatggaaa ttaatatcca agctaacctt 1380
tggagaagtt ttctgtactc taatgtggct ttgtaccttc cagatgttta caagtacacg 1440
ccacctaaca ttactttgcc cactaacacc aacacctatg agtacatgaa cgggcgagtg 1500
gtatccccat ccctggttga ttcatacatc aacattggcg ccaggtggtc tcttgaccca 1560
atggacaatg tgaatccatt caaccaccac cgcaatgctg gtctgcgcta caggtccatg 1620
cttctgggaa atggtcgtta tgtgcctttc cacatacaag tgcctcagaa attctttgct 1680
gtcaagaacc tacttcttct acctggctcc tacacctacg agtggaactt ccgaaaggat 1740
gtgaacatgg tcctgcaaag ttcccttgga aatgacctca gaacggatgg tgctaccata 1800
agtttcacca gcatcaatct ctatgccacc ttcttcccca tggctcacaa cacagcttcc 1860
acccttgaag ccatgctgcg caacgatacc aatgatcagt catttaacga ctacctctct 1920
gcagctaaca tgctttaccc cattcctgcc aatgcaacca acattccaat ttccatccca 1980
tctcgcaact gggcagcctt caggggctgg tccttcacca gactcaaaac caaggagact 2040
ccatctcttg gatcagggtt cgatccctac ttcgtatatt ctggatctat tccctacctg 2100
gatggcacct tttaccttaa ccacactttc aagaaggtct ccatcatgtt tgactcctca 2160
gtcagctggc ctggcaatga caggctgttg agtccaaatg agtttgaaat caagcgcact 2220
gtggacgggg aaggatacaa cgtggcacaa tgcaacatga ccaaagactg gttcctggtt 2280
cagatgcttg ccaattacaa cattggctac cagggctttt acatccctga gggatacaag 2340
gatcgcatgt actccttttt cagaaacttc cagcctatga gcaggcaggt ggttgatgag 2400
gttaattaca ctgactacaa agccgtcacc ttaccatacc aacacaacaa ctctggcttt 2460
gtagggtacc ttgcacctac tatgagacaa ggggaacctt acccagccaa ttatccatac 2520
ccgctcatcg gaactactgc cgttaagagt gtcacccaga aaaagttcct gtgcgacagg 2580
accatgtggc gcattccctt ctccagcaac ttcatgtcca tgggggccct taccgacctg 2640
ggacagaaca tgctctatgc caactcagcc catgcgctgg acatgacttt tgaggtggat 2700
cccatggatg agcccaccct gctttatctt cttttcgaag tcttcgacgt ggtcagagtg 2760
caccagccac accgcggcgt catcgaggcc gtctacctgc gcacaccgtt ctcggccggc 2820
aacgccacca cataa 2835
<210> 12
<211> 319
<212> PRT
<213> Human mastadenovirus B
<400> 12
Met Ala Lys Arg Ala Arg Leu Ser Thr Ser Phe Asn Pro Val Tyr Pro
1 5 10 15
Tyr Glu Asp Glu Ser Ser Ser Gln His Pro Phe Ile Asn Pro Gly Phe
20 25 30
Ile Ser Pro Asp Gly Phe Thr Gln Ser Pro Asn Gly Val Leu Ser Leu
35 40 45
Lys Cys Val Asn Pro Leu Thr Thr Ala Ser Gly Ser Leu Gln Leu Lys
50 55 60
Val Gly Ser Gly Leu Thr Val Asp Thr Thr Asp Gly Ser Leu Glu Glu
65 70 75 80
Asn Ile Lys Val Asn Thr Pro Leu Thr Lys Ser Asn His Ser Ile Asn
85 90 95
Leu Pro Ile Gly Asn Gly Leu Gln Ile Glu Gln Asn Lys Leu Cys Ser
100 105 110
Lys Leu Gly Asn Gly Leu Thr Phe Asp Ser Ser Asn Ser Ile Ala Leu
115 120 125
Lys Asn Asn Thr Leu Trp Thr Gly Pro Lys Pro Glu Ala Asn Cys Ile
130 135 140
Ile Glu Tyr Gly Lys Gln Asn Pro Asp Ser Lys Leu Thr Leu Ile Leu
145 150 155 160
Val Lys Asn Gly Gly Ile Val Asn Gly Tyr Val Thr Leu Met Gly Ala
165 170 175
Ser Asp Tyr Val Asn Thr Leu Phe Lys Asn Lys Asn Val Ser Ile Asn
180 185 190
Val Glu Leu Tyr Phe Asp Ala Thr Gly His Ile Leu Pro Asp Ser Ser
195 200 205
Ser Leu Lys Thr Asp Leu Glu Leu Lys Tyr Lys Gln Thr Ala Asp Phe
210 215 220
Ser Ala Arg Gly Phe Met Pro Ser Thr Thr Ala Tyr Pro Phe Val Leu
225 230 235 240
Pro Asn Ala Gly Thr His Asn Glu Asn Tyr Ile Phe Gly Gln Cys Tyr
245 250 255
Tyr Lys Ala Ser Asp Gly Ala Leu Phe Pro Leu Glu Val Thr Val Met
260 265 270
Leu Asn Lys Arg Leu Pro Asp Ser Arg Thr Ser Tyr Val Met Thr Phe
275 280 285
Leu Trp Ser Leu Asn Ala Gly Leu Ala Pro Glu Thr Thr Gln Ala Thr
290 295 300
Leu Ile Thr Ser Pro Phe Thr Phe Ser Tyr Ile Arg Glu Asp Asp
305 310 315
<210> 13
<211> 90
<212> PRT
<213> Human mastadenovirus B
<400> 13
Asn Gly Val Leu Ser Leu Lys Cys Val Asn Pro Leu Thr Thr Ala Ser
1 5 10 15
Gly Ser Leu Gln Leu Lys Val Gly Ser Gly Leu Thr Val Asp Thr Thr
20 25 30
Asp Gly Ser Leu Glu Glu Asn Ile Lys Val Asn Thr Pro Leu Thr Lys
35 40 45
Ser Asn His Ser Ile Asn Leu Pro Ile Gly Asn Gly Leu Gln Ile Glu
50 55 60
Gln Asn Lys Leu Cys Ser Lys Leu Gly Asn Gly Leu Thr Phe Asp Ser
65 70 75 80
Ser Asn Ser Ile Ala Leu Lys Asn Asn Thr
85 90
<210> 14
<211> 186
<212> PRT
<213> Human mastadenovirus B
<400> 14
Trp Thr Gly Pro Lys Pro Glu Ala Asn Cys Ile Ile Glu Tyr Gly Lys
1 5 10 15
Gln Asn Pro Asp Ser Lys Leu Thr Leu Ile Leu Val Lys Asn Gly Gly
20 25 30
Ile Val Asn Gly Tyr Val Thr Leu Met Gly Ala Ser Asp Tyr Val Asn
35 40 45
Thr Leu Phe Lys Asn Lys Asn Val Ser Ile Asn Val Glu Leu Tyr Phe
50 55 60
Asp Ala Thr Gly His Ile Leu Pro Asp Ser Ser Ser Leu Lys Thr Asp
65 70 75 80
Leu Glu Leu Lys Tyr Lys Gln Thr Ala Asp Phe Ser Ala Arg Gly Phe
85 90 95
Met Pro Ser Thr Thr Ala Tyr Pro Phe Val Leu Pro Asn Ala Gly Thr
100 105 110
His Asn Glu Asn Tyr Ile Phe Gly Gln Cys Tyr Tyr Lys Ala Ser Asp
115 120 125
Gly Ala Leu Phe Pro Leu Glu Val Thr Val Met Leu Asn Lys Arg Leu
130 135 140
Pro Asp Ser Arg Thr Ser Tyr Val Met Thr Phe Leu Trp Ser Leu Asn
145 150 155 160
Ala Gly Leu Ala Pro Glu Thr Thr Gln Ala Thr Leu Ile Thr Ser Pro
165 170 175
Phe Thr Phe Ser Tyr Ile Arg Glu Asp Asp
180 185
<210> 15
<211> 544
<212> PRT
<213> Human mastadenovirus B
<400> 15
Met Arg Arg Arg Ala Val Leu Gly Gly Ala Val Val Tyr Pro Glu Gly
1 5 10 15
Pro Pro Pro Ser Tyr Glu Ser Val Met Gln Gln Gln Ala Ala Met Ile
20 25 30
Gln Pro Pro Leu Glu Ala Pro Phe Val Pro Pro Arg Tyr Leu Ala Pro
35 40 45
Thr Glu Gly Arg Asn Ser Ile Arg Tyr Ser Glu Leu Ser Pro Leu Tyr
50 55 60
Asp Thr Thr Lys Leu Tyr Leu Val Asp Asn Lys Ser Ala Asp Ile Ala
65 70 75 80
Ser Leu Asn Tyr Gln Asn Asp His Ser Asn Phe Leu Thr Thr Val Val
85 90 95
Gln Asn Asn Asp Phe Thr Pro Thr Glu Ala Ser Thr Gln Thr Ile Asn
100 105 110
Phe Asp Glu Arg Ser Arg Trp Gly Gly Gln Leu Lys Thr Ile Met His
115 120 125
Thr Asn Met Pro Asn Val Asn Glu Tyr Met Phe Ser Asn Lys Phe Lys
130 135 140
Ala Arg Val Met Val Ser Arg Lys Ala Pro Glu Gly Val Thr Val Asn
145 150 155 160
Asp Thr Tyr Asp His Lys Glu Asp Ile Leu Lys Tyr Glu Trp Phe Glu
165 170 175
Phe Ile Leu Pro Glu Gly Asn Phe Ser Ala Thr Met Thr Ile Asp Leu
180 185 190
Met Asn Asn Ala Ile Ile Asp Asn Tyr Leu Glu Ile Gly Arg Gln Asn
195 200 205
Gly Val Leu Glu Ser Asp Ile Gly Val Lys Phe Asp Thr Arg Asn Phe
210 215 220
Arg Leu Gly Trp Asp Pro Glu Thr Lys Leu Ile Met Pro Gly Val Tyr
225 230 235 240
Thr Tyr Glu Ala Phe His Pro Asp Ile Val Leu Leu Pro Gly Cys Gly
245 250 255
Val Asp Phe Thr Glu Ser Arg Leu Ser Asn Leu Leu Gly Ile Arg Lys
260 265 270
Arg His Pro Phe Gln Glu Gly Phe Lys Ile Met Tyr Glu Asp Leu Glu
275 280 285
Gly Gly Asn Ile Pro Ala Leu Leu Asp Val Thr Ala Tyr Glu Glu Ser
290 295 300
Lys Lys Asp Thr Thr Thr Glu Thr Thr Thr Leu Ala Val Ala Glu Glu
305 310 315 320
Thr Ser Glu Asp Asp Asp Ile Thr Arg Gly Asp Thr Tyr Ile Thr Glu
325 330 335
Lys Gln Lys Arg Glu Ala Ala Ala Ala Glu Val Lys Lys Glu Leu Lys
340 345 350
Ile Gln Pro Leu Glu Lys Asp Ser Lys Ser Arg Ser Tyr Asn Val Leu
355 360 365
Glu Asp Lys Ile Asn Thr Ala Tyr Arg Ser Trp Tyr Leu Ser Tyr Asn
370 375 380
Tyr Gly Asn Pro Glu Lys Gly Ile Arg Ser Trp Thr Leu Leu Thr Thr
385 390 395 400
Ser Asp Val Thr Cys Gly Ala Glu Gln Val Tyr Trp Ser Leu Pro Asp
405 410 415
Met Met Gln Asp Pro Val Thr Phe Arg Ser Thr Arg Gln Val Asn Asn
420 425 430
Tyr Pro Val Val Gly Ala Glu Leu Met Pro Val Phe Ser Lys Ser Phe
435 440 445
Tyr Asn Glu Gln Ala Val Tyr Ser Gln Gln Leu Arg Gln Ala Thr Ser
450 455 460
Leu Thr His Val Phe Asn Arg Phe Pro Glu Asn Gln Ile Leu Ile Arg
465 470 475 480
Pro Pro Ala Pro Thr Ile Thr Thr Val Ser Glu Asn Val Pro Ala Leu
485 490 495
Thr Asp His Gly Thr Leu Pro Leu Arg Ser Ser Ile Arg Gly Val Gln
500 505 510
Arg Val Thr Val Thr Asp Ala Arg Arg Arg Thr Cys Pro Tyr Val Tyr
515 520 525
Lys Ala Leu Gly Ile Val Ala Pro Arg Val Leu Ser Ser Arg Thr Phe
530 535 540
<210> 16
<211> 944
<212> PRT
<213> Human mastadenovirus B
<400> 16
Met Ala Thr Pro Ser Met Met Pro Gln Trp Ala Tyr Met His Ile Ala
1 5 10 15
Gly Gln Asp Ala Ser Glu Tyr Leu Ser Pro Gly Leu Val Gln Phe Ala
20 25 30
Arg Ala Thr Asp Thr Tyr Phe Ser Met Gly Asn Lys Phe Arg Asn Pro
35 40 45
Thr Val Ala Pro Thr His Asp Val Thr Thr Asp Arg Ser Gln Arg Leu
50 55 60
Met Leu Arg Phe Val Pro Val Asp Arg Glu Asp Asn Thr Tyr Ser Tyr
65 70 75 80
Lys Val Arg Tyr Thr Leu Ala Val Gly Asp Asn Arg Val Leu Asp Met
85 90 95
Ala Ser Thr Phe Phe Asp Ile Arg Gly Val Leu Asp Arg Gly Pro Ser
100 105 110
Phe Lys Pro Tyr Ser Gly Thr Ala Tyr Asn Ser Leu Ala Pro Lys Gly
115 120 125
Ala Pro Asn Thr Ser Gln Trp Ile Val Thr Thr Asn Gly Asp Asn Ala
130 135 140
Val Thr Thr Thr Thr Asn Thr Phe Gly Ile Ala Ser Met Lys Gly Asp
145 150 155 160
Asn Ile Thr Lys Glu Gly Leu Gln Ile Gly Lys Asp Ile Thr Thr Thr
165 170 175
Glu Gly Glu Glu Lys Pro Ile Tyr Ala Asp Lys Thr Tyr Gln Pro Glu
180 185 190
Pro Gln Val Gly Glu Glu Ser Trp Thr Asp Thr Asp Gly Thr Asn Glu
195 200 205
Lys Phe Gly Gly Arg Ala Leu Lys Pro Ala Thr Asn Met Lys Pro Cys
210 215 220
Tyr Gly Ser Phe Ala Arg Pro Thr Asn Ile Lys Gly Gly Gln Ala Lys
225 230 235 240
Asn Arg Lys Val Lys Pro Thr Thr Glu Gly Gly Val Glu Thr Glu Glu
245 250 255
Pro Asp Ile Asp Met Glu Phe Phe Asp Gly Arg Asp Ala Val Ala Gly
260 265 270
Ala Leu Ala Pro Glu Ile Val Leu Tyr Thr Glu Asn Val Asn Leu Glu
275 280 285
Thr Pro Asp Ser His Val Val Tyr Lys Pro Glu Thr Ser Asn Asn Ser
290 295 300
His Ala Asn Leu Gly Gln Gln Ala Met Pro Asn Arg Pro Asn Tyr Ile
305 310 315 320
Gly Phe Arg Asp Asn Phe Val Gly Leu Met Tyr Tyr Asn Ser Thr Gly
325 330 335
Asn Met Gly Val Leu Ala Gly Gln Ala Ser Gln Leu Asn Ala Val Val
340 345 350
Asp Leu Gln Asp Arg Asn Thr Glu Leu Ser Tyr Gln Leu Leu Leu Asp
355 360 365
Ser Leu Gly Asp Arg Thr Arg Tyr Phe Ser Met Trp Asn Gln Ala Val
370 375 380
Asp Ser Tyr Asp Pro Asp Val Arg Ile Ile Glu Asn His Gly Ile Glu
385 390 395 400
Asp Glu Leu Pro Asn Tyr Cys Phe Pro Leu Asn Gly Ile Gly Pro Gly
405 410 415
His Thr Tyr Gln Gly Ile Lys Val Lys Thr Asp Asp Thr Asn Gly Trp
420 425 430
Glu Lys Asp Ala Asn Val Ala Pro Ala Asn Glu Ile Thr Ile Gly Asn
435 440 445
Asn Leu Ala Met Glu Ile Asn Ile Gln Ala Asn Leu Trp Arg Ser Phe
450 455 460
Leu Tyr Ser Asn Val Ala Leu Tyr Leu Pro Asp Val Tyr Lys Tyr Thr
465 470 475 480
Pro Pro Asn Ile Thr Leu Pro Thr Asn Thr Asn Thr Tyr Glu Tyr Met
485 490 495
Asn Gly Arg Val Val Ser Pro Ser Leu Val Asp Ser Tyr Ile Asn Ile
500 505 510
Gly Ala Arg Trp Ser Leu Asp Pro Met Asp Asn Val Asn Pro Phe Asn
515 520 525
His His Arg Asn Ala Gly Leu Arg Tyr Arg Ser Met Leu Leu Gly Asn
530 535 540
Gly Arg Tyr Val Pro Phe His Ile Gln Val Pro Gln Lys Phe Phe Ala
545 550 555 560
Val Lys Asn Leu Leu Leu Leu Pro Gly Ser Tyr Thr Tyr Glu Trp Asn
565 570 575
Phe Arg Lys Asp Val Asn Met Val Leu Gln Ser Ser Leu Gly Asn Asp
580 585 590
Leu Arg Thr Asp Gly Ala Thr Ile Ser Phe Thr Ser Ile Asn Leu Tyr
595 600 605
Ala Thr Phe Phe Pro Met Ala His Asn Thr Ala Ser Thr Leu Glu Ala
610 615 620
Met Leu Arg Asn Asp Thr Asn Asp Gln Ser Phe Asn Asp Tyr Leu Ser
625 630 635 640
Ala Ala Asn Met Leu Tyr Pro Ile Pro Ala Asn Ala Thr Asn Ile Pro
645 650 655
Ile Ser Ile Pro Ser Arg Asn Trp Ala Ala Phe Arg Gly Trp Ser Phe
660 665 670
Thr Arg Leu Lys Thr Lys Glu Thr Pro Ser Leu Gly Ser Gly Phe Asp
675 680 685
Pro Tyr Phe Val Tyr Ser Gly Ser Ile Pro Tyr Leu Asp Gly Thr Phe
690 695 700
Tyr Leu Asn His Thr Phe Lys Lys Val Ser Ile Met Phe Asp Ser Ser
705 710 715 720
Val Ser Trp Pro Gly Asn Asp Arg Leu Leu Ser Pro Asn Glu Phe Glu
725 730 735
Ile Lys Arg Thr Val Asp Gly Glu Gly Tyr Asn Val Ala Gln Cys Asn
740 745 750
Met Thr Lys Asp Trp Phe Leu Val Gln Met Leu Ala Asn Tyr Asn Ile
755 760 765
Gly Tyr Gln Gly Phe Tyr Ile Pro Glu Gly Tyr Lys Asp Arg Met Tyr
770 775 780
Ser Phe Phe Arg Asn Phe Gln Pro Met Ser Arg Gln Val Val Asp Glu
785 790 795 800
Val Asn Tyr Thr Asp Tyr Lys Ala Val Thr Leu Pro Tyr Gln His Asn
805 810 815
Asn Ser Gly Phe Val Gly Tyr Leu Ala Pro Thr Met Arg Gln Gly Glu
820 825 830
Pro Tyr Pro Ala Asn Tyr Pro Tyr Pro Leu Ile Gly Thr Thr Ala Val
835 840 845
Lys Ser Val Thr Gln Lys Lys Phe Leu Cys Asp Arg Thr Met Trp Arg
850 855 860
Ile Pro Phe Ser Ser Asn Phe Met Ser Met Gly Ala Leu Thr Asp Leu
865 870 875 880
Gly Gln Asn Met Leu Tyr Ala Asn Ser Ala His Ala Leu Asp Met Thr
885 890 895
Phe Glu Val Asp Pro Met Asp Glu Pro Thr Leu Leu Tyr Leu Leu Phe
900 905 910
Glu Val Phe Asp Val Val Arg Val His Gln Pro His Arg Gly Val Ile
915 920 925
Glu Ala Val Tyr Leu Arg Thr Pro Phe Ser Ala Gly Asn Ala Thr Thr
930 935 940
<210> 17
<211> 136
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 7 sequence
<400> 17
ctctctattt aatatacctt atagatggaa tggtgccaat atgtaaatga ggtaatttaa 60
aaaagtgcgc gctgtgtggt gattggctgt ggggttaacg gctaaaatgg gcggggcggc 120
cgtgggaaaa tgacgt 136
<210> 18
<211> 136
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 7 sequence
<400> 18
acgtcatttt cccacggccg ccccgcccat tttagccgtt aaccccacag ccaatcacca 60
cacagcgcgc acttttttaa attacctcat ttacatattg gcaccattcc atctataagg 120
tatattatat agagag 136
<210> 19
<211> 343
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 7 sequence
<400> 19
gacttatgtg ggaggagcta tgttgcaagt tattgcggta aatgtgacgt aaaacgaggt 60
gtggtttgaa cacggaagta gacagttttc ccacgcttac tgacaggata tgaggtagtt 120
ttgggcggat gcaagtaaaa attctccatt ttcgcgcgaa aactgaatga ggaagtgaat 180
ttctgagtca tttcgcggtt atgacagggt ggagtatttg ccgagggccg agtagacttt 240
gaccgtttac gtggaggttt cgattaccgt gtttttcacc taaatttccg cgtacggtgt 300
caaagtcctg tgtttttacg taggtgtcag ctgatcgcta ggg 343
<210> 20
<211> 3440
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 7 sequence
<400> 20
tatttaaacc tgacgagttc cgtcaagagg ccactcttga gtgccagcga gaagagtttt 60
ctccttcgcg ccgcaagtca gttctgcgct ttgaaaatga gacacctgcg tttcctgcca 120
caggagatta tcttcagtga gaccgggatc gaaatactgg agtttgtggt aaatacccta 180
atgggagacg acccggaacc gccagtgcag cctttcgatc cacctacgct gcacgatctg 240
tatgatttag aggtagacgg gcctcaggat cccaatgagg aagctgtgaa tgggtttttt 300
actgattcta tgctgctagc tgccgatgaa ggattggaca taaaccctcc tcctgagacc 360
cttgttaccc caggggtggt tgtggaaagc ggcagaggtg ggaaaaaatt gcctgatctg 420
ggagcagctg aaatggactt gcgttgttat gaagagggtt ttcctccgag tgatgatgaa 480
gatggggaaa ctgagcagtc catccatacc gcagtgaatg agggagtaaa agctgccagc 540
gatgttttta agttggactg tccggagctg cctggacatg gctgtaagtc ttgtgaattt 600
cacaggaata acactggaat gaaagaacta ttgtgctcgc tttgctatat gagaatgcac 660
tgccacttta tttacagtaa gtgtatttaa gtgaaattta aaggaatagt gtagctgttt 720
aataactgtt gaatggtaga tttatgtttt ttacttgtga ttttttgtag gtcctgtgtc 780
tgatgatgag tcaccttctc ctgattcaac tacctcacct cctgaaattc aggcgcccgc 840
acctgcaaac gtatgcaagc ccattcctgt aaagcctaag cctgggaaac gccctgctgt 900
ggataagctt gaggacttgt tggagggtgg ggatggacct ttggacctta gtacccggaa 960
actgccaagg caataagtgc cctgcagctg tgtttattta atgtgacgtc atgtaataaa 1020
attatgtcag ctgctgagtg ttttattact tcttgggtgg ggacttggat atataagtag 1080
gagcagatct gtgtggttag ctcacagcaa cctgctgcca tccatggagg tttgggctat 1140
cttggaagac ctcagacaga ctaggctact gctagaaaac gcctcggacg gagtctctgg 1200
cctttggaga ttctggttcg gtggtgatct agctaggcta gtgtttagga taaaacagga 1260
ctacagcgta gaatttgaaa agttattgga cgacagtcca ggactttttg aagctcttaa 1320
cttgggtcat caggctcatt ttaaggagaa ggttttatca gttttagatt tttctactcc 1380
tggtagaact gctgctgctg tagcttttct tacttttata ttggataaat ggatccgcca 1440
aactcacttc agcaagggat acgttttgga tttcatagca gcagctttgt ggagaacatg 1500
gaaggctcgc aggatgagga caatcttaga ttactggcca gtgcagcctc taggagtagc 1560
agggatactg agacacccac cgaccatgcc agcggttctg caggaggagc agcaggagga 1620
caatccgaga gccggcctgg accctccggt ggaggagtag ctgacctgtt tcctgaactg 1680
cgacgggtgc ttactaggtc tacgaccagt ggacagaaca gaggcattaa gagggagagg 1740
aatcctagtg ggaataattc aagaaccgag ttggctttaa gtttaatgag ccgcaggcgt 1800
cctgaaactg tttggtggca tgaggttcag agcgaaggca gggatgaagt ttcaatattg 1860
caggagaaat attcactaga acaacttaag acctgttggt tggaacctga ggatgattgg 1920
gaggtggcca ttaggaatta tgctaagata tctctgaggc ctgataaaca atatagaatt 1980
actaagaaga ttaatattag aaatgcatgc tacatatcag ggaatggggc agaggttata 2040
atagatacac aagataaagc agcttttaga tgttgtatga tgggtatgtg gccaggggtt 2100
gtcggcatgg aagcagtaac acttatgaat attaggttta gaggggatgg gtataatggc 2160
attgtattta tggctaacac taagctgatt ctacatggtt gtagcttttt tgggtttaat 2220
aatacgtgtg tagaagcttg ggggcaagtt agtgtgaggg gttgtagttt ttatgcatgc 2280
tggattgcaa catcaggtag ggtcaagagt cagttgtctg tgaagaaatg catgtttgag 2340
agatgtaatc ttggcatact gaatgaaggt gaagcaagga tccgccactg cgcagctaca 2400
gaaactggct gcttcattct aataaaggga aatgccagtg tgaagcataa tatgatctgt 2460
ggacattcgg atgagaggcc ttatcagatg ctgacctgcg ctggtggaca ttgcaatatt 2520
cttgctactg tgcatatcgt ttcacatgca cgcaagaaat ggcctgtatt tgaacataat 2580
gtgattacca agtgcaccat gcacataggt ggtcgcaggg gaatgtttat gccttaccag 2640
tgtaacatga atcatgtgaa ggtaatgttg gaaccagatg ccttttccag agtgagctta 2700
acaggaatct ttgatatgaa tattcaacta tggaagatcc tgagatatga tgacactaaa 2760
ccgagggtgc gcgcatgcga atgcggaggc aagcatgcta gattccagcc ggtgtgcgtg 2820
gatgtgactg aagacctgag acccgatcat ttggtgcttg cctgcactgg agcggagttc 2880
ggttccagtg gtgaagaaac tgactaaagt gagtagtggg ggcaagatgt ggatggggac 2940
tttcaggttg gtaaggtgga cagattgggt aaattttgtt aatttctgtc ttgcagctgc 3000
catgagtgga agcgcttctt ttgagggggg agtatttagc ccttatctga cgggcaggct 3060
cccaccatgg gcaggagttc gtcagaatgt catgggatcc actgtggatg ggagacccgt 3120
ccagcccgcc aattcctcaa cgctgaccta tgccactttg agttcgtcac cattggatgc 3180
agctgcagcc gccgccgcta ctgctgccgc caacactatc cttggaatgg gctattacgg 3240
aagcatcgtt gccaattcca gttcctctaa taacccttca accctggctg aggacaagct 3300
acttgttctg ttggctcagc tcgaggcctt aacccaacgc ttaggcgaac tgtctaagca 3360
ggtggcccag ttgcgtgagc aaactgagtc tgctgttgct acagcaaagt ctaaataaag 3420
atctcaaatc aataaataaa 3440
<210> 21
<211> 22921
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 7 sequence
<400> 21
tttaagagtc agcgcgcagt acttgttgaa gagagcctcg gcgtcctcga gagtgcgctg 60
aagttggtct tcgctcttgt gatacaaaca acttctggtg agcgagcgca gagatcggtt 120
ttttactttc agttcctgct cttgcccccg actctgctgg aagatggcat agagggttgg 180
aaagatccgg ttcctcagct ctctggtctg cgctggctcg ttcgctgtga tcctcagtcc 240
tcctcctgct gcacttgttg tagattttct aactgctggt tttctggtca ccgttgtcgc 300
tgctgtcttt ttctgtcggg gttgccggga cttgctgact gcagtagggg ctgtggaggt 360
gacggtagta atgcaagata ttgcggggga agttcacacc gtggtggaag agcaggtatc 420
gccgggtgaa ggatatgttg cccccgcatt catgcaagca ggagatgata gcgtttttat 480
gtccacgcca ggacttgtat ccctgtcgct ccttcttacc ggtcttggaa gcggtggtcg 540
ggtttgggaa tcgcccggtc tcgtcccatc tactgttggg ccgccgctgg accccccgac 600
ccggagcgga gatggtagcc gtgctgctgt ctggggactt gcttgtctcc gccgccgatg 660
acaactgttt ggcggcggtt gcttcttcca cctcctctgc ctcctcgtct tcctcctcca 720
aactgtcttc ctccaggctg tccacctcct ctgcctggct gtcccaatct tccatctcct 780
cctctgcctg actgtcccag tcttcctcca tatcctctgg gggcgtcagc tgcaccttca 840
gcttcttgct tcctcggcga tgggacatcc tgggggaacc ttgtgttgag ctcctcaccg 900
gtctgggggt caaggtagac cccgcttccc tttttcagta gaaattcttg gcgggatttt 960
tggatggctt gcaattgggc cagaattgct ccctgggtga tgacgcaggc tgagagctcg 1020
actttgggag gatgtgactg gtcctcatag aacctgatct cataggggtg gtaatcctcg 1080
ggatgaaact tgcgcaggta ggcggaggtc cacagccccg gtgtcagttt cagactctgc 1140
cccggagaag acccctcgcc ttcactgctg ggaccctgca actcgaaggt gccgatgatc 1200
tgggtctcgc tcagcaactg ggggttgcag gcaagggagc ggtggggtgt gcaaagattg 1260
cagcggcagt ggcattccag cagaccgtct ccgctcacat cctctataac atccgagtgg 1320
taggagaggt agttggccag gcggaacagg tagcagtggc tccatagcgg cggtgggcac 1380
tcgcggtagg tgagaggcac aaagtcggag ggcagcgcac agcaggtggc aggcaggata 1440
ccggagcgtt ccaggatgaa agagcgaaag ttgttaagca tgctctggct cataaagtct 1500
ggcaggccgt ttcgcagagt aaccctgaga cgctcgggga agatgatgtc tgccaggtcc 1560
gaggcgacgg tgcgctcatc aaaacctgtc cacagggctt tgagggatct ctgcaagagc 1620
ttgtccagct cttttaggtt ctgctcttcc aaacactgtt gccacacacc catgccagtc 1680
tgccaggtat ggcagaggta gaggtagaca cagtctcgga tgtagtcacg gcgggcctcc 1740
cctttaaggg tggtgtgcag gacgctctgc cctagccggt tctcatgcaa aatgcccatg 1800
taagaaacca ggttggtaag ctccacgttg gagatcttgc atgcctgccg cacgaagcca 1860
tgtctaaagg tgtagtgcag gttctcctct agcttgcgca gggtctcggg gtcggtgaaa 1920
aagcggcgca aacactccag ctccacagtt actagcacta cagccatcat aagcttgcgc 1980
ctctcttcca aatctcgggg ggagttggta cccagccagc gagatagctg ctcgtcactg 2040
actaccggct tgccctcgtc cgaggcgtct ggatcctgca tgttctggtt ttctgaaagt 2100
ggacctgctc gtttgatgag cagatggtcc ataacagcgc tcataacttt ggggggcagg 2160
ttaacagcgg ggtaggcaaa atgggtgacc acgatactgc gcttgagcac tgcaagccgg 2220
gcattgtcac cctccagttc cactaaagcg ctgtgatgtt catccatgcc attctctccc 2280
tgttgcagag catttgcggc ccgagtctca tcacttccca gaccctcaaa gatttttgga 2340
acctcttcca aggaagctat atcaggtaag cgagctcccg gacccaagtt gagaagggca 2400
tcggcgcggg tgcggttggc gcggcaggag actggaatct tttggttctt aaaaaagatg 2460
tggtaggtgg ccagcacttc ggggacagta aaagctggat agaagttcag tcgagggttg 2520
gcctcgcagg tgccgtttgg ctgccgcttg gggggtatgt gaggcgaaaa gaggttcagc 2580
tcgtaggcgc ggctaagctc ttccacactg atgggcactt cggtgaggtc gagtagtgcg 2640
tctttaacta tgttcgactg ccttgctaga tgtttgagga gcacgtcttc ccccccaagc 2700
ccggtgaggt agtcggcaac ttgatccccg atgccagcct cctggtgatc gccatctgct 2760
tgatgctctg ggcggtcgtc atcctctctg tctataaaac gtttcagctc ctcctcgtgc 2820
tccgccggtg tcacatagcc cgggtcctgc tcgacatctg cctcaatctc ttccgctttc 2880
acattatcct gcgcctgcat ctcctgggct gcgtcgacct cctcctcctc atcatcgagg 2940
gtagaggtgg tggtagctgg actgggtggt ggggtggtta agctctcctc ctcgtcgctg 3000
ctgggggcga ggtgtgatgg cgcttgcagc gatgttggca gtgatggctg agtttccatg 3060
tctgttgttt ctctgcctag gagaacacaa tggccagccg cggaggaaat cagtcaagcg 3120
accgccaacg ggagcacacc cccgaacgcg gaatgggctc tgccagccat ccgcttccaa 3180
ggccagaccg cagcccatct cagtcgcctc cacctctgcc cccgaagagg aacacctacc 3240
gtcgcgtggg gtccgattct tctatcgaga gccaggtggt actggtaagc gaaacttcgc 3300
ggtcatccct gtctccggaa cggagcaaca gtcctccccc gatccctccc aagaagaagc 3360
ccagaaagac caagcatgtc cctctgcaag acatcggcca cgacagcgaa gaagaaagag 3420
aacaggctca gttggtggcc gtgggcttca gctacccccc ggtgcgcatc attgagaagg 3480
atggcaagag aagtgttgag aagatcgaca agaatgaccc tatagctaaa ggagctactt 3540
ctattgctgt taggaatcct ttgagcttgc ccctggtatc tgcctgggag aagggcatgg 3600
aagtgatggc tgtgctaatg gagaggtaca ggctggataa tgacctgaga acctctttca 3660
agctgatgcc agagcagcac gagcagtaca agcgtatctg ccaccagtat gtgaacgagg 3720
agcaccgtgg catcccgctg acatttagta gcatgaagac cctgacagcg atgatgggaa 3780
gattcatgca gggattggta cattcttatt ctgagatcgc ccacaatagt tgggagtgca 3840
ccgggtgcgc tctgtgggct catggatgca ccgattatga aggcaaggtg aaatgcctgc 3900
atggcactat catgattcag aaggaccaca ttatcgagat ggatgtggcg agcgagaacg 3960
gacagcgcgc tatgaaggag aacccagaca gagccaagat cacccagaac cgctggggca 4020
gaaatgtggt ccagttggcc aacaacgatg cccgctgctg tgtaaatgat gccaactgtg 4080
ctactaatca attttccagc aagtcctgtg ggatgttcta taccgaggga agtaaggctc 4140
aggaagcttt caagcagtac gaagccttca tgaaggccgt gtacccaggg ataacccccg 4200
accaagccag gatgatgctg atccccattc attgcgattg caaccacaag ccaggctgcg 4260
ctcccgtgat gggcaggcag acctgtaaga tgaccccctt tgggatggcc aatgctgaag 4320
acttggatgt gactaccatc agtgacccga ccgtgctggc aagcgtgaga cacccagcct 4380
tgatggtgtt ccagtgttgc aacccagtgt accgcaactc ccgtgtccag aatgccggtc 4440
ccaactgtga tttcaagatc tctgctcctg acctacttgg cgccctgcag ctgaccagaa 4500
agttgtggca agacaccttt cccgagattc cagttcccaa gttggtgatc cccgagttca 4560
agtggcagaa caggttacag ttccgcaacg tatccctgcc cgcgggtcac tttgactccc 4620
gccagaaccc atttgatttc tgagtgaata atgaaaacga atgagtaaaa aacgagagcc 4680
ttagtgcatg taaaaataaa gtgcttttta ttgaacacgg ttttacatga cttattgcat 4740
atccatacgg tcaaacgcgg tggccctttc gatgcgtgcg cggtgagaac gaaagtaaga 4800
tgagtgggtg tttaggaagc gatatagcgc ctcctggttg cggcgcaggg tgggctgcac 4860
ttggggagat tggagcatgc tgttgggcac cccagtcagc aacttcatgg tggggtttcc 4920
gttcatgggg cggtcgggcc agtgcacaaa ggcatgaagg aacatacagc aaaaaagtcc 4980
acaggcggct gagcgtgggc cctgcacgct ctgggtggac ttttccaggg tgatgcagcg 5040
gtctttggta gcaagggcac tgcggcgcag gagcccctcg tactcaaact ggtaaatctg 5100
tttgagtcgc tcatccgaga acccaaaagg atcaaaaagg tagcaggtgt tggagcgcgg 5160
gttccaacca aaagccagcc agtgctctcc ccccgtctcg cgtccggcag tgttgactat 5220
ggcgcaggcg agcttgtcgg gggccatgaa ccccgggaaa cgcttgtcaa aggttcccag 5280
gaaatagggt ccgcaaccca ggtctcggac gatggctttg agctcttgct cgctggagcc 5340
gtttccggac ccgcatgaca tggctgcagc tgctgcttgc aagaagcaag aggcttctta 5400
tgtggtggcg ttgccggccg agaacggtgt gcgcaggtag acggcctcga tgacgccgcg 5460
gtgtggctgg tgcactctga ccacgtcgaa gacttcgaaa agaagataaa gcagggtggg 5520
ctcatccatg ggatccacct caaaagtcat gtccagcgca tgggccgagt tggcatagag 5580
caggttctgt cccaggtccg taagggctcc catggacatg aagttgctgg agaacggtat 5640
gcgccacatg gtcctgtcgc acaggaactt tttttgggta acacttttaa cggcagtagt 5700
tccgatgagc gggtatggat aattggctgg gtaaggttcc ccttgtctca tagtaggcgc 5760
aaggtatcct acaaagccag agttgttgtg ttgatatggt aaggtgacgg ctttgtagtc 5820
agtgtaatta acctcatcaa ccacctgcct gctcataggc tggaagtttc tgaaaaagga 5880
gtacatgcga tccttgtatc cctcagggat gtaaaagccc tggtagccaa tgttgtagtt 5940
ggcaagcatc tgaaccagga accagtcttt ggtcatgttg cattgggcca cattgtatcc 6000
ttccccatcc acagtgcgct tgatttcaaa ctcatttgga gacaacagcc tgtcattgcc 6060
aggccagctg actgaggagt caaacatgat ggagaccttc ttgaaagtgt ggttaaggta 6120
aaaagtgcca tccaggtagg gaatagatcc agaataaacg aagtagggat cgaaccctga 6180
tccaagagat ggagtctcct tggttttgag tctggtgaag gaccagcccc tgaaggctgc 6240
ccagttgcga gatgggatgg aaattggaat gttggttgca ttggcaggga tggggtaaag 6300
catgttagct gcagagaggt agtcgttgaa tgactgatca ttggtatcgt tgcgcagcat 6360
ggcttcaaga gttgaagcgg tgttgtgagc catggggaag aaggtggcat agaggttgat 6420
gctggtgaaa cttatgttag caccatctgt tctgaggtca tttccaaggg aactttgcag 6480
gaccatgttc acatcctttc tgaagttcca ctcataggtg taggagccag gtagaagaag 6540
taggttcttg acagcaaaga atttttgagg cacttgtatg tggaaaggca cataacggcc 6600
attgcccaga agcatggacc ggtagcgtag gccagcattg cggtggtggt taaatggatt 6660
cacattgtcc attgggtcaa gagaccacct ggcgccaatg ttgatgtatg aatcgaccag 6720
agatggggaa accactcgcc cgttcatgta ctcataggtg ttggtgttag cgggcagagt 6780
aatgttagtt ggcgtgtact tgtaaacatc tggaaggtac aaagccacat tggagtacag 6840
aaaacttctc caaagattag cttggatatt aatttccata gccagattgt tgcctatggc 6900
tatttcatta gctgtagaaa ctttagtatc tttttcccat gcagtgtctc taggtttaat 6960
gccttgatat ttgttccctg gtcctatgcc atccagagga aaacagtaat taggcagttc 7020
atcctcgacg ccatgatttt caataatacg aacatcggga tcatagctgt ccacagcctg 7080
attccacatg ctgaagtatc tgcttctgtc tcccagagaa tcaagcaaaa gctgatatga 7140
cagttcagtg tttctgtcct gcaagtcaac cactgcattc agttgtgatg cttggccggc 7200
caaaactccc atatttccag tactgttgta gtacataaga cctacaaagt tatccctgaa 7260
gccaatgtaa ttgggtctgt taggcatggc ttgttgaccc aaatttgcat gagagttacc 7320
atcagaagtt cctggcttgt ataccacatg gctgtctgga gtttccaaat tgacattttc 7380
cgtgtaaagc acaatttcag gcgaaaaagc gtcagcagct tctctaccat cgaaaaattc 7440
catatcaata tctggctcct cagcttcaac atctccttcg gttggtgtta cttttctgtt 7500
tttagcttgg ccccctttta tgtttgtagg tcttgcaaaa gacccgtagc atggcttcat 7560
tttagtagct ggtttaagag ctctacctcc aaatttttca tttgttccat caatatcagt 7620
ccatgattct tctccaactt gaggctctgg ctgatatgtt ttatcggcat aaatgggctt 7680
gttgtctgca gtaatgtctt tcccaatttc taaaccttcc ttagtaatat tgtctccctt 7740
cgtggaagca atgccaaatg tgtatgtggt ggcattgtct tctcccgttg taactatcca 7800
ctgagatgtg ttaggcgcgc ccttaggagc cagtgaattg taagctgtgc cggaatatgg 7860
cttgaagcta ggacctctat caagcacccc cctaatgtca aagaatgtgc tggccatgtc 7920
aagcactctg ttgtcgccca cggcgagggt gtaccgcact ttgtaagagt atgtattgtc 7980
ctcccggtca acgggcacga agcgcagcat cagtcgctgg ctacggtcgg tggtcacatc 8040
gtgggtgggc gccactgtgg ggtttctaaa cttgttcccc atactgaagt aggtgtctgt 8100
tgcacgggcg aactgcacca gacccggact caggtactcc gaagcatcct gtccggcgat 8160
gtgcatgtat gcccattggg gcatcatcga tggggtggcc atcttgaaag caactcagcc 8220
tcggcgcgcg acctcttcct ttctcctctg ctgcggcggc gtggtgatga tacatacaca 8280
cagacaagca agttaagcgc tactccatat ttaattaata gcagcgacgg cgctttacac 8340
tctgcacgcc cagacccacg atgctgttca gagtactttg ccagtttgct ttcgggcgcg 8400
gtgtgccccc aggacgcggt ctggctacgg caacgggctg tacggcggtg ggctttctgg 8460
tagcgacagg tttgggaaca ggcgccgcag aagcaggggg aggaggcaag tccaaggtgg 8520
cgggtcgatg taactcagaa ggtttcatca ccccggtagc catgtgagct acgggcctgg 8580
tagtgggcat tccgagcttt actgcctcct cgtatgaagg gggctcgtct gcgcgcgtca 8640
ccagcgtgtg ctctagctcg ggtcgcggac gcttgtcgcc ccgcttttcc agcggaggaa 8700
gttcttcctc cacttccatt tcaccagggg ttgcgggcgg cgggtccagg cggctgttta 8760
tctgtttttg tacagcctgg ttggccagat ccactacgcc gttaatacca gaggcgatcc 8820
catcgaccac cttctgttgg aagttttgtt ccttaagctt atttctcaga gcctgccctg 8880
tgctgctgtt ccaagctttg ttcccatagg tttttacggt cgagccaaaa tttttaagcc 8940
cgctccagat actgctccaa ttgaaggcgc ccccgttcag ttggctcgtg ccgatgtcgc 9000
tccaggtgcc catgtacggc ctcgtgccgt gtcgcggagc cagggatgaa aaattgatgt 9060
cttccatctc tacaaaaaca tagtcacagg accaggagcg tcagagtcca ttctattttt 9120
tatttataag tttttccaat gttagtggcg ctgcgaggcc tgaaccgcca cggaagctat 9180
gcctggtatc gccccgatcg ctgcggcgat gatgggtata agagctggca aaaagccacc 9240
ccctaatcgt ctgctgatag cgcgccttcg tctgtggcgg cgcatccctc gccccaacat 9300
ccttctacgg cgcgagtttc ttcctcggta gccagtaatg gggacgcgaa ggcggcaagt 9360
gagggccata tctgcaagga ggcagcgtca acagtcatta agtggtgatg cttggatggt 9420
agcgcgcgcg cggcagcgtc agaggttcag cgcgaccatc gcggtacact ctccgcacca 9480
gggcggcggg agtcaatttg ctggcagtgt tgcggcggcg gcgacggcga gtgcgacttg 9540
caggtggttt gcggcggcga gaggtgttgc tccggtttcg atagtagcga gtgcctctgt 9600
aacccggagt gggaatgatg gatgggtgca gagcatagtt gggcattagc agacttgctg 9660
ggccgtactt tcgtcgtgat cttcgagtgg tgctgggggc ggcaacgggc gcgggcatcc 9720
agggttccgt ttgcacctca attgaggtgg ttgtgggttt tgcaggttcg gtctgcactt 9780
ccatggactc ggtgggaatc ttgatgtcga aggtttgtac tcccaaacct ggcgccactt 9840
ccttgatagg tcttactttg acctcaggct ggatatcggc atccactttc attttctcca 9900
gtacgtcttc tagcctctgg cgcttgggca ccattagctg catggtggga tacaggtcct 9960
caccctcgcg ctttacgcct ctccgcgcag gcacgggcag cacttgctgc agggtgactg 10020
gtttgaggct gggggtggga tttccatgat ccaaaggaat ggacaccgcc tcctctttgg 10080
gactggatct agtgcgcttg ccataagcaa actcgtcaag gcggtctgcc gcctgctcaa 10140
gaatattgtc atccccgtac acctcatcat aggaccgttt aaaagtagtg ctggaacgct 10200
cgccgggtgt aaaaaccaca gtggtcccgg gtctgagcac ttgacgcact ttgcgcccgc 10260
gccactgcac gcgccgtctt ggggcgaact cgcgcacaaa ctccaccagc ccatcatcgt 10320
catcttcttc ctttttgtta tttttgaccc gcttgatttt gcggggcttt ttttcatcct 10380
tcaccggtgg accgtagatt tcaggcgcga tgacctggag catctcttcc ttgtatttgc 10440
gcttggacat acttgccgct gggacacaac atcggagact gctcagtatc ttctaagtgc 10500
gaggggggcg agtgcgcacg ggcacgcgct ggccggtagt ggcatcacgc acccagtaca 10560
cattgcctct tcgcggttgg gccatgttgg caatggccgc tgctgccgcc gtggccgcgc 10620
gcctgcggga cctgccgctg ctggcacctg aagccgcgcg tctggccgct ctaagcatgg 10680
ctcttcgccc cacacgtttg gccctccgca gaatagcttt tgcagctcgc atggcgggag 10740
tagccctgtg gcgcctggcg atgcgcctcc ttcggctctt ccggcgagca taggcgcggg 10800
cgtctgccac cacactgtca ataactgcat ccacagtaga tgtaggcgca gtaggagtat 10860
aattacgagc atcggcgacc acctggtcga tcacatcatc gaccgtggtc cgagtgcggg 10920
tacgaccctt gagtgcgccc cagggagcgc ggaaatgacc gcgaacgcgc acagggtgct 10980
gggtagagcg tttgcgggcg cctccataca tcttggtggg cgcatacagt ccccaaccgg 11040
tattattact gggcgagatg agaatggaca tttttttttt ttagaaagtg cggcttgaaa 11100
gaacgcgcgg cgcgactatg cccagggcct tgtaaacgta gggacaggtg cggcgtctgg 11160
cgtcagtaac ggtcacgcgc tggactcccc ggatactgct gcgtaacggc agggtcccgt 11220
gatctgtgag agcaggaacg ttttcactga cggtggtaat tgtgggcgcc ggcgggcgga 11280
tgaggatctg gttctcaggg aagcggttga agacgtgcgt gagcgaagtg gcctgtcgga 11340
gctgctgaga gtacacggct tgctcattgt agaaactctt tgagaagacg ggcataagct 11400
ctgcacccac cactgggtag ttgttgactt gtcttgtgga gcggaacgtg actgggtctt 11460
gcatcatgtc agggagcgac cagtaaacct gctctgcccc acaggtgaca tctgaagtgg 11520
tgagcagtgt ccaagacctt attcctttct tagggttacc gtaattgtag gacaggtacc 11580
aactgcggta ggccgtgttg attttgtctt ccaagacatt gtagcttcta ctcttgctgt 11640
ctttttctag aggttggatc tttaactctt ttttaacttc agcagctgca gcttcacgtt 11700
tgtgtttttc tgttatatag gtatctcctc tagttatatt atcatcttca ctagtttcct 11760
ctgcaacagc cagtgtggtt gtttcagtag tggtatcctt tttgctttcc tcataggcag 11820
tgacatccaa aagggcagga atattacccc cttcaagatc ttcatacatg attttgaaac 11880
cctcctggaa tggatgtctc ttcctgatgc caagcaagtt gctaagtcgg ctttcagtaa 11940
agtctacccc gcaaccaggc agcaatacaa tgtcaggatg gaatgcctca taagtgtaga 12000
ctcctggcat aatcaactta gtttcggggt cccacccgag cctgaaattt ctagtgtcaa 12060
acttaacacc aatgtcactt tccagcactc cattctgtct gccaatttcc aggtagttgt 12120
caatgatggc attgttcatc aggtcgatcg tcatggtggc tgaaaagttg ccttctggta 12180
aaatgaactc aaaccactca tacttcaaga tatcctcttt atgatcatag gtgtcattta 12240
ctgtaacacc ttcaggagct tttctggaca ccatcaccct cgccttgaac ttgttgctga 12300
acatgtactc gttcacgttg ggcatgttgg tgtgcatgat ggtcttcaga tgaccgcccc 12360
atcgcgaccg ttcgtcaaag ttgatggtct gggtgctagc ctccgtgggg gtaaagtcat 12420
tgttctgcac caccgtggtc aggaagttgc tgtggtcgtt ctgatagttc agggaggcga 12480
tgtccgccga cttgttgtca accagataca acttggtggt atcgtacagg ggcgacagct 12540
ccgagtaacg aatgctgttt ctcccttccg taggcgccag gtaccgcggg ggtacgaagg 12600
gaacctccag tgggggctgt atcatcgccg cctgttgctg catcacgctc tcgtaagaag 12660
gaggaggacc ctccggatac accaccgctc cgcctagcac ggctcgtctc ctcatcgtac 12720
tagacacaga taacaaaaaa gaacgaacgc acgctcggtc gccatggcct tggtgagttg 12780
catttttatt ttactttcac ttttacaaca tgcgcccgaa tctgggacgc agatgagcga 12840
acgggttgcc ccctcctctt ccacccaagt ccaacacgct gctatcatcg gcagagtcct 12900
catcgtccca cacaagaccc atctgtctgt cgtggcgctg gcgtctacgg gtcggtctgc 12960
ttgtagcccc caatatcctg ggctcgtctc tgtgatcctg cgcataggtc ttccatctac 13020
tcatcttatc caccagactc tctattccat tgttggggaa gttcttttcc ctctctggcc 13080
tcagcaaaga gtcattcaag tactcatcct cgcccatcaa gcgcgggcgg gttattctcc 13140
ccagttcact gctgcgaacg ctgtttagtg aaaagggcaa gctagggaaa ggacttgcag 13200
cttcgggcac ggtcgcggca gcaccagccg ttccggacag cgacacggaa gagtgtcttc 13260
tatcgccccc ttccttcttc caaactgtat aaccgggagg cggggagaat atgctgctgt 13320
ccacatcgtc ccacaggaac ccgtcattgg ggtcgggcat gtcgtactcg ccagtgtaga 13380
aaccaggtgg gggcagccag tgtgggttca ggatagcatt ggtgaaataa tcagagttca 13440
tggcggccgc cctgtgcagg tagtccagca gtttgttaat gaaaggcctg ttactagcat 13500
acatgctggg ctccatgttt cgagctgtca tgtccagcgc ggcggtaggt gtcgccccct 13560
cctgcatcag aaacagtcca acgctctgtt gcacgtatct gaggatccgc tcctcctcag 13620
cggtaagcgc atactgagga gggatcttct gcgaccggtt ggttagcaag aagttcaggg 13680
tggcttccaa actgcccgtg tcttcctgac ccagggcgcg gctcacttgg gtgatttctt 13740
gataggtctg ctcgtccacc tggctctgcc ctatggcctc gcgatacagg ttaagcaggt 13800
agcccaagta cgagttgcgg tcgatgctac cgctgtcagt aaagggggat accagcagca 13860
gcagcaggcg ggagttggga gtcagcaagc tagacacggt cgcgcgatct cctactgggg 13920
cgtgcactcc ccacagaccc ttcaggttct tgaaagcctg agtcaggttc actgtctgca 13980
agccctgtct gctggtctgg aagaagtaat ctggcccgga ctggtacacc tcgctctggg 14040
gcacctcagc taccatgagt ctcaatgcac tcaaaaagtt tgtatagtct tgctgaccac 14100
ggggcacgtt ggcgggctgg gtgctgagga aagcgtttag cgctaccaac gaccccaagt 14160
tggcgccgcg ctggaaccgc tcgcgctgag acacggcctc gcgcacatcg gtcaccatcc 14220
tgtccaggtt ggtttgcacg ttgctgctgt tgtaacgggc cacgcgctcc aagagagcat 14280
tgtataccag cccggcctca tcgggacgga tggccttgtt ctccaccagc gcgttcacga 14340
tagccaggac cttctcgtgg gtggggttgg agcgggaggg cactacggcc tccagtatgg 14400
ccgaaaggcg gttggcctgg ggttgctgtc taaaggcttc ggggttgcgg gtcgtcagcg 14460
ccattatgcg ttgcatggcc tgggtccaat cgtccgaaga gttaatgccg gacggctggc 14520
tctgcagcgc cgcccgcatt gcggggtccg gtgcctgctg ctgttccatc tagcaaaaat 14580
acgggtcgcg ccatcagtct tccaagtact cgccctcctc gtcctcgact tcatccacct 14640
cttctatgta aggaagctca caccctgcag cctccatggc cctgcgactg ggttgccatt 14700
gcaagtccgc tcccatgtca aagtagttct ccccatcagt cccggccccc gttagagctc 14760
tttgcaagct gtgcataagt tctctgtcgc tcagctcgcg cctcctgctg gcgctcaccg 14820
cgcggtgcat cctgtcattg cgatacaccc ccagatcgtc gctcagagtc agcaccttca 14880
gagtcatgcg catgtaaaac ccatctatct ttacctcctt atctatgggt acgtaggggg 14940
tcttgtagat cttgcgagcg tagtatttgc ccaggctcaa gaccgagtag ttgatagctg 15000
ccactttctc agccaaaccc aggctacgtt cctgcactat aatactttgc aggatgttga 15060
tcagatcata cagccatctc ccatcaggct cggtgatgtt caacaacgcc tccctgaatg 15120
cctcgttgtc cctgctatgt tgaaccacca gaaacagctg agctgtcagt ggtttgctag 15180
tggggttctg ggtgatagcc tccatcaggt cccacagatg catcagaccc agggtcactt 15240
cctcgcgggc gatcagggtg cgcacatggt tgttaaaaga tttttggaag ttgcgctcct 15300
ccttcacggt ctgctcgtag gctgagacta ggttggccgc ggccacatgt gccctagctg 15360
ggctgatccc tgtcacttca tcgacctcaa aatcctcgtc ttgcagcacc cgtcttcgat 15420
ccagaccgtg gcgcagctcg cgacccgcgt taaatcgaga tgctcgcatc tcctctggct 15480
cctcaccgct cctgtccctg aacaggttct gctggggcac gtacgcctcg cgagagtcct 15540
ttttcagttg cacccgcggg tgccgctcgg gcgatggtgc gcccaggcgc gccagtccct 15600
cgccctcttc caattccaga tcataggcgg gctgtcccgc gccgctgacg gctgcagccg 15660
cagtagttac aggagcagga agagcctttt gtggctgttg ttgtagctgc tgctgagaag 15720
ggggctgttg ctgggggcgc atctgtcgca gcacgggatg catctgggca acaaaaaaca 15780
aaaaaaaaaa agagggctcg ctcccgtaaa ctggagaagt cggctgggcg ggtgccgctc 15840
gggcgatggt gcgcccaggc gcgccagtcc ctcgccctct tccaattcca gatcataggc 15900
gggctgtccc gcgccgctga cggctgcagc cgcagtagtt acaggagcag gaagagcctt 15960
ttgtggctgt tgttgtagct gctgctgaga agggggctgt tgctgggggc gcatctgtcg 16020
cagcacggga tgcatctggg caacaaaaaa caaaaaaaaa aaagagggct cgctcccgta 16080
aactggagaa gtcggctggc ggggtcttag aaacgtcgcg gaaaccggcc gatccggcgc 16140
gctaagactc gaaccggggc acaccgcaac gcaaccctgg cgattaattc tccagactac 16200
gggcgcgagc cactcccagc cccgagaact gagtgttcta aagcttgacg cagcactggc 16260
tcccatccag gaaaaagcaa aaaaacgacc cgcctccgta tcctggaggt tttgtgcagg 16320
cctgggtcga gacgggagtg ccagtaccac gttagctgcg gctccagcct gatccgagat 16380
tcgaaccggg gtacacgcgc agcccaaccc gttcgcttag cctccaggcc acggagacga 16440
gccgctgacc gctttcgttt ttgcccgtat gtctagagca tcaacgactg tgcacgtctc 16500
acgggccaaa ccgtgcctac catgaactac ttcatgccgc tgcgcaacat ctggaaccgc 16560
gtacgcgagt tcccgcgggc atccaccacc gcctccggta tcacctggat gtccaggtac 16620
atctacggtt accaccgcct catgctggaa gaccttgccc ccggagcccc ggctacagag 16680
cgatggcccc tgtaccgcca gccaccgcca cactttctca tcggctacca gtacctggtg 16740
cgcacctgca acgattacat ctttgacacc cgcgcatact cgcgcctcaa gtacaccgag 16800
ctcgtgcgcc ctgggcacca gacagtcaac tggtcagtca tggccaactg ctcctacaca 16860
atcaacaccg gggcctacca ccgctttgtg gactttgacg acttccaagc caccctcacc 16920
caggtgcagc aagccatcct cgccgaaagg gttgtagcgg acctggcact tgtccagccc 16980
atgcgcgggt tcgggatcac tcgcatgcat ggcagagcgg gcgaagaaga agtgcccgtg 17040
gaacgactca tgcaagacta ctataaagat ctggccagat gtcaggataa tgcttgggga 17100
atggcccatc gcctgcgcat ccaacaagcc ggacccaaag acctggtgct cctcgccacc 17160
atccgccgtc tcaaaactgc ctattttaat ttcatcacca gcagcatcgt ctcatcctcc 17220
caagaggagg aaggaaaaga aagagagaac cccgaccgag cgtctagccg cccccgcccg 17280
caagaaacag tgctcagcct accttgcgat tgcgactggt tagacgcttt cgtcgaaagg 17340
ttttcagatc ccgtggatct tgagacgatc aggtccttgc gcggagtacc tacggggcaa 17400
ttgataaaat gcataatcag cgcggtgtcc ctgcccaacg gagagcctcc cagtcaccac 17460
ttcagggaga tgcgcggagg cgtcttcact ctgagaccca gggagaacgg tcgtgccgtc 17520
accgagacca tgcgccgccg ccgcggagag gtcattgaaa gattcatcga ccgtctgccc 17580
gtgcgccgcc ggcgtcgccg cgttccccct cctcctgcag ccccacctga agaggaagag 17640
atgttagtgg aagaagaaga gattgaggaa gaaatcccgg gggatttcga gcgcgaggtg 17700
cgcaccacca ttgccgaact catccgtctt ctggaagagg agttgaccgt gtccgcgcgt 17760
aactcccagt ttttcaactt tgccgtggac ttctacgagg ccatggagcg cttggaagcg 17820
ctgggcgatg tcagcgagat gccgctgaga cgatggatca tgtatttctt cgtcaccgag 17880
cacatcgcca ccacactcaa ctaccttttc cagcgcctat gcaactatgc ggtcttcacc 17940
cgccacgtag agcttaacct cgcccaggtg gttatgcgcg cgagagatcc cgtgggggct 18000
gtggtctaca gccgcgtctg gaacgaggcg ggcatgaatg cattctctca actcattggg 18060
cgcatctcca acgacctagc ggccaccgtc gagagagcgg gccgcggaga tcttcaagag 18120
gaagagatcc agcagttcat ggccgagatc gcctaccagg ataactctgg cgacgtgcaa 18180
gaaatcctta ggcaagccgc cgtcaacgat accgagattg attctgttga actctctttc 18240
aggttcaagc tcacggggcc ggtagctttc acccagaggc gtcagatcca ggatgtcaac 18300
cgccgcgtcg tcgcacatgc gagtcttctc agggcgcagt accagaacct acccgcgcgc 18360
ggcgccgacg taccactgcc agccatgccg ccgggtcccg agccgcccct gccgcccggt 18420
gcgcgccctc gacaccgctc ctaaacatgc aagaagcaac agagccaccg ccgcccaaaa 18480
ggaaaaacaa gggcacggtg gtagcgccca aggggcacgg aaccctgcaa gccattgaca 18540
tctccaccaa cggacccgtg gagatcaagt accatctgaa cctccctcac gccctcgaaa 18600
agatcatgca agtcaatctc ctgacactgc ctactaacct gactccgcag cgtctcagga 18660
ccctggacag ctccggcctg cgcgctctcg tcctcgagct ccgcccctgc cgcgccgagg 18720
tctggacttg cctcccgcga gggctcgtca gcatgaccac catcgagaca gaagatggtc 18780
atgccgatgc agacaacata gtagagcgcc aggtacaaac gccaggcctc aattttccac 18840
tgaaatttct cgtcaaagga agtcaggtac aactcattca tgaggtgcat cccgtgaatc 18900
gctgcgagta ctgcggccgt ctgtacaagc acaagcatga atgctcggcg cgtcgcaggg 18960
agttctactt ccatcacatc aacagccatt cctccaactg gtggcaggag atccagttct 19020
tcccgattgg ctctcatcct cgcacagaaa ggctcttcct cacctacgat gtggaaacct 19080
acacctggat ggggtccttt ggcaagcagc taatcccctt catgctggtc atgaaactct 19140
ctggagacca gcggctcgtc aacatcgcct atgacctcgc catgaaactt aagtgggatc 19200
gctggcggca ggacccccaa accttctatt gcgtcacccc agaaaaaatg gcagtcgggc 19260
agcattttcg tcaataccgg gaccagttac aaacagcact cgcagtggac ctctggtcct 19320
ccttcctcaa agcgaaccct cacgtgcacg aatgggccct cgaacactat gctctcactg 19380
accctacaga tctcactttt gaagaactca agaagctgcc tcatgtcagg ggcacccctc 19440
gattcttaga actgtacata gtggggcaca acatcaatgg ctttgatgag atcgtcttgg 19500
ccgctcaggt tatcaataac cgagcagagg tccctcagcc tttcagaatc acccgaaatt 19560
tcatgcccag ggccggcaag atcctcttca atgatgttac tttcgctttg cccaaccccg 19620
cctacaagaa gcgggtggac ttccaactct gggaacaggg ggcctgtgat gacatggact 19680
tcaagtatca attcctcaaa gtcatggtca gggacacttt tgccctcact catacctcgc 19740
tgcgcaatgc agcccaagca tactctctcc cagtggagaa gggatgctgt ccctacaagg 19800
cagtcaatca gttctacatg ttgggctctt accgtgcaga aaaagacggg tttcccctcg 19860
aagagtactg gaaggatcgc gaagaatacc ttctcaaccg cgagctgtgg gaaaagaaaa 19920
gccaaccgcg ttatgacatc atccaggaaa ctctcgacta ctgtgccctg gatgtactcg 19980
tcaccgccga gctggtagcc aagctgcaag agtcatatgc ccacttcata agggactctg 20040
taggcctacc tcatgcccat tttaacatat tccagagacc tactatctct tcaaattccc 20100
atgccatctt tcgccagatc gtttacaggg cggaaaaacc caaccgcacc aatctgggcc 20160
cgggtcttct cgccccctca catgaactct atgactatgt gcgagcaagc atcagagggg 20220
ggcgctgtta tcccacttac atcggcatcc tcgaagagcc cctctatgta tacgatatct 20280
gtggcatgta tgcctccgcg ctcacccacc ccatgccctg gggcacccct cttaacccct 20340
atgagcgcgc gctggcagtt cgagaatggc agatgacctt ggatgatccc accaccatca 20400
gctattttga caaagatttg ctaccgggaa tatttaccat agatgcggac ccccctgatg 20460
agctcatgct agaccccctc ccccctttct gttcaagaaa aggaggtcga ctctgctgga 20520
ccaatgagcc cctccgaggc gaggtggcca ccagtgtgga tctgataacc ctgcacaata 20580
ggggatggcg agtcagaata gttccggatg aactgacaac catcttccct gaatggaaat 20640
gtgtggcgcg cgagtacgtc cagcttaaca tcgccgccaa ggagcgcgcg gacaaggaaa 20700
agaaccaaac catgcgctcc atcgccaagc ttctatccaa tgccctctat ggatcatttg 20760
ctaccaagct ggacaacaag aagattgtgt tttctgacca gatggacgag agtcttatga 20820
aaggcatctc tgctggtact gtcaatatca aatcctcctc gttcctagaa actgacaacc 20880
tgagtgcaga ggtcatgccc gccttcgaga gggaatacct accccaacag ctggcgctcc 20940
tggacagcga tccggaagac agtgaggacg aacagaggcc cgcccccttt tatacccccc 21000
cggcggggac ccctggtcac gtggcctaca cttacaagcc aatcacattc ttggatgtgg 21060
aggaggggga catgtgttta cataccgtag agaaggtgga ccccctggtt gacaacgacc 21120
gctacccctc ccacgtggcc tcctttgtgc tggcctggac acgcgctttt gtatcagagt 21180
gggctgggtt cctctacgaa gaggaccgag gcactccgct cgaggacagg cccataaagt 21240
cggtctacgg ggacacggac agcctctttg tcacccagcg gggacacgac ctcatggaaa 21300
ccaaaggtaa gaaacgcatc aaaaaacatg gcggaaaact tgtttttgac cccgatgagc 21360
cggatctgac ctggctcgtg gagtgcgaaa ccgtctgcgc ctcctgcggt gcggatgcat 21420
actcccccga atccattttc ctcgcgccca agctgtatgc cctcaaatgt atctactgcc 21480
ccgcctgcca taaaacttcc aaaggtaagc tccgtgccaa aggccacgcg gccgaggcgc 21540
tcaactacga actcatggta aactgctacc tggccgacat gcagggcgcc gatcggcagc 21600
ggttctcgac cagcaggatg agtctgaagc gcaccctcgc aagcgcccaa ccaggcgcgc 21660
acccattcac cgtgacggaa acaaccctga ctcggacgct gcgaccatgg aaggatcgga 21720
ccctggcagc gctggacgcc catcgtctga ttccctactc caggagccgt cccaacccgc 21780
gaaacgagga ggtctgctgg atcgagatgc catagagcac atcaccgagc tctgggaccg 21840
gctcgagctc ttgcaacaga ctctttccaa aatgcccatg gctgacgggc tgaagccgct 21900
gaaaaacttc tcctcgctcc aggagcttct atcccttggg ggagagcgcc tcctaacgga 21960
cttggtgcgg gaaaatatcc atgtaaggga aatgatgaac gaagtggccc ccctactccg 22020
ggaggacggc agctgtcgct ccctaaacta ccatctgcaa cccgtaattg gggtcattta 22080
cggtcccact gggtgcggca agtctcagct gcttaggaat ttgctctcat cccagttaat 22140
caccccggct ccagaaacgg tattttttat agccccgcag gtggacatga tccccccctc 22200
tgaactgaaa gcctgggaaa tgcaaatatg tgaggggaac tatgctcccg ggccagaggg 22260
aactttcatc ccccaatctg gcaccctccg cccaaagttt attaaaatgg cttatgatga 22320
cctgactcag gagcataact atgatgtttc agacccccgg aacgtgttcg cccgtgccgc 22380
tgcccacggc cccatcgcta tcattatgga tgagtgcatg gagaatctgg ggggtcacaa 22440
aggcgtctcc aaattttttc atgcttttcc ctctaagctg catgataaat ttcccaagtg 22500
caccggatac actgtcttag tggtcctgca caatatgaac ccgagacggg atctaggcgg 22560
caacattgcc aacctcaaga tccagtccaa aatgcatata atttcacccc ggatgtaccc 22620
gtcccagctc aatagatttg taaacaccta cactaagggc ctccccgttg caattagtct 22680
gctcctaaaa gatattgtgc aacaccatgc actccgacct tgctatgact gggtgattta 22740
taacactacc ccggagcaag aggctcttca atggagctat ctccaccccc gagacggact 22800
aatgcctatg tatctaaaca ttcaatccca cctttacagg gtactggaaa agatccaccg 22860
agttctcaat gatcgagacc gatggtccag ggcataccgc gcgcgaaaaa tcaaataaac 22920
a 22921
<210> 22
<211> 4038
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 7 sequence
<400> 22
tataaaacgc ctggtgatca gaggccgagg tatccagctc aacgacgagt cggttagctc 60
ttcgcttggt ctgcgaccag acggagtctt ccagatcgcc ggctgtggga gatcttcctt 120
cacccctcgt caggctgtac tgactttgga gagttcgtcc tcgcagcccc gctcgggcgg 180
catcggaact ctccagttcg tggaggagtt tactccctct gtctacttca accccttctc 240
cggctctcct ggccagtacc cagacgagtt cataccgaac ttcgacgcaa tcagcgagtc 300
agtggatggc tatgattgat gtctaatggt ggcgcggctg agctagctcg actgcgacac 360
ctagaccact gccgccgctt tcgctgcttc gcccgggaac tcaccgagtt catctacttc 420
gaactccccg aggagcaccc tcagggtccg gcccacggag tgcggattac catcgaaggg 480
ggaatagact ctcgcctgca tcgaatcttc tcccagcgac ccgtgctgat tgagcgcgac 540
cagggaaata caaccatctc catttactgc atctgtaacc accccggatt gcatgaaagc 600
ctttgctgtc ttgtttgtgc tgagtttaat aaaaactgag ttaagaccct cctacggact 660
accgcttctt caatcaggac tttacaacac caaccagatc ttccagaaga cccagaccct 720
tcctcctctg atccaggact ctaactctac cttaccagca ccatccacta ctaaccttcc 780
cgaaactaac aagcttggat ctcatctgca acaccgcctt tcacgaagcc ttctttctgc 840
caatactacc actcccaaaa ccggaggtga gctccgcggt ctccctactg acgacccctg 900
ggtggtagcg ggttttgtaa cgttaggagt agttgcgggt gggcttgtgc taatcctttg 960
ctacctatac ataccttgct gtgcatattt agtcatattg cgctgttggt ttaaaaaatg 1020
ggggccatat tagtcgtgct tgctttactt tcgcttttgg gtctgggctc tgctaatctc 1080
aatcctcttg atcacgatcc atgtctagac ttcgacccag aaaactgcac acttactttt 1140
gcacccgaca caagccgtct ctgtggagtt cttattaagt gcggatggga ctgcaggtcc 1200
gttgaaatta cacataataa taaaacatgg aacaatacct tatccaccac atgggagcca 1260
ggagttcccg agtggtatac tgtctctgtc cgaggtcctg acggttccat ccgcattagt 1320
aacaacactt ttattttttc tgaaatgtgc gatctggcca tgttcatgag cagacagtat 1380
gacctatggc ctcccagcaa agagaacatt gtggcatttt ccattgctta ttgcttggta 1440
acatgcatca tcactgctat catttgtgtg tgcatacact tgcttatagt tattcgccct 1500
agacaaagca ataaggaaaa agagaaaatg ccttaacctt tttactcata ccttttcttt 1560
acagcatggc ttttgttaca gctctaatta ttgccaacat tgtcactgtc gctcacgggc 1620
aaacaattat ccatattacc ttaggacata atcacaccct tgtagggccc ccaattactt 1680
cagaggttat ttggaccaaa cttggaagtg ttgattattt tgatataatt tgcaacaaaa 1740
ctaaaccaat atttgtaatc tgtaacagac aaaatctcac gttaattaat gttagcaaaa 1800
tttataacgg ttactattat ggttatgaca gatccagtag tcaatataaa aattacttag 1860
ttcgcataac tcagcccaaa ttaacagtgc ccactatgac aataattaaa atggctaata 1920
aagcattaga aaattttaca tcaccaacaa cgcccaatga aaaaaacatt ccaaattcaa 1980
tgattgcaat tattgcggcg gtggcattgg gaatggcact aataataata tgcatgttcc 2040
tatatgcttg ttgctataaa aagtttcaac ataaacagga tccactacta aattttaaca 2100
tttaattttt tatacagatg ttttccacta caatttttat cattactagc cttgcagctg 2160
taacttatgg ccgttcacac ctaactctac ctgttggctc aacatgtaca ctacaaggac 2220
cccaacaagg ctatgtcact tggtggagaa tatatgataa tggagggttc gctagaccat 2280
gtgatcagcc tggtacaaaa ttttcatgca acggaagaga cttgaccata attaacataa 2340
catcaaatga gcaaggcttc tattatggaa ccaactataa agatagttta gattacaaca 2400
ttattgtagt gccagccacc acttctgctc cccgcaaaac cactttctct agcagcagtg 2460
ccaaagcaag cacaattcct aaaacagctt ctgctatgtt aaagcttcaa aaaatcgctt 2520
taaataattc cacagccgct cccaatacaa ttcctaaatc aacaattggc atcattactg 2580
ccgtggtagt gggattaatt attatatttt tgtgcataat gtactatgcc tgctgctata 2640
gaaaacatga acaaaaaggt gatgcattac taaattttga catttaattt tttatagaat 2700
tatgatattg tttcaatcaa ataccactaa cactatcaat gtgcagacta ctttaaatca 2760
tgacatggaa aaccacacta cctcctatgc atacacaaac attcagccta aatacgctat 2820
gcaatagaaa ttctaaaaga cgtcccatct attctcctat gattagtcgt ccccatatgg 2880
ctttgaatga aatctaagat cttttttttt tttctcttac agtatggtga acaccaatca 2940
tgatccctag aaatttcttc ttcaccatac tcatctgtgc tttcaatgtc tgtgctactt 3000
tcacagcagt agccactgca agcccagact gtataggacc atttgcttcc tatgcacttt 3060
ttgccttcgt tacttgcatc tgcgtgtgta gcatagtctg cctggttatt aattttttcc 3120
aactggtaga ctggatcttt gtacgaattg cctacctacg tcaccatccc gaataccgca 3180
atcaaaatgt tgcggcactt cttaggctta tttaaaacca tgcaggctat gctaccagtc 3240
attttaattc tgctactacc ctgcattgcc ctagcttcca ccgccactcg cgctacacct 3300
gaacaactta gaaaatgcaa atttcaacaa ccatggtcat ttcttgattg ctaccatgaa 3360
aaatctgatt tccccacata ctggatagtg attgttggaa taattaacat actttcatgt 3420
acctttttct caatcacaat ataccccaca tttaattttg ggtggaattc tcccaatgca 3480
ctgggttacc cacaagaacc agatgaacat atcccactac aacacataca acaaccacta 3540
gcactggtag agtatgaaaa tgagccacaa ccttcactac ctcctgccat tagttacttc 3600
aacctaaccg gcggagatga ctgaaatact caccacctcc aattccgccg aggatctgct 3660
tgatatggac ggccgcgtct cagaacagcg actcgcccaa ctacgcatcc gccagcagca 3720
ggaacgcgtg accaaagagc tcagagatgt catccaaatt caccaatgca aaaaaggcat 3780
attttgcttg gtaaaacaag ccaagatatc ctacgagatc accgctactg accatcgcct 3840
ctcttacgaa cttggccccc aacgacaaaa atttacatgc atggtgggaa tcacccctat 3900
agttatcact cagcaaagtg gagatactaa ggggtgcatt cactgctctt gcgattccat 3960
cgagtgcacc tacaccctgc taaagaccct atgcggccta agagacctgc tacccatgaa 4020
ttaaaaatta ataaaaaa 4038
<210> 23
<211> 978
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 7 sequence
<400> 23
atgaccaaga gagtccggct cagtgattcc ttcaaccctg tctaccccta tgaagatgaa 60
agcacctccc aacacccctt tataaaccca gggtttattt ccccaaatgg ctttacacaa 120
agcccagacg gagttcttac tttaaaatgt ttaaccccac taacaaccac aggcgggtct 180
ctacagttaa aagtgggagg gggtcttaca atagatgaca ccgacggttt tttgaaagaa 240
aacataagtg ccaccacacc actcgttaag actggtcact ctataggttt gtcgctagga 300
cccggattag gaacaaatga aaacaaactt tgtgccaaat tgggagaagg acttacattc 360
aattccaaca acatttgcat taatgacaat attaacaccc tatggacagg agttaacccc 420
accagagcca actgtcaaat aatggcctcc agtgaatcta atgattgcaa attaattcta 480
acactagtta aaactggagc cctcgtcact gcatttgttt atgttatagg agtatctaac 540
gattttaata tgctaactac acataaaaat ataaatttca ctgcagagct gttttttgat 600
tctactggta atttattaac tagcctttca tccctaaaaa ctccacttaa tcataaatca 660
gggcaaaaca tggctactgg tgcccttact aatgctaaag gtttcatgcc cagcacaact 720
gcctatcctt tcaatgttaa ttccagagaa aaagaaaact acatttacgg aacttgttac 780
tacacagcta gtgatcacac tgcttttccc attgacatat ctgtcatgct taaccaaaga 840
gcattaaata atgagacatc atattgtatt cgtgtaactt ggtcctggaa tacaggagtt 900
gccccagaag tgcaaacctc tgctactacc ctagtcacct ctccatttac cttttactac 960
attagagaag acgactga 978
<210> 24
<211> 273
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 7 sequence
<400> 24
gacggagttc ttactttaaa atgtttaacc ccactaacaa ccacaggcgg gtctctacag 60
ttaaaagtgg gagggggtct tacaatagat gacaccgacg gttttttgaa agaaaacata 120
agtgccacca caccactcgt taagactggt cactctatag gtttgtcgct aggacccgga 180
ttaggaacaa atgaaaacaa actttgtgcc aaattgggag aaggacttac attcaattcc 240
aacaacattt gcattaatga caatattaac acc 273
<210> 25
<211> 576
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 7 sequence
<400> 25
ctatggacag gagttaaccc caccagagcc aactgtcaaa taatggcctc cagtgaatct 60
aatgattgca aattaattct aacactagtt aaaactggag ccctcgtcac tgcatttgtt 120
tatgttatag gagtatctaa cgattttaat atgctaacta cacataaaaa tataaatttc 180
actgcagagc tgttttttga ttctactggt aatttattaa ctagcctttc atccctaaaa 240
actccactta atcataaatc agggcaaaac atggctactg gtgcccttac taatgctaaa 300
ggtttcatgc ccagcacaac tgcctatcct ttcaatgtta attccagaga aaaagaaaac 360
tacatttacg gaacttgtta ctacacagct agtgatcaca ctgcttttcc cattgacata 420
tctgtcatgc ttaaccaaag agcattaaat aatgagacat catattgtat tcgtgtaact 480
tggtcctgga atacaggagt tgccccagaa gtgcaaacct ctgctactac cctagtcacc 540
tctccattta ccttttacta cattagagaa gacgac 576
<210> 26
<211> 1635
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 7 sequence
<400> 26
atgaggagac gagccgtgct aggcggagcg gtggtgtatc cggagggtcc tcctccttct 60
tacgagagcg tgatgcagca acaggcggcg atgatacagc ccccactgga ggttcccttc 120
gtacccccgc ggtacctggc gcctacggaa gggagaaaca gcattcgtta ctcggagctg 180
tcgcccctgt acgataccac caagttgtat ctggttgaca acaagtcggc ggacatcgcc 240
tccctgaact atcagaacga ccacagcaac ttcctgacca cggtggtgca gaacaatgac 300
tttaccccca cggaggctag cacccagacc atcaactttg acgaacggtc gcgatggggc 360
ggtcatctga agaccatcat gcacaccaac atgcccaacg tgaacgagta catgttcagc 420
aacaagttca aggcgagggt gatggtgtcc agaaaagctc ctgaaggtgt tacagtaaat 480
gacacctatg atcataaaga ggatatcttg aagtatgagt ggtttgagtt cattttacca 540
gaaggcaact tttcagccac catgacgatc gacctgatga acaatgccat cattgacaac 600
tacctggaaa ttggcagaca gaatggagtg ctggaaagtg acattggtgt taagtttgac 660
actagaaatt tcaggctcgg gtgggacccc gaaactaagt tgattatgcc aggagtctac 720
acttatgagg cattccatcc tgacattgta ttgctgcctg gttgcggggt agactttact 780
gaaagccgac ttagcaactt gcttggcatc aggaagagac atccattcca ggagggtttc 840
aaaatcatgt atgaagatct tgaagggggt aatattcctg cccttttgga tgtcactgcc 900
tatgaggaaa gcaaaaagga taccactact gaaacaacca cactggctgt tgcagaggaa 960
actagtgaag atgataatat aactagagga gatacctata taacagaaaa acacaaacgt 1020
gaagctgcag ctgctgaagt taaaaaagag ttaaagatcc aacctctaga aaaagacagc 1080
aagagtagaa gctacaatgt cttggaagac aaaatcaaca cggcctaccg cagttggtac 1140
ctgtcctaca attacggtaa ccctaagaaa ggaataaggt cttggacact gctcaccact 1200
tcagatgtca cctgtggggc agagcaggtt tactggtcgc tccctgacat gatgcaagac 1260
ccagtcacgt tccgctccac aagacaagtc aacaactacc cagtggtggg tgcagagctt 1320
atgcccgtct tctcaaagag tttctacaat gagcaagccg tgtactctca gcagctccga 1380
caggccactt cgctcacgca cgtcttcaac cgcttccctg agaaccagat cctcatccgc 1440
ccgccggcgc ccacaattac caccgtcagt gaaaacgttc ctgctctcac agatcacggg 1500
accctgccgt tacgcagcag tatccgggga gtccagcgcg tgaccgttac tgacgccaga 1560
cgccgcacct gtccctacgt ttacaaggcc ctgggcatag tcgcgccgcg cgttctttca 1620
agccgcactt tctaa 1635
<210> 27
<211> 2805
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 7 sequence
<400> 27
atggccaccc catcgatgat gccccaatgg gcatacatgc acatcgccgg acaggatgct 60
tcggagtacc tgagtccggg tctggtgcag ttcgcccgtg caacagacac ctacttcagt 120
atggggaaca agtttagaaa ccccacagtg gcgcccaccc acgatgtgac caccgaccgt 180
agccagcgac tgatgctgcg cttcgtgccc gttgaccggg aggacaatac atactcttac 240
aaagtgcggt acaccctcgc cgtgggcgac aacagagtgc ttgacatggc cagcacattc 300
tttgacatta ggggggtgct tgatagaggt cctagcttca agccatattc cggcacagct 360
tacaattcac tggctcctaa gggcgcgcct aacacatctc agtggatagt tacaacggga 420
gaagacaatg ccaccacata cacatttggc attgcttcca cgaagggaga caatattact 480
aaggaaggtt tagaaattgg gaaagacatt actgcagaca acaagcccat ttatgccgat 540
aaaacatatc agccagagcc tcaagttgga gaagaatcat ggactgatat tgatggaaca 600
aatgaaaaat ttggaggtag agctcttaaa ccagctacta aaatgaagcc atgctacggg 660
tcttttgcaa gacctacaaa cataaaaggg ggccaagcta aaaacagaaa agtaacacca 720
accgaaggag atgttgaagc tgaggagcca gatattgata tggaattttt cgatggtaga 780
gaagctgctg acgctttttc gcctgaaatt gtgctttaca cggaaaatgt caatttggaa 840
actccagaca gccatgtggt atacaagcca ggaacttctg atggtaactc tcatgcaaat 900
ttgggtcaac aagccatgcc taacagaccc aattacattg gcttcaggga taactttgta 960
ggtcttatgt actacaacag tactggaaat atgggagttt tggccggcca agcatcacaa 1020
ctgaatgcag tggttgactt gcaggacaga aacactgaac tgtcatatca gcttttgctt 1080
gattctctgg gagacagaag cagatacttc agcatgtgga atcaggctgt ggacagctat 1140
gatcccgatg ttcgtattat tgaaaatcat ggcgtcgagg atgaactgcc taattactgt 1200
tttcctctgg atggcatagg accagggaac aaatatcaag gcattaaacc tagagacact 1260
gcatgggaaa aagatactaa agtttctaca gctaatgaaa tagccatagg caacaatctg 1320
gctatggaaa ttaatatcca agctaatctt tggagaagtt ttctgtactc caatgtggct 1380
ttgtaccttc cagatgttta caagtacacg ccaactaaca ttactctgcc cgctaacacc 1440
aacacctatg agtacatgaa cgggcgagtg gtttccccat ctctggtcga ttcatacatc 1500
aacattggcg ccaggtggtc tcttgaccca atggacaatg tgaatccatt taaccaccac 1560
cgcaatgctg gcctacgcta ccggtccatg cttctgggca atggccgtta tgtgcctttc 1620
cacatacaag tgcctcaaaa attctttgct gtcaagaacc tacttcttct acctggctcc 1680
tacacctatg agtggaactt cagaaaggat gtgaacatgg tcctgcaaag ttcccttgga 1740
aatgacctca gaacagatgg tgctaacata agtttcacca gcatcaacct ctatgccacc 1800
ttcttcccca tggctcacaa caccgcttca actcttgaag ccatgctgcg caacgatacc 1860
aatgatcagt cattcaacga ctacctctct gcagctaaca tgctttaccc catccctgcc 1920
aatgcaacca acattccaat ttccatccca tctcgcaact gggcagcctt caggggctgg 1980
tccttcacca gactcaaaac caaggagact ccatctcttg gatcagggtt cgatccctac 2040
ttcgtttatt ctggatctat tccctacctg gatggcactt tttaccttaa ccacactttc 2100
aagaaggtct ccatcatgtt tgactcctca gtcagctggc ctggcaatga caggctgttg 2160
tctccaaatg agtttgaaat caagcgcact gtggatgggg aaggatacaa tgtggcccaa 2220
tgcaacatga ccaaagactg gttcctggtt cagatgcttg ccaactacaa cattggctac 2280
cagggctttt acatccctga gggatacaag gatcgcatgt actccttttt cagaaacttc 2340
cagcctatga gcaggcaggt ggttgatgag gttaattaca ctgactacaa agccgtcacc 2400
ttaccatatc aacacaacaa ctctggcttt gtaggatacc ttgcgcctac tatgagacaa 2460
ggggaacctt acccagccaa ttatccatac ccgctcatcg gaactactgc cgttaaaagt 2520
gttacccaaa aaaagttcct gtgcgacagg accatgtggc gcataccgtt ctccagcaac 2580
ttcatgtcca tgggagccct tacggacctg ggacagaacc tgctctatgc caactcggcc 2640
catgcgctgg acatgacttt tgaggtggat cccatggatg agcccaccct gctttatctt 2700
cttttcgaag tcttcgacgt ggtcagagtg caccagccac accgcggcgt catcgaggcc 2760
gtctacctgc gcacaccgtt ctcggccggc aacgccacca cataa 2805
<210> 28
<211> 325
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 7 sequence
<400> 28
Met Thr Lys Arg Val Arg Leu Ser Asp Ser Phe Asn Pro Val Tyr Pro
1 5 10 15
Tyr Glu Asp Glu Ser Thr Ser Gln His Pro Phe Ile Asn Pro Gly Phe
20 25 30
Ile Ser Pro Asn Gly Phe Thr Gln Ser Pro Asp Gly Val Leu Thr Leu
35 40 45
Lys Cys Leu Thr Pro Leu Thr Thr Thr Gly Gly Ser Leu Gln Leu Lys
50 55 60
Val Gly Gly Gly Leu Thr Ile Asp Asp Thr Asp Gly Phe Leu Lys Glu
65 70 75 80
Asn Ile Ser Ala Thr Thr Pro Leu Val Lys Thr Gly His Ser Ile Gly
85 90 95
Leu Ser Leu Gly Pro Gly Leu Gly Thr Asn Glu Asn Lys Leu Cys Ala
100 105 110
Lys Leu Gly Glu Gly Leu Thr Phe Asn Ser Asn Asn Ile Cys Ile Asn
115 120 125
Asp Asn Ile Asn Thr Leu Trp Thr Gly Val Asn Pro Thr Arg Ala Asn
130 135 140
Cys Gln Ile Met Ala Ser Ser Glu Ser Asn Asp Cys Lys Leu Ile Leu
145 150 155 160
Thr Leu Val Lys Thr Gly Ala Leu Val Thr Ala Phe Val Tyr Val Ile
165 170 175
Gly Val Ser Asn Asp Phe Asn Met Leu Thr Thr His Lys Asn Ile Asn
180 185 190
Phe Thr Ala Glu Leu Phe Phe Asp Ser Thr Gly Asn Leu Leu Thr Ser
195 200 205
Leu Ser Ser Leu Lys Thr Pro Leu Asn His Lys Ser Gly Gln Asn Met
210 215 220
Ala Thr Gly Ala Leu Thr Asn Ala Lys Gly Phe Met Pro Ser Thr Thr
225 230 235 240
Ala Tyr Pro Phe Asn Val Asn Ser Arg Glu Lys Glu Asn Tyr Ile Tyr
245 250 255
Gly Thr Cys Tyr Tyr Thr Ala Ser Asp His Thr Ala Phe Pro Ile Asp
260 265 270
Ile Ser Val Met Leu Asn Gln Arg Ala Leu Asn Asn Glu Thr Ser Tyr
275 280 285
Cys Ile Arg Val Thr Trp Ser Trp Asn Thr Gly Val Ala Pro Glu Val
290 295 300
Gln Thr Ser Ala Thr Thr Leu Val Thr Ser Pro Phe Thr Phe Tyr Tyr
305 310 315 320
Ile Arg Glu Asp Asp
325
<210> 29
<211> 91
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 7 sequence
<400> 29
Asp Gly Val Leu Thr Leu Lys Cys Leu Thr Pro Leu Thr Thr Thr Gly
1 5 10 15
Gly Ser Leu Gln Leu Lys Val Gly Gly Gly Leu Thr Ile Asp Asp Thr
20 25 30
Asp Gly Phe Leu Lys Glu Asn Ile Ser Ala Thr Thr Pro Leu Val Lys
35 40 45
Thr Gly His Ser Ile Gly Leu Ser Leu Gly Pro Gly Leu Gly Thr Asn
50 55 60
Glu Asn Lys Leu Cys Ala Lys Leu Gly Glu Gly Leu Thr Phe Asn Ser
65 70 75 80
Asn Asn Ile Cys Ile Asn Asp Asn Ile Asn Thr
85 90
<210> 30
<211> 192
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 7 sequence
<400> 30
Leu Trp Thr Gly Val Asn Pro Thr Arg Ala Asn Cys Gln Ile Met Ala
1 5 10 15
Ser Ser Glu Ser Asn Asp Cys Lys Leu Ile Leu Thr Leu Val Lys Thr
20 25 30
Gly Ala Leu Val Thr Ala Phe Val Tyr Val Ile Gly Val Ser Asn Asp
35 40 45
Phe Asn Met Leu Thr Thr His Lys Asn Ile Asn Phe Thr Ala Glu Leu
50 55 60
Phe Phe Asp Ser Thr Gly Asn Leu Leu Thr Ser Leu Ser Ser Leu Lys
65 70 75 80
Thr Pro Leu Asn His Lys Ser Gly Gln Asn Met Ala Thr Gly Ala Leu
85 90 95
Thr Asn Ala Lys Gly Phe Met Pro Ser Thr Thr Ala Tyr Pro Phe Asn
100 105 110
Val Asn Ser Arg Glu Lys Glu Asn Tyr Ile Tyr Gly Thr Cys Tyr Tyr
115 120 125
Thr Ala Ser Asp His Thr Ala Phe Pro Ile Asp Ile Ser Val Met Leu
130 135 140
Asn Gln Arg Ala Leu Asn Asn Glu Thr Ser Tyr Cys Ile Arg Val Thr
145 150 155 160
Trp Ser Trp Asn Thr Gly Val Ala Pro Glu Val Gln Thr Ser Ala Thr
165 170 175
Thr Leu Val Thr Ser Pro Phe Thr Phe Tyr Tyr Ile Arg Glu Asp Asp
180 185 190
<210> 31
<211> 544
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 7 sequence
<400> 31
Met Arg Arg Arg Ala Val Leu Gly Gly Ala Val Val Tyr Pro Glu Gly
1 5 10 15
Pro Pro Pro Ser Tyr Glu Ser Val Met Gln Gln Gln Ala Ala Met Ile
20 25 30
Gln Pro Pro Leu Glu Val Pro Phe Val Pro Pro Arg Tyr Leu Ala Pro
35 40 45
Thr Glu Gly Arg Asn Ser Ile Arg Tyr Ser Glu Leu Ser Pro Leu Tyr
50 55 60
Asp Thr Thr Lys Leu Tyr Leu Val Asp Asn Lys Ser Ala Asp Ile Ala
65 70 75 80
Ser Leu Asn Tyr Gln Asn Asp His Ser Asn Phe Leu Thr Thr Val Val
85 90 95
Gln Asn Asn Asp Phe Thr Pro Thr Glu Ala Ser Thr Gln Thr Ile Asn
100 105 110
Phe Asp Glu Arg Ser Arg Trp Gly Gly His Leu Lys Thr Ile Met His
115 120 125
Thr Asn Met Pro Asn Val Asn Glu Tyr Met Phe Ser Asn Lys Phe Lys
130 135 140
Ala Arg Val Met Val Ser Arg Lys Ala Pro Glu Gly Val Thr Val Asn
145 150 155 160
Asp Thr Tyr Asp His Lys Glu Asp Ile Leu Lys Tyr Glu Trp Phe Glu
165 170 175
Phe Ile Leu Pro Glu Gly Asn Phe Ser Ala Thr Met Thr Ile Asp Leu
180 185 190
Met Asn Asn Ala Ile Ile Asp Asn Tyr Leu Glu Ile Gly Arg Gln Asn
195 200 205
Gly Val Leu Glu Ser Asp Ile Gly Val Lys Phe Asp Thr Arg Asn Phe
210 215 220
Arg Leu Gly Trp Asp Pro Glu Thr Lys Leu Ile Met Pro Gly Val Tyr
225 230 235 240
Thr Tyr Glu Ala Phe His Pro Asp Ile Val Leu Leu Pro Gly Cys Gly
245 250 255
Val Asp Phe Thr Glu Ser Arg Leu Ser Asn Leu Leu Gly Ile Arg Lys
260 265 270
Arg His Pro Phe Gln Glu Gly Phe Lys Ile Met Tyr Glu Asp Leu Glu
275 280 285
Gly Gly Asn Ile Pro Ala Leu Leu Asp Val Thr Ala Tyr Glu Glu Ser
290 295 300
Lys Lys Asp Thr Thr Thr Glu Thr Thr Thr Leu Ala Val Ala Glu Glu
305 310 315 320
Thr Ser Glu Asp Asp Asn Ile Thr Arg Gly Asp Thr Tyr Ile Thr Glu
325 330 335
Lys His Lys Arg Glu Ala Ala Ala Ala Glu Val Lys Lys Glu Leu Lys
340 345 350
Ile Gln Pro Leu Glu Lys Asp Ser Lys Ser Arg Ser Tyr Asn Val Leu
355 360 365
Glu Asp Lys Ile Asn Thr Ala Tyr Arg Ser Trp Tyr Leu Ser Tyr Asn
370 375 380
Tyr Gly Asn Pro Lys Lys Gly Ile Arg Ser Trp Thr Leu Leu Thr Thr
385 390 395 400
Ser Asp Val Thr Cys Gly Ala Glu Gln Val Tyr Trp Ser Leu Pro Asp
405 410 415
Met Met Gln Asp Pro Val Thr Phe Arg Ser Thr Arg Gln Val Asn Asn
420 425 430
Tyr Pro Val Val Gly Ala Glu Leu Met Pro Val Phe Ser Lys Ser Phe
435 440 445
Tyr Asn Glu Gln Ala Val Tyr Ser Gln Gln Leu Arg Gln Ala Thr Ser
450 455 460
Leu Thr His Val Phe Asn Arg Phe Pro Glu Asn Gln Ile Leu Ile Arg
465 470 475 480
Pro Pro Ala Pro Thr Ile Thr Thr Val Ser Glu Asn Val Pro Ala Leu
485 490 495
Thr Asp His Gly Thr Leu Pro Leu Arg Ser Ser Ile Arg Gly Val Gln
500 505 510
Arg Val Thr Val Thr Asp Ala Arg Arg Arg Thr Cys Pro Tyr Val Tyr
515 520 525
Lys Ala Leu Gly Ile Val Ala Pro Arg Val Leu Ser Ser Arg Thr Phe
530 535 540
<210> 32
<211> 934
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 7 sequence
<400> 32
Met Ala Thr Pro Ser Met Met Pro Gln Trp Ala Tyr Met His Ile Ala
1 5 10 15
Gly Gln Asp Ala Ser Glu Tyr Leu Ser Pro Gly Leu Val Gln Phe Ala
20 25 30
Arg Ala Thr Asp Thr Tyr Phe Ser Met Gly Asn Lys Phe Arg Asn Pro
35 40 45
Thr Val Ala Pro Thr His Asp Val Thr Thr Asp Arg Ser Gln Arg Leu
50 55 60
Met Leu Arg Phe Val Pro Val Asp Arg Glu Asp Asn Thr Tyr Ser Tyr
65 70 75 80
Lys Val Arg Tyr Thr Leu Ala Val Gly Asp Asn Arg Val Leu Asp Met
85 90 95
Ala Ser Thr Phe Phe Asp Ile Arg Gly Val Leu Asp Arg Gly Pro Ser
100 105 110
Phe Lys Pro Tyr Ser Gly Thr Ala Tyr Asn Ser Leu Ala Pro Lys Gly
115 120 125
Ala Pro Asn Thr Ser Gln Trp Ile Val Thr Thr Gly Glu Asp Asn Ala
130 135 140
Thr Thr Tyr Thr Phe Gly Ile Ala Ser Thr Lys Gly Asp Asn Ile Thr
145 150 155 160
Lys Glu Gly Leu Glu Ile Gly Lys Asp Ile Thr Ala Asp Asn Lys Pro
165 170 175
Ile Tyr Ala Asp Lys Thr Tyr Gln Pro Glu Pro Gln Val Gly Glu Glu
180 185 190
Ser Trp Thr Asp Ile Asp Gly Thr Asn Glu Lys Phe Gly Gly Arg Ala
195 200 205
Leu Lys Pro Ala Thr Lys Met Lys Pro Cys Tyr Gly Ser Phe Ala Arg
210 215 220
Pro Thr Asn Ile Lys Gly Gly Gln Ala Lys Asn Arg Lys Val Thr Pro
225 230 235 240
Thr Glu Gly Asp Val Glu Ala Glu Glu Pro Asp Ile Asp Met Glu Phe
245 250 255
Phe Asp Gly Arg Glu Ala Ala Asp Ala Phe Ser Pro Glu Ile Val Leu
260 265 270
Tyr Thr Glu Asn Val Asn Leu Glu Thr Pro Asp Ser His Val Val Tyr
275 280 285
Lys Pro Gly Thr Ser Asp Gly Asn Ser His Ala Asn Leu Gly Gln Gln
290 295 300
Ala Met Pro Asn Arg Pro Asn Tyr Ile Gly Phe Arg Asp Asn Phe Val
305 310 315 320
Gly Leu Met Tyr Tyr Asn Ser Thr Gly Asn Met Gly Val Leu Ala Gly
325 330 335
Gln Ala Ser Gln Leu Asn Ala Val Val Asp Leu Gln Asp Arg Asn Thr
340 345 350
Glu Leu Ser Tyr Gln Leu Leu Leu Asp Ser Leu Gly Asp Arg Ser Arg
355 360 365
Tyr Phe Ser Met Trp Asn Gln Ala Val Asp Ser Tyr Asp Pro Asp Val
370 375 380
Arg Ile Ile Glu Asn His Gly Val Glu Asp Glu Leu Pro Asn Tyr Cys
385 390 395 400
Phe Pro Leu Asp Gly Ile Gly Pro Gly Asn Lys Tyr Gln Gly Ile Lys
405 410 415
Pro Arg Asp Thr Ala Trp Glu Lys Asp Thr Lys Val Ser Thr Ala Asn
420 425 430
Glu Ile Ala Ile Gly Asn Asn Leu Ala Met Glu Ile Asn Ile Gln Ala
435 440 445
Asn Leu Trp Arg Ser Phe Leu Tyr Ser Asn Val Ala Leu Tyr Leu Pro
450 455 460
Asp Val Tyr Lys Tyr Thr Pro Thr Asn Ile Thr Leu Pro Ala Asn Thr
465 470 475 480
Asn Thr Tyr Glu Tyr Met Asn Gly Arg Val Val Ser Pro Ser Leu Val
485 490 495
Asp Ser Tyr Ile Asn Ile Gly Ala Arg Trp Ser Leu Asp Pro Met Asp
500 505 510
Asn Val Asn Pro Phe Asn His His Arg Asn Ala Gly Leu Arg Tyr Arg
515 520 525
Ser Met Leu Leu Gly Asn Gly Arg Tyr Val Pro Phe His Ile Gln Val
530 535 540
Pro Gln Lys Phe Phe Ala Val Lys Asn Leu Leu Leu Leu Pro Gly Ser
545 550 555 560
Tyr Thr Tyr Glu Trp Asn Phe Arg Lys Asp Val Asn Met Val Leu Gln
565 570 575
Ser Ser Leu Gly Asn Asp Leu Arg Thr Asp Gly Ala Asn Ile Ser Phe
580 585 590
Thr Ser Ile Asn Leu Tyr Ala Thr Phe Phe Pro Met Ala His Asn Thr
595 600 605
Ala Ser Thr Leu Glu Ala Met Leu Arg Asn Asp Thr Asn Asp Gln Ser
610 615 620
Phe Asn Asp Tyr Leu Ser Ala Ala Asn Met Leu Tyr Pro Ile Pro Ala
625 630 635 640
Asn Ala Thr Asn Ile Pro Ile Ser Ile Pro Ser Arg Asn Trp Ala Ala
645 650 655
Phe Arg Gly Trp Ser Phe Thr Arg Leu Lys Thr Lys Glu Thr Pro Ser
660 665 670
Leu Gly Ser Gly Phe Asp Pro Tyr Phe Val Tyr Ser Gly Ser Ile Pro
675 680 685
Tyr Leu Asp Gly Thr Phe Tyr Leu Asn His Thr Phe Lys Lys Val Ser
690 695 700
Ile Met Phe Asp Ser Ser Val Ser Trp Pro Gly Asn Asp Arg Leu Leu
705 710 715 720
Ser Pro Asn Glu Phe Glu Ile Lys Arg Thr Val Asp Gly Glu Gly Tyr
725 730 735
Asn Val Ala Gln Cys Asn Met Thr Lys Asp Trp Phe Leu Val Gln Met
740 745 750
Leu Ala Asn Tyr Asn Ile Gly Tyr Gln Gly Phe Tyr Ile Pro Glu Gly
755 760 765
Tyr Lys Asp Arg Met Tyr Ser Phe Phe Arg Asn Phe Gln Pro Met Ser
770 775 780
Arg Gln Val Val Asp Glu Val Asn Tyr Thr Asp Tyr Lys Ala Val Thr
785 790 795 800
Leu Pro Tyr Gln His Asn Asn Ser Gly Phe Val Gly Tyr Leu Ala Pro
805 810 815
Thr Met Arg Gln Gly Glu Pro Tyr Pro Ala Asn Tyr Pro Tyr Pro Leu
820 825 830
Ile Gly Thr Thr Ala Val Lys Ser Val Thr Gln Lys Lys Phe Leu Cys
835 840 845
Asp Arg Thr Met Trp Arg Ile Pro Phe Ser Ser Asn Phe Met Ser Met
850 855 860
Gly Ala Leu Thr Asp Leu Gly Gln Asn Leu Leu Tyr Ala Asn Ser Ala
865 870 875 880
His Ala Leu Asp Met Thr Phe Glu Val Asp Pro Met Asp Glu Pro Thr
885 890 895
Leu Leu Tyr Leu Leu Phe Glu Val Phe Asp Val Val Arg Val His Gln
900 905 910
Pro His Arg Gly Val Ile Glu Ala Val Tyr Leu Arg Thr Pro Phe Ser
915 920 925
Ala Gly Asn Ala Thr Thr
930
<210> 33
<211> 137
<212> DNA
<213> Human mastadenovirus B
<400> 33
catcatcaat aatatacctt atagatggaa tggtgccaat atgtaaatga ggtgatttta 60
aaaagtgtgg atcgtgtggt gattggctgt ggggttaacg gctaaaaggg gcggtgcgac 120
cgtgggaaaa tgacgtt 137
<210> 34
<211> 137
<212> DNA
<213> Human mastadenovirus B
<400> 34
aacgtcattt tcccacggtc gcaccgcccc ttttagccgt taaccccaca gccaatcacc 60
acacgatcca cactttttaa aatcacctca tttacatatt ggcaccattc catctataag 120
gtatattatt gatgatg 137
<210> 35
<211> 342
<212> DNA
<213> Human mastadenovirus B
<400> 35
ttgtgggggt ggagtttttt tgcaagttgt cgcgggaaat gtgacgcata aaaaggcttt 60
tttctcacgg aactacttag ttttcccacg gtatttaaca ggaaatgagg tagttttgac 120
cggatgcaag tgaaaattgt tgattttcgc gcgaaaactg aatgaggaag tgtttttctg 180
aataatgtgg tatttatggc agggtggagt atttgttcag ggccaggtag actttgaccc 240
attacgtgga ggtttcgatt accgtgtttt ttacctgaat ttccgcgtac cgtgtcaaag 300
tcttctgttt ttacgtaggt gtcagctgat cgctagggta tt 342
<210> 36
<211> 3452
<212> DNA
<213> Human mastadenovirus B
<400> 36
tatacctcag ggtttgtgtc aagaggccac tcttgagtgc cagcgagaag agttttctcc 60
tctgcgccgg cagtttaata ataaaaaaat gagagatttg cgatttctgc ctcaggaaat 120
aatctctgct gagactggaa atgaaatatt ggagcttgtg gtgcacgccc tgatgggaga 180
cgatccggag ccacctgtgc agctttttga gcctcctacg cttcaggaac tgtatgattt 240
agaggtagag ggatcggagg attctaatga ggaagctgta aatggctttt ttaccgattc 300
tatgctttta gctgctaatg aagggttaga attagatccg cctttggaca cttttgatac 360
tccaggggta attgtggaaa gcggtacagg tgtaagaaaa ttacctgatt tgagttccgt 420
ggactgtgat ttgcactgct atgaagacgg gtttcctccg agtgatgagg aggaccatga 480
aaaggagcag tccatgcaga ctgcagcggg tgagggagtg aaggctgcca atgttggttt 540
tcagttggat tgcccggagc ttcctggaca tggctgtaag tcttgtgaat ttcacaggaa 600
aaatactgga gtaaaggaac tgttatgttc gctttgttat atgagaacgc actgccactt 660
tatttacagt aagtgtgttt aagttaaaat ttaaaggaat atgctgtttt tcacatgtat 720
attgagtgtg agttttgtgc ttcttattat aggtcctgtg tctgatgctg atgaatcacc 780
atctcctgat tctactacct cacctcctga gattcaagca cctgttcctg tggacgtgcg 840
caagcccatt cctgtgaagc ttaagcctgg gaaacgtcca gcagtggaaa aacttgagga 900
cttgttacag ggtggggacg gacctttgga cttgagtaca cggaaacgtc caagacaata 960
agtgttccat atccgtgttt acttaaggtg acgtcaatat ttgtgtgaca gtgcaatgta 1020
ataaaaatat gttaactgtt cactggtttt tattgctttt tgggcgggga ctcaggtata 1080
taagtagaag cagacctgtg tggttagctc ataggagctg gctttcatcc atggaggttt 1140
gggccatttt ggaagacctt aggaagacta ggcaactgtt agagaacgct tcggacggag 1200
tctccggttt ttggagattc tggttcgcta gtgaattagc tagggtagtt tttaggataa 1260
aacaggacta taaccaagaa tttgaaaagt tgttggtaga ttgcccagga ctttttgaag 1320
ctcttaattt gggccatcag gttcacttta aagaaaaagt tttatcagtt ttagactttt 1380
caaccccagg tagaactgct gctgctgtgg cttttcttac ttttatatta gataaatgga 1440
tcccgcagac tcatttcagc aggggatacg ttttggattt catagccaca gcattgtgga 1500
gaacatggaa ggttcgcaag atgaggacaa tcttaggtta ctggccagtg cagcctttgg 1560
gtgtagcggg aatcctgagg catccaccgg tcatgccagc ggttctggag gaggaacagc 1620
aagaggacaa cccgagagcc ggcctggacc ctccagtgga ggaggcggag tagctgactt 1680
gtctcctgaa ctgcaacggg tgcttactgg atctacgtcc actggacggg ataggggcgt 1740
taagagggag agggcatcta gtggtactga tgctagatct gagttggctt taagtttaat 1800
gagtcgcaga cgtcctgaaa ccatttggtg gcatgaggtt cagaaagagg gaagggatga 1860
agtttctgta ttgcaggaga aatattcact ggaacaggtg aaaacatgtt ggttggagcc 1920
tgaggatgat tgggaggtgg ccattaaaaa ttatgccaag atagctttga ggcctgataa 1980
acagtataag attactagac ggattaatat ccggaatgct tgttacatat ctggaaatgg 2040
ggctgaggtg gtaatagata ctcaagacaa ggcagttatt agatgctgca tgatggatat 2100
gtggcctggg gtagtcggta tggaagcagt aacttttgta aatgttaagt ttaggggaga 2160
tggttataat ggaatagtgt ttatggccaa taccaaactt atattgcatg gttgtagctt 2220
ttttggtttc aacaatacct gtgtagatgc ctggggacag gttagtgtac ggggatgtag 2280
tttctatgcg tgttggattg ccacagctgg cagaaccaag agtcaattgt ctctgaagaa 2340
atgcatattt caaagatgta acctgggcat tctgaatgaa ggcgaagcaa gggtccgcca 2400
ctgcgcttct acagatactg gatgttttat tttgattaag ggaaatgcca gcgtaaagca 2460
taacatgatt tgcggtgctt ccgatgagag gccttatcaa atgctcactt gtgctggtgg 2520
gcattgtaat atgctggcta ctgtgcatat tgtttcccat caacgcaaaa aatggcctgt 2580
ttttgatcac aatgtgatga cgaagtgtac catgcatgca ggtgggcgta gaggaatgtt 2640
tatgccttac cagtgtaaca tgaatcatgt gaaagtgttg ttggaaccag atgccttttc 2700
cagaatgagc ctaacaggaa tttttgacat gaacatgcaa atctggaaga tcctgaggta 2760
tgatgatacg agatcgaggg tacgcgcatg cgaatgcgga ggcaagcatg ccaggttcca 2820
gccggtgtgt gtagatgtga ctgaagatct cagaccggat catttggtta ttgcccgcac 2880
tggagcagag ttcggatcca gtggagaaga aactgactaa ggtgagtatt gggaaaactt 2940
tggggtggga ttttcagatg gacagattga gtaaaaattt gttttttctg tcttgcagct 3000
gtcatgagtg gaaacgcttc ttttaagggg ggagtcttca gcccttatct gacagggcgt 3060
ctcccatcct gggcaggagt tcgtcagaat gttatgggat ctactgtgga tggaagaccc 3120
gtccaacccg ccaattcttc aacgctgacc tatgctactt taagttcttc acctttggac 3180
gcagctgcag ctgccgccgc cgcttctgtt gccgctaaca ctgtgcttgg aatgggttac 3240
tatggaagca tcatggctaa ttccacttcc tctaataacc cttctaccct gactcaggac 3300
aagttacttg tccttttggc ccagctggag gctttgaccc aacgtctggg tgaactttct 3360
cagcaggtgg tcgagttgcg agtacaaact gagtctgctg tcggcacggc aaagtctaaa 3420
taaaaaaatc ccagaatcaa tgaataaata aa 3452
<210> 37
<211> 21483
<212> DNA
<213> Human mastadenovirus B
<400> 37
ttggaggctg tgattggtcc tcatagaact tgatttcata ggggtggtaa tcttccggag 60
caaacttgcg caagtaggcg gaggtccaca gtcccggggt cagttttaaa ctttgcccag 120
gagaagaccc atcgccttgg ctgctggggc cttgcaattc aaaggtgcct attatctggg 180
tttcgctcat caactggggg ttgcaagcta gggaccggtg gggcgtgcac agattgcagc 240
ggcagtgaca ctccagcaag ccgtctccgc tcacatcctc gatcacatcc gagtggtagg 300
agagatagtt ggccagacgg aacaggtagc agtgactcca tagcggcggg gggcactcgc 360
ggtaggtgag aggcacaaag tcggagggca gtgcgcagca ggtggcgggc aggataccgg 420
agcgttccag gatgaaagag cgaaaattgt taagcatgct ctggctcata aagtcaggca 480
atccgtttcg caaagtaacc ctgagacgct ctgggaagat gaggtctgcc aggtcggaag 540
cgacggtgcg ctcgtcgaac cctgtccaca gaaccttaag agatttctgt aagagcttgt 600
caagctcttt caagttctgt tcttctaaac attgctgcca tacacccatg ccggtttgcc 660
acgtgtggca caggtacaga tagacacaat cgcggatgta atcacggcgg gcttccccct 720
tcagggtgct gtgcagcacg ctttgtccta ggcgattctc atgcagaata cccatgtagg 780
aaaccaggtt ggtgagttcc acgttagata tcttgcatgc ctgccgcaca aagccgtgtc 840
taaaagtgta gtgcagattc tcttcgagtt tgcgcaaggt ttctgaatcg gtaaagaaac 900
gtcggagaca ctctagttct acggtaacca gcaccacggc catcataagc ttgcgacgct 960
cttccaaatc cctgggagag tcggtgccca gccatcgggt tagctgctca tcactgacca 1020
ctggtttacc ctcatcacag gcatctgggt catgcatgtc ttctgaaagg ggacttgcgc 1080
gcttaatgag taactggtcc atgaccgccg tcatgacttt agggggcagg ttgacagcgg 1140
gatatgcgaa gtgtgtgacc tcgatgcttc gcttgagtac tgcgagtctg gcattatcgc 1200
cttccaattc caccagaacg ctgtgatgct catccatgcc attttctccc ttttgcagag 1260
catttgcggc ccgagtctca ttattgccca gaccctcgaa gatctttgga acctcttcca 1320
aggaagctat atcaggtaag cgtgaaccag gtcccagatt gagtagggca tcggcgcggg 1380
tgcgattagc gcggcaggag actggaattt tttgattttt aaaaaagatg tgataggtag 1440
ccagtacttc tggcacagca aaagctggat aaaagtttaa gcgaggattt ggctcgcagg 1500
tgccgtttgg ctgacgtttg gggggagtac gaggtgaaaa gaggttaagc tcgtaggcgc 1560
ggctgagctc ttccacactg atgggcactt cagttctgtc caataatgca tccttgacta 1620
tgagcgactg tcttgctaga tgtttaagga gcgcgtcttc cccgtcaagc cctatgaggt 1680
agtcggtgtt ctgatcccta tttccagcat cttggtgata gttatctgct cgttgttttg 1740
ggcagttttc atcctctctc tctagaaagc gtttcaactc ttcctcgtgt tccaccggtg 1800
tcacatagcc cgggtcttgc tcgatgtctg tctcagactc tttcgctttt ttattctgca 1860
tgtcatgaga tgcgtcgacc tccttatctt ctagggtaga ggtggtggca ggactgggcg 1920
gtggaatgct taagctctgc tccttttcct cgtcgctgag gacgagatgt gatggcactc 1980
gtggcgatgt tgacagcaat ggctgagttt ccatgtctgt tgtttctctg cctaggagaa 2040
cacaatggcc agccgcgaag gaaatcagtt aagcgaccgc cacagggagc acacccccga 2100
acgcggaagg ggttctgcca gtcatccgcc ttccaggtcg gaccgcagcc cttcgcaatc 2160
gcctccacct ctgcccccga agagaaacac ctgtcgccgt gtggggtcag gttcttctac 2220
cgacagtcag ttggtaatgg tgagcgaaac gtcacaatcc tccctgtctc cggaacggag 2280
cgacagtcct cctcctccga taccccccaa aaagaagcca aggaagacca aacatatccc 2340
catgcaagac atcagtcaag acagcgaaga agaaagagaa gaggcgcaac ttgtagcagt 2400
gggtttcagc tacccgcccg tgcgcatcgt tgagaaggat ggcaaaagaa gcattgagaa 2460
gatcgctaaa gatgaccctc tggctaaagg agctgctgcc tgcactgtta agaatccgat 2520
tagcttgccc ctggtgtctg cttgggagaa aggcatggaa gtgatgtgtc tgctgatgga 2580
gaagtacagg ctggataacg aacttagaac ctcttttaaa ctaatgcctg agcaacacga 2640
acaatacaag cgcatctgtc accagtacgt aaacgaggag caccgaggca tccagttaac 2700
tttcactagt cacaagacac tgagcacgat gatgggaaga tttctgcagg gaatgataca 2760
ttctttttct cagatcgccc accataattg ggaatgtaca ggctgtgcgt tgtggcctca 2820
tggctgcaat gattatgagg gcaagctgaa gtgcctgcat ggcaatatta tgattcagaa 2880
ggagcagatt atcgagatgg atgtggccag cgagaacgga caacgagcct taaaggagaa 2940
tcccgagcga accaaaatca cccaaaaccg ctggggcaga agtgtggtgc aaatagctaa 3000
caatgacgcc cgctgctgtg tgaatgatgc cggctgtgca gctaaccagt tttcgagcag 3060
gtcctgcggg atgttttata ccgagggtag taaagcccag caggctttca agcaatatga 3120
tgctttcatg agagccgtgt atccaggaat cagacaggat caggccaaga tgatactgat 3180
ccccctgcac tgcgattgca accacaagcc taattgggtg cccgccatgg gtaggcagac 3240
ctgcaagatg accccgttca gcattgccaa tgctgaagat ctggatgtgg gcatgattgc 3300
agatcccacc gtgctggcaa gcgtgagaca tccgtcgctg atggtgtttc agtgctgcaa 3360
tccggtgtac cgcaactctc gcgctcaaag cactggtcct aattgtgatt tcaagatttc 3420
ggctcctgac ctgcttggag ctttgcagct gaccagaaag ctgtggagtg acatcctgcc 3480
cgatataccg gttcccaagt tggtgattcc cgaattcaag tggcaaccca agtatcagtt 3540
ccgcaacgta tcactgcctg cgggtcattc tgattctcgt cagaacccat tcgacttgta 3600
aataaataag taatgcagag ccttgataca tgtaaaaaaa taaagtgatg tttattgaac 3660
acgttgttta catgagtcat tattgaacat ccatacggtc gaacgcagtg gccctttcga 3720
tgtgtgtacg atgggagcga aaataaggcg aatgggtatt aagaaaatgg tagagtgctt 3780
tttgattgtc acacagggtg ggctggactt taggagaatg aagcatgttg tttggcactc 3840
cagttagcaa tttcatggtg gggtttccgt ccatgggacg gtcaggccag tgcacaaagg 3900
cgtgaaggaa catgcagcag aaaagtccgc aggcggcaga acggggaccc tgcacggtct 3960
gggtagattt ttccagcgta atacagcggt ccttggtagc aagagcgctg cggcgcagga 4020
gaccctcata ttcaaactgg taaatctgtt tgagacgatc atccgagaat ccaaaaggat 4080
caaaaaggta gcaggtgtta gaacgtgggt tccaaccgaa agccaaccag tgctctcccc 4140
ccgtctcacg tccggccgta tttacaatgg cacaggcgag cttatcgggg gccatgaacc 4200
ccgggaagcg cttatcgtag gttcccaaaa aatagggtcc gcaacccagg tcttggacaa 4260
tggctctgag ctcttgctcg ctggagccgt tttgggatcc gcaggccatg gttgcagctg 4320
ctatttgcaa gaagcaagaa gcttcttacg tggtagcgtt accggccgag aacggtgtac 4380
gcaggtagac tgcctcgatg atgccgcggt gtggctgatg cactctgacc acgtcgaaaa 4440
cttcgaagag aagataaagc agggtgggct catccatggg atccacctca aaggtcatgt 4500
ccagagcatg agctgagttg gcatagagca tattctgtcc caagtctgta agggccccca 4560
tagacatgaa gttgctcgag aacggtatgc gccacatggt tctgtcacac aagaactttt 4620
tctgcgtaac actatttacg gcagttgttc caatgagtgg atagggatag ttagcgggat 4680
agggttgacc ttggcgcatg gtcggagcca tgtaacccac aaagccagag ttgttgtgtt 4740
ggtagggtat ggcgacggcc ttgaagtctt tgtaattgac ctcatcaacc acctgcctgc 4800
tcatgggctg gaagtttctg aaaaatgaat acatgcgatc tttgtatcct tctggaatgt 4860
agaagccctg atagccgatg ttgtagttgg cgagcatctg taccaagaac cagtctttgg 4920
tcatgttgca ttgggctacg ttgtagcctt cgccatccac agtgcgcttt atttcaaatt 4980
cgttaggaga tagtaacctg tcatttccag gccagctcac tgaagagtca aacatgatgg 5040
aaaccttctt aaaagtgtgg ttcaggtaga aggtaccatc caggtaggga atagaaccag 5100
aatagacaaa gtaggggtca aatccagacc ccaaagaggg agtttctttg gttttcagtc 5160
tggtaaatga ccagcctctg aaagccgccc agttgcgaga aggaatggaa atgggaatat 5220
tggttgcatt ggcaggaatg gggtagagca tgttagctgc agataggtag tcgttgaatg 5280
actgatcatt ggtgtcattc cgcagcatgg cttcaagggt ggaagcggtg ttgtgagcca 5340
tggggaaaaa agtagcatag aggttgatgc tcgtgaaact gatgctggcg ccatctaccc 5400
gcaggtcgtt accgagggaa ctctgtagaa ccatgttcac atccttccta aagttccact 5460
cataagtgta ggagcctggg agaagcagca ggtttttaac agcgaagaat ttttgaggca 5520
cttgtatgtg gaaaggcaca taacgtccgt tacccagaag catggatcgg taacgcaagc 5580
cagcgttacg gtggtggttg aatgggttga cattgtccat ggcatccaga gaccacctgg 5640
caccaatgtt cacataggtg tctactagag atggcggcac cacccgcccg ttcatgtagt 5700
cgtaggtgtt tttgttttct ggaagagtga cattggacgg ggtgtatttg tacgagtctg 5760
ggagatatag agccacattg gaataaagga aacttcgcca tagattggct tgaaggttaa 5820
tttccatggc aaacaaatta ccctgtccga tctcacttgt tccatttact tcaggttcct 5880
tccaattagg cgcattgtct ccatttggaa ctattgattt gtaactggtt gttggaacac 5940
ctatgccgtc cagtggaaaa cagtagttgg gaagttcatc ttccacacca tgattttcaa 6000
taacacgtac atcaggatca taactgtcca cagcctgatt ccacatgcta aagtatctgg 6060
ttctgtcgcc cagagagtca agcaagagtt ggtaagaaag ttctgtgttt ctgtcctgca 6120
agtcaaccac tgcatttaac tgagacgctt gaccagccag cacccccatg ttaccagtac 6180
tgttatagta cataagtcca ataaagttat ctctgaagcc aatgtagttg ggtctgttgg 6240
gcatagattg ttgtcccaaa ttagcttcgg aacttgtgtc ttctgttcca ggtttgtaca 6300
ctacatgagt gtctggagtt tccaaattta cattttctgc atacatgaca attttaggac 6360
ttaagtttgt tttctgcgat gccgcatcaa aaaactccat gtcgatatca tattcgactt 6420
tctgatttgg ctgctccgtt gttttttgtt ttgcctgacc gcctttcaca ttagtaggtt 6480
tggcaaagga cccgtagcat ggtttcatct tagtatcggg tttgagagcc ctgcctccat 6540
acttttcggt ttttccatca aggtcagtcc aagtttcatc tcccagctga ggttctggct 6600
gatatgtttt atcagcataa atcggtttac tttcttcatc tgaaacttcc aaacctactg 6660
ggagtccttc ttttgtaatt tcagcttcag cttttacagg agcattgcca aaagtgtaag 6720
tagtagtatt ggtttcctct tctgttacgt gttcctcacc agttgtattt tttacacctt 6780
ctgcaatcca ctgagatgta tttggagcgc ctttaggagc cagggagttg taagccgtac 6840
cagaataggg tttgaaactg ggacctctgt ccaacacacc cctaatgtca aagaacgtgc 6900
tggccatatc cagcactctg ttgtcgccca cggccagggt gtaccgcact ttgtaagagt 6960
atgtattgtc ctcccggtca acgggcacga agcgcaacat gagccgctgg ctacggtcgg 7020
tggtcacatc gtgggtcggc gctacggtgg gatttctaaa cttatttccc agattgaagt 7080
aggtgtctgt ggcgcgggcg aactgcacca gacccggact caggtactcc gaagcatcct 7140
gtccggcgat gtgcatgtat gcccattggg gcagcatcga tggggtggcc atcttgaaag 7200
taactcagcg tcgacgcacg acctcttcct tttttcctct gctgctgtga cggcgtgtaa 7260
tgacacatat acacagatag gcaagttaag cgctactcca tatttaatta aaagcagcga 7320
cggcgtttta cactttgcac gcctagaccc acgatgctgt tcagagtatt ttgccagtgc 7380
gcatttggac gaggagcgcc cccgggacgt gacctggcta cggcgactgg tttcggggca 7440
gcgacaggct tagaagcggg tacagcagta gcagcagggg gagggggcaa atccaaggtg 7500
acgggtcgat gcaactgaga aggtttcatc accccggtgg ccattggggc tatcggtcta 7560
gtggtgggca ttccaagctt cgttgcttcc tcataagaag gcggttcatc tacgcgcgtc 7620
accagcgtct cttccaaatc gggacgcgga cgcttgtcgc ctcgtttttc tggcggagga 7680
atttcttcct ccacttgcat ttcacctggg gttgctggcg gcgggtccaa acgactgttt 7740
atctttttct gcacagcctg gttagccaaa tctaccactc cattgatgcc ggaagctatc 7800
ccatcgacta ctttttgttg gaagttctgg tctttaagtt tatttctaag cgcctgtcct 7860
gtactgctgt tccaagcttt gttcccgtat gtttttatgg ttgagccaaa atttttaagc 7920
ccgctccaga tactgctcca attgaaggcg cccccgttca gttggctcgt gccgatgtcg 7980
ctccaggtgc ccatgtacgg cttcgtgccg tgtcgcggag ccaaggatga aaaattgatg 8040
tcttccatct ctaagaaaac atagtcacag gaccaggagt gtcagagtcc attgtatttt 8100
ttttttttta tttatacgtt tttttccaat gtcaatgtcg ttgcgaggcc tgaaccgcca 8160
cggaagctat gcctggtatc gcgccaattg cagcagcgat aattggaatt aaggctggta 8220
aaaaaccacc ccgcaattgc ttgcggatag cacgccgtcg cctgtagcgt cgcattccgc 8280
gtcccaacat ccctcttcta cggcgcgagt ttcttcctcg gtaaccagtg atgggaacgc 8340
gaaggcgaca agtgagggcc atatctgcaa ggaggcagcg gcaacattga ttaagtgatg 8400
atactcggat ggtaacgcgc acgcggcagt gtcaaaggtt ccgcactacc attgcggtac 8460
acttgccgca ccagggcgcc gggagtcggt ttgcttgtgc gtctacggcg acgactgcga 8520
tttgcaggtg tcttgcggcg acggcgggag gtactgtttc ggctgcgata gtagcgagtg 8580
cctcggtaac caggagtagg aataatagat gggtgtacaa cataattggg catcaacaga 8640
cttgctggac cgtactttcg tcgggatctt cgagtgggac cggcggcgtc agttgtaata 8700
ggcatgggca tccatggatc cgtttgcact tcagtggagg tggcagtagg ctttgcgggt 8760
tcagtttgca cttccatact ttcagtggga atcttaatgt ctacagtttg tacccccaga 8820
ccaggcgcta cctgcttaat gggtctcact ttaacctcag gttgaatatc tggatccact 8880
tttactttct ccaaaacgtc ctccaacttc tggcgtttgg gtaccatcag ttgcatagtg 8940
ggatacaaat cttcaccttc gcgtttaaca cctgttcgcg gagttacggg taacacttgc 9000
tgcaaagtga ccggtttaag actaggggtg ggatttccat gatccaaggg tatcgacact 9060
gtctcatcct tggaagttat tctactacgc ttgccataag caaactcgcc taatcggtca 9120
gccgcctgct caagaatatc atcatccccg tacacctcat cataggaacg cttaaaagta 9180
gcgcttgaac gctcgccggg tgtaaagacc accgaagttc caggtctcaa cacatgtcga 9240
actttgcgcc cacgccattg cacgcgtcgc cgtggggcaa actcgcgcac aaactccgcc 9300
agcccatcat cgccatcttc ctcttctttt ttgtcctttt taacccgctt gattttgcgg 9360
ggtttttttt catccttcaa cggttggccg tagacttcag gtgcgataac ctgcagcatt 9420
tcttccttgt atttgcgctt ggacatcctc gccgctggga cacaacatcg gagactgctc 9480
agtatcttct aagtgcgagg gggacgggtg cgcacgggta cacgttgacc ggtggcagcg 9540
tcacgcaccc agtatacatt gcctcttcgc gattgggcca tgtcggcaat agtcgccgct 9600
gcgacagcgg ctgcttgcct gcgggacctg ccggcgctgg cgcccgaagc tgcacgtctg 9660
gccgccctaa gcatggctct tcgccccacg cgtctagctc ttcgtagcag agctcttgcg 9720
gctcgcatgg cagtggtagc tcggtggcgt ctggcaatgc gccttcgccg gctcttacgt 9780
cgagcatagt tgcgagcgtc agccactaca ctgtcaataa ctgcatccac agtagatgta 9840
ggcgcagtag gagtataatt acgggcgtcg gcaaccacct gatcgattac atcatcgacg 9900
gtggttcgaa cgcgagtgcg gcccttgagg gcgccccatg gagcgcgaaa atgtccgcga 9960
acacggacag gatgttgggt agaacgtttg cgtgcgcctc cgtacatctt gcttggagcg 10020
cgcagacccc aaccggtgtt attactgggc gagataagaa tggacatttt tttttttttt 10080
agaaagtgcg gcttgaaagg acgcgcggtg cgactatgcc cagtgccttg tacacgtagg 10140
gacaggtgcg gcgtctggcg tcagtaacgg tcacacgttg gactccccgg atactgctgc 10200
gcaacggcag ggtcccgtga tctgtgagag caggaacgtt ttcactgacg gtggtaatgg 10260
tgggcgccgg cggacggatt aaaatctggt tctcaggaaa gcggttgaag acgtgcgtaa 10320
gcgaggtgga ctggcggagc tgctgggagt acacagcttg ttcgttgtag aagctctttg 10380
agaagacggg cataagctct gcacccacca cagggtagtt actgacttgt ctagtggagc 10440
ggaaagtgac aggatccttc atcatgtctg gaagcgacca gtagacctgc tctgctccgc 10500
aggtgacatc tgaggtggtg agcaatgtcc aggaacgcac tcctttttcg ggatcgccat 10560
aattgtacga aagataccaa ctgcgatagg ctgtgttgat tttgtcttcc aacacattat 10620
agcttctatt cttactatct ttttctacag gttgaatagt gagtttcacg tccgttcctt 10680
cagacacatc ggccaataat gattctgcag tcggaacagg tgttggcgca aaattgtctc 10740
ctctgacctc tccagcgtta gcaacccttg tagagtcgct ggcaactatg tttgccttag 10800
cttctgcagc agctgtagca gcttctattt tggctttttg ttctttctta ctgttctcat 10860
aggcatctac atccaagagg gccggaatat taccaccttc taaatcttca tacaaaatct 10920
taaaaccctc ttgaaatggc tgtttttttc tgataccaag aaggttgctc aaacgactct 10980
cggtaaaatc cactccgcag ccaggcagta agacaatgtc aggatggaag gcttcatacg 11040
tatacactcc aggcatgatc aacttggttt cgggatccca tcccagcttg aagttcctgg 11100
tgtcgaactt aacaccaatg tcactttcaa gcactccatt ctgtctaccc actttcaagt 11160
aattatctat gatggcattg ttcatcaaat caatagtcat agtaactgaa aagttgcctt 11220
ctggcaaagt aaactcgaac cactcatatt tcaaaatatc ctgcttgtga tcataagtat 11280
ccccaactgc agcaccgtcg ggaggttttc tggacaccat cacacgcgct ttgaacttgt 11340
tactaaacat atactcgttc acgtttggca tgttagtatg catgatggtc tttagctgac 11400
cgccccaccg cgatcgttca tcaaagttaa tggtctgggt gctggcttcc gtaggggtaa 11460
agtcattgtt ttgcaccacc gtggtcaaga agttgctgtg gtcattctga tagttcagag 11520
aagcaatgtc cgccgacttg ttgtccacca gatacaacct ggtggtatcg tactgaggtg 11580
ccagttccga ataacgaatg ctgtttctgc cctccgtagg tgccaggtat cgcggaggca 11640
caaagggagc ctccagtggg gattgcatca ccgccgtcgc ctgctgctgc tgcatcacgc 11700
tctcgtacga aggaggagga ccctccggat acaccaccgc tccgcctagc acgactcgcc 11760
tcattatact agacacagat aataaagaag aacgaacgta cgctcgtcgc catggccttg 11820
gtgagttttt tttttatttt tttttacaac ataccaccca agcgagggcg caaatgagca 11880
aacgggttgc cccttcctct cccacccaag tccagcacgc tgctatcatc ggccgaatcc 11940
tcatcgtccc acacaagacc cctctgtctg tcatggcgct ggcgtctacg gctcgctcta 12000
cttgtaatcc ccatgatccc aggctcgtct ctgtgatcct gagcataagt cttccatcta 12060
ctcattttat ccaccaaact ttctattcca ttgtttggga aatttttttc tcttgccggt 12120
ctgagcaagg aatcgtttag atactcctct tcgcccatta aactcgggcg acttattcta 12180
cccacttcgc tgctacgtac actgtgtaga gaaaagggta gactaggaaa aggacttgca 12240
gactcgggct cagccgcggt agcacccatg accccggaca gcgatgcaga agaatgcatt 12300
ctatcgccgc cttccttttt ccacgtgcga tgatcagaaa gaggtgaaaa aacatcgctg 12360
tccacgtcgt cccacagaaa tccgtcatta gggtcgggca tgtcatattc gcccgtgtag 12420
aaaccaggtg ggggcagcca gtgcgggttt aagatggcat tggtgaaata atcagagttc 12480
atagcggcag ctctgtgcaa gtagtccagc agtttgttaa tgaaaggtcg gttactggca 12540
tacatgctgg gctccatatt tcgcgctgtc atgtccagtg ctgcagtcgg agttgccccc 12600
tcttgcatca gaaacaatcc cacgctctgc tgcacatatc taaggatcct ctcctcctcc 12660
gcagtaagag catattgagg agggatcttt tgagaccgat tggtaagcaa gaagttcaga 12720
gtggcttcca aactgccagt gtcttcctgt cccaaagcgc gactgacttg ggtaatttct 12780
tgataggtct gctcgtccac ctgactttgc cctatggctt cgcgatacag gtttagtagg 12840
taacccaaat aggaattacg gtcgatgcta ccgctgtcgg tgaaaggagc taccaacagt 12900
aataataggc gggagttcgg agttaacaag ctagacacgg ttgctctttc tcctaccggg 12960
gcatgcactc cccacaaacc tttaaggttt ttaaaagctt ggctcagatt taccgtctgc 13020
aagccctgtc tgctagtctg aaagaagtaa tcaggaccgg actgatacac ttcgctctga 13080
ggtacttctg ataccatcag tctcaaagcg cttaaaaagt tagtataatc ctgttgacca 13140
cgcggcacat tagcaggctg agtactcaag aaagcattta acgccaccag cgaacccagg 13200
ttggcatcac gctggaacct ttcgcgctga gacacggctt cgcgtacatc tgttatcata 13260
cggtccaaat tggtttgcac attgctactg ttgtagcgag ccacgcgttc taagagagcg 13320
ttgtatacca gtccggcctc atctggacga atagctttgt tctccaccaa cgcgttcacg 13380
atggccagga ccttctcatg agtgggatta gagcgggaag gcactacagc ttccatgatg 13440
gccgatagac ggttggcctg gggttgctgt ctaaaggctt cggggttgcg agtcgtcaac 13500
gccatgatac gttgcatggc ctgggtccaa tcgtccgagg agttaatgcc ggacggctgg 13560
ctctgcagcg ccgcccgcat tgcgggatcc ggtgcttgct gttccatcta gcaaaaaaca 13620
cgggttgtgc catcagtctt ccaagtactc gccctcttcc tcctcgcctt catccgcctc 13680
ttctatgtaa ggaagctcac atcctgccgt cgcggcgctc agagccctgc gactaggctg 13740
ccactgcaag tcagctccca tgtcgaagta attctcaccc tcggttccag ctccagtcag 13800
agctctttgc aaactgtgca tcagttccct gtcgcttaac tcgcgcctcc tgctggcgct 13860
aaccgcgcga tgcattctgt cattgcgata caccccaaga tcatcgctca gggtcaagac 13920
cttgagcgtc atgcgcatgt agaacccatc tatcttcacc tccttgtcta tgggaacgta 13980
tggagtcttg tagattttgc gagcgtaata ttttcccaag ctcaaaaccg agtaattgat 14040
ggcagccacc ttctcggcca ggcccaggct ccgctcctgc actatgatac tctgtagaat 14100
gttgataaga tcatacaacc atctcccctc gggttcggtg atgttcagca gcgcctctct 14160
gaaagcctca ttgtctctgc tgtgttgcac caccagaaac agctgggcgg tcagaggttt 14220
gctagtaggg ttctgaatga tagcttccat caaatcccac aaatgcatca aaccaagggt 14280
aacttcttcg cgggcaatca gggttcgcac atgattatta aaagactttt ggaagttacg 14340
ctcttccttt actgtctgct cgtaagccga tacaaggttg gctgcagcca cgtgtgccct 14400
ggcaggactg atccctgtca tttcatcaac ttcgaaatcc tcgtcccgca acactcgtct 14460
tcggtccaaa ccgtgacgca gctcacgacc cgcgttaaag cgggaagctc gcatctcctc 14520
cggctcctcg ccgcttctgt ctctaaatag gttctgttgg ggcacatacg cctcgcgaga 14580
atcttttttc agttgaactc gcggatgccg ctcgggtgaa ggcgcaccta gacgtgccag 14640
tccttcgccc tcttccaagt ccagatcata ggcgggctgt cccgcaccgc tcacggcggc 14700
agttgcagta gttgcaggga cagccttttg tgattgctgc tgctgctgct gcgagggggg 14760
ctgttgttgg gggcgcatct gtcgcagcac gggatgcatc tgagcggcaa aaaaaaaaaa 14820
taggactcac ttccctgcca ttcggaaacc agcaaaacga ctcgattccg tatcctggat 14880
ttttgtaggc tgggtcgaga cgggagtgcc aataccacgt tagccgcggc tccggccggc 14940
tcgagtacaa gtctcgaacc ggggtacacc gcgacccaac ccgttcacgt tcctccaggc 15000
tacggagtcg agtcgctgaa cgctttcatt ttctccgtgt ctatagagca tcaatgactg 15060
cgcgcgcctc actggtcaaa ccgtgcctac aatgaactac ttcatgccgc tacgcaacat 15120
ttggaaccgc gtacgcgagt ttcctcgggc ttctactacc gccgcaggaa tcacctggat 15180
gtccaggtac atctacggct atcaccgcct tatgttggaa gacctcgccc ctggcgctcc 15240
agctacagaa cgatggcctc tctaccgcca accaccgccg cattttctta tagggtacca 15300
gtatctggtg cgcacctgca acgattacat ctttgacacc cgcgcctatt cgcgccttaa 15360
atacaccgag ctcgtgcgcc ctggtcacca gacagttaac tggtcagtca tggccaactg 15420
tgcttacacc attaatacag gagcttacca ccgctttgtg gattttgatg actttcaagc 15480
cacccttacc caagtacagc aagccatcct cgccgaaaga gtcgtagctg acttggcact 15540
ggtacaacca atgcgcggat ttggactcac acgtatgcat ggcagaacgg gtgaggaaga 15600
agtgcccgta gaacggctca tgcaagacta ctacaaagat cttgctagat gtcaggataa 15660
tgcttgggga atggccaatc gcctgcgtat ccagcaagcc ggacccaaag acctggtgct 15720
cctcgccacc atccgccgtc ttagaactgc ctactttaat ttcatcacca gcagcatcgt 15780
ctcaccttcc cgagatgaag aagaaacaga agacccagac cgaacacata accacccccg 15840
cccacaagaa gccgtactca gcctaccttg tgactgtgac tggttagacg ctttcgtcga 15900
aaggttttca gatcccgtgg atcttgacac gatcagatct ctgcgtgcag tccctacggg 15960
ccaattaata aaatgtataa tcagcgccct ctccctccca aacggagaac ctcccagtca 16020
ccactttaag gagatgcgcg gcggtgtttt tactctgcga ccgcgcgaga acggccgcgc 16080
cgtcactgaa accatgcgcc gccgccgcgg agaggtcatt gaacgattca tcgaccgttt 16140
gcccgtgcgc cgtcgacgtc gccgcgtgcc ccctccgccc ccgcctgaag acgaagaaga 16200
gatgttagtg gaagaagaga tagaagagga agaagagatc ccgggagcct tcgaacgcga 16260
agtacgggcc accatagccg aactcatccg tcttctcgag gaggaattga ccgtgtccgc 16320
gcgaaactcc cagtttttta attttgccgt ggacttctac gaggccatgg agcgcttgga 16380
agctctgggc gatgttagcg aaatgccgct gagacgatgg atcatgtatt tcttcgtcgc 16440
cgaacacatt gccaccacac tcaactacct ttttcagcgc ctatgcaact atgcggtctt 16500
caccagacac gtggagctta acctcgctca ggtggtgatg cgcgcaagag actccgaggg 16560
ggccgtggtt tacagccgcg tctggaacga ggcgggcatg aatgcattct cccaactcat 16620
gggccgtatc tccaatgacc tcgcggccac cgtcgaaaga gcgggtcgcg gagatcttca 16680
ggaggaagaa atcgagcagt tcatggcgga gatcgcctac caggacaact ctggtgacgt 16740
acaagaaata ctgagacaag ctgccgttaa cgataccgaa attgattctg ttgaactctc 16800
tttcaggttc aagctcacgg ggccggtagc tttcacccag agacgtcaga tacaagacgt 16860
caatcgacgc gtggtggcgc acgcaagtct tctcagagcg cagtaccaga acctgcccgt 16920
gcgcggcgcc gacgtgccac taccagccat gccctcgggt ccggaacaac cgctgccgcc 16980
cggcgcgcgt ccccgtcacc gcttctgagc atgcaagaag caagagagcc accaccgatc 17040
aaaagaaaaa acaaaggtac ggtagtggcg cccaaaggac acggaaccct gcaagccatt 17100
gacgtctcta caaacgaacc tgtggaaatc aagtaccatc tgaacctccc gcacgccctg 17160
gaaaagatca tgcaagttaa tcttctgtcc ctacctacta acctgagtcc gcagcgtctc 17220
aggactctgg acagctccag cctgcgcgct ctcgtccttc agctccgccc ctcccgcgcc 17280
gaggtctgga cttgcctccc gcgggggctc gtcagcatga ccaccatcga aacagaagat 17340
gaacaggccg atacagcgaa tatagaagag cacgagatac aatcgccagg cctcggcttc 17400
ccactgaaat ttctcgtcaa gggaagccag gtacaactca ttcacgagat acaacccgtg 17460
caacgctgcg actactgcgg ccgtctgtac aagcacaaac acgaatgctc ggcgcgccgc 17520
agaaacttct acttccatca catcaacagc caatcctcca actggtggca ggaaatccag 17580
ttcttcccga tcggctctca tcctcgcaca gaaagactct tcctgaccta cgatgtggaa 17640
acttacacct ggatgggatc ctttggcaaa caactagttc ctttcatgct ggtcatgaaa 17700
ctctcaggag aagagcgtct cgtcaacatg gcccacgatc tagccattaa actcaagtgg 17760
gatcgatggc aacaagaccc cagaaccttc tactgtgtca ctccagaaaa aatggcaatt 17820
ggccggcatt ttcgtcagta tcgggaccag ttacaaacag cactggcggt agatctttgg 17880
tcatcattcc tacatgcaaa tcctcacctg cacgaatggg ctctcgaaca ctacgcctta 17940
tctgacccca cagacctaac ctttgatgag ctcagtaagc tacctcacgt cagaggcacg 18000
ccgcgtttca tagaattata catcgtagga cacaacatca acggtttcga cgagatcgtc 18060
ctagctgccc aggtgatcaa caatcgagcg gaagtaccac agccttttcg catcactcgc 18120
aattttatgc ccagagccgg taagattctc ttcaatgatg ttactttcgc tttgcccaac 18180
cccgcctaca agaaacgggt agacttccaa ctctgggaac agggagcctg tgacgacatc 18240
gacttcaaat accaatttct caaagtcatg gtcagagaca cctttgccct tactcacgct 18300
tcgctacgaa aagctgctca agcatactct ctacccgtag agaagggctg ctgcccttac 18360
aaggcagtta atcagttcta catgctagga tcttaccgtg cagacaaaga cgggtttccg 18420
ctagaagagt actggaagga tcgcgaagaa taccttctca accgcgaact gtgggaaaag 18480
aaaaaccaac caggttatga catcattcaa gaaacacttg actactgcgc cctagacgta 18540
cttgtcaccg ccgaactggt aaccaagctt caagaatctt atgcccactt tgtcagagac 18600
tctgtaggtc tacctcatgc ccatttcaac atttttcaaa gacccaccat ctcttccaat 18660
tctcacgcca tctttcgcca gatcgtctac agaacagaaa aacccaatcg caccaacttg 18720
ggtccggggc tgctagcgcc atcacatgaa ctatatgact atgtgcgagc aagtatcaga 18780
ggggggcgat gctatccaac ctacataggc atctttgagg atcccatcta cgtctatgac 18840
atctgtggca tgtatgcctc tgcactcacc catcccatgc catggggcag tccccttaac 18900
ccatatgagc gcgcactggc agctcgagaa tggcaaatgg ccttagatga ccccactccc 18960
atcagctatt ttgataagga tttacttccg ggaatcttta ccatggatgc agaccctccc 19020
gatgaactta tgctagaccc acttccccct ttctgttcta ggaaaggagg taggctctgt 19080
tggaccaatg aaccccttcg aggcgaggtg gccaccagtg tggatttaat taccttgcat 19140
aatcgagggt ggcaagtgag aatcgtgcca gatgaattaa caactatctt ccccgaatgg 19200
aagtgcctgg cacgcgagta tgtccaactc aacatcgccg ccaaagagcg cgcggacaag 19260
gaaaagaacc aaaccatgcg atccattgcc aaacttttat ccaacgccct gtatggatca 19320
tttgccacca aacttgacaa taaaaaaatt gtgttttctg accaaatgga cgaaaacctc 19380
atgaaaggca tctcaaccgg cactgtcaat atcaaatcct cctcgttctt agaaactgac 19440
aacctgagtg cagaggtcat gcccgccttc gagagggaat acctacccca acagctgacg 19500
ttcctggaca gcgatccgga agacagtgag gaagagcaaa gaaccgcccc cttttatacc 19560
cccccagcgg ggaccccagg tcacgtgaaa tacacctaca agccaatcac attcctggat 19620
gttgaagagg gtgacatgtg tttgcatact ttggaaaagg tggaccccct ggttgacaac 19680
gatcgctacc cctcccacat agcctccttt gtgctggcct ggacgcgcgc ctttgtatca 19740
gagtggtcag agttcctgta cgaagaagac cgaggcactc cactggagaa gaggcctgta 19800
aaatcagtct acggggacac ggacagcctg tttgtcactc aacgaggaca cgaactcatg 19860
gagaccaaag gtaagaaacg catcaaaaaa tatggcggaa aacttgtttt tgaccccaat 19920
gaaccggatt taacctggct ggtggaatgt gaaactgttt gcgcctcctg cggcgcagat 19980
gcatactccc cagaatccgt tttccttgcg cccaagttgt atgcgctgaa atgcctatac 20040
tgcccggtat gcaagaaaac ttccaaaggt aagctccgcg ccaaaggcca cgcagccgag 20100
gcgctcaact acgaactcat ggtaaactgc tacttggccg acatacaggg cgccaagcga 20160
cagaagtttt cgaccagcag gatgagtctg aagcgcaccc tggcaagcgc ccaagcaggc 20220
gcacacccct tcactgtgac ggaaacaacc ctgactcgaa cactgagacc ctggaaggac 20280
cgaaccctgg cagcgctgga cgcccatcgt ctcataccct attccaggag ccgtccaaac 20340
ccgcgaaacg aggaggtctg ctggatcgag atgccataga acacatcact gaactgtgga 20400
acagactaga acttttgcag caaactctct ccaaaatgcc catggctgac ggtctgaaac 20460
cgctgaaaaa cttttcctca ctacaagaac ttctatcact aggaggagag cgcctcctaa 20520
tggatttggt gcgggaaaat atgcatgtaa gggaaatgat gaacgaggtg gcccccttgc 20580
ttcgagaaga cggcagttgc cgttccctaa actaccacct gcaacccgta atcggaatca 20640
tttatggccc caccggatgt ggcaaatctc aattgctcag aaatttgcta tcatcacaat 20700
taatcacccc cgccccagaa acggtgtttt tcatagcccc ccaggtggac atgattccac 20760
cctcggaact gaaagcttgg gaaatgcaaa tctgtgaggg gaactatgct ccggggcccg 20820
aaggaacatt cataccccaa tctggtactc tccgccccaa attcattaaa atggcttatg 20880
atgatttaac tcaggaacat aactatgatg tgtcagaccc acggaacgtg tttgcccgcg 20940
ccgctgccca cggccccatt gctattatca tggatgagtg catggaaaat cttggaggac 21000
acaagggtgt ctccaaattt ttccacgctt ttccatccaa gctgcacgat aaatttccta 21060
aatgtaccgg atacaccgtc ttggtggtcc ttcataacat gaacccaaga cgggatcttg 21120
gcggcaatat tgccaactta aaaatccaat ccaaaatgca cataatttca ccccgaatgc 21180
acccatccca gctcaaccgg tttgtaaaca cctacaccaa gggcttatct gtggcaatca 21240
gcctacttct aaaagatatt gtgcaacacc atgcactgcg accttgttat gactgggtga 21300
tttacaacac taccccggag catgaatccc ttcaatggag ctatctccac cccaaagacg 21360
gcctaatgcc catgtatcta aacattcaat cccacctcta taggatcctg gaaaaaatcc 21420
accgagttct caatgataga gatcggtggt ctagggcata ccgtgcgcga aaaatgaaat 21480
aaa 21483
<210> 38
<211> 3759
<212> DNA
<213> Human mastadenovirus B
<400> 38
tataaaacgc ctgatgatca gaggccgagg tatccagctc aacgacgagt cggtgagctc 60
tccgcttggt ctacgaccag acggaatctt tcagattgcc ggctgcggga gatcttcctt 120
cacccctcgt caggctgttc tgactttgga aagttcgtct tcgcaacccc gctcgggcgg 180
aatcgggacc gttcaatttg tggaggagtt tactccctct gtctacttca accccttctc 240
cggatctcct gggcattacc cggacgagtt cataccgaac ttcgacgcga ttagcgagtc 300
agtggacggc tacgattgat gtctggtgac gcggctgagc tatctcggct gcgacatcta 360
gaccactgcc gccgctttcg ctgctttgcc cgggaactca ttgagttcat ctacttcgaa 420
ctccccaagg atcaccctca aggtccggcc cacggagtgc ggatttctat cgaaggcaaa 480
atagactctc gcctgcaacg aattttctcc cagcggcccg tgctgatcga gcgagaccag 540
ggaaacacca cggtttccat ctactgcatt tgtaatcacc ccggattgca tgaaagcctt 600
tgctgtctta tgtgtactga gtttaataaa aactgaatta agactctcct acggactgcc 660
gcttcttcaa cccggatttt acaaccagaa gaacgaaact tttcctgtcg tccaggactc 720
tgttaacttc acctttccta ctcacaaact agaagctcaa cgactacacc gcttttccag 780
aagcattttc cctactaata ctactttcaa aaccggaggt gagctccaag gtcttcctac 840
agaaaaccct tgggtggaag cgggccttgt agtgctagga attcttgcgg gtgggcttgt 900
gattattctt tgctacctat acacaccttg cttcactttc ttagtggtgt tgtggtattg 960
gtttaaaaaa tggggcccat actagtcttg cttgttttac tttcgctttt ggaaccgggt 1020
tctgccaatt acgatccatg tctagacttc gacccagaaa actgcacact tacttttgca 1080
cccgacacaa gccgcatctg tggagttctt attaagtgcg gatgggaatg caggtccgtt 1140
gaaattacac acaataacaa aacctggaac aataccttat ccaccacatg ggagccagga 1200
gttcccgagt ggtacactgt ctctgtccga ggtcctgacg gttccatccg cattagtaac 1260
aacactttca ttttttctga aatgtgcgat ctggccatgt tcatgagcaa acagtattct 1320
ctatggcctc ctagcaagga caacatcgta acgttctcca ttgcttattg cttgtgcgct 1380
tgccttctta ctgctttact gtgcgtatgc atacacctgc ttgtaaccac tcgcatcaaa 1440
aacgccaata acaaagaaaa aatgccttaa cctctttctg tttacagaca tggcttctct 1500
tacatctctc atatttgtca gcattgtcac tgccgctcat ggacaaacag tcgtctctat 1560
ccctctagga cataattaca ctctcatagg acccccaatc acttcagagg tcatctggac 1620
caaactggga agcgttgatt actttgatat aatctgcaac aaaacaaaac caataatagt 1680
aacttgcaac atacaaaatc ttacattgat taatgttagc aaagtttaca gcggttacta 1740
ttatggttat gacagataca gtagtcaata tagaaattac ttggttcgtg ttacccagtt 1800
gaaaaccacg aaaatgccaa atatggcaaa gattcgatcc gatgacaatt ctctagaaac 1860
ttttacatct cccaccacac ccgacgaaaa aaacatccca gattcaatga ttgcaattgt 1920
tgcagcggtg gcagtggtga tggcactaat aataatatgc atgcttttat atgcttgtcg 1980
ctacaaaaag tttcatccta aaaaacaaga tctcctacta aggcttaaca tttaatttct 2040
ttttatacag ccatggtttc cactaccaca ttccttatgc ttactagtct cgcaactctg 2100
acttctgctc gctcacacct cactgtaact ataggctcaa actgcacact aaaaggacct 2160
caaggtggtc atgtcttttg gtggagaata tatgacaatg gatggtttac aaaaccatgt 2220
gaccaacctg gtagattttt ctgcaacggc agagacctaa ccattatcaa cgtgacagca 2280
aatgacaaag gcttctatta tggaaccgac tataaaagta gtttagatta taacattatt 2340
gtactgccat ctaccactcc agcaccccgc acaactactt tctctagcag cagtgtcgct 2400
aacaatacaa tttccaatcc aacctttgcc gcgcttttaa aacgcactgt gaataattct 2460
acaacttcac atacaacaat ttccacttca acaatcagca ttatcgctgc agtgacaatt 2520
ggaatatcta ttcttgtttt taccataacc tactacgcct gctgctatag aaaagacaaa 2580
cataaaggtg atccattact tagatttgat atttaatttg ttcttttttt ttttatttac 2640
agtatggtga acaccaatca tggtacctag aaatttcttc ttcaccatac tcatttgtgc 2700
atttaatgtt tgcgctactt tcacagcagt agccacagca accccagact gtataggagc 2760
atttgcttcc tatgcacttt ttgcttttgt tacttgcatc tgcgtatgta gcatagtctg 2820
cctggttatt aattttttcc aacttataga ctggatcctt gtgcgaattg cctacctgcg 2880
ccaccatccc gaataccgca accaaaatat cgcggcactt cttagactca tctaaaacca 2940
tgcaggctat actaccaata tttttgcttc tattgcttcc ctacgctgtc tcaaccccag 3000
ctgcctatag tactccacca gaacacctta gaaaatgcaa attccaacaa ccgtggtcat 3060
ttcttgcttg ctatcgagaa aaatcagaaa ttcccccaaa tttaataatg attgctggaa 3120
taattaatat aatctgttgc accataattt catttttgat atacccccta tttgattttg 3180
gctggaatgc tcccaatgca catgatcatc cacaagaccc agaggaacac attcccctac 3240
aaaacatgca acatccaata gcgctaatag attacgaaag tgaaccacaa cccccactac 3300
tccctgctat tagttacttc aacctaaccg gcggagatga ctgaaacact caccacctcc 3360
aattccgccg aggatctgct cgatatggac ggccgcgtct cagaacagcg actcgcccaa 3420
ctacgcatcc gccagcagca ggaacgcgcg gccaaagagc tcagagatgt catccaaatt 3480
caccaatgca aaaaaggcat attctgtttg gtaaaacaag ccaagatatc ctacgagatc 3540
accgctactg accatcgcct ctcttacgaa cttggccccc aacgacaaaa atttacctgc 3600
atggtgggaa tcaaccccat agttatcacc cagcaaagtg gagatactaa gggttgcatt 3660
cactgctcct gcgattccat cgagtgcacc tacaccctgc tgaagaccct atacggccta 3720
agagacctgc taccaatgaa ttaaaaaatg attaataaa 3759
<210> 39
<211> 978
<212> DNA
<213> Human mastadenovirus B
<400> 39
atgaccaaga gagtccggct cagtgactcc ttcaaccctg tctaccccta tgaagatgaa 60
agcacctccc aacacccctt tataaaccca gggtttattt ccccaaatgg cttcacacaa 120
agcccaaacg gagttcttac tttaaaatgt ttaaccccac taacaaccac aggcggatct 180
ctacagctaa aagtgggagg gggacttaca gtggatgaca ccaacggttt tttgaaagaa 240
aacataagtg ccaccacacc actcgttaag actggtcact ctataggttt accactagga 300
gccggattgg gaacgaatga aaataaactt tgtatcaaat taggacaagg acttacattc 360
aattcaaaca acatttgcat tgatgacaat attaacacct tatggacagg agtcaacccc 420
accgaagcca actgtcaaat catgaactcc agtgaatcta atgattgcaa attaattcta 480
acactagtta aaactggagc actagtcact gcatttgttt atgttatagg agtatctaac 540
aattttaata tgctaactac acacagaaat ataaatttta ctgcagagct gtttttcgat 600
tctactggta atttactaac tagactctca tccctcaaaa ctccacttaa tcataaatca 660
ggacaaaaca tggctactgg tgccattact aatgctaaag gtttcatgcc cagcacgact 720
gcctatcctt tcaatgataa ttctagagaa aaagaaaact acatttacgg aacttgttac 780
tacacagcta gtgatcgcac tgcttttccc attgacatat ctgtcatgct taaccgaaga 840
gcaataaatg acgagacatc atattgtatt cgtataactt ggtcctggaa cacaggagat 900
gccccagagg tgcaaacctc tgctacaacc ctagtcacct ccccatttac cttttactac 960
atcagagaag acgactga 978
<210> 40
<211> 273
<212> DNA
<213> Human mastadenovirus B
<400> 40
aacggagttc ttactttaaa atgtttaacc ccactaacaa ccacaggcgg atctctacag 60
ctaaaagtgg gagggggact tacagtggat gacaccaacg gttttttgaa agaaaacata 120
agtgccacca caccactcgt taagactggt cactctatag gtttaccact aggagccgga 180
ttgggaacga atgaaaataa actttgtatc aaattaggac aaggacttac attcaattca 240
aacaacattt gcattgatga caatattaac acc 273
<210> 41
<211> 576
<212> DNA
<213> Human mastadenovirus B
<400> 41
ttatggacag gagtcaaccc caccgaagcc aactgtcaaa tcatgaactc cagtgaatct 60
aatgattgca aattaattct aacactagtt aaaactggag cactagtcac tgcatttgtt 120
tatgttatag gagtatctaa caattttaat atgctaacta cacacagaaa tataaatttt 180
actgcagagc tgtttttcga ttctactggt aatttactaa ctagactctc atccctcaaa 240
actccactta atcataaatc aggacaaaac atggctactg gtgccattac taatgctaaa 300
ggtttcatgc ccagcacgac tgcctatcct ttcaatgata attctagaga aaaagaaaac 360
tacatttacg gaacttgtta ctacacagct agtgatcgca ctgcttttcc cattgacata 420
tctgtcatgc ttaaccgaag agcaataaat gacgagacat catattgtat tcgtataact 480
tggtcctgga acacaggaga tgccccagag gtgcaaacct ctgctacaac cctagtcacc 540
tccccattta ccttttacta catcagagaa gacgac 576
<210> 42
<211> 1686
<212> DNA
<213> Human mastadenovirus B
<400> 42
atgaggcgag tcgtgctagg cggagcggtg gtgtatccgg agggtcctcc tccttcgtac 60
gagagcgtga tgcagcagca gcaggcgacg gcggtgatgc aatccccact ggaggctccc 120
tttgtgcctc cgcgatacct ggcacctacg gagggcagaa acagcattcg ttattcggaa 180
ctggcacctc agtacgatac caccaggttg tatctggtgg acaacaagtc ggcggacatt 240
gcttctctga actatcagaa tgaccacagc aacttcttga ccacggtggt gcaaaacaat 300
gactttaccc ctacggaagc cagcacccag accattaact ttgatgaacg atcgcggtgg 360
ggcggtcagc taaagaccat catgcatact aacatgccaa acgtgaacga gtatatgttt 420
agtaacaagt tcaaagcgcg tgtgatggtg tccagaaaac ctcccgacgg tgctgcagtt 480
ggggatactt atgatcacaa gcaggatatt ttgaaatatg agtggttcga gtttactttg 540
ccagaaggca acttttcagt tactatgact attgatttga tgaacaatgc catcatagat 600
aattacttga aagtgggtag acagaatgga gtgcttgaaa gtgacattgg tgttaagttc 660
gacaccagga acttcaagct gggatgggat cccgaaacca agttgatcat gcctggagtg 720
tatacgtatg aagccttcca tcctgacatt gtcttactgc ctggctgcgg agtggatttt 780
accgagagtc gtttgagcaa ccttcttggt atcagaaaaa aacagccatt tcaagagggt 840
tttaagattt tgtatgaaga tttagaaggt ggtaatattc cggccctctt ggatgtagat 900
gcctatgaga acagtaagaa agaacaaaaa gccaaaatag aagctgctac agctgctgca 960
gaagctaagg caaacatagt tgccagcgac tctacaaggg ttgctaacgc tggagaggtc 1020
agaggagaca attttgcgcc aacacctgtt ccgactgcag aatcattatt ggccgatgtg 1080
tctgaaggaa cggacgtgaa actcactatt caacctgtag aaaaagatag taagaataga 1140
agctataatg tgttggaaga caaaatcaac acagcctatc gcagttggta tctttcgtac 1200
aattatggcg atcccgaaaa aggagtgcgt tcctggacat tgctcaccac ctcagatgtc 1260
acctgcggag cagagcaggt ctactggtcg cttccagaca tgatgaagga tcctgtcact 1320
ttccgctcca ctagacaagt cagtaactac cctgtggtgg gtgcagagct tatgcccgtc 1380
ttctcaaaga gcttctacaa cgaacaagct gtgtactccc agcagctccg ccagtccacc 1440
tcgcttacgc acgtcttcaa ccgctttcct gagaaccaga ttttaatccg tccgccggcg 1500
cccaccatta ccaccgtcag tgaaaacgtt cctgctctca cagatcacgg gaccctgccg 1560
ttgcgcagca gtatccgggg agtccaacgt gtgaccgtta ctgacgccag acgccgcacc 1620
tgtccctacg tgtacaaggc actgggcata gtcgcaccgc gcgtcctttc aagccgcact 1680
ttctaa 1686
<210> 43
<211> 2847
<212> DNA
<213> Human mastadenovirus B
<400> 43
atggccaccc catcgatgct gccccaatgg gcatacatgc acatcgccgg acaggatgct 60
tcggagtacc tgagtccggg tctggtgcag ttcgcccgcg ccacagacac ctacttcaat 120
ctgggaaata agtttagaaa tcccaccgta gcgccgaccc acgatgtgac caccgaccgt 180
agccagcggc tcatgttgcg cttcgtgccc gttgaccggg aggacaatac atactcttac 240
aaagtgcggt acaccctggc cgtgggcgac aacagagtgc tggatatggc cagcacgttc 300
tttgacatta ggggtgtgtt ggacagaggt cccagtttca aaccctattc tggtacggct 360
tacaactccc tggctcctaa aggcgctcca aatacatctc agtggattgc agaaggtgta 420
aaaaatacaa ctggtgagga acacgtaaca gaagaggaaa ccaatactac tacttacact 480
tttggcaatg ctcctgtaaa agctgaagct gaaattacaa aagaaggact cccagtaggt 540
ttggaagttt cagatgaaga aagtaaaccg atttatgctg ataaaacata tcagccagaa 600
cctcagctgg gagatgaaac ttggactgac cttgatggaa aaaccgaaaa gtatggaggc 660
agggctctca aacccgatac taagatgaaa ccatgctacg ggtcctttgc caaacctact 720
aatgtgaaag gcggtcaggc aaaacaaaaa acaacggagc agccaaatca gaaagtcgaa 780
tatgatatcg acatggagtt ttttgatgcg gcatcgcaga aaacaaactt aagtcctaaa 840
attgtcatgt atgcagaaaa tgtaaatttg gaaactccag acactcatgt agtgtacaaa 900
cctggaacag aagacacaag ttccgaagct aatttgggac aacaatctat gcccaacaga 960
cccaactaca ttggcttcag agataacttt attggactta tgtactataa cagtactggt 1020
aacatggggg tgctggctgg tcaagcgtct cagttaaatg cagtggttga cttgcaggac 1080
agaaacacag aactttctta ccaactcttg cttgactctc tgggcgacag aaccagatac 1140
tttagcatgt ggaatcaggc tgtggacagt tatgatcctg atgtacgtgt tattgaaaat 1200
catggtgtgg aagatgaact tcccaactac tgttttccac tggacggcat aggtgttcca 1260
acaaccagtt acaaatcaat agttccaaat ggagacaatg cgcctaattg gaaggaacct 1320
gaagtaaatg gaacaagtga gatcggacag ggtaatttgt ttgccatgga aattaacctt 1380
caagccaatc tatggcgaag tttcctttat tccaatgtgg ctctatatct cccagactcg 1440
tacaaataca ccccgtccaa tgtcactctt ccagaaaaca aaaacaccta cgactacatg 1500
aacgggcggg tggtgccgcc atctctagta gacacctatg tgaacattgg tgccaggtgg 1560
tctctggatg ccatggacaa tgtcaaccca ttcaaccacc accgtaacgc tggcttgcgt 1620
taccgatcca tgcttctggg taacggacgt tatgtgcctt tccacataca agtgcctcaa 1680
aaattcttcg ctgttaaaaa cctgctgctt ctcccaggct cctacactta tgagtggaac 1740
tttaggaagg atgtgaacat ggttctacag agttccctcg gtaacgacct gcgggtagat 1800
ggcgccagca tcagtttcac gagcatcaac ctctatgcta cttttttccc catggctcac 1860
aacaccgctt ccacccttga agccatgctg cggaatgaca ccaatgatca gtcattcaac 1920
gactacctat ctgcagctaa catgctctac cccattcctg ccaatgcaac caatattccc 1980
atttccattc cttctcgcaa ctgggcggct ttcagaggct ggtcatttac cagactgaaa 2040
accaaagaaa ctccctcttt ggggtctgga tttgacccct actttgtcta ttctggttct 2100
attccctacc tggatggtac cttctacctg aaccacactt ttaagaaggt ttccatcatg 2160
tttgactctt cagtgagctg gcctggaaat gacaggttac tatctcctaa cgaatttgaa 2220
ataaagcgca ctgtggatgg cgaaggctac aacgtagccc aatgcaacat gaccaaagac 2280
tggttcttgg tacagatgct cgccaactac aacatcggct atcagggctt ctacattcca 2340
gaaggataca aagatcgcat gtattcattt ttcagaaact tccagcccat gagcaggcag 2400
gtggttgatg aggtcaatta caaagacttc aaggccgtcg ccatacccta ccaacacaac 2460
aactctggct ttgtgggtta catggctccg accatgcgcc aaggtcaacc ctatcccgct 2520
aactatccct atccactcat tggaacaact gccgtaaata gtgttacgca gaaaaagttc 2580
ttgtgtgaca gaaccatgtg gcgcataccg ttctcgagca acttcatgtc tatgggggcc 2640
cttacagact tgggacagaa tatgctctat gccaactcag ctcatgctct ggacatgacc 2700
tttgaggtgg atcccatgga tgagcccacc ctgctttatc ttctcttcga agttttcgac 2760
gtggtcagag tgcatcagcc acaccgcggc atcatcgagg cagtctacct gcgtacaccg 2820
ttctcggccg gtaacgctac cacgtaa 2847
<210> 44
<211> 325
<212> PRT
<213> Human mastadenovirus B
<400> 44
Met Thr Lys Arg Val Arg Leu Ser Asp Ser Phe Asn Pro Val Tyr Pro
1 5 10 15
Tyr Glu Asp Glu Ser Thr Ser Gln His Pro Phe Ile Asn Pro Gly Phe
20 25 30
Ile Ser Pro Asn Gly Phe Thr Gln Ser Pro Asn Gly Val Leu Thr Leu
35 40 45
Lys Cys Leu Thr Pro Leu Thr Thr Thr Gly Gly Ser Leu Gln Leu Lys
50 55 60
Val Gly Gly Gly Leu Thr Val Asp Asp Thr Asn Gly Phe Leu Lys Glu
65 70 75 80
Asn Ile Ser Ala Thr Thr Pro Leu Val Lys Thr Gly His Ser Ile Gly
85 90 95
Leu Pro Leu Gly Ala Gly Leu Gly Thr Asn Glu Asn Lys Leu Cys Ile
100 105 110
Lys Leu Gly Gln Gly Leu Thr Phe Asn Ser Asn Asn Ile Cys Ile Asp
115 120 125
Asp Asn Ile Asn Thr Leu Trp Thr Gly Val Asn Pro Thr Glu Ala Asn
130 135 140
Cys Gln Ile Met Asn Ser Ser Glu Ser Asn Asp Cys Lys Leu Ile Leu
145 150 155 160
Thr Leu Val Lys Thr Gly Ala Leu Val Thr Ala Phe Val Tyr Val Ile
165 170 175
Gly Val Ser Asn Asn Phe Asn Met Leu Thr Thr His Arg Asn Ile Asn
180 185 190
Phe Thr Ala Glu Leu Phe Phe Asp Ser Thr Gly Asn Leu Leu Thr Arg
195 200 205
Leu Ser Ser Leu Lys Thr Pro Leu Asn His Lys Ser Gly Gln Asn Met
210 215 220
Ala Thr Gly Ala Ile Thr Asn Ala Lys Gly Phe Met Pro Ser Thr Thr
225 230 235 240
Ala Tyr Pro Phe Asn Asp Asn Ser Arg Glu Lys Glu Asn Tyr Ile Tyr
245 250 255
Gly Thr Cys Tyr Tyr Thr Ala Ser Asp Arg Thr Ala Phe Pro Ile Asp
260 265 270
Ile Ser Val Met Leu Asn Arg Arg Ala Ile Asn Asp Glu Thr Ser Tyr
275 280 285
Cys Ile Arg Ile Thr Trp Ser Trp Asn Thr Gly Asp Ala Pro Glu Val
290 295 300
Gln Thr Ser Ala Thr Thr Leu Val Thr Ser Pro Phe Thr Phe Tyr Tyr
305 310 315 320
Ile Arg Glu Asp Asp
325
<210> 45
<211> 91
<212> PRT
<213> Human mastadenovirus B
<400> 45
Asn Gly Val Leu Thr Leu Lys Cys Leu Thr Pro Leu Thr Thr Thr Gly
1 5 10 15
Gly Ser Leu Gln Leu Lys Val Gly Gly Gly Leu Thr Val Asp Asp Thr
20 25 30
Asn Gly Phe Leu Lys Glu Asn Ile Ser Ala Thr Thr Pro Leu Val Lys
35 40 45
Thr Gly His Ser Ile Gly Leu Pro Leu Gly Ala Gly Leu Gly Thr Asn
50 55 60
Glu Asn Lys Leu Cys Ile Lys Leu Gly Gln Gly Leu Thr Phe Asn Ser
65 70 75 80
Asn Asn Ile Cys Ile Asp Asp Asn Ile Asn Thr
85 90
<210> 46
<211> 192
<212> PRT
<213> Human mastadenovirus B
<400> 46
Leu Trp Thr Gly Val Asn Pro Thr Glu Ala Asn Cys Gln Ile Met Asn
1 5 10 15
Ser Ser Glu Ser Asn Asp Cys Lys Leu Ile Leu Thr Leu Val Lys Thr
20 25 30
Gly Ala Leu Val Thr Ala Phe Val Tyr Val Ile Gly Val Ser Asn Asn
35 40 45
Phe Asn Met Leu Thr Thr His Arg Asn Ile Asn Phe Thr Ala Glu Leu
50 55 60
Phe Phe Asp Ser Thr Gly Asn Leu Leu Thr Arg Leu Ser Ser Leu Lys
65 70 75 80
Thr Pro Leu Asn His Lys Ser Gly Gln Asn Met Ala Thr Gly Ala Ile
85 90 95
Thr Asn Ala Lys Gly Phe Met Pro Ser Thr Thr Ala Tyr Pro Phe Asn
100 105 110
Asp Asn Ser Arg Glu Lys Glu Asn Tyr Ile Tyr Gly Thr Cys Tyr Tyr
115 120 125
Thr Ala Ser Asp Arg Thr Ala Phe Pro Ile Asp Ile Ser Val Met Leu
130 135 140
Asn Arg Arg Ala Ile Asn Asp Glu Thr Ser Tyr Cys Ile Arg Ile Thr
145 150 155 160
Trp Ser Trp Asn Thr Gly Asp Ala Pro Glu Val Gln Thr Ser Ala Thr
165 170 175
Thr Leu Val Thr Ser Pro Phe Thr Phe Tyr Tyr Ile Arg Glu Asp Asp
180 185 190
<210> 47
<211> 561
<212> PRT
<213> Human mastadenovirus B
<400> 47
Met Arg Arg Val Val Leu Gly Gly Ala Val Val Tyr Pro Glu Gly Pro
1 5 10 15
Pro Pro Ser Tyr Glu Ser Val Met Gln Gln Gln Gln Ala Thr Ala Val
20 25 30
Met Gln Ser Pro Leu Glu Ala Pro Phe Val Pro Pro Arg Tyr Leu Ala
35 40 45
Pro Thr Glu Gly Arg Asn Ser Ile Arg Tyr Ser Glu Leu Ala Pro Gln
50 55 60
Tyr Asp Thr Thr Arg Leu Tyr Leu Val Asp Asn Lys Ser Ala Asp Ile
65 70 75 80
Ala Ser Leu Asn Tyr Gln Asn Asp His Ser Asn Phe Leu Thr Thr Val
85 90 95
Val Gln Asn Asn Asp Phe Thr Pro Thr Glu Ala Ser Thr Gln Thr Ile
100 105 110
Asn Phe Asp Glu Arg Ser Arg Trp Gly Gly Gln Leu Lys Thr Ile Met
115 120 125
His Thr Asn Met Pro Asn Val Asn Glu Tyr Met Phe Ser Asn Lys Phe
130 135 140
Lys Ala Arg Val Met Val Ser Arg Lys Pro Pro Asp Gly Ala Ala Val
145 150 155 160
Gly Asp Thr Tyr Asp His Lys Gln Asp Ile Leu Lys Tyr Glu Trp Phe
165 170 175
Glu Phe Thr Leu Pro Glu Gly Asn Phe Ser Val Thr Met Thr Ile Asp
180 185 190
Leu Met Asn Asn Ala Ile Ile Asp Asn Tyr Leu Lys Val Gly Arg Gln
195 200 205
Asn Gly Val Leu Glu Ser Asp Ile Gly Val Lys Phe Asp Thr Arg Asn
210 215 220
Phe Lys Leu Gly Trp Asp Pro Glu Thr Lys Leu Ile Met Pro Gly Val
225 230 235 240
Tyr Thr Tyr Glu Ala Phe His Pro Asp Ile Val Leu Leu Pro Gly Cys
245 250 255
Gly Val Asp Phe Thr Glu Ser Arg Leu Ser Asn Leu Leu Gly Ile Arg
260 265 270
Lys Lys Gln Pro Phe Gln Glu Gly Phe Lys Ile Leu Tyr Glu Asp Leu
275 280 285
Glu Gly Gly Asn Ile Pro Ala Leu Leu Asp Val Asp Ala Tyr Glu Asn
290 295 300
Ser Lys Lys Glu Gln Lys Ala Lys Ile Glu Ala Ala Thr Ala Ala Ala
305 310 315 320
Glu Ala Lys Ala Asn Ile Val Ala Ser Asp Ser Thr Arg Val Ala Asn
325 330 335
Ala Gly Glu Val Arg Gly Asp Asn Phe Ala Pro Thr Pro Val Pro Thr
340 345 350
Ala Glu Ser Leu Leu Ala Asp Val Ser Glu Gly Thr Asp Val Lys Leu
355 360 365
Thr Ile Gln Pro Val Glu Lys Asp Ser Lys Asn Arg Ser Tyr Asn Val
370 375 380
Leu Glu Asp Lys Ile Asn Thr Ala Tyr Arg Ser Trp Tyr Leu Ser Tyr
385 390 395 400
Asn Tyr Gly Asp Pro Glu Lys Gly Val Arg Ser Trp Thr Leu Leu Thr
405 410 415
Thr Ser Asp Val Thr Cys Gly Ala Glu Gln Val Tyr Trp Ser Leu Pro
420 425 430
Asp Met Met Lys Asp Pro Val Thr Phe Arg Ser Thr Arg Gln Val Ser
435 440 445
Asn Tyr Pro Val Val Gly Ala Glu Leu Met Pro Val Phe Ser Lys Ser
450 455 460
Phe Tyr Asn Glu Gln Ala Val Tyr Ser Gln Gln Leu Arg Gln Ser Thr
465 470 475 480
Ser Leu Thr His Val Phe Asn Arg Phe Pro Glu Asn Gln Ile Leu Ile
485 490 495
Arg Pro Pro Ala Pro Thr Ile Thr Thr Val Ser Glu Asn Val Pro Ala
500 505 510
Leu Thr Asp His Gly Thr Leu Pro Leu Arg Ser Ser Ile Arg Gly Val
515 520 525
Gln Arg Val Thr Val Thr Asp Ala Arg Arg Arg Thr Cys Pro Tyr Val
530 535 540
Tyr Lys Ala Leu Gly Ile Val Ala Pro Arg Val Leu Ser Ser Arg Thr
545 550 555 560
Phe
<210> 48
<211> 948
<212> PRT
<213> Human mastadenovirus B
<400> 48
Met Ala Thr Pro Ser Met Leu Pro Gln Trp Ala Tyr Met His Ile Ala
1 5 10 15
Gly Gln Asp Ala Ser Glu Tyr Leu Ser Pro Gly Leu Val Gln Phe Ala
20 25 30
Arg Ala Thr Asp Thr Tyr Phe Asn Leu Gly Asn Lys Phe Arg Asn Pro
35 40 45
Thr Val Ala Pro Thr His Asp Val Thr Thr Asp Arg Ser Gln Arg Leu
50 55 60
Met Leu Arg Phe Val Pro Val Asp Arg Glu Asp Asn Thr Tyr Ser Tyr
65 70 75 80
Lys Val Arg Tyr Thr Leu Ala Val Gly Asp Asn Arg Val Leu Asp Met
85 90 95
Ala Ser Thr Phe Phe Asp Ile Arg Gly Val Leu Asp Arg Gly Pro Ser
100 105 110
Phe Lys Pro Tyr Ser Gly Thr Ala Tyr Asn Ser Leu Ala Pro Lys Gly
115 120 125
Ala Pro Asn Thr Ser Gln Trp Ile Ala Glu Gly Val Lys Asn Thr Thr
130 135 140
Gly Glu Glu His Val Thr Glu Glu Glu Thr Asn Thr Thr Thr Tyr Thr
145 150 155 160
Phe Gly Asn Ala Pro Val Lys Ala Glu Ala Glu Ile Thr Lys Glu Gly
165 170 175
Leu Pro Val Gly Leu Glu Val Ser Asp Glu Glu Ser Lys Pro Ile Tyr
180 185 190
Ala Asp Lys Thr Tyr Gln Pro Glu Pro Gln Leu Gly Asp Glu Thr Trp
195 200 205
Thr Asp Leu Asp Gly Lys Thr Glu Lys Tyr Gly Gly Arg Ala Leu Lys
210 215 220
Pro Asp Thr Lys Met Lys Pro Cys Tyr Gly Ser Phe Ala Lys Pro Thr
225 230 235 240
Asn Val Lys Gly Gly Gln Ala Lys Gln Lys Thr Thr Glu Gln Pro Asn
245 250 255
Gln Lys Val Glu Tyr Asp Ile Asp Met Glu Phe Phe Asp Ala Ala Ser
260 265 270
Gln Lys Thr Asn Leu Ser Pro Lys Ile Val Met Tyr Ala Glu Asn Val
275 280 285
Asn Leu Glu Thr Pro Asp Thr His Val Val Tyr Lys Pro Gly Thr Glu
290 295 300
Asp Thr Ser Ser Glu Ala Asn Leu Gly Gln Gln Ser Met Pro Asn Arg
305 310 315 320
Pro Asn Tyr Ile Gly Phe Arg Asp Asn Phe Ile Gly Leu Met Tyr Tyr
325 330 335
Asn Ser Thr Gly Asn Met Gly Val Leu Ala Gly Gln Ala Ser Gln Leu
340 345 350
Asn Ala Val Val Asp Leu Gln Asp Arg Asn Thr Glu Leu Ser Tyr Gln
355 360 365
Leu Leu Leu Asp Ser Leu Gly Asp Arg Thr Arg Tyr Phe Ser Met Trp
370 375 380
Asn Gln Ala Val Asp Ser Tyr Asp Pro Asp Val Arg Val Ile Glu Asn
385 390 395 400
His Gly Val Glu Asp Glu Leu Pro Asn Tyr Cys Phe Pro Leu Asp Gly
405 410 415
Ile Gly Val Pro Thr Thr Ser Tyr Lys Ser Ile Val Pro Asn Gly Asp
420 425 430
Asn Ala Pro Asn Trp Lys Glu Pro Glu Val Asn Gly Thr Ser Glu Ile
435 440 445
Gly Gln Gly Asn Leu Phe Ala Met Glu Ile Asn Leu Gln Ala Asn Leu
450 455 460
Trp Arg Ser Phe Leu Tyr Ser Asn Val Ala Leu Tyr Leu Pro Asp Ser
465 470 475 480
Tyr Lys Tyr Thr Pro Ser Asn Val Thr Leu Pro Glu Asn Lys Asn Thr
485 490 495
Tyr Asp Tyr Met Asn Gly Arg Val Val Pro Pro Ser Leu Val Asp Thr
500 505 510
Tyr Val Asn Ile Gly Ala Arg Trp Ser Leu Asp Ala Met Asp Asn Val
515 520 525
Asn Pro Phe Asn His His Arg Asn Ala Gly Leu Arg Tyr Arg Ser Met
530 535 540
Leu Leu Gly Asn Gly Arg Tyr Val Pro Phe His Ile Gln Val Pro Gln
545 550 555 560
Lys Phe Phe Ala Val Lys Asn Leu Leu Leu Leu Pro Gly Ser Tyr Thr
565 570 575
Tyr Glu Trp Asn Phe Arg Lys Asp Val Asn Met Val Leu Gln Ser Ser
580 585 590
Leu Gly Asn Asp Leu Arg Val Asp Gly Ala Ser Ile Ser Phe Thr Ser
595 600 605
Ile Asn Leu Tyr Ala Thr Phe Phe Pro Met Ala His Asn Thr Ala Ser
610 615 620
Thr Leu Glu Ala Met Leu Arg Asn Asp Thr Asn Asp Gln Ser Phe Asn
625 630 635 640
Asp Tyr Leu Ser Ala Ala Asn Met Leu Tyr Pro Ile Pro Ala Asn Ala
645 650 655
Thr Asn Ile Pro Ile Ser Ile Pro Ser Arg Asn Trp Ala Ala Phe Arg
660 665 670
Gly Trp Ser Phe Thr Arg Leu Lys Thr Lys Glu Thr Pro Ser Leu Gly
675 680 685
Ser Gly Phe Asp Pro Tyr Phe Val Tyr Ser Gly Ser Ile Pro Tyr Leu
690 695 700
Asp Gly Thr Phe Tyr Leu Asn His Thr Phe Lys Lys Val Ser Ile Met
705 710 715 720
Phe Asp Ser Ser Val Ser Trp Pro Gly Asn Asp Arg Leu Leu Ser Pro
725 730 735
Asn Glu Phe Glu Ile Lys Arg Thr Val Asp Gly Glu Gly Tyr Asn Val
740 745 750
Ala Gln Cys Asn Met Thr Lys Asp Trp Phe Leu Val Gln Met Leu Ala
755 760 765
Asn Tyr Asn Ile Gly Tyr Gln Gly Phe Tyr Ile Pro Glu Gly Tyr Lys
770 775 780
Asp Arg Met Tyr Ser Phe Phe Arg Asn Phe Gln Pro Met Ser Arg Gln
785 790 795 800
Val Val Asp Glu Val Asn Tyr Lys Asp Phe Lys Ala Val Ala Ile Pro
805 810 815
Tyr Gln His Asn Asn Ser Gly Phe Val Gly Tyr Met Ala Pro Thr Met
820 825 830
Arg Gln Gly Gln Pro Tyr Pro Ala Asn Tyr Pro Tyr Pro Leu Ile Gly
835 840 845
Thr Thr Ala Val Asn Ser Val Thr Gln Lys Lys Phe Leu Cys Asp Arg
850 855 860
Thr Met Trp Arg Ile Pro Phe Ser Ser Asn Phe Met Ser Met Gly Ala
865 870 875 880
Leu Thr Asp Leu Gly Gln Asn Met Leu Tyr Ala Asn Ser Ala His Ala
885 890 895
Leu Asp Met Thr Phe Glu Val Asp Pro Met Asp Glu Pro Thr Leu Leu
900 905 910
Tyr Leu Leu Phe Glu Val Phe Asp Val Val Arg Val His Gln Pro His
915 920 925
Arg Gly Ile Ile Glu Ala Val Tyr Leu Arg Thr Pro Phe Ser Ala Gly
930 935 940
Asn Ala Thr Thr
945
<210> 49
<211> 137
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 14 sequence
<400> 49
catcatcaat aatatacctt atagatggaa tggtgccaat atgtaaatga ggtgatttta 60
aaaagtgtgg gctgtgtggt aattggctgt ggggttaacg gctaaaaggg gcggcgcggc 120
cgtgggaaaa tgacgtt 137
<210> 50
<211> 137
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 14 sequence
<400> 50
aacctcattt tcccacggcc gcgccgcccc ttttagccgt taaccccaca gccaattacc 60
acacagccca cactttttaa aatcacctca tttacatatt ggcaccattc catctataag 120
gtatattatt gatgatg 137
<210> 51
<211> 342
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 14 sequence
<400> 51
ttttgggggt ggagtgtttt tgcaagttgt cgcggtaaat gtgacgcaaa caaaggcttt 60
ttttttacgg aactacttag tgttcccacg gtatttaaca ggaaatgagg tagttttggc 120
cggatgcaag taaaaattgt tcattttcgc gcgaaaactg aatgaggaag tggttttctg 180
aataatgcgg tatttatggc agggtggagt atttgttcag ggccaggtag actttgaccc 240
attacgtgga ggtttcgatt accgcggagg tttcgattac cgtgtttttt acctaaattt 300
ccgcgtaccg tgtgaaagtc ttctgttttt acgtaggtgt ca 342
<210> 52
<211> 3468
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 14 sequence
<400> 52
gctgatcgct acggtattta tacctcaggg tttgtgtcaa gaggccactc ttgagtgcca 60
gcgagaagag ttttctcctc tgcgccggca gtttaatatt aaaaaaaatg agacacttgc 120
gatttatgcc tcaggaaata atttctgctg agactggaaa cgaaatactg gagtttgtgg 180
tgcacgccct gatgggagac gatccggagc cacctgtgca gctttttgag cctcctacgc 240
ttcaggaact gtatgattta gaggtagagg gatcggagga ttctaatgag gaagctgtga 300
atggcttttt taccgattct atgcttttag ctgctaatga aggattagaa ttagatccgc 360
ctttggacac tttcgatact ccaggggtga ttgtggaaag cggtacagct gtaagaaaat 420
tacctgattt gggttccgtg gactgtgatt tgcactgcta tgaagacggg tttcctttga 480
gtgatgagga ggaccatgaa aaggagcagt ctatgcagac tgcagcgggt gagggagtga 540
aggctgccat tggttttcag ttggattgcc cggagcttcc tggacatggc tgtaagtctt 600
gtgaatttca caggaaaaat actggagtaa aggaactgtt atgttcgctt tgttatatga 660
gagcgcactg ccactttatt tacagtaagt gtgtttaagt taaaatttaa aggaatatgc 720
tgtttttcac atgtatattg agtgggaaat ttgtgcttct tattataggt cctgtgtctg 780
atgctgatga gtcaccatct cctgattcta ctacctcacc tcctgagatt caagcacctg 840
ttcctgtgga cgtgcacaag cccattcctg taaagcttaa gcctggaaaa cgtccagcag 900
tggaaaaact cgaggacttg ttacagggtg gggacggacc tttggacttg agtacacgga 960
aacggccaag acaataagtg ttccatatcc gtgtttactt aaggtgacgt caatatttgt 1020
gtgagagtgc aatgtaataa aaatatgtta actgtgtact ggtttttatt gctttttggg 1080
cggggactca ggtatataag tagaagcaga cctgtgtggt tagctcatag aagctggctt 1140
tgattcatgg aggtttgggc cattttggaa gaccttagaa agactaggca actgttagag 1200
aacgcttcgg acggagtctc cggtttttgg agattctggt tcgctagtga attagctagg 1260
gtagttttta ggataaaaca ggactataaa gaagaatttg aaaagttgtt ggtagattgt 1320
ccaggacttt ttgaagctct taatttgggc catcaagttc actttaaaga aaaagtttta 1380
tcagttttag acttttcgac cccaggtaga actgccgctg ctgtggcttt tcttactttt 1440
atattagata aatggatccc gcagactcat ttcagcaggg gatacgtttt ggatttcgta 1500
gccacagcat tgtggagaac atggaaggtt cgcaagatga ggacaatctt aggttactgg 1560
ccagtgcagc ctttgggtgt agcgggaatc ctgaggcatc caccggtcat gccagcggtt 1620
ctggaggagg aacagcaaga ggacaacccg agagccggcc tggaccctcc agtggaggag 1680
gcggagtagc tgacttgtct cctgaactgc aacgggtgct tactggatct acgtccactg 1740
gacgggatag gggcgttaaa agggagaggg catctagtgg tactgatgct agatctgagt 1800
tggctttaag tttaatgagt cgcagacgtc ctgaaaccat ttggtggcat gaggtccaga 1860
aagagggaag ggatgaagtt tctgtattgc aggagaaata ttcactggaa caggtgaaaa 1920
catgttggtt ggagcctgag gatgattggg aggtggccat taaaaattat gccaagatag 1980
ctttgaggcc tgataaacag tataagatta ctagacggat taatatccgg aatgcttgtt 2040
acatatctgg aaatggggct gaggtggtaa tagatactcc agacaagaca gttattagat 2100
gctgcatgat ggatatgtgg cctggagtag tcggtatgga agcagtaact tttgtaaatg 2160
ttaagtttag gggagatggt tataatggaa tagtgtttat ggccaatacc aaacttatat 2220
tgcatggttg tagctttttt ggttttaaca atacctgtgt agatgcctgg ggacaggtta 2280
gtgtacgggg atgtagtttc tatgcgtgtt ggattgccac agctggcaga accaagagtc 2340
aattgtctct gaagaaatgc atattccaaa gatgtaacct gggcattctt aatgaaggcg 2400
aagcaagggt ccgccactgc gcttctacag atactggatg ttttatttta attaagggca 2460
atgccagcgt aaagcataac atgatttgcg gtgcttccga tgagaggcct tatcaaatgc 2520
tcacttgtgc cggagggcat tgtaacatgc tggctactgt gcatattgtt tctcatcaac 2580
gcaaaaaatg gcctgttttt gatcacaatg tgttgaccaa gtgtaccatg catgcaggtg 2640
ggcgtagagg aatgtttatg ccttaccagt gtaacatgaa tcatgtaaaa gtgttgttgg 2700
aaccagatgc cttttccaga atgagtctaa caggaatgtt tgacatgaac atgcaaatct 2760
ggaagatcct gaggtatgat gatacaagat cgagggtgcg cgcatgcgaa tgcggaggca 2820
agcatgccag gttccagccg gtgtgtgtag atgtgactga agatctgaga ccggatcatt 2880
tggttattgc ccgcactgga gcagagttcg gatccagtgg agaagaaact gactaaggtg 2940
agtattggga aaactttggg gtgggatttt cagatggaca gattgagtaa aaatttgttt 3000
ttctgtcttg cagctgtcat gagtggaaac gcttctttta atgggggagt cttcagccct 3060
tatctgacag ggcgtctccc atcctgggca ggagttcgtc agaatgttat gggatctact 3120
gtggatggaa gacccgtcca acccgccaat tcttcaacgc tgacctatgc tactttaagt 3180
tcttcacctt tggacgcagc tgcagccgcc gctgccgcct ctgttgccgc taacactgtg 3240
cttggaatgg gttactatgg aagcatcctg gctaattcca cttcctctaa taacccttct 3300
accctgactc aggacaagtt acttgtcctt ttggcccagc tggaggcttt gacccaacgt 3360
ctgggtgaac tttctcagca ggtggccgag ttgcgagtac aaactgagtc tgctgtcggc 3420
acggcaaagt ctaaataaaa aaaaaaaatt ccagaatcaa tgaataaa 3468
<210> 53
<211> 19427
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 14 sequence
<400> 53
atggccagcc gcgaaggaaa tcagttaagc gaccgccaca gggagcacac ccccgaacgc 60
ggaaggggtt ctgccagtca tccgccttcc aggtcggacc gcagcccttc gcaatcgcct 120
ccacctctgc ccccgaagag aaacacctgt cgccgtgtgg ggtcaggttc ttctaccgac 180
agtcagttgg taatggtgag cgaaacttca caatcctccc tgtctccgga acggagcgac 240
agtcctcctc ccccgatacc ccccaaaaag aagccaagga agaccaaaca tgttcccatg 300
caagacatca gtcaagacag cgaagaagaa agagaagagg cgcagcttgt agcagtaggt 360
ttcagctacc cgcccgtgcg catcgttgag aaggatggca aaagaagcat tgaaaagatt 420
gccaaagatg atcctctggc taaaggagct gctgcctgta ctgttaagaa tccgattagc 480
ttgcccctgg tgtctgcttg ggagaagggc atggaagtga tgtgtgtact gatggagaag 540
tacaggctgg ataacgaact tagaacctct tttaaactaa tgcctgagca gcacgaacaa 600
tacaagcgca tctgtcacca gtacgtaaac gaggagcacc gaggcatcca gttaactttc 660
actagtcaca agacactgag cacgatgatg ggaagatttc tgcagggaat gatacattct 720
ttttctcaga tcgcccacca taattgggaa tgtacaggct gtgcgttgtg gcctcatggc 780
tgcaatgatt atgagggcaa gctgaagtgc ctgcatggca ctattatgat tcagaaggag 840
cagattatcg agatggatgt ggccagcgag aatggacaac gagccttgaa ggagaatccc 900
gagcgaacca aaatcaccca aaaccgctgg ggcagaagtg tggtgcaaat agccaacaat 960
gacgcccgct gctgtgtgaa tgatgccggc tgcgcagcta accagttttc gagcaggtcc 1020
tgcgggatgt tctataccga gggtagtaaa gcccagcagg ctttcaagca atatgatgct 1080
ttcatgagag ccgtgtatcc aggaatcaga caggatcagg ccaagatgat actaatcccc 1140
ctgcactgcg attgcaacca caagcctaat tgggtgcccg ccatgggtag gcagacctgc 1200
aagatgaccc cgttcagcat tgccaatgct gaagatctgg atgtgggcat gattgcagat 1260
cccaccgtgc tggcaagcgt gagacatccg tcgctgatgg tgtttcagtg ctgcaatccg 1320
gtgtaccgca actctcgcgc tcagagcact ggtcctaatt gtgatttcaa gatttcggct 1380
cctgacctgc tgggagcttt gcagctgacc agaaagctgt ggagtgacat cctacccgat 1440
ataccggttc ccaagttggt gattcccgaa ttcaagtggc aacccaagta tcagttccgc 1500
aacgtatcac tgcccgcggg tcattctgat tctcgtcaga acccattcga cttgtaaata 1560
aataagtaat ccagagcctt gatacgtgta aaaaataaag tgctgtttat tcaacacgtt 1620
gtttacatga gtcattattg cacatccata cggtcgaacg cagtggccct ttcgatgtgt 1680
gtacgatggg agcgaaaata aggcgaatgg gtattgagaa aatggtagag tgctttttga 1740
ttgtcacaca gggtgggctg gactttagga gaatgaagca tgttgtttgg cactccagtc 1800
agcaatttca tggtggggtt tccgtccatg ggacggtcag gccagtgcac aaaggcatga 1860
aggaacatgc agcagaaaag tccgcaggcg gcagaacggg ggccctgcac ggtctgggta 1920
gatttttcca gcgtaataca gcggtccttg gtagcaagag cgctgcggcg caggagaccc 1980
tcatattcaa actggtaaat ctgtttaaga cgatcatccg agaatccaaa aggatcaaaa 2040
aggtagcagg tgttagaacg tgggttccaa ccgaaagcca accagtgctc tccccccgtc 2100
tcacgtccgg ccgtgtttac aatggcacag gcgagcttat cgggggccat gaaccccggg 2160
aagcgcttat cgtaggttcc caaaaaatag ggtccgcaac ccaggtcttg gacaatggct 2220
ctgagctctt gctcgctgga gccgttttgg gatccgcagg ccatggttgc agctgctgtt 2280
tgcaagaagc aagaagcttt ttacgtggta gcgttaccgg ccgagaacgg tgtacgcagg 2340
tagactgtct cgatgatgcc gcgatgtggc tgatgcactc tgaccacgtc gaaaacttcg 2400
aagagaagat aaagcagggt gggctcatcc atgggatcca cctcaaaggt catgtccaga 2460
gcatgagctg agttggcata aagcatgttc tgtcccaagt ctgtaagggc ccccatagac 2520
atgaagttgc tcgagaacgg tatgcgccac atggttctgt cacacaagaa ctttttctgc 2580
gtaacactat ttacggcagt tgttccaatg agtggatagg gatagttagc gggatagggt 2640
tgaccttggc gcatggtcgg agccatgtaa cccacaaagc cagagttgtt gtgttggtag 2700
ggtatggcga cggccttgaa gtctttgtaa ttgacctcat caaccacctg cctgctcatg 2760
ggctggaagt ttctgaaaaa tgaatacatg cgatctttgt atccttctgg aatgtagaag 2820
ccctgatagc ctatgttgta gttggcgagc atctgtacca agaaccagtc tttggtcatg 2880
ttgcattggg ctacattgta gccttcgcca tccacagtgc gctttatttc aaattcgttg 2940
ggagatagta acctgtcatt tccaggccag ctcactgaag agtcaaacat gatggaaacc 3000
ttcttaaaag tgtggttcag gtagaaggta ccatccaggt agggaataga accagaatag 3060
acaaagtagg ggtcaaatcc agaccccaaa gagggagttt ctttggtttt gagtctggta 3120
aatgaccagc ctctgaaagc cgcccagttg cgagaaggaa tggaaatggg aatattggtt 3180
gcattggcag gaatgggata gagcatgtta gctgcagata gatagtcgtt gaatgactga 3240
tcattggtgt cattccgcag catggcttca agggtggaag cggtgttgtg agccatgggg 3300
aaaaaggtag catagaggtt gatgctcgtg aaactgatgc tggcgccatc tacccgtagg 3360
tcgttaccga gggaactctg tagcaccatg ttcacatcct tcctgaagtt ccactcataa 3420
gtgtaggagc ctgggagaag cagcaggttt ttgacagcga agaatttttg aggcacttgt 3480
atgtggaaag gcacataacg tccgttaccc aaaagcatgg atcggtaacg caagccagcg 3540
ttacggtggt ggttgaatgg gttgacattg tccatagcat ccagagacca cctggcgcca 3600
atgttcacat aggtgtctac tagagatggc ggcaccaccc gcccgttcat gtagtcgtag 3660
gtgtttttgt tttctggaag agtgacattg gacggggtgt atttgtacga gtctgggaga 3720
tacagagcca cattggaata aaggaaactt cgccatagat tggcttgaag gttaatttcc 3780
atggcaaatg gatttccctt aacaagttca ctgataccat ttggatttac atctttccaa 3840
gcttggtctc catttaactg aatctccttg taactatctg ttcgcggacc gatgccgtcc 3900
agtggaaaac agtagttggg aagttcatct tccacaccat gattttcaat aacacgcaca 3960
tcgggatcat aactgtcaac agcctgattc cacatgctaa agtatctggt tctatcgccc 4020
agggagtcaa gcaagagttg gtaagacagt tctgtgtttc tgtcctgcaa gtcaaccact 4080
gcattcaact gagatgcttg gccagccagc acccccatgt taccagtact gttatagtac 4140
ataagaccaa taaaattatc tctgaagcca atgtagttgg gtctgttggg catagactgc 4200
tgtccaagat tagcatttga actagcatct gaaacttcag gtttgtacac aacatgagta 4260
tctggagatt ccaggtccac attttctgca tacattacaa tcttaggttt aagaccttgt 4320
ttttgtgatc ttaagtcaaa aaagttcatg tcaatgtcat attcaatgtt gttgccttct 4380
tctgttttca cttttgcctg tccgcctttc acattagtag gtttagcaaa agacccatag 4440
cacggtttca ttttagtgtc cggtttaagt actctgcctc cgtatttttc ttcagtgcca 4500
tctgtatcag tccacgattc ctgtcccacc tggggttctg gttggtaaag cttattagcg 4560
tagataggtt tagggtcacc ttcagctggg acttccaaac ctattggtag tccgtctttt 4620
gtaatgtcag catcggcttt tactggggca ttgccaaaag tgtatgtagc tttttcgtca 4680
ttttccccgt cttcattttg ccgttcttca gtagtttcaa cccctttatc caaccactga 4740
gatgcatttg gagcgccttt aggagccaga gagttgtaag ccgtaccaga atagggtttg 4800
aaactgggac ctctgtccaa cacgccccta atgtcaaaga acgtgctggc catatccagc 4860
actctgttgt cgcccacggc cagggtgtac cgcactttgt aagagtatgt attgtcctcc 4920
cggtcaacgg gcacgaagcg caacatgagc cgctggctac ggtcggtggt cacatcgtgg 4980
gttggcgcta cggtgggatt tctaaactta tttcccagat tgaagtaggt gtctgtggcg 5040
cgggcgaact gcaccagacc cggactcagg tactccgaag catcctgtcc ggcgatgtgc 5100
atgtatgccc actggggcag catcgatggg gtggccatct tgaaagtaac tcagcgtcga 5160
cgcacgacct cttccttttt tcctctgctg ctgtgacggc gtgtaatgac acatatacac 5220
agataggcaa gttaagcgct actccatatt taattaaaag cagcgacggc gttttacact 5280
ttgcacgcct agacccacga tgctgttcag agtattttgc cagtgcgcat ttggacgagg 5340
agcgcccccg ggacgtgacc tggctacggc gactggtttc ggggcagcga caggcttaga 5400
agcgggtaca gcagtagcag cagggggagg gggcaaatcc aaagtgacgg gtcgatgcaa 5460
ctgagaaggt ttcattaccc cggtagccat aggggctatc ggtctagtgg tgggcattcc 5520
aagcttcgtt gcttcctcat aagaaggcgg ttcatctacg cgcgtcacca gcgtctcttc 5580
caaatcggga cgcggacgct tgtcgcctcg tttttctggc ggaggaattt cttcctccac 5640
ttgtatttca cctggggttg ctggcggcgg gtccaaacga ctgtttatct ttttctgcac 5700
agcctgatta gccaaatcta ccactccatt gatgccggaa gctatcccat cgactacttt 5760
ttgttgaaag ttctggtctt taagtttatt tctaagcgcc tgtcctgtac tgctgttcca 5820
agctttgttc ccgtatgttt ttatggttga gccaaaattt ttaagcccgc tccagatact 5880
gctccaattg aaggcgcccc cgttcagttg gctcgtgccg atgtcgctcc aggtgcccat 5940
gtacggcttc gtgccgtgtc gcggagccaa ggatgaaaaa ttgatgtttt ccatctctaa 6000
gaaaacatag tcacaggacc aggagtgtca gagtccattg tatttttttt tttatttata 6060
cttttttttc caatgtcaat gtcgttgcga ggcctgaacc gccacggaag ctatgcctgg 6120
tatcgcgcca attgcagcag cgataattgg aattaaggct ggcaaaaaac caccccgcaa 6180
ttgcttgcgg atagcacgcc gtcgcctgta gcgtcgcatt ccgcgcccca acatccctct 6240
tctacggcgc gaatttcttc ctcggtaacc agtgatggga acgcgaaggc gacaagtgag 6300
ggccatatct gcaaggaggc agcggcaaca ttgattaagt gatgatactt ggatggtaac 6360
gcgcacgcgg cagtgtcaaa ggttccgcac tactattgcg gtacacttgc cgcaccaggg 6420
cgccgggagt cggtttgctt gtgcgtctac ggcgacgact gcgatttgca ggtgtcttgc 6480
ggcgacggcg ggaggtactg tttcggctgc gatagtagcg agtgcctcgg taaccaggag 6540
taggaataat agatgggtgt acaacatagt tgggcatcaa cagacttgct ggaccgtact 6600
ttcgtcggga tcttcgagtg ggaccggcgg cgtcagttgt aataggcatc ggcatccatg 6660
gatccgtttg cacttcagtg gaggtggcag taggctttgc gggttcagtt tgcacttcca 6720
tactttcagt gggaatctta atgtctacag tttgtactcc cagaccaggc gctacctgct 6780
taatgggtct cactttaacc tcaggttgaa tatctggatc cacttttact ttctccaaaa 6840
cgtcctccaa cttttggcgt ttgggtacca ttagttgcat agtgggatac aaatcttcac 6900
cttcgcgttt aacacctgtt cgcggagtta cgggtaacac ttgctgcaaa gtgaccggtt 6960
taagactagg ggtgggattt ccatgatcca agggtatgga cactgtctca tccttgggat 7020
ttattctact acgcttgcca taagcaaact cgcctaatcg gtcagccgcc tgctcaagaa 7080
tatcatcatc cccgtacacc tcatcatagg aacgcttaaa agtagcgctt gaacgctcgc 7140
cgggtgtaaa gaccaccgaa gttccaggtc tcaacaaatg tcgaactttg cgtccacgcc 7200
attgcacgcg tcgccgtggg gcaaactcgc gcacaaactc cgccagccca tcatcgccat 7260
cttcctcttc ttttttgtcc tttttagccc gcttgatttt gcggggtttt ttttcatcct 7320
tcagcggttg gccgtagact tcaggtgcga taacctgcag catttcttcc ttgtatttgc 7380
gcttggacat cctcgccgct gggacacaac atcggagact gctcagtatc ttctaagtgc 7440
gagggggacg ggtgcgcacg ggtacacgtt gaccggtggc agcgtcacgc acccagtata 7500
cattgcctct tcgcgtttgg gccatgtcgg caatagtcgc cgctgcgaca gcggctgctt 7560
gcctgcggga cctgccggcg ctggcgcccg aagctgcacg tctggccgcc ctaagcatgg 7620
ctcttcgtcc cacgcgtcta gctcttcgta gcagagctct tgcggctcgc atggcagtgg 7680
tagctcggtg gcgtctggca atgcgccttc gccggctctt acgtcgagca tagttgcgag 7740
cgtcagccac tacactgtca ataactgcat ccacagtaga tgtaggcgca gtaggagtat 7800
aattacgggc gtcggcaacc acctcatcga ttacatcatc gacggtggtt cgaacgcgag 7860
tgcggccctt gagggcaccc catggagcgc gaaaatgacc gcgaacacgc acgggatgtt 7920
gggtagaacg tttgcgtgcg cctccgtaca tcttgcttgg agcgcgcaga ccccaaccgg 7980
tgttattact gggcgagata agaatggaca tttttttaga aagtgcggct tgaaaggacg 8040
cgcggtgcga ctatgcccag tgccttgtac acgtagggac aggtgcggcg tctggcgtca 8100
gtaacggtca cacgttggac tccccggata ctgctgcgca acggcagggt cccgtgatct 8160
gtgagagcag gaacgttttc actgacggtg gtaatggtgg gcgccggcgg acggattaaa 8220
atctggttct caggaaagcg gttgaagacg tgcgtaagcg aggtggactg gcggagctgc 8280
tgggagtaca cagcttgttc gttgtagaag ctctttgaga agacgggcat aagctctgca 8340
cccaccacag ggtagttgct gacttgtcta gtggagcgga aagtgacagg atcctgcatc 8400
atgtctggaa gcgaccagta gacctgctct gctccgcagg tgacatctga ggtggtgagc 8460
aatgtccagg aacgcactcc tttttcggga tcgccataat tgtacgaaag gtaccaactg 8520
cgataggctg tgttgatttt atcttccaac acattatagc ttctattctt actatctttt 8580
tctacaggtt gaatagtgag tttcacgtcc gttcctccag ttacatcggc caataatgat 8640
tctgcagtcg gaacaggtgt tggtgcaaaa ttgtctcctc tgacctctcc agcgttagca 8700
acccttgtaa agtcgctggc aactatgttt gccttagctt ccgcagcagc ttctattttg 8760
gctttttgtt ctttcttact gttctcatag gcatctacat ccaagagggc cggaatatta 8820
cctccttcta aatcttcata caaaatctta aaaccctctt gaaatggctg tttttttctg 8880
ataccaagaa ggttgctcaa acgactttcg gtaaagtcca ctccacagcc aggcagtaag 8940
acaatgtcag gatgaaaggc ttcatacgta tacactccag gcataatcaa cttggtttcg 9000
ggatcccatc ccagcttgaa gttcctggtg tcgaacttaa caccaatgtc actttcaagc 9060
actccattct gtctgcccac tttcaagtag ttatctatga tggcattgtt catcaaatca 9120
atggtcatag taactgaaaa gttgccttct ggcaaagtaa actcgaacca ctcatattcc 9180
aaaatatcct gcttgtgatc atatgtatcc ccaactgcag caccttcggg aggttttctg 9240
gacaccatca cacgcgcttt gaagttgtta ctaaacatat actcgtttac gttgggcatg 9300
ttagtatgca tgatggtctt tagctgaccg ccccaccgcg atcgttcatc aaagttaatg 9360
gtctgggtac tggcttccgt aggggtaaag tcattgttct gcaccaccgt ggtcaagaag 9420
ttgctgtggt cattctgata gttcagagaa gcaatgtccg ccgacttgtt gtccaccaga 9480
tacaacctgg tggtatcgta ctgaggtgcc agttccgagt aacgaatgct gtttctgccc 9540
tccgtaggtg ccaggtatcg cggaggtaca aagggagcct ccagtgggga ttgcatcacc 9600
gccgtcgcct gctgctgctg catcacgctc tcgtacgaag gaggaggacc ctccggatac 9660
accaccgctc cgcctagcac gactcgcctc attatactag acacaaataa taaagaagaa 9720
cgaacgtacg ctcgtcgcca tggccttggt gagttttcct ttttattttt tttttacaac 9780
ataccaccca agcgagggcg caaatgagca aacgggttgc cccttcctct cccacccaag 9840
tccaacacgc tgctatcatc ggccgaatcc tcatcttccc acacaagacc cctctgtctg 9900
tcatgacgct ggcgtctacg gctcgctcta cttgtagtcc ccatgatccc aggctcgtct 9960
ctgtgatcct gagcataagt cttccatcta ctcatcttat ccaccaaact ttctattcca 10020
ttgtttggga aatttttttc tctcgccggt ctgagcaagg aatcgtttag gtattcctct 10080
tcgcccatta aactcgggcg acttattcta cccacttcgc tgctacgtac actgtgtaga 10140
gaaaagggta gactaggaaa aggacttgca gactcgggct cagccgcggt agcacccatg 10200
accccggaca gcgatgcaga agaatgcatt ctatcgccgc cttccttttt ccacgtgcga 10260
tgatcaaaaa gaggtgaaaa aacattactg tccacgtcgt cccacagaaa cccgtcatta 10320
gggtcgggca tgtcatattc gcccgtgtag aaaccaggtg ggggcagcca gtgcgggttt 10380
aggatggcat tggtaaaata atcagagttc atagcggcag ctctgtgcaa gtagtccagc 10440
agtttgttaa tgaaaggccg gttactggca tacatgctgg gctccatatt tcgcgctgtc 10500
atgtccaatg ccgcagtcgg agttgccccc tcttgcatca gaaacaatcc cacgctctgc 10560
tgcacatatc taaggatcct ctcctcctcc gcagtaagag catattgagg agggatcttc 10620
tgagaccgat tggtaagcaa gaagttcaga gtggcttcca aactgccagt gtcttcctga 10680
cccaaagcgc gactgacttg ggtaatttct tgataggtct gctcgtccac ctggctttgc 10740
cctatggctt cgcgatacag gtttagtagg taacccaaat aggaattacg gtcgatgctg 10800
ccgctgtcgg tgaaaggagc taccaacagt agtaataggc gggagtttgg agttaacaag 10860
ctagacacgg ttgctctttc tcctaccggg gcatgcactc cccacaaacc tttaaggttt 10920
ttaaaagctt ggctcagatt taccgtctgc aaaccctgtc tgctagtctg aaagaagtag 10980
tcaggtccgg actgatacac ttcgctctga ggtacttcag ataccatcag tctcaacgca 11040
ctcaaaaagt tagtataatc ctgttgacca cgcggcacat tagcaggctg agtactcaaa 11100
aaagcattta acgccaccag cgaaccaagg ttggcatcgc gctggaacct ttcacgctga 11160
gacacggctt cgcgtacatc tgttatcata cggtccaaat tggtttgcac attgctactg 11220
ttgtagcgag ccacgcgttc taaaagagcg ttgtatacca gtccggcctc atctggacga 11280
atagctttgt tctccaccaa cgcgtttaca atggccagga ccttctcatg agtgggatta 11340
gagcgggaag gcactacagc ttccatgatg gccgatagac ggttggcctg gggttgctgt 11400
ctaaaggctt cggggttgcg agtcgtcaac gccatgatac gttgcatggc ctgggtccaa 11460
tcgtccgagg agttaatgcc ggacggctgg ctctgcagcg ccgcccgcgt tgcgggatcc 11520
ggtgcttgct gttccatcta gcaaaaaaca cgggttgtgc catcagtctt ccaagtactc 11580
gccctcttcc tcctcgcctt catccgcctc ttctatgtaa ggaagctcac atcctgccgt 11640
cgcggcgctc agagccctgc gactaggctg ccactgcaag tcagctccca tgtcaaagta 11700
attctcaccc tctgttccag ctccagtcag agctctttgc aaactgtgca tcagttccct 11760
gtcgcttaac tcgcgcctcc tactggcgct aacggcgcga tgcattctgt cattgcggta 11820
caccccaaga tcatcgctca gggtcaagac cttgagcgtc atacgcatgt agaacccatc 11880
tatcttcacc tccttgtcta tgggaacgta tggagtcttg tagatcttgc gagcgtaata 11940
ttttcccaaa cttaaaaccg agtaattgat ggcagccacc ttttcggcca ggcccaggct 12000
ccgctcctgc actatgatac tctgtagaat gttgataaga tcatacaacc atctcccctc 12060
gggttcagtg atgttgagca gtgcctctct gaaagcctcg ttgtctctgc tgtgttgcac 12120
caccagaaac agctgtgcgg tcagaggttt gctagtaggg ttctgaatga tagcttccat 12180
caaatcccac aaatgcatca aaccaagagt aacttcttcg cgggcaatca gggttcgcac 12240
atgattatta aaagactttt ggaagttacg ctcttccttt actgtctgct cgtaagccga 12300
tacaaggttg gctgcagcca cgtgtgccct ggcaggactg atccctgtca cttcatcaac 12360
ttcgaaatcc tcgtcccgca acactcgtct tcggtccaaa ccgtgacgca gctcacgacc 12420
cgcgttaaag cgggaagctc gcatctcctc cggctcctcg ccgcttctgt ctctaaatag 12480
gttctgttgg ggcacatacg cctcgcgaga atcttttttc agttgaactc gcggatgccg 12540
ctcgggcgag ggcgcaccta gacgtgccag tccttcgccc tcttccaagt ccagatcata 12600
ggcgggctgt cccgcaccgc tcacggcggc agttgcagta gttgcaggga cagccttttg 12660
tggttgctgc tgctgcgagg ggggctgttg ttggggacgc atctgtcgca gcacgggatg 12720
catctgagcg gcaaaaaaaa aaataggact cacttccctg ccattcagca accagcaaaa 12780
cgactcgatt ccgtatcctg gatttttgta ggctgggtcg agacgggagt gccaatacca 12840
cgttagccgc ggctccggcc ggctcgagta caagtcttga accggggtac accgcgaccc 12900
aacccgttca cgttcctcca ggctacagag tcgagtcgct gaacgctttc attttcttcg 12960
tgtctataga gcatcaatga ctgcgcgcgc ctcactggtc aaaccgtgcc tacaatgaac 13020
tacttcatgc cgctacgcaa catttggaac cgcgtacgcg agtttcctcg ggcttccact 13080
accgccgcag gaatcacctg gatgtccagg tacatctacg gctatcaccg ccttatgttg 13140
gaagacctcg cccccggcgc tccagctaca gaacaatggc ctctctaccg ccaaccacca 13200
ccgcattttc ttatagggta ccagtatctg gtgcgcacct gcaacgatta catttttgac 13260
acccgcgcct attcgcgcct taaatacacc gagctcgtgc gccatggtca ccaaacagtt 13320
aactggtcag tcatggccaa ctgtgcttac accatcaata ccggggctta ccaccgcttc 13380
gtggattttg atgactttca agccaccctc acccaagtac agcaagccat cctcgccgaa 13440
agagttgtag ctgacttggc actggtccaa ccaatgcgcg ggtttggact cacacgtatg 13500
catggcagaa cgggtgaaga agaagtgccc gtagaacggc tcatgcaaga ctactacaaa 13560
gatctggcta gatgtcagga taatgcttgg ggaatggcca atcgcctgcg tatccagcaa 13620
gccggaccca aagacctggt gctcctcgcc accatccgcc gtcttagaac tgcctacttt 13680
aatttcatca ccagcagcat cgtctcacct tcccgagatg aagaaggaat agaagaccca 13740
gaccgaacac ataaccaccc ccgcccacaa gaagccgtac tcagcctacc ttgtgactgt 13800
gactggttag acgctttcgt tgaaaggttt tcagatcccg tggatcttga cacgattaga 13860
tctctgcgcg cagtccctac gggccaatta ataaaatgta taatcagcgc cctttccctc 13920
ccaaacggag aacctcccag tcaccacttt aaggagatgc gcggcggtgt ttttactctg 13980
cgaccgcgcg agaacggccg cgccgtcact gaaaccatgc gccgccgccg cggagaggtc 14040
attgaacgat tcatcgaccg tttgcccgtg cgccgtcgac gtcgccgcgt gccccctccg 14100
cccccgcctg aagacgaaga agagatgtta gtggaagaag agatagaaga ggaagaagag 14160
atgccgggag ccttcgaacg cgaagtacgg gccaccatag ccgaactcat ccgtcttctc 14220
gaggaggaat tgaccgtgtc cgcgcgaaac tcccagtttt ttaattttgc cgtggacttc 14280
tacgaggcca tggagcgctt ggaagctctg ggcgatgtca gcgaaatgcc gctgagacga 14340
tggatcatgt atttctttgt cgccgaacac atcgccacca cactcaacta cctttttcag 14400
cgcctatgca actatgcggt cttcaccaga cacgtggagc ttaacctcgc tcaggtggtg 14460
atgcgcgcaa gagactccga gggggccgtg gtttacagcc gcgtctggaa cgaggcgggc 14520
atgaatgcat tctcccaact catgggccgt atctccaatg acctcgcggc caccgtcgag 14580
agagcgggtc gcggagatct tcaggaggaa gaaatcgagc agttcatggc ggagatcgcc 14640
taccaggaca actctggtga cgtacaagaa atactgagac aagctgccgt taacgatacc 14700
gaaattgatt ctgttgaact ctctttcagg ttcaagctca cggggccggt agctttcacc 14760
caaagacgtc agatacaaga cgtcaatcga cgcgtggtgg cgcacgcaag tcttctcaga 14820
gcgcagtacc agaacctgcc cgtgcgcggc gccgacgtgc cactaccagc catgcccccg 14880
ggtccggaac aaccgctgcc gcccggcgcg cgtccccgtc accgctttta agcatgcaag 14940
aagcaagaga gccaccaccg atcaaaagaa aaaacaaagg tacggtagtg gcacccaaag 15000
gacacggaac cctgcaagcc attgacgtct ctacaaacga acctgtggaa atcaagtacc 15060
atctaaacct cccgcacgcc ctggaaaaga tcatgcaagt taatcttctg tccctaccta 15120
ctaacctgag tccgcagcgt ctcaggactc tggacagctc cagcctgcgc gctctcgtcc 15180
ttcagctccg cccctcccgc gccgaggtct ggacttgcct cccgcggggg ctcgtcagca 15240
tgaccaccat cgaaacagaa gatgaacagg ccaatacagc gaatatagaa gagcacgaga 15300
tacaatcgcc aggcctcggc ttcccactga aatttctcgt caagggaagc caggtacagc 15360
tcattcacga gatacaaccc gtgcaacgct gcgactactg cggccgtctg tacaagcaca 15420
aacacgaatg ctcggcgcgc cgcagaaact tctacttcca tcacatcaac agccaatcct 15480
ccaactggtg gcaggaaatc cagtttttcc caatcggctc tcatcctcgc acagaaagac 15540
tcttcctgac ctacgatgtg gaaacttaca cctggatggg gtcctttggc aaacaactag 15600
ttcctttcat gctggtcatg aaactctcag gagaagagcg tctcgtcaac atggcccacg 15660
atctagccat taaacttaag tgggatcgat ggcaacaaga tcccggaacc ttctactgtg 15720
tcactccaga aaaaatggca attggccagc attttcgtca gtatcgggac cagttacaaa 15780
cagcactggc ggtggatctt tggtcatcat tcctacatgc aaatcctcat ctgcacgaat 15840
gggcccttga acactacgcc ttatctgacc ctacagacct aacctttgat gagctcaata 15900
agctacctca cgtcagaggc acgccgcgtt tcatagaatt atacattgta ggacacaaca 15960
tcaacggctt cgacgagatc gtcctagctg cccaggtgat caacaatcga gcggaagtac 16020
cacagccttt tcgcatcact cgcaatttta tgcccagagc cggtaagatt ctcttcaacg 16080
atgttacttt cgctttgccc aaccccgcct acaagaaacg ggtagacttc caactctggg 16140
aacagggagc ctgtgacgac atggacttta aataccaatt tgtcaaagtc atggttagag 16200
acaccttcgc ccttactcac gcttcgctac gaaaagctgc tcaagcatac tctctacccg 16260
tagagaaggg ctgctgccct tacaaggcag ttaatcagtt ctacatgcta ggatcttacc 16320
gtgcagacaa agacgggttt ccgctagaag agtactggaa ggatcgcgaa gaataccttc 16380
tcaaccgcga actgtgggaa aagaaaaacc aaccaggtta tgacatcatt caagaaacac 16440
ttgactactg cgccctggac gtacttgtca ccgcccaact ggtaaccaag cttgaagaat 16500
cttatgccca ctttatcaga gactctgtag gtctacctca tgcccacttc aacatttttc 16560
aaagacccac catctcttcc aattctcacg ccatctttcg ccagattgtc tacagaacag 16620
aaaaacccaa tcgcaccaac ttgggtccgg ggctgctagc gccgtcacat gaactatatg 16680
actatgtgcg agcaagtatc agaggggggc gatgctatcc aacctacata ggcatctttg 16740
aggatcccat ctacgtctat gacatctgtg gcatgtatgc ctctgcactc acccatccca 16800
tgccctgggg cagtcccctt aacccatatg agcgcgcact ggcagctcga gaatggcaaa 16860
tggccttaga tgaccccact cccatcagct attttgataa ggatttactt cctggaatct 16920
ttaccatgga tgcagaccct cccgatgaac ttatgctaga cccacttcca cctttctgtt 16980
ctaggaaagg aggtaggctc tgctggacca acgaacccct tcgaggcgag gtggccacca 17040
gtgtggattt aattaccttg cataaccgag ggtggcaagt gagaattgtg ccagatgaat 17100
tgacaactat cttccccgaa tggaagtgcc tggcacgcga atatgtccaa ctcaacatcg 17160
ctgccaaaga gcgcgcggac aaggaaaaga accaaaccat gcgatccatt gccaaacttt 17220
tatccaacgc cctgtatgga tcatttgcca ccaaacttga caataaaaaa attgtgtttt 17280
ctgaccaaat ggacgaaaac ctcatgaaag gcatctcaag cggcactgtc aatatcaaat 17340
cctcctcgtt cttagaaact gacaacctga gtgcagaggt catgcccgcc ttcgagaggg 17400
aatacctacc ccaacagctg acgttcctgg acagcgatcc ggaagacagt gaggaagagc 17460
agagaaccgc ccccttttat acccccccag ctgggacccc aggtcacgtg aaatacacct 17520
acaagccaat cacattcctg gatgttgaag agagtgacat gtgtttgcat actttggaaa 17580
aggtggaccc cctggttgac aacgatcgct acccctccca catagcctcc tttgtgctgg 17640
cctggacgcg cgcctttgta tcagagtggt cagagttcct atacgaagaa gaccgaggca 17700
ctccactgga aaagaggcct gtaaaatcag tctacgggga cacggacagc ctgtttgtca 17760
ctcaacgagg acacgaactc atggagacca aaggtaagaa acgcatcaaa aaatatggcg 17820
gaaaacttgt ttttgacccc aatgaaccgg atttaacctg gctggtggaa tgtgaaactg 17880
tttgcgcctc ctgcggcgcg gatgcatact ccccagaatc cattttcctt gcgcccaagc 17940
tgtatgcgct gaaatgccta tactgcccgg tatgcaagaa aacttccaaa ggtaagctcc 18000
gcgccaaggg ccacgcagcc gaggcgctca actacgaact catggtaaac tgctacttgg 18060
ccgacataca gggcgccaag cggcacaagt tttcgaccag caggatgagt ctgaagcgca 18120
ccctggcaag cgcccaagca ggcgcacacc ccttcactgt gacggaaaca accctgaccc 18180
gaactttgag accctggaag gaccgaaccc tggcagcgct ggacgcccat cgtctcatac 18240
cctactccag gagccgtcca aacccgcgaa acgaggaggt ctgctggatc gagatgccat 18300
agaacacatc actgaactgt ggaacagact agaacttttg caacagactc tctccaaaat 18360
gcccatggct gacggtctaa aaccgctgaa aaacttttcc tcactacaag aacttctatc 18420
actaggagga gagcgcctcc taatggattt ggtgcgggaa aatatgcatg taagggaaat 18480
gatgaacgag gtggccccct tgcttcgaga agacggcagt tgccgttccc taaactacca 18540
actgcaacct gtaatcggaa tcatttatgg ccccaccgga tgtggcaaat ctcaattgct 18600
cagaaacttg ctatcatccc aactaattac cccagcccca gaaacggtgt tctttatagc 18660
cccccaggtg gacatgattc caccctcgga actgaaagct tgggaaatgc aaatctgtga 18720
ggggaactat gctccggggc ccgaaggaac attcataccc caatcgggta ctctccgtcc 18780
caaatttatt aaaatggcct atgatgattt aactcaggaa cataactatg atgtgtcaga 18840
cccacggaac gtgtttgccc gcgctgctgc ccacggccct attgctatta tcatggatga 18900
gtgcatggaa aatctcggag gacacaaggg tgtctccaaa tttttccacg cttttccatc 18960
caagctgcac gataaatttc ctaaatgtac cggatacacc gtcttggtgg tacttcataa 19020
catgaaccca agacgagatc ttggcggcaa tattgccaac ttaaaaatcc aatccaaaat 19080
gcacataatt tcaccccgaa tgcacccctc ccagctcaac cggtttgtaa acacctacac 19140
caagggctta tctgtggcaa tcagcctact tctaaaagat attgtgcaac accatgcaca 19200
gcgaccttgt tatgactggg taatttacaa cactaccccg gagcatgaat cccttcaatg 19260
gagctatctc caccccaaag acggcctaat gcccatgtat ctaaacattc aatcccacct 19320
ttataggatt ttggaaaaaa tccaccgtgt tctcaatgat cgagatcggt ggtctagggc 19380
ataccgtgcg cgaaaaatga aataaaaaac acttgatttt aaatcaa 19427
<210> 54
<211> 3748
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 14 sequence
<400> 54
tataaaacgc ctgatgatta gaggccgagg tattcagctt aacgacgagt cggtgagctc 60
tccgcttggt ctacgaccag acggaatctt tcaaattgcc ggctgcggga gatcttcctt 120
cacccctcgt cagactgttt tgactttgga aagttcgtct tcgcaacccc gctcgggcgg 180
aatcgggacc gttcaatttg tggaggagtt tactccctct gtctacttca accctttctc 240
cggatctcct gggcactacc cggacgagtt cataccgaac tttgacgcaa ttagcgagtc 300
agtggacggc tacgattgat gtctggtgac gcggctgagc tatctcggct gcgacatcta 360
gaccactgcc gccgctttcg ctgttttgcc cgggaactca ttgagttcat ttacttcgaa 420
ctccccaagg atcaccctca aggtccggcc cacggagtgc ggattactat cgaaggtaaa 480
ataaactctc gcctgcatcg aattttctcc cagcggcccg tgctgatcga gcgagaccag 540
ggaaacacca cggtttctat ctactgcatt tgtaatcacc caggattgca tgaaagcctt 600
tgctgtctta tgtgtactga gtttaataaa aactgaatta agactctcct acggactgcc 660
gcttcttcaa cccggatttt acaaccagaa gaacgaaact tttcctctca tccaggactc 720
tgttaacttt acctttccta cttacaaacc agaagctcaa cgacaacacc gcttttccag 780
aagcattttc cctactaata ctactttcaa aaccggaggt gagctccaca gtctccccgc 840
agaaaaccct tgggtggaag cgggccttgt agtgctagga attcttgcgg gcgggcttgt 900
gattattctt tgctacctat acacaccttg cttcactttc ctagtggtgt tgtggtattg 960
gtttaaaaaa tggggcccat actagtcttg cttgttttac tttcgctttt gggaccgggt 1020
tctgccaact acaatccatg tctagacttt gacccagaaa actgcacact tacttttgca 1080
cccgacacaa gccgcatctg tggagttctt attaagtgcg gatgggaatg caggtccgtt 1140
gaaattacac acaataacaa aacctggaac aataccttat ccaccacatg ggagccagga 1200
gttcccgagt ggtacactgt ctctgtccga ggtcctgacg gttccatccg cattagtaac 1260
aacactttta ttttttctac aatgtgcgat ctggccatgt tcatgagcaa acagtattct 1320
ctatggcctc ccagcaagga caacattgta acgttctcca ttgcttattg cttgtgcgct 1380
tgccttctta ctgctttact gtgcgtatgc atacacctgc ttgtaaccac tcgtatcaaa 1440
aacgccaata acaaagaaaa aatgccttaa cctctttctg tttacagaca tggcttttct 1500
tacagctctc atacttgtca gcattgtcac tgccgctcac ggacaaacag tcgtctctat 1560
ccctctaggt cataattaca ctctcatagg acccccaatc acttcagagg tcatctggac 1620
caaactggga agcgttgatt actttgatat aatctgtaac aaaacaaaac caataatagt 1680
aacctgcaac atacaaaatc ttacattaat taatgttagc aaagtttaca gcggttacta 1740
ttatggttat gacagataca gtagtcaata tagaaattac ttggttcgtg ttacccagtc 1800
caaaaccacg aaaatgccaa atatggcaga aattcgatcc gatgacaatt ctctagaaac 1860
ttttacatct tccaccacac ctgacgaaaa aaatatccca gattcaatga ttgcaattat 1920
cgcagcggtg gcagtggtga tggcactaac agtaatatgc atgcttttat atgcttgtcg 1980
ctacaaaaag tttcatccta aaaaacaaga tctcctacta aggcttaaca tttaatttct 2040
ttttacacag ccatggtttc cactaccaca ttccttatgc ttactagtat agcaactctg 2100
acttctgctc gctcacacct cactgtaact ataggctcaa actgcacact aaaaggacct 2160
caaggtggtc atgtcttttg gtggagaata tatgacaatg gatggtttac aaaaccatgt 2220
gaccaacctg gtagattttt ctgcaacggc agagacctaa ccattatcaa cgtgacagca 2280
aatgacaaag gcttctatta tggaaccgac tataaaagta gtttagatta taacattatt 2340
gtactgccat ccaccactcc agcgccccgc aaaactactt tctctagcag cagtgccgct 2400
aacaatacaa tttccaatcc aacctttacc gcgcttttaa aacgcactgt gaataattct 2460
acaacaattt ccacttcaac aatcagcatc atcgctgccg tgacaattgg aatatctatt 2520
cttgttttta ccataaccta ctacacctgc tgctataaaa aagacgaaca taaaggtgat 2580
ccattactta gatttgatat ttaatttgtt cttttttttt ttatttacag tatggtgaac 2640
accaatcatg gtacctagaa atttcttctt caccatactc atctgtgctt ttaatgtttg 2700
cgctactttc acagcagtag ccacagcaag cccagactgt ataggagcat ttgcttccta 2760
tgcacttttt gcttttgtca cttgcatctg cgtatgtagc atagtctgcc tggttattaa 2820
ttttttccaa cttctagact ggatccttgt gcgaattgcc tacctgcgcc accatcccga 2880
ataccgcaac caaaatatcg cggcacttct tagacttatc taaaaccatg caggctatac 2940
taccaatatt tttgcttcta ttgcttccct acgctgtctc aaccccagct acctatagta 3000
ctccaccaga acaccttaga aaatgcaaat tccaacaacc gtggtcattt cttgcttgct 3060
atcgagaaaa atctgaaatt cccccaactt taataatgat tgctggaata attaatgtaa 3120
tctgttgcac cataatttca tttctgatat accccctatt tgattttggc tggaatgctc 3180
ccaatgcaca tgattattcc caagacccag aggaacacat tcccctacat aacatgcaac 3240
aaccaatagc gctaatagaa tacgaaagtg aaccacaacc cccactactc cctgctatta 3300
gttacttcaa cctaaccggc ggagatgact gaaacactca ccacctccaa ttccgccgag 3360
gatctgcttg atatggacgg ccgcgtctca gaacagcgac tcgcccaact acgcatccgc 3420
cagcagcagg aacgcgtggc caaagagctc agagatgtca tccaaattca ccaatgcaaa 3480
aaaggcatat tctgtttggt aaaacaagcc aaaatatcct acgagatcac cgctaccgac 3540
catcgcctct cttacgagct tggcccccaa cgacaaaaat ttacctgcat ggtgggaatc 3600
aaccccatag ttatcaccca acaaagtgga gatactaagg gttgcattca ctgctcctgc 3660
gattccatcg agtgcaccta caccctgctg aagaccctat gcggactaag agacctgcta 3720
cccatgaatt aaaaaaatga ttaataaa 3748
<210> 55
<211> 978
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 14 sequence
<400> 55
atgaccaaga gagtccggct cagtgactcc ttcaaccctg tctaccccta tgaagatgaa 60
agcacctccc aacacccctt tataaaccca gggtttattt ccccaaatgg cttcacccaa 120
agcccagacg gagttcttac tttaaaatgt ttaaccccgc taacaaccac aggcgggtct 180
ctacagctaa aagtgggagg gggacttaca gtagatgaca ctgatgggac cttacaagaa 240
aacataggtg ccaccacacc acttgttaag actgggcact ctataggttt atccctagga 300
gccggattgg gaacagatga aaataaactt tgtaccaaat tgggagaagg acttacattc 360
aattcaaaca acatttgcat tgatgacaat attaacaccc tgtggacagg agttaacccc 420
accgaagcca actgtcaaat gatggactcc agtgaatcta atgattgcaa attaattcta 480
acactagtta aaactggagc cctagtcact gcatttgttt atgttatagg agtatctaac 540
aattttaata tgctaactac atacagaaat ataaatttta ctgcggagct gttttttgat 600
tctgcgggta atttactaac tagcctgtca tccctaaaaa ctccacttaa tcataaatca 660
ggacaaaaca tggctactgg tgccattact aatgctaaaa gtttcatgcc cagcacaact 720
gcttatcctt tcaataataa ttctagagaa aaagaaaact acatttacgg aacttgtcac 780
tacacagcta gtgatcacac tgcttttccc attgacatat ctgtcatgct taaccaaaga 840
gcaataagag ctgatacatc atattgtatt cgtataactt ggtcctggaa cacaggagat 900
gccccagagg ggcaaacctc tgctacaacc ctagttacct ccccatttac cttttactac 960
atcagagaag acgactga 978
<210> 56
<211> 273
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 14 sequence
<400> 56
gacggagttc ttactttaaa atgtttaacc ccgctaacaa ccacaggcgg gtctctacag 60
ctaaaagtgg gagggggact tacagtagat gacactgatg ggaccttaca agaaaacata 120
ggtgccacca caccacttgt taagactggg cactctatag gtttatccct aggagccgga 180
ttgggaacag atgaaaataa actttgtacc aaattgggag aaggacttac attcaattca 240
aacaacattt gcattgatga caatattaac acc 273
<210> 57
<211> 576
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 14 sequence
<400> 57
ctgtggacag gagttaaccc caccgaagcc aactgtcaaa tgatggactc cagtgaatct 60
aatgattgca aattaattct aacactagtt aaaactggag ccctagtcac tgcatttgtt 120
tatgttatag gagtatctaa caattttaat atgctaacta catacagaaa tataaatttt 180
actgcggagc tgttttttga ttctgcgggt aatttactaa ctagcctgtc atccctaaaa 240
actccactta atcataaatc aggacaaaac atggctactg gtgccattac taatgctaaa 300
agtttcatgc ccagcacaac tgcttatcct ttcaataata attctagaga aaaagaaaac 360
tacatttacg gaacttgtca ctacacagct agtgatcaca ctgcttttcc cattgacata 420
tctgtcatgc ttaaccaaag agcaataaga gctgatacat catattgtat tcgtataact 480
tggtcctgga acacaggaga tgccccagag gggcaaacct ctgctacaac cctagttacc 540
tccccattta ccttttacta catcagagaa gacgac 576
<210> 58
<211> 1677
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 14 sequence
<400> 58
atgaggcgag tcgtgctagg cggagcggtg gtgtatccgg agggtcctcc tccttcgtac 60
gagagcgtga tgcagcagca gcaggcgacg gcggtgatgc aatccccact ggaggctccc 120
tttgtacctc cgcgatacct ggcacctacg gagggcagaa acagcattcg ttactcggaa 180
ctggcacctc agtacgatac caccaggttg tatctggtgg acaacaagtc ggcggacatt 240
gcttctctga actatcagaa tgaccacagc aacttcttga ccacggtggt gcagaacaat 300
gactttaccc ctacggaagc cagtacccag accattaact ttgatgaacg atcgcggtgg 360
ggcggtcagc taaagaccat catgcatact aacatgccca acgtaaacga gtatatgttt 420
agtaacaact tcaaagcgcg tgtgatggtg tccagaaaac ctcccgaagg tgctgcagtt 480
ggggatacat atgatcacaa gcaggatatt ttggaatatg agtggttcga gtttactttg 540
ccagaaggca acttttcagt tactatgacc attgatttga tgaacaatgc catcatagat 600
aactacttga aagtgggcag acagaatgga gtgcttgaaa gtgacattgg tgttaagttc 660
gacaccagga acttcaagct gggatgggat cccgaaacca agttgattat gcctggagtg 720
tatacgtatg aagcctttca tcctgacatt gtcttactgc ctggctgtgg agtggacttt 780
accgaaagtc gtttgagcaa ccttcttggt atcagaaaaa aacagccatt tcaagagggt 840
tttaagattt tgtatgaaga tttagaagga ggtaatattc cggccctctt ggatgtagat 900
gcctatgaga acagtaagaa agaacaaaaa gccaaaatag aagctgctgc ggaagctaag 960
gcaaacatag ttgccagcga ctttacaagg gttgctaacg ctggagaggt cagaggagac 1020
aattttgcac caacacctgt tccgactgca gaatcattat tggccgatgt aactggagga 1080
acggacgtga aactcactat tcaacctgta gaaaaagata gtaagaatag aagctataat 1140
gtgttggaag ataaaatcaa cacagcctat cgcagttggt acctttcgta caattatggc 1200
gatcccgaaa aaggagtgcg ttcctggaca ttgctcacca cctcagatgt cacctgcgga 1260
gcagagcagg tctactggtc gcttccagac atgatgcagg atcctgtcac tttccgctcc 1320
actagacaag tcagcaacta ccctgtggtg ggtgcagagc ttatgcccgt cttctcaaag 1380
agcttctaca acgaacaagc tgtgtactcc cagcagctcc gccagtccac ctcgcttacg 1440
cacgtcttca accgctttcc tgagaaccag attttaatcc gtccgccggc gcccaccatt 1500
accaccgtca gtgaaaacgt tcctgctctc acagatcacg ggaccctgcc gttgcgcagc 1560
agtatccggg gagtccaacg tgtgaccgtt actgacgcca gacgccgcac ctgtccctac 1620
gtgtacaagg cactgggcat agtcgcaccg cgcgtccttt caagccgcac tttctaa 1677
<210> 59
<211> 2838
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 14 sequence
<400> 59
atggccaccc catcgatgct gccccagtgg gcatacatgc acatcgccgg acaggatgct 60
tcggagtacc tgagtccggg tctggtgcag ttcgcccgcg ccacagacac ctacttcaat 120
ctgggaaata agtttagaaa tcccaccgta gcgccaaccc acgatgtgac caccgaccgt 180
agccagcggc tcatgttgcg cttcgtgccc gttgaccggg aggacaatac atactcttac 240
aaagtgcggt acaccctggc cgtgggcgac aacagagtgc tggatatggc cagcacgttc 300
tttgacatta ggggcgtgtt ggacagaggt cccagtttca aaccctattc tggtacggct 360
tacaactctc tggctcctaa aggcgctcca aatgcatctc agtggttgga taaaggggtt 420
gaaactactg aagaacggca aaatgaagac ggggaaaatg acgaaaaagc tacatacact 480
tttggcaatg ccccagtaaa agccgatgct gacattacaa aagacggact accaataggt 540
ttggaagtcc cagctgaagg tgaccctaaa cctatctacg ctaataagct ttaccaacca 600
gaaccccagg tgggacagga atcgtggact gatacagatg gcactgaaga aaaatacgga 660
ggcagagtac ttaaaccgga cactaaaatg aaaccgtgct atgggtcttt tgctaaacct 720
actaatgtga aaggcggaca ggcaaaagtg aaaacagaag aaggcaacaa cattgaatat 780
gacattgaca tgaacttttt tgacttaaga tcacaaaaac aaggtcttaa acctaagatt 840
gtaatgtatg cagaaaatgt ggacctggaa tctccagata ctcatgttgt gtacaaacct 900
gaagtttcag atgctagttc aaatgctaat cttggacagc agtctatgcc caacagaccc 960
aactacattg gcttcagaga taattttatt ggtcttatgt actataacag tactggtaac 1020
atgggggtgc tggctggcca agcatctcag ttgaatgcag tggttgactt gcaggacaga 1080
aacacagaac tgtcttacca actcttgctt gactccctgg gcgatagaac cagatacttt 1140
agcatgtgga atcaggctgt tgacagttat gatcccgatg tgcgtgttat tgaaaatcat 1200
ggtgtggaag atgaacttcc caactactgt tttccactgg acggcatcgg tccgcgaaca 1260
gatagttaca aggagattca gttaaatgga gaccaagctt ggaaagatgt aaatccaaat 1320
ggtatcagtg aacttgttaa gggaaatcca tttgccatgg aaattaacct tcaagccaat 1380
ctatggcgaa gtttccttta ttccaatgtg gctctgtatc tcccagactc gtacaaatac 1440
accccgtcca atgtcactct tccagaaaac aaaaacacct acgactacat gaacgggcgg 1500
gtggtgccgc catctctagt agacacctat gtgaacattg gcgccaggtg gtctctggat 1560
gctatggaca atgtcaaccc attcaaccac caccgtaacg ctggcttgcg ttaccgatcc 1620
atgcttttgg gtaacggacg ttatgtgcct ttccacatac aagtgcctca aaaattcttc 1680
gctgtcaaaa acctgctgct tctcccaggc tcctacactt atgagtggaa cttcaggaag 1740
gatgtgaaca tggtgctaca gagttccctc ggtaacgacc tacgggtaga tggcgccagc 1800
atcagtttca cgagcatcaa cctctatgct acctttttcc ccatggctca caacaccgct 1860
tccacccttg aagccatgct gcggaatgac accaatgatc agtcattcaa cgactatcta 1920
tctgcagcta acatgctcta tcccattcct gccaatgcaa ccaatattcc catttccatt 1980
ccttctcgca actgggcggc tttcagaggc tggtcattta ccagactcaa aaccaaagaa 2040
actccctctt tggggtctgg atttgacccc tactttgtct attctggttc tattccctac 2100
ctggatggta ccttctacct gaaccacact tttaagaagg tttccatcat gtttgactct 2160
tcagtgagct ggcctggaaa tgacaggtta ctatctccca acgaatttga aataaagcgc 2220
actgtggatg gcgaaggcta caatgtagcc caatgcaaca tgaccaaaga ctggttcttg 2280
gtacagatgc tcgccaacta caacataggc tatcagggct tctacattcc agaaggatac 2340
aaagatcgca tgtattcatt tttcagaaac ttccagccca tgagcaggca ggtggttgat 2400
gaggtcaatt acaaagactt caaggccgtc gccataccct accaacacaa caactctggc 2460
tttgtgggtt acatggctcc gaccatgcgc caaggtcaac cctatcccgc taactatccc 2520
tatccactca ttggaacaac tgccgtaaat agtgttacgc agaaaaagtt cttgtgtgac 2580
agaaccatgt ggcgcatacc gttctcgagc aacttcatgt ctatgggggc ccttacagac 2640
ttgggacaga acatgcttta tgccaactca gctcatgctc tggacatgac ctttgaggtg 2700
gatcccatgg atgagcccac cctgctttat cttctcttcg aagttttcga cgtggtcaga 2760
gtgcatcagc cacatcgcgg catcatcgag acagtctacc tgcgtacacc gttctcggcc 2820
ggtaacgcta ccacgtaa 2838
<210> 60
<211> 325
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 14 sequence
<400> 60
Met Thr Lys Arg Val Arg Leu Ser Asp Ser Phe Asn Pro Val Tyr Pro
1 5 10 15
Tyr Glu Asp Glu Ser Thr Ser Gln His Pro Phe Ile Asn Pro Gly Phe
20 25 30
Ile Ser Pro Asn Gly Phe Thr Gln Ser Pro Asp Gly Val Leu Thr Leu
35 40 45
Lys Cys Leu Thr Pro Leu Thr Thr Thr Gly Gly Ser Leu Gln Leu Lys
50 55 60
Val Gly Gly Gly Leu Thr Val Asp Asp Thr Asp Gly Thr Leu Gln Glu
65 70 75 80
Asn Ile Gly Ala Thr Thr Pro Leu Val Lys Thr Gly His Ser Ile Gly
85 90 95
Leu Ser Leu Gly Ala Gly Leu Gly Thr Asp Glu Asn Lys Leu Cys Thr
100 105 110
Lys Leu Gly Glu Gly Leu Thr Phe Asn Ser Asn Asn Ile Cys Ile Asp
115 120 125
Asp Asn Ile Asn Thr Leu Trp Thr Gly Val Asn Pro Thr Glu Ala Asn
130 135 140
Cys Gln Met Met Asp Ser Ser Glu Ser Asn Asp Cys Lys Leu Ile Leu
145 150 155 160
Thr Leu Val Lys Thr Gly Ala Leu Val Thr Ala Phe Val Tyr Val Ile
165 170 175
Gly Val Ser Asn Asn Phe Asn Met Leu Thr Thr Tyr Arg Asn Ile Asn
180 185 190
Phe Thr Ala Glu Leu Phe Phe Asp Ser Ala Gly Asn Leu Leu Thr Ser
195 200 205
Leu Ser Ser Leu Lys Thr Pro Leu Asn His Lys Ser Gly Gln Asn Met
210 215 220
Ala Thr Gly Ala Ile Thr Asn Ala Lys Ser Phe Met Pro Ser Thr Thr
225 230 235 240
Ala Tyr Pro Phe Asn Asn Asn Ser Arg Glu Lys Glu Asn Tyr Ile Tyr
245 250 255
Gly Thr Cys His Tyr Thr Ala Ser Asp His Thr Ala Phe Pro Ile Asp
260 265 270
Ile Ser Val Met Leu Asn Gln Arg Ala Ile Arg Ala Asp Thr Ser Tyr
275 280 285
Cys Ile Arg Ile Thr Trp Ser Trp Asn Thr Gly Asp Ala Pro Glu Gly
290 295 300
Gln Thr Ser Ala Thr Thr Leu Val Thr Ser Pro Phe Thr Phe Tyr Tyr
305 310 315 320
Ile Arg Glu Asp Asp
325
<210> 61
<211> 91
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 14 sequence
<400> 61
Asp Gly Val Leu Thr Leu Lys Cys Leu Thr Pro Leu Thr Thr Thr Gly
1 5 10 15
Gly Ser Leu Gln Leu Lys Val Gly Gly Gly Leu Thr Val Asp Asp Thr
20 25 30
Asp Gly Thr Leu Gln Glu Asn Ile Gly Ala Thr Thr Pro Leu Val Lys
35 40 45
Thr Gly His Ser Ile Gly Leu Ser Leu Gly Ala Gly Leu Gly Thr Asp
50 55 60
Glu Asn Lys Leu Cys Thr Lys Leu Gly Glu Gly Leu Thr Phe Asn Ser
65 70 75 80
Asn Asn Ile Cys Ile Asp Asp Asn Ile Asn Thr
85 90
<210> 62
<211> 192
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 14 sequence
<400> 62
Leu Trp Thr Gly Val Asn Pro Thr Glu Ala Asn Cys Gln Met Met Asp
1 5 10 15
Ser Ser Glu Ser Asn Asp Cys Lys Leu Ile Leu Thr Leu Val Lys Thr
20 25 30
Gly Ala Leu Val Thr Ala Phe Val Tyr Val Ile Gly Val Ser Asn Asn
35 40 45
Phe Asn Met Leu Thr Thr Tyr Arg Asn Ile Asn Phe Thr Ala Glu Leu
50 55 60
Phe Phe Asp Ser Ala Gly Asn Leu Leu Thr Ser Leu Ser Ser Leu Lys
65 70 75 80
Thr Pro Leu Asn His Lys Ser Gly Gln Asn Met Ala Thr Gly Ala Ile
85 90 95
Thr Asn Ala Lys Ser Phe Met Pro Ser Thr Thr Ala Tyr Pro Phe Asn
100 105 110
Asn Asn Ser Arg Glu Lys Glu Asn Tyr Ile Tyr Gly Thr Cys His Tyr
115 120 125
Thr Ala Ser Asp His Thr Ala Phe Pro Ile Asp Ile Ser Val Met Leu
130 135 140
Asn Gln Arg Ala Ile Arg Ala Asp Thr Ser Tyr Cys Ile Arg Ile Thr
145 150 155 160
Trp Ser Trp Asn Thr Gly Asp Ala Pro Glu Gly Gln Thr Ser Ala Thr
165 170 175
Thr Leu Val Thr Ser Pro Phe Thr Phe Tyr Tyr Ile Arg Glu Asp Asp
180 185 190
<210> 63
<211> 558
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 14 sequence
<400> 63
Met Arg Arg Val Val Leu Gly Gly Ala Val Val Tyr Pro Glu Gly Pro
1 5 10 15
Pro Pro Ser Tyr Glu Ser Val Met Gln Gln Gln Gln Ala Thr Ala Val
20 25 30
Met Gln Ser Pro Leu Glu Ala Pro Phe Val Pro Pro Arg Tyr Leu Ala
35 40 45
Pro Thr Glu Gly Arg Asn Ser Ile Arg Tyr Ser Glu Leu Ala Pro Gln
50 55 60
Tyr Asp Thr Thr Arg Leu Tyr Leu Val Asp Asn Lys Ser Ala Asp Ile
65 70 75 80
Ala Ser Leu Asn Tyr Gln Asn Asp His Ser Asn Phe Leu Thr Thr Val
85 90 95
Val Gln Asn Asn Asp Phe Thr Pro Thr Glu Ala Ser Thr Gln Thr Ile
100 105 110
Asn Phe Asp Glu Arg Ser Arg Trp Gly Gly Gln Leu Lys Thr Ile Met
115 120 125
His Thr Asn Met Pro Asn Val Asn Glu Tyr Met Phe Ser Asn Asn Phe
130 135 140
Lys Ala Arg Val Met Val Ser Arg Lys Pro Pro Glu Gly Ala Ala Val
145 150 155 160
Gly Asp Thr Tyr Asp His Lys Gln Asp Ile Leu Glu Tyr Glu Trp Phe
165 170 175
Glu Phe Thr Leu Pro Glu Gly Asn Phe Ser Val Thr Met Thr Ile Asp
180 185 190
Leu Met Asn Asn Ala Ile Ile Asp Asn Tyr Leu Lys Val Gly Arg Gln
195 200 205
Asn Gly Val Leu Glu Ser Asp Ile Gly Val Lys Phe Asp Thr Arg Asn
210 215 220
Phe Lys Leu Gly Trp Asp Pro Glu Thr Lys Leu Ile Met Pro Gly Val
225 230 235 240
Tyr Thr Tyr Glu Ala Phe His Pro Asp Ile Val Leu Leu Pro Gly Cys
245 250 255
Gly Val Asp Phe Thr Glu Ser Arg Leu Ser Asn Leu Leu Gly Ile Arg
260 265 270
Lys Lys Gln Pro Phe Gln Glu Gly Phe Lys Ile Leu Tyr Glu Asp Leu
275 280 285
Glu Gly Gly Asn Ile Pro Ala Leu Leu Asp Val Asp Ala Tyr Glu Asn
290 295 300
Ser Lys Lys Glu Gln Lys Ala Lys Ile Glu Ala Ala Ala Glu Ala Lys
305 310 315 320
Ala Asn Ile Val Ala Ser Asp Phe Thr Arg Val Ala Asn Ala Gly Glu
325 330 335
Val Arg Gly Asp Asn Phe Ala Pro Thr Pro Val Pro Thr Ala Glu Ser
340 345 350
Leu Leu Ala Asp Val Thr Gly Gly Thr Asp Val Lys Leu Thr Ile Gln
355 360 365
Pro Val Glu Lys Asp Ser Lys Asn Arg Ser Tyr Asn Val Leu Glu Asp
370 375 380
Lys Ile Asn Thr Ala Tyr Arg Ser Trp Tyr Leu Ser Tyr Asn Tyr Gly
385 390 395 400
Asp Pro Glu Lys Gly Val Arg Ser Trp Thr Leu Leu Thr Thr Ser Asp
405 410 415
Val Thr Cys Gly Ala Glu Gln Val Tyr Trp Ser Leu Pro Asp Met Met
420 425 430
Gln Asp Pro Val Thr Phe Arg Ser Thr Arg Gln Val Ser Asn Tyr Pro
435 440 445
Val Val Gly Ala Glu Leu Met Pro Val Phe Ser Lys Ser Phe Tyr Asn
450 455 460
Glu Gln Ala Val Tyr Ser Gln Gln Leu Arg Gln Ser Thr Ser Leu Thr
465 470 475 480
His Val Phe Asn Arg Phe Pro Glu Asn Gln Ile Leu Ile Arg Pro Pro
485 490 495
Ala Pro Thr Ile Thr Thr Val Ser Glu Asn Val Pro Ala Leu Thr Asp
500 505 510
His Gly Thr Leu Pro Leu Arg Ser Ser Ile Arg Gly Val Gln Arg Val
515 520 525
Thr Val Thr Asp Ala Arg Arg Arg Thr Cys Pro Tyr Val Tyr Lys Ala
530 535 540
Leu Gly Ile Val Ala Pro Arg Val Leu Ser Ser Arg Thr Phe
545 550 555
<210> 64
<211> 945
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 14 sequence
<400> 64
Met Ala Thr Pro Ser Met Leu Pro Gln Trp Ala Tyr Met His Ile Ala
1 5 10 15
Gly Gln Asp Ala Ser Glu Tyr Leu Ser Pro Gly Leu Val Gln Phe Ala
20 25 30
Arg Ala Thr Asp Thr Tyr Phe Asn Leu Gly Asn Lys Phe Arg Asn Pro
35 40 45
Thr Val Ala Pro Thr His Asp Val Thr Thr Asp Arg Ser Gln Arg Leu
50 55 60
Met Leu Arg Phe Val Pro Val Asp Arg Glu Asp Asn Thr Tyr Ser Tyr
65 70 75 80
Lys Val Arg Tyr Thr Leu Ala Val Gly Asp Asn Arg Val Leu Asp Met
85 90 95
Ala Ser Thr Phe Phe Asp Ile Arg Gly Val Leu Asp Arg Gly Pro Ser
100 105 110
Phe Lys Pro Tyr Ser Gly Thr Ala Tyr Asn Ser Leu Ala Pro Lys Gly
115 120 125
Ala Pro Asn Ala Ser Gln Trp Leu Asp Lys Gly Val Glu Thr Thr Glu
130 135 140
Glu Arg Gln Asn Glu Asp Gly Glu Asn Asp Glu Lys Ala Thr Tyr Thr
145 150 155 160
Phe Gly Asn Ala Pro Val Lys Ala Asp Ala Asp Ile Thr Lys Asp Gly
165 170 175
Leu Pro Ile Gly Leu Glu Val Pro Ala Glu Gly Asp Pro Lys Pro Ile
180 185 190
Tyr Ala Asn Lys Leu Tyr Gln Pro Glu Pro Gln Val Gly Gln Glu Ser
195 200 205
Trp Thr Asp Thr Asp Gly Thr Glu Glu Lys Tyr Gly Gly Arg Val Leu
210 215 220
Lys Pro Asp Thr Lys Met Lys Pro Cys Tyr Gly Ser Phe Ala Lys Pro
225 230 235 240
Thr Asn Val Lys Gly Gly Gln Ala Lys Val Lys Thr Glu Glu Gly Asn
245 250 255
Asn Ile Glu Tyr Asp Ile Asp Met Asn Phe Phe Asp Leu Arg Ser Gln
260 265 270
Lys Gln Gly Leu Lys Pro Lys Ile Val Met Tyr Ala Glu Asn Val Asp
275 280 285
Leu Glu Ser Pro Asp Thr His Val Val Tyr Lys Pro Glu Val Ser Asp
290 295 300
Ala Ser Ser Asn Ala Asn Leu Gly Gln Gln Ser Met Pro Asn Arg Pro
305 310 315 320
Asn Tyr Ile Gly Phe Arg Asp Asn Phe Ile Gly Leu Met Tyr Tyr Asn
325 330 335
Ser Thr Gly Asn Met Gly Val Leu Ala Gly Gln Ala Ser Gln Leu Asn
340 345 350
Ala Val Val Asp Leu Gln Asp Arg Asn Thr Glu Leu Ser Tyr Gln Leu
355 360 365
Leu Leu Asp Ser Leu Gly Asp Arg Thr Arg Tyr Phe Ser Met Trp Asn
370 375 380
Gln Ala Val Asp Ser Tyr Asp Pro Asp Val Arg Val Ile Glu Asn His
385 390 395 400
Gly Val Glu Asp Glu Leu Pro Asn Tyr Cys Phe Pro Leu Asp Gly Ile
405 410 415
Gly Pro Arg Thr Asp Ser Tyr Lys Glu Ile Gln Leu Asn Gly Asp Gln
420 425 430
Ala Trp Lys Asp Val Asn Pro Asn Gly Ile Ser Glu Leu Val Lys Gly
435 440 445
Asn Pro Phe Ala Met Glu Ile Asn Leu Gln Ala Asn Leu Trp Arg Ser
450 455 460
Phe Leu Tyr Ser Asn Val Ala Leu Tyr Leu Pro Asp Ser Tyr Lys Tyr
465 470 475 480
Thr Pro Ser Asn Val Thr Leu Pro Glu Asn Lys Asn Thr Tyr Asp Tyr
485 490 495
Met Asn Gly Arg Val Val Pro Pro Ser Leu Val Asp Thr Tyr Val Asn
500 505 510
Ile Gly Ala Arg Trp Ser Leu Asp Ala Met Asp Asn Val Asn Pro Phe
515 520 525
Asn His His Arg Asn Ala Gly Leu Arg Tyr Arg Ser Met Leu Leu Gly
530 535 540
Asn Gly Arg Tyr Val Pro Phe His Ile Gln Val Pro Gln Lys Phe Phe
545 550 555 560
Ala Val Lys Asn Leu Leu Leu Leu Pro Gly Ser Tyr Thr Tyr Glu Trp
565 570 575
Asn Phe Arg Lys Asp Val Asn Met Val Leu Gln Ser Ser Leu Gly Asn
580 585 590
Asp Leu Arg Val Asp Gly Ala Ser Ile Ser Phe Thr Ser Ile Asn Leu
595 600 605
Tyr Ala Thr Phe Phe Pro Met Ala His Asn Thr Ala Ser Thr Leu Glu
610 615 620
Ala Met Leu Arg Asn Asp Thr Asn Asp Gln Ser Phe Asn Asp Tyr Leu
625 630 635 640
Ser Ala Ala Asn Met Leu Tyr Pro Ile Pro Ala Asn Ala Thr Asn Ile
645 650 655
Pro Ile Ser Ile Pro Ser Arg Asn Trp Ala Ala Phe Arg Gly Trp Ser
660 665 670
Phe Thr Arg Leu Lys Thr Lys Glu Thr Pro Ser Leu Gly Ser Gly Phe
675 680 685
Asp Pro Tyr Phe Val Tyr Ser Gly Ser Ile Pro Tyr Leu Asp Gly Thr
690 695 700
Phe Tyr Leu Asn His Thr Phe Lys Lys Val Ser Ile Met Phe Asp Ser
705 710 715 720
Ser Val Ser Trp Pro Gly Asn Asp Arg Leu Leu Ser Pro Asn Glu Phe
725 730 735
Glu Ile Lys Arg Thr Val Asp Gly Glu Gly Tyr Asn Val Ala Gln Cys
740 745 750
Asn Met Thr Lys Asp Trp Phe Leu Val Gln Met Leu Ala Asn Tyr Asn
755 760 765
Ile Gly Tyr Gln Gly Phe Tyr Ile Pro Glu Gly Tyr Lys Asp Arg Met
770 775 780
Tyr Ser Phe Phe Arg Asn Phe Gln Pro Met Ser Arg Gln Val Val Asp
785 790 795 800
Glu Val Asn Tyr Lys Asp Phe Lys Ala Val Ala Ile Pro Tyr Gln His
805 810 815
Asn Asn Ser Gly Phe Val Gly Tyr Met Ala Pro Thr Met Arg Gln Gly
820 825 830
Gln Pro Tyr Pro Ala Asn Tyr Pro Tyr Pro Leu Ile Gly Thr Thr Ala
835 840 845
Val Asn Ser Val Thr Gln Lys Lys Phe Leu Cys Asp Arg Thr Met Trp
850 855 860
Arg Ile Pro Phe Ser Ser Asn Phe Met Ser Met Gly Ala Leu Thr Asp
865 870 875 880
Leu Gly Gln Asn Met Leu Tyr Ala Asn Ser Ala His Ala Leu Asp Met
885 890 895
Thr Phe Glu Val Asp Pro Met Asp Glu Pro Thr Leu Leu Tyr Leu Leu
900 905 910
Phe Glu Val Phe Asp Val Val Arg Val His Gln Pro His Arg Gly Ile
915 920 925
Ile Glu Thr Val Tyr Leu Arg Thr Pro Phe Ser Ala Gly Asn Ala Thr
930 935 940
Thr
945
<210> 65
<211> 114
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 16 sequence
<400> 65
cattatctat aatatacctt atagatggaa tggtgccaac atgtaaatga ggtaatttaa 60
aaaagtgcgc gctgtgtggt gattggctgc ggggtgaacg gctaaaaggg gcgg 114
<210> 66
<211> 114
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 16 sequence
<400> 66
ccgccccttt tagccgttca ccccgcagcc aatcaccaca cagcgcgcac ttttttaaat 60
tacctcattt acatgttggc accattccat ctataaggta tattattgat aatg 114
<210> 67
<211> 365
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 16 sequence
<400> 67
gcaatgctgg gatgtgacgt aacttatgtg ggaggagtta tgttgcaagt tatcgcggta 60
aaggtgacgt aaaacgaggt gtggtttgga cacggaagta gacagttttc ccacgtttac 120
tgacaggata tgaggtagtt ttgggcggat gcaagtgaaa attctccatt ttcgcgcgaa 180
aactgaatga ggaagtgaat ttctgagtca tttcgcggtt atgacagggt ggagtatttg 240
ccgagggccg agtagacttt gaccgtttac gtggaggttt cgattaccgt gtttttcacc 300
taaatttccg cgtacggtgt caaagtcctg tgtttttacg taggtgtcag ctgatcacta 360
gggta 365
<210> 68
<211> 3431
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 16 sequence
<400> 68
tttaaacctg tcgagttccg tcaagaggcc actcttgagt gccagcgaga agagttttct 60
cctccgcgct gcgagtcagt tttgcgcttt gaaaatgaga cacctgcgat tcctgccaca 120
ggagattatc tccagcgaga ccgggatcga aatactggag tttgtggtaa ataccctgat 180
gggagatgac ccggaaccgc cagtgcagcc tttcgatcca cctacgctgc acgatctgta 240
tgatttagag gtagacgggc ctgatgatcc caatgaggaa gctgtaaatg ggttttttac 300
tgattctatg ctgctagctg ccgatgaagg attggacata aaccctcctc ctgagaccct 360
tgatacccca ggggtggttg tggaaagcgg cagaggtggg aaaaaattgc ctgatctggg 420
agcagctgaa atggacttgc gttgttatga agagggtttt cctccgagtg atgatgaaga 480
cggggaaact gaacagtcca tccataccgc agtgaatgag ggagtaaaag ctgccagcga 540
tgtttttaag ttggactgtc cggagctgcc tggacatggc tgtaagtctt gtgaatttca 600
caggaataac actggaatga aagaactatt gtgctcgctt tgctatatga gaatgcactg 660
ccactttatt tacagtaagt gtatttaagt gaaatttaaa ggaatagtgt agctgtttaa 720
taactgttga atggtagatt tatgtttttg cttgcgattt tttgtaggtc ctgtgtctga 780
tgatgagtca ccttctcctg attcaactac ctcacctcct gaaattcagg cgcccgtacc 840
tgcaaacgta tgcaagccca ttcctgtgaa gcctaagtct gggaaacgcc ctgctgtgga 900
taagcttgag gacttgttgg agggtgggga tggacctttg gaccttagta cccggaaact 960
gccaaggcaa tgagtgccct gcagctgtgt ttatttagtg acgtcatgta ataaaattat 1020
gtcagctgct gagtgtttta ttgcttcttg ggtggggact tggatatata agtaggagca 1080
gatctgtgtg gttagctcat agcaacctgc tgccatccat ggaggtttgg gctatcttgg 1140
aagacctgag acagactagg ctactgctag aaaacgcctc ggacggagtc tctggctttt 1200
ggagattctg gttcggtggc gatctagcta ggctagtgtt taggataaaa caggactata 1260
gggaagaatt tgaaaagtta ttggacgaca gtccaggact ttttgaagct cttaacttgg 1320
gccatcaggc tcattttaag gagaaggttt tatcagtttt agatttttct actcctggta 1380
gaactgctgc tgctgtagct tttcttactt ttatattgga taaatggatc cgccaaaccc 1440
acttcagcaa gggatacgtt ttggatttca tagcagcagc tttgtggaga acatggaagg 1500
ctcgcaggat gaggacaatc ttagattact ggccagtgca gcctctggga gtagcaggga 1560
tactgagaca cccaccggcc atgccagcgg ttctggagga ggagcagcag gaggacaatc 1620
cgagagccgg cctggaccct ccggtggagg agtagctgac ttgtttcctg aactgcgacg 1680
ggtgcttact aggtctacgt ccagtggaca ggacaggggc attaagaggg aaaggaatcc 1740
tagtgggaat aattcaagaa ccgagttggc tttaagttta atgagccgta ggcgtcctga 1800
aactgtttgg tggcatgagg ttcagagcga aggcagggat gaagtttcaa tattgcagga 1860
gaaatattca ctagaacaac ttaagacctg ttggttggaa cctgaggatg attgggaggt 1920
ggccattagg aattatgcta agatatctct gaggcctgat aaacagtata gaattactaa 1980
gaagattaat attagaaatg catgctacat atcagggaat ggggcagagg ttataataga 2040
tacacaagat aaagcagctt ttagatgttg tatgatgggt atgtggccag gggttgtcgg 2100
catggaagca gtaacattta tgaatattag gtttaaaggg gatgggtata atggcattgt 2160
atttatggct aacactaagc tgattctaca tggttgtagc ttttttgggt ttaataatac 2220
ttgtgtagaa gcttgggggc aagttagtgt gaggggttgt agtttttatg catgctggat 2280
tgcaacatca ggtagggtca agagtcagtt gtctgtgaag aaatgcatgt ttgagagatg 2340
taatcttggc atactgaatg aaggtgaagc aagggtccgc cactgcgcag ctacagaaac 2400
tggctgcttc attctaataa agggaaatgc cagtgtgaag cataatatga tctgtggaca 2460
ttcgaatgag aggccttatc agatgctgac ctgcgctggt ggacattgca atattctggc 2520
taccgtgcat atcgtttccc atgcacgcaa gaaatggcct gtatttgaac ataatgtgat 2580
taccaagtgc accatgcaca taggtggtcg caggggaatg tttatgcctt accagtgtaa 2640
catgaatcat gtgaaggtga tgttggaacc agatgccttt tccagagtaa gcttaacagg 2700
aatctttgat atgaatattc aactatggaa gatcctgaga tatgatgaca ctaaaccgag 2760
ggtgcgcgca tgcgaatgcg gaggcaagca tgctagattc cagccggtgt gcgtggatgt 2820
gactgaagac ctgagacccg atcatttggt gcttgcctgc actggagcgg agttcggttc 2880
tagtggtgaa gaaactgact aaagtgagta gtgggacgag ctgtggaggt gggactttga 2940
ggttggtaag gtgggcagat tgggtaaatt ttgttaattt ctgtcttgca gctgccatga 3000
gtggaagcgc ttcttttgag gggggagtat ttagccctta tctgacgggc aggctcccac 3060
catgggcagg agttcgtcag aatgtcatgg gatccactgt ggatgggaga cccgtccagc 3120
ccgccaattc ctcaacgctg acctatgcca ctttgagttc gtcaccattg gatgcagctg 3180
cagccgccgc cgctactgct gccgccaaca ccatccttgg aatgggctat tacggaagca 3240
tcgttgccaa ttccagttcc tctaataacc cttcaaccct ggctgaggac aagctacttg 3300
ttctcttggc tcagctcgag gccttaaccc aacgcttagg cgaactgtct aagcaggtgg 3360
cccagttgcg tgagcaaact cagtctgctg ttgccacagc aaagtctaaa taaagatctt 3420
aaatcaataa a 3431
<210> 69
<211> 19627
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 16 sequence
<400> 69
atggccagcc gcggaggaaa tcagtcaagc gaccgccaac gggagcacac ccccgaacgc 60
ggaatgggct ctgccagcca tccgcctcca aggccagacc gcagcccatc tcagtcgcct 120
ccacctctgc ccccgaagag gaacacctac cgtcgcgtgg ggtccgattc ttctatcgag 180
agccaggtgg tactggtaag cgaaacttcg cggtcatccc tgtctccgga acggagcaac 240
agtcctcccc cgatccctcc caagaagaag cccaggaaga ccaagcatgt ccctctgcaa 300
gacatcagcc aggacagcga agaagaaaga gaacaggctc agttggtggc cgtgggcttc 360
agctaccccc cggtgcgcat cattgagaag gatggcaaga gaagtgttga gaagatcgac 420
aagaatgacc ctatagctaa aggagctact tctattgctg ttaggaatcc tttgagcttg 480
cccctggtat ctgcctggga gaagggcatg gaagtgatgg ctgtgctaat ggagaggtat 540
aggctggata atgacctgag aacctctttc aagctgatgc cagagcagca cgagcagtac 600
aagcgtatct gccaccagta tgtgaacgag gagcaccgtg gcattccgct gacatttagt 660
agcatgaaga ccctgacagc gatgatggga agattcatgc agggattggt gcattcttat 720
tctgagatcg cccacaataa ttgggagtgc accgggtgcg ctctgtgggc tcatggatgc 780
accgattacg aaggcaaggt gaaatgcctg catggcacta tcatgatcca gaaggaccac 840
attatcgaga tggatgtggc gagcgagaac gggcagcgcg ctatgaagga gaacccagac 900
agagccaaga tcacccagaa ccgctggggc agaaatgtgg ttcagttggc caacaacgat 960
gcccgctgct gtgtaaatga tgccaactgt gctactaacc aattttccag caagtcctgt 1020
ggaatgttct acaccgaggg aagtaaggct caggaagctt tcaagcagta cgaagccttc 1080
atgaaggccg tatatccagg gataaccccc gaccaagcca ggatgatgct gattcccatt 1140
cattgcgatt gcaaccacaa gccaggctgc gctcccgtga tgggcaggca gacctgtaag 1200
atgaccccct ttgggatggc caatgctgaa gacttggatg tgactaccat cagtgacccg 1260
accgtgctgg caagcgtgag acacccagcc ttgatggtgt tccagtgttg caacccagtg 1320
taccgcaact cccgtgtcca gaatgccggc cccaactgtg atttcaagat ctctgctcct 1380
gacctgcttg gcgccctgca actgaccaga aagttgtggc aagacacctt tcccgagatt 1440
ccagttccca agctggtgat ccccgagttc aagtggcaga acaggttaca gttccgcaac 1500
gtatccctgc ccgcgggcca ctatgactcc cgccagaacc catttgattt ctgagtgaat 1560
gatgaaaacg aatgagcaaa aaaccagagc cttagtgcat gtaaaaataa agtgcttttt 1620
attgaacacg gttttacatg acttattgca tatccatacg gtcaaacgcg gtggcccttt 1680
cgatgcgtgc gcggtgagaa cgaaagtaag atgagtgggt gtttaggaag cggtatagtg 1740
cctcctggtt gcggcgcagg gtgggctgga cttggggaga ttggagcatg ctgttgggca 1800
ccccagtcag caacttcatg gtggggtttc cgttcatggg acggtcgggc cagtgcacaa 1860
aggcatgaag gaacatacag caaaaaagtc cacaggcggc tgagcgtggg ccctgcacgc 1920
tctgggtgga cttttccagg gtgatgcagc ggtctttggt agcaagggca ctgcggcgca 1980
ggagcccctc gtactcaaac tggtaaatct gtttgagtcg ctcatccgag aacccaaaag 2040
gatcaaaaag gtagcaggtg ttggagcgcg ggttccaacc aaaagccagc cagtgctctc 2100
cccccgtctc gcgtccggca gtgttgacta tggcgcaggc gagcttgtcg ggggccatga 2160
accccgggaa acgcttgtca aaggttccca ggaaataggg accgcaaccc aggtctcgga 2220
cgatggcttt gagctcttgc tcgctggagc cgtttccgga cccgcatgac atggctgcag 2280
ctgctgcttg caagaagcaa gaggcttctt atgtggtggc gttgccggcc gagaacggtg 2340
tgcgcaggta gacggcctcg atgacgccgc ggtgtggctg gtgcactctg accacgtcga 2400
agacttcgaa aagaagataa agcagggtgg gctcatccat gggatccacc tcaaaagtca 2460
tgtccagtgc atgggccgag ttggcataga gcaggttttg tcccaggtct gtaagggccc 2520
ccatggacat gaagttgctg gagaacggta tgcgccacat ggtcctgtcg cacaggaact 2580
ttttttgggt aacactctta acggcagtag ttccgatgag cgggtatgga taattggctg 2640
ggtaaggttc cccttgtctc atagtaggcg caaggtatcc tacaaagcca gagttgttgt 2700
gttgatatgg taaggtgacg gctttgtagt cagtgtaatt aacctcatca accacctgcc 2760
tgctcatagg ctggaagttt ctgaaaaagg agtacatgcg atccttgtat ccctcaggga 2820
tgtaaaagcc ctggtagcca atgttgtagt tggcgagcat ctgtaccaag aaccagtctt 2880
tggtcatgtt gcattgggct acgttgtagc cttcgccatc cacagtgcgc tttatttcaa 2940
attcgttagg agatagtaac ctgtcatttc caggccagct cactgaagag tcaaacatga 3000
tggaaacctt cttaaaagtg tgatttagat agaaggtacc atccaggtag ggaatagaac 3060
cggaatagac aaagtatggg tcaaatccag accccaaaga gggagtttct ttggttttca 3120
gtctggtaaa tgaccagcct ctgaaagccg cccagttgcg agaaggaatg gaaatgggaa 3180
tattggttgc gttggcaggt atggggtaga gcatgttagc tgcagatagg tagtcgttga 3240
atgactgatc attggtgtca ttccgcagca tggcttcaag ggtggaagcg gtgttgtgag 3300
ccatggggaa aaaagtagca taaagattga tgctcgtgaa actgatgctg gcgccatcta 3360
cccgtaggtc gttaccaagg gaactctgta gaaccatgtt tacatccttc ctaaagttcc 3420
actcataagt gtaggagcct gggagaagca gcaggttttt aacagcgaag aatttttgag 3480
gcacttgtat gtggaaaggc acataacgtc cgttacccag aagcatggat cggtaacgca 3540
agccagcgtt acggtggtgg ttgaatgggt tgacattgtc catggcatcc agagaccacc 3600
tggcaccaat gttcacatag gtgtctacta gagatggcgg caccacccgc ccgttcatgt 3660
agtcgtaggt gtttttgttt tctgggagag tgacattgga cggggtgtat ttatacgagt 3720
ctgggagata caaagccaca ttggaataaa ggaaacttcg ccatagattg gcttggatgt 3780
tgatttccat ggcaaaagga ttgcctccat ggatttcatt agcagtacta actgtggtgt 3840
catctttgtc ccactgtgtt ccactggttc cagcaactgc atctgtttta actttaacac 3900
cttggtaagt gtctgtaaat cccacaccat tcaacggaaa gcaatagttt ggcaattcgt 3960
cctccacacc atggttttca ataatacgca catcaggatc atagctgtcc accgcctgat 4020
tccacatact gaaataccgg gttctgtcac ccagagagtc aagcaagagc tggtaggaca 4080
gttcagtgtt tctgtcttgc aagtcaacca cagcattcag ctgagaggcc tgaccggcca 4140
gcacccccat attgccagtg ctgttgtagt acatgagccc aataaaattg tctctgaagc 4200
caatgtagtt gggtctgtta ggcatggctt gctgacccaa attggattca gagctggtgt 4260
cctctgttcc aggtttgtat acaatatgag tatctggagt ctgcaagtca acattttctg 4320
tgtacattac aatatctgga tcgtagttag cagcaatatt tttgttgtca aagaaagcca 4380
gatctatatc atagttagga gtggtggcgg cggtttctga atcttttaag ttagcctgac 4440
caccttcttt gttggtaggc ttggcgaaag aaccatagca gggtttcatc tttgtagtgt 4500
ccttcagagc tctgcctcca tatttttcct ctgtaccatt ggcgtcaacc caactggcat 4560
ttccaacttg tggttctggt tggaaagttt tatcagcata aattactgtg tcagttccag 4620
aagttgaatc tattccaata ggcagcccat cagcttctat ctttttccca gtaacaccgg 4680
gcatggcagc taccccaaag gtatgcattt tgctgtcaga atccttccac tggcaggtgt 4740
tgggcgctcc cttgggagcc aggctgttgt aggcggtccc ggagtagggt ttgaagctag 4800
ggccccggtc cagcacgccg cggatgtcaa agaacgtgct ggccatatcc agtactctgt 4860
tgtcccctac agccagcgtg tagcgaactt tgtaagagta ggtattgtct tcccggtcaa 4920
cgggcacgaa gcgcagcatt agtcgctggc tacggtcggt ggtcacatcg tgggtgggcg 4980
ccactgtggg gtttctaaac ttgttcccca tactgaagta ggtgtctgtt gcacgggcga 5040
actgcaccag acccggactc aggtactccg aagcatcctg tccggcgatg tgcatgtatg 5100
cccattgggg catcatcgat ggggtggcca tcttgaaagc aactcagcct cggcgcgcga 5160
cctcttcctt tctcctctgc tgcggcggca tggtgatgat acatacacac agacaagcaa 5220
gttaagcgct actccatatt taattaatag cagcgacggc gctttacact ctgcacgccc 5280
agacccacga tgctgttcag agtactctgc cagtttgctt tcgggcgcgg tgtgccccag 5340
gacgcggtct ggctacggcg acgggctgta cggcggtggg ctttctggta gcgacaggtt 5400
tgggaatagg cgccgcagaa gcagggggag gaggcaagtc caaggtggca ggccgatgcg 5460
actgagaagg tttcatcacc ccggtagcca tgtgagctac aggcctggta gtgggcattc 5520
cgagctttac tgcctcctcg tatgaagggg gctcgtctgc gcgcgtcacc aacgtctgtt 5580
ccagctcggg acgcggtcgc ttgtcgcccc gcttctccag cggaggaagc tcttcctcca 5640
cttccatttc accaggagtt gcgggcggcg ggtccaggcg gctgtttatc tgtttctgca 5700
cagcctggtt ggctagatcc actacgccgt taataccaga ggcgatacca tcgaccacct 5760
tttgttggaa gttctgctcc ttaagcttat ttctaagggc ctgccctgtg ctgctgttcc 5820
aagctttgtt cccataggtt tttatggtcg agccaaaatt tttaagcccg ctccagatac 5880
tgctccaatt gaaggcgccc ccgttcagtt ggctcgtgcc gatgtcgctc caggtgccca 5940
tgtacggcct cgtgccgtgt cgcggagcca gggatgaaaa attgatgtct tccatctcta 6000
caaaaacata gtcacaggac caggagcgtc agagtccatt ctatttttta tttataaatt 6060
tttccattgt tagtggcgct gcgaggcctg aaccgccacg gaagctatgc ctggtatcgc 6120
cccgatcgcc gcggcgatga tgggtataag agctggcaga aagccacccc ctaatcgctt 6180
gctgatagcg cgccttcgtc tgtggcggcg catccctcgc cccaacatcc ttctacggcg 6240
cgagtttctt cctcggtagc cagtaatggg gacgcgaagg cggcaagtga gagccatatc 6300
tgcaaggagg cagcgtcaac agtcattaag tggtgatgct tggatgatag cgcgcgcgcg 6360
gcagcgtcag aggttcagcg cgaccatcgc ggtacactct ccgcaccagg gcggcgggag 6420
ttaatttgct ggcagtggtg cggcggcggc gacggcgagt gcgacttgca ggtagtttgc 6480
ggcggcgtga ggtgttgctc cgacttcgat agtagcgagt gcctctgtaa cccggagtgg 6540
gaatgatgga tgggtgcaga gcatagttgg gcattagcag acttgctggg ccatactttc 6600
gacgtgatct tctagtggtg ctgggggcgg caacgggcgc gggcatccag ggttccgtct 6660
gaacctcaat tgaggtgact gtgggttttg caggttcggt ctgcacttcc atggactcag 6720
tgggaatctt gatgtcaaag gtttgtactc ccaaacctgg cgccacttcc ttgatgggtc 6780
tcactttcac ctcaggctgg atatcggcat ccactttcat tttctccagt acgtcttcta 6840
atctctgccg cttgggcacc attagctgca tggtgggata taggtcctca ccctcgcgct 6900
ttacgcctct gctcgcaggt acgggcagca cttgctgcag ggtgactggt ttgaggctag 6960
gggtgggatt tccatgatcc aagggaatag ataccgcctc ctctttggga ctggatcttg 7020
tgcgcttgcc ataagcaaac tcgccaaggc ggtctgccgc ctgctcaata atatcgtcat 7080
ccccatacac ctcatcatag gaccgtttaa aagtagtgct ggaacgctcg ccaggtgtaa 7140
agaccacagt ggtcccgggt ctaagcactt ggcgtacttt tcgaccgcgc cactgcacgc 7200
gccgtcttgg cgcgaactcg cgcacaaact ccaccagtcc atcatcgcca tcttcttctt 7260
ttttgtcctt tttaacccgc ttgattttgc ggggcttttt ttcatccttc atcggcggac 7320
cgtagatttc aggcgcgatg acctggagca tctcttcctt gtatttgcgc ttggacatac 7380
ttgccgctgg gacacaacat cggagactgc tcagtatctt ctaagtgcga ggggggcggg 7440
tgcgcacggg cacgcgctgg ccggtagtgg catcgcgcac ccaatacaca ttgcctcttc 7500
gcggttgggc catgttggca atggccgctg ctgccgccgt ggccgcgcgc ctgcgggacc 7560
tgccgctgct agcaccagaa gccgcgcgtc tggccgctct aagcatggct cttcgtccca 7620
cacgtttggc cctccgcaga atagcttttg cagctcgcat agcgggagta gccctgtggc 7680
gcctggcgat gcgcctcctt cggctcttcc ggcgagcata ggcgcgagcg tctgccacta 7740
cactgtcaat aactgcatcc acagtagatg taggcgcagt aggagtataa ttacgagcat 7800
cggcaaccac ctggtcgatc acatcatcga ccgtggtccg agtgcgggta cggcccttga 7860
gggcgcccca gggagcgcgg aaatgaccgc gaacgcgcac ggggtgctgg gtagagcgtt 7920
tgcgggcgcc tccgtacatc ttggtgggcg catgcagtcc ccaaccggta ttattactgg 7980
gcgagatgag aatggacatt tttttttttt tttagaaagt gcggcttgaa agaacgcgcg 8040
gcgcgactat gcccagggcc ttgtaaacgt agggacaggt gcgacgtctg gcgtcagtaa 8100
cggtcacgcg ctggactccc cggatactgc tgcgtaacgg cagggtcccg tgatctgtga 8160
gagcaggaac gttttcactg atggtggtaa ttgtgggcgc cggcgggcgg atgaggatct 8220
ggttctcagg gaagcggttg aagacgtgcg tgagcgaggt ggactgtcgg agctgctgag 8280
agtacacggc ttgctcattg tagaaactct ttgagaagac cggcataagc tctgcaccca 8340
ctactgggta gttgttgact tgtctcgagg agcggaaggt gatggggtct tgcatcatgt 8400
cggggagcga ccagtagacc tgctcggctc cacaggtgac atccgaagtg gtgagcagtg 8460
tccaggacct tattcctttc tcagggttac cataattgta ggacaggtac cagctgcggt 8520
aggctgtgtt gattttgtct tccaagacat tgtagcttct attcttgctg tctttttcta 8580
aaggttggat ctttaactct tttttaactt cagacataag taatagttct gcagctgcag 8640
cttcacgttt ttgtttttca gttatataag tatctcctct agttatatta tcatcttcac 8700
tggtttcctc tgcaacagcc actgtggttg ttttaaccac cgccttttcg cctgtttcag 8760
tagtggtatc ctttttgctt tcctcatagg cagtgacatc caaaagggca ggaatattac 8820
ccccttcaag atcttcatac atgattttga aaccctcctg gaatggatgt ctcttcctga 8880
tgccaagcaa gttgctaagt cggctttcag taaaatctac cccgcaacca ggcaacaaaa 8940
caatgtcagg atggaatgcc tcataagtgt agacccctgg cataatcaac ttagtttcgg 9000
ggtcccaccc gagcctgaag tttctagtgt caaacttaac accaatgtca ctttccagca 9060
ctccattctg tctgccaatt ttcaggtagt tgtcaatgat ggcattgttc atcaggtcga 9120
tggtcatggt agctgagaag ttaccttctg gtaaagtgaa ctcaaaccac tcatatttca 9180
aaatatcatc tttatgatca tttactgtaa caccttcagg agccttccta gataccatca 9240
ccctcgcctt aaacttgttg ctgaacatgt actcgttcac gttgggcatg ttggtgtgca 9300
taatggtctt cagctgaccg ccccaccgcg accgctcgtc aaagttaatg gtctgggtgc 9360
tagcctccgt gggggtaaag tcattgttct gcaccactgt ggtcaggaag ttgctgtggt 9420
cgttctgata gttcagggag gcgatgtccg ccgacttgtt gtccaccaga tacaacttgg 9480
tggtatcgta ctggggtgac agctccgagt aacgaatgct atttctccct tccgtaggcg 9540
ccaggtaccg agggggtacg aagggagcct ccagtggggg ctgtatcatc gccgcctgtt 9600
gctgcatcac gctctcgtaa gaaggaggag gaccctccgg atacaccacc gctccgccta 9660
gcacggctcg tctcctcatc gtactagata cagataacaa aaaaaagaac gaacgcacgc 9720
tcggttgcca tggccttggt gagttgcctt tttattttta ctttcacttt tacaacatgc 9780
gaccgaaacg gggacgcaga tgagcgaacg ggttgccaac tccttttcca cccaagtcca 9840
acacgctgct gtcatcggca gagtcctcgt cgtcccacac aagacccatc tgcctgtcgt 9900
ggcgctggcg tctacggctc ggtctgcttg tagcccccaa gatcctgggc tcgtctctgt 9960
gatcctgcgc ataggtcttc catctactca tcttatccac caggctctct attccattgt 10020
tagggaagtt cttttccctc tctggcctca gcaaagagtc attcaagtac tcatcctcgc 10080
ccatcaagcg cgggcggttt attctcccca gttcactgct gcgaacgctg tttagtgaaa 10140
aggacaagct agggaaagga ctcgcagctt cgggcacggc cgcggcagca ccagccgttc 10200
cgggcaacga tacggaagag tgccttctat cgcccccttc cttcttccaa accgtataac 10260
ctggcggcgg ggaaaatatg ctactgtcca catcgtccca taggaacccg tcattgggat 10320
cgggcatgtc gtattcgcca gtgtagaaac caggtggggg cagccagtgt gggttcagaa 10380
tagcattggt gaaataatca gagttcatgg cggccgccct gtgcaggtag tccagcagtt 10440
tgttaatgaa aggcctgtta ctagcataca tgctgggctc catgtttcga gctgtcatat 10500
ccagcgcggc ggtaggtgtc gccccctcct gcatcaaaaa cagtccaacg ctctgttgca 10560
cgtatcttag gatccgctcc tcctcagcgg taagcgcata ctgaggaggg atcttctgcg 10620
accggttggt tagtaagaag ttcagggtgg cttccaaacc gcctgtgtct tcctgaccca 10680
gggcgcggct cacttgggtg atttcttgat aggtctgctc gtccacctgg ctctgtccta 10740
tagcctcgcg atacaggtta agcaggtagc ccaagtagga gttgcggtcg atgctaccgc 10800
tgtcagtgaa gggggatacc agcagcagca gcaggcggga gttgggagtc agcaagctag 10860
acacggtcgc gcgatctcct actggggcgt gcactcccca cagacccttc aggttcttga 10920
aagcctgggt caggttcact gtctgcaagc cctgtctgct ggtctggaag aagtaatctg 10980
gcccggactg gtacacctcg ctctggggca cctcagatac catgagtctc aatgcactca 11040
aaaagtttgt atagtcttgc tgaccacggg gcacgttggc gggctgggtg ctaaggaaag 11100
cgtttagcgc taccaatgac cccaagttgg cgtcgcgctg gaaccgctcg cgctgagaca 11160
cagcctcgcg cacatcggtc accatccggt ccaggttggt ctgcacgttg ctgctgttgt 11220
aacgggccac gcgctccaaa agagcattgt ataccagccc ggcctcatcg ggacggatgg 11280
ccttgttctc caccagcgcg ttcacgatag ccaggacctt ctcgtgggtg gggttggagc 11340
gggagggcac tacggcctcc agtatggccg aaaggcggtt ggcctggggt tgctgtctaa 11400
aggcttcggg gttgcgggtc gtcagcgcca ttatacgttg catggcctgg gtccaatcgt 11460
ccgaggagtt aatgccggac ggctggctct gtagcgccgc ccgcattgcg gggtccggtg 11520
cctgctgttg ttccatctag caaaaatacg ggtcgcgcca tcagtcttcc aagtactcgc 11580
cctcctcgtc ctcgacttca tccacctctt ctatgtaagg aagctcacac cctgcagcct 11640
ccatggccct gcgactgggt tgccattgca agtccgctcc catgtcaaag tagttctccc 11700
catcagttcc ggcccccgtt agagcccttt gcaagctgtg cataagttct ctgtcgctca 11760
gctcgcgcct cctgctggcg ctcaccgcgc ggtgcatcct gtcattgcga tacaccccca 11820
gatcgtcgct taaagtcaac accttgagag tcatgcgcat gtaaaaccca tctatcttca 11880
cctccttgtc aatgggtacg tagggggtct tgtagatctt gcgagcgtag tatttgccca 11940
ggctcaagac cgagtagttg atagctgcca ctttctcagc caaacccagg ctacgttcct 12000
gcactataat actttgcagg atgttaatca gatcatacag ccatctccca tcaggctcgg 12060
tgatattcaa caacgcctcc ctgaatgcct cgttgtccct gctatgttga accaccagaa 12120
acagctgagc tgtcaggggt ttgctagtgg ggttctgggt gatagcctcc atcaggtccc 12180
acaggtgcat cagacccagg gtcacttcct cgcgggcgat cagggtgcgc acatggttgt 12240
taaaagattt ttggaagttg cgctcctcct tcacggtctg ctcgtaggcc gagactaggt 12300
tggccgcggc cacatgtgcc ctagctgggc tgatccctgt cacttcatcg acctcaaaat 12360
cctcgtcttg cagcacccgt cttcgatcca gaccgtggcg cagctcgcga cccgcgttaa 12420
atcgagatgc tcgcatctcc tctggctcct cgccgctcct gtccctgaat aggttctgtt 12480
ggggcacgta cgcctcgcga gagtcctttt ttagttgcac ccgcgggtgc cgctcgggcg 12540
atggagcccc caggcgcgcc aatccctcgc cctcttccaa gtccagatca taggcgggct 12600
gtcccgcgcc gctgacggct gcagccgcag tagttacagg agcaggaaga gccttttgtg 12660
gctgttgttg tagctgctgc tgagaagggg gctgttgctg ggggcgcatc tgtcgcagca 12720
cgggatgcat ctgggcaaca aaaaacaaaa aaaagagggc tcgctcccgt aaactggaga 12780
agtcggctgg cggggtctta gaaatgacga ggctgccaaa ccctcgcttg tcgcggaaac 12840
cggccgatcc ggcgcgctaa gactcgaacc ggggcacacc gcaacgcaac cctggcgatt 12900
gattctccag actacgggcg cgagccactc ccagccccga gaactgagtg ttctaaagct 12960
tgacgcagca ctggctccca tccaggaaaa agcaaaaaaa aaacgacccg cctccgtatc 13020
ctggaggttt tgtgcaggcc tgggtcgaga cgggagtgcc agtaccacgt tagctgcggc 13080
tccagcctga tccgagattc gaaccggggt acacgcgcag cccaacccgt tcgcttagcc 13140
tccaggccac ggagacgagc cgctgaccgc tttcgttttt gcccgtatgt ctagagcatc 13200
aacgactgtg cgcgtctcac gggccaaacc gtgcctacca tgaactactt catgccgctg 13260
cgcaacatct ggaaccgcgt acgcgagttc ccgcgggcat ccaccaccgc ctccggtatc 13320
acctggatgt ccaggtacat ctacggttat caccgcctca tgctggaaga cctcgcccct 13380
ggcgccccgg ctacagagcg atggccccta taccgccagc cgccgcctca ctttctcatc 13440
ggctaccagt acctggtgcg cacctgtaac gattacatct ttgacacccg cgcctactcg 13500
cgcctcaagt acaccgagat tgtgcgtccg gggcaccaga cagtcaactg gtcagtcatg 13560
gccaactgct cctacacaat caacaccggg gcttaccacc gcttcgtgga ctttgacgac 13620
ttccaagcca ccctcaccca ggtgcagcaa gccatcctcg cagaaagggt tgtagcggac 13680
ctggcacttg tccagcccat gcgcgggttc gggatcactc gcatgcatgg cagagcgggc 13740
gaagaagaag tgcccgtgga acgactcatg caagactact ataaagatct ggccagatgt 13800
caggataatg cttggggaat ggcccatcgc ctgcgcatcc aacaagccgg acccaaagac 13860
ctggtgctcc tcgccaccat ccgccgtctc aaaactgcct attttaattt catcaccagc 13920
agcatcgtct caccctccaa agaggaggaa ggagaagaaa gagagaaccc cgaccgagcg 13980
tctagccgcc cccgcccgca agaaacagtg ctcagcctac cttgcgattg cgactggtta 14040
gacgctttcg tcgaaaggtt ttcagatccc gtggatcttg agacgatcag gtccttgcgc 14100
ggagtaccta cggggcaatt gataaaatgc ataatcagcg cggtgtccct gcccaacgga 14160
gagcctccca gtcaccactt cagggagatg cgcggaggcg tcttcactct gagacccagg 14220
gagaacggtc gtgccgtcac cgagaccatg cgccgccgcc gcggagaggt cattgaaaga 14280
ttcatcgacc gtctgcctgt gcgccgccgg cgtcgccgcg ttccccctcc tcctgcagcc 14340
ccacctgaag aggaagagat gttagtggaa gaagaagaaa ttgaggaaga aatcccgggg 14400
gctttcgagc gcgaggtgcg caccaccatc gccgaactca tccgtcttct ggaagaggag 14460
ttgaccgtgt ccgcgcgtaa ctcccagttt ttcaactttg ccgtggactt ctacgaggcc 14520
atggagcgct tggaagcgct gggcgatgtt agcgagatgc cgctgagacg atggatcatg 14580
tatttcttcg tcaccgagca catcgccacc acactcaact accttttcca gcgcctatgc 14640
aactatgcgg tcttcacccg ccacgtggag ctcaacctcg cccaggtggt catgcgcgcg 14700
agagatcccg agggggctgt ggtctacagc cgcgtctgga acgaggcggg catgaatgca 14760
ttctctcaac tcattggacg catctccaac gaccttgcgg ccaccgtcga gagagcgggc 14820
cgcggagatc ttcaagagga agagatcgag cagttcatgg ccgagatcgc ctaccaggac 14880
aactctggcg acgtgcaaga aatccttagg caagccgccg tcaacgatac cgagattgat 14940
tctgttgaac tctctttcag gttcaagctc acggggccgg tagcgttcac ccagaggcgt 15000
cagatccagg atgtcaaccg ccgcgtcgtc gcgcatgcaa gtcttctcag ggcgcagtac 15060
cagaacctac ccgcgcgcgg cgccgacgta ccactgccgg ccatgccgcc gggtcccgag 15120
ccgcccctgc cgcccggtgc gcgccctcga caccgcttct aaacatgcaa gaagcaacag 15180
agccaccgcc gcccaaacgg aaaaacaagg gcacggtggt agcgcccaag gggcacggaa 15240
ccctgcaagc catcgacatc tccaccaacg gacccgtgga gatcaagtac catctgaacc 15300
tccctcacgc cctcgaaaag atcatgcaag tcaatctcct gacactgcct actaacctga 15360
ctccgcagcg tctcaggacc ctggacagct ccgacctgcg cgctctcgtc ctcgagctcc 15420
gcccctgccg cgccgaggtc tggacttgcc tcccgcgagg gctcgtcagc atgaccacca 15480
tcgagacaga agatggtcat gccgatgcag acaacatagt agagcgcgag gtacaagcgc 15540
caggcctcaa ttttccactg aaatttctcg tcaaaggaag tcaggtacaa ctcattcatg 15600
aggtgcatcc cgtgaatcga tgcgagtact gcggccgtct gtacaagcac aagcatgaat 15660
gctcggcgcg tcgcagggag ttctacttcc atcacatcaa cagccattcc tccaactggt 15720
ggcaggagat ccagttcttc ccgattggct ctcatcctcg cacagaaagg ctcttcctca 15780
cctacgatgt ggaaacctac acctggatgg ggtcctttgg caagcagcta atccccttca 15840
tgctggtcat gaaactctct ggagaccagc ggctcgtcaa catcgcctat gacctggcta 15900
taaaactcaa gtgggatcgc tggcagcagg acccccaaac cttctattgc gtcaccccag 15960
aaaagatggc agtcgggcag cattttcgtc agtaccggga ccagttacaa acagcactgg 16020
cagtggacct ctggtcctcc ttcctcaaag cgaaccctca cctgcacgaa tgggccctcg 16080
aacactatgc tctcactgac cctacagacc tcacttttga agaactcaag aagctgcctc 16140
atgtcagggg cacacctcga ttcttagaac tgtacatagt ggggcacaac atcaatggct 16200
ttgatgagat cgtcttggcc gctcaggtta tcaataaccg agcagaggtc cctcagcctt 16260
tcagaatcac ccgaaatttt atgcccaggg ccggcaagat cctcttcaat gatgttactt 16320
tcgctttgcc caaccccgcc tacaagaagc gggtggactt ccaactctgg gaacaggggg 16380
cctgtgatga catcgacttc aagtatcaat tcctcaaagt catggtcagg gacacttttg 16440
ccctcactca tacctcgctg cgcaatgcag cccaagcata ctctctccca gtggagaagg 16500
gatgctgtcc ctacaaggca gtcaatcaat tctacatgtt gggctcttac cgtgcagaaa 16560
aagacgggtt tcccctcgaa gagtactgga aggatcgcga agaatacctt ctcaaccgcg 16620
agctgtggga aaagaaaaac caaccgcgtt atgacatcat ccaggaaact ctcgactact 16680
gtgccctaga cgtacttgtc accgccgagc tggtagccaa gctgcaagag tcatatgccc 16740
acttcataag ggactctgta ggcctccctc atgcccattt taacatattc cagagaccta 16800
ctatctcttc caattcccat gccatctttc gccagatcgt ttacagggcg gaaaaaccca 16860
accgcaccaa tctgggcccg ggtcttctcg ccccctcaca tgaactctat gactatgtgc 16920
gagcaagcat cagagggggg cgctgttatc ccacttacat cggcatcctc gaagagcccc 16980
tctatgtcta cgatatctgt ggcatgtatg cctccgcgct cacccacccc atgccctggg 17040
gcacccctct taacccctat gagcgcgcgc tggcagttcg agaatggcag atgactttgg 17100
atgatcccgc caccatcagc tattttgaca aggatttgct accgggaata tttaccatag 17160
atgcggaccc ccctgatgag ttcatgctag accccctccc ccctttctgt tcaagaaaag 17220
gaggtcgact ctgctggacc aatgagcccc tccgaggcga ggtagccacc agtgtggatc 17280
tgataaccct gcacaatagg ggatggcgag tcagaatagt tccggatgaa ctgacaacca 17340
tcttccctga atggaaatgt gtggcgcgcg agtacgtcca gcttaacatc gccgccaagg 17400
agcgcgcgga caaggaaaag aaccaaacca tgcgctctat cgccaagctt ctatccaatg 17460
ccctctatgg atcatttgcc accaagctgg acaacaagaa gattgtgttt tctgaccaga 17520
tggacgagag tcttatgaaa ggcatctctg ctggtactgt caatatcaaa tcctcctcgt 17580
tcctagaaac tgacaacctg agtgcagagg tcatgcccgc cttcgagagg gaatacctac 17640
cccaacagct ggcgctcctg gacagcgatc cggaagacag tgaagacgaa cagaggcccg 17700
ccccctttta tacccccccg gcggggaccc ctggtcacgt ggcctacact tacaagccaa 17760
tcacattctt ggatgtggag gagggggaca tgtgtttaca taccgtagag aaggtggacc 17820
ccctggttga caacgaccgc tacccctccc acgtggcctc ctttgtgctg gcctggacac 17880
gcgcttttgt atcagagtgg gctgggttcc tctacgaaga ggaccgcggc actccgctcg 17940
aggacaggcc cataaagtca gtctacgggg acacggacag cctctttgtt acccagcggg 18000
gacacgaact catggaaacc aaaggtaaga aacgcatcaa aaaacatggc ggaaaacttg 18060
tttttgaccc cgatgagccg gatctgacat ggctcgtgga gtgcgaaacc gtctgcgcct 18120
cctgcggtgc ggatgcatac tcccccgaat ccattttcct cgcgcccaag ctgtatgccc 18180
tcaaatgtat ctactgcccc gcctgccata aaacttccaa aggtaagctc cgtgccaaag 18240
gccacgcggc cgaggcgctc aactacgaac tcatggtaaa ctgctacctg gccgacatgc 18300
agggcgccga tcggcagcgg ttctcgacca gcaggatgag tctgaagcgc accctcgcaa 18360
gcgcccaacc aggcgcgcac cccttcaccg tgacggaaac aaccctgact cggacgctgc 18420
gaccatggaa ggatcggacc ctggcagcgc tggacgccca tcgtctgatt ccctactcca 18480
ggagccgtcc caacccgcga aacgaggagg tctgctggat cgagatgcca tagagcacat 18540
caccgagctc tgggaccggc tcgagctctt gcaacagact ctttccaaaa tgcccatggc 18600
tgacgggctg aagccgctga aaaacttctc ctcgctccag gagcttctat cccttggggg 18660
agagcgcctc ctaacggact tggtgcggga aaatatccat gtaagggaaa tgatgaacga 18720
agtggccccc ctgctccggg aggacggcag ctgtcgctcc ctaaactacc atctgcaacc 18780
cgtaattggg gtcatttacg gtcccactgg gtgcggcaag tctcagctgc ttaggaattt 18840
gctctcatcc cagttaatca ccccggctcc agaaacagta ttttttatag ccccgcaggt 18900
ggatatgatc cccccctctg aactgaaagc ctgggaaatg caaatatgtg agggaaacta 18960
tgctcccggg ccagagggaa ctttcatccc ccaatctggc acccttcgcc caaagtttat 19020
taaaatggct tatgatgacc tgactcagga gcataactat gatgtttcag acccccggaa 19080
cgtgttcgcc cgtgccgctg cccacggccc catcgctatc attatggatg agtgcatgga 19140
gaatctgggg ggtcacaaag gcgtctccaa attttttcat gcttttccct ctaagctgca 19200
tgataaattt cccaagtgca ccggatacac tgtcttggtg gttctgcaca atatgaaccc 19260
cagacgggat ctaggcggca acattgccaa cctcaagatc cagtccaaaa tgcatataat 19320
ttcaccccgg atgcacccgt cccagctcaa cagatttgta aacacctaca ctaagggcct 19380
ccccgttgca attagtctgc tcctaaaaga tattgtgcaa caccatgcac tccgaccttg 19440
ctatgactgg gtgatttata acactacccc ggagcaagag gctcttcaat ggagctatct 19500
ccacccccgg gacggactaa tgcccatgta tctaaacatt caatcccacc tttacagggt 19560
actggaaaag atccaccgag ttctcaatga tcgagaccga tggtccaggg cataccgcgc 19620
gcgaaaa 19627
<210> 70
<211> 4157
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 16 sequence
<400> 70
tataaaacgc ctggtgatca gaggccgagg tatccagctc aacgacgagt cggttagctc 60
ttcgcttggt ctgcgaccag acggagtctt ccagatcgcc ggctgtggga gatcttcctt 120
cactcctcgt caggctgtgc tgactttgga gagttcgtcc tcgcagcccc gctcgggcgg 180
catcggaact ctccagtttg tggaggagtt tactccctct gtctacttca accccttctc 240
cggctctcct ggccagtacc cggacgagtt cataccgaac ttcgacgcaa tcagcgagtc 300
agtggatggc tatgattgat gtctaatggt ggcgcggctg agctagctcg actgcgacac 360
ctagaccact gccgccgctt tcgctgtttc gcccgggaac tcaccgagtt catctacttc 420
gaactctccg aggagcaccc tcagggtccg gcccacggag tgcggattac catcgaaggg 480
ggaatagact ctcgcctgca tcgcatcttc tcccagcggc ccgtgctgat tgagcgcgac 540
cagggaaata caaccatctc catctactgc atttgtaacc accccggatt gcatgaaagc 600
ctttgctgtc ttgtttgtgc tgagtttaat aaaaactgag ttaagaccct cctacggact 660
accgcttctt caatcaggac tttacaacac caaccagatc ttccagaaga cccagaccct 720
tcctcctctg atccaggact ctaactctac cttaccagca ccctccacta ctaaccttcc 780
cgaaactaac aagcttggat ctcatctgca acaccgcctt tcacgaagcc ttctttctgc 840
caatactacc actcccaaaa ccggaggtga gctccgcggt cttcctactg acgacccctg 900
ggtggtagcg ggttttgtaa cgttaggagt agttgcgggt gggcttgtgc taatcctttg 960
ctacctatac acaccttgct gtgcatattt agtcatattg tgctgttggt ttaagaaatg 1020
ggggccatac tagtcgtgct tgctttactt tcgcttttgg gtctgggctc tgctaatctc 1080
aatcctcttg atcacgatcc atgtctagac ttcgacccag aaaactgcac acttactttt 1140
gcacccgaca caagccgtct ctgtggagtt cttattaagt gcggatggga ctgcaggtcc 1200
gttgaaatta cacataataa caaaacatgg aacaatacct tatccaccac atgggagcca 1260
ggagttcccg agtggtatac tgtctctgtc cgaggtcctg acggttccat tcgcattagt 1320
aacaacactt tcattttttc tgaaatgtgc gatctggcca tgtttatgag caaacagtat 1380
gacctatggc ctcctagcaa agagaacatt gtggcatttt ccattgctta ttgcttggta 1440
acatgcatca tcactgctat catttgtgtg tgcatacact tgcttatagt tattcgccct 1500
agacaaagca atgaggaaaa agagaaaatg ccttaacctt tttcctcata ccttttcttt 1560
acagcatggc ttctgttaca gctctaatta ttgccagcat tgtcactgtc gctcacgggc 1620
aaacaattgt ccatattacc ttaggacata atcacactct tgtagggccc ccaattactt 1680
cagaggttat ttggaccaaa cttggaagtg ttgattattt tgatataatt tgcaacaaaa 1740
ctaaaccaat atttgtaatc tgcaacagac aaaatctcac gttaattaat gtcagcaaaa 1800
tttataacgg ttactattat ggttatgata gatccagtag tcaatataaa aattacttag 1860
ttcgcataac tcaacccaaa tcaacagtgc caactatgac aataattaaa atggctaata 1920
aagcattaga aaattttaca ttaccaacaa cgcccaatga aaaaaacatt ccaaattcaa 1980
tgattgcaat tattgcggcg gtggcattgg gaatggcact aataataata tgcatgttcc 2040
tatatgcttg ttgctataaa aagtttaaac ataaacagga tccactacta aattttaaca 2100
tttaattttt tatacagatg atttccacta caatttttat cattactagc cttgcagctg 2160
taacttatgg ccgttcacac ctaactgtac ctgttggctc aacatgtaca ctacaaggac 2220
cccaagaagg ccatgtcact tggtggagaa tatatgataa tggagggttc gctagaccat 2280
gtgatcagcc tggtacaaaa ttttcatgca acggaagaga cttgaccatt attaacataa 2340
cattaaatga gcaaggcttc tattatggaa ccaactataa aaatagttta gattacaaca 2400
ttattgtagt gccagccacc acttctgctc cccgcaaatc cactttctct agcagcagtg 2460
ccaaagcaag cacaattcct aaaacagctt ctgctatgtt aaagcttcga aaaatcgctt 2520
taagtaattc cacagccgct cccaatacaa ttcctaaatc aacaattggc atcattactg 2580
ccgtggtagt gggattaata attatatttt tgtgcataat gtactacgcc tgctgctata 2640
gaaaacatga acaaaaaggt gatgcattac taaattttga tatttaattt tttatagaat 2700
tatgatattg tttcaatcaa ataccactaa cactatcaat gtgcagacta ctttaaatca 2760
tgacatggaa aaccacacta cctcctatgc atacacaaac attcagccta aatacgctat 2820
gcaactaaga aatcaccata ctaattgtaa ttggaattct tatactatct gttattcttt 2880
attttatatt ctgccgtcaa atacccaatg ttcatagaaa ttctaaaaga cgacccatct 2940
attctcctat gattagtcgt ccccatatgg ctctgaatga aatctaagat cttttttttt 3000
ctcttacagt atggtgaaca tcaatcatga ttcctagaaa tttcttcttc accatactca 3060
tctgtgcttt caatgtctgt gctactttca cagcagtagc cactgcaagc ccagactgta 3120
taggaccatt tgcttcctat gcactttttg ccttcgttac ttgcatctgc gtgtgtagca 3180
tagtctgcct ggttattaat tttttccaac tggtagactg gatctttgtg cgaattgcct 3240
acctacgtca ccatcccgaa taccgcaatc aaaatgttgc ggcacttttt aggcttattt 3300
aaaaccatgc aggctatgct gccagtcatt ttaattctgc tcctaccctg cattgcccta 3360
gcttccaccg ccactcgcgc tacacctgaa caacttagaa aatgcaaatt tcaacaacca 3420
tggtcatttc ttgattgcta ccatgaaaaa tctgattttc ccacatactg gatagtgatt 3480
gttggaataa ttaacatact ttcatgtacc tttttctcaa tcacaatata ccccacattt 3540
aattttgggt ggaattctcc caatgcactg ggttacccac aagaaccaca tgaacatatc 3600
ccactacaac acatacaaca accactagca ctggtagagt atgaaaatga gccacaacct 3660
tcactgcctc ctgccattag ttacttcaac ctaaccggcg gagatgactg aaatactcac 3720
cacctccaat tccgccgagg atctgcttga tatggacggc cgcgcctcag aacagcgact 3780
cgcccaacta cgcatacgcc agcagcagga acgtgccgcc aaggagctca gggatgctat 3840
tgaaattcac caatgcaaaa aaggcatatt ttgtttggta aaacaagcca agatatccta 3900
cgagattacc aatactgacc atcgcctctc atacgagctc ggaccgcagc gacaaaaatt 3960
cacttgtatg gtgggaatca accccataat catcacccag caagctggag ataccaaggg 4020
ttgcatccac tgttcctgca gttccgccga gtgcatctac accctgctga agaccctctg 4080
cggccttcga gacctcctac ccatgaacta atcaacccag cccctcactt accaattaca 4140
taaagccaat taataaa 4157
<210> 71
<211> 1062
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 16 sequence
<400> 71
atggccaaac gagctcggct aagcagctcc ttcaatccgg tctaccccta tgaagatgaa 60
agcagctcac aacacccctt tataaaccct ggtttcattt cctcaaatgg ttttgcacaa 120
agcccagatg gagttctaac tcttaaatgt gttaatccac tcactaccgc cagcggaccc 180
ctccaactta aagttggaag cagtcttaca gtagatacta tcgatgggtc tttggaggaa 240
aatataactg ccgcagcgcc actcactaaa actaaccact ccataggttt attaatagga 300
tctggcttgc aaacaaagga tgataaactt tgtttatcgc tgggagatgg gttggtaaca 360
aaggatgata aactatgttt atcgctggga gatgggttaa taacaaaaaa tgatgtacta 420
tgtgccaaac taggacatgg ccttgtgttt gactcttcca atgctatcac catagaaaac 480
aacaccttgt ggacaggcgc aaaaccaagc gccaactgtg taattaaaga gggagaagat 540
tccccagact gtaagctcac tttagttcta gtgaagaatg gaggactgat aaatggatac 600
ataacattaa tgggagcctc agaatatact aacaccttgt ttaaaaacaa tcaagttaca 660
atcgatgtaa acctcgcatt tgataatact ggccaaatta ttacttacct atcatccctt 720
aaaagtaacc tgaactttaa agacaaccaa aacatggcta ctggaaccat aaccagtgcc 780
aaaggcttca tgcccagcac caccgcctat ccatttataa catacgccac tgagacccta 840
aatgaagatt acatttatgg agagtgttac tacaaatcta ccaatggaac tctctttcca 900
ctaaaagtta ctgtcacact aaacagacgt atgttagctt ctggaatggc ctatgctatg 960
aatttttcat ggtctctaaa tgcagaggaa gccccggaaa ctaccgaagt cactctcatt 1020
acctccccct tctttttttc ttatatcaga gaagatgact ga 1062
<210> 72
<211> 360
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 16 sequence
<400> 72
gatggagttc taactcttaa atgtgttaat ccactcacta ccgccagcgg acccctccaa 60
cttaaagttg gaagcagtct tacagtagat actatcgatg ggtctttgga ggaaaatata 120
actgccgcag cgccactcac taaaactaac cactccatag gtttattaat aggatctggc 180
ttgcaaacaa aggatgataa actttgttta tcgctgggag atgggttggt aacaaaggat 240
gataaactat gtttatcgct gggagatggg ttaataacaa aaaatgatgt actatgtgcc 300
aaactaggac atggccttgt gtttgactct tccaatgcta tcaccataga aaacaacacc 360
<210> 73
<211> 573
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 16 sequence
<400> 73
ttgtggacag gcgcaaaacc aagcgccaac tgtgtaatta aagagggaga agattcccca 60
gactgtaagc tcactttagt tctagtgaag aatggaggac tgataaatgg atacataaca 120
ttaatgggag cctcagaata tactaacacc ttgtttaaaa acaatcaagt tacaatcgat 180
gtaaacctcg catttgataa tactggccaa attattactt acctatcatc ccttaaaagt 240
aacctgaact ttaaagacaa ccaaaacatg gctactggaa ccataaccag tgccaaaggc 300
ttcatgccca gcaccaccgc ctatccattt ataacatacg ccactgagac cctaaatgaa 360
gattacattt atggagagtg ttactacaaa tctaccaatg gaactctctt tccactaaaa 420
gttactgtca cactaaacag acgtatgtta gcttctggaa tggcctatgc tatgaatttt 480
tcatggtctc taaatgcaga ggaagccccg gaaactaccg aagtcactct cattacctcc 540
cccttctttt tttcttatat cagagaagat gac 573
<210> 74
<211> 3633
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 16 sequence
<400> 74
atgaggagac gagccgtgct aggcggagcg gtggtgtatc cggagggtcc tcctccttct 60
tacgagagcg tgatgcagca acaggcggcg atgatacagc ccccactgga ggctcccttc 120
gtaccccctc ggtacctggc gcctacggaa gggagaaata gcattcgtta ctcggagctg 180
tcaccccagt acgataccac caagttgtat ctggtggaca acaagtcggc ggacatcgcc 240
tccctgaact atcagaacga ccacagcaac ttcctgacca cagtggtgca gaacaatgac 300
tttaccccca cggaggctag cacccagacc attaactttg acgagcggtc gcggtggggc 360
ggtcagctga agaccattat gcacaccaac atgcccaacg tgaacgagta catgttcagc 420
aacaagttta aggcgagggt gatggtatct aggaaggctc ctgaaggtgt tacagtaaat 480
gatcataaag atgatatttt gaaatatgag tggtttgagt tcactttacc agaaggtaac 540
ttctcagcta ccatgaccat cgacctgatg aacaatgcca tcattgacaa ctacctgaaa 600
attggcagac agaatggagt gctggaaagt gacattggtg ttaagtttga cactagaaac 660
ttcaggctcg ggtgggaccc cgaaactaag ttgattatgc caggggtcta cacttatgag 720
gcattccatc ctgacattgt tttgttgcct ggttgcgggg tagattttac tgaaagccga 780
cttagcaact tgcttggcat caggaagaga catccattcc aggagggttt caaaatcatg 840
tatgaagatc ttgaaggggg taatattcct gcccttttgg atgtcactgc ctatgaggaa 900
agcaaaaagg ataccactac tgaaacaggc gaaaaggcgg tggttaaaac aaccacagtg 960
gctgttgcag aggaaaccag tgaagatgat aatataacta gaggagatac ttatataact 1020
gaaaaacaaa aacgtgaagc tgcagctgca gaactattac ttatgtctga agttaaaaaa 1080
gagttaaaga tccaaccttt agaaaaagac agcaagaata gaagctacaa tgtcttggaa 1140
gacaaaatca acacagccta ccgcagctgg tacctgtcct acaattatgg taaccctgag 1200
aaaggaataa ggtcctggac actgctcacc acttcggatg tcacctgtgg agccgagcag 1260
gtctactggt cgctccccga catgatgcaa gaccccatca ccttccgctc ctcgagacaa 1320
gtcaacaact acccagtagt gggtgcagag cttatgccgg tcttctcaaa gagtttctac 1380
aatgagcaag ccgtgtactc tcagcagctc cgacagtcca cctcgctcac gcacgtcttc 1440
aaccgcttcc ctgagaacca gatcctcatc cgcccgccgg cgcccacaat taccaccatc 1500
agtgaaaacg ttcctgctct cacagatcac gggaccctgc cgttacgcag cagtatccgg 1560
ggagtccagc gcgtgaccgt tactgacgcc agacgtcgca cctgtcccta cgtttacaag 1620
gccctgggca tagtcgcgcc gcgcgttctt tcaagccgca ctttctaaaa aaaaaaaaaa 1680
atgtccattc tcatctcgcc cagtaataat accggttggg gactgcatgc gcccaccaag 1740
atgtacggag gcgcccgcaa acgctctacc cagcaccccg tgcgcgttcg cggtcatttc 1800
cgcgctccct ggggcgccct caagggccgt acccgcactc ggaccacggt cgatgatgtg 1860
atcgaccagg tggttgccga tgctcgtaat tatactccta ctgcgcctac atctactgtg 1920
gatgcagtta ttgacagtgt agtggcagac gctcgcgcct atgctcgccg gaagagccga 1980
aggaggcgca tcgccaggcg ccacagggct actcccgcta tgcgagctgc aaaagctatt 2040
ctgcggaggg ccaaacgtgt gggacgaaga gccatgctta gagcggccag acgcgcggct 2100
tctggtgcta gcagcggcag gtcccgcagg cgcgcggcca cggcggcagc agcggccatt 2160
gccaacatgg cccaaccgcg aagaggcaat gtgtattggg tgcgcgatgc cactaccggc 2220
cagcgcgtgc ccgtgcgcac ccgcccccct cgcacttaga agatactgag cagtctccga 2280
tgttgtgtcc cagcggcaag tatgtccaag cgcaaataca aggaagagat gctccaggtc 2340
atcgcgcctg aaatctacgg tccgccgatg aaggatgaaa aaaagccccg caaaatcaag 2400
cgggttaaaa aggacaaaaa agaagaagat ggcgatgatg gactggtgga gtttgtgcgc 2460
gagttcgcgc caagacggcg cgtgcagtgg cgcggtcgaa aagtacgcca agtgcttaga 2520
cccgggacca ctgtggtctt tacacctggc gagcgttcca gcactacttt taaacggtcc 2580
tatgatgagg tgtatgggga tgacgatatt attgagcagg cggcagaccg ccttggcgag 2640
tttgcttatg gcaagcgcac aagatccagt cccaaagagg aggcggtatc tattcccttg 2700
gatcatggaa atcccacccc tagcctcaaa ccagtcaccc tgcagcaagt gctgcccgta 2760
cctgcgagca gaggcgtaaa gcgcgagggt gaggacctat atcccaccat gcagctaatg 2820
gtgcccaagc ggcagagatt agaagacgta ctggagaaaa tgaaagtgga tgccgatatc 2880
cagcctgagg tgaaagtgag acccatcaag gaagtggcgc caggtttggg agtacaaacc 2940
tttgacatca agattcccac tgagtccatg gaagtgcaga ccgaacctgc aaaacccaca 3000
gtcacctcaa ttgaggttca gacggaaccc tggatgcccg cgcccgttgc cgcccccagc 3060
accactagaa gatcacgtcg aaagtatggc ccagcaagtc tgctaatgcc caactatgct 3120
ctgcacccat ccatcattcc cactccgggt tacagaggca ctcgctacta tcgaagtcgg 3180
agcaacacct cacgccgccg caaactacct gcaagtcgca ctcgccgtcg ccgccgccgc 3240
accactgcca gcaaattaac tcccgccgcc ctggtgcgga gagtgtaccg cgatggtcgc 3300
gctgaacctc tgacgctgcc gcgcgcgcgc tatcatccaa gcatcaccac ttaatgactg 3360
ttgacgctgc ctccttgcag atatggctct cacttgccgc cttcgcgtcc ccattactgg 3420
ctaccgagga agaaactcgc gccgtagaag gatgttgggg cgagggatgc gccgccacag 3480
acgaaggcgc gctatcagca agcgattagg gggtggcttt ctgccagctc ttatacccat 3540
catcgccgcg gcgatcgggg cgataccagg catagcttcc gtggcggttc aggcctcgca 3600
gcgccactaa caatggaaaa atttataaat aaa 3633
<210> 75
<211> 2823
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 16 sequence
<400> 75
atggccaccc catcgatgat gccccaatgg gcatacatgc acatcgccgg acaggatgct 60
tcggagtacc tgagtccggg tctggtgcag ttcgcccgtg caacagacac ctacttcagt 120
atggggaaca agtttagaaa ccccacagtg gcgcccaccc acgatgtgac caccgaccgt 180
agccagcgac taatgctgcg cttcgtgccc gttgaccggg aagacaatac ctactcttac 240
aaagttcgct acacgctggc tgtaggggac aacagagtac tggatatggc cagcacgttc 300
tttgacatcc gcggcgtgct ggaccggggc cctagcttca aaccctactc cgggaccgcc 360
tacaacagcc tggctcccaa gggagcgccc aacacctgcc agtggaagga ttctgacagc 420
aaaatgcata cctttggggt agctgccatg cccggtgtta ctgggaaaaa gatagaagct 480
gatgggctgc ctattggaat agattcaact tctggaactg acacagtaat ttatgctgat 540
aaaactttcc aaccagaacc acaagttgga aatgccagtt gggttgacgc caatggtaca 600
gaggaaaaat atggaggcag agctctgaag gacactacaa agatgaaacc ctgctatggt 660
tctttcgcca agcctaccaa caaagaaggt ggtcaggcta acttaaaaga ttcagaaacc 720
gccgccacca ctcctaacta tgatatagat ctggctttct ttgacaacaa aaatattgct 780
gctaactacg atccagatat tgtaatgtac acagaaaatg ttgacttgca gactccagat 840
actcatattg tatacaaacc tggaacagag gacaccagct ctgaatccaa tttgggtcag 900
caagccatgc ctaacagacc caactacatt ggcttcagag acaattttat tgggctcatg 960
tactacaaca gcactggcaa tatgggggtg ctggccggtc aggcctctca gctgaatgct 1020
gtggttgact tgcaagacag aaacactgaa ctgtcctacc agctcttgct tgactctctg 1080
ggtgacagaa cccggtattt cagtatgtgg aatcaggcgg tggacagcta tgatcctgat 1140
gtgcgtatta ttgaaaacca tggtgtggag gacgaattgc caaactattg ctttccgttg 1200
aatggtgtgg gatttacaga cacttaccaa ggtgttaaag ttaaaacaga tgcagttgct 1260
ggaaccagtg gaacacagtg ggacaaagat gacaccacag ttagtactgc taatgaaatc 1320
catggaggca atccttttgc catggaaatc aacatccaag ccaatctatg gcgaagtttc 1380
ctttattcca atgtggcttt gtatctccca gactcgtata aatacacccc gtccaatgtc 1440
actctcccag aaaacaaaaa cacctacgac tacatgaacg ggcgggtggt gccgccatct 1500
ctagtagaca cctatgtgaa cattggtgcc aggtggtctc tggatgccat ggacaatgtc 1560
aacccattca accaccaccg taacgctggc ttgcgttacc gatccatgct tctgggtaac 1620
ggacgttatg tgcctttcca catacaagtg cctcaaaaat tcttcgctgt taaaaacctg 1680
ctgcttctcc caggctccta cacttatgag tggaacttta ggaaggatgt aaacatggtt 1740
ctacagagtt cccttggtaa cgacctacgg gtagatggcg ccagcatcag tttcacgagc 1800
atcaatcttt atgctacttt tttccccatg gctcacaaca ccgcttccac ccttgaagcc 1860
atgctgcgga atgacaccaa tgatcagtca ttcaacgact acctatctgc agctaacatg 1920
ctctacccca tacctgccaa cgcaaccaat attcccattt ccattccttc tcgcaactgg 1980
gcggctttca gaggctggtc atttaccaga ctgaaaacca aagaaactcc ctctttgggg 2040
tctggatttg acccatactt tgtctattcc ggttctattc cctacctgga tggtaccttc 2100
tatctaaatc acacttttaa gaaggtttcc atcatgtttg actcttcagt gagctggcct 2160
ggaaatgaca ggttactatc tcctaacgaa tttgaaataa agcgcactgt ggatggcgaa 2220
ggctacaacg tagcccaatg caacatgacc aaagactggt tcttggtaca gatgctcgcc 2280
aactacaaca ttggctacca gggcttttac atccctgagg gatacaagga tcgcatgtac 2340
tcctttttca gaaacttcca gcctatgagc aggcaggtgg ttgatgaggt taattacact 2400
gactacaaag ccgtcacctt accatatcaa cacaacaact ctggctttgt aggatacctt 2460
gcgcctacta tgagacaagg ggaaccttac ccagccaatt atccataccc gctcatcgga 2520
actactgccg ttaagagtgt tacccaaaaa aagttcctgt gcgacaggac catgtggcgc 2580
ataccgttct ccagcaactt catgtccatg ggggccctta cagacctggg acaaaacctg 2640
ctctatgcca actcggccca tgcactggac atgacttttg aggtggatcc catggatgag 2700
cccaccctgc tttatcttct tttcgaagtc ttcgacgtgg tcagagtgca ccagccacac 2760
cgcggcgtca tcgaggccgt ctacctgcgc acaccgttct cggccggcaa cgccaccaca 2820
taa 2823
<210> 76
<211> 353
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 16 sequence
<400> 76
Met Ala Lys Arg Ala Arg Leu Ser Ser Ser Phe Asn Pro Val Tyr Pro
1 5 10 15
Tyr Glu Asp Glu Ser Ser Ser Gln His Pro Phe Ile Asn Pro Gly Phe
20 25 30
Ile Ser Ser Asn Gly Phe Ala Gln Ser Pro Asp Gly Val Leu Thr Leu
35 40 45
Lys Cys Val Asn Pro Leu Thr Thr Ala Ser Gly Pro Leu Gln Leu Lys
50 55 60
Val Gly Ser Ser Leu Thr Val Asp Thr Ile Asp Gly Ser Leu Glu Glu
65 70 75 80
Asn Ile Thr Ala Ala Ala Pro Leu Thr Lys Thr Asn His Ser Ile Gly
85 90 95
Leu Leu Ile Gly Ser Gly Leu Gln Thr Lys Asp Asp Lys Leu Cys Leu
100 105 110
Ser Leu Gly Asp Gly Leu Val Thr Lys Asp Asp Lys Leu Cys Leu Ser
115 120 125
Leu Gly Asp Gly Leu Ile Thr Lys Asn Asp Val Leu Cys Ala Lys Leu
130 135 140
Gly His Gly Leu Val Phe Asp Ser Ser Asn Ala Ile Thr Ile Glu Asn
145 150 155 160
Asn Thr Leu Trp Thr Gly Ala Lys Pro Ser Ala Asn Cys Val Ile Lys
165 170 175
Glu Gly Glu Asp Ser Pro Asp Cys Lys Leu Thr Leu Val Leu Val Lys
180 185 190
Asn Gly Gly Leu Ile Asn Gly Tyr Ile Thr Leu Met Gly Ala Ser Glu
195 200 205
Tyr Thr Asn Thr Leu Phe Lys Asn Asn Gln Val Thr Ile Asp Val Asn
210 215 220
Leu Ala Phe Asp Asn Thr Gly Gln Ile Ile Thr Tyr Leu Ser Ser Leu
225 230 235 240
Lys Ser Asn Leu Asn Phe Lys Asp Asn Gln Asn Met Ala Thr Gly Thr
245 250 255
Ile Thr Ser Ala Lys Gly Phe Met Pro Ser Thr Thr Ala Tyr Pro Phe
260 265 270
Ile Thr Tyr Ala Thr Glu Thr Leu Asn Glu Asp Tyr Ile Tyr Gly Glu
275 280 285
Cys Tyr Tyr Lys Ser Thr Asn Gly Thr Leu Phe Pro Leu Lys Val Thr
290 295 300
Val Thr Leu Asn Arg Arg Met Leu Ala Ser Gly Met Ala Tyr Ala Met
305 310 315 320
Asn Phe Ser Trp Ser Leu Asn Ala Glu Glu Ala Pro Glu Thr Thr Glu
325 330 335
Val Thr Leu Ile Thr Ser Pro Phe Phe Phe Ser Tyr Ile Arg Glu Asp
340 345 350
Asp
<210> 77
<211> 130
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 16 sequence
<400> 77
Asp Gly Val Leu Thr Leu Lys Cys Val Asn Pro Leu Thr Thr Ala Ser
1 5 10 15
Gly Pro Leu Gln Leu Lys Val Gly Ser Ser Leu Thr Val Asp Thr Ile
20 25 30
Asp Gly Ser Leu Glu Glu Asn Ile Thr Ala Ala Ala Pro Leu Thr Lys
35 40 45
Thr Asn His Ser Ile Gly Leu Leu Ile Gly Ser Gly Leu Gln Thr Lys
50 55 60
Asp Asp Lys Leu Cys Leu Ser Leu Gly Asp Gly Leu Val Thr Lys Asp
65 70 75 80
Asp Lys Leu Cys Leu Ser Leu Gly Asp Gly Leu Ile Thr Lys Asn Asp
85 90 95
Val Leu Cys Ala Lys Leu Gly His Gly Leu Val Phe Asp Ser Ser Asn
100 105 110
Ala Ile Thr Ile Glu Asn Asn Thr Leu Trp Thr Gly Ala Lys Pro Ser
115 120 125
Ala Asn
130
<210> 78
<211> 181
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 16 sequence
<400> 78
Cys Val Ile Lys Glu Gly Glu Asp Ser Pro Asp Cys Lys Leu Thr Leu
1 5 10 15
Val Leu Val Lys Asn Gly Gly Leu Ile Asn Gly Tyr Ile Thr Leu Met
20 25 30
Gly Ala Ser Glu Tyr Thr Asn Thr Leu Phe Lys Asn Asn Gln Val Thr
35 40 45
Ile Asp Val Asn Leu Ala Phe Asp Asn Thr Gly Gln Ile Ile Thr Tyr
50 55 60
Leu Ser Ser Leu Lys Ser Asn Leu Asn Phe Lys Asp Asn Gln Asn Met
65 70 75 80
Ala Thr Gly Thr Ile Thr Ser Ala Lys Gly Phe Met Pro Ser Thr Thr
85 90 95
Ala Tyr Pro Phe Ile Thr Tyr Ala Thr Glu Thr Leu Asn Glu Asp Tyr
100 105 110
Ile Tyr Gly Glu Cys Tyr Tyr Lys Ser Thr Asn Gly Thr Leu Phe Pro
115 120 125
Leu Lys Val Thr Val Thr Leu Asn Arg Arg Met Leu Ala Ser Gly Met
130 135 140
Ala Tyr Ala Met Asn Phe Ser Trp Ser Leu Asn Ala Glu Glu Ala Pro
145 150 155 160
Glu Thr Thr Glu Val Thr Leu Ile Thr Ser Pro Phe Phe Phe Ser Tyr
165 170 175
Ile Arg Glu Asp Asp
180
<210> 79
<211> 555
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 16 sequence
<400> 79
Met Arg Arg Arg Ala Val Leu Gly Gly Ala Val Val Tyr Pro Glu Gly
1 5 10 15
Pro Pro Pro Ser Tyr Glu Ser Val Met Gln Gln Gln Ala Ala Met Ile
20 25 30
Gln Pro Pro Leu Glu Ala Pro Phe Val Pro Pro Arg Tyr Leu Ala Pro
35 40 45
Thr Glu Gly Arg Asn Ser Ile Arg Tyr Ser Glu Leu Ser Pro Gln Tyr
50 55 60
Asp Thr Thr Lys Leu Tyr Leu Val Asp Asn Lys Ser Ala Asp Ile Ala
65 70 75 80
Ser Leu Asn Tyr Gln Asn Asp His Ser Asn Phe Leu Thr Thr Val Val
85 90 95
Gln Asn Asn Asp Phe Thr Pro Thr Glu Ala Ser Thr Gln Thr Ile Asn
100 105 110
Phe Asp Glu Arg Ser Arg Trp Gly Gly Gln Leu Lys Thr Ile Met His
115 120 125
Thr Asn Met Pro Asn Val Asn Glu Tyr Met Phe Ser Asn Lys Phe Lys
130 135 140
Ala Arg Val Met Val Ser Arg Lys Ala Pro Glu Gly Val Thr Val Asn
145 150 155 160
Asp His Lys Asp Asp Ile Leu Lys Tyr Glu Trp Phe Glu Phe Thr Leu
165 170 175
Pro Glu Gly Asn Phe Ser Ala Thr Met Thr Ile Asp Leu Met Asn Asn
180 185 190
Ala Ile Ile Asp Asn Tyr Leu Lys Ile Gly Arg Gln Asn Gly Val Leu
195 200 205
Glu Ser Asp Ile Gly Val Lys Phe Asp Thr Arg Asn Phe Arg Leu Gly
210 215 220
Trp Asp Pro Glu Thr Lys Leu Ile Met Pro Gly Val Tyr Thr Tyr Glu
225 230 235 240
Ala Phe His Pro Asp Ile Val Leu Leu Pro Gly Cys Gly Val Asp Phe
245 250 255
Thr Glu Ser Arg Leu Ser Asn Leu Leu Gly Ile Arg Lys Arg His Pro
260 265 270
Phe Gln Glu Gly Phe Lys Ile Met Tyr Glu Asp Leu Glu Gly Gly Asn
275 280 285
Ile Pro Ala Leu Leu Asp Val Thr Ala Tyr Glu Glu Ser Lys Lys Asp
290 295 300
Thr Thr Thr Glu Thr Gly Glu Lys Ala Val Val Lys Thr Thr Thr Val
305 310 315 320
Ala Val Ala Glu Glu Thr Ser Glu Asp Asp Asn Ile Thr Arg Gly Asp
325 330 335
Thr Tyr Ile Thr Glu Lys Gln Lys Arg Glu Ala Ala Ala Ala Glu Leu
340 345 350
Leu Leu Met Ser Glu Val Lys Lys Glu Leu Lys Ile Gln Pro Leu Glu
355 360 365
Lys Asp Ser Lys Asn Arg Ser Tyr Asn Val Leu Glu Asp Lys Ile Asn
370 375 380
Thr Ala Tyr Arg Ser Trp Tyr Leu Ser Tyr Asn Tyr Gly Asn Pro Glu
385 390 395 400
Lys Gly Ile Arg Ser Trp Thr Leu Leu Thr Thr Ser Asp Val Thr Cys
405 410 415
Gly Ala Glu Gln Val Tyr Trp Ser Leu Pro Asp Met Met Gln Asp Pro
420 425 430
Ile Thr Phe Arg Ser Ser Arg Gln Val Asn Asn Tyr Pro Val Val Gly
435 440 445
Ala Glu Leu Met Pro Val Phe Ser Lys Ser Phe Tyr Asn Glu Gln Ala
450 455 460
Val Tyr Ser Gln Gln Leu Arg Gln Ser Thr Ser Leu Thr His Val Phe
465 470 475 480
Asn Arg Phe Pro Glu Asn Gln Ile Leu Ile Arg Pro Pro Ala Pro Thr
485 490 495
Ile Thr Thr Ile Ser Glu Asn Val Pro Ala Leu Thr Asp His Gly Thr
500 505 510
Leu Pro Leu Arg Ser Ser Ile Arg Gly Val Gln Arg Val Thr Val Thr
515 520 525
Asp Ala Arg Arg Arg Thr Cys Pro Tyr Val Tyr Lys Ala Leu Gly Ile
530 535 540
Val Ala Pro Arg Val Leu Ser Ser Arg Thr Phe
545 550 555
<210> 80
<211> 940
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 16 sequence
<400> 80
Met Ala Thr Pro Ser Met Met Pro Gln Trp Ala Tyr Met His Ile Ala
1 5 10 15
Gly Gln Asp Ala Ser Glu Tyr Leu Ser Pro Gly Leu Val Gln Phe Ala
20 25 30
Arg Ala Thr Asp Thr Tyr Phe Ser Met Gly Asn Lys Phe Arg Asn Pro
35 40 45
Thr Val Ala Pro Thr His Asp Val Thr Thr Asp Arg Ser Gln Arg Leu
50 55 60
Met Leu Arg Phe Val Pro Val Asp Arg Glu Asp Asn Thr Tyr Ser Tyr
65 70 75 80
Lys Val Arg Tyr Thr Leu Ala Val Gly Asp Asn Arg Val Leu Asp Met
85 90 95
Ala Ser Thr Phe Phe Asp Ile Arg Gly Val Leu Asp Arg Gly Pro Ser
100 105 110
Phe Lys Pro Tyr Ser Gly Thr Ala Tyr Asn Ser Leu Ala Pro Lys Gly
115 120 125
Ala Pro Asn Thr Cys Gln Trp Lys Asp Ser Asp Ser Lys Met His Thr
130 135 140
Phe Gly Val Ala Ala Met Pro Gly Val Thr Gly Lys Lys Ile Glu Ala
145 150 155 160
Asp Gly Leu Pro Ile Gly Ile Asp Ser Thr Ser Gly Thr Asp Thr Val
165 170 175
Ile Tyr Ala Asp Lys Thr Phe Gln Pro Glu Pro Gln Val Gly Asn Ala
180 185 190
Ser Trp Val Asp Ala Asn Gly Thr Glu Glu Lys Tyr Gly Gly Arg Ala
195 200 205
Leu Lys Asp Thr Thr Lys Met Lys Pro Cys Tyr Gly Ser Phe Ala Lys
210 215 220
Pro Thr Asn Lys Glu Gly Gly Gln Ala Asn Leu Lys Asp Ser Glu Thr
225 230 235 240
Ala Ala Thr Thr Pro Asn Tyr Asp Ile Asp Leu Ala Phe Phe Asp Asn
245 250 255
Lys Asn Ile Ala Ala Asn Tyr Asp Pro Asp Ile Val Met Tyr Thr Glu
260 265 270
Asn Val Asp Leu Gln Thr Pro Asp Thr His Ile Val Tyr Lys Pro Gly
275 280 285
Thr Glu Asp Thr Ser Ser Glu Ser Asn Leu Gly Gln Gln Ala Met Pro
290 295 300
Asn Arg Pro Asn Tyr Ile Gly Phe Arg Asp Asn Phe Ile Gly Leu Met
305 310 315 320
Tyr Tyr Asn Ser Thr Gly Asn Met Gly Val Leu Ala Gly Gln Ala Ser
325 330 335
Gln Leu Asn Ala Val Val Asp Leu Gln Asp Arg Asn Thr Glu Leu Ser
340 345 350
Tyr Gln Leu Leu Leu Asp Ser Leu Gly Asp Arg Thr Arg Tyr Phe Ser
355 360 365
Met Trp Asn Gln Ala Val Asp Ser Tyr Asp Pro Asp Val Arg Ile Ile
370 375 380
Glu Asn His Gly Val Glu Asp Glu Leu Pro Asn Tyr Cys Phe Pro Leu
385 390 395 400
Asn Gly Val Gly Phe Thr Asp Thr Tyr Gln Gly Val Lys Val Lys Thr
405 410 415
Asp Ala Val Ala Gly Thr Ser Gly Thr Gln Trp Asp Lys Asp Asp Thr
420 425 430
Thr Val Ser Thr Ala Asn Glu Ile His Gly Gly Asn Pro Phe Ala Met
435 440 445
Glu Ile Asn Ile Gln Ala Asn Leu Trp Arg Ser Phe Leu Tyr Ser Asn
450 455 460
Val Ala Leu Tyr Leu Pro Asp Ser Tyr Lys Tyr Thr Pro Ser Asn Val
465 470 475 480
Thr Leu Pro Glu Asn Lys Asn Thr Tyr Asp Tyr Met Asn Gly Arg Val
485 490 495
Val Pro Pro Ser Leu Val Asp Thr Tyr Val Asn Ile Gly Ala Arg Trp
500 505 510
Ser Leu Asp Ala Met Asp Asn Val Asn Pro Phe Asn His His Arg Asn
515 520 525
Ala Gly Leu Arg Tyr Arg Ser Met Leu Leu Gly Asn Gly Arg Tyr Val
530 535 540
Pro Phe His Ile Gln Val Pro Gln Lys Phe Phe Ala Val Lys Asn Leu
545 550 555 560
Leu Leu Leu Pro Gly Ser Tyr Thr Tyr Glu Trp Asn Phe Arg Lys Asp
565 570 575
Val Asn Met Val Leu Gln Ser Ser Leu Gly Asn Asp Leu Arg Val Asp
580 585 590
Gly Ala Ser Ile Ser Phe Thr Ser Ile Asn Leu Tyr Ala Thr Phe Phe
595 600 605
Pro Met Ala His Asn Thr Ala Ser Thr Leu Glu Ala Met Leu Arg Asn
610 615 620
Asp Thr Asn Asp Gln Ser Phe Asn Asp Tyr Leu Ser Ala Ala Asn Met
625 630 635 640
Leu Tyr Pro Ile Pro Ala Asn Ala Thr Asn Ile Pro Ile Ser Ile Pro
645 650 655
Ser Arg Asn Trp Ala Ala Phe Arg Gly Trp Ser Phe Thr Arg Leu Lys
660 665 670
Thr Lys Glu Thr Pro Ser Leu Gly Ser Gly Phe Asp Pro Tyr Phe Val
675 680 685
Tyr Ser Gly Ser Ile Pro Tyr Leu Asp Gly Thr Phe Tyr Leu Asn His
690 695 700
Thr Phe Lys Lys Val Ser Ile Met Phe Asp Ser Ser Val Ser Trp Pro
705 710 715 720
Gly Asn Asp Arg Leu Leu Ser Pro Asn Glu Phe Glu Ile Lys Arg Thr
725 730 735
Val Asp Gly Glu Gly Tyr Asn Val Ala Gln Cys Asn Met Thr Lys Asp
740 745 750
Trp Phe Leu Val Gln Met Leu Ala Asn Tyr Asn Ile Gly Tyr Gln Gly
755 760 765
Phe Tyr Ile Pro Glu Gly Tyr Lys Asp Arg Met Tyr Ser Phe Phe Arg
770 775 780
Asn Phe Gln Pro Met Ser Arg Gln Val Val Asp Glu Val Asn Tyr Thr
785 790 795 800
Asp Tyr Lys Ala Val Thr Leu Pro Tyr Gln His Asn Asn Ser Gly Phe
805 810 815
Val Gly Tyr Leu Ala Pro Thr Met Arg Gln Gly Glu Pro Tyr Pro Ala
820 825 830
Asn Tyr Pro Tyr Pro Leu Ile Gly Thr Thr Ala Val Lys Ser Val Thr
835 840 845
Gln Lys Lys Phe Leu Cys Asp Arg Thr Met Trp Arg Ile Pro Phe Ser
850 855 860
Ser Asn Phe Met Ser Met Gly Ala Leu Thr Asp Leu Gly Gln Asn Leu
865 870 875 880
Leu Tyr Ala Asn Ser Ala His Ala Leu Asp Met Thr Phe Glu Val Asp
885 890 895
Pro Met Asp Glu Pro Thr Leu Leu Tyr Leu Leu Phe Glu Val Phe Asp
900 905 910
Val Val Arg Val His Gln Pro His Arg Gly Val Ile Glu Ala Val Tyr
915 920 925
Leu Arg Thr Pro Phe Ser Ala Gly Asn Ala Thr Thr
930 935 940
<210> 81
<211> 114
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 21 sequence
<400> 81
ctatctatat aatatacctt atagatggaa tggtgccaat atgcaaatga ggtaatttaa 60
aaaagtgcgc gctgtgtggt gattggctgc ggggtgaacg gctaaaaggg gcgg 114
<210> 82
<211> 114
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 21 sequence
<400> 82
ccgccccttt tagccgttca ccccgcagcc aatcaccaca cagcgcgcac ttttttaaat 60
tacctcattt gcatattggc accattccat ctataaggta tattatatag atag 114
<210> 83
<211> 365
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 21 sequence
<400> 83
gcaatgctgg gaggtgacgt aacttatgta ggaggagtta tgttgcaagt tatcgcggta 60
aaggtgacgt aaaacgaggt gtggtttgga cacggaagta gacagttttc ccacgcttac 120
tgacaggata tgaggtagtt ttgggcggat gcaagtgaaa attctccatt ttcgcgcgaa 180
aactgaatga ggaagtgaat ttctgagtca tttcgcggtt atgacagggt ggagtatttg 240
ccgagggccg agtagacttt gaccgtttac gtggaggttt cgattaccgt gtttttcacc 300
taaatttccg cgtacggtgt caaagtcctg tgtttttacg taggtgtcag ctgatcacta 360
gggta 365
<210> 84
<211> 3432
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 21 sequence
<400> 84
tttaaacctg tcgagttccg tcaagaggcc actcttgagt gccagcgaga agagttttct 60
cctccgcgct gcgagtcagt tttgcgcttt gaaaatgaga cacctgcgat tcctgccaca 120
ggagattatc tccagcgaga ccgggatcga aatactggag tttgtggtaa ataccctgat 180
gggagatgac ccggaaccgc cagtgcagcc tttcgatcca cctacgctgc acgatctgta 240
tgatttagag gtagacgggc ctgatgatcc caatgaggaa gctgtaaatg ggttttttac 300
tgattctatg ctgctagctg ccgatgaagg attggacata aaccctcctc ctgggaccct 360
tgatacccca ggggtggttg tggaaagcgg cagaggtggg aaaaaattgc ctgatctggg 420
agcagctgaa atggacttgc gttgttatga agagggtttt cctccgagtg atgatgaaga 480
tggggaaact gaacagtcca tccataccgc agtgaatgag ggagtaaaag ctgccagcga 540
tgtttttaag ttggactgtc cggagctgcc tggacatggc tgtaagtctt gtgaatttca 600
caggaataac actggaatga aagaactatt gtgctcgctt tgctatatga gaatgcactg 660
ccactttatt tacagtaagt gtatttaagt gaaatttaaa ggaatagtgt agctgtttaa 720
taactgttga atggtagatt tatgttttta cttgcgattt tttgtaggtc ctgtgtctga 780
tgatgaggcg ccttctcctg attcaactac ctcacctcct gaaattcagg cgcccgtacc 840
tgcaaacgta tgcaagccca ttcctgtgaa gcctaagtgt gggaaacgcc ctgctgtgga 900
taagcttgag gacttgttgg agggtgggga tggacctttg gaccttagta cccggaaact 960
gccaagacaa tgagtgccct gcagctgtgt ttatttaatg tgacgtcatg taataaaatt 1020
atgtcagctg ctgagtgttt tattgcttct tgggtgggga cttggatata taagtaggag 1080
cagatctgtg tggttagctc atagcaacct gctgccatcc atggaggttt gggctatctt 1140
ggaagacctg agacagacta ggctactgct agaaaacgcc tcggacggag tctctggctt 1200
ttggagattc tggttcggtg gtgatctagc taggctagtg tttaggataa aacaggacta 1260
cagggaagaa tttgaaaagt tattggacga cagtccagga ctttttgaag ctcttaactt 1320
gggccaccag gctcatttta aggagaaggt tttatcagtt ttagattttt ctactcctgg 1380
tagaactgct gctgctgtag cttttcttac ttttatattg gataaatgga tccgccaaac 1440
ccacttcagc aagggatacg ttttggattt catagcagca gctttgtgga gaacatggaa 1500
ggctcgcagg atgaggacaa tcttagatta ctggccagtg cagcctctgg gagtagcagg 1560
gatactgaga cacccaccgg ccatgccagc ggttctggag gaggagcagc aggaggacaa 1620
tccgagagcc ggcctggacc ctccggtgga ggagtagctg acctgtttcc tgaactgcga 1680
cgggtgctta ctaggtctac gtccagtgga caggacaggg gcattaagag ggagaggaat 1740
cctagtggga ataattcaag aaccgagttg gctttaagtt taatgagccg taggcgtcct 1800
gaaactgttt ggtggcatga ggttcagagc gaaggcaggg atgaagtttc aatattgcag 1860
gagaaatatt cactagaaca acttaagacc tgttggttgg aacctgagga tgattgggag 1920
gtggccatta ggaattatgc taagatatct ctgaggcctg ataaacagta tagaattact 1980
aagaagatta atattagaaa tgcatgctac atatcaggga atggggcaga ggttataata 2040
gatacccaag ataaagcagc ttttagatgt tgtatgatgg gtatgtggcc aggggttgtc 2100
ggcatggaag cagtaacatt tatgaatatt aggtttaaag gggatgggta taatggcatt 2160
gtatttatgg ctaacactaa gctgattcta catggttgta gcttttttgg gtttaataat 2220
acttgtgtag aagcttgggg gcaagttggt gtgaggggtt gtagttttta tgcatgctgg 2280
attgcaacat caggtagggt caagagtcag ttgtctgtga agaaatgcat gtttgagaga 2340
tgtaatcttg gcatactgaa tgaaggtgaa gcaagggtcc gccactgcgc agctacagaa 2400
actggctgct tcattctaat aaagggaaat gccagtgtga agcataatat gatctgtgga 2460
cattcgaatg agaggcctta tcagatgctg acctgcgctg gtggacattg caatattctt 2520
gctaccgtgc atatcgtttc ccatgcacgc aagaaatggc ctgtatttga acataatgtg 2580
attaccaagt gcaccatgca cataggtggt cgcaggggaa tgtttatgcc ttaccagtgt 2640
aacatgaatc atgtgaaggt gatgttggaa ccagatgcct tttccagagt gagcttaaca 2700
ggaatctttg atatgaatat tcaactatgg aagatcctga gatatgatga cactaaaccg 2760
agggtgcgcg catgcgaatg cggaggcaag catgctagat tccagccggt gtgcgtggat 2820
gtgactgaag acctgagacc cgatcatttg gtgcttgcct gcactggagc ggagttcggt 2880
tctagtggtg aagaaactga ctaaagtgag tagtggggca atatgtggat ggggactttc 2940
aggttggtaa ggtggacaga ttgggtaaat tttgttaatt tctgtcttgc agctgccatg 3000
agtggaagcg cttcttttga ggggggagta tttagccctt atctgacggg caggctccca 3060
tcatgggcag gagttcgtca gaatgtcatg ggatccactg tggatgggag acccgtccag 3120
cccgccaatt cctcaacgct gacctatgcc actttgagtt cgtcatcatt ggatgcagct 3180
gcagccgccg ccgctactgc tgccgccaac accatccttg gaatgggcta ttacggaagc 3240
atcgttgcca attccagttc ctctaataac ccttcaaccc tggctgagga caagctgctt 3300
gttctcttgg ctcagctcga ggccttaacc caacgcttag gcgaactgtc taagcaggtg 3360
gcccagttgc gtgagcaaac tgagtctgct gttgccacag caaagtctaa ataaagatct 3420
caaatcaata aa 3432
<210> 85
<211> 19688
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 21 sequence
<400> 85
atggccagcc gcggaggaaa tcagtcaagc gaccgccaac gggagcacac ccccgaacgc 60
ggaatgggct ctgccagcca tccgcctcca aggccggacc gcagcccatc tcagtcgcct 120
ccacctctgc ccccgaagag gaacacctac cgtcgcgtgg ggtccgattc ttctatcgag 180
agccaggtgg tactggtaag cgaaacttcg cggtcatccc tgtctccgga acggagcaac 240
agtcctcccc cgatccctcc caagaagaag cccaggaaga ccaagcatgt ccctctgcaa 300
gacatcagcc aggacagcga agaagaaaga gaacaggctc agttggtggc cgtgggcttc 360
agctaccccc cggtgcgcat cattgagaag gatggcaaga gaagtgttga gaagatcgac 420
aagaatgacc ctatagctaa aggagctact tctattgctg ttaggaatcc tttgagcttg 480
cccctggtat ctgcctggga gaagggcatg gaagtgatgg ctgtgctaat ggagaggtat 540
aggctggata atgacctgag aacctctttc aagctgatgc cagagcagca cgagcagtac 600
aagcgtatct gccaccagta tgtgaacgag gagcaccgtg gcatcccgct gacatttagt 660
agcatgaaga ccctgacagc gatgatggga agattcatgc agggattggt gcattcttat 720
tctgagatcg cccacaataa ttgggagtgc accgggtgcg ctctgtgggc tcatggatgc 780
accgattacg aaggcaaggt gaaatgcctg catggcacta ttatgatcca gaaggaccac 840
attatcgaga tggatgtggc gagcgaaaac gggcagcgcg ctatgaagga gaacccagac 900
agagccaaga tcacccagaa ccgctggggc agaaatgtgg tccagttggc caacaacgat 960
gcccgctgct gtgtgaatga tgccaactgt gctactaacc aattttccag caagtcctgt 1020
gggatgtttt acaccgaggg aagtaaggct caggaagctt tcaagcagta cgaagccttc 1080
atgaaggccg tgtacccagg gataaccccc gaccaagcca ggatgatgct gatccccatt 1140
cattgcgatt gcaaccacaa gccaggctgc gctcccgtga tgggcaggca gacctgtaag 1200
atgaccccct ttggaatggc caatgctgaa gacttggatg tgactaccat cagtgacccg 1260
accgtgctgg caagcgtgag acacccagcc ttgatggtgt tccagtgttg caacccagtg 1320
taccgcaact cccgtgtcca gaatgccggc cccaactgtg atttcaagat ctctgctcct 1380
gacctgcttg gcgccctgca actgaccaga aagttgtggc aagacacctt tcccgaaatt 1440
ccagttccca agctggtgat ccccgagttc aagtggcaga acaggttaca gttccgcaac 1500
gtctccctgc ccacgggtca ctctgactca cgccagaacc catttgattt ctgagtgaat 1560
gatgaaaacg aatgagcaaa aaaccagagc cttagtgcat gtaaaaataa agtgcttttt 1620
attgaacacg gttttacatg acttattgca tatccatacg gtcaaacgcg gtggcccttt 1680
cgatgcgtgc gcggtgagaa cgaaagtaag atgagtgggt gtttaggaag cgatatagcg 1740
cctcctggtt gcgacgcagg gtgggctgga cttggggtga ttggagcatg ctgtttgaca 1800
ccccagtcag caacttcatg gtggggtttc cgttcatggg gcggtcgggc cagtgcacaa 1860
aggcatgaag gaacatacag caaaaaagtc cacaggcggc tgagcgcggg ccctgcacgc 1920
tctgggtgga cttttccagg gtgatgcagc ggtctttggt agcaagggca ctgcggcgca 1980
ggagcccctc gtactcaaac tggtaaatct gtttgagtcg ctcatccgag aacccaaaag 2040
gatcaaaaag gtagcaggtg ttggagcgcg ggttccaacc aaaagccagc cagtgctctc 2100
cccccgtctc gcgtccggca gtgttgacta tggcgcaggc gagcttgtcg ggggccatga 2160
accccgggaa acgcttgtca aaggttccca ggaaataggg tccgcagccc aggtctcgga 2220
cgatggcttt gagctcttgc tcgctggagc cgtttccgga cccgcatgac atggctgcag 2280
ctgctgcttg caagaagcaa gaggcttctt atgtggtggc gttgccggcc gagaacggtg 2340
tgcgcaggta gacggcctcg atgacgccgc ggtgtggctg gtgcactctg accacgtcga 2400
agacttcgaa aagaagataa agcagggtgg gctcatccat gggatccacc tcaaaagtca 2460
tgtccagcgc atgggccgag ttggcataca gcaagttctg tcccaggtct gtaagggcac 2520
ccatggacat gaagttgcta gagaatggga tgcgccacat ggtcctgtcg cacaggaatt 2580
ttttctgggt gacactggtt actgcagtgg ttccaattag ggggtatggg tagttagcag 2640
ggtacgcttg accctgacgc atggtaggag ccatgtaacc cacaaagcca gagttattat 2700
gctggtaggg tacggcgaca gctttatagt ctttgtagtt aatctcatca accacctgtc 2760
tactcatggg ctggaagttt ctgaagaagg agtacatgcg atccttgtaa ccctcaggaa 2820
cgtagaagcc ctggtatcca atgttgtagt tggcaagcat ctggaccagg aaccagtctt 2880
tggtcatgtt acattgggcc acattgtagc cttccccatc aactgtgcgc ttgatttcga 2940
actcatttgg acttagcaat ctgtcattac caggccagct cactgaagag tcaaacatga 3000
tggagacttt cttgaaagtg tggttaaggt agaaggtacc atccaggtag ggtatagaac 3060
cagagtaaac aaagtaggga tcgaaccctg atcccaaaga gggagtctcc ttggttttga 3120
gtctggtgaa ggaccagcct ctgaaggcgg cccagttgcg agagggaatg gagatgggaa 3180
cgttggtagc gttggccggg atggggtaga gcatgttggc agcagaaagg tagtcattga 3240
atgattgatc attggtgtca ttgcgcagca tggcttcaag ggtggaggca gtgttgtggg 3300
ccatggggaa gaaggtggca tagagattga tgctggtaaa acttatgctg gcaccatcga 3360
cccggagatc attaccaagg gaactctgca ggaccatgtt cacatccttt ctgaagttcc 3420
actcgtaggt gtaagaaccg ggtagaagca gcaggttctt cacagcaaag aatttctgag 3480
gcacttgaat gtggaaaggc acgtaacgac cattgcccaa aagcatggac cggtatcgca 3540
ggccagcgtt gcggtgatgg ttaaaggggt tgacattgtc catggcatcc aaagaccatc 3600
tggcgccaat gtttacgtag gtatccacca gggatggggg aaccacccgc ccattcatgt 3660
agtcataagt gttggtgtta gttggaagag tgacattggc tggggtgtat ttgtaggagt 3720
ctgggagata cagagccaca ttggaataaa gaaaacttct ccagagatta gcttggaggt 3780
taatttccat ggcaaagaga tttccttgtc caatttcact tgttccattt atgtcaggct 3840
ctttccaatc tgcaccctgt ccgtttggtt caattatttt gtaactactt attggtaccc 3900
ctactccatc caatggaaag cagtagttgg gaagctcatc ttccacccca tgattttcaa 3960
taatgcgcac atcaggatca tagctatcga ctgcttgatt ccacatgctg aagtatctgg 4020
ttctgtcacc cagagagtca agcagtagtt gatatgatag ttctgtgttt ctgtcctgca 4080
agtcaaccac cgcattcaat tgggatgctt gacctgccag cactcccatg ttgccagtac 4140
tgttgtagta cataagtcca ataaagttat ctctaaagcc aatgtagttg ggtctgttgg 4200
gcatagattg ttgacccaga ttagcatgag aactttcttc tgaagtacca ggtttgtaca 4260
ccacatgagt gtctggggtt tccaagtcta cattttctgc atacatcaca atttttggac 4320
tgaagtttgc tttctgtgac gcttcatcaa aaaagttcat gtcaatatca tattcaacct 4380
gctggttttg cggttgttca gtagtttttt gttttgcctg tccgcctttg acgttagtgg 4440
gtttagcaaa agacccatag cagggtttca ttttagtttc tggctttaga gctctaccac 4500
catacttctc agttgttcca tctgtgtcag tccaagtttc atctcccacc tgaggttctg 4560
gttggtatag tttatctgca taaattggtt tggcttcgcc gtctgtaatt tctgaaccaa 4620
ttggaagacc tttgtcttta gtgatatcac caccttctgc tttcactggg gcatttccaa 4680
aagtgtaagt ggtgagattt ttctcttcct cttcgtcaga tcccccatct tcttttttta 4740
cgccttcagc aatccactga gatgtattgg gagcgccctt aggggccaac gagttgtaag 4800
cagtgccaga gtatggcttg aagctagggc ctctatccaa cacaccccga atgtcaaaga 4860
aagtgctggc catatccagc actctgttgt cgcccacagc caaggtgtat cgaactttgt 4920
atgcgtaggt attgtcttcc cggtcaacgg gcacaaagcg cagcatcagc cgctgactgc 4980
ggtcggtggt cacatcatgg gtgggcgcca cggtggggtt cctaaacttg ttccccagat 5040
tgaagtaggt gtctgtggcg cgggcgaact gcaccagacc cggactcagg tactccgaag 5100
catcctgtcc ggcgatgtgc atgtatgccc actggggcag catcgatggg gtggccatct 5160
tgaaatcaac tcagcctcgg cgcgcgacct cttccttgct cctctgctgt tgctgcggcg 5220
gcggcgtgat gatgacacat acacacagac aggcaagtta agcgctactc catattaatt 5280
taaaagcagc gacggcgctt tacactttgc acgcccagac ccacgatgct gttcagagta 5340
ctctgccagt ttgcattcgg acgtggagtg cccccaggac gcggtctggc tacggcgacg 5400
ggctgtacgg tggtgggctt cggggtagcg acaggcttgc gagcaggcgc tgcaacagca 5460
gggggaggca agtccaaggt agcgggtcgg tgtgactgag aaggtttcat taccccggta 5520
gccatggggg ctacaggtct ggtggtgggc attccaagct tcactgcctc ctcgtaggag 5580
ggcgggtcgt ctgagcgtgt gactagtgtc tcctccagat cggggcgcgg acgcttgtcg 5640
ccccgctttt caaggggagg gagatcttcc tccacttcca tttcacccgg ggctgacggc 5700
ggcgggtcaa tgcggctgtt tatctgtttc tgcacggcct ggttggccag atccaccacc 5760
ccattgatac cagaggcgat tccatcaacc accttctgtt ggaagttttg ctctttaagc 5820
ttatttctca atgcctgccc tgtgctgctg ttccaagctt tgttcccata ggtttttatg 5880
gtagagccaa aatttttaag cccgctccag atactgctcc aattgaaggc gcccccgttc 5940
agttggctgg tgccgatgtc gctccaggtg cccatgtacg gcctcgtgcc gtgtcgcgga 6000
gccagggatg aaaaattgat gtcttccatc tctacaaaaa catagtcaca ggaccaggag 6060
catcagagtc cattctgttt tatttataag tttttccaat gtcagtggcg ctgcgaggcc 6120
tgaaccgcca cggaagctat gcctggtatc gccccgatcg ccgcggctat gatggggatc 6180
agagcaggca gaaagccacc ccccagcctc ttgctgatag cgcgccgccg cctgtggcgt 6240
cgcattccgc gccccaacat ccctcttcta cggcgcgagt ttcttcctcg gtagccagta 6300
atggggacac gaaggcggca agtgagggcc atatctgcaa ggaggcagcg gcaacagttg 6360
ttaagttgtg atgcttggat ggtagcgtac gcgcggcaac gtcaggggat ccgcgcggcc 6420
atcgcgatac actctccgca ccagagcagc gggagtcaga ttgctggtgg ggcggcggcg 6480
acgacggtga ctacgacttg caggtgtttt gcggcgacgg cgggaagtgc tgctcctgct 6540
gcggtagtag cgagtgcctc ggtaacccgg agttggaata atggatgggt gcagagcata 6600
atttggcatc agcaaacttg ctggaccgta ctttcgccgg gatcttcgag tggtgttgac 6660
agcagctgga gttgtaacgg gtgcggtcat ccagggatcc gtttgcacct caatggaggt 6720
ggttgtgggc tttgcaggtt cggtttggac ttccatggac tcggtgggaa tcttgatgtc 6780
tacggtttgt actcccaaac ctggcgccac ctgcttgatg ggtctcactt tgacctcagg 6840
ttgtatatcg ggatccactt tcattttctc cagcacgtcc tccagccgct ggcgcttggg 6900
caccatcaat tgcatagtgg gatacagatc ctcaccctct cgcttgttgc ctctgcgtgg 6960
aggcacgggc agcacttgct gcagggtgac tggcttgaga ctaggggtgg gattcccatt 7020
gtccaaggga atggacaccg cctcctcctt ggggctcgag cgggagcgct tgccataagc 7080
aaactcgccc aggcggtcgg ccgcctgctc cagaatatca tcatccccat acacctcatc 7140
ataggaccgc ttaaaagcag tgctggagcg ctcgccgggc gtaaagacca ccgtggttcc 7200
aggtctcagc acaggccgca ctttgcgtcc acgccactgc acacgccgcc ttggggcgaa 7260
ctcgcgtaca aactccgcca gaccatcatt gccatcttct tcctttttgt cctttttgac 7320
ccgcttgatt ttgcggggct ttttttcatc cttcaccggc ggaccgtaga tttcaggcgc 7380
gatgacctgg agcatctctt ccttgtattt gcgcttggac atcctcgctg ggacacaaca 7440
tcggagactg ctcagtatct tctaagagcg aggggggcgg gtgcgcacgg gcacgcgctg 7500
gccggtggtg gcgtcgcgca cccagtacac attgcctctt cgcggttggg ccatgttggc 7560
aatggccgct gctgccgccg tggctgcgcg cctgcgggac ctgccggcac tggcacctga 7620
agccgcgcgt ctggccgctc taagcatagc tcttcgcccc acgcgtttgg ccctccgtag 7680
cagagctctt gccgctcgca tagcgggagt agcccggtgg cgcctggcga tgcgtctccg 7740
cctgctcttc cggcgagcat aggcgcgggc gtcagccact acgctgtcaa taactgcatc 7800
cacagtagat gtaggtgcag taggagtata attacgagca tcggccacca cctggtcgat 7860
cacatcatcg acggtggttc tagtgcgggc acgacccttg agggcgcccc atggagcgcg 7920
gaagtgcccg cgcacgcgca cagggtgctg tgtagagcgt ttgcgagcac ctccgtacat 7980
cttgcttggc gcgcgcaggc cccaaccggt gttattacta ggtgagataa gaatggacat 8040
tttttttttt agaaagtgcg gcttgaaagg acgcgcggcg cgactatgcc cagggccttg 8100
tagacgtagg ggcaggtgcg gcgtctggcg tcagtaacgg tcacgcgctg gactccccgg 8160
atactgctgc gcaacggcag ggtcccgtga tctgtgagag caggaacgtt ttcactgacg 8220
gtggtaatgg tgggcgctgg cgggcggatg aggatctggt tctcagggaa gcggttgaag 8280
acgtgcgtga gcgaggtgga ctggcgaagc tgctgggagt acacggcttg ctcgttgtag 8340
aaactctttg agaagaccgg catgagctct gcacctacca ctggatagtt gctgacttgt 8400
ctcgtggaac ggaatgtgac agggtcctgc atcatgtctg ggagcgacca gtacacctgc 8460
tctgctccac aggtgacatc cgaggtggtg agcagtgtcc aggaacggac tcctttttca 8520
gggtcaccat agttgtagga caggtaccag ctgcggtagg ctgtattcac tttatcttcc 8580
aagacattgt aacttctact cttgctgtct ttttctacag gtttaatagt gagttttgtc 8640
tctgtagttt cggccacagc agccaatagc gattcgtcag ttgcaacaga tgaagctgta 8700
tagttgtctc ctctgacttc ttctgcatta gccaccctta cagggtcgct gacaactatg 8760
ttggctttag caatagcagc agctttagcg gcttctgttt tggcttcttg ttctttctta 8820
ctgttctcat aggcttctac atccaacagg gccgggatat tacccccttc aagatcctca 8880
tacaagatct taaaaccctc ctggaatggg tgtcttttcc tgataccaag caagttacta 8940
aggcgacttt cagtaaagtc aactccgcaa ccaggcaaca atacaatgtc aggatggaat 9000
gcctcatagg tgtaaacccc aggcataatc aacttagttt ccggatccca acccagtcta 9060
aagttcctgg tgtcaaattt aacaccaatg tcactctcta acactccatt ctgtctgccc 9120
acttcaaggt aattatcaat gatggcattg ttcattaggt caatggtcat tgtggctgag 9180
aaattccctt ccggtagagt aaactcaaac cactcatatt ccaaaatatc ctgcttgtga 9240
tcataattgt catctactgt gacaccttca ggagcctttc tagacaccat cacccgagct 9300
ttgaacttgt tgctaaacat gtactcgttc acgttgggca tgttggtgtg catgatagtc 9360
ttcagctgac cgccccatcg cgaccgctcg tcaaagttga tggtctgggt gctggcctcc 9420
gtgggggtaa agtcattgtt ttgcaccacc gtggtgagga agttgctgtg gtcgttctga 9480
tagttcagtg aggcgatgtc cgcggacttg ttgtccacca aatacaaccg ggtggtatca 9540
tacaatggtg ccagctccga gtaacgaatg ctgtttctcc cctccgtagg tgccaggtac 9600
cgagggggta caaagggagc ctccagtggt ggctgcatcg tcgccgccgc cgcctgctgc 9660
atcacgctct cgtacgaagg aggaggaccc tccggataca ccaccgctcc gcctagcacg 9720
gttcgcctca tcatactaga tataacagag aagaaacgaa cgcacgctgg tcgccatggc 9780
cttggtgagt atttattttc ggtttcttac atcaggcgcc cgacgcgggg gcgcaggtga 9840
gcgaacgggt taccaccact cccacccaag tccaacacgc tgctgtcgtc ggcggaatca 9900
tcatcggccc acaccaggcc ccgctgcctg tcgtgccact ggcgtttacg ggtagcgctg 9960
ccccggctat cccccagcgc ccggggatcg tgcgcgtacg tcttccagcg gttcattttg 10020
tcaaccaagc tttctatccc gttgttgggg aaattcttct ccctctcggg tctcaacagg 10080
gagtcgttca aatactcctc ctcgccgatc aagcgaggac gggttattct tcccagctca 10140
ctgctgcgta cactgtttag cgaaaatggc aaactaggga aaggacttgc ggcctcggga 10200
gccgctgcgg cagcacccgt tgccccggac agtgacacgg aagagtgcct tctatcgcca 10260
ccttccttct tccaagtgtt ataaccagga ggcggggaga aaacactact gtccacatcg 10320
tcccataaaa acccgtcatt gggtcgggca atgtcatact cgcccgtata gaacccaggt 10380
gggggcagcc aatgggggtt caggatagca ttggtgaaat aatcagagtt catagcagcc 10440
gccctgtgta agtagtctag cagtttattg ataaaaggcc ggttactggc atacatgctg 10500
ggctccatgt ttcgggctgt catatcgagc gcagcagtag gagtcgcccc ctcctgcatt 10560
aggaacagtc ccacgctctg ctgcacgtat ctcaggatcc gttcctcctc cgcggtaagc 10620
gcatactgag gagggatctt ctgcgaccgg ttggtcagca agaagtttaa ggtggcttcc 10680
aagctgccag tgtcctcccg acccagagcg cggctcactt gggtaatttc ttgataggtt 10740
tgctcatcta cctgagtttg ccctatggcc tcgcgataca ggttcaacag atagcccaag 10800
tacgaattac ggtcgatgct accgctgtca gtgaatgggg ctaccaagag cagtagtagg 10860
cgggagttgg gggtcagcaa gctagacacg gtcgcccgat ctcccactgg ggcgcgcact 10920
ccccacagac cattcaggtt cttaaaagcc tggctcaggt tcactgtctg caagccctgt 10980
ctgctggtct ggaaaaagta gtctggcccg gactggtaca cttcgctttg agggacttcg 11040
gccaccatga gtctcaatgc acttagaaag tttgtgtagt cttgctgacc gcgaggcacg 11100
ttggcaggct gagtgctgag gaaggcgttc aaagccacca gcgaccctaa attggcgtct 11160
cgctggaacc gctcgcgctg agacacggcc tcgcgcacat cggtcaccat ccggtccagg 11220
ttggtctgca cgttgctgct gttgtagcgg gctacgcgct ccaatagggc attgtatacc 11280
agcccagcct catcgggacg tatggctttg ttctccacca gcgcgttcac gatggccagg 11340
accttctcgt gtgtggggtt ggagcgggag ggcactacgg cctccaggat agcagaaagg 11400
cggttggcct ggggttgctg cctaaaggct tcggggttgc gggtcgtcag cgccatgatg 11460
cgttgcatgg cctggctcca atcgtccgag gagttaatgc cggacggctg gctctgtagc 11520
gccgcccgtt ttgcggggtc cggtgcctgc tgttccatct agcaaaaata tggatggtcg 11580
cgccatcagt cttccaggta ctcgccctcc tcatcctggc cttcatccac ctcttctatg 11640
taaggaagct cataccctgc tgcgtccagg gccctgcgac tgggctgcca ttgcaagtcc 11700
gctcccatgt caaagtagtt ctccccctcg gttccagccc cagtcagagc tctttgcaag 11760
ctgtgcataa gttctctgtc gctcagctca cgccttctgc tggcgctcac tgcgcggtgc 11820
atcctgtcgt tgcggtacac tcccagatcg tcactcaagg tcagcacctt gagagtcatg 11880
cgcatataaa acccatctat cttcacctcc ttgtctatag gtacgtatgg ggttttgtag 11940
atcttgcgag cgtagtgctt gcccaggctc aagaccgagt agttaatagc agccaccttc 12000
tcagctagac ccaggctacg ttcttgcact attatacttt gcagaatatt gataagatca 12060
tacaaccatc tcccctcggg ctcagtaatg ttcaacagcg cctccctaaa tgcctcattg 12120
tctctactat gttgcaccac cagaaacagc tgagcggtta gaggtttgct ggtggggttc 12180
tgggtaatgg cttccatcag gtcccacagg tgcatcagtc ccagtgtcac ttcctcgcgg 12240
gcaatcaggg tgcgcacatg gttgttgaaa gatttttgaa agttgcgctc ctccttcacg 12300
gtctgctcgt aagctgatac taggttggcc gcggccacat gtgccctagc aggacttatt 12360
cctgtcactt catcgacttc aaaatcatca tcacgcagca cccgtcttcg gtccagaccg 12420
tgacgcagtt cgcgacccgc gttaaagcgg gaagctcgca tttcctcagg ctcctcgccg 12480
ctcctgtccc tgaacaggtt ctgctggggc acgtacgcct cgcgagagtc ctttttcagt 12540
tgcacccgcg ggtgccgctc gggcgatggt gcgcccaggc gcgccagtcc ctcgccctct 12600
tccaagtcca gatcataggc gggctgcccc gcgccgctga cggctgcagc cgcagtagtt 12660
acaggagcag gaagagcctt ttgtggctgt tgttgtagct gctgctgaga agggggctgt 12720
tgctgggggc gcatctgtcg cagcacggga tgcatctggg caacaaaaaa acaaaaaaag 12780
agggctcgct cccgtaaact ggagaagtcg gctggcgggg tcttagaaat gacggggctg 12840
ccaaaccctc gcttgtcgcg gaaaccggcc gatccggcgc gctaagactc gaaccggggc 12900
acaccgcaac gcaaccctgg cgattgattc tccagactac gggcgcgagc cactcccagc 12960
cccgagaact gagtgttcta aagcttgacg cagcactggc tcccatccag gaaaaagcaa 13020
aaaaaaaaaa aaacgacccg cctccgtatc ctggaggttt tgtgcaggcc tgggtcgaga 13080
cgggagtgcc agtaccacgt tagctgcggc tccagcctga tccgagattc gaaccggggt 13140
acacgcgcag cccaacccgt tcgcttagcc tccaggccac ggagacgagc cgctgaccgc 13200
tttcgttttt gcccgtatgt ctagagcatc aacgactgtg cacgtctcac gggccaaacc 13260
gtgcctacca tgaactactt catgccgctg cgcaacatct ggaaccgcgt acgcgagttc 13320
ccgcgggcat ccaccaccgc ctccggtatc acctggatgt ccaggtacat ctacggttat 13380
caccgcctca tgctggaaga cctcgcccct ggcgccccgg ctacagagcg atggccccta 13440
taccgccagc cgccgccgca ctttcttatc ggctaccagt acctggtgcg cacctgtaac 13500
gattacatct ttgacacccg cgcctactcg cgcctcaagt acaccgagat tgtgcgtccg 13560
gggcaccaga cagtcaactg gtcagtcatg gccaactgct cctacacaat caacaccggg 13620
gcttaccacc gcttcgtgga ctttgacgac ttccaagcca ccctcaccca ggtgcagcaa 13680
gccatcctcg cagaaagggt tgtagcggac ctggcacttg tccagcccat gcgcgggttc 13740
gggatcactc gcatgcatgg cagagcgggc gaagaagaag tgcccgtgga acgactcatg 13800
caagactact ataaagatct ggccagatgt caggataatg cttggggaat ggcccatcgc 13860
ctgcgcatcc aacaagccgg acccaaagac ctggtgctcc tcgccaccat ccgccgtctc 13920
aaaactgcct attttaattt catcaccagc agcatcgtct caccctccaa agaggaggaa 13980
ggagaagaaa gagagaaccc cgaccgagcg tctagccgcc cccgcccgca agaaacagtg 14040
ctcagcctac cttgcgattg cgactggtta gacgctttcg tcgaaaggtt ttcagatccc 14100
gtggatcttg agacgatcag gtccttgcgc ggagtaccta cggggcaatt gataaaatgc 14160
ataatcagcg cggtgtccct gcccaacgga gagcctccca gtcaccactt cagggagatg 14220
cgcggaggcg tcttcactct gagacccagg gagaacggtc gtgccgtcac cgagaccatg 14280
cgccgccgcc gcggagaggt cattgaaaga ttcatcgacc gtctgcccgt gcgccgccgg 14340
cgtcgccgcg ttccccctcc tcctgcagcc ccacctgaag aggaagagat gttagtggaa 14400
gaagaagaga ttgaggaaga aatcccaggg gctttcgagc gcgaggtgcg caccaccgtc 14460
gccgaactca tccgtcttct ggaagaggag ttgaccgtgt ccgcgcgtaa ctcccagttt 14520
ttcaactttg ccgtggactt ctacgaggcc atggagcgct tggaagcgct gggcgatgtc 14580
agcgagatgc cgctgagacg atggatcatg tatttcttcg tcaccgagca catcgccacc 14640
acactcaact accttttcca gcgtctatgc aactatgcgg tcttcacccg ccacgtggag 14700
ctcaacctcg cccaggtggt catgcgcgcg agagatcccg tgggggctgt ggtctacagc 14760
cgcgtctgga acgaggcggg catgaatgca ttctctcaac tcattgggcg catctccaac 14820
gacctggcgg ccaccgtcga gagagcgggc cgcggagatc ttcaagagga agagatcgag 14880
cagttcatgg ccgagatcgc ctaccaggac aactctggcg acgtgcaaga aatccttagg 14940
caagccgccg tcaacgatac cgagattgat tctgttgaac tctctttcag gttcaagctc 15000
acggggccgg tagctttcac ccagaggcgt cagatccagg atgtcaaccg ccgcgtcgtc 15060
gcgcatgcga gtcttctcag agcacagtac cagaacctac ccgcgcgcgg cgccgacgta 15120
ccactgccag ccatgccgcc gggtcccgaa ccgcccctgc cgcccggtgc gcgccctcga 15180
caccgcttct aaacatgcaa gaagcaacag agccaccgcc gcccaaaagg aaaaacaagg 15240
gcacggtggt agcacccaag gggcacggaa ccctgcaagc catcgacatc tccaccaacg 15300
gacccgtgga gatcaagtac catctgaacc tccctcacgc cctcgaaaag atcatgcaag 15360
tcaatctcct gacactgcct actaacctga ctccgcagcg tctcaggacc ctggacagct 15420
ccggcctgcg cgctctcgtc ctcgagctcc gcccctgccg cgccgaggtc tggacttgcc 15480
tcccgcgagg gctcgtcagc atgaccacca tcgagacaga agatggtcat gccgatgcag 15540
acaacatagt agagcgcgag gtacaaacgc caggcctcaa ttttccactg aaatttctcg 15600
tcaaaggaag tcaggtacaa ctcattcatg aggtgcatcc cgtgaatcgc tgcgagtact 15660
gcggccgtct gtacaagcac aagcatgaat gctcggcgcg tcgcagggag ttctacttcc 15720
atcacatcaa cagccattcc tccaactggt ggcaggagat ccagttcttc ccgattggct 15780
ctcatcctcg cacagaaagg ctcttcctca cctacgatgt ggaaacctac acctggatgg 15840
ggtcctttgg caagcagcta atccccttca tgctggtcat gaaactctct ggagaccagc 15900
ggctcgtcaa catcgcctat gacctcgcca tgaaactcaa gtgggatcgc tggcggcagg 15960
acccccaaac cttctattgc gtcaccccag aaaagatggc agtcgggcag cattttcgtc 16020
agtaccggga ccagttacaa acagcactgg cagtggacct ctggtcctcc ttcctcaaag 16080
cgaaccctca cgtgcacgaa tgggccctcg aacactatgc tctcactgac cctacagatc 16140
tcacttttga agaactcaag aagctgcctc atgtcagggg cacccctcga ttcttagaac 16200
tgtacatagt ggggcacaac atcaatggct ttgatgagat cgtcttggcc gctcaggtta 16260
tcaataaccg agcagaggtc cctcagcctt tcaaaatcac ccgaaatttc atgcccaggg 16320
ccggcaagat cctcttcaat gatgttactt tcgctttgcc caaccccgcc tacaagaagc 16380
gggtggactt ccaactctgg gaacaggggg cctgtgatga cattgacttc aagtatcaat 16440
tcctcaaagt catggtcagg gacacttttg ccctcactca tacctcgctg cgcaatgcag 16500
cccaagcata ctctcttcca gtggagaagg gatgctgtcc ctacaaggca gtcaatcagt 16560
tctacatgtt gggctcttac cgtgcagaaa aagacgggtt tcccctcgaa gagtactgga 16620
aggatcgcga agaatacctt ctcaaccgcg agctgtggga aaagaaaagc caaccgcgtt 16680
atgacatcat ccaggaaact ctcgactact gtgccctgga tgtactcgtc accgccgagc 16740
tggtagccaa gctgcaagag tcatatgccc acttcataag ggactctgta ggcctacctc 16800
atgcccattt taacatattc cagagaccta ctatctcttc caattcccat gccatctttc 16860
gccagatcgt ttacagggcg gaaaaaccca accgcaccaa tctgggcccg ggtcttctcg 16920
ccccctcaca tgaactctat gactatgtgc gagcaagcat cagagggggg cgctgttatc 16980
ccacttacat cggcatcctc gaagagcccc tctatgtcta cgatatctgt ggcatgtatg 17040
cctccgcgct cacccacccc atgccctggg gcacccctct taacccctat gagcgcgcgc 17100
tggcagttcg agaatggcag atgaccttgg atgatcccgc caccatcagc tattttgaca 17160
aagatttgct accgggaata tttaccatag atgcggaccc ccctgatgag ttcatgctag 17220
accccctccc acctttctgt tcaagaaaag gaggtcgact ctgctggacc aatgagcccc 17280
tccgaggcga ggtggccacc agtgtggatc tgataaccct gcacaatagg ggatggcgag 17340
tcagaatagt tccggatgaa ctgacaacca tcttccctga atggaaatgt gtggcgcgcg 17400
agtacgtcca gcttaacatc gccgccaagg agcgcgcgga caaggaaaag aaccaaacca 17460
tgcgctccat cgccaagctt ctgtccaatg ccctttatgg atcatttgcc accaagctgg 17520
acaacaagaa gattgtgttt tctgaccaga tggacgagag tcttatgaaa ggcgtctctg 17580
ctggtactgt caatatcaaa tcctcctcgt tcctagaaac tgacaacctg agtgcagagg 17640
tcatgcccgc cttcgagagg gaatacctac cccaacagct ggcgctcctg gacagcgatc 17700
ctgaagacag tgaggacgaa cagaggcccg ccccctttta tacccccccg gcggggaccc 17760
ctggtcacgt ggcctacact tacaagccaa tcacattctt ggatgtggag gagggggaca 17820
tgtgtttaca taccgtagag aaggtggacc cactggttga caacgaccgc tacccctccc 17880
acgtggcctc ctttgtgctg gcctggacac gcgcttttgt atcagagtgg gctgggttcc 17940
tctacgaaga ggaccgaggc actccgctcg aggacaggcc cataaagtcg gtctacgggg 18000
acacggacag cctctttgtc acccagcggg gacacgaact catggaaacc aaaggtaaga 18060
aacgcatcaa aaaacatggc ggaaaacttg tttttgaccc cgatgagccg gatctgacct 18120
ggctcgtgga gtgcgaaacc gtctgcgcct cctgcggtgc ggatgcatac tcccccgaat 18180
ccattttcct cgcgcccaag ctgtatgccc tcaaatgtat ctactgcccc gcctgccata 18240
aaacttccaa aggtaagctc cgtgccaaag gccacgcggc cgaggcgctc aactacgaac 18300
tcatggtaaa ctgctacctg gccgacctgc agggcgccga tcggcagcgg ttctcgacca 18360
gcaggatgag tctgaagcgc accctcgcaa gcgcccaacc aggcgcgcac cccttcaccg 18420
tgacggaaac aaccctgact cggacgctgc gaccatggaa ggatcggacc ctagcagcgc 18480
tggacgccca tcgtctgatt ccctactcca ggagccgtcc caacccgcga aacgaggagg 18540
tctgttggat cgagatgcca tagagcacat caccgagctc tgggaccggc tcgagctctt 18600
gcaacagact ctttccaaaa tgcccatggc tgacgggctg aagccgctga aaaacttctc 18660
ctcgctccag gagcttctat cccttggggg agagcgcctc ctaacggact tggtgcggga 18720
aaatatccat gtaagggaaa tgatgaacga agtggccccc ctgctccggg aggacggcag 18780
ctgtcgctcc ctaaactacc atctgcaacc cgtaattggg gtcatttacg gtcccactgg 18840
gtgcggcaag tctcagctgc ttaggaattt gctctcatcc cagttaatca ccccggctcc 18900
agaaacggta ttttttatag ccccgcaggt ggacatgatc cccccctcgg aactgaaagc 18960
ctgggaaatg caaatatgtg agggaaacta tgctcccggg ccagagggaa ctttcatccc 19020
ccaatctggc accctccgcc caaagtttat taaaatggct tatgatgacc tgactcagga 19080
gcataactat gatgtttcag acccccggaa cgtgttcgcc cgtgccgctg cccacggccc 19140
catcgctatc attatggatg agtgcatgga gaatctgggg ggtcacaaag gcgtctccaa 19200
attttttcat gcttttccct ctaagctgca tgataaattt cccaagtgca ccggatacac 19260
tgtcttggtg gttctgcaca atatgaatcc gagacgggat ctaggcggca acattgccaa 19320
cctcaagatc cagtccaaaa tgcatataat ttcacccagg atgcacccgt cccagctcaa 19380
cagatttgta aacacctaca ctaagggcct ccccgttgca attagtctgc tcctaaaaga 19440
tattgtgcaa caccatgcac tccgaccttg ctatgactgg gtgatttata acactacccc 19500
ggagcaagag gctcttcaat ggagctatct ccacccccga gacggactaa tgcccatgta 19560
tctaaacatt caatcccacc tttacagggt actggaaaag atccaccgag ttctcaatga 19620
tcgagaccga tggtccaggg cataccgcgc gcgaaaaatc aaataaacat tcatttgttt 19680
ttataaca 19688
<210> 86
<211> 3768
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 21 sequence
<400> 86
atgtctaatg gtggcgcggc tgagctagct cgactgcgac acctagacca ctgccgccgc 60
tttcgctgtt tcgcccggga actcaccgag ttcatttact tcgaactctc cgaggagcac 120
cctcagggtc cggcccacgg agtgcggatt accatcgaag ggggaataga ctctcgcctg 180
catcgcatct tctcccagcg gcccgtgctg attgagcgcg accagggaaa tacaaccatc 240
tccatctact gcatctgtaa ccaccccgga ttgcatgaaa gcctttgctg tcttgtttgt 300
gctgagttta ataaaaactg agttaagacc ctcctacgga ctaccgcttc ttcaatcagg 360
actttacaac accaaccaga tcttccagaa gacccagacc cttcctcctc tgatccagga 420
ctctaactct accttaccag caccctccac tactaacctt cccgaaacta acaagcttgg 480
atctcatctg caacaccgcc tttcacgaag ccttctttct gccaatacta ccactcccaa 540
aaccggaggt gagctccgcg gtcttcctac tgacgacccc tgggtggtag cgggttttgt 600
aacgttagga ttagttgcgg gtgggcttgt gctaatcctt tgctacctat acacaccttg 660
ctgtgcatat ttagtcatat tgtgctgttg gtttaagaaa tgggggccat actagtcgtg 720
cttgctttac tttcgctttt gggtctgggc tctgctaatc tcaatcctct tgatcacgat 780
ccatgtctag acttcgaccc agaaaattgc acacttactt ttgcacccga cacaagccgt 840
ctctgtggag ttcttattaa gtgcggatgg gactgcaggt ccgttgaaat tacacataat 900
aacaaaacat ggaacaatac attatccacc acatgggaac caggagttcc cgagtggtat 960
actgtctctg tccgaggtcc tgacggttcc attcgcatta gtaacaacac tttcattttt 1020
tctgaaatgt gcgatctggc catgtttatg agcaaacagt atgacctatg gcctcctagc 1080
aaagagaaca ttgtggcatt ttccattgct tattgcttgg taacatgcat catcactgct 1140
atcatttgtg tgtgcataca cttgcttata gttattcgcc ctagacaaag caatgaggaa 1200
aaagagaaaa tgccttaacc tttttcctca taccttttct ttacagcatg gcttctgtta 1260
cagctctaat tattgccagc attgtcactg tcgctcacgg gcaaacaatt gtccatatta 1320
ccttaggaca taatcacact cttgtagggc ccccaattac ttcagaggtt atttggacca 1380
aacttggaag tgttgattat tttgatataa tttgcaacaa aactgaacca atatttgtaa 1440
tctgtaacag acaaaatctc acgttaatta atgttagcaa aatttataac ggttactatt 1500
atggttatga tagatccagt agtcaatata aaaattactt agttcgcata actcagccca 1560
aatcaacagt gccaactatg acaataatta aaatggctaa taaagcatta gaaaatttta 1620
cattaccaac aacgcccaat gaaaaaaaca ttccaaattc aatgattgca attattgcgg 1680
cggtggcatt gggaatggca ctaataataa tatgcatgtt cctatatgct tgttgctata 1740
aaaagtttca acataaacag gatccactac taaattttaa catttaattt tttatacaga 1800
tgatttccac tacaattttt atcattacta gccttgcagc tgtaacttat ggccgttcac 1860
acctaactgt acctgttggc tcaacatgta cactacaagg accccaagaa ggctatgtca 1920
cttggtggag aatatatgat aatggagggt tcgctagacc atgtgatcag cctggtacaa 1980
aattttcatg caacggaaga gacttgacca ttattaacat aacattaaat gagcaaggct 2040
tctattatgg aaccaactat aaaaatagtt tagattacaa cattattgta gtgccagcca 2100
ccacttctgc tccccgcaaa tccactttct ctagcagcag tgccaaagca agcacaattc 2160
ctaaaacagc ttctgctatg ttaaagcttc gaaaaatcgc tttaagtaat tccacagcag 2220
ctcccaatac aattcctaaa tcaacaattg gcatcattac tgccgtggta gtgggattaa 2280
tgattatatt tttgtgcata atgtactacg cctgctgcta tagaaaacat gaacaaaaag 2340
gtgatgcatt actaaatttt gatattgttt caatcaaatg ccactaacac tctcaatgtg 2400
cagactactt taaaacatga catggaaaac cacactacct cctatgcata cacaaatatt 2460
cagcctaaat acgctatgca acttagaaat caccatacta attgtaattg gaattcttac 2520
actatctgtt attctttatt ttatattctg ccgtcaaata cccaatgttc atagaaattc 2580
taaaagacgt cccatctatt ctcctatgat tagtcgtccc catatggctc tgaatgaaat 2640
ctaagatctt tttttttctt ttacagtatg gtgaacatca atcatgattc ctagaaattt 2700
cttcttcacc atactcatct gtgctttcaa tgtctgtgct actttcacag cagtagccac 2760
tgcaagccca gactgtatag gaccatttgc ttcctatgca ctttttgcct ttgttacttg 2820
catctgcgtg tgtagcatag tctgcctggt tattaatttt ttccaactgg tagactggat 2880
ctttgtgcga attgcctacc tacgtcacca tcccgaatac cgcaatcaaa atgttgcggc 2940
acttcttagg cttatttaaa accatgcagg ctatgctacc agttatttta attctgctac 3000
taccctgcat tgccctacct tccaccgcca ctcgcgctac acctgaacaa cttagaaaat 3060
gcaaatttca acaaccatgg tcatttcttg attgctacca tgaaaaatct gattttccca 3120
catactggat agtgattgtt ggaataatta acatactttc atgtaccgtt ttctcaatca 3180
caatataccc cacatttaat tttgggtgga attctcccaa tgcactgggt tacccacaag 3240
aactagatga acatatccca ctacaacaca tacaacaacc actagcattg gtagagtatg 3300
aaaatgagcc acaaccttca ctgcctcctg ctattagtta cttcaaccta accggcggag 3360
atgactgaaa tactcaccac ctccaattcc gccgaggatc tgcttgatat ggacggccgc 3420
gcctcagaac agcgactcgc ccaactacgc atccgccagc agcaggaacg cgtgaccaaa 3480
gagctcagag atgtcatcca aattcaccaa tgcaaaaaag gcatattttg tttggtaaaa 3540
caagccaaga tatcctacga gatcaccgct actgaccatc gcctttctta cgaacttggc 3600
ccccaacgac aaaaatttac atgcatggtg ggaatcaacc ctatagttat cacccagcaa 3660
agtggagata ctaagggttg cattcactgc tcttgcgatt ccaccgagtg cacctacacc 3720
ctgctgaaga ccctatgcgg cctaagagac ctgctaccca tgaattaa 3768
<210> 87
<211> 972
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 21 sequence
<400> 87
atgaccaaga gagtccggct cagtgattcc ttcaaccctg tctaccccta tgaagatgaa 60
agcacctccc aacacccctt tataaaccca gggtttattt ccccaaatgg ctttacacaa 120
agcccagacg gagttcttac tttaaattgt ttaaccccac taacaaccac aggcgggcct 180
ttacagttaa aagtgggagg gggacttata gtggatgaca ctgatgggac cttacaagaa 240
aacatacgtg ctacagcacc cattactaaa aataatcatt ctgtagaact atccattgga 300
aatggattag aaacacaaaa caataaacta tgtgccaaat tgggaaatgg gttaaaattt 360
aacaacggtg acatttgtat aaaggatagt attaacacct tatggactgg aataaagcct 420
ccacctaact gtcaaattgt ggaaaacact gatacaaacg atggcaaact tactttagta 480
ttagtaaaaa acggagggct tgttaatggc tacgtatctc tagttggtgt atcagacact 540
gtgaaccaaa tgttcacaca aaagtcagca accatacaat taagattata tttcgactct 600
tctggaaatc tattaactga tgaatcaaac ttaaaaattc cacttaaaaa taaatcttct 660
acagcaacca gtgaagctgc aaccagcagc aaagccttta tgccaagtac tacagcttat 720
ccctttaaca ccactactag ggatagtgaa aactatattc atggaatatg ttactatatg 780
actagttatg atagaagtct agttccctta aacatttcta taatgctaaa cagccgtacg 840
atttcttcca atgttgccta tgccatacaa tttgaatgga atctaaatgc aaaagaatct 900
ccagaaagca acatagctac gctgaccaca tccccctttt tcttttctta tattagagaa 960
gacgacaact aa 972
<210> 88
<211> 273
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 21 sequence
<400> 88
gacggagttc ttactttaaa ttgtttaacc ccactaacaa ccacaggcgg gcctttacag 60
ttaaaagtgg gagggggact tatagtggat gacactgatg ggaccttaca agaaaacata 120
cgtgctacag cacccattac taaaaataat cattctgtag aactatccat tggaaatgga 180
ttagaaacac aaaacaataa actatgtgcc aaattgggaa atgggttaaa atttaacaac 240
ggtgacattt gtataaagga tagtattaac acc 273
<210> 89
<211> 570
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 21 sequence
<400> 89
ttatggactg gaataaagcc tccacctaac tgtcaaattg tggaaaacac tgatacaaac 60
gatggcaaac ttactttagt attagtaaaa aacggagggc ttgttaatgg ctacgtatct 120
ctagttggtg tatcagacac tgtgaaccaa atgttcacac aaaagtcagc aaccatacaa 180
ttaagattat atttcgactc ttctggaaat ctattaactg atgaatcaaa cttaaaaatt 240
ccacttaaaa ataaatcttc tacagcaacc agtgaagctg caaccagcag caaagccttt 300
atgccaagta ctacagctta tccctttaac accactacta gggatagtga aaactatatt 360
catggaatat gttactatat gactagttat gatagaagtc tagttccctt aaacatttct 420
ataatgctaa acagccgtac gatttcttcc aatgttgcct atgccataca atttgaatgg 480
aatctaaatg caaaagaatc tccagaaagc aacatagcta cgctgaccac atcccccttt 540
ttcttttctt atattagaga agacgacaac 570
<210> 90
<211> 1686
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 21 sequence
<400> 90
atgatgaggc gaaccgtgct aggcggagcg gtggtgtatc cggagggtcc tcctccttcg 60
tacgagagcg tgatgcagca ggcggcggcg gcgacgatgc agccaccact ggaggctccc 120
tttgtacccc ctcggtacct ggcacctacg gaggggagaa acagcattcg ttactcggag 180
ctggcaccat tgtatgatac cacccggttg tatttggtgg acaacaagtc cgcggacatc 240
gcctcactga actatcagaa cgaccacagc aacttcctca ccacggtggt gcaaaacaat 300
gactttaccc ccacggaggc cagcacccag accatcaact ttgacgagcg gtcgcgatgg 360
ggcggtcagc tgaagactat catgcacacc aacatgccca acgtgaacga gtacatgttt 420
agcaacaagt tcaaagctcg ggtgatggtg tctagaaagg ctcctgaagg tgtcacagta 480
gatgacaatt atgatcacaa gcaggatatt ttggaatatg agtggtttga gtttactcta 540
ccggaaggga atttctcagc cacaatgacc attgacctaa tgaacaatgc catcattgat 600
aattaccttg aagtgggcag acagaatgga gtgttagaga gtgacattgg tgttaaattt 660
gacaccagga actttagact gggttgggat ccggaaacta agttgattat gcctggggtt 720
tacacctatg aggcattcca tcctgacatt gtattgttgc ctggttgcgg agttgacttt 780
actgaaagtc gccttagtaa cttgcttggt atcaggaaaa gacacccatt ccaggagggt 840
tttaagatct tgtatgagga tcttgaaggg ggtaatatcc cggccctgtt ggatgtagaa 900
gcctatgaga acagtaagaa agaacaagaa gccaaaacag aagccgctaa agctgctgct 960
attgctaaag ccaacatagt tgtcagcgac cctgtaaggg tggctaatgc agaagaagtc 1020
agaggagaca actatacagc ttcatctgtt gcaactgacg aatcgctatt ggctgctgtg 1080
gccgaaacta cagagacaaa actcactatt aaacctgtag aaaaagacag caagagtaga 1140
agttacaatg tcttggaaga taaagtgaat acagcctacc gcagctggta cctgtcctac 1200
aactatggtg accctgaaaa aggagtccgt tcctggacac tgctcaccac ctcggatgtc 1260
acctgtggag cagagcaggt gtactggtcg ctcccagaca tgatgcagga ccctgtcaca 1320
ttccgttcca cgagacaagt cagcaactat ccagtggtag gtgcagagct catgccggtc 1380
ttctcaaaga gtttctacaa cgagcaagcc gtgtactccc agcagcttcg ccagtccacc 1440
tcgctcacgc acgtcttcaa ccgcttccct gagaaccaga tcctcatccg cccgccagcg 1500
cccaccatta ccaccgtcag tgaaaacgtt cctgctctca cagatcacgg gaccctgccg 1560
ttgcgcagca gtatccgggg agtccagcgc gtgaccgtta ctgacgccag acgccgcacc 1620
tgcccctacg tctacaaggc cctgggcata gtcgcgccgc gcgtcctttc aagccgcact 1680
ttctaa 1686
<210> 91
<211> 2850
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 21 sequence
<400> 91
atggccaccc catcgatgct gccccagtgg gcatacatgc acatcgccgg acaggatgct 60
tcggagtacc tgagtccggg tctggtgcag ttcgcccgcg ccacagacac ctacttcaat 120
ctggggaaca agtttaggaa ccccaccgtg gcgcccaccc atgatgtgac caccgaccgc 180
agtcagcggc tgatgctgcg ctttgtgccc gttgaccggg aagacaatac ctacgcatac 240
aaagttcgat acaccttggc tgtgggcgac aacagagtgc tggatatggc cagcactttc 300
tttgacattc ggggtgtgtt ggatagaggc cctagcttca agccatactc tggcactgct 360
tacaactcgt tggcccctaa gggcgctccc aatacatctc agtggattgc tgaaggcgta 420
aaaaaagaag atgggggatc tgacgaagag gaagagaaaa atctcaccac ttacactttt 480
ggaaatgccc cagtgaaagc agaaggtggt gatatcacta aagacaaagg tcttccaatt 540
ggttcagaaa ttacagacgg cgaagccaaa ccaatttatg cagataaact ataccaacca 600
gaacctcagg tgggagatga aacttggact gacacagatg gaacaactga gaagtatggt 660
ggtagagctc taaagccaga aactaaaatg aaaccctgct atgggtcttt tgctaaaccc 720
actaacgtca aaggcggaca ggcaaaacaa aaaactactg aacaaccgca aaaccagcag 780
gttgaatatg atattgacat gaactttttt gatgaagcgt cacagaaagc aaacttcagt 840
ccaaaaattg tgatgtatgc agaaaatgta gacttggaaa ccccagacac tcatgtggtg 900
tacaaacctg gtacttcaga agaaagttct catgctaatc tgggtcaaca atctatgccc 960
aacagaccca actacattgg ctttagagat aactttattg gacttatgta ctacaacagt 1020
actggcaaca tgggagtgct ggcaggtcaa gcatcccaat tgaatgcggt ggttgacttg 1080
caggacagaa acacagaact atcatatcaa ctactgcttg actctctggg tgacagaacc 1140
agatacttca gcatgtggaa tcaagcagtc gatagctatg atcctgatgt gcgcattatt 1200
gaaaatcatg gggtggaaga tgagcttccc aactactgct ttccattgga tggagtaggg 1260
gtaccaataa gtagttacaa aataattgaa ccaaacggac agggtgcaga ttggaaagag 1320
cctgacataa atggaacaag tgaaattgga caaggaaatc tctttgccat ggaaattaac 1380
ctccaagcta atctctggag aagttttctt tattccaatg tggctctgta tctcccagac 1440
tcctacaaat acaccccagc caatgtcact cttccaacta acaccaacac ttatgactac 1500
atgaatgggc gggtggttcc cccatccctg gtggatacct acgtaaacat tggcgccaga 1560
tggtctttgg atgccatgga caatgtcaac ccctttaacc atcaccgcaa cgctggcctg 1620
cgataccggt ccatgctttt gggcaatggt cgttacgtgc ctttccacat tcaagtgcct 1680
cagaaattct ttgctgtgaa gaacctgctg cttctacccg gttcttacac ctacgagtgg 1740
aacttcagaa aggatgtgaa catggtcctg cagagttccc ttggtaatga tctccgggtc 1800
gatggtgcca gcataagttt taccagcatc aatctctatg ccaccttctt ccccatggcc 1860
cacaacactg cctccaccct tgaagccatg ctgcgcaatg acaccaatga tcaatcattc 1920
aatgactacc tttctgctgc caacatgctc taccccatcc cggccaacgc taccaacgtt 1980
cccatctcca ttccctctcg caactgggcc gccttcagag gctggtcctt caccagactc 2040
aaaaccaagg agactccctc tttgggatca gggttcgatc cctactttgt ttactctggt 2100
tctataccct acctggatgg taccttctac cttaaccaca ctttcaagaa agtctccatc 2160
atgtttgact cttcagtgag ctggcctggt aatgacagat tgctaagtcc aaatgagttc 2220
gaaatcaagc gcacagttga tggggaaggc tacaatgtgg cccaatgtaa catgaccaaa 2280
gactggttcc tggtccagat gcttgccaac tacaacattg gataccaggg cttctacgtt 2340
cctgagggtt acaaggatcg catgtactcc ttcttcagaa acttccagcc catgagtaga 2400
caggtggttg atgagattaa ctacaaagac tataaagctg tcgccgtacc ctaccagcat 2460
aataactctg gctttgtggg ttacatggct cctaccatgc gtcagggtca agcgtaccct 2520
gctaactacc cataccccct aattggaacc actgcagtaa ccagtgtcac ccagaaaaaa 2580
ttcctgtgcg acaggaccat gtggcgcatc ccattctcta gcaacttcat gtccatgggt 2640
gcccttacag acctgggaca gaacttgctg tatgccaact cggcccatgc gctggacatg 2700
acttttgagg tggatcccat ggatgagccc accctgcttt atcttctttt cgaagtcttc 2760
gacgtggtca gagtgcacca gccacaccgc ggcgtcatcg aggccgtcta cctgcgcaca 2820
ccgttctcgg ccggcaacgc caccacataa 2850
<210> 92
<211> 323
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 21 sequence
<400> 92
Met Thr Lys Arg Val Arg Leu Ser Asp Ser Phe Asn Pro Val Tyr Pro
1 5 10 15
Tyr Glu Asp Glu Ser Thr Ser Gln His Pro Phe Ile Asn Pro Gly Phe
20 25 30
Ile Ser Pro Asn Gly Phe Thr Gln Ser Pro Asp Gly Val Leu Thr Leu
35 40 45
Asn Cys Leu Thr Pro Leu Thr Thr Thr Gly Gly Pro Leu Gln Leu Lys
50 55 60
Val Gly Gly Gly Leu Ile Val Asp Asp Thr Asp Gly Thr Leu Gln Glu
65 70 75 80
Asn Ile Arg Ala Thr Ala Pro Ile Thr Lys Asn Asn His Ser Val Glu
85 90 95
Leu Ser Ile Gly Asn Gly Leu Glu Thr Gln Asn Asn Lys Leu Cys Ala
100 105 110
Lys Leu Gly Asn Gly Leu Lys Phe Asn Asn Gly Asp Ile Cys Ile Lys
115 120 125
Asp Ser Ile Asn Thr Leu Trp Thr Gly Ile Lys Pro Pro Pro Asn Cys
130 135 140
Gln Ile Val Glu Asn Thr Asp Thr Asn Asp Gly Lys Leu Thr Leu Val
145 150 155 160
Leu Val Lys Asn Gly Gly Leu Val Asn Gly Tyr Val Ser Leu Val Gly
165 170 175
Val Ser Asp Thr Val Asn Gln Met Phe Thr Gln Lys Ser Ala Thr Ile
180 185 190
Gln Leu Arg Leu Tyr Phe Asp Ser Ser Gly Asn Leu Leu Thr Asp Glu
195 200 205
Ser Asn Leu Lys Ile Pro Leu Lys Asn Lys Ser Ser Thr Ala Thr Ser
210 215 220
Glu Ala Ala Thr Ser Ser Lys Ala Phe Met Pro Ser Thr Thr Ala Tyr
225 230 235 240
Pro Phe Asn Thr Thr Thr Arg Asp Ser Glu Asn Tyr Ile His Gly Ile
245 250 255
Cys Tyr Tyr Met Thr Ser Tyr Asp Arg Ser Leu Val Pro Leu Asn Ile
260 265 270
Ser Ile Met Leu Asn Ser Arg Thr Ile Ser Ser Asn Val Ala Tyr Ala
275 280 285
Ile Gln Phe Glu Trp Asn Leu Asn Ala Lys Glu Ser Pro Glu Ser Asn
290 295 300
Ile Ala Thr Leu Thr Thr Ser Pro Phe Phe Phe Ser Tyr Ile Arg Glu
305 310 315 320
Asp Asp Asn
<210> 93
<211> 91
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 21 sequence
<400> 93
Asp Gly Val Leu Thr Leu Asn Cys Leu Thr Pro Leu Thr Thr Thr Gly
1 5 10 15
Gly Pro Leu Gln Leu Lys Val Gly Gly Gly Leu Ile Val Asp Asp Thr
20 25 30
Asp Gly Thr Leu Gln Glu Asn Ile Arg Ala Thr Ala Pro Ile Thr Lys
35 40 45
Asn Asn His Ser Val Glu Leu Ser Ile Gly Asn Gly Leu Glu Thr Gln
50 55 60
Asn Asn Lys Leu Cys Ala Lys Leu Gly Asn Gly Leu Lys Phe Asn Asn
65 70 75 80
Gly Asp Ile Cys Ile Lys Asp Ser Ile Asn Thr
85 90
<210> 94
<211> 190
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 21 sequence
<400> 94
Leu Trp Thr Gly Ile Lys Pro Pro Pro Asn Cys Gln Ile Val Glu Asn
1 5 10 15
Thr Asp Thr Asn Asp Gly Lys Leu Thr Leu Val Leu Val Lys Asn Gly
20 25 30
Gly Leu Val Asn Gly Tyr Val Ser Leu Val Gly Val Ser Asp Thr Val
35 40 45
Asn Gln Met Phe Thr Gln Lys Ser Ala Thr Ile Gln Leu Arg Leu Tyr
50 55 60
Phe Asp Ser Ser Gly Asn Leu Leu Thr Asp Glu Ser Asn Leu Lys Ile
65 70 75 80
Pro Leu Lys Asn Lys Ser Ser Thr Ala Thr Ser Glu Ala Ala Thr Ser
85 90 95
Ser Lys Ala Phe Met Pro Ser Thr Thr Ala Tyr Pro Phe Asn Thr Thr
100 105 110
Thr Arg Asp Ser Glu Asn Tyr Ile His Gly Ile Cys Tyr Tyr Met Thr
115 120 125
Ser Tyr Asp Arg Ser Leu Val Pro Leu Asn Ile Ser Ile Met Leu Asn
130 135 140
Ser Arg Thr Ile Ser Ser Asn Val Ala Tyr Ala Ile Gln Phe Glu Trp
145 150 155 160
Asn Leu Asn Ala Lys Glu Ser Pro Glu Ser Asn Ile Ala Thr Leu Thr
165 170 175
Thr Ser Pro Phe Phe Phe Ser Tyr Ile Arg Glu Asp Asp Asn
180 185 190
<210> 95
<211> 561
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 21 sequence
<400> 95
Met Met Arg Arg Thr Val Leu Gly Gly Ala Val Val Tyr Pro Glu Gly
1 5 10 15
Pro Pro Pro Ser Tyr Glu Ser Val Met Gln Gln Ala Ala Ala Ala Thr
20 25 30
Met Gln Pro Pro Leu Glu Ala Pro Phe Val Pro Pro Arg Tyr Leu Ala
35 40 45
Pro Thr Glu Gly Arg Asn Ser Ile Arg Tyr Ser Glu Leu Ala Pro Leu
50 55 60
Tyr Asp Thr Thr Arg Leu Tyr Leu Val Asp Asn Lys Ser Ala Asp Ile
65 70 75 80
Ala Ser Leu Asn Tyr Gln Asn Asp His Ser Asn Phe Leu Thr Thr Val
85 90 95
Val Gln Asn Asn Asp Phe Thr Pro Thr Glu Ala Ser Thr Gln Thr Ile
100 105 110
Asn Phe Asp Glu Arg Ser Arg Trp Gly Gly Gln Leu Lys Thr Ile Met
115 120 125
His Thr Asn Met Pro Asn Val Asn Glu Tyr Met Phe Ser Asn Lys Phe
130 135 140
Lys Ala Arg Val Met Val Ser Arg Lys Ala Pro Glu Gly Val Thr Val
145 150 155 160
Asp Asp Asn Tyr Asp His Lys Gln Asp Ile Leu Glu Tyr Glu Trp Phe
165 170 175
Glu Phe Thr Leu Pro Glu Gly Asn Phe Ser Ala Thr Met Thr Ile Asp
180 185 190
Leu Met Asn Asn Ala Ile Ile Asp Asn Tyr Leu Glu Val Gly Arg Gln
195 200 205
Asn Gly Val Leu Glu Ser Asp Ile Gly Val Lys Phe Asp Thr Arg Asn
210 215 220
Phe Arg Leu Gly Trp Asp Pro Glu Thr Lys Leu Ile Met Pro Gly Val
225 230 235 240
Tyr Thr Tyr Glu Ala Phe His Pro Asp Ile Val Leu Leu Pro Gly Cys
245 250 255
Gly Val Asp Phe Thr Glu Ser Arg Leu Ser Asn Leu Leu Gly Ile Arg
260 265 270
Lys Arg His Pro Phe Gln Glu Gly Phe Lys Ile Leu Tyr Glu Asp Leu
275 280 285
Glu Gly Gly Asn Ile Pro Ala Leu Leu Asp Val Glu Ala Tyr Glu Asn
290 295 300
Ser Lys Lys Glu Gln Glu Ala Lys Thr Glu Ala Ala Lys Ala Ala Ala
305 310 315 320
Ile Ala Lys Ala Asn Ile Val Val Ser Asp Pro Val Arg Val Ala Asn
325 330 335
Ala Glu Glu Val Arg Gly Asp Asn Tyr Thr Ala Ser Ser Val Ala Thr
340 345 350
Asp Glu Ser Leu Leu Ala Ala Val Ala Glu Thr Thr Glu Thr Lys Leu
355 360 365
Thr Ile Lys Pro Val Glu Lys Asp Ser Lys Ser Arg Ser Tyr Asn Val
370 375 380
Leu Glu Asp Lys Val Asn Thr Ala Tyr Arg Ser Trp Tyr Leu Ser Tyr
385 390 395 400
Asn Tyr Gly Asp Pro Glu Lys Gly Val Arg Ser Trp Thr Leu Leu Thr
405 410 415
Thr Ser Asp Val Thr Cys Gly Ala Glu Gln Val Tyr Trp Ser Leu Pro
420 425 430
Asp Met Met Gln Asp Pro Val Thr Phe Arg Ser Thr Arg Gln Val Ser
435 440 445
Asn Tyr Pro Val Val Gly Ala Glu Leu Met Pro Val Phe Ser Lys Ser
450 455 460
Phe Tyr Asn Glu Gln Ala Val Tyr Ser Gln Gln Leu Arg Gln Ser Thr
465 470 475 480
Ser Leu Thr His Val Phe Asn Arg Phe Pro Glu Asn Gln Ile Leu Ile
485 490 495
Arg Pro Pro Ala Pro Thr Ile Thr Thr Val Ser Glu Asn Val Pro Ala
500 505 510
Leu Thr Asp His Gly Thr Leu Pro Leu Arg Ser Ser Ile Arg Gly Val
515 520 525
Gln Arg Val Thr Val Thr Asp Ala Arg Arg Arg Thr Cys Pro Tyr Val
530 535 540
Tyr Lys Ala Leu Gly Ile Val Ala Pro Arg Val Leu Ser Ser Arg Thr
545 550 555 560
Phe
<210> 96
<211> 949
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 21 sequence
<400> 96
Met Ala Thr Pro Ser Met Leu Pro Gln Trp Ala Tyr Met His Ile Ala
1 5 10 15
Gly Gln Asp Ala Ser Glu Tyr Leu Ser Pro Gly Leu Val Gln Phe Ala
20 25 30
Arg Ala Thr Asp Thr Tyr Phe Asn Leu Gly Asn Lys Phe Arg Asn Pro
35 40 45
Thr Val Ala Pro Thr His Asp Val Thr Thr Asp Arg Ser Gln Arg Leu
50 55 60
Met Leu Arg Phe Val Pro Val Asp Arg Glu Asp Asn Thr Tyr Ala Tyr
65 70 75 80
Lys Val Arg Tyr Thr Leu Ala Val Gly Asp Asn Arg Val Leu Asp Met
85 90 95
Ala Ser Thr Phe Phe Asp Ile Arg Gly Val Leu Asp Arg Gly Pro Ser
100 105 110
Phe Lys Pro Tyr Ser Gly Thr Ala Tyr Asn Ser Leu Ala Pro Lys Gly
115 120 125
Ala Pro Asn Thr Ser Gln Trp Ile Ala Glu Gly Val Lys Lys Glu Asp
130 135 140
Gly Gly Ser Asp Glu Glu Glu Glu Lys Asn Leu Thr Thr Tyr Thr Phe
145 150 155 160
Gly Asn Ala Pro Val Lys Ala Glu Gly Gly Asp Ile Thr Lys Asp Lys
165 170 175
Gly Leu Pro Ile Gly Ser Glu Ile Thr Asp Gly Glu Ala Lys Pro Ile
180 185 190
Tyr Ala Asp Lys Leu Tyr Gln Pro Glu Pro Gln Val Gly Asp Glu Thr
195 200 205
Trp Thr Asp Thr Asp Gly Thr Thr Glu Lys Tyr Gly Gly Arg Ala Leu
210 215 220
Lys Pro Glu Thr Lys Met Lys Pro Cys Tyr Gly Ser Phe Ala Lys Pro
225 230 235 240
Thr Asn Val Lys Gly Gly Gln Ala Lys Gln Lys Thr Thr Glu Gln Pro
245 250 255
Gln Asn Gln Gln Val Glu Tyr Asp Ile Asp Met Asn Phe Phe Asp Glu
260 265 270
Ala Ser Gln Lys Ala Asn Phe Ser Pro Lys Ile Val Met Tyr Ala Glu
275 280 285
Asn Val Asp Leu Glu Thr Pro Asp Thr His Val Val Tyr Lys Pro Gly
290 295 300
Thr Ser Glu Glu Ser Ser His Ala Asn Leu Gly Gln Gln Ser Met Pro
305 310 315 320
Asn Arg Pro Asn Tyr Ile Gly Phe Arg Asp Asn Phe Ile Gly Leu Met
325 330 335
Tyr Tyr Asn Ser Thr Gly Asn Met Gly Val Leu Ala Gly Gln Ala Ser
340 345 350
Gln Leu Asn Ala Val Val Asp Leu Gln Asp Arg Asn Thr Glu Leu Ser
355 360 365
Tyr Gln Leu Leu Leu Asp Ser Leu Gly Asp Arg Thr Arg Tyr Phe Ser
370 375 380
Met Trp Asn Gln Ala Val Asp Ser Tyr Asp Pro Asp Val Arg Ile Ile
385 390 395 400
Glu Asn His Gly Val Glu Asp Glu Leu Pro Asn Tyr Cys Phe Pro Leu
405 410 415
Asp Gly Val Gly Val Pro Ile Ser Ser Tyr Lys Ile Ile Glu Pro Asn
420 425 430
Gly Gln Gly Ala Asp Trp Lys Glu Pro Asp Ile Asn Gly Thr Ser Glu
435 440 445
Ile Gly Gln Gly Asn Leu Phe Ala Met Glu Ile Asn Leu Gln Ala Asn
450 455 460
Leu Trp Arg Ser Phe Leu Tyr Ser Asn Val Ala Leu Tyr Leu Pro Asp
465 470 475 480
Ser Tyr Lys Tyr Thr Pro Ala Asn Val Thr Leu Pro Thr Asn Thr Asn
485 490 495
Thr Tyr Asp Tyr Met Asn Gly Arg Val Val Pro Pro Ser Leu Val Asp
500 505 510
Thr Tyr Val Asn Ile Gly Ala Arg Trp Ser Leu Asp Ala Met Asp Asn
515 520 525
Val Asn Pro Phe Asn His His Arg Asn Ala Gly Leu Arg Tyr Arg Ser
530 535 540
Met Leu Leu Gly Asn Gly Arg Tyr Val Pro Phe His Ile Gln Val Pro
545 550 555 560
Gln Lys Phe Phe Ala Val Lys Asn Leu Leu Leu Leu Pro Gly Ser Tyr
565 570 575
Thr Tyr Glu Trp Asn Phe Arg Lys Asp Val Asn Met Val Leu Gln Ser
580 585 590
Ser Leu Gly Asn Asp Leu Arg Val Asp Gly Ala Ser Ile Ser Phe Thr
595 600 605
Ser Ile Asn Leu Tyr Ala Thr Phe Phe Pro Met Ala His Asn Thr Ala
610 615 620
Ser Thr Leu Glu Ala Met Leu Arg Asn Asp Thr Asn Asp Gln Ser Phe
625 630 635 640
Asn Asp Tyr Leu Ser Ala Ala Asn Met Leu Tyr Pro Ile Pro Ala Asn
645 650 655
Ala Thr Asn Val Pro Ile Ser Ile Pro Ser Arg Asn Trp Ala Ala Phe
660 665 670
Arg Gly Trp Ser Phe Thr Arg Leu Lys Thr Lys Glu Thr Pro Ser Leu
675 680 685
Gly Ser Gly Phe Asp Pro Tyr Phe Val Tyr Ser Gly Ser Ile Pro Tyr
690 695 700
Leu Asp Gly Thr Phe Tyr Leu Asn His Thr Phe Lys Lys Val Ser Ile
705 710 715 720
Met Phe Asp Ser Ser Val Ser Trp Pro Gly Asn Asp Arg Leu Leu Ser
725 730 735
Pro Asn Glu Phe Glu Ile Lys Arg Thr Val Asp Gly Glu Gly Tyr Asn
740 745 750
Val Ala Gln Cys Asn Met Thr Lys Asp Trp Phe Leu Val Gln Met Leu
755 760 765
Ala Asn Tyr Asn Ile Gly Tyr Gln Gly Phe Tyr Val Pro Glu Gly Tyr
770 775 780
Lys Asp Arg Met Tyr Ser Phe Phe Arg Asn Phe Gln Pro Met Ser Arg
785 790 795 800
Gln Val Val Asp Glu Ile Asn Tyr Lys Asp Tyr Lys Ala Val Ala Val
805 810 815
Pro Tyr Gln His Asn Asn Ser Gly Phe Val Gly Tyr Met Ala Pro Thr
820 825 830
Met Arg Gln Gly Gln Ala Tyr Pro Ala Asn Tyr Pro Tyr Pro Leu Ile
835 840 845
Gly Thr Thr Ala Val Thr Ser Val Thr Gln Lys Lys Phe Leu Cys Asp
850 855 860
Arg Thr Met Trp Arg Ile Pro Phe Ser Ser Asn Phe Met Ser Met Gly
865 870 875 880
Ala Leu Thr Asp Leu Gly Gln Asn Leu Leu Tyr Ala Asn Ser Ala His
885 890 895
Ala Leu Asp Met Thr Phe Glu Val Asp Pro Met Asp Glu Pro Thr Leu
900 905 910
Leu Tyr Leu Leu Phe Glu Val Phe Asp Val Val Arg Val His Gln Pro
915 920 925
His Arg Gly Val Ile Glu Ala Val Tyr Leu Arg Thr Pro Phe Ser Ala
930 935 940
Gly Asn Ala Thr Thr
945
<210> 97
<211> 137
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 34 sequence
<400> 97
catcatcaat aatatacctt atagatggaa tggtgccaat atgtaaatga ggtgatttta 60
aaaattgtgg ggtgtgtggt gattggctgt ggggttaacg gctaaacggg gcggcgcggc 120
cgtgggaaaa tgacgtt 137
<210> 98
<211> 137
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 34 sequence
<400> 98
aacgtcattt tcccacggcc gcgccgcccc gtttagccgt taaccccaca gccaatcacc 60
acacacccca caatttttaa aatcacctca tttacatatt ggcaccattc catctataag 120
gtatattatt gatgatg 137
<210> 99
<211> 342
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 34 sequence
<400> 99
ttgtgggggt ggagtttttt tgcaagttgt cgcgggaaat gtgacgcata aaaaggcttt 60
ttttctcacg gaactactga cttttcccac ggtatttaac aggaaatgag gtagttttga 120
ccggatgcaa gtgaaaattg ctgatttgcg cgcgaaaact gaatgaggaa gtgtttttct 180
gaataatgtg gtatttatgg cagggtggag tatttgttca gggccaggta gactttgacc 240
cattacgtgg aggtttcgat taccgtgttt tttacctgaa tttccgcgta ccgtgtcaaa 300
gtcttctgtt tttacgtagg tgtcagctga tcgctacggt at 342
<210> 100
<211> 3450
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 34 sequence
<400> 100
ttatacctca gggtttgtgt caagaggcca ctcttgagtg ccagcgagaa gagttttctc 60
ctctgcgccg gcagtttaat aataaaaaaa tgagagattt gcgatttctg cctcaggaaa 120
taatttctgc tgagactgga aatgaaatac tggagcttgt ggtgcacgcc ctgatgggag 180
acgatccgga gccacctgtg cagctttttg agcctcctac gcttcaggaa ctgtatgatt 240
tagaggtaga gggatcggag gattctaatg aggaagctgt gaatggcttt tttaccgatt 300
ctatgctttt agctgctaat gaaggattag aattagatcc gcctttggac actttcgata 360
ctccaggggt gattgtggaa agcggtacag gtgtaagaaa attacctgat ttgggttccg 420
tggactgtga tttgcactgc tatgaagacg ggtttcctcc gagtgatgag gaggaccatg 480
aaaaggagca gtctatgcag actgcagcgg gtgagggagt gaaggctgcc agtgttggtt 540
ttcagttgga ttgcccggag cttcctggac atggctgtaa gtcttgtgaa tttcacagga 600
aaaatactgg agtaaaggaa ctgttatgtt cgctttgtta tatgagagcg cactgccact 660
ttatttacag taagtgtgtt taagttaaaa tttaaaggaa tatgctgttt ttcacatgta 720
tattgagtgg gagttttgtg cttcttatta taggtcctgt gtctgatgct gatgagtcac 780
catctcctga ttctactacc tcacctcctg agattcaagc acctgttcct gtggacgtgc 840
gcaagcccat tcctgtgaag cttaagcctg ggaaacgtcc agcagtggaa aaacttgagg 900
acttgttaca gggtggggac ggacctttgg acttgagtac acggaaacgg ccaagacaat 960
aagtgttcca tatccgtgtt tacttaaggt gacgtcaata tttgtgtgag agtgcaatgt 1020
aataaaaata tgttaactgt tcactggttt ttattgcttt ttgggcgggg actcaggtat 1080
ataagtagaa gcagacctgt atggttagct cataggagct ggctttcatc catggaggtt 1140
tgggccattt tggaagacct tagaaagact aggcaactgt tagaggacgc ttcggacgga 1200
gtctccggtt tttggagatt ctggttcgct agtgaattag ctagggtagt ttttaggata 1260
aaacaggact ataaagaaga atttgaaaag ttgttggtag attgcccagg actttttgaa 1320
gctcttaatt tgggccatca agttcacttt aaagaaaaag ttttatcagt tttagacttt 1380
tcaaccccag gtagaactgc cgctgctgtg gcttttctta cttttatatt agataaatgg 1440
atcccgcaga ctcatttcag caggggatac gttttggatt tcgtagccac agcattgtgg 1500
agaacatgga aggttcgcaa gatgaggaca atcttaggtt actggccagt gcagcctttg 1560
ggtgtagcgg gaatcctgag gcatccaccg gtcatgccag cggttctgga ggaggaacag 1620
caagaggaca acccgagagc cggcctggac cctccagtgg aggaggcgga gtagctgact 1680
tgtctcctga actgcaacgg gtgcttactg gatctacgtc cactggacgg gataggggcg 1740
ttaagaggga gagggcatct agtggtactg atgctagatc tgagttggct ttaagtttaa 1800
tgagtcgcag acgtcctgaa accatttggt ggcatgaggt ccagaaagag ggaagggatg 1860
aagtttctgt attgcaggag aaatattcac tggaacaggt gaaaacatgt tggttggagc 1920
ctgaggatga ttgggaggtg gccattaaaa attatgccaa gatagctttg aggcctgata 1980
aacagtataa gattactaga cggattaata tccggaatgc ttgttacata tctggaaatg 2040
gggctgaggt ggtaatagat actcaagaca aggcagttat tagatgctgc atgatggata 2100
tgtggcctgg agtagtcggt atggaagcag taacttttgt aaatgttaag tttaggggag 2160
atggttataa tggaatagtg tttatggcca ataccaaact tatattgcat ggttgtagct 2220
tttttggttt caacaatacc tgtgtagatg cctggggaca ggttagtgta cggggatgta 2280
gtttctatgc gtgttggatt gccacagctg gcagaaccaa gagtcaattg tctctgaaga 2340
aatgcatatt ccaaagatgt aacctgggca ttctgaatga aggcgaagca agggtccgcc 2400
actgcgcttc tacagatact ggatgtttta ttttaattaa gggcaatgcc agcgtaaagc 2460
ataacatgat ttgcggtgct tccgatgaga ggccttatca aatgctcact tgtgccggtg 2520
ggcattgtaa tatgctggct actgtgcata ttgtttccca tcaacgcaaa aaatggcctg 2580
tttttgatca caatgtgttg accaagtgta ccatgcatgc aggtgggcgt agaggaatgt 2640
ttatgcctta ccagtgtaac atgaatcatg tgaaagtgtt gttggaacca gatgcctttt 2700
ccagaatgag cctaacagga atctttgaca tgaacatgca aatctggaag atcctgaggt 2760
atgatgatac gagatcgagg gtgcgcgcat gcgaatgcgg aggcaagcat gccaggttcc 2820
agccggtgtg tgtagatgtg actgaagatc tgagaccgga tcatttggtt attgcccgca 2880
ctggagcaga gttcggatcc agtggagaag aaactgacta aggtgagtat tgggaaaact 2940
tggggtgggg ttttcagatg gacagattga gtaaaaattt gttttttctg tctttcagct 3000
gtcatgagtg gaaacgcttc ttttaagggg ggagtcttca gcccttatct gacagggcgt 3060
ctcccatcct gggcaggagt tcgtcagaat gttatgggat ctactgtgga tggaagaccc 3120
gtccaacccg ccaattcttc aacgctgacc tatgctactt taagttcttc acctttggac 3180
gcagctgcag ccgccgccgc cgcctctgtt gccgctaaca ctgtgcttgg aatgggttac 3240
tatggaagta tcgtggctaa ttccacttcc tctaataacc cttctaccct gactcaggac 3300
aagttacttg tccttttggc ccagctggag gctttgaccc aacgtctggg tgaactttat 3360
cagcaggtgg ccgagttgcg agtacaaact gagtctgctg tcggcacggc aaagtctaaa 3420
taaaaaaaaa ttccacaatc aatgaataaa 3450
<210> 101
<211> 19455
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 34 sequence
<400> 101
atggccagcc gcgaaggaaa tcagttaagc gaccgccaca gggagcacac ccccgaacgc 60
ggaaggggtt ctgccagtca tccgccttcc aggtcggacc gcagcccttc gcaatcgcct 120
ccacctctgc ccccgaagag aaacacctgt cgccgtgtgg ggtcaggttc ttctaccgac 180
agtcagttgg taatggtgag cgaaacgtca caatcctccc tgtctccgga acggagcgac 240
agtcctcctc ctccgatacc cccgaaaaag aagccaagga agaccaaaca tgtccccatg 300
caagacatca gtcaagacag cgaagaagaa agagaagagg cgcaacttgt agcagtgggt 360
ttcagctacc cgcccgtgcg catcgttgag aaggatggca aaagaagcat tgagaagatc 420
gccaaagatg accctctggc taaaggagct gctgcctgca ctgttaagaa tccgattagc 480
ttgcccctgg tgtctgcttg ggagaaaggc atggaagtga tgtgtctgct gatggagaag 540
tacaggctgg ataacgaact tagaacctct tttaaactaa tgcctgagca gcacgaacaa 600
tacaagcgca tctgtcacca gtacgtgaac gaggagcacc gaggcatcca gttaactttc 660
actagtcaca agacactgag cacgatgatg ggaagatttc tgcagggaat gatacattct 720
ttttctcaga tcgcccacca taattgggaa tgtacaggct gtgcgttgtg gcctcatggc 780
tgcaatgatt atgagggcaa gctgaagtgc ttgcatggca atattatgat tcagaaggag 840
cagattatcg agatggatgt ggccagcgag aacggacaac gagccttgaa ggagaatccc 900
gagcgaacca aaatcaccca aaaccgctgg ggcagaagtg tggtgcaaat agccaacaat 960
gacgcccgct gctgtgtgaa tgatgccggc tgcgcagcta accagttttc gagcaggtcc 1020
tgcgggatgt tttataccga gggtagtaaa gcccagcagg ctttcaagca atatgatgct 1080
ttcatgagag ccgtgtatcc aggaatcaga caggatcagg ccaagatgat actgatcccc 1140
ctgcactgcg attgtaacca caagcctaat tgggtgcccg ccatgggtag gcagacctgc 1200
aagatgaccc cgttcagcat tgccaatgct gaagatctgg atgtgggcat gattgcagat 1260
cccaccgtgc tggcaagcgt aagacatccg tcgctgatgg tgtttcagtg ctgcaatccg 1320
gtgtaccgca actctcgcgc tcagagcact ggtcctaatt gtgatttcaa gatttcggct 1380
cctgacctgc tgggagcttt gcagctgacc agaaagctgt ggagtgacat cctgcccgat 1440
ataccggttc ccaagttggt gattcccgaa ttcaagtggc aacccaagta tcagttccgc 1500
aacgtatcac tgcctgcggg tcattctgat tctcgtcaga acccattcga cttgtaaata 1560
aataagtaat ccagagcctc gatacatgta aaaaataaag tgctgtttat tgaacacgtt 1620
gtttacatga atcattattg cacatccata cggtcgaacg cagtggccct ttcgatgtgt 1680
gtacgatgag agcgaaaata aggcgaatgg gtattgagaa aatggtagag tgctttttga 1740
ttgtcacaca gggtgggctg gactttagga gaatgaagca tgttgtttgg cactccagtt 1800
agcaatttca tggtggggtt tccgtccatg ggacggtcag gccagtgcac aaaggcatga 1860
aggaacatgc agcagaaaag tccgcaggcg gcagaacggg ggccctgcac ggtctgggta 1920
gatttttcca gcgtaataca ccggtccttg gtagcaagag cgctgcggcg caggagaccc 1980
tcatattcaa actggtaaat ctgtttgaga cgatcatccg agaatccaaa aggatcaaaa 2040
aggtagcagg tgttagaacg tgggttccaa ccgaaagcca accagtgctc tccccccgtc 2100
tcacgtccgg ccgtatttac aatggcacag gcgagcttat cgggggccat gaaccccggg 2160
aagcgcttat caaaggttcc caaaaaatat ggtccgcaac ccaggtcttg gacaatggct 2220
ctgagctctt gctcgctgga gccgttttgg gatccgcagg ccatggttgc agctgctgtt 2280
tgcaagaagc aagaagcttc ttacgtggta gcgttaccgg ccgagaacgg tgtacgcagg 2340
tagactgcct cgatgatgcc gcggtgtggc tgatgcactc tgaccacgtc gaaaacttcg 2400
aagagaagat aaagcagggt gggctcatcc atgggatcca cctcaaaggt catgtccaga 2460
gcatgagctg agttggcata gagcatgttc tgtcccaagt ctgtaagggc tcccatagac 2520
atgaagttgc ttgagaacgg tatgcgccac atggttctgt cacacaagaa ctttttctgc 2580
gtaacactat ttacggcagt tgttccaatg agtggatagg gatagttagc gggatagggt 2640
tgaccttgac gcatggtcgg agccatgtaa cccacaaagc cagagttgtt gtgttggtag 2700
ggtatggcga cggccttgaa gtctttgtaa ttgacctcat caaccacctg cctgctcatg 2760
ggctggaagt ttctgaaaaa tgaatacatg cgatctttgt atccttctgg aatgtagaag 2820
ccctgatagc cgatgttgta gttggcgagc atctgtacca agaaccagtc tttggtcatg 2880
ttgcattggg ctacgttgta gccttcgcca tccacagtgc gctttatttc aaattcgtta 2940
ggagatagta acctgtcatt tccaggccag ctcactgaag agtcaaacat gatggaaacc 3000
ttcttaaaag tgtggttcag gtagaaggta ccatccaggt agggaataga accagaatag 3060
acgaagtagg ggtcaaatcc agaccccaaa gagggagttt ctttggtttt cagtctggta 3120
aatgaccagc ctctgaaagc cgcccagttg cgagaaggaa tggaaatggg aatattggtt 3180
gcattggcag gaatggggta gagcatgtta gctgcagata ggtagtcgtt gaatgactga 3240
tcattggtgt cattccgcag catggcttca agggtggaag cggtgttgtg agccatgggg 3300
aaaaaagtag catagaggtt gatgctcgta aaactgatgc tggcgccatc tacccgtagg 3360
tcgttaccga gggaactctg tagaaccatg tttacatcct tcctaaagtt ccactcataa 3420
gtgtaggagc ctgggagaag cagcaggttt ttaacagcga agaatttttg aggcacttgt 3480
atgtggaaag gcacataacg tccgttaccc agaagcatgg atcggtaacg caagccagcg 3540
ttacggtggt ggttgaatgg gttgacattg tccatggcat ccagagacca cctggcacca 3600
atgttcacat aggtgtctac tagagatggc ggcaccaccc gcccgttcat gtagtcgtag 3660
gtgtttttgt tttctggaag agtgacattg gacggggtgt atttgtacga gtctgggaga 3720
tatagagcca cattggaata aaggaaactt cgccatagat tggcttgaag gttaatttcc 3780
atggcaaatg gatttccctt agcaagttca ctgctgccag ttgggtctac atttgtccaa 3840
gtagattggt ctccatttgg cttaatctcc ttgtaactat ctgttcgcgg accgacacca 3900
tccaacggaa aacaatagtt gggaagttca tcttccacac catgattttc aataacacgt 3960
acatcaggat cataactgtc cacagcctga ttccacatgc taaagtatct ggttctgtcg 4020
cccagagagt caagcaagag ttggtaagac agttctgtgt ttctgtcctg caagtcaacc 4080
actgcattca actgagacgc ttggccagcc agtaccccca tgttgccagt actgttatag 4140
tacataagtc cgatgaagtt atctctgaag ccaatgtagt tgggtctgtt gggcatagac 4200
tgttgtccaa gattggtctc agaactagca tctgaaactc caggtttgta cacaacatga 4260
gtatctggac attccaggtc cacattttct gcatacatta caattttagg tttgagttct 4320
gatctttgtg atcttaagtc aaagaagttc atgtcaatgt catactcgat gttgttagtg 4380
ccatcgtctt cttttggttt tacctttgcc tgacctcctt taatattagt aggtttagca 4440
aaagatccgt agcagggttt cattttagtt tcaggtttaa gaaccctccc tccatactct 4500
tcggtttttc cgtctaggtc agtccaagtt tcgtctccca cttgaggttc tggctgataa 4560
agcttatcag catagattgg tttaggacct tcagttgaaa cttccaagcc caccggcaat 4620
ccgtcttttg tgatttcagc ctcggctttt actggagcat taccaaaagt gtatgttgct 4680
tttttggctt cttccccatc atcagtattg ccgtcgtcca ctaggccagt gcttgtaact 4740
cccttatcca accactgaga tgcatttgga gcgcctttag gagccaggga gttgtaagcc 4800
gtaccagaat agggtttaaa actgggacct ctgtccaaca cgcccctaat gtcaaagaac 4860
gtgctggcca tatccagcac tctgttgtcg cccacggcca gggtgtaccg cactttgtaa 4920
gagtatgtat tgtcctcccg gtcaacgggc acgaagcgca acatgagccg ctggctacga 4980
tcggtggtca catcgtgggt cggcgctacg gtaggatttc taaacttatt tcccagattg 5040
aagtaggtgt ctgtggcgcg ggcgaactgc accagacccg gactcaggta ctccgaagca 5100
tcctgtccgg cgatgtgcat gtatgcccat tggggcagca tcgatggggt ggccatcttg 5160
aaagtaactc agcgtcgacg cacgacctct tccttttttc ctctgatgct gtgacggcgt 5220
gtaatgacac atatacacag ataggcaagt taagcgctac tccatattta attaaaagca 5280
gcgacggcgt tttacacttt gcacgcctag acccacgatg ctgttcagag tattttgcca 5340
gtgtgcattt ggacgaggag cgcccccggg acgtgacctg gctacggcga ctggtttcgg 5400
ggcagcgaca ggcttagaag cgggtacagc agtagcagca ggaggagggg gcaaatccaa 5460
ggtgacgggt cgatgcaact gagaaggttt catcaccccg gtggccatag gggctatcgg 5520
tctagtggtg ggcattccaa gcttcgttgc ttcctcataa gaaggcggtt catctacgcg 5580
cgtcaccagc gtctcttcca aatcgggacg cggacgcttg tcgcctcgtt tttctggcgg 5640
aggaatttct tcctccactt gcatttcacc tggggttgct ggcggcgggt ccaaacgact 5700
gtttatcttt ttctgcacag cctggttagc caaatctacc actccattga taccggaagc 5760
tatcccatcg actacttttt gttggaagtt ctggtcttta agtttatttc taagcgcctg 5820
tcctgtactg ctgttccaag ctttgttccc gtatgttttt atggttgagc caaaattttt 5880
aagcccgctc cagatactgc tccaattgaa ggcgcccccg ttcagttggc tcgtgccgat 5940
gtcgctccag gtgcccatgt acggcttcgt gccgtgtcgc ggagccaagg atgaaaaatt 6000
gatgtcttcc atctctaaga aaacatagtc acagtaccag gagtgtcaga gtccattgta 6060
ttttttattt atacgttttt tttttttcca atgtcaatgt cgttgcgagg cctgaaccgc 6120
cacggaagct atgcctggta ttgcgccaat cgcagcagcg ataattggaa ttaaggctgg 6180
caaaaaacca ccccgcaatt gcttgcggat agcacgccgt cgcctgtagc gtcgcattcc 6240
gcgccccaac atccctcttc tacggcgcga gtttcttcct cggtaaccag tgatgggaac 6300
gcgaaggcga caagtgaggg ccatatctgc aaggaggcag cggcaacatt gattaagtga 6360
tgatactagg atggtaacgc gcacgcggca gtgtcaaagg ttccgcacta ccattgcggt 6420
acacttgccg caccagggcg ccgggaatcg gtttgcttgt gcgtctacgg cgacgactgc 6480
gatttgcagg tgtcttgcgg cgacggcggg aagtactgtt tcggctgcga tagtagcgag 6540
tgcctcggta accaggagta ggaataatag atgggtgtac gacatagttg ggcatcaaca 6600
gacttgctgg accgtacttt cgtcgggatc ttcgagtggg accgacggcg tcagttgtaa 6660
taggcatggg catccatggg tccgtttgca cttcagtgga ggtggcagta ggctttgcgg 6720
gttcagtttg cacttccata ctttcagtgg gaattttaat gtctacagtt tgtactccca 6780
gaccaggcgc tacctgctta atgggtctca ctttaacctc aggttgaata tctggatcca 6840
cttttacttt ctccaaaacg tcctccaact tctggcgttt gggcaccatc agttgcatag 6900
tgggatacaa atcttcacct tcgcgtttaa cacctgttcg cggagttacg ggtaacactt 6960
gctgcaaagt gaccggttta agactagggg tgggatttcc atgatccaag ggtatggaca 7020
ctgtttcatc cttgggattt attctactac gcttgccata agcaaactcg cctaatcggt 7080
cagctgcctg ctcaagaata tcatcatccc cgtacacctc atcataggaa cgcttaaaag 7140
tagcgcttga acgctcgccg ggtgtaaaga ccaccgaagt tccaggtctc aacacatgtc 7200
gaactttgcg cccacgccat tgcacgcgtc gccgtggggc aaactcgcgc acaaactccg 7260
ccagcccatc atcgccatct tcctcttctt ttttgtcctt ttttacccgc ttgattttgc 7320
ggggtttttt ttcatccttc aacggttggc cgtagacttc aggtgcgata acctgcagca 7380
tttcttcctt gtatttgcgc ttggacatcc tcgccgctgg gacacaacat cggagactgc 7440
tcagtatctt ctaagtgcga gggggacggg tgcgcacggg tacacgttga ccggtggcag 7500
cgtcacgcac ccagtataca ttgcctcttc gcgattgggc catgtcggca atagtcgccg 7560
ctgcgacagc ggctgcttgc ctgcgggacc tgccggcgct ggcgcccgaa gctgcacgtc 7620
tggccgccct aagcatggct cttcgcccca cgcgtctagc tcttcgtagc agagctcttg 7680
ctgctcgcat ggcagtggta gctcggtgac gtctggcaat gcgccttcgc cggctcttac 7740
gtcgagcata gttgcgagcg tcagccacta cactgtcaat aactgcgtcc acagtagatg 7800
taggcgcagt aggagtataa ttacgggcgt cggcaaccac ctgatcgatt acatcatcga 7860
cggtggttcg aacgcgagtg cggcccttga gggcacccca tggagcgcga aaatgcccgc 7920
gaacacgcac gggatgttgg gtagaacgtt tgcgtgcgcc tccgtacatc ttgctgggag 7980
cgcgcagacc ccaaccggtg ttattactgg gcgagataag aacggacatt tttttttttt 8040
ttttagaaag tgcggcttga aaggacgcgc ggtgcgacta tgcccagtgc cttgtacacg 8100
tagggacagg tgcggcgtct ggcgtcagta acggtcacac gttggactcc ccggatactg 8160
ctgcgcaacg gcagggtccc gtgatctgtg agagcaggaa cgttttcact gacggtggta 8220
attgtgggcg ccggcggacg gattaaaatc tggttctcag gaaagcggtt gaagacgtgc 8280
gtaagcgagg tggactggcg gagctgctgg gagtacacag cttgttcgtt gtagaagctc 8340
tttgaaaaga cgggcataag ctctgcaccc accacagggt agttactgac ttgtctagtg 8400
gagcggaaag tgacaggatc ctgcatcatg tctggaagcg accagtagac ctgctccgct 8460
ccgcaggtga catctgaggt ggtgagcaat gtccaggaac gcactccttt ttcggggtcg 8520
ccataattgt acgaaaggta ccaactgcga taggccgtgt tgattttatc ttccaacaca 8580
ttgtaacttc tgtttttgcc atctttttcc acaggcttaa tagtgagttt taactctatg 8640
ttttgagaca catcatccaa taatgattct ttagtcggaa cggatgttgc ggcaaaactg 8700
tctcccctga tttcactagc gttagccacc cttaccggat cgttggcaac tatgtttgct 8760
ttagcttctg cagcagcttc tattttggct ttttgatctt tcttgctgtt ctcataagca 8820
tctacatcca aaagggctgg aatatttcct ccttctaaat cctcatacaa gatcttaaaa 8880
ccctcttgga atgggtgttt ctttctaatg ccaagaaggt tgctcagacg gctttcggta 8940
aagtccactc cgcagccagg cagcaatacg atgtcaggat ggaaggcctc ataggtgtaa 9000
accccaggca tgatcaactt agtttctgga tcccatccca acttgaagtt cctagtgtcg 9060
aacttaacac caatgtcact ttccaacact ccattctgtc tgcccacttt caagtaattg 9120
tctatgatgg cattgttcat caagtcgata gtcatagtga ccgaaaagtt gccttctggc 9180
aaagtaaact cgaaccactc gtattttaga atatcttgct tatgatcata attatcgtct 9240
actctaacac cctcaggagg ttttctggac accatcacac gcgctttgaa cttgttacta 9300
aacatatact cgttcacgtt gggcatgtta gtatgcatga tggtttttag ctgaccgccc 9360
caccgcgatc gttcatcaaa gttaatggtc tgggtgctgg cttccgtagg ggtaaagtca 9420
ttgttttgca ccaccgtggt caagaagttg ctgtggtcat tctgatagtt cagagaagca 9480
atgtccgccg acttgttgtc caccagatac aacctggtgg tatcgtactg aggtgccagt 9540
tccgagtaac gaatgctgtt tctgccctcc gtaggtgcca ggtatcgcgg aggcacaaag 9600
ggagcctcca gtggggattg catcaccgcc gtcgcctgct gctgctgcat cacgctctcg 9660
tacgaaggag gaggaccctc cggatacacc accgctccgc ctagcacgac tcgcctcatt 9720
atactagaca cagataataa agaagaacga acgtacgctc gtcgccatgg ccttggtgag 9780
ttttttcttt tttatttttt tttacaacat accacccaag cgagggcgca aatgagcaaa 9840
cgggttgccc cttcctctcc cacccaagtc caatacgctg ctatcatcgg ccgaatcctc 9900
atcgtcccac acaagacccc tctgtctgtc atggcgctgg cgtctacggc tcgctctact 9960
tgtagtcccc atgatcccag gctcgtctct gtgatcctga gcataagtct tccatctact 10020
cattttatcc accaaacttt ctattccatt gtttgggaaa tttttttctc ttgccggtct 10080
gagcaaggaa tcgtttaggt actcctcttc gcccattaaa ctcgggcgac ttattctacc 10140
cacttcgctg ctacgtacac tgtgtagaga aaagggtaga ctaggaaaag gacttgcaga 10200
ctcgggctca gccgcggtag caccaatgac cccggacagc gatgcagaag aatgcattct 10260
atcgccgcct tcctttttcc acgtgcgatg atcagaaaga ggtgaaaaaa catcgctgtc 10320
cacgtcgtcc cacagaaatc cgtcattagg gtcgggcatg tcatattcgc ccgtgtagaa 10380
accaggtggg ggcagccagt gcgggtttaa gatggcattg gtgaaataat cagagttcat 10440
agcggcagct ctgtgcaagt agtccagcag tttgttaatg aaaggtcggt tactggcata 10500
catgctgggc tccatatttc gcgctgtcat gtccagtgct gcagtcggag ttgccccctc 10560
ttgcatcaga aacaatccca cgctctgctg cacatatcta aggatcctct cctcctccgc 10620
agtaagagca tattgaggag ggatcttttg agaccgattg gtaagcaaga agttcagagt 10680
ggcttccaaa ctgccagtgt cttcctgtcc caaagcgcga ctgacttggg taatttcttg 10740
ataggtctgc tcgtccacct gactttgccc tatggcttcg cgatacaggt ttagtaggta 10800
acccaaatag gaattacggt cgatgctacc gctgtcggtg aaaggagcta ccaacagtaa 10860
taataggcgg gagttcggag ttaacaagct agacacggtt gctctttctc ctaccggggc 10920
atgcactccc cacaaacctt taaggttttt aaaagcttgg ctcagattta ccgtctgcaa 10980
gccctgtctg ctagtctgaa agaagtaatc aggaccggac tgatatactt cgctctgagg 11040
tacttctgat accatcagtc tcaaagcact taaaaagtta gtataatcct gttgaccacg 11100
cggcacatta gcaggctgag tactcaagaa agcatttaac gccaccagcg aacccaggtt 11160
ggcatcgcgc tggaaccttt cgcgctgaga cacggcttcg cgtacatctg ttatcatacg 11220
gtccaaattg gtttgcacat tgctactgtt gtagcgagcc acgcgttcta agagagcgtt 11280
gtataccagt ccggcctcat ctggacgaat agctttgttc tccaccaacg cgttcacgat 11340
ggccaggacc ttctcatgag tgggattaga gcgggaaggc actacagctt ccatgatggc 11400
cgatagacgg ttggcctggg gttgctgtct aaaggcttcg gggttgcgag tcgtcaacgc 11460
catgatacgt tgcatggcct gggtccaatc gtccgaggag ttaatgccgg acggctggct 11520
ctgcagcgcc gcccgcattg cgggatccgg tgcttgctgt tccatctagc aaaaaacacg 11580
ggttgtgcca tcagtcttcc aagtactcgc cctcttcctc ctcgccttca tccgcctctt 11640
ctatgtaagg aagctcacat cctgccgtcg cggcgttcag agccctgcga ctaggctgcc 11700
actgcaagtc agctcccata tcaaagtaat tctcaccctc ggttccagct ccagttagag 11760
ctctttgcaa actgtgcatc agttccctgt cgcttaactc gcgcctcctg ctggcgctca 11820
ccgcgcgatg cattctgtca ttgcggtaca ccccaagatc atcgctcagg gtcaacacct 11880
tcagcgtcat gcgcatgtag aacccatcta tcttcacctc cttgtctatg ggaacgtatg 11940
gagtcttgta gatcttgcga gcgtaatact ttcccaagct caaaaccgag taattgatgg 12000
cagccacctt ctcggccagg cccaggctcc gctcctgcac tatgatactc tgtagaatgt 12060
tgataagatc atacaaccat ctcccctcgg gttcggtgat gttgagcagc gcctctctga 12120
aagcctcatt gtctctgctg tgttgcacca ccagaaacag ctgtgcggtc agaggtttgc 12180
tagtagggtt ctgaatgata gcttccatca aatcccacaa atgcatcaaa ccaagggtga 12240
cttcttcgcg ggcaatgagg gttcgcacat gattattaaa agacttttgg aaattacgct 12300
cttcctttac tgtctgttcg taagccgata caaggttggc tgcagccacg tgtgccctgg 12360
caggactgat ccctgtcact tcatcaactt cgaaatcctc gtcccgcaac actcgtcttc 12420
tgtccaaacc gtgacgcagc tcacgacccg cgttaaagcg ggaagctcgc atctcctccg 12480
gctcctcgcc gcttctgtct ctaaataggt tctgttgggg cacatacgcc tcgcgagaat 12540
cttttttcag ttgaactcgc ggatgccgct cgggcgaagg cgcacctaga cgtgccagtc 12600
cttcgccctc ttccaagtcc agatcatagg cgggctgtcc cgcaccgctc acagcggcag 12660
ttgcagtagt tgcagggaca gccttttgtg gttgctgctg ctgcgagggg ggctgttgtt 12720
ggggacgcat ctgtcgcagc acgggatgca tctgagcggc aaaaaaaaaa aataggactc 12780
acttccctgc cattcggcaa ccagcaaaac gactcgattc cgtatcctgg atttttgtag 12840
gctgggtcga gacgggagtg ccaataccac gttagccgcg gctccggccg gctcgagtac 12900
aagtctcgaa ccggggtaca ccgcgaccca acccgttcac gttcctccag gctacggagt 12960
cgagtcgctg aacgctttca ttttctccgt gtctatagag catcaatgac tgcgcgcgcc 13020
tcactggtca aaccgtgcct acaatgaact acttcatgcc gctacgcaac atttggaacc 13080
gcgtacgcga gtttcctcgg gcttctacta ccgccgcagg aatcacctgg atgtccaggt 13140
acatctacgg ctatcaccgc cttatgttgg aagacctcgc ccccggcgct ccagctacag 13200
aacgatggcc tctctaccgc caaccaccgc cgcattttct tataggttac cagtatctgg 13260
tgcgcacctg caacgattac atctttgaca cccgcgccta ttcgcgcctt aaatacaccg 13320
agctcgtgcg ccctggtcac cagacagtta actggtcagt catggccaac tgtgcttaca 13380
ccattaatac cggggcttac caccgctttg tggattttga tgactttcaa gccaccctca 13440
cccaagtaca gcaagccatc ctcgccgaaa gagtcgtagc tgacttggca ctggtacaac 13500
caatgcgcgg gtttggactc acacgtatgc atggcagaac gggtgaggaa gaagtgcccg 13560
tagaacggct catgcaagac tactacaaag atcttgctag atgtcaggat aatgcttggg 13620
gaatggccaa tcgcctgcgt atccagcaag ccggacccaa agacctggtg ctcctcgcca 13680
ccatccgccg tcttagaact gcctacttta atttcatcac cagcagcatc gtctcacctt 13740
cccgagatga agaagaaaca gaagacccag accgaacaca taaccacccc cgcccacaag 13800
aagccgtact cagcctacct tgtgactgtg actggttaga cgctttcgtc gaaaggtttt 13860
cagatcccgt ggatcttgac acgatcagat ctctgcgcgc agtccctacg ggccaattaa 13920
taaaatgtat aatcagcgcc ctctccctcc caaacggaga acctcccagt caccacttta 13980
aggagatgcg cggcggtgtt tttactctgc gaccgcgcga gaacggccgc gccgtcactg 14040
aaaccatgcg ccgccgccgc ggagaggtca ttgaacgatt catcgaccgt ttgcccgtgc 14100
gccgtcgacg tcgccgtgtg ccccctccgc ccccgcctga agacgaagaa gagatgttag 14160
tggaagaaga gatagaagag gaagaagaga tcccgggagc cttcgaacgc gaagtacggg 14220
ccaccatagc cgaactcatc cgtcttctcg aggaggaatt gaccgtgtcc gcgcgaaact 14280
cccagttttt taattttgcc gtggacttct acgaggccat ggagcgcttg gaagctctgg 14340
gcgatgtcag cgaaatgccg ctgagacgat ggatcatgta tttcttcgtc gccgaacaca 14400
ttgccaccac actcaactac ctttttcagc gcctatgcaa ctatgcggtc ttcaccagac 14460
acgtggagct taacctcgct caggtggtga tgcgcgcaag agactccgag ggggccgtgg 14520
tttacagccg cgtctggaac gaggcgggca tgactgcatt ctcccaactc atgggccgta 14580
tctccaatga cctcgcggcc accgtcgaga gagcgggtcg cggagatctt caggaggaag 14640
aaatcgagca gttcatggcg gagatcgcct accaggacaa ctctggtgac gtacaagaaa 14700
tactgagaca agctgccgtt aacgataccg aaattgattc tgttgaactc tctttcaggt 14760
tcaagctcac ggggccggta gctttcaccc agagacgtca gatacaagac gtcaatcgac 14820
gcgtggtggc gcacgcaagt cttctcagag cgcagtacca gaacctgccc gtgcgcggcg 14880
ccgacgtgcc actaccagcc atgcctccgg gtccggaaca accgcttccg cccggcgcgc 14940
gtccccgtca tcgcttctga gcatgcaaga agcaagagag ccaccaccga tcaaaagaaa 15000
aaacaaaggt acggtagtgg cgcccaaagg acacggaacc ctgcaagcca ttgacatctc 15060
tacaaacgaa cctgtggaaa tcaagtacca tctgaacctc ccgcacgccc tggaaaagat 15120
catgcaagtt aatcttctgt ccctacctac taacctgagt ccgcagcgtc tcaggactct 15180
ggacagctcc agcctgcgcg ctctggtcct tcagctccgc ccctcccgcg ccgaggtctg 15240
gacttgcctc ccgcgggggc tcgtcagcat gaccaccacc gaaacagaag atgaacaggc 15300
cgatacagcg aatatagaag agcacgagat acaatcgcca ggcctcggct tcccactgaa 15360
atttctcgtc aagggaagcc aggtacagct cattcacgag atacaacccg tgcaacgctg 15420
cgactactgc ggccgtctgt acaagcacaa acacgaatgc tcggcgcgcc gcagaaactt 15480
ctacttccat cacatcaaca gccaatcctc caactggtgg caggaaatcc agttcttccc 15540
gatcggctct catcctcgca cagaaagact cttcctgacc tacgatgtgg aaacttacac 15600
ctggatgggg tcctttggca aacaactagt tcctttcatg ctggtcatga aactctcagg 15660
agaagagcgt ctcgtcaaca tggcccacga tctagccatt aaactaaagt gggatcgatg 15720
gcaacaagac cccagaacct tctactgtgt cactccagaa aaaatggcaa ttggccagca 15780
ttttcgtcag tatcgggacc agttacaaac agcactggcg gtggatcttt ggtcatcatt 15840
cctacatgca aatcctcacc tgcacgaatg ggctctcgaa cactacgcct tatctgaccc 15900
tacagaccta acctttgatg agctcaataa gctacctcac gtcaaaggca cgccgcgttt 15960
catagaatta tacatcgtag gacacaacat caacggtttc gacgagatcg tcctagctgc 16020
ccaggtgatc aacaatcgag cggaagtacc acagcctttc cgcatcactc gcaattttat 16080
gcccagagcc ggtaagattc tcttcaacga tgttactttc gctttgccca accccgccta 16140
caagaaacgg gtagacttcc aactctggga acagggagcc tgtgacgaca tggacttcaa 16200
ataccaattt ctcaaagtca tggtcagaga caccttcgcc cttactcacg cttcgctgcg 16260
aaaagctgct caagcatact ctctacccgt agagaagggc tgctgccctt acaaggcagt 16320
taatcagttc tacatgctag gatcttaccg tgcagacaaa gacgggtttc cgctagaaga 16380
gtactggaag gatcgcgaag aataccttct caaccgcgaa ctgtgggaaa agaaaaacca 16440
accaggttat gacatcattc aagaaacact tgactactgc gccctagacg tacttgtcac 16500
cgccgaactg gtaaccaagc ttcaagaatc ttatgcccac tttgtcagag actctgtagg 16560
tctacctcat gcccatttca acatttttca aagacccacc atctcttcca attctcacgc 16620
catctttcgc cagattgtct acagaacaga aaaacccaat cgcaccaact tgggtccggg 16680
gttgctagcg ccatcacatg aactatatga ctatgtgcga gcaagtatca gaggggggcg 16740
atgctatcca acctatatag gcatctttga ggatcccatc tacgtctatg acatctgtgg 16800
catgtatgcc tctgcactca cccatcccat gccctggggc agtcccctta acccatatga 16860
gcgtgcactg gcagctcgag aatggcaaat ggccttagat gaccccactc ccatcagcta 16920
ttttgataag gatttacttc cgggaatctt taccatggat gcagaccctc ccgatgaact 16980
tatgctagac ccacttcccc ctttctgttc taggaaagga ggtaggctct gttggaccaa 17040
cgaacccctt cgaggcgagg tggccaccag tgtggattta attaccttgc ataatcgagg 17100
gtggcaagtg agaatcgtgc cagatgaatt gacaactatc ttccccgaat ggaagtgcct 17160
agcacgcgag tatgtccaac tcaacatcgc tgccaaagag cgcgcggaca aggaaaagaa 17220
ccaaaccatg cgatccattg ccaaactttt atccaacgcc ctgtatggat catttgccac 17280
caaacttgac aataaaaaaa ttgtgttttc tgaccaaatg gacgaaaacc tcatgaaagg 17340
catctcaacc ggcactgtca atatcaaatc ctcctcgttc ttagaaactg acaacctgag 17400
tgcagaggtc atgcccgcct tcgagaggga atacctaccc caacagctga cgttcctgga 17460
cagcgatccg gaagacagtg aggaagagca aagaaccgcc cccttttata cccccccagc 17520
ggggacccca ggtcacgtga aatacaccta caagccaatc acattcctgg atgttgaaga 17580
gggtgacatg tgtttgcata ctttggaaaa ggtggacccc ctggttgaca acgatcgcta 17640
cccctcccac atagcctcct ttgtgctggc ctggacgcgc gcctttgtat cagagtggtc 17700
agagttcctg tacgaagaag accgaggcac tccactggag aagaggcctg taaaatcagt 17760
ctacggggat acggacagcc tgtttgtcac tcaacgagga cacgaactca tggagaccaa 17820
aggtaagaaa cgcatcaaaa aatatggcgg aaaacttgtt tttgacccca atgaaccgga 17880
tttaacctgg ctggtggaat gtgaaactgt ttgcgcctcc tgcggcgcag atgcatactc 17940
cccagaatcc attttccttg cgcccaagct gtatgcgctg aaatgcctat actgcccggt 18000
atgcaagaaa acttccaaag gtaagctccg cgccaaaggc cacgcagccg aggcgctcaa 18060
ctacgaactc atggtaaact gctacttggc cgacatacag ggcgccaagc gacagaagtt 18120
ctccaccagc agaatgagtc tgaagcgcac cctggcaagc gcccaagcag gcgcacaccc 18180
cttcactgtg acggaaacaa ccctgactcg aacactgaga ccctggaagg accgaaccct 18240
ggcagcgctg gacgcccatc gtctcatacc ctactccagg agccgtccaa acccgcgaaa 18300
cgaggaggtc tgctggatcg agatgccata gaacacatca ctgaactgtg gaacagacta 18360
gaacttttgc agcaaactct ctccaaaatg cccatggctg acggtctaaa accgctgaaa 18420
aacttttcct cactacaaga acttctatca ctaggaggag agcgcctcct aatggatttg 18480
gtgcgggaaa atatgcatgt aagggaaatg atgaacgagg tggccccctt gcttcgagaa 18540
gacggcagtt gccgttccct aaactaccac ctgcaacctg taatcggaat catttatggc 18600
cccaccggat gtggcaaatc tcaattgctc agaaacttgc tatcatccca actaatcacc 18660
cccgccccag aaacggtgtt cttcatagcc ccccaggtgg acatgattcc accatcggaa 18720
ctgaaagctt gggaaatgca aatctgtgag gggaactatg ctccggggcc cgaaggaaca 18780
ttcatacccc aatcgggtac tctccgcccc aaattcatta aaatggctta tgatgattta 18840
actcaggaac ataactatga tgtgtcagac ccacggaacg tgtttgcccg cgctgctgcc 18900
cacggcccca ttgctattat catggatgag tgcatggaaa atctcggagg acacaagggt 18960
gtctccaaat ttttccacgc ttttccatcc aagctacacg ataaatttcc taaatgtacc 19020
ggatacaccg tcttggtggt ccttcataac atgaacccaa gacgagatct tggcggcaat 19080
attgccaact taaaaatcca atccaaaatg cacataattt caccccgaat gcacccctcc 19140
cagctcaacc ggtttgtaaa cacctacacc aagggcttat ctgtggcaat cagcctactt 19200
ctaaaagata ttgtgcaaca ccatgcactg cgaccttgtt atgactgggt gatttacaac 19260
actaccccgg agcatgaatc ccttcaatgg agctatctcc accccaaaga tggcctaatg 19320
cccatgtatc taaacattca atcccacctc tataggattc tggaaaaaat ccaccgtgtt 19380
ctcaatgatc gagatcggtg gtctagggca taccgtgcgc gaaaaatgaa ataaaaacac 19440
ttgattttaa atcaa 19455
<210> 102
<211> 3441
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 34 sequence
<400> 102
atgtctggtg acgcggctga gctatctcgg ctgcgacatc tagaccactg ccgccgcttt 60
cgctgctttg cccgggaact cattgagttc atctacttcg aactccccaa ggatcaccct 120
caaggtccgg cccacggagt gcggattact atcgaaggca aaatacactc tcgcctgcaa 180
cgaattttct cccagcggcc cgtgctgatc gagcgagacc agggaaacac cacggtttcc 240
atctactgca tttgtaatca ccccggattg catgaaagcc tttgctgtct tatgtgtact 300
gagtttaata aaaactgaat taagactctc ctacggactg ccgcttcttc aacccggatt 360
ttacaaccag aagaacgaaa cttttcctgt cgtccaggac tctgttaact tcacctttcc 420
tactcacaaa ctagaagctc aacgactaca ccgcttttcc agaagcattt tccctactaa 480
tactactttc aaaaccggag gtgagctcca aggtcttcct acagaaaacc cttgggtgga 540
agcgggcctt gtagtgctag gaattcttgc gggtgggctt gtgattattc tttgctacct 600
atacacacct tgcttcactt tcctagtggt gttgtggtat tggtttaaaa aatggggccc 660
atactagtct tgcttgtttt actttcgctt ttggaaccgg gttctgccaa ttacgatcca 720
tgtctagact tcgacccaga aaactgcaca cttacttttg cacccgacac aagccgcatc 780
tgtggagttc ttattaagtg cggatgggaa tgcaggtccg ttgaaattac acacaataac 840
aaaacctgga acaatacctt atccaccaca tgggagccag gagttcccga gtggtacact 900
gtctctgtcc gaggtcctga cggttccatc cgcattagta acaacacttt cattttttct 960
gaaatgtgcg atctggccat gttcatgagc aaacagtatt ctctatggcc tcctagcaag 1020
gacaacatcg taacgttctc cattgcttat tgcttgtgcg cttgccttct tactgcttta 1080
ctgtgcgtat gcatacacct gcttgtaacc actcgcatca aaaacgccaa taacaaagaa 1140
aaaatgcctt aacctctttc tgtttacaga catggcttct cttacatctc tcatatttgt 1200
cagcattgtc actgccgctc acggacaaac agtcgtctct atccctctag gacataatta 1260
cactctcata ggacccccaa tcacttcaga ggtcatctgg accaaactgg gaagcgttga 1320
ttactttgat ataatctgca acaaaacaaa accaataata gtaacttgca acatacaaaa 1380
tcttacattg attaatgtta gcaaagttta cagcggttac tattatggtt atgacagata 1440
cagtagtcaa tatagaaatt acttggttcg tgttacccag ttaaaaacca cgaaaatgcc 1500
aaatatggca aagattcgat ccgatgacaa ttctctagaa acttttacat ctcccaccac 1560
acccgacgaa aaaaacatcc cagattcaat gattgcaatt gttgcagcgg tggcagtggt 1620
gatggcacta ataataatat gcatgctttt atatgcttgt cgctacaaaa agtttcatcc 1680
taaaaaacaa gatctcctac taaggcttaa catttaattt ctttttatac agccatggtt 1740
tccactacca cattccttat gcttactagt cttgcaactc tgacttctgc tcgctcacac 1800
ctcactgtaa ctataggctc aaactgcaca ctaaaaggac ctcaaggtgg tcatgtcttt 1860
tggtggagaa tatatgacaa tggatggttt acaaaaccat gtgaccaacc tggtagattt 1920
ttctgcaacg gcagagacct aaccattatc aacgtgacag caaatgacaa aggcttctat 1980
tatggaaccg actataaaag tagtttagat tataacatta ttgtactgcc atctaccact 2040
ccagcacccc gcacaactac tttctctagc agcagtgtcg ctaacaatac aatttccaat 2100
ccaacctttg ccgcgctttt aaaacgcact gtgaataatt ctacaacttc acatacaaca 2160
atttccactt caacaatcag cattatcgct gcagtgacaa ttggaatatc tattcttgtt 2220
tttaccataa cctactacgc ctgctgctat agaaaagaca aacataaagg tgatccatta 2280
cttagatttg atatttaatt tgttcttttt ttttttattt acagtatggt gaacaccaat 2340
catggtacct agaaatttct tcttcaccat actcatttgt gcatttaatg tttgcgctac 2400
tttcacagca gtagccacag caaccccaga ctgtatagga gcatttgctt cctatgcact 2460
ttttgctttt gttacttgca tctgcgtatg tagcatagtc tgcctggtta ttaatttttt 2520
ccaacttcta gactggatcc ttgtgcgaat tgcctacctg cgccaccatc ccgaataccg 2580
caaccaaaat atcgcggcac ttcttagact catctaaaac catgcaggct atactaccaa 2640
tatttttgct tctattgctt ccctacgctg tctcaacccc agctgcctat agtactccac 2700
cagaacacct tagaaaatgc aaattccaac aaccgtggtc atttcttgct tgctatcgag 2760
aaaaatcaga aattccccca aatttaataa tgattgctgg aataattaat ataatctgtt 2820
gcaccataat ttcatttttg atataccccc tatttgattt tggctggaat gctcccaatg 2880
cacatgatca tccacaagac ccagaggaac acattcccct acaaaacatg caacatccaa 2940
tagcgctaat agattacgaa agtgaaccac aacccccact actccctgct attagttact 3000
tcaacctaac cggcggagat gactgaaaca ctcaccacct ccaattccgc cgaggatctg 3060
ctcgatatgg acggccgcgt ctcagaacag cgacttgccc aactacgcat ccgccagcag 3120
caggaacgcg cggccaaaga gctcagagat gtcatccaaa ttcaccaatg caaaaaaggc 3180
atattctgtt tggtaaaaca agccaagata tcctacgaga tcaccgctac tgaccatcgc 3240
ctctcttacg aacttggccc ccaacgacaa aaatttacct gcatggtggg aatcaacccc 3300
atagttatca cccagcaaag tggagatact aagggttgca ttcactgctc ctgcgattcc 3360
atcgagtgca cctacaccct gctgaagacc ctatgcggcc taagagacct gctaccaatg 3420
aattaaaaaa tgattaataa a 3441
<210> 103
<211> 972
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 34 sequence
<400> 103
atgaccaaga gagtccggct cagtgactcc ttcaaccctg tctaccccta tgaagatgaa 60
agcacctccc aacacccctt tataaaccca gggtttattt ccccaaatgg cttcacacaa 120
agcccagacg gagttcttac tttaaaatgt ttaaccccac taacaaccac aggcggatct 180
ctacagctaa aagtgggagg gggacttaca gtggatgaca ctgatggtac cttacaagaa 240
aacatacgtg ctacagcacc cattactaaa aataatcact ctgtagaact atccattgga 300
aatggattag aaactcaaaa caataaacta tgtgccaaat tgggaaatgg gttaaaattt 360
aacaacggtg acatttgtat aaaggatagt attaacacct tatggactgg aataaaccct 420
ccacctaact gtcaaattgt ggaaaacact aatacaaatg atggcaaact tactttagta 480
ttagtaaaaa acggagggct tgttaatggc tacgtgtctc tagttggtgt atcagacact 540
gtgaaccaaa tgttcacaca aaagacagca aacatccaat taagattata ttttgactct 600
tctggaaatc tattaactga tgaatcagac ttaaaaattc cacttaaaaa taaatcttct 660
acagcgacca gtgaaactgt agccagcagc aaagccttta tgccaagtac tacagcttat 720
cccttcaaca ccactactag ggatagtgaa aactacattc atggaatatg ttactacatg 780
actagttatg atagaagtct atttcccttg aacatttcta taatgctaaa cagccgtatg 840
atttcttcca atgttgccta tgccatacaa tttgaatgga atctaaatgc aagtgaatct 900
ccagaaagca acatagctac gctgaccaca tccccctttt tcttttctta cattacagaa 960
gacgacaact aa 972
<210> 104
<211> 273
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 34 sequence
<400> 104
gacggagttc ttactttaaa atgtttaacc ccactaacaa ccacaggcgg atctctacag 60
ctaaaagtgg gagggggact tacagtggat gacactgatg gtaccttaca agaaaacata 120
cgtgctacag cacccattac taaaaataat cactctgtag aactatccat tggaaatgga 180
ttagaaactc aaaacaataa actatgtgcc aaattgggaa atgggttaaa atttaacaac 240
ggtgacattt gtataaagga tagtattaac acc 273
<210> 105
<211> 570
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 34 sequence
<400> 105
ttatggactg gaataaaccc tccacctaac tgtcaaattg tggaaaacac taatacaaat 60
gatggcaaac ttactttagt attagtaaaa aacggagggc ttgttaatgg ctacgtgtct 120
ctagttggtg tatcagacac tgtgaaccaa atgttcacac aaaagacagc aaacatccaa 180
ttaagattat attttgactc ttctggaaat ctattaactg atgaatcaga cttaaaaatt 240
ccacttaaaa ataaatcttc tacagcgacc agtgaaactg tagccagcag caaagccttt 300
atgccaagta ctacagctta tcccttcaac accactacta gggatagtga aaactacatt 360
catggaatat gttactacat gactagttat gatagaagtc tatttccctt gaacatttct 420
ataatgctaa acagccgtat gatttcttcc aatgttgcct atgccataca atttgaatgg 480
aatctaaatg caagtgaatc tccagaaagc aacatagcta cgctgaccac atcccccttt 540
ttcttttctt acattacaga agacgacaac 570
<210> 106
<211> 1677
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 34 sequence
<400> 106
atgaggcgag tcgtgctagg cggagcggtg gtgtatccgg agggtcctcc tccttcgtac 60
gagagcgtga tgcagcagca gcaggcgacg gcggtgatgc aatccccact ggaggctccc 120
tttgtgcctc cgcgatacct ggcacctacg gagggcagaa acagcattcg ttactcggaa 180
ctggcacctc agtacgatac caccaggttg tatctggtgg acaacaagtc ggcggacatt 240
gcttctctga actatcagaa tgaccacagc aacttcttga ccacggtggt gcaaaacaat 300
gactttaccc ctacggaagc cagcacccag accattaact ttgatgaacg atcgcggtgg 360
ggcggtcagc taaaaaccat catgcatact aacatgccca acgtgaacga gtatatgttt 420
agtaacaagt tcaaagcgcg tgtgatggtg tccagaaaac ctcctgaggg tgttagagta 480
gacgataatt atgatcataa gcaagatatt ctaaaatacg agtggttcga gtttactttg 540
ccagaaggca acttttcggt cactatgact atcgacttga tgaacaatgc catcatagac 600
aattacttga aagtgggcag acagaatgga gtgttggaaa gtgacattgg tgttaagttc 660
gacactagga acttcaagtt gggatgggat ccagaaacta agttgatcat gcctggggtt 720
tacacctatg aggccttcca tcctgacatc gtattgctgc ctggctgcgg agtggacttt 780
accgaaagcc gtctgagcaa ccttcttggc attagaaaga aacacccatt ccaagagggt 840
tttaagatct tgtatgagga tttagaagga ggaaatattc cagccctttt ggatgtagat 900
gcttatgaga acagcaagaa agatcaaaaa gccaaaatag aagctgctgc agaagctaaa 960
gcaaacatag ttgccaacga tccggtaagg gtggctaacg ctagtgaaat caggggagac 1020
agttttgccg caacatccgt tccgactaaa gaatcattat tggatgatgt gtctcaaaac 1080
atagagttaa aactcactat taagcctgtg gaaaaagatg gcaaaaacag aagttacaat 1140
gtgttggaag ataaaatcaa cacggcctat cgcagttggt acctttcgta caattatggc 1200
gaccccgaaa aaggagtgcg ttcctggaca ttgctcacca cctcagatgt cacctgcgga 1260
gcggagcagg tctactggtc gcttccagac atgatgcagg atcctgtcac tttccgctcc 1320
actagacaag tcagtaacta ccctgtggtg ggtgcagagc ttatgcccgt cttttcaaag 1380
agcttctaca acgaacaagc tgtgtactcc cagcagctcc gccagtccac ctcgcttacg 1440
cacgtcttca accgctttcc tgagaaccag attttaatcc gtccgccggc gcccacaatt 1500
accaccgtca gtgaaaacgt tcctgctctc acagatcacg ggaccctgcc gttgcgcagc 1560
agtatccggg gagtccaacg tgtgaccgtt actgacgcca gacgccgcac ctgtccctac 1620
gtgtacaagg cactgggcat agtcgcaccg cgcgtccttt caagccgcac tttctaa 1677
<210> 107
<211> 2856
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 34 sequence
<400> 107
atggccaccc catcgatgct gccccaatgg gcatacatgc acatcgccgg acaggatgct 60
tcggagtacc tgagtccggg tctggtgcag ttcgcccgcg ccacagacac ctacttcaat 120
ctgggaaata agtttagaaa tcctaccgta gcgccgaccc acgatgtgac caccgatcgt 180
agccagcggc tcatgttgcg cttcgtgccc gttgaccggg aggacaatac atactcttac 240
aaagtgcggt acaccctggc cgtgggcgac aacagagtgc tggatatggc cagcacgttc 300
tttgacatta ggggcgtgtt ggacagaggt cccagtttta aaccctattc tggtacggct 360
tacaactccc tggctcctaa aggcgctcca aatgcatctc agtggttgga taagggagtt 420
acaagcactg gcctagtgga cgacggcaat actgatgatg gggaagaagc caaaaaagca 480
acatacactt ttggtaatgc tccagtaaaa gccgaggctg aaatcacaaa agacggattg 540
ccggtgggct tggaagtttc aactgaaggt cctaaaccaa tctatgctga taagctttat 600
cagccagaac ctcaagtggg agacgaaact tggactgacc tagacggaaa aaccgaagag 660
tatggaggga gggttcttaa acctgaaact aaaatgaaac cctgctacgg atcttttgct 720
aaacctacta atattaaagg aggtcaggca aaggtaaaac caaaagaaga cgatggcact 780
aacaacatcg agtatgacat tgacatgaac ttctttgact taagatcaca aagatcagaa 840
ctcaaaccta aaattgtaat gtatgcagaa aatgtggacc tggaatgtcc agatactcat 900
gttgtgtaca aacctggagt ttcagatgct agttctgaga ccaatcttgg acaacagtct 960
atgcccaaca gacccaacta cattggcttc agagataact tcatcggact tatgtactat 1020
aacagtactg gcaacatggg ggtactggct ggccaagcgt ctcagttgaa tgcagtggtt 1080
gacttgcagg acagaaacac agaactgtct taccaactct tgcttgactc tctgggcgac 1140
agaaccagat actttagcat gtggaatcag gctgtggaca gttatgatcc tgatgtacgt 1200
gttattgaaa atcatggtgt ggaagatgaa cttcccaact attgttttcc gttggatggt 1260
gtcggtccgc gaacagatag ttacaaggag attaagccaa atggagacca atctacttgg 1320
acaaatgtag acccaactgg cagcagtgaa cttgctaagg gaaatccatt tgccatggaa 1380
attaaccttc aagccaatct atggcgaagt ttcctttatt ccaatgtggc tctatatctc 1440
ccagactcgt acaaatacac cccgtccaat gtcactcttc cagaaaacaa aaacacctac 1500
gactacatga acgggcgggt ggtgccgcca tctctagtag acacctatgt gaacattggt 1560
gccaggtggt ctctggatgc catggacaat gtcaacccat tcaaccacca ccgtaacgct 1620
ggcttgcgtt accgatccat gcttctgggt aacggacgtt atgtgccttt ccacatacaa 1680
gtgcctcaaa aattcttcgc tgttaaaaac ctgctgcttc tcccaggctc ctacacttat 1740
gagtggaact ttaggaagga tgtaaacatg gttctacaga gttccctcgg taacgaccta 1800
cgggtagatg gcgccagcat cagttttacg agcatcaacc tctatgctac ttttttcccc 1860
atggctcaca acaccgcttc cacccttgaa gccatgctgc ggaatgacac caatgatcag 1920
tcattcaacg actacctatc tgcagctaac atgctctacc ccattcctgc caatgcaacc 1980
aatattccca tttccattcc ttctcgcaac tgggcggctt tcagaggctg gtcatttacc 2040
agactgaaaa ccaaagaaac tccctctttg gggtctggat ttgaccccta cttcgtctat 2100
tctggttcta ttccctacct ggatggtacc ttctacctga accacacttt taagaaggtt 2160
tccatcatgt ttgactcttc agtgagctgg cctggaaatg acaggttact atctcctaac 2220
gaatttgaaa taaagcgcac tgtggatggc gaaggctaca acgtagccca atgcaacatg 2280
accaaagact ggttcttggt acagatgctc gccaactaca acatcggcta tcagggcttc 2340
tacattccag aaggatacaa agatcgcatg tattcatttt tcagaaactt ccagcccatg 2400
agcaggcagg tggttgatga ggtcaattac aaagacttca aggccgtcgc cataccctac 2460
caacacaaca actctggctt tgtgggttac atggctccga ccatgcgtca aggtcaaccc 2520
tatcccgcta actatcccta tccactcatt ggaacaactg ccgtaaatag tgttacgcag 2580
aaaaagttct tgtgtgacag aaccatgtgg cgcataccgt tctcaagcaa cttcatgtct 2640
atgggagccc ttacagactt gggacagaac atgctctatg ccaactcagc tcatgctctg 2700
gacatgacct ttgaggtgga tcccatggat gagcccaccc tgctttatct tctcttcgaa 2760
gttttcgacg tggtcagagt gcatcagcca caccgcggca tcatcgaggc agtctacctg 2820
cgtacaccgt tctcggccgg taacgctacc acgtaa 2856
<210> 108
<211> 323
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 34 sequence
<400> 108
Met Thr Lys Arg Val Arg Leu Ser Asp Ser Phe Asn Pro Val Tyr Pro
1 5 10 15
Tyr Glu Asp Glu Ser Thr Ser Gln His Pro Phe Ile Asn Pro Gly Phe
20 25 30
Ile Ser Pro Asn Gly Phe Thr Gln Ser Pro Asp Gly Val Leu Thr Leu
35 40 45
Lys Cys Leu Thr Pro Leu Thr Thr Thr Gly Gly Ser Leu Gln Leu Lys
50 55 60
Val Gly Gly Gly Leu Thr Val Asp Asp Thr Asp Gly Thr Leu Gln Glu
65 70 75 80
Asn Ile Arg Ala Thr Ala Pro Ile Thr Lys Asn Asn His Ser Val Glu
85 90 95
Leu Ser Ile Gly Asn Gly Leu Glu Thr Gln Asn Asn Lys Leu Cys Ala
100 105 110
Lys Leu Gly Asn Gly Leu Lys Phe Asn Asn Gly Asp Ile Cys Ile Lys
115 120 125
Asp Ser Ile Asn Thr Leu Trp Thr Gly Ile Asn Pro Pro Pro Asn Cys
130 135 140
Gln Ile Val Glu Asn Thr Asn Thr Asn Asp Gly Lys Leu Thr Leu Val
145 150 155 160
Leu Val Lys Asn Gly Gly Leu Val Asn Gly Tyr Val Ser Leu Val Gly
165 170 175
Val Ser Asp Thr Val Asn Gln Met Phe Thr Gln Lys Thr Ala Asn Ile
180 185 190
Gln Leu Arg Leu Tyr Phe Asp Ser Ser Gly Asn Leu Leu Thr Asp Glu
195 200 205
Ser Asp Leu Lys Ile Pro Leu Lys Asn Lys Ser Ser Thr Ala Thr Ser
210 215 220
Glu Thr Val Ala Ser Ser Lys Ala Phe Met Pro Ser Thr Thr Ala Tyr
225 230 235 240
Pro Phe Asn Thr Thr Thr Arg Asp Ser Glu Asn Tyr Ile His Gly Ile
245 250 255
Cys Tyr Tyr Met Thr Ser Tyr Asp Arg Ser Leu Phe Pro Leu Asn Ile
260 265 270
Ser Ile Met Leu Asn Ser Arg Met Ile Ser Ser Asn Val Ala Tyr Ala
275 280 285
Ile Gln Phe Glu Trp Asn Leu Asn Ala Ser Glu Ser Pro Glu Ser Asn
290 295 300
Ile Ala Thr Leu Thr Thr Ser Pro Phe Phe Phe Ser Tyr Ile Thr Glu
305 310 315 320
Asp Asp Asn
<210> 109
<211> 91
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 34 sequence
<400> 109
Asp Gly Val Leu Thr Leu Lys Cys Leu Thr Pro Leu Thr Thr Thr Gly
1 5 10 15
Gly Ser Leu Gln Leu Lys Val Gly Gly Gly Leu Thr Val Asp Asp Thr
20 25 30
Asp Gly Thr Leu Gln Glu Asn Ile Arg Ala Thr Ala Pro Ile Thr Lys
35 40 45
Asn Asn His Ser Val Glu Leu Ser Ile Gly Asn Gly Leu Glu Thr Gln
50 55 60
Asn Asn Lys Leu Cys Ala Lys Leu Gly Asn Gly Leu Lys Phe Asn Asn
65 70 75 80
Gly Asp Ile Cys Ile Lys Asp Ser Ile Asn Thr
85 90
<210> 110
<211> 190
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 34 sequence
<400> 110
Leu Trp Thr Gly Ile Asn Pro Pro Pro Asn Cys Gln Ile Val Glu Asn
1 5 10 15
Thr Asn Thr Asn Asp Gly Lys Leu Thr Leu Val Leu Val Lys Asn Gly
20 25 30
Gly Leu Val Asn Gly Tyr Val Ser Leu Val Gly Val Ser Asp Thr Val
35 40 45
Asn Gln Met Phe Thr Gln Lys Thr Ala Asn Ile Gln Leu Arg Leu Tyr
50 55 60
Phe Asp Ser Ser Gly Asn Leu Leu Thr Asp Glu Ser Asp Leu Lys Ile
65 70 75 80
Pro Leu Lys Asn Lys Ser Ser Thr Ala Thr Ser Glu Thr Val Ala Ser
85 90 95
Ser Lys Ala Phe Met Pro Ser Thr Thr Ala Tyr Pro Phe Asn Thr Thr
100 105 110
Thr Arg Asp Ser Glu Asn Tyr Ile His Gly Ile Cys Tyr Tyr Met Thr
115 120 125
Ser Tyr Asp Arg Ser Leu Phe Pro Leu Asn Ile Ser Ile Met Leu Asn
130 135 140
Ser Arg Met Ile Ser Ser Asn Val Ala Tyr Ala Ile Gln Phe Glu Trp
145 150 155 160
Asn Leu Asn Ala Ser Glu Ser Pro Glu Ser Asn Ile Ala Thr Leu Thr
165 170 175
Thr Ser Pro Phe Phe Phe Ser Tyr Ile Thr Glu Asp Asp Asn
180 185 190
<210> 111
<211> 558
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 34 sequence
<400> 111
Met Arg Arg Val Val Leu Gly Gly Ala Val Val Tyr Pro Glu Gly Pro
1 5 10 15
Pro Pro Ser Tyr Glu Ser Val Met Gln Gln Gln Gln Ala Thr Ala Val
20 25 30
Met Gln Ser Pro Leu Glu Ala Pro Phe Val Pro Pro Arg Tyr Leu Ala
35 40 45
Pro Thr Glu Gly Arg Asn Ser Ile Arg Tyr Ser Glu Leu Ala Pro Gln
50 55 60
Tyr Asp Thr Thr Arg Leu Tyr Leu Val Asp Asn Lys Ser Ala Asp Ile
65 70 75 80
Ala Ser Leu Asn Tyr Gln Asn Asp His Ser Asn Phe Leu Thr Thr Val
85 90 95
Val Gln Asn Asn Asp Phe Thr Pro Thr Glu Ala Ser Thr Gln Thr Ile
100 105 110
Asn Phe Asp Glu Arg Ser Arg Trp Gly Gly Gln Leu Lys Thr Ile Met
115 120 125
His Thr Asn Met Pro Asn Val Asn Glu Tyr Met Phe Ser Asn Lys Phe
130 135 140
Lys Ala Arg Val Met Val Ser Arg Lys Pro Pro Glu Gly Val Arg Val
145 150 155 160
Asp Asp Asn Tyr Asp His Lys Gln Asp Ile Leu Lys Tyr Glu Trp Phe
165 170 175
Glu Phe Thr Leu Pro Glu Gly Asn Phe Ser Val Thr Met Thr Ile Asp
180 185 190
Leu Met Asn Asn Ala Ile Ile Asp Asn Tyr Leu Lys Val Gly Arg Gln
195 200 205
Asn Gly Val Leu Glu Ser Asp Ile Gly Val Lys Phe Asp Thr Arg Asn
210 215 220
Phe Lys Leu Gly Trp Asp Pro Glu Thr Lys Leu Ile Met Pro Gly Val
225 230 235 240
Tyr Thr Tyr Glu Ala Phe His Pro Asp Ile Val Leu Leu Pro Gly Cys
245 250 255
Gly Val Asp Phe Thr Glu Ser Arg Leu Ser Asn Leu Leu Gly Ile Arg
260 265 270
Lys Lys His Pro Phe Gln Glu Gly Phe Lys Ile Leu Tyr Glu Asp Leu
275 280 285
Glu Gly Gly Asn Ile Pro Ala Leu Leu Asp Val Asp Ala Tyr Glu Asn
290 295 300
Ser Lys Lys Asp Gln Lys Ala Lys Ile Glu Ala Ala Ala Glu Ala Lys
305 310 315 320
Ala Asn Ile Val Ala Asn Asp Pro Val Arg Val Ala Asn Ala Ser Glu
325 330 335
Ile Arg Gly Asp Ser Phe Ala Ala Thr Ser Val Pro Thr Lys Glu Ser
340 345 350
Leu Leu Asp Asp Val Ser Gln Asn Ile Glu Leu Lys Leu Thr Ile Lys
355 360 365
Pro Val Glu Lys Asp Gly Lys Asn Arg Ser Tyr Asn Val Leu Glu Asp
370 375 380
Lys Ile Asn Thr Ala Tyr Arg Ser Trp Tyr Leu Ser Tyr Asn Tyr Gly
385 390 395 400
Asp Pro Glu Lys Gly Val Arg Ser Trp Thr Leu Leu Thr Thr Ser Asp
405 410 415
Val Thr Cys Gly Ala Glu Gln Val Tyr Trp Ser Leu Pro Asp Met Met
420 425 430
Gln Asp Pro Val Thr Phe Arg Ser Thr Arg Gln Val Ser Asn Tyr Pro
435 440 445
Val Val Gly Ala Glu Leu Met Pro Val Phe Ser Lys Ser Phe Tyr Asn
450 455 460
Glu Gln Ala Val Tyr Ser Gln Gln Leu Arg Gln Ser Thr Ser Leu Thr
465 470 475 480
His Val Phe Asn Arg Phe Pro Glu Asn Gln Ile Leu Ile Arg Pro Pro
485 490 495
Ala Pro Thr Ile Thr Thr Val Ser Glu Asn Val Pro Ala Leu Thr Asp
500 505 510
His Gly Thr Leu Pro Leu Arg Ser Ser Ile Arg Gly Val Gln Arg Val
515 520 525
Thr Val Thr Asp Ala Arg Arg Arg Thr Cys Pro Tyr Val Tyr Lys Ala
530 535 540
Leu Gly Ile Val Ala Pro Arg Val Leu Ser Ser Arg Thr Phe
545 550 555
<210> 112
<211> 951
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 34 sequence
<400> 112
Met Ala Thr Pro Ser Met Leu Pro Gln Trp Ala Tyr Met His Ile Ala
1 5 10 15
Gly Gln Asp Ala Ser Glu Tyr Leu Ser Pro Gly Leu Val Gln Phe Ala
20 25 30
Arg Ala Thr Asp Thr Tyr Phe Asn Leu Gly Asn Lys Phe Arg Asn Pro
35 40 45
Thr Val Ala Pro Thr His Asp Val Thr Thr Asp Arg Ser Gln Arg Leu
50 55 60
Met Leu Arg Phe Val Pro Val Asp Arg Glu Asp Asn Thr Tyr Ser Tyr
65 70 75 80
Lys Val Arg Tyr Thr Leu Ala Val Gly Asp Asn Arg Val Leu Asp Met
85 90 95
Ala Ser Thr Phe Phe Asp Ile Arg Gly Val Leu Asp Arg Gly Pro Ser
100 105 110
Phe Lys Pro Tyr Ser Gly Thr Ala Tyr Asn Ser Leu Ala Pro Lys Gly
115 120 125
Ala Pro Asn Ala Ser Gln Trp Leu Asp Lys Gly Val Thr Ser Thr Gly
130 135 140
Leu Val Asp Asp Gly Asn Thr Asp Asp Gly Glu Glu Ala Lys Lys Ala
145 150 155 160
Thr Tyr Thr Phe Gly Asn Ala Pro Val Lys Ala Glu Ala Glu Ile Thr
165 170 175
Lys Asp Gly Leu Pro Val Gly Leu Glu Val Ser Thr Glu Gly Pro Lys
180 185 190
Pro Ile Tyr Ala Asp Lys Leu Tyr Gln Pro Glu Pro Gln Val Gly Asp
195 200 205
Glu Thr Trp Thr Asp Leu Asp Gly Lys Thr Glu Glu Tyr Gly Gly Arg
210 215 220
Val Leu Lys Pro Glu Thr Lys Met Lys Pro Cys Tyr Gly Ser Phe Ala
225 230 235 240
Lys Pro Thr Asn Ile Lys Gly Gly Gln Ala Lys Val Lys Pro Lys Glu
245 250 255
Asp Asp Gly Thr Asn Asn Ile Glu Tyr Asp Ile Asp Met Asn Phe Phe
260 265 270
Asp Leu Arg Ser Gln Arg Ser Glu Leu Lys Pro Lys Ile Val Met Tyr
275 280 285
Ala Glu Asn Val Asp Leu Glu Cys Pro Asp Thr His Val Val Tyr Lys
290 295 300
Pro Gly Val Ser Asp Ala Ser Ser Glu Thr Asn Leu Gly Gln Gln Ser
305 310 315 320
Met Pro Asn Arg Pro Asn Tyr Ile Gly Phe Arg Asp Asn Phe Ile Gly
325 330 335
Leu Met Tyr Tyr Asn Ser Thr Gly Asn Met Gly Val Leu Ala Gly Gln
340 345 350
Ala Ser Gln Leu Asn Ala Val Val Asp Leu Gln Asp Arg Asn Thr Glu
355 360 365
Leu Ser Tyr Gln Leu Leu Leu Asp Ser Leu Gly Asp Arg Thr Arg Tyr
370 375 380
Phe Ser Met Trp Asn Gln Ala Val Asp Ser Tyr Asp Pro Asp Val Arg
385 390 395 400
Val Ile Glu Asn His Gly Val Glu Asp Glu Leu Pro Asn Tyr Cys Phe
405 410 415
Pro Leu Asp Gly Val Gly Pro Arg Thr Asp Ser Tyr Lys Glu Ile Lys
420 425 430
Pro Asn Gly Asp Gln Ser Thr Trp Thr Asn Val Asp Pro Thr Gly Ser
435 440 445
Ser Glu Leu Ala Lys Gly Asn Pro Phe Ala Met Glu Ile Asn Leu Gln
450 455 460
Ala Asn Leu Trp Arg Ser Phe Leu Tyr Ser Asn Val Ala Leu Tyr Leu
465 470 475 480
Pro Asp Ser Tyr Lys Tyr Thr Pro Ser Asn Val Thr Leu Pro Glu Asn
485 490 495
Lys Asn Thr Tyr Asp Tyr Met Asn Gly Arg Val Val Pro Pro Ser Leu
500 505 510
Val Asp Thr Tyr Val Asn Ile Gly Ala Arg Trp Ser Leu Asp Ala Met
515 520 525
Asp Asn Val Asn Pro Phe Asn His His Arg Asn Ala Gly Leu Arg Tyr
530 535 540
Arg Ser Met Leu Leu Gly Asn Gly Arg Tyr Val Pro Phe His Ile Gln
545 550 555 560
Val Pro Gln Lys Phe Phe Ala Val Lys Asn Leu Leu Leu Leu Pro Gly
565 570 575
Ser Tyr Thr Tyr Glu Trp Asn Phe Arg Lys Asp Val Asn Met Val Leu
580 585 590
Gln Ser Ser Leu Gly Asn Asp Leu Arg Val Asp Gly Ala Ser Ile Ser
595 600 605
Phe Thr Ser Ile Asn Leu Tyr Ala Thr Phe Phe Pro Met Ala His Asn
610 615 620
Thr Ala Ser Thr Leu Glu Ala Met Leu Arg Asn Asp Thr Asn Asp Gln
625 630 635 640
Ser Phe Asn Asp Tyr Leu Ser Ala Ala Asn Met Leu Tyr Pro Ile Pro
645 650 655
Ala Asn Ala Thr Asn Ile Pro Ile Ser Ile Pro Ser Arg Asn Trp Ala
660 665 670
Ala Phe Arg Gly Trp Ser Phe Thr Arg Leu Lys Thr Lys Glu Thr Pro
675 680 685
Ser Leu Gly Ser Gly Phe Asp Pro Tyr Phe Val Tyr Ser Gly Ser Ile
690 695 700
Pro Tyr Leu Asp Gly Thr Phe Tyr Leu Asn His Thr Phe Lys Lys Val
705 710 715 720
Ser Ile Met Phe Asp Ser Ser Val Ser Trp Pro Gly Asn Asp Arg Leu
725 730 735
Leu Ser Pro Asn Glu Phe Glu Ile Lys Arg Thr Val Asp Gly Glu Gly
740 745 750
Tyr Asn Val Ala Gln Cys Asn Met Thr Lys Asp Trp Phe Leu Val Gln
755 760 765
Met Leu Ala Asn Tyr Asn Ile Gly Tyr Gln Gly Phe Tyr Ile Pro Glu
770 775 780
Gly Tyr Lys Asp Arg Met Tyr Ser Phe Phe Arg Asn Phe Gln Pro Met
785 790 795 800
Ser Arg Gln Val Val Asp Glu Val Asn Tyr Lys Asp Phe Lys Ala Val
805 810 815
Ala Ile Pro Tyr Gln His Asn Asn Ser Gly Phe Val Gly Tyr Met Ala
820 825 830
Pro Thr Met Arg Gln Gly Gln Pro Tyr Pro Ala Asn Tyr Pro Tyr Pro
835 840 845
Leu Ile Gly Thr Thr Ala Val Asn Ser Val Thr Gln Lys Lys Phe Leu
850 855 860
Cys Asp Arg Thr Met Trp Arg Ile Pro Phe Ser Ser Asn Phe Met Ser
865 870 875 880
Met Gly Ala Leu Thr Asp Leu Gly Gln Asn Met Leu Tyr Ala Asn Ser
885 890 895
Ala His Ala Leu Asp Met Thr Phe Glu Val Asp Pro Met Asp Glu Pro
900 905 910
Thr Leu Leu Tyr Leu Leu Phe Glu Val Phe Asp Val Val Arg Val His
915 920 925
Gln Pro His Arg Gly Ile Ile Glu Ala Val Tyr Leu Arg Thr Pro Phe
930 935 940
Ser Ala Gly Asn Ala Thr Thr
945 950
<210> 113
<211> 159
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus D37 sequence
<400> 113
catcatcata atatacccca caaagtaaac aaaagttaat atgcaaatga gcttttgaat 60
tttaacggtt ttggggcgga gccaacgctg attggacgag aagcggtgat gcaaataacg 120
tcacgacgca cggctaacgg ccggcgcgga ggcgtggcc 159
<210> 114
<211> 159
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus D37 sequence
<400> 114
ggccacgcct ccgcgccggc cgttagccgt gcgtcgtgac gttatttgca tcaccgcttc 60
tcgtccaatc agcgttggct ccgccccaaa accgttaaaa ttcaaaagct catttgcata 120
ttaacttttg tttactttgt ggggtatatt atgatgatg 159
<210> 115
<211> 320
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus D37 sequence
<400> 115
taggccggaa gcaagtcgcg gggctaatga cgtataaaaa agcggacttt agacccggaa 60
acggccgatt ttcccgcggc cacgcccgga tatgaggtaa ttctgggcgg atgcaagtga 120
aattaggtca ttttggcgcc aaaactgaat gaggaagtga aaagtgaaaa atacctgtcc 180
cgcccagggc ggaatattta ccgagggccg agagactttg accgattacg tggggtttcg 240
attgcggtgt ttttttcgcg aatttccgcg tccgtgtgaa agtccggtgt ttatgtcaca 300
gatcagctga tccacagggt 320
<210> 116
<211> 3388
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus D37 sequence
<400> 116
atttaaacca gttgagcccg tcaagaggcc actcttgagt gccagcgagt agagatttct 60
ctgagctccg ctcccaaagt gtgagaaaaa tgagacacct gcgcctcctg tcttcaactg 120
tgcctattaa catggccgca ttattgctgg aggactatgt gagtacagta ttggaggacg 180
aactacatcc atctccattt gagctgggac ctacacttca ggacctttat gatttggagg 240
tagatgccca tgatgacgac ccaaacgaag aggctgtgaa tttaatattt ccagaatctc 300
tgattcttca ggctgacata gccagcgaag ctgtacctac accacttcat acaccgactt 360
tgtcacccat acctgaattg gaagaggagg acgagttaga cctccgatgt tatgaggaag 420
gttttcctcc cagcgattca gaggacgaac agggtgagca gagcatggct ctaatctcag 480
aatatgcttg tgtggttgtg gaagagcatt ttgtgttgga caatcctgag gtgcccgggc 540
aaggctgtag atcctgccag taccaccggg ataagaccgg agacacaaac gcctcctgcg 600
ctctgtgtta catgaaaaag aacttcagct ttatttacag taagtggagt gaatgtgaga 660
gaggctgagt gcttaacaca taactgggtg atgcttaaac agctgtgcta agtgtggttt 720
atttttgttt ctaggtccgg tgtcagagga tgagtcatca ccctcagaag aaaaccaccc 780
gtgtccccct gagctgtcag gcgaaacgcc cctgcaagtg cacaaaccca ccccagtcag 840
acccagtggc gagaggcgag cagctgttga aaaaattgag gacttgttac atgacatggg 900
tggggatgaa cctttggacc tgagcttgaa acgccccagg aactaggcgc agctgtgctt 960
agtcatgtgt aaataaagtt gtacaataaa agtatatgtg acgcatgcaa ggtgtggttt 1020
atgactcatg ggcggggctt agtcctatat aagtggcaac acctgggcac tgggcacaga 1080
ccttcaggga gttcctgatg gatgtgtgga ctatccttgc agactttagc aagacacgcc 1140
ggcttgtaga ggatagttca gacgggtgct ccgggttctg gagacactgg tttggaactc 1200
ctctatctcg actggtgtac acagttaaga aggattataa cgaggaattt gaaaatcttt 1260
ttgctgattg ctctggcctg ctagattctc tgaatctcgg ccaccagtcc cttttccagg 1320
aaagggtact ccacagcctt gatttttcca gcccagggcg cactacagcc ggggttgctt 1380
ttgtggtttt tctggttgac aaatggagcc agaacaccca actgagcagg ggctacattc 1440
tggacttcgc agccatgcac ctgtggaggg catgggtgag gcagcgggga cagagaatct 1500
tgaactactg gcttatacag ccagcagctc cgggtcttct tcgtctacac agacaaacat 1560
ccatgttgga ggaagaaatg aggcaggcca tggacgagaa cccgaggagc ggcctggacc 1620
ctccgtcgga agaggagctg gattgaatca ggtatccagc ttgtacccag agcttagcaa 1680
ggtgctgaca tccatggcta ggggagtgaa gagggagagg agcgatgggg gcaataccgg 1740
gatgatgacc gagctgacgg ccagcctgat gaatcgcaag cgcccagagc gcattacctg 1800
gcacgagcta cagatggagt gcagggatga gttgggcctg atgcaggata aatatggcct 1860
ggagcagata aaaacacatt ggttgaaccc agatgaggat tgggaggagg ccattaagaa 1920
atatgccaag atagccctgc gcccagattg caagtacata gtgaccaaga ccgtgaatat 1980
tagacatgcc tgctacattt cagggaacgg ggcagaggtg gtcatcgata ccctggacaa 2040
ggccgccttc aggtgttgca tgatgggaat gagagcagga gtgatgaata tgaattccat 2100
gatcttcatg aacatgaagt tcaatggaga gaagtttaat ggggtgctgt tcatggccaa 2160
cagccacatg accctgcatg gctgcagttt ctttggcttc aacaatatgt gcgccgaggt 2220
ctggggcgct tccaagatca ggggatgtaa gttttatggc tgctggatgg gcgtggtcgg 2280
aagacctaag agcgagatgt ctgtgaagca gtgtgtgttt gagaaatgct acctgggagt 2340
ctctaccgag ggcaatgcta gagtgagaca ctgctcttcc ctggatacgg gctgcttctg 2400
cctggtgaag ggtacggcct ctctgaagca taatatggtg aagggctgca cagatgagcg 2460
catgtacaac atgctaacat gcgactcggg ggtctgtcat atcctgaaga acatccatgt 2520
gacctcccac cccagaaaga agtggccagt gtttgagaat aacctgctga tcaagtgcca 2580
tatgcacctg ggtgccagaa ggggcacctt ccagccgtac cagtgcaact ttagccagac 2640
caagctgctg ttggaaaacg atgccttctc cagggtgaac ctgaacggca tctttgacat 2700
ggatgtctcg gtgtacaaga tcctgagata cgatgagacc aagtccaggg tgcgcgcttg 2760
cgagtgcggg ggcagacaca ccaggatgca gccagtggcc ctggatgtga ccgaggagct 2820
gagaccagac cacctggtga tggcctgtac cgggaccgag ttcagctcca gtggggagga 2880
cacagattag aggtaggttt gagtagtggg cgtggctaat gtgagtataa aggcgggtgt 2940
cttacgaggg tctttttgct tttctgcaga catcatgaac gggaccggcg gggccttcga 3000
aggggggctt tttagccctt atttgacaac ccgcctgccg ggatgggccg gagttcgtca 3060
gaatgtgatg ggatctacgg tggatgggcg tccagtgctt ccagcaaatt cctcgaccat 3120
gacctacgcg accgtgggga gctcgtcgct tgacagcacc gccgcagccg cggcagccgc 3180
agccgccatg acagcgacga gactggcctc gagctatatg cccagcagcg gtagcagccc 3240
ctctgtgccc agttccatca tcgccgagga gaaactgctg gccctgctgg ccgagctgga 3300
agccctgagc cgccagctgg ccgccctgac ccagcaggtg tccgatctcc gcgagcaaca 3360
gcagcagcaa aataaatgat tcaataaa 3388
<210> 117
<211> 18876
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus D37 sequence
<400> 117
atggccggcg gcagtcagga cgtgcgccgg ttcatggagc gagaggccac tccgccccgg 60
ggccacgggt cggcgcgcta tccgccggag caggagagga gcccctcgcc gccgccacct 120
cctctgccca ccaagcgccg aaagtatcag cgggtgggct ccgggtcttc cgaggaggac 180
gtggtccccg tggacagccc tccaaaaaag aagcaagcca gaaagaccaa gcatgtgacc 240
aaggtagacc ccgacgaaga gatgccccag gaagacgccg tgatcgtggg agtgggattc 300
agccagcctc cggttctgtt gaaggaaggc aaggacggaa aacgcatcgt cgagcccgcg 360
acccctggtg tcctgaacgt gcgcaacccc ctgagtctgc ctctggtctc gtcatgggag 420
aagggcatgg ataccatgaa cgtgctgatg gaacgctacc gcgtcgacag cggcttgcgc 480
gatgcttaca agctcatgcc ggagcagacc gagatcttcc agaagatgtg ccagacctgg 540
atgaacgagg aggcccgcgg gatgcaactg acattcacca cccagaaagc atttagcacc 600
attatgggtc gcctgttgca aggttacatt ttcagccaca gcgggatcgc gcacaagaat 660
tgggagtgca ccggctgcgt cctgtgggat cacggctgca ccgaggtgga aggtcagctc 720
aagtgtctgc atggaacggt gatgattcac aaggaccacg tggtggagat ggatgtgacc 780
agcgagaacg gacagcgcgc gctgaaggag cagcccagca aggctaaggt gacccagaac 840
cgctggggac ggagcgtggt gcaactgacc agccatgacg cgcgctgctg cgtgcatgat 900
gccgggtgcg ggaataacca gttcagcggg aagagctgcg gcctgttttt tagcgagggg 960
gccaaggccc agcaagcttt caagcagatc gcggccttcg tcaaggccct ctacccgaat 1020
atgcagcgcg gcgcggggat gatgctgatg cccgtgcact gcgagtgtaa ccacaagcct 1080
cagagcgtgc ccttcctggg ccgccagctg tgcaagatga ccccgttcgg cctgagcaac 1140
gccgaggacc tggacaagga tcagattagc gacaagagcg tgcttgccag tgtgaagtac 1200
cccagtctga tggtgttcca gtgctgcaac cccgtgtacc gcaactcgcg cgcgcagagc 1260
accggtccca actgcgattt caagatctcc ggccctgaca tgctgggcgc cctgcaaatg 1320
agccggcgca tgtggagcga gaccttcccc gagactccag tgcccaaact ggtgatcccc 1380
gagttcaagt ggcagcccaa gttccagtac cgcaacgtgg ccctccccag cgcggcgcac 1440
aacgacgagc gcgagaaccc cttcgacttt taaataactt gcatatactc cagcgcatgt 1500
gtaaaataaa agtgctgttt atttgagtca tacacgcagt tgtttcattt tatcaaaagc 1560
ggtggcgtgt tcgatggcgg cgcggtggga gcgaaagtag ggggagtggc gcgcgaggaa 1620
gcggtagagc tcctcctggt tgcgcctgag ggtgggcagc acctgtggcg attgtagcat 1680
gccgttgggc acccccgtca gcaagttcat ggtggggttc ccgtccatgg gtcggtcggg 1740
ccagtgcacg aaggcatgca agaacatgca acagaagagt ccgcaggcgg cggagtcggg 1800
cccctgcacg gtctgggtgg actgttcgag gctaagacag cgatcgggcg aggaggccag 1860
ggcgcttcgg cgcagcatgg cctcgtactc gaagctgtaa atctgcttga gccggcggtc 1920
cgagaacccg aaggggtcga acatgtagca ggtgcgcgag cgcgggttcc agccaaaggc 1980
gagccagtgc acgcccccgg tctcgcggcc ggccgtgttg acgatggcgc aggccagctt 2040
gtcgccggcg aggaagcccg ggaagcgctt gtcgtgggtg cccaaaaagt agggcccgca 2100
gcccaggtcg cgcacgatgg ccgcgagctc tcgttcgctg gagccgctca tgcttaggtg 2160
gtggcgttgc cggcggagaa gggcgtgcgc aggtagacgg cctcgatgac gccgcggtgc 2220
ggctggtgca ctctgaccac gtcgaaaact tcgaagagaa gatagaggag ggtgggctca 2280
tccatggggt ccacctcgaa ggtcatgtcg agcgcgtggg ccgagttggc gtagagcatg 2340
ttctgaccca ggtcggtgag ggcgcccatg gacatgaagt tgctggagaa ggggatgcgc 2400
cacatgaccc tgtcgcagag gaactttttc tgggtgacgg atggcactgc ggtggagccg 2460
atgagcgggt aggggaagtt ggcggggtag ggctgcccct gacgcatggt gggtgccagg 2520
tagccggtga agccagagtt gttgtgctgg aagggcaggg tgactgcctt gtagtccttg 2580
tagttgatct catcgaccac ctgcctgctc atgggctgga agttgcggaa gaaggagtac 2640
atgcggtcct tgtagccctc gggcacatgg aagccctggt agccgatgtt gtagtgggag 2700
agcatctgga cgaggaacca gtccttggtc atgttgcatt gggccacgtt gtagccctcc 2760
ccgtcgacgc tgcgcttgat ctcgaactcg ttcggcgtaa gcagccggtc gttgccgggc 2820
cagctgaccg aggagtcgaa catgatggaa accttcttga aggtgtggtt gaggtagaag 2880
gtcccgtcga ggtaggggat ggagcccgag tagacaaagt aggggtcaaa acccgagcca 2940
agggagggag tttccttggt cttgagccgg gtgaaactcc agccgcggaa ggcggcccag 3000
ttgcgcgagg ggatggaaat gggcacgttg gtggccttgg ccgggatggg gtagagcatg 3060
ttggcggccg agaggtagtc gttgaaggac tggtcgttgg tgtcgttgcg cagcatggct 3120
tccagggtgg aggcggtgtt gtgcgccatg gggaagaagg tggcgtagag gttgacgctg 3180
tcgaagcgga cggaggcgcc gtcgacgcgc aggtcgtttc cgagggaact ctgcaggatc 3240
atgttgacat ccttgcggaa gttccactcg taggtgtagg agccggggag caggagcagg 3300
ttcttgatgg caaagaactt ttggggcact tggatgtgga agggcacgta gcggccattg 3360
cccaaaagca tggagcggta gcgcaggccc gcattgcggt ggtggttaaa ggggttgacg 3420
ttgtccatgg ggtccagcga ccagcgggcg ccgatgttaa tgtaggcgtc caccagcgag 3480
ggggctacca cgcggccgtt catgtactca taggtgttgg tgttggcggg cagcgtgacg 3540
ttggccggcg tgtacttgta ggagtcgggc aggtacaggg ccacgttcga gtacagaaaa 3600
ctcttccaca ggttggcctg gaggttgatc tccatggcaa agatgttgcc ctttccaatt 3660
tgattatggg ctgaaatgtc atcatccttt acccaatctc cattaactcc gcctcctgtt 3720
tgatcaggct ttagtttaac accttgatag gctgaattag tttgaacacc gtccaagggg 3780
aagcaatagt taggaagttc atcttccaca ccgtggttct caatgatcct gacatcggga 3840
tcatagctgt ccaccgcaga gttccacata ctaaaatatc tggttctgtc accaagagaa 3900
tctagcaaga gctggtaaga cagttcggtg tttctgtctt gcaagtcgac cacggcattc 3960
aactgagaag cctgaccagc cagcacaccc atgttgccag tgctgttgta gtacaatagc 4020
cccacaaagt tgtctctgaa gccaatgtag tttggtctgt taggcatgga ctgctgagtt 4080
aaattagctt cagaactgtc atcctctttg cctggtttgt acaccacatg tgtatctgga 4140
gtttccaaat ctacattttc agtgtacaac accacatctg gtatatttat agtgcttgag 4200
tcaaagaaag ccatgtccac atcgtattga ggatcggtac cattgggtgt ttctttcaat 4260
ttagcctgcc caccttcctt gtttgtgggt ttagcaaatg aaccatagca tggcttcatt 4320
ttggtatctt ttttaagagc cctgccgcca taatattcat cattatcctg ccagttttct 4380
tctccaactt gaggttctgg ctggaaagtt ttgtctgcat agattggttt ttcagcattt 4440
gctgttttgt cagttccaat ctgcaaaccg tctttagaaa tattactgcc tcccatggcg 4500
gcaagtccaa atgtctttgt aacatctttt tctgctccag ttcctccgtt ttgcttttct 4560
ttggtagtcc actgactggg attgggggcg cccttggggg ccaggctgtt gtaagccgtg 4620
cccgagtagg gtttgaagct tgggccgcgg tccaggacgc cgcggatgtc aaagtaagtg 4680
ctggccatgt ctagcacccg gttgtcgccc acggccagag tgaagcgcgc cttgtacgag 4740
tacgtggtgt cctcgcgatc cacgggcaca aagcgcagcg tcagacgctg ggaccggtcc 4800
gtggtcacat cgtgggtggg agccaccgtg gggttcctaa acttgttgcc caggctgaag 4860
tacgtgtcgg tggcgcgggc aaactgcacc agacccgggc tcaggtactc cgaggcgtcc 4920
tgcccggcga tgtgcatgta cgcccactgc ggcatcatcg agggggtggc catcttcgcg 4980
cgttctctgg cggtaaggca catacaagtt aagctctccc tttagtgtcc tctttactct 5040
ctctcaatag catcggcggc gcttcagact tttcactccc aggcccacga tactgtgcag 5100
cgtgctctgc cagttctggg cctggcggcg ggcggggacg cggcgcacgg cggtcgccac 5160
cggagggggc tgcacaaccg gagctgcttt tggtggagcg ggcgtgggtg gtggaggcag 5220
gtcaagggta gcgggtttca ttacacccgt ggccagcggc gcgatgatgc gcgtggtggg 5280
catgccggcc ttgacggcct cctcgtacga gggcggctcg tccacttgca ggattgtctc 5340
ctccgcgtcg ggccgcggtc gcttctcgcc cttgggcggc ggaagagttg catcttccat 5400
ctccaccacc gtgggcggcc gcgggtccag gcggctgttt atctcgcgct gcacggcctg 5460
gttcgcgatg tccaccaccc cgttaatgcc cgaggccagc ccgtccacca ccttttgctg 5520
gaagttctgg tctttgagct tttcccttaa caactgccca gtgctactat tccaggcctt 5580
gttcccatag gtccggagcg tcgagccgaa atttttaagc ccgctccaga cactgctcca 5640
attgaaggcg cccccgttca gctggctggt gccgatctcg ttccaggtgc ccatgaacgg 5700
ccgcgtgccg tgccgcggag ccagggacgc aaaattgatg tcttccattc taaaaatata 5760
caggaccagg tgtgtcagag tctaaagagg ctttattcgc acatcaacgg cgctgcgacg 5820
cctgcagcgc aacggaagct atgcccggga tcgtgccgat ggccgcggcg attatgggga 5880
tgagcgcggg cagaaagccg ccactcaggc gcctgcgcat ggcccgccgc cggcggcggt 5940
tcaggccact gcctgccatg cctctcctgc ggcgggatct tcctcggtaa ttcgggacgg 6000
ggatgcgcag gcggcaagtg agagccatct ctctgcaaca gtatcacagc acacggatta 6060
aaggatgctg gggtggtagc gcacggtggg cagaacgagc gagcggcccc gccgcgtggt 6120
cacgcggcgc acgcgggcgg gggccagacg gcggcgggtg gcggtgcggc ggcggcgttt 6180
gctggctggg cgcctgcggc tggcgtagta ccgggtgccg cggtagcctg gcgtcgggat 6240
gatggaagga tgcaacacgt agttgggcat cagccggctg gcggcgcccc atcttcgcct 6300
cctgggaggc tcggtagccg tggcggcggt agaagtggac gcggtagcgg tggaggctgg 6360
gagccagggg tcggtttgca cctcgatgct ggtcgagggt tttttgtcga catccatgtc 6420
ggtggggatc tgaatgtcca cggtttgcac gcccaggccc ggcgccacct gcttgatggg 6480
gcgcaccttg acctcgggct ccacatccat ttttacggtg tccagcacgt cctccacgcg 6540
ccggcgcttg ggcaccatga tctgcatggt cgggtacatg ctctcgccct cgcgcttgac 6600
cccgcggctc ggcagcagca ctgcctgggg cagcacctgc tgcagggtca cgggctttag 6660
gctcggcgtg gggttgcttt cgtccagcgg cagcgagatc agctcctctt cgcgcgaccg 6720
cttcccgtag gcgaactcgc ccgcccgctc cgccgcctgg tccaggatgt cgtcgtcgcc 6780
gtacacctcg tcatagctac gcttgctcct gaccgaggac cgctcgccgg gcgtgaacac 6840
caccgccgtg ccgggccgca acacacgctg caccctgcgc cccttccaat ttacgcgccg 6900
ccgcggagcg aactcgcgca caaactctac tgccccctcg tccacctcat cctttttttt 6960
aacccgcttg attttgcggg gtttctggtc cgcctggggt ggtccgtaaa tctccggggc 7020
gacgacctgg agcatctcct ccttgatttt gcgctttgac atcgtcgctt gcgggggagg 7080
acacaagcat tagatcaggg acgaggagga cgggtgcgca cgggcacgcg cacgcccgtg 7140
acggagtcgc gcacccagta cacgtttccg cgcctgggtc tggtcatgct agagatggcc 7200
gcggcggcgg cagcggccgc tcgtctgcga gtcctgcctg cgggggtggg tgcagtggca 7260
gcgcggcgcg cggctcgcat catggcccgg cggcccgtgc gtctggcgcg gcgcagcaga 7320
gctcgggcgg cgcgcatggc gggcgtgctc cggtggcgcc tggcgatccg tcgccgccgg 7380
ctcttgcgtc tggcatagtc acgcgcgtct gccaccacgc tgtcgatgac cgcgtccacg 7440
gtcgaggggg cgggggtgta gttgcgcgca tcggcgacca ccgagtcgat gacgtcgtcg 7500
acggtggtgc gcacggcggc aggagcagag gtccgccccc gcttgtaagc gccccaggga 7560
gcgcggaagt gaccgcggac gcggacgggg tgctgctggg agcgtttctt ggctcctccg 7620
tacatggtgc tgggcctagt aagaccccag ccggtgttat tgctgggcga gatgagaata 7680
gacatttttt agaaggtgcg actggaaagc acgcgcggcg cgactatgcc cagggccttg 7740
tagacgtagg gacaggtgcg gcgacgggcg tcagtgacgg tcactcgctg gactccgcgg 7800
atactgctgc gcagcggtag cgtcccgtga tctgtgagag caggcacgtt ttcactgacg 7860
gtggtgatgg tgggcgcggg cgggcggcaa aggatctggt tgtcggggaa gcggttgaag 7920
acgtgggtga gggaggtgta gctgcggatg agctgggagt agacggcgag gtcgttgtaa 7980
aagctcttgg cgcggaaggg catgagctcg gcgccgacca cggggtagtt gctgacttgc 8040
tgggtagagc ggaaggtgac ggggtcttgc atgaggtccg gcagcgacca gtagacttgc 8100
tccgcgccgc aggtgacgtc cggggtggtg agcagcgtcc acgactgcac ccccttctcg 8160
ggatccccgt aggtatagga caggtaccaa ctgcggtaca gggtgtctgt ggttccctcg 8220
atcacattgt agcttctgtc tgaatcatct ttcaaaatgg ccttcaactc aatttctttt 8280
cctgctgctt tggcttctgc cgctgatgca tagttatctc ctcttgggac ggcatcattc 8340
tgagccttaa tagtatttgc atctgctttg ccagcttctt ccttatcctt cagatactcc 8400
ttgacattca ggagagcggg gatgttgccc cctactaggt cctcatacat gattctgaag 8460
ccctcttgaa aaggttgctt cttgcgaatg cccaggaggt tgctcaggcg gctctcggtg 8520
aaatccaccc cgcagcccgg cagcagcacc acgtccgggt ggaaggcctc gtaggtgtag 8580
acccctggca tcaccagctt ggtcaccggg tcccagccca gcttgaaatt tctgctgtca 8640
aacttgactc cgatatcact ctccagcacg ccattttgcc gccccacttg caagtagttt 8700
tccaagatgg cgttgttcat taggtctatg gtcatggtct cggaaaagtt gccctcgggc 8760
agggtaaact caaaccactg atactctaag atatccttgc tcctatcatt tgcatcagcc 8820
ccttccgcct tttttctagc caccatcacc cgcgccttaa acttgctggt gaacatgtac 8880
tcgttcacat taggcatgtt ggtgtgcaga atggtcttca gatcaccgcc ccaccgcgac 8940
cgctcgtcaa aatttatcgt ctgcgtgctg gcctcggcag gggtgaaatc gttgttctgc 9000
accaccgtgg tcaggaagtt gctgtggtcg ttttggtagt tcagggaagc gatgtccgcc 9060
gacttgttgt ccaccaaata cacgcgagtg gtgtcgtaca gcggagccag ctccgagtaa 9120
cgaatgctgt ttctgccctc cgtaggagcc atataccgcg gaggcacaaa cggaacctcc 9180
agggtcgcct gcgccatcac gctctcgtac gagggaggag gagaggaaga caccaccgcg 9240
cgcctcatct ctaacaagga agagaacgca cgctatggcc ttggtgagtt ttattttgca 9300
ttcaaaacat ccgtcgcccc agtctgggct gcagatgcgc gaacgggttg gccccaccgc 9360
tcccgcccaa gtccaacacg ctgctatcgt cggccgagtc ctcgtcgtcc cacaccaggc 9420
cccgctgccg gtcgtgacgc tgtcgccgcg gcgcgggcgc aggttcccta tggtcctgag 9480
cgtaggtttt ccagcggttc agtttgtcca ccagactctc tatcccgtta ttgaccatgg 9540
cgttcttgac ccgcggcggc tgcagcagcg agtcgttcag gtactcgtcc tcgcccagca 9600
agcgcggccg gctcaccctg ccgctgttca ccgagcccgg caagctatgc aaactcccta 9660
agctaggaaa ggggctccga cccaccgcgc cctcgctcgc gggcgtgcgc accgcctcct 9720
ggcgcttttg caaggtcggt gagaacaccg cgctgtccac gtcgtcccac aaaaacccgt 9780
cgttggggtc aggcatgtcg tactcgcccg tgtagaaccc cggcggcggg agccagtgcg 9840
ggttcaagat ggcattggta aagtagtccg agttcatgga cgccgcgcgg tgcaggtagt 9900
ccatcagctt attaataaac ggccggttgg cggcgtacat gctaggttcc atgttgcgcg 9960
cggtcatgtc cagcgcggcg ctgggggtgg ccccctcctg catcaggaac agccctacgc 10020
tctgctgcac atatctcagg atgcgctcct cctcggccga cagcgcgtac tgcgccggga 10080
tcttctgctg tctattggtc agcaagaagt tcagggtggc cctcagactg tcggtgtcgt 10140
tctgacccag cgcgcggctc acgctagtga tctcctggaa ggtctgctca tccacctgcg 10200
cctggcctat ggcctcgcgg tacagcgtca gcaggtgacc caggtacgag ttgcggttca 10260
cgctgccact gtcggtgaag ggcgcgatca gcagcagcag cagccgcgag ttgggcgtca 10320
gcaagctgct caccgtcgac cggtcgccca cgggcgcctg cacgccccac agcccgcgca 10380
ggttcttgaa agcctgactc aggttcaccg tctgcaggcc ctgtctgctc gtctggaaaa 10440
agtagtccgg gcccgactgg tacacctcgc tctggggcac ctcggtcacc atcagccgca 10500
gcgcgcttat aaagttggta taatcatcct gcccgcgcgg cacgttcgcc ggctgcgtcg 10560
ccaggaaggc gttcagcgcc accagcgaac ccaggccctc gttcttgaac cgctcgcgct 10620
gcgccacggc ctcgcgcacg tccgtcacca gccggtccag gttggactgc acgtttgtgc 10680
tgttgtagcg gcccacgcgc tccagcaggg cgttgtacac tagcccggcc tcgtcgggac 10740
ggatggcctt gttctccgcc agcgcgttca cgatcgccag caccttctcg tgcgtggggt 10800
tggtccgaga aggaaccacc gcctccagaa tggccgagag tctgttggcc tgcggctgtt 10860
gtctaaagga ctcggggttg cgggtcgtca gggccatgat gcgttgcatc gcggcctccc 10920
agtcgtccga tgctagaccg gacggctggc tttgcagcgc cgcccttatg gcggggtccg 10980
gggcttgctg catctaaaaa cacatcacgg aggcgtcagt accccgcaac gggtgcatcc 11040
tcctcctctt cctcttcctc atccaagtcc tctggaccgt aggcggcctc caaggcgcgt 11100
cggctcggct gccaatgcag gtccgccccc atgtcaaagt aggactcctc accgccggtg 11160
gcgcctccta ccagcgcccg gcgcagactc agcatcagct cgcggtcgct cagctcgcgc 11220
cgccggcttg tgctcacggc cttgtggatg cggtcgttgc ggtacacgcc caggtcgtcg 11280
ctcagcgtca gcaccttgag cgccatgcgc atgtaaaagc tgtctatctt cacctccttg 11340
tctatgggca catacggcgt cttgtaaatc ttgcgcgcgt aaaacttgcc caggctcagc 11400
accgagtagt tgatcgccgc caccttctcg gccaggctca ggctgcgctc ctgcactacg 11460
atgctctgca agatgttaat cagctccagc agccagcgac cctcgggctc ggcgatgttc 11520
agcagtgcct ccctgaacgc ctcgttgtcc ctgctgtgct gcaccaccag gaacagctgt 11580
gccgtcagag gcttgctgtc cgggttctgc acgatggcct ccgccaggtc ccacaggtgc 11640
atcaggccca gggccacctc ctcgcgcgcg atcagggtgc gcacgtggtt gttgaaactc 11700
ttttggaagt tgcgctcctg cttcaccgtc tgctcgtagg ccgtcaccag gttggccgcc 11760
gccacgtgcg cgcgcgcggg gctgatcccc gtctgctcgt tcggctcgaa atcctcgtcg 11820
cgcagcacgc gctggcggtc caggccctcg cgcagctccc tgcccgcccg aaaccggcag 11880
tcgcgcatct cctcgggctc ctccccgctg cggtccctga acaggttctg cgcaggcacg 11940
tacgccgggc gcacgtcctt ctgcagctgc acgcggggat gtcgctccgg ggacggcgcc 12000
cccagtctcg ccagcccttc gccctcttcc aagtccatct ctgtctgtgg ctgtggctgg 12060
ctagcgccgg cgcctgctac ggccgcggtc gcggtggtcg ccgggggggt gggacgcatt 12120
tggcgcagga cgggatgcat ctggcaaaaa gaaaaaaggg ggctcgctcc cgtaactgga 12180
gaagtcggct ggctgtgggt ctttaaatcg gcggggtgac caagtcccgc tcgccgcggc 12240
cgtccttgaa ccgggttctg ccgcgactca accctggcga tgcttctcca gactacgggc 12300
gcgagccact acccggcagg gttttcggcc gctttcaagt ctagcgactc ccctcggccg 12360
acaaaaaggg ctctccgccg tatcctggcg gctatcgggc ttgggtcgag acgggagtgc 12420
caataccacg ttagtcgcgg ctccagcctg attcgagggg actcgaaccg gggtacacac 12480
gcggcctaac ccgtttgcgt tccgccaggc tacggaggaa gagcccgctc aaccgctttc 12540
gtttttgcct ctagagcatc aatgactgcg cgcgtctcac cggccagacc gtgccgacca 12600
tggactattt cctgcccctg cgcaacatct ggaaccgcgt ccgcgagttc ccgcgcgcct 12660
ccaccaccgc cgccggcatc acctggatgt cccgctacct ctacggctac caccgactca 12720
tgcttgagga cctggccccg ggcgcgccgg ccacccagcg ctggccgctc taccgccagc 12780
cgccgccgca ctttctagtc ggataccagt acctcgtgcg cacctgcaac gactatgtct 12840
tcgactcgcg cgccttctcg cggctcaggt actccgaggt cgtgcaaccc ggcctgcaga 12900
ccgtcaactg gtcgcttatg gccaactgca cttacaccat caacacaggg gcctaccacc 12960
gcttcgtcga catggacgac ttccaggaca ccctcacccg cgtgcaacag gccatcctcg 13020
ccgagcgcgt cgtcgccgac ctggcgctcg tgcagccgtt caggggcgtc ggggtcaccc 13080
gcatggaaga ctccgcctcc gccagtgatg acatcgagag gctcatgcat gactactaca 13140
agaacctgag ccggtgtcag ggccaggcct ggggcatggc cgagcggctc cgcatccagc 13200
aagcgggacc caaggacctg gtcctcctcg ccaccatccg ccgcctcaaa aacgcctact 13260
tcaattacat catcagcaac cgcaattcta acagcgtcca cagggctgct acgtgtttga 13320
gcttaccttg cgactgcgat tggctagacg ctttcctcga aagattctcc gatccggtcg 13380
atctcgacgc gctcacgtgc cctacaccgc aattgataag atgcattgtc agcgccctat 13440
cgctgcccaa cggggaccca ccccattacc gggagatgac cggcggcgtc ttcacgctgc 13500
gtcctcgcga acggggtcgc gccgtcaccg aaaccatgcg tcgccgccgc ggggagatga 13560
tcgagcgctt cgtcgaccgt ctcccggtgc gtcgccgtcg tcgtcgggcc ccgccaccac 13620
caccgccccc agaggaagaa atagaagaag aggtcgtcat ggaagaagag gaagaggagg 13680
aggcccccgg ggatttcgag cgcgaggtgc gcgccaccat cgccgaactc atcaggctcc 13740
tggaagacga gctcacggtc tcggcccgca acgcccagtt tttcaacttc gccgtggatt 13800
tctacgaggc catggaaagg ctggaggcca ttggcgacat cagcgaaatg cccctgcgcc 13860
gctggattat gtacttcttc gtcaccgagc acatcgccac caccctcaac tacctcttcc 13920
aacgcctgcg caactatgcc gtcttcgcgc ggcacgtgga gctcaacctc gcgcaggtgg 13980
tcatgcgcgc gcgcgacgcc gacggggacg tggtttacag ccgcgtctgg aacgagagcg 14040
gcctgggcgc cttctcgcag ctcatgggtc gcatctcgaa tgaccttgcc gccaccgtag 14100
agcgcgcggg ccgcggcgat ctccaggagg aggaaatcga gcagttcatg tccgagatcg 14160
cctaccagga caactcgggc gacgtgcaag agatcctgcg tcaggccgcc gtcaatgacg 14220
ccgagattga ttctgttgaa ctgtctttca ggttcaaagt cacggggccc gtggtcttca 14280
cgcaaaggcg gcagatccag gatgtcaacc gccgcgtcgt cgcgcacgcc agcgctctca 14340
gggcgcagca ccgggacctg cccgagcgcc acgccgacgt gcctctaccg ccactgcccg 14400
cggggccgga accgccgctg ccgccgggag cgcgtccgcg acaccgcttc taaaagcgca 14460
ccgcggcacg gtcgtggccc cgcgcagcta cgggctcatg caatgcgtgg acacgaccac 14520
caactcaccc gtggagatca agtaccatct gcatctcaag cacgccctca cccgcctcta 14580
cgaggtcaac ctcagaaccc tgcccccgga cctggatctc cgcgacacca tggacagctc 14640
ccaactgcgc gccctcgttt tcgctctccg cccccgccgc gccgagatct ggacctggct 14700
cccgcgcggg ctcgtcagcc tctccgtcct cgaggagccc cagggtgagt cccacgcagg 14760
cgaacatgaa aaccaccagc cagggccgcc actcctgaag ttcctcctca agggacgcgc 14820
tgtgtatctc gtggatgagg tacagcccgt gcagcgctgc gagtactgcg gacgctttta 14880
caagcatcag cacgagtgct cggttcgccg gcgggatttc tactttcatc acatcaacag 14940
ccactcgacc aactggtggc aggaaatcca gttcttccca atcggctctc atcctcgcac 15000
ggagcggctc tttgtcacct acgatgtaga aacctacacc tggatggggt ccttcggcaa 15060
gcagctcgtc cccttcatgc tggtcatgaa attctccggg gaccccgagc tggtcgccct 15120
cgctcgcgat ctcgccgtgc gcttacgctg ggatcgctgg gagcgggacc ccctcacctt 15180
ctactgcgtc accccagaaa agatggccgt gggccagcag ttccgcctct ttcgcgacga 15240
gctccagacc ctcatggccc gcgagctctg ggcttcattc atgcaagcca acccacatct 15300
ccaggagtgg gcgctcgagc agcacggcct gcaatgcccc gaggacctca cctacgagga 15360
actcaaaaag ctgccgcaca tcaaaggccg cccgcgattc atggaactct acatcgtcgg 15420
gcacaacatc aacggcttcg acgagatcgt cctcgccgcc caggtcatca acaaccgagc 15480
ctccgttccg ggccctttcc gcatcacccg caatttcatg ccgcgggcag gcaagattct 15540
cttcaatgac gtcactttcg ctctgcctaa ccccctctcg aagaagcgca ccgatttcga 15600
gctctgggag cacggcggct gcgacgactc ggatttcaag taccagttct tgaaagtcat 15660
ggttagggat accttcgccc tgacgcacac ctcgctccgc aaggccgctc aagcttacgc 15720
cctccccgtg gagaagggct gctgtcccta caaggccgtg aaccatttct acatgctggg 15780
ctcttaccgt gcggacgatc gaggattccc gctccgggag tactggaagg atgacgagga 15840
gtacgccctc aaccgcgcgc tgtgggagaa gaaagaagag gcgggttatg acatcatccg 15900
tgaaacgctg gactactgcg ccatggacgt ccttgtcacc gccgagctcg ttgccaagct 15960
gcaagactcc tacgcgcact tcatccgcga ctcggtccgc ttgccccacg cccactttaa 16020
catcttccaa cggcccacca tctcctccaa ctcgcatgcc atctttcgcc agatcgtctt 16080
ccgcgccgag cagccccagc gcaccaatct cggccccgct ttcttggccc cctcgcacga 16140
gttgtatgac tatgtgcgcg ccagcatccg cggggggcgc tgttatccca cctacatcgg 16200
catcctctcg gagcccatct atgtctacga catctgcggc atgtacgcct ccgccctcac 16260
gcatcccatg ccctggggtc cgcccctcaa cccctacgag cgagcgctgg ccgcccgcga 16320
gtggcagatg gccttggatg atgcatcctc aaaaatcgat tattttgaca aggaactctg 16380
tccgggcatc ttcaccatcg atgcggaccc ccctgacgag catctgcttg atgtgctgcc 16440
cccgttctgc tcgcgcaagg gcggacgcct ctgctggacc aacgagcccc tgcgcggcga 16500
ggtggccacc agcgtggacc tggtcaccct gcataatcgc ggctggcgcg tcaggatcgt 16560
gcccgacgag cgcaccaccg tcttcccaga atggaagtgt gtcgcgcgcg agtatgtcca 16620
gctcaacatc gcggccaagg agcgcgccga ccgtgacaaa aatcagacca tgagatccat 16680
cgccaagctt ctctccaacg ccctctatgg ctcctttgcc accaagcttg acaataaaaa 16740
aatagtcttt tctgaccaga tggatgaaag tctcctaaaa agcattgcgg cagggcaggc 16800
caacatcaaa tcctcctcgt ttctagaaac tgacaacctg agtgccgagg tcatgcccgc 16860
tctcgagagg gaatacctac cccaacagct ggcgctcgtg gacagcgacg cggaagagag 16920
tgaggacgag cacagacccg ccccctttta tacccccccg tcggggaccc ccggtcacgt 16980
ggcctacacc tacaagccaa tcaccttctt ggatgcggag gagggggaca tgtgtctgca 17040
cacggtggaa aaggtggacc ccctggtgga caacgaccgc tacccctcgc acgtggcctc 17100
ctttgtcttg gcgtggacgc gcgcctttgt ctcagagtgg tccgagtttc tctacgagga 17160
ggaccgcggg acgcccctgc aggacaggcc aatcaagtcc gtctacgggg acacagacag 17220
cctgtttgtc accgaacgcg gacacagact catggagacg cgaggtaaga agcgcatcaa 17280
aaagaacggg ggaaaactgg tttttgaccc cgagcagccc gagctcacct ggctcgtcga 17340
gtgcgaaacc gtctgcgccc actgcggagc ggacgccttc gctcccgagt ccgtctttct 17400
cgcacccaag ctctacgccc tgcaatccct cctctgtccc gcctgcgggc gctcttccaa 17460
aggcaagctc cgtgccaagg gccacgccgc cgaggccctt aactacaagc tcatggtcaa 17520
ctgctatctc gccgacgcgc agggcgaaga ccgtgcccgt ttcagcacca gcaggatgag 17580
tctcaagcgc acccttgcaa gcgcccagcc cggggcccac cccttcaccg tgacggagac 17640
caccctcact cggaccctga gaccctggaa ggacatgacg ctggccgcgc tggacgccca 17700
tcgtctcgtg ccctacagtc gcagtcgtcc caacccccga aacgaggaag tctgctggat 17760
cgagatgccg tagagcacgt caccgagcta tgggaccgcc tggagctcct ctcgcagacc 17820
cttgccaaga tgcccatggc cgacgggctc aagcccctga aaaactttgc ttccctgcaa 17880
gagctgctct cgctgggcgg ggaccgcctc ctcggcgagc tcgtccggga aaacctccaa 17940
gtgagagaca tgctcaacga ggtggccccc ctcctccggg acgacggcag ctgcatctcc 18000
ttgaactacc acctgcaacc cgtcatcggg gtcatctacg gcccgaccgg gtgcggcaag 18060
tcccagctgt taagaaacct gctctcctcg cagctcatca cccccgcccc ggaaaccgtt 18120
tttttcatcg ccccgcaggt ggacatgatc cccccctccg agatgaaagc ctgggagatg 18180
cagatctgcg aggggaactt cgccccgggg cccgagggaa cgatcgtccc ccaatctggc 18240
acccttcgcc ccaaattcat taaaatgtct tatgatgatc tcacccagga gcataattat 18300
gatgtctctg accccagaaa cgtttttgcc aaagccgcag cccacgggcc cattgccatc 18360
atcatggatg agtgcatgga aaacctgggc gggcacaagg gcgtctccaa attcttccac 18420
gcattccctt ccaagttgca tgataagttc cccaagtgca cgggctacac cgttctggtg 18480
gtcctgcaca atatgaaccc ccggcgggat ctgggtggca acatcgccaa cctcaagatc 18540
caggccaaac tgcacatcat ctccccccgc atgcatccct cccagcttaa ccgctttgcc 18600
aacacctaca ccaaggggct ccccgtggcc atcagtctcc tcctcaagga catcatccag 18660
caccacgccc agcgcccctg ctatgactgg attatctaca acacgacccc agagcacgag 18720
gccatgcagt ggtgctacct ccacccccgg gacgggctca tgcccatgta cctcaacatc 18780
caatcccacc tctaccgggt cctggaaaaa atccaccgca ctctcaatga tcgggagagg 18840
tggaccaggg cctaccgcgc gcgaaaaaat aaataa 18876
<210> 118
<211> 4574
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus D37 sequence
<400> 118
atgtcctatg gtgactcggc tgagctcgct cggttgaggc atctggacca ctgccgccgc 60
ctgcgctgct ttgcccggga gagctacggc ctcatctact ttgagctgcc cgaggagcac 120
cccaacggcc ctgcacacgg agtgcggatc accgtagagg gcaccaccga gtctcacctg 180
gtcaggttct tcacccagca acccttcctg gtcgagcggg accggggcgc caccacctac 240
accgtctact gcatttgtcc taccccgaag ttgcatgaga atttttgttg tactctttgt 300
ggtgagttta ataaaagcta aactcttgca atactctgga ccttgtcgtc atcaactcaa 360
cgagaccgtc tacctcacca accagactga ggtaaaactt acctgcagac cacacaagac 420
ctatatcatc tggttcttcg agaacacctc atttgcagtc tccaacactc actgcaacga 480
cggtgttgaa cttcccaaca acctttccag tggactgagt tacaatacac gtagagctaa 540
gctcatcctc tacaatcctt ttgtagaggg aacctaccag tgccagagcg gaccttgctt 600
ccacagtttt actttggtga acgttaccgg cagcagcaca gccgctccag aaactaacct 660
tccttctgat actatcaaac cttgtttcgg aggtgagcta aggcttcccc cttctcagga 720
gggggttagc ccatacgaag tggtcgggta tttgatttta ggggtggtcc tgggtgggtg 780
catagcggtg ctagctcagc tgccttgctg ggtggaaatc aaaatcttta tatgctgggt 840
aagacattgt ggggaggaac tatgaagggg ctcttgctga ttatcctttc cctggtgggg 900
ggtgtgctgt catgccacga acagccacga tgtaacatca ccacaggcaa tgagaggaac 960
gactgctctg tagttatcaa atgcgagcac cattgtcctc tcaacattac attcaaaaat 1020
aagaccatgg gaaatgtatg ggtgggattc tggcaaccag gagatgagca gaactacacg 1080
gtcactgtcc atggtagcaa tggcaatcac actttcggtt tcaaattcat ttttgaagtc 1140
atgtgtgata tcacactaca tgtggctaga cttcatggct tgtggccccc taccaaggat 1200
aacatggtgg gtttttcttt ggcttttgtg atcatggcct gcttgatgtc aggtctgctg 1260
gtaggggctc tagtgtggtt tctgaaacgc aagcccaggt atggaaatga agagaaggaa 1320
aaattgctat aaattctttt tctttttcgc agaaccatga atacagtgat ccgtatcgtg 1380
ctgctctctc ttcttgtagc ttttagtcag gcaggatttc atactatcaa tgctacatgg 1440
tgggctaata taactttagt gggaccccca gacacaccag tcacttggta tgatactcaa 1500
ggattgtggt tttgcaatgg cagtagagtt aagaatcctc aaatcagaca tacatgtaat 1560
gatcaaaacc ttactttgat ccatgtgaac aaaacttatg aaagaacata catgggttat 1620
aatagacaag ggactaaaaa agaagactac aaagttgtag ttataccacc tcctcctgct 1680
actgtaaaac cacagccaga gccagagtat gtgtttgttt atatgggaga gaacaaaact 1740
ctagaaggtc ctccgggaac tccagtcaca tggtttaatc aggatggaaa gaaattttgt 1800
gaaggagaaa aagttcttca tccagaattt aaccacacct gtgacaaaca aaaccttata 1860
ctactgtttg tgaattttac acatgatgga gcttaccttg ggtacaatca tcaaggaacc 1920
cagagaacac actatgaagt tacagtatta gatctttttc cagattctgg ccaaatgaaa 1980
attgaaaatc atagtgagga aacagagcaa aaaaatgatg aacatcataa ctggcagaaa 2040
cagggtgggc aaaaacaggg tgggcaaaaa acaaatcaaa caaaagttaa tgacaggaga 2100
aaaacagcgc aaaaaagacc atcaaagcta aagccggcaa ctattgaggc aatgctggtt 2160
acagtgactg ccgggtctaa cttaactttg gttggaccta aagcagaagg aaaagttact 2220
tggtttgatg gagatttaaa aagaccatgt gagcctaatt acagactaag acacgaatgt 2280
aataatcaaa acttaactct gattaatgta actaaagatt atgagggaac ttactatggt 2340
acaaatgaca aagatgaggg caaaaggtac agagtgaaag taaatactac aaattctcaa 2400
tctgtgaaaa ttcagccata taccagacaa actactcctg atcaagagca caaatttgaa 2460
ttacagttcg aaactaatgg aaattatgat tcaaaaattc cctcaaccac tgtggcaatc 2520
gtggtgggtg tgattgcggg cttcataact ctgatcattg tcttcatatg ctacatctgc 2580
tgccgcaagc gtcccagggc atacaatcat atggtagacc cactactcag cttctcttac 2640
taagactcag tcactttcat ttcagaacca tgaaggcttt cacagcttgc gttctgatta 2700
gcctagtcac acttagtgta gctattaaaa atcaatatca tgttcataat gttaccagag 2760
atggatatat cacattaaat gtaacaattg ataatactac ctggacaaga tatcatttaa 2820
ataagtggca tcaaatttgt acgtggtcag acccatcata caaatgtcac agcaatggca 2880
gcattaccat tcatgctttc aatattactt ctggccagta caaagctgaa agttttacta 2940
actggtttag atattacggt aatcataaac atgaaattca tatttttaac ataactgtaa 3000
ttgagcatcc tacaacaaaa gcacccacca ctgctaatac agctacatca attaaatcaa 3060
caaccacaca gcctactact agggagacaa ctcaacctac caccacagtc agtacaacta 3120
ctgagaccac tactcaaact acacagctag acacaacagt gcagaatagc actgtgttgg 3180
ttaggtatct gttgagggag gaaagtacta ctgaacagac agaggctacc tcaagtgcct 3240
ttagcagcac tgcaaattta acttcgcttg cttggactaa tgaaaccgga gtatcattga 3300
tgaatcatca gcctttctca ggtttggata ttcaaattac ttttctggtt gtttgtggga 3360
tctttattct tgtggttctt ctgtactttg tctgctgcaa agccagagag aaatctagga 3420
ggcccatcta caggccagta atcggggaac ctcagccact ccaagtggaa gggggtctaa 3480
ggaatcttct tttctctttt tcagtatggt gatcagccat gattcctagg ttcttcctat 3540
ttaacatcct cttctgtctc ttcaacatct gcgctgcctt tgcagccgtc tcgcacgcct 3600
cgcccgactg tctcgggccc ttcccaacct acctcctctt tgccctgctc acctgcacct 3660
gcgtctgcag cattgtctgc ctggtcatca ccttcctgca gcttatcgac tggtgctgtg 3720
cgcgctacaa ttatctccat cacagtcccg aatacaggga caagaacgta gccagaatct 3780
taaggctcat ctgaccatgc agactctgct catgctgcta tccctcctat cccctgccct 3840
agccacttat gctgattact ctaaatgcaa attcgcagac atatggaatt tcttagattg 3900
ctatcaggaa aaaattgata tgccctccta ttacttggtg attgtgggaa tagtcatggt 3960
ctgctcctgc actttctttg ccatcatgat ttacccctgt tttgatctcg gctggaactc 4020
tgttgaagca ttcacataca cactagaaag cagttcacta gcctccacgc caccacccac 4080
accgcctcct cgcagaaatc agttccccct gatacagtac ttagaagagc cccctccccg 4140
acccccttcc actgttagct actttcacat aaccggcggc gatgactgac caccacctgg 4200
acctcgagat ggacggccag gcctccgagc agcgcatcct gcaactgcgc gtccgtcagc 4260
agcaggagcg ggccgccaag gagctccttg atgccatcaa catccaccag tgcaagaagg 4320
gcatcttctg cctggtcaaa caggcaaaga tcacctacga gctcgtgtcc aacggcaaac 4380
agcatcgcct tacctatgag atgccccagc agaagcagaa gttcacctgc atggtgggcg 4440
tcaaccccat agtcatcacc cagcagtcgg gcgagaccaa cggctgcatc cactgctcct 4500
gcgaaagccc cgagtgcatc tactcccttc tcaagaccct ttgcggactc cgcgacctcc 4560
tccccatgaa ctga 4574
<210> 119
<211> 1098
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus D37 sequence
<400> 119
atgtcaaaga ggctccgggt ggaagatgac ttcaaccccg tctaccccta tggctacgcg 60
cggaatcaga atatcccctt cctcactccc ccctttgtct cctccgatgg attcaaaaac 120
ttcccccctg gggtactgtc actcaaactg gctgatccaa tcaccattac caatggggat 180
gtatccctca aggtgggagg tggtctcact ttgcaagatg gaagcctaac tgtaaaccct 240
aaggctccac tgcaagttaa tactgataaa aaacttgagc ttgcatatga taatccattt 300
gaaagtagtg ctaataaact tagtttaaaa gtaggacatg gattaaaagt attagatgaa 360
aaaagtgctg cggggttaaa agatttaatt ggcaaacttg tggttttaac aggaaaagga 420
ataggcactg aaaatttaga aaatacagat ggtagcagca gaggaattgg tataaatgta 480
agagcaagag aagggttgac atttgacaat gatggatact tggtagcatg gaacccaaag 540
tatgacacgc gcacactttg gacaacacca gacacatctc caaactgcac aattgctcaa 600
gataaggact ctaaactcac tttggtactt acaaagtgtg gaagtcaaat attagctaat 660
gtgtctttga ttgtggtcgc aggaaagtac cacatcataa ataataagac aaatccaaaa 720
ataaaaagtt ttactattaa actgctattt aataagaacg gagtgctttt agacaactca 780
aatcttggaa aagcttattg gaactttaga agtggaaatt ccaatgtttc gacagcttat 840
gaaaaagcaa ttggttttat gcctaatttg gtagcgtatc caaaacccag taattctaaa 900
aaatatgcaa gagacatagt ttatggaact atatatcttg gtggaaaacc tgatcagcca 960
gcagtcatta aaactacctt taaccaagaa actggatgtg aatactctat cacatttaac 1020
tttagttggt ccaaaaccta tgaaaatgtt gaatttgaaa ccacctcttt taccttctcc 1080
tatattgccc aagaatga 1098
<210> 120
<211> 429
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus D37 sequence
<400> 120
cctggggtac tgtcactcaa actggctgat ccaatcacca ttaccaatgg ggatgtatcc 60
ctcaaggtgg gaggtggtct cactttgcaa gatggaagcc taactgtaaa ccctaaggct 120
ccactgcaag ttaatactga taaaaaactt gagcttgcat atgataatcc atttgaaagt 180
agtgctaata aacttagttt aaaagtagga catggattaa aagtattaga tgaaaaaagt 240
gctgcggggt taaaagattt aattggcaaa cttgtggttt taacaggaaa aggaataggc 300
actgaaaatt tagaaaatac agatggtagc agcagaggaa ttggtataaa tgtaagagca 360
agagaagggt tgacatttga caatgatgga tacttggtag catggaaccc aaagtatgac 420
acgcgcaca 429
<210> 121
<211> 540
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus D37 sequence
<400> 121
ctttggacaa caccagacac atctccaaac tgcacaattg ctcaagataa ggactctaaa 60
ctcactttgg tacttacaaa gtgtggaagt caaatattag ctaatgtgtc tttgattgtg 120
gtcgcaggaa agtaccacat cataaataat aagacaaatc caaaaataaa aagttttact 180
attaaactgc tatttaataa gaacggagtg cttttagaca actcaaatct tggaaaagct 240
tattggaact ttagaagtgg aaattccaat gtttcgacag cttatgaaaa agcaattggt 300
tttatgccta atttggtagc gtatccaaaa cccagtaatt ctaaaaaata tgcaagagac 360
atagtttatg gaactatata tcttggtgga aaacctgatc agccagcagt cattaaaact 420
acctttaacc aagaaactgg atgtgaatac tctatcacat ttaactttag ttggtccaaa 480
acctatgaaa atgttgaatt tgaaaccacc tcttttacct tctcctatat tgcccaagaa 540
<210> 122
<211> 1560
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus D37 sequence
<400> 122
atgaggcgcg cggtggtgtc ttcctctcct cctccctcgt acgagagcgt gatggcgcag 60
gcgaccctgg aggttccgtt tgtgcctccg cggtatatgg ctcctacgga gggcagaaac 120
agcattcgtt actcggagct ggctccgctg tacgacacca ctcgcgtgta tttggtggac 180
aacaagtcgg cggacatcgc ttccctgaac taccaaaacg accacagcaa cttcctgacc 240
acggtggtgc agaacaacga tttcacccct gccgaggcca gcacgcagac gataaatttt 300
gacgagcggt cgcggtgggg cggtgatctg aagaccattc tgcacaccaa catgcctaat 360
gtgaacgagt acatgttcac cagcaagttt aaggcgcggg tgatggtggc tagaaaaaag 420
gcggaagggg ctgatgcaaa tgataggagc aaggatatct tagagtatca gtggtttgag 480
tttaccctgc ccgagggcaa cttttccgag accatgacca tagacctaat gaacaacgcc 540
atcttggaaa actacttgca agtggggcgg caaaatggcg tgctggagag tgatatcgga 600
gtcaagtttg acagcagaaa tttcaagctg ggctgggacc cggtgaccaa gctggtgatg 660
ccaggggtct acacctacga ggccttccac ccggacgtgg tgctgctgcc gggctgcggg 720
gtggatttca ccgagagccg cctgagcaac ctcctgggca ttcgcaagaa gcaacctttt 780
caagagggct tcagaatcat gtatgaggac ctagtagggg gcaacatccc cgctctcctg 840
aatgtcaagg agtatctgaa ggataaggaa gaagctggca aagcagatgc aaatactatt 900
aaggctcaga atgatgccgt cccaagagga gataactatg catcagcggc agaagccaaa 960
gcagcaggaa aagaaattga gttgaaggcc attttgaaag atgattcaga cagaagctac 1020
aatgtgatcg agggaaccac agacaccctg taccgcagtt ggtacctgtc ctatacctac 1080
ggggatcccg agaagggggt gcagtcgtgg acgctgctca ccaccccgga cgtcacctgc 1140
ggcgcggagc aagtctactg gtcgctgccg gacctcatgc aagaccccgt caccttccgc 1200
tctacccagc aagtcagcaa ctaccccgtg gtcggcgccg agctcatgcc cttccgcgcc 1260
aagagctttt acaacgacct cgccgtctac tcccagctca tccgcagcta cacctccctc 1320
acccacgtct tcaaccgctt ccccgacaac cagatccttt gccgcccgcc cgcgcccacc 1380
atcaccaccg tcagtgaaaa cgtgcctgct ctcacagatc acgggacgct accgctgcgc 1440
agcagtatcc gcggagtcca gcgagtgacc gtcactgacg cccgtcgccg cacctgtccc 1500
tacgtctaca aggccctggg catagtcgcg ccgcgcgtgc tttccagtcg caccttctaa 1560
<210> 123
<211> 2850
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus D37 sequence
<400> 123
atgtgcctta ccgccagaga acgcgcgaag atggccaccc cctcgatgat gccgcagtgg 60
gcgtacatgc acatcgccgg gcaggacgcc tcggagtacc tgagcccggg tctggtgcag 120
tttgcccgcg ccaccgacac gtacttcagc ctgggcaaca agtttaggaa ccccacggtg 180
gctcccaccc acgatgtgac cacggaccgg tcccagcgtc tgacgctgcg ctttgtgccc 240
gtggatcgcg aggacaccac gtactcgtac aaggcgcgct tcactctggc cgtgggcgac 300
aaccgggtgc tagacatggc cagcacttac tttgacatcc gcggcgtcct ggaccgcggc 360
ccaagcttca aaccctactc gggcacggct tacaacagcc tggcccccaa gggcgccccc 420
aatcccagtc agtggactac caaagaaaag caaaacggag gaactggagc agaaaaagat 480
gttacaaaga catttggact tgccgccatg ggaggcagta atatttctaa agacggtttg 540
cagattggaa ctgacaaaac agcaaatgct gaaaaaccaa tctatgcaga caaaactttc 600
cagccagaac ctcaagttgg agaagaaaac tggcaggata atgatgaata ttatggcggc 660
agggctctta aaaaagatac caaaatgaag ccatgctatg gttcatttgc taaacccaca 720
aacaaggaag gtgggcaggc taaattgaaa gaaacaccca atggtaccga tcctcaatac 780
gatgtggaca tggctttctt tgactcaagc actataaata taccagatgt ggtgttgtac 840
actgaaaatg tagatttgga aactccagat acacatgtgg tgtacaaacc aggcaaagag 900
gatgacagtt ctgaagctaa tttaactcag cagtccatgc ctaacagacc aaactacatt 960
ggcttcagag acaactttgt ggggctattg tactacaaca gcactggcaa catgggtgtg 1020
ctggctggtc aggcttctca gttgaatgcc gtggtcgact tgcaagacag aaacaccgaa 1080
ctgtcttacc agctcttgct agattctctt ggtgacagaa ccagatattt tagtatgtgg 1140
aactctgcgg tggacagcta tgatcccgat gtcaggatca ttgagaacca cggtgtggaa 1200
gatgaacttc ctaactattg cttccccttg gacggtgttc aaactaattc agcctatcaa 1260
ggtgttaaac taaagcctga tcaaacagga ggcggagtta atggagattg ggtaaaggat 1320
gatgacattt cagcccataa tcaaattgga aagggcaaca tctttgccat ggagatcaac 1380
ctccaggcca acctgtggaa gagttttctg tactcgaacg tggccctgta cctgcccgac 1440
tcctacaagt acacgccggc caacgtcacg ctgcccgcca acaccaacac ctatgagtac 1500
atgaacggcc gcgtggtagc cccctcgctg gtggacgcct acattaacat cggcgcccgc 1560
tggtcgctgg accccatgga caacgtcaac ccctttaacc accaccgcaa tgcgggcctg 1620
cgctaccgct ccatgctttt gggcaatggc cgctacgtgc ccttccacat ccaagtgccc 1680
caaaagttct ttgccatcaa gaacctgctc ctgctccccg gctcctacac ctacgagtgg 1740
aacttccgca aggatgtcaa catgatcctg cagagttccc tcggaaacga cctgcgcgtc 1800
gacggcgcct ccgtccgctt cgacagcgtc aacctctacg ccaccttctt ccccatggcg 1860
cacaacaccg cctccaccct ggaagccatg ctgcgcaacg acaccaacga ccagtccttc 1920
aacgactacc tctcggccgc caacatgctc taccccatcc cggccaaggc caccaacgtg 1980
cccatttcca tcccctcgcg caactgggcc gccttccgcg gctggagttt cacccggctc 2040
aagaccaagg aaactccctc ccttggctcg ggttttgacc cctactttgt ctactcgggc 2100
tccatcccct acctcgacgg gaccttctac ctcaaccaca ccttcaagaa ggtttccatc 2160
atgttcgact cctcggtcag ctggcccggc aacgaccggc tgcttacgcc gaacgagttc 2220
gagatcaagc gcagcgtcga cggggagggc tacaacgtgg cccaatgcaa catgaccaag 2280
gactggttcc tcgtccagat gctctcccac tacaacatcg gctaccaggg cttccatgtg 2340
cccgagggct acaaggaccg catgtactcc ttcttccgca acttccagcc catgagcagg 2400
caggtggtcg atgagatcaa ctacaaggac tacaaggcag tcaccctgcc cttccagcac 2460
aacaactctg gcttcaccgg ctacctggca cccaccatgc gtcaggggca gccctacccc 2520
gccaacttcc cctacccgct catcggctcc accgcagtgc catccgtcac ccagaaaaag 2580
ttcctctgcg acagggtcat gtggcgcatc cccttctcca gcaacttcat gtccatgggc 2640
gccctcaccg acctgggtca gaacatgctc tacgccaact cggcccacgc gctcgacatg 2700
accttcgagg tggaccccat ggatgagccc accctcctct atcttctctt cgaagttttc 2760
gacgtggtca gagtgcacca gccgcaccgc ggcgtcatcg aggccgtcta cctgcgcacg 2820
cccttctccg ccggcaacgc caccacctaa 2850
<210> 124
<211> 361
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus D37 sequence
<400> 124
Met Ser Lys Arg Leu Arg Val Glu Asp Asp Phe Asn Pro Val Tyr Pro
1 5 10 15
Tyr Gly Tyr Ala Arg Asn Gln Asn Ile Pro Phe Leu Thr Pro Pro Phe
20 25 30
Val Ser Ser Asp Gly Phe Lys Asn Phe Pro Pro Gly Val Leu Ser Leu
35 40 45
Lys Leu Ala Asp Pro Ile Thr Ile Thr Asn Gly Asp Val Ser Leu Lys
50 55 60
Val Gly Gly Gly Leu Thr Leu Gln Asp Gly Ser Leu Thr Val Asn Pro
65 70 75 80
Lys Ala Pro Leu Gln Val Asn Thr Asp Lys Lys Leu Glu Leu Ala Tyr
85 90 95
Asp Asn Pro Phe Glu Ser Ser Ala Asn Lys Leu Ser Leu Lys Val Gly
100 105 110
His Gly Leu Lys Val Leu Asp Glu Lys Ser Ala Ala Gly Leu Lys Asp
115 120 125
Leu Ile Gly Lys Leu Val Val Leu Thr Gly Lys Gly Ile Gly Thr Glu
130 135 140
Asn Leu Glu Asn Thr Asp Gly Ser Ser Arg Gly Ile Gly Ile Asn Val
145 150 155 160
Arg Ala Arg Glu Gly Leu Thr Phe Asp Asn Asp Gly Tyr Leu Val Ala
165 170 175
Trp Asn Pro Lys Tyr Asp Thr Arg Thr Leu Trp Thr Thr Pro Asp Thr
180 185 190
Ser Pro Asn Cys Thr Ile Ala Gln Asp Lys Asp Ser Lys Leu Thr Leu
195 200 205
Val Leu Thr Lys Cys Gly Ser Gln Ile Leu Ala Asn Val Ser Leu Ile
210 215 220
Val Val Ala Gly Lys Tyr His Ile Ile Asn Asn Lys Thr Asn Pro Lys
225 230 235 240
Ile Lys Ser Phe Thr Ile Lys Leu Leu Phe Asn Lys Asn Gly Val Leu
245 250 255
Leu Asp Asn Ser Asn Leu Gly Lys Ala Tyr Trp Asn Phe Arg Ser Gly
260 265 270
Asn Ser Asn Val Ser Thr Ala Tyr Glu Lys Ala Ile Gly Phe Met Pro
275 280 285
Asn Leu Val Ala Tyr Pro Lys Pro Ser Asn Ser Lys Lys Tyr Ala Arg
290 295 300
Asp Ile Val Tyr Gly Thr Ile Tyr Leu Gly Gly Lys Pro Asp Gln Pro
305 310 315 320
Ala Val Ile Lys Thr Thr Phe Asn Gln Glu Thr Gly Cys Glu Tyr Ser
325 330 335
Ile Thr Phe Asn Phe Ser Trp Ser Lys Thr Tyr Glu Asn Val Glu Phe
340 345 350
Glu Thr Thr Ser Phe Thr Phe Ser Tyr
355 360
<210> 125
<211> 143
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus D37 sequence
<400> 125
Pro Gly Val Leu Ser Leu Lys Leu Ala Asp Pro Ile Thr Ile Thr Asn
1 5 10 15
Gly Asp Val Ser Leu Lys Val Gly Gly Gly Leu Thr Leu Gln Asp Gly
20 25 30
Ser Leu Thr Val Asn Pro Lys Ala Pro Leu Gln Val Asn Thr Asp Lys
35 40 45
Lys Leu Glu Leu Ala Tyr Asp Asn Pro Phe Glu Ser Ser Ala Asn Lys
50 55 60
Leu Ser Leu Lys Val Gly His Gly Leu Lys Val Leu Asp Glu Lys Ser
65 70 75 80
Ala Ala Gly Leu Lys Asp Leu Ile Gly Lys Leu Val Val Leu Thr Gly
85 90 95
Lys Gly Ile Gly Thr Glu Asn Leu Glu Asn Thr Asp Gly Ser Ser Arg
100 105 110
Gly Ile Gly Ile Asn Val Arg Ala Arg Glu Gly Leu Thr Phe Asp Asn
115 120 125
Asp Gly Tyr Leu Val Ala Trp Asn Pro Lys Tyr Asp Thr Arg Thr
130 135 140
<210> 126
<211> 176
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus D37 sequence
<400> 126
Leu Trp Thr Thr Pro Asp Thr Ser Pro Asn Cys Thr Ile Ala Gln Asp
1 5 10 15
Lys Asp Ser Lys Leu Thr Leu Val Leu Thr Lys Cys Gly Ser Gln Ile
20 25 30
Leu Ala Asn Val Ser Leu Ile Val Val Ala Gly Lys Tyr His Ile Ile
35 40 45
Asn Asn Lys Thr Asn Pro Lys Ile Lys Ser Phe Thr Ile Lys Leu Leu
50 55 60
Phe Asn Lys Asn Gly Val Leu Leu Asp Asn Ser Asn Leu Gly Lys Ala
65 70 75 80
Tyr Trp Asn Phe Arg Ser Gly Asn Ser Asn Val Ser Thr Ala Tyr Glu
85 90 95
Lys Ala Ile Gly Phe Met Pro Asn Leu Val Ala Tyr Pro Lys Pro Ser
100 105 110
Asn Ser Lys Lys Tyr Ala Arg Asp Ile Val Tyr Gly Thr Ile Tyr Leu
115 120 125
Gly Gly Lys Pro Asp Gln Pro Ala Val Ile Lys Thr Thr Phe Asn Gln
130 135 140
Glu Thr Gly Cys Glu Tyr Ser Ile Thr Phe Asn Phe Ser Trp Ser Lys
145 150 155 160
Thr Tyr Glu Asn Val Glu Phe Glu Thr Thr Ser Phe Thr Phe Ser Tyr
165 170 175
<210> 127
<211> 519
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus D37 sequence
<400> 127
Met Arg Arg Ala Val Val Ser Ser Ser Pro Pro Pro Ser Tyr Glu Ser
1 5 10 15
Val Met Ala Gln Ala Thr Leu Glu Val Pro Phe Val Pro Pro Arg Tyr
20 25 30
Met Ala Pro Thr Glu Gly Arg Asn Ser Ile Arg Tyr Ser Glu Leu Ala
35 40 45
Pro Leu Tyr Asp Thr Thr Arg Val Tyr Leu Val Asp Asn Lys Ser Ala
50 55 60
Asp Ile Ala Ser Leu Asn Tyr Gln Asn Asp His Ser Asn Phe Leu Thr
65 70 75 80
Thr Val Val Gln Asn Asn Asp Phe Thr Pro Ala Glu Ala Ser Thr Gln
85 90 95
Thr Ile Asn Phe Asp Glu Arg Ser Arg Trp Gly Gly Asp Leu Lys Thr
100 105 110
Ile Leu His Thr Asn Met Pro Asn Val Asn Glu Tyr Met Phe Thr Ser
115 120 125
Lys Phe Lys Ala Arg Val Met Val Ala Arg Lys Lys Ala Glu Gly Ala
130 135 140
Asp Ala Asn Asp Arg Ser Lys Asp Ile Leu Glu Tyr Gln Trp Phe Glu
145 150 155 160
Phe Thr Leu Pro Glu Gly Asn Phe Ser Glu Thr Met Thr Ile Asp Leu
165 170 175
Met Asn Asn Ala Ile Leu Glu Asn Tyr Leu Gln Val Gly Arg Gln Asn
180 185 190
Gly Val Leu Glu Ser Asp Ile Gly Val Lys Phe Asp Ser Arg Asn Phe
195 200 205
Lys Leu Gly Trp Asp Pro Val Thr Lys Leu Val Met Pro Gly Val Tyr
210 215 220
Thr Tyr Glu Ala Phe His Pro Asp Val Val Leu Leu Pro Gly Cys Gly
225 230 235 240
Val Asp Phe Thr Glu Ser Arg Leu Ser Asn Leu Leu Gly Ile Arg Lys
245 250 255
Lys Gln Pro Phe Gln Glu Gly Phe Arg Ile Met Tyr Glu Asp Leu Val
260 265 270
Gly Gly Asn Ile Pro Ala Leu Leu Asn Val Lys Glu Tyr Leu Lys Asp
275 280 285
Lys Glu Glu Ala Gly Lys Ala Asp Ala Asn Thr Ile Lys Ala Gln Asn
290 295 300
Asp Ala Val Pro Arg Gly Asp Asn Tyr Ala Ser Ala Ala Glu Ala Lys
305 310 315 320
Ala Ala Gly Lys Glu Ile Glu Leu Lys Ala Ile Leu Lys Asp Asp Ser
325 330 335
Asp Arg Ser Tyr Asn Val Ile Glu Gly Thr Thr Asp Thr Leu Tyr Arg
340 345 350
Ser Trp Tyr Leu Ser Tyr Thr Tyr Gly Asp Pro Glu Lys Gly Val Gln
355 360 365
Ser Trp Thr Leu Leu Thr Thr Pro Asp Val Thr Cys Gly Ala Glu Gln
370 375 380
Val Tyr Trp Ser Leu Pro Asp Leu Met Gln Asp Pro Val Thr Phe Arg
385 390 395 400
Ser Thr Gln Gln Val Ser Asn Tyr Pro Val Val Gly Ala Glu Leu Met
405 410 415
Pro Phe Arg Ala Lys Ser Phe Tyr Asn Asp Leu Ala Val Tyr Ser Gln
420 425 430
Leu Ile Arg Ser Tyr Thr Ser Leu Thr His Val Phe Asn Arg Phe Pro
435 440 445
Asp Asn Gln Ile Leu Cys Arg Pro Pro Ala Pro Thr Ile Thr Thr Val
450 455 460
Ser Glu Asn Val Pro Ala Leu Thr Asp His Gly Thr Leu Pro Leu Arg
465 470 475 480
Ser Ser Ile Arg Gly Val Gln Arg Val Thr Val Thr Asp Ala Arg Arg
485 490 495
Arg Thr Cys Pro Tyr Val Tyr Lys Ala Leu Gly Ile Val Ala Pro Arg
500 505 510
Val Leu Ser Ser Arg Thr Phe
515
<210> 128
<211> 949
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus D37 sequence
<400> 128
Met Cys Leu Thr Ala Arg Glu Arg Ala Lys Met Ala Thr Pro Ser Met
1 5 10 15
Met Pro Gln Trp Ala Tyr Met His Ile Ala Gly Gln Asp Ala Ser Glu
20 25 30
Tyr Leu Ser Pro Gly Leu Val Gln Phe Ala Arg Ala Thr Asp Thr Tyr
35 40 45
Phe Ser Leu Gly Asn Lys Phe Arg Asn Pro Thr Val Ala Pro Thr His
50 55 60
Asp Val Thr Thr Asp Arg Ser Gln Arg Leu Thr Leu Arg Phe Val Pro
65 70 75 80
Val Asp Arg Glu Asp Thr Thr Tyr Ser Tyr Lys Ala Arg Phe Thr Leu
85 90 95
Ala Val Gly Asp Asn Arg Val Leu Asp Met Ala Ser Thr Tyr Phe Asp
100 105 110
Ile Arg Gly Val Leu Asp Arg Gly Pro Ser Phe Lys Pro Tyr Ser Gly
115 120 125
Thr Ala Tyr Asn Ser Leu Ala Pro Lys Gly Ala Pro Asn Pro Ser Gln
130 135 140
Trp Thr Thr Lys Glu Lys Gln Asn Gly Gly Thr Gly Ala Glu Lys Asp
145 150 155 160
Val Thr Lys Thr Phe Gly Leu Ala Ala Met Gly Gly Ser Asn Ile Ser
165 170 175
Lys Asp Gly Leu Gln Ile Gly Thr Asp Lys Thr Ala Asn Ala Glu Lys
180 185 190
Pro Ile Tyr Ala Asp Lys Thr Phe Gln Pro Glu Pro Gln Val Gly Glu
195 200 205
Glu Asn Trp Gln Asp Asn Asp Glu Tyr Tyr Gly Gly Arg Ala Leu Lys
210 215 220
Lys Asp Thr Lys Met Lys Pro Cys Tyr Gly Ser Phe Ala Lys Pro Thr
225 230 235 240
Asn Lys Glu Gly Gly Gln Ala Lys Leu Lys Glu Thr Pro Asn Gly Thr
245 250 255
Asp Pro Gln Tyr Asp Val Asp Met Ala Phe Phe Asp Ser Ser Thr Ile
260 265 270
Asn Ile Pro Asp Val Val Leu Tyr Thr Glu Asn Val Asp Leu Glu Thr
275 280 285
Pro Asp Thr His Val Val Tyr Lys Pro Gly Lys Glu Asp Asp Ser Ser
290 295 300
Glu Ala Asn Leu Thr Gln Gln Ser Met Pro Asn Arg Pro Asn Tyr Ile
305 310 315 320
Gly Phe Arg Asp Asn Phe Val Gly Leu Leu Tyr Tyr Asn Ser Thr Gly
325 330 335
Asn Met Gly Val Leu Ala Gly Gln Ala Ser Gln Leu Asn Ala Val Val
340 345 350
Asp Leu Gln Asp Arg Asn Thr Glu Leu Ser Tyr Gln Leu Leu Leu Asp
355 360 365
Ser Leu Gly Asp Arg Thr Arg Tyr Phe Ser Met Trp Asn Ser Ala Val
370 375 380
Asp Ser Tyr Asp Pro Asp Val Arg Ile Ile Glu Asn His Gly Val Glu
385 390 395 400
Asp Glu Leu Pro Asn Tyr Cys Phe Pro Leu Asp Gly Val Gln Thr Asn
405 410 415
Ser Ala Tyr Gln Gly Val Lys Leu Lys Pro Asp Gln Thr Gly Gly Gly
420 425 430
Val Asn Gly Asp Trp Val Lys Asp Asp Asp Ile Ser Ala His Asn Gln
435 440 445
Ile Gly Lys Gly Asn Ile Phe Ala Met Glu Ile Asn Leu Gln Ala Asn
450 455 460
Leu Trp Lys Ser Phe Leu Tyr Ser Asn Val Ala Leu Tyr Leu Pro Asp
465 470 475 480
Ser Tyr Lys Tyr Thr Pro Ala Asn Val Thr Leu Pro Ala Asn Thr Asn
485 490 495
Thr Tyr Glu Tyr Met Asn Gly Arg Val Val Ala Pro Ser Leu Val Asp
500 505 510
Ala Tyr Ile Asn Ile Gly Ala Arg Trp Ser Leu Asp Pro Met Asp Asn
515 520 525
Val Asn Pro Phe Asn His His Arg Asn Ala Gly Leu Arg Tyr Arg Ser
530 535 540
Met Leu Leu Gly Asn Gly Arg Tyr Val Pro Phe His Ile Gln Val Pro
545 550 555 560
Gln Lys Phe Phe Ala Ile Lys Asn Leu Leu Leu Leu Pro Gly Ser Tyr
565 570 575
Thr Tyr Glu Trp Asn Phe Arg Lys Asp Val Asn Met Ile Leu Gln Ser
580 585 590
Ser Leu Gly Asn Asp Leu Arg Val Asp Gly Ala Ser Val Arg Phe Asp
595 600 605
Ser Val Asn Leu Tyr Ala Thr Phe Phe Pro Met Ala His Asn Thr Ala
610 615 620
Ser Thr Leu Glu Ala Met Leu Arg Asn Asp Thr Asn Asp Gln Ser Phe
625 630 635 640
Asn Asp Tyr Leu Ser Ala Ala Asn Met Leu Tyr Pro Ile Pro Ala Lys
645 650 655
Ala Thr Asn Val Pro Ile Ser Ile Pro Ser Arg Asn Trp Ala Ala Phe
660 665 670
Arg Gly Trp Ser Phe Thr Arg Leu Lys Thr Lys Glu Thr Pro Ser Leu
675 680 685
Gly Ser Gly Phe Asp Pro Tyr Phe Val Tyr Ser Gly Ser Ile Pro Tyr
690 695 700
Leu Asp Gly Thr Phe Tyr Leu Asn His Thr Phe Lys Lys Val Ser Ile
705 710 715 720
Met Phe Asp Ser Ser Val Ser Trp Pro Gly Asn Asp Arg Leu Leu Thr
725 730 735
Pro Asn Glu Phe Glu Ile Lys Arg Ser Val Asp Gly Glu Gly Tyr Asn
740 745 750
Val Ala Gln Cys Asn Met Thr Lys Asp Trp Phe Leu Val Gln Met Leu
755 760 765
Ser His Tyr Asn Ile Gly Tyr Gln Gly Phe His Val Pro Glu Gly Tyr
770 775 780
Lys Asp Arg Met Tyr Ser Phe Phe Arg Asn Phe Gln Pro Met Ser Arg
785 790 795 800
Gln Val Val Asp Glu Ile Asn Tyr Lys Asp Tyr Lys Ala Val Thr Leu
805 810 815
Pro Phe Gln His Asn Asn Ser Gly Phe Thr Gly Tyr Leu Ala Pro Thr
820 825 830
Met Arg Gln Gly Gln Pro Tyr Pro Ala Asn Phe Pro Tyr Pro Leu Ile
835 840 845
Gly Ser Thr Ala Val Pro Ser Val Thr Gln Lys Lys Phe Leu Cys Asp
850 855 860
Arg Val Met Trp Arg Ile Pro Phe Ser Ser Asn Phe Met Ser Met Gly
865 870 875 880
Ala Leu Thr Asp Leu Gly Gln Asn Met Leu Tyr Ala Asn Ser Ala His
885 890 895
Ala Leu Asp Met Thr Phe Glu Val Asp Pro Met Asp Glu Pro Thr Leu
900 905 910
Leu Tyr Leu Leu Phe Glu Val Phe Asp Val Val Arg Val His Gln Pro
915 920 925
His Arg Gly Val Ile Glu Ala Val Tyr Leu Arg Thr Pro Phe Ser Ala
930 935 940
Gly Asn Ala Thr Thr
945
<210> 129
<211> 114
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 50 sequence
<400> 129
caatcaatat aatatacctt atagatggaa tggtgccaat atgtaaatga ggtaatttaa 60
aaaagtgcgc gctgtgtggt gattggctgc ggggtgaacg gctaaaaggg gcgg 114
<210> 130
<211> 114
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 50 sequence
<400> 130
ccgccccttt tagccgttca ccccgcagcc aatcaccaca cagcgcgcac ttttttaaat 60
tacctcattt acatattggc accattccat ctataaggta tattatattg attg 114
<210> 131
<211> 365
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 50 sequence
<400> 131
acatgctggg aggtgacgtg acttatgggg gaggagttat gttgcaagtt atcgcggtaa 60
aggtgacgta aaacgaggtg tggtttggac acggaagtag acagttttcc cacgcttact 120
gacaggatat gaggtagttt tgggcggatg caagtgaaaa ttctccattt tcgcgcgaaa 180
actgaatgag gaagtgaatt tctgagtcat ttcgcggtta tgacagggtg gagtatttgc 240
cgagggccga gtagactttg accgtttacg tggaggtttc gattaccgtg tttttcacct 300
aaatttccgc gtacggtgtc aaagtcctgt gtttttacgt aggtgtcagc tgatcgctag 360
ggtat 365
<210> 132
<211> 3431
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 50 sequence
<400> 132
ttaaacctgt cgagttccgt caagaggcca ctcttgagtg ccagcgagaa gagttttctc 60
ctccgcgccg cgagtcagtt ttgcgctttg aaaatgagac acctgcgatt cctgccacag 120
gagattatct ccagcgagac cgggatagaa atactggagt ttgtggtaaa taccctgatg 180
ggagatgacc cggaaccgcc agcgcagcct ttcgatccac ctacgctgca cgatctgtat 240
gatttagagg tagacgggcc ggacgatccc aatgaggaag ctgtaaatgg gttttttact 300
gattctatgc tactagctgc cgatgaagga ttggacataa accctcctcc tgagaccctt 360
gataccccag gggtggttgt ggaaagcggc agaggtggga taaaattgcc tgatctggga 420
gcagctgaaa tggacttgcg ttgttatgaa gagggttttc ctccgagtga tgatgaagat 480
ggggaaactg aacagtccat ccataccgca gtgaatgagg gagtaaaagc tgccagcgat 540
gtttttaagt tggactgtcc ggagctgcct ggacatggct gtaagtcttg tgaatttcac 600
aggaataaca ctggaatgaa agaactattg tgctcgcttt gctatatgag aatgcactgc 660
cattttattt acagtaagtg tatttaagtg aaatttaaag gaatagtgta gctgtttaat 720
aactgttgaa tggtagattt atgtttttac ttgtgatttt ttgtaggtcc tgtgtctgat 780
gatgagtcgc cttctcctga ttcaactacc tcacctcctg aaattcaggc gcccgtacct 840
gcaaacgtat gcaagcccat tcctgtgaag cctaagtctg ggaaacgccc tgctgtggat 900
aagcttgagg acttgttgga gggtggggat ggacctttgg accttagtac ccggaaactg 960
ccaaggcaat gagtgccctg cagctgtgtt tatttaatgt gacgtcatgt aataaaatta 1020
tgtcagctgc tgagtgtttt attgcttctt gggtggggac ttggatatat aagtaggagc 1080
agatctgtgt ggttagctta tagcaacctg ctgccatcca tggaggtttg ggctatcttg 1140
gaagacctga gacagactag gctactgcta gaaaacgcct cggacggagt ctctggcttt 1200
tggagattct ggttcggtgg tgatctagct aggctagtgt ttaggataaa acaggactac 1260
agggaagaat ttgaaaagtt attggacgac agtccaggac tttttgaagc tcttaacttg 1320
ggccatcagg ctcattttaa ggagaaggtt ttatcagttt tagatttttc tactcctggt 1380
agaactgctg ctgctgtagc ttttcttact tttatattgg ataaatggat ccgacaaacc 1440
cacttcagca agggatacgt tttggatttc atagcagcag ctttgtggag aacatggaag 1500
gctcgcagca tgaggacaat cttagattac tggccagtgc agcctctggg agtagcaggg 1560
atactgagac acccaccgac catgccagcg gttctggagg aggagcagca ggaggacaat 1620
ccgagagccg gcctggaccc tccggtggag gagtagctga cctgtttcct gaactgcgac 1680
gggtgcttac taggtctacg tccagtggac aggacagggg cattaagagg gaaaggaatc 1740
ctagtgggaa taattcaaga accgagttgg ctttaagttt aatgagccgt aggcgtcctg 1800
aaactgtttg gtggcatgag gttcagagcg aaggcaggga tgaagtttca atattgcagg 1860
agaaatattc actagaacaa cttaagacct gttggttgga acctgaggat gattgggagg 1920
tggccattag gaattatgct aagatatctc tgaggcctga taaacagtat agaattacta 1980
aaaagattaa tattagaaat gcatgctaca tatcagggaa tggggcagag gttataatag 2040
atacccaaga taaagcagct tttagatgtt gtatgatggg tatgtggcca ggggttgtcg 2100
gcatggaagc agtaacattt atgaatatta ggtttaaagg ggatgggtat aatggcattg 2160
tatttatggc taacactaag ctgattctac atggttgtag cttttttggg tttaataata 2220
cttgtgtaga agcttggggg caagttggtg tgaggggttg tagtttttat gcatgctgga 2280
ttgcaacatc aggtagggtc aagagtcagt tgtctgtgaa gaaatgcatg tttgagagat 2340
gtaatcttgg catactgaat gaaggtgaag caagggtccg ccactgcgca gctacagaaa 2400
ctggctgctt cattctaata aagggaaatg ccagtgtgaa gcataatatg atctgtggac 2460
attcgaatga gaggccttat cagatgctga cttgcgctgg tggacattgc aatattcttg 2520
ctaccgtgca tatcgtttcc catgcacgca agaaatggcc tgtatttgaa cataatgtga 2580
ttaccaagtg caccatgcac ataggtggtc gcaggggaat gtttatgcct taccagtgta 2640
acatgaatca tgtgaaggtg atgttggaac cagatgcctt ttccagagtg agcttaacag 2700
gaatctttga tatgaatatt caactatgga agatactgag atatgatgac actaaaccga 2760
gggtgcgcgc atgcgaatgc ggaggcaagc atgctagatt ccagccggtg tgcgtggatg 2820
tgactgaaga cctgagaccc gatcatttgg tgcttgcctg cactggagcg gagttcggtt 2880
ctagtggtga agaaactgac taaagtgagt agtggggcaa gatgtggatg gagactttca 2940
ggttggtaag gtggacagat tgggtaaatt ttgttaattt ctgtcttgca gctgccatga 3000
gtggaagcgc ttcttttgag gggggagtat ttagccctta tctgacgggc aggctcccat 3060
catgggcagg agttcgtcag aatgtcatgg gatccactgt ggatgggaga cccgtccagc 3120
ccgccaattc ctcaacgctg acctatgcca ctttgagttc gtcaccattg gatgcagctg 3180
cagccgccgc cgctactgct gccgccaaca ccatccttgg aatgggctat tacggaagca 3240
tcgttgccaa ttccagttcc tctaataacc cttcaaccct ggctgaggac aagctacttg 3300
ttctcttggc tcagctcgag gccttaaccc aacgcttagg cgaactgtct aagcaggtgg 3360
cccagttgcg tgagcaaact gagtctgctg ttgccacagc aaagtctaaa taaagatctc 3420
aaatcaataa a 3431
<210> 133
<211> 19668
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 50 sequence
<400> 133
atggccagcc gcggaggaaa tcagtcaagc gaccgccaac gggagcacac ccccgaacgc 60
ggaatgggct ctgccagcca tccgcctcca aggccggacc gcagcccatc tcagtcgcct 120
ccacctctgc ccccgaagag gaacacctac cgtcgcgtgg ggtccgattc ttctatcgag 180
agccaggtgg tactggtaag cgaaacttcg cggtcatccc tgtctccgga acggagcaac 240
agtcctcccc cgatccctcc caagaagaag cccaggaaga ccaagcatgt ccctctgcaa 300
gacatcagcc aggacagcga agaagaaaga gaacaggctc agttggtggc cgtgggcttc 360
agctaccccc cggtgcgcat cattgagaag gatggcaaga gaagtgttga gaagatcgac 420
aagaatgacc ctatagctaa aggagctact tctattgctg ttaggaatcc tttgagcttg 480
cccctggtat ctgcctggga gaagggcatg gaagtgatgg ctgtgctaat ggagaggtat 540
aggctggata atgacctgag aacctctttc aagctgatgc cagagcagca cgagcagtac 600
aagcgtatct gccaccagta tgtgaacgag gagcaccgtg gcatcccgct gacatttagt 660
agcatgaaga ccctgacagc gatgatggga agattcatgc agggattggt gcattcttat 720
tctgagatcg cccacaataa ttgggagtgc accgggtgcg ctctgtgggc tcatggatgc 780
accgattacg aaggcaaggt gaaatgcctg catggcacta tcatgatcca gaaggaccac 840
attatcgaga tggatgtggc gagcgaaaac gggcagcgcg ctatgaagga gaacccagac 900
agagccaaga tcacccagaa ccgctggggc agaaatgtgg tccagttggc caacaacgat 960
gcccgctgct gtgtgaatga tgccaactgt gctactaacc aattttccag caagtcctgt 1020
gggatgtttt acaccgaggg aagtaaggct caggaagctt tcaagcagta cgaagccttc 1080
atgaaggccg tgtacccagg gataaccccc gaccaagcca ggatgatgct gatccccatt 1140
cattgcgatt gcaaccacaa gccaggctgc gctcccgtga tgggcaggca gacctgtaag 1200
atgaccccct ttggaatggc caatgctgaa gacttggatg tgactaccat cagtgacccg 1260
accgtgctgg caagcgtgag acacccagcc ttgatggtgt tccagtgttg caacccagtg 1320
taccgcaact cccgtgtcca gaatgccggc cccaactgtg atttcaagat ctctgctcct 1380
gacctgcttg gcgccctgca actgaccaga aagttgtggc aagacacctt tcccgaaatt 1440
ccagttccca agctggtgat ccccgagttc aagtggcaga acaggttaca gttccgcaac 1500
gtctccctgc ccacgggtca ctctgactcc cgccagaacc catttgattt ctgagtgaat 1560
gatgaaaacg aatgagcaaa aaaccagagc cttagtgcat gtaaaaataa aatgcttttt 1620
attgaacacg gttttacatg acttattgca tatccatacg gtcaaacgcg gtggcccttt 1680
caatgcgtgc gcggtgagaa cgaaagtaag atgagtgggt gtttaggaag cgatatagcg 1740
cctcctggtt gcggcgcagg gtgggctgga cttggggtga ttggagcatg ctgtttgaca 1800
ccccagtcag caacttcatg gtggggtttc cgttcatggg gcggtcgggc cagtgcacaa 1860
aggcatgaag gaacatacag caaaaaagtc cacaggcggc tgagcgcggg ccctgcacgc 1920
tctgggtgga cttttccagg gtgatgcagc ggtctttggt agcaagggca ctgcggcgca 1980
ggagcccctc gtactcaaac tggtaaatct gtttgagtcg ctcatccgag aacccaaaag 2040
gatcaaaaag gtagcaggtg ttggagcgcg ggttccaacc aaaagccagc cagtgctctc 2100
cccccgtctc gcgtccggca gtgttgacta tggcgcaggc gagcttgtcg ggggccatga 2160
accccgggaa acgcttgtca aaggttccca ggaaataggg tccgcagccc aggtctcgga 2220
cgatggcttt gagctcttgc tcgctggagc cgtttccgga cccgcatgac atggctgcag 2280
ctgctgcttg caagaagcaa gaggcttctt atgtggtggc gttgccggcc gagaacggtg 2340
tgcgcaggta gacggcctcg atgacgccgc ggtgtggctg gtgcactctg accacgtcga 2400
agacttcgaa aagaagataa agcagggtgg gctcatccat gggatccacc tcaaaagtca 2460
tgtccagcgc atgggccgag ttggcataca gcaagttctg tcccaggtct gtaagggcac 2520
ccatggacat gaagttgcta gagaatggga tgcgccacat ggtcctgtcg cacaggaatt 2580
ttttctgggt gacactggtt actgcagtgg ttccaattag ggggtatggg tagttagcag 2640
ggtacgcttg accctgacgc atggtaggag ccatgtaacc cacaaagcca gagttattat 2700
gctggtaggg tacggcgaca gctttatagt ctttgtagtt aatctcatca accacctgtc 2760
tactcatggg ctggaagttt ctgaagaagg agtacatgcg atccttgtaa ccctcaggaa 2820
cgtagaagcc ctggtatcca atgttgtagt tggcaagcat ctggaccagg aaccagtctt 2880
tggtcatgtt acattgggcc acattgtagc cttccccatc aactgtgcgc ttgatttcga 2940
actcatttgg acttagcaat ctgtcattac caggccagct cactgaagag tcaaacatga 3000
tggagacttt cttgaaagtg tggttaaggt agaaggtacc atccaggtag ggtatagaac 3060
cagagtaaac aaagtaggga tcgaaccctg atcccaaaga gggagtctcc ttggttttga 3120
gtctggtgaa ggaccagcct ctgaaggcgg cccagttgcg agagggaatg gagatgggaa 3180
cgttggtagc gttggccggg atggggtaga gcatgttggc agcagaaagg tagtcattga 3240
atgattgatc attggtgtca ttgcgcagca tggcttcaag ggtggaggca gtgttgtggg 3300
ccatggggaa gaaggtggca tagagattga tgctggtaaa acttatgctg gcaccatcga 3360
cccggagatc attaccaagg gaactctgca ggaccatgtt cacatccttt ctgaagttcc 3420
actcgtaggt gtaagaaccg ggtagaagca gcaggttctt cacagcaaag aatttctgag 3480
gcacttgaat gtggaaaggc acgtaacgac cattgcccaa aagcatggac cggtatcgca 3540
ggccagcgtt gcggtgatgg ttaaaggggt tgacattgtc catggcatcc aaagaccatc 3600
tggcgccaat gtttacgtag gtatccacca gggatggggg aaccacccgc ccattcatgt 3660
agtcataagt gttggtgtta gttggaagag tgacattggc tggggtgtat ttgtaggagt 3720
ctgggagata cagagccaca ttggaataaa gaaaacttct ccagagatta gcttggaggt 3780
taatttccat ggcaaacgga tttcccttag caatttcact tatgcccttt ggctctaaat 3840
ctttccaagt agtggtttca tcaccatttg tctcaattcc cttgtaactg tctattcgcg 3900
gacctacacc atccaatgga aaacaatagt taggaagttc atcttccaca ccatggttct 3960
caataacacg cacatctggg tcatagctat ccactgcttg attccacata ctgaaatatc 4020
tggttctgtc ccccagagaa tcaagcaaga gttgatatga caattctgtg tttctgtctt 4080
gcaagtcaac cactgcattt agctgagacg cttgtccagc cagcactccc atgttgccag 4140
tactgttgta gtacatgagt ccgatgaagt tgtccctgaa gccaatatag ttaggtctat 4200
tgggcatgga ctgttgacca aggtttgcat gagagctagc atctgaagct ccaggtttgt 4260
acaccacatg agtgtcagga gtttctagat ccacattttc tgcatacatt acaattttag 4320
gcttgaggcc agtcatttgt gatcttaggt cgaaaaagtt catgtcaatg tcatattcaa 4380
ccttgccttc ttcttctttc ttcacttttg cctgcccgcc tttaacatta gtaggtttag 4440
cgaaagaccc gtagcagggt ttcattttag tttcaggttt aagtgctctg cctccatatt 4500
tttcatctgt gccatccgta tcagtccaag attcctctcc cacctgaggt tctggctgat 4560
acagtttatc agcataaatg ggtttagggc caccttcaga tggaacttcc aaacctattg 4620
gcagtccttc ttttgtaatt tcagcttcgg cttttactgg cgcattgcca aaagtgtatg 4680
tagcttgttg gtcgtcttcc ccatcctctt catctccctt attaagccac tgagatgtat 4740
tgggagcgcc cttaggggcc aatgagttgt aagcagtgcc agaatatggc ttgaagctag 4800
gacctctatc caacacaccc cgaatgtcaa agaaagtgct ggccatatcc agcactctgt 4860
tgtcgcccac agccaaggtg tatcgaactt tgtatgcgta ggtattgtct tcccggtcaa 4920
cgggcacaaa gcgcagcatc agccgctgac tgcggtcggt ggtcacatca tgggtgggcg 4980
ccacggtggg gttcctaaac ttgttcccca gattgaagta ggtgtctgtg gcgcgggcga 5040
actgcaccag acccggactc aggtactccg aagcatcctg tccggcgatg tgcatgtatg 5100
cccactgggg cagcatcgat ggggtggcca tcttgaaatc aactcagcct cggcgcgcga 5160
cctcttcctt gctcctctgc tgttgctgcg gcggcggcgt gatgatgaca catacacaca 5220
gacaggcaag ttaagcgcta ctccatattt aatttaaaag cagcgacggc gctttacact 5280
ttgcacgccc agacccacga tgctgttcag agtactctgc cagtttgcat tcggacgtgg 5340
agtgccccca ggacgcggtc tggctacggc gacgggctgt acggtggtgg gcttcggggt 5400
agcgacaggc ttgcgagcag gcgctgcaac agcaggggga ggcaagtcca aggtagcggg 5460
tcggtgtgac tgagaaggtt tcattacccc ggtagccatg ggggctacag gtctggtggt 5520
gggcattcca agcttcactg cctcctcgta ggagggcggg tcgtctgagc gtgtgactag 5580
tgtctcctcc agatcggggc gcggacgctt gtcgccccgc ttttcaaggg gagggagatc 5640
ttcctccact tccatttcac caggggctga cggcggcggg tcaaggcggc tgtttatctg 5700
tttctgcacg gcctggttgg ccagatccac caccccattg ataccagagg cgattccatc 5760
aaccaccttc tgttggaagt tttgctcttt aagcttattt ttcaatgcct gccctgtgct 5820
gctgttccaa gctttgttcc cataggtttt tatggtagag ccaaaatttt taagcccgct 5880
ccagatactg ctccaattga aggcgccccc gttcagttgg ctggtgccga tgtcgctcca 5940
ggtgcccatg tacggcctcg tgccgtgtcg cggagccagg gatgaaaaat tgatgtcttc 6000
catctctaca aaaacatagt cacaggacca ggagcatcag agtccattct gttttattta 6060
taagtttttc caatgtcagt ggcgctgcga ggcctgaacc gccacggaag ctatgcctgg 6120
tatcgccccg atcgccgcgg ctatgatggg gatcagagca ggcagaaagc caccccccag 6180
cctcttgctg atagcgcgcc gccgcctgtg gcgtcgcatt ccgcgcccca acatccctct 6240
tctacggcgc gagtttcttc ctcggtagcc agtaatgggg acacgaaggc ggcaagtgag 6300
ggccatatct gcaaggaggc agcggcaaca gttgttaagt tgtgatgctt ggatggtagc 6360
gtacgcgcgg taacgtcagg ggatccgcgc ggccatcgcg atacactctc cgcaccagag 6420
cagcgggagt cagattgctg gtggggcggc ggcgacgacg atgactacga cttgcaggtg 6480
ttttgcggcg acggcgggaa gtgctgctcc tgctgcggta gtagcgagtg cctcggtaac 6540
ccggagttgg aataatggat gggtgcagag cataatttgg catcagcaaa cttgctggac 6600
cgtactttcg ccgggatctt cgagtggtgt tgacagcagc tggagttgta acgggtgcgg 6660
tcatccaggg atccgtttgc acctcaatgg aggtggttgt gggctttgca ggttcggttt 6720
ggacttccat tgactcggtg ggaatcttga tgtctacggt ttgtactccc aaacctggcg 6780
ccacctgctt gatgggtctc actttgacct caggttgtat atcgggatcc actttcattt 6840
tctccagcac gtcctccagc cgctggcgct tgggcaccat caattgcata gtgggataca 6900
gatcctcacc ctctcgcttg ttgcctctgc gtggaggcac gggcagcact tgctgcaggg 6960
tgactggctt gagactaggg gtgggattcc cattgtccaa gggaatggac accgcctcct 7020
ccttggggct cgagcgggag cgcttgccat aagcaaactc gcccaggcgg tcggccgcct 7080
gctccagaat atcatcatcc ccatacacct catcatagga ccgcttaaaa gcagtgctgg 7140
agcgctcgcc gggcgtaaag accaccgtgg ttccaggtct cagcacaggc tgcactttgc 7200
gtccacgcca ctgcactcgc cgccttgggg cgaactcgcg tacaaactcc gccagaccat 7260
cattgccatc ttcttccttt ttgtcctttt tgacccgctt gattttgcgg ggcttttttt 7320
catccttcac cggcggaccg tagatttcag gcgcgatgac ctggagcatc tcttccttgt 7380
atttgcgctt ggacatcctc gctgggacac aacatcggag actgctcagt atcttctaag 7440
agcgaggggg gcgggtgcgc acgggcacgc gctggccggt ggtggcgtcg cgcacccagt 7500
acacattgcc tcttcgcggt tgggccatgt tggcaatggc cgctgctgcc gccgtggctg 7560
cgcgcctgcg ggacctgccg gcactggcac ctgaagccgc gcgtctggcc gctctaagca 7620
tagctcttcg ccccacgcgt ttggccctcc tcagcagagc tcttgccgct cgcatagcgg 7680
gagtagcccg gtggcgcctg gcgatgcgtc tccgcctgct cttccggcga gcataggcgc 7740
gggcgtcagc cactacgctg tcaataactg catccacagt agatgtaggt gcagtaggag 7800
tataattacg agcatcggcc accacctggt cgatcacatc atcgacggtg gttctagtgc 7860
gggtacgacc cttgagggcg ccccatggag cgcggaagtg cccgcgcacg cgcacagggt 7920
gctgtgtaga gcgtttgcga gcacctccgt acatcttgct tggcgcgcgc aggccccaac 7980
cggtgttatt actaggtgag ataagaatgg acattttttt ttagaaagtg cggcttgaaa 8040
ggacgcgcgg cgcgactatg cccagggcct tgtagacgta ggggcaggtg cggcgtctgg 8100
cgtcagtaac ggtcacgcgc tggactcccc ggatactgct gcgcaacggc agggtcccgt 8160
gatctgtgag agcaggaacg ttttcactga cggtggtaat ggtgggcgct ggcgggcgga 8220
tgaggatctg gttctcaggg aagcggttga agacgtgcgt gagcgaggtg gactggcgaa 8280
gctgctggga gtacacggct tgctcgttgt agaaactctt tgagaagacc ggcatgagct 8340
ctgcacctac cactggatag ttgctgactt gtctcgtgga acggaatgtg acagggtcct 8400
gcatcatgtc tgggagcgac cagtacacct gctctgctcc acaggtgaca tccgaggtgg 8460
tgagcagtgt ccaggaacgg actccttttt cagggtcacc atagttgtag gacaggtacc 8520
agctgcggta ggctgtattc actttatctt ccaagacatt gtaacttcta ctcttgctgt 8580
ctttttctac aggtttaata gtgagtttgg tctctgtagt ttcggccaca gcagccaata 8640
gcgattcttc agttgcaaca gatgaagctg tatagttgtc tcctctgact tcttcggcat 8700
tagccaccct tacagggtcg ctgacaacta tgttggcttt agcaatagca gcagctttag 8760
cggcttctgt tttggcttct cgttctttct tactgttctt ataggcttct acatccaaca 8820
gggccgggat attaccccct tcaagatcct catacaagat cttaaaaccc tcctggaatg 8880
ggtgtctttt cctgatacca agcaagttac taaggcgact ttcagtaaag tcaactccgc 8940
aaccaggcaa caatacaatg tcaggatgga atgcctcata ggtgtaaacc ccaggcataa 9000
tcaacttagt ttccggatcc caacccagtc taaagttcct ggtgtcaaat ttaacaccaa 9060
tgtcactctc caacactcca ttctgtctgc ccacttcaag gtaattatca atgatggcat 9120
tgttcattag gtcaatggtc attgtggctg agaagttccc ttccggtaga gtaaactcaa 9180
accactcata ttccaaaata tcctgcttgt gatcataatt gtcatctact gtgacacctt 9240
caggagcctt tctagacacc atcacccgag ctttgaactt gttgctaaac atgtactcgt 9300
tcacgttggg catgttggtg tgcatgatag tcttcagctg accgccccat cgcgaccgct 9360
cgtcaaagtt gatggtctgg gtgctggcct ccgtgggggt aaagtcattg ttttgcacca 9420
ccgtggtgag gaagttgctg tggtcgttct gatagttcag tgaggcgatg tccgcggact 9480
tgttgtccac caaatacaac cgggtggtat catacaatgg tgccagctcc gagtaacgaa 9540
tgctgtttct cccctccgta ggtgccaggt accgaggggg tacaaaggga gcctccagtg 9600
gtggctgcat cgccgccgcc gccgcctgct gcatcacgct ctcgtacgaa ggaggaggac 9660
cctccggata caccaccgct ccgcctagca cggttcgcct catcatacta gctataacag 9720
agaagaaacg aacgcacgct ggtcgccatg gccttggtga gtatttattt tcggtttctt 9780
acatcaggcg cccgacgcgg gggcgcaggt gagcgaacgg gttaccacca ctcccaccca 9840
agtccaacac gctgctgtcg tcggcggaat catcatcggc ccacaccagg ccccgctgcc 9900
tgtcgtgcca ctggcgttta cgggtagcga tgccccggct atcccccagc gcccggggat 9960
cgtccctgtg atcgtgcgcg tacgtcttcc agcggttcat tttgtcaacc aagctttcta 10020
tcccgttgtt ggggaaattc ttctccctct cgggtctcaa cagggagtcg ttcaaatact 10080
cctcctcgcc gatcaagcga ggacgggtta ttcttcccag ctcactgctg cgtacactgt 10140
ttagcgaaaa tggcaaacta gggaaaggac ttgcggcctc gggagccgct gcagcacccg 10200
ttgctccgga cagtgacacg gaagagtgcc ttctatcgcc accttccttc ttccaagtgt 10260
tataaccagg aggcggggag aaaacactac tgtccacatc gtcccataaa aacccgtcat 10320
tggggtcggg catgtcatac tcgcccgtat agaacccagg tgggggcagc caatgggggt 10380
tcaggatagc attggtgaaa taatcagagt tcatagcagc cgccctgtgt aagtagtcta 10440
gcagtttatt gataaaaggc cggttactgg catacatgct gggctccatg tttcgggctg 10500
tcatatcgag cgcagcagta ggagtcgccc cctcctgcat taggaacagt cccacgctct 10560
gctgcacgta tctcaggatc cgttcctcct ccgcggtaag cgaatactga ggagggatct 10620
tctgcgaccg gttggtcagc aagaagttta aggtggcttc caagctgcca gtgtcctccc 10680
gacccagagc gcggctcact tgggtaattt cttgataggt ttgctcatct acctgagttt 10740
gccctatggc ctcgcgatac aggttcaaca gatagcccaa gtacgaatta cggtcgatgc 10800
taccgctgtc agtgaatggg gctaccaaga gcagtagtag gcgggagttg ggggtcagca 10860
agctagacac ggtcgcccga tctcccactg gggcgcgcac tccccacaga ccattcaggt 10920
tcttaaaagc ctggctcagg ttcactgtct gcaagccctg tctgctggtc tggaaaaagt 10980
agtctggccc ggactggtac acttcgcttt gagggacttc ggccaccatg agtctcaatg 11040
cacttagaaa gtttgtgtag tcttgctgac cgcgaggcac gttggcaggc tgagtgctga 11100
ggaaggcgtt caaagccacc agcgacccta aattggcgtc tcgctggaac cgctcgcgct 11160
gagacacggc ctcgcgcaca tcggtcacca tccggtccag gttggtctgc acgttgctgc 11220
tgttgtaacg ggctacgcgc tccaataggg cattgtatac cagcccagcc tcatcgggac 11280
gtatggcttt gttctccacc agcgcgttca cgatggccag gaccttctcg tgtgtggggt 11340
tggagcggga gggcactacg gcctccagga tggcagaaag gcggttggcc tggggttgct 11400
gtctaaaggc ttcggggttg cgggtcgtca gcgccatgat gcgttgcatg gcctggctcc 11460
aatcgtccga ggagttaatg ccggacggct ggctctgtag cgccgcccgt tttgcggggt 11520
ccggtgcctg ctgttccatc tagcaaaaat atggatggtc gcgccatcag tcttccagat 11580
actcgccctc ctcatcctgg ccttcatcca cctcttctat gtaaggaagc tcataccctg 11640
ctgcgtccag ggccctgcga ctgggctgcc actgcaagtc cgctcccatg tcaaagtagt 11700
tttccccctc ggttccagcc ccagtcagag ctctttgcaa gctgtgcata agttctctgt 11760
cgctcagctc acgccttctg ctggcgctca ctgcgcggtg catcctgtcg ttgcggtaca 11820
ctcccagatc gtcactcaag gtcagcacct tgagagtcat gcgcatataa aacccatcta 11880
tcttcacctc cttgtctata ggtacgtatg gggttttgta gatcttgcga gcgtagtgct 11940
tgcccaggct caagaccgag tagttaatag cagccacctt ctcagctaga cccaggctac 12000
gttcttgcac gattatactt tgcagaatat tgataagatc atacaaccat ctcccctcgg 12060
gctcagtaat gttcaacagc gcctccctaa atgcctcatt gtctctacta tgttgcacca 12120
ccagaaacag ctgagcggtt agaggtttgc tggtggggtt ctgggtaatg gcttccatca 12180
ggtcccacag gtgcatcaga cccagtgtca cttcctcgcg ggcaatcagg gtgcgcacat 12240
ggttgttgaa agatttttga aagttgcgct cctccttcac ggtctgctcg taagctgata 12300
ctaggttggc cgcggccaca tgtgccctag caggacttat tcctgtcact tcatcgactt 12360
caaaatcatc atcacgcagc acccgtcttc ggtccagacc gtgacgcagt tcgcgacccg 12420
cgttaaagcg ggaagctcgc atttcctcag gctcctcgcc gctcctgtcc ctgaacaggt 12480
tctgctgggg cacgtacgcc tcgcgagagt cctttttcag ttgcacccgc gggtgccgct 12540
cgggcgatgg tgcgcccagg cgcgccagtc cctcgccctc ttccaagtcc agatcatagg 12600
cgggctgccc cgcgccgctg acggctgcag ccgcagtagt tacaggagca ggaagagcct 12660
tttgtggctg ttgttgtagc tgctgctgag aagggggctg ttgctggggg cgcatctgtc 12720
gcagcacggg atgcatctgg gcaacaaaaa aacaaaaaaa gagggctcgc tcccgtaaac 12780
tggagaagtc ggctggcggg gtcttagaaa tgacgaggct gccaaaccct cgcttgtcgc 12840
ggaaaccggc cgatccggcg cgctaagact cgaaccgggg cacaccgcaa cgcaaccctg 12900
gcgattgatt ctccagacta cgggcgcgag ccactcccag ccccgagaac tgagtgttct 12960
aaagcttgac gcagcattgg ctcccatcca ggaaaaagcc aaaaaaaaaa aaacgacccg 13020
cctccgtatc ctggaggttt tgtgcaggcc tgggtcgaga cgggagtgcc agtaccacgt 13080
tagctgcggc tccagcctga tccgagattc gaaccggggt acacgcgcag cccaacccgt 13140
tcgcttagcc tccaggccac ggagacgagc cgctgaccgc tttcgttttt gcccgtatgt 13200
ctagagcatc aacgactgtg cacgtctcac gggccaaacc gtgcctacca tgaactactt 13260
catgccgctg cgcaacatct ggaaccgcgt acgcgagttc ccgcgggcat ccaccaccgc 13320
ctccggtatc acctggatgt ccaggtacat ctacggttat caccgcctca tgctggaaga 13380
cctcgcccct ggcgccccgg ctacagagcg atggccccta taccgccagc cgccgccgca 13440
ctttctcatc ggctaccagt acctggtgcg cacctgtaac gattacatct ttgacacccg 13500
cgcatactcg cgccttaagt ataccgagct tgtgcgccct gggcaccaga cagtcaactg 13560
gtcagtcatg gccaactgct cctacacaat caacaccggg gcttaccacc gcttcgtgga 13620
ctttgacgac ttccaagcca ccctcaccca ggtgcagcaa gccatcctcg cagaaagggt 13680
tgtagcggac ctggcacttg tccagcccat gcgcgggttc gggatcactc gcatgcatgg 13740
cagagcgggc gaagaagaag tgcccgtgga acgactcatg caagactact ataaagatct 13800
ggccagatgt caggataatg cttggggaat ggcccatcgc ctgcgcatcc aacaagccgg 13860
acccaaagac ctggtgctcc tcgccaccat ccgccgtctc aaaactgcct attttaattt 13920
catcaccagc agcatcgtct caccctccaa agaggaggaa ggagaagaaa gagagaaccc 13980
cgaccgagcg tctagccgcc cccgcccgca agaaacagtg ctcagcctac cttgcgattg 14040
cgactggtta gacgctttcg tcgaaaggtt ttcagatccc gtggatcttg agacgatcag 14100
gtccttgcgc ggagtaccta cggggcaatt aataaaatgc ataatcagcg cggtgtccct 14160
gcccaacgga gagcctccca gtcaccactt cagggagatg cgcggaggcg tcttcactct 14220
gagacccagg gagaacggtc gtgccgtcac cgagaccatg cgccgccgcc gcggagaggt 14280
cattgaaaga ttcatcgacc gtctgcccgt gcgccgccgg cgtcgccgcg ttccccctcc 14340
tcctgcagcc ccacctgaag aggaagagat gttagtggaa gaagaagaga ttgaggaaga 14400
aatcccaggg gctttcgagc tcgaggtgcg caccaccatc gccgaactca tccgtctttt 14460
ggaagaagag ttgaccgtgt ccgcgcgtaa ctcccagttt ttcaactttg ccgtggactt 14520
ctacgaggcc atggagcgct tggaagcgct gggcgatgtc agcgagatgc cgctgagacg 14580
atggatcatg tatttcttcg tcaccgagca catcgccacc acactcaact accttttcca 14640
gcgcctatgc aactatgcgg tcttcacccg ccacgtggag ctcaacctcg cccaggtggt 14700
catgcgcgcg agagatcccg tgggggctgt ggtctacagc cgcgtctgga acgaggcggg 14760
catgaatgca ttctctcaac tcattgggcg tatctccaac gacctcgcgg ccaccgtcga 14820
gagagcgggc cgcggagatc ttcaagagga agagatcgag cagttcatgg ccgagatcgc 14880
ctaccaggac aactctggcg acgtgcaaga aatccttagg caagccgccg tcaacgatac 14940
cgagattgat tctgttgaac tctctttcag gttcaagctc acggggccgg tagctttcac 15000
ccagaggcgt cagatccagg atgtcaaccg ccgcgtcgtg gcgcatgcga gtcttctgag 15060
ggcgcagtac cagaacctac ccgcgcgcgg cgccgacgta ccactgccgg ccatgccgcc 15120
gggtcccgaa ccgcccctgc cgcccggtgc gcgccctcga caccgcttct aaacatgcaa 15180
gaagcaacag agccaccgcc gcccaaaagg aaaaacaagg gcacggtggt agcgcccaag 15240
gggcacggaa ccctgcaagc catcgacatc tccaccaacg gacccgtgga gatcaagtac 15300
catctgaacc tccctcacgc cctcgaaaag atcatgcaag tcaatctcct gacactgcct 15360
actaacctga ctccgcagcg tctcaggacc ctggacagct ccggcctgcg cgctctcgtc 15420
ctcgagctcc gcccctgccg cgccgaggtc tggacttgcc tcccgcgagg gctcgtcagc 15480
atgaccacca tcgagacaga agatggtcat gccgatgcag acaacatagt agagcgcgag 15540
gtacaatcgc caggcctcaa ttttccactg aaatttctcg tcaaaggaag tcaggtacaa 15600
ctcattcatg aggtgcatcc cgtgaatcga tgcgagtact gcggccgtct gtacaagcac 15660
aagcatgaat gctcggcgcg tcgcagggag ttctacttcc atcacatcaa cagccattcc 15720
tccaactggt ggcaggagat ccagttcttc ccgattggct ctcatcctcg cacagaaagg 15780
ctcttcctca cctacgatgt ggaaacctac acctggatgg ggtcctttgg caagcagcta 15840
atccccttca tgctggtcat gaaactctct ggagaccagc ggctcgtcaa catcgcctat 15900
gacctggcca taaaactcaa gtgggatcgc tggcggcagg acccccaaac cttctattgc 15960
gtcaccccag aaaagatggc agtcgggcag cattttcgtc agtaccggga ccagttacaa 16020
acagcactgg cagtggacct ctggtcctcc ttcctcaaag cgaaccctca cgtgcacgaa 16080
tgggccctcg aacactatgc tctcactgac cctacagacc tcacttttga agaactcaag 16140
aagctgcctc atgtcagggg cacccctcga ttcttagaac tgtacatagt ggggcacaac 16200
atcaatggct ttgatgagat cgtcttggcc gctcaggtta tcaataaccg agcagaggtc 16260
cctcagcctt tcagaatcac ccgaaatttc atgcccaggg ccggcaagat cctcttcaat 16320
gatgttactt tcgctttgcc caaccccgcc tacaagaagc gggtggactt ccaactctgg 16380
gaacaggggg cctgtgatga catcgacttc aagtatcaat tcctcaaagt catggtcagg 16440
gacacttttg ccctcactca tacctcgctg cgcaatgcag cccaagcata ctctctccca 16500
gtggagaagg gatgctgtcc ctacaaggca gtcaatcagt tctacatgtt gggctcttac 16560
cgtgcagaaa aagacgggtt tcccctcgaa gagtactgga aggatcgcga agaatacctt 16620
ctcaaccgcg agctgtggga aaagaaaagc caaccgcgtt atgacatcat ccaggaaact 16680
ctcgactact gtgccctgga cgtactcgtc accgccgagc tggtagccaa gctgcaagag 16740
tcatatgccc acttcataag ggactctgta ggcctacctc atgcccattt taacatattc 16800
cagagaccta ctatctcttc caattcccat gccatctttc gccagatcgt ttacagggcg 16860
gaaaaaccca accgcaccaa tctgggcccg ggtcttctcg ccccctcaca tgaactctat 16920
gactatgtgc gagcaagcat cagagggggg cgctgttatc ccacttacat cggcatcctc 16980
gaagagcccc tctatgtcta cgatatctgt ggcatgtatg cctccgcgct cacccacccc 17040
atgccctggg gcacccctct taacccctac gagcgcgcgc tggcagttcg agaatggcag 17100
atgaccttgg atgatcccgc caccatcagc tattttgaca aagatttgct accgggaata 17160
tttaccatag atgcggaccc ccctgatgag ttcatgctag accccctccc ccctttctgt 17220
tcaagaaaag gaggtcgact ctgctggacc aatgagcccc tccgaggcga ggtagccacc 17280
agtgtggatc tgataaccct gcacaatagg ggatggcgag tcagaatagt tccggatgaa 17340
ctgacaacca tcttccctga atggaaatgt gtggcgcgcg agtacgtcca gcttaacatc 17400
gccgccaagg agcgcgcgga caaggaaaag aaccaaacca tgcgctccat cgccaagctt 17460
ctatccaatg ccctctatgg atcatttgcc accaagctgg ataacaagaa gattgtgttt 17520
tctgaccaga tggacgagag tcttatgaaa ggcatctctg ctggtactgt caatatcaaa 17580
tcctcctcgt tcctagaaac tgacaacctg agtgcagagg tcatgcccgc cttcgagaga 17640
gaatacctac cccaacagct ggcgctcctg gacagtgatc cggaagacag tgaggacgaa 17700
cagaggcccg cccactttta tacccccccg gcggggaccc ctggtcacgt ggcctacact 17760
tacaagccaa tcacattctt ggatgtggag gagggggaca tgtgtttaca taccgtagag 17820
aaggtggacc ccctggttga caacgaccgc tacccctccc acgtggcctc ctttgtgctg 17880
gcctggacac gcgcttttgt atcagagtgg gctgggttcc tctacgaaga ggaccgaggc 17940
actccgctcg aggacaggcc cataaagtcg gtctacgggg acacggacag cctctttgtc 18000
acccagcggg gacacgaact catggaaacc aaaggtaaga aacgcatcaa aaaacatggc 18060
ggaaaacttg tttttgaccc cgatgagccg gatctgacct ggctcgtgga gtgcgaaacc 18120
gtctgcgcct cctgcggtgc ggatgcatac tcccccgaat ccattttcct cgcgcccaag 18180
ctgtatgccc tcaaatgtat ctactgcccc gcctgccata aaacttccaa aggtaagctc 18240
cgtgccaaag gccacgcggc cgaggcgctc aactacgaac tcatggtaaa ctgctacctg 18300
gccgacatgc agggcgccga tcggcagcgg ttctcgacca gcaggatgag tctgaagcgc 18360
accctcgcaa gcgcccaacc aggcgcgcac cccttcaccg tgacggaaac aaccctgact 18420
cggacgctgc gaccatggaa ggatcggacc ctagcagcgc tggacgctca tcgtctgatt 18480
ccctactcca ggagccgtcc caacccgcga aacgaggagg tctgctggat cgagatgcca 18540
tagagcacat caccgagctc tgggaccggc tcgagctctt gcaacagact ctttccaaaa 18600
tgcccatggc tgacgggctg aaaccgttga aaaacttctc ctcgctccag gagcttctat 18660
cccttggggg agagcgcctc ctaacggact tggtgcggga aaatatccat gtaagggaaa 18720
tgatgaacga agtggccccc ctgctccggg aggacggcag ctgtcgctcc ctaaactacc 18780
atctgcaacc cgtaattggg gtcatttacg gtcccactgg gtgcggcaag tctcagctgc 18840
ttaggaattt gctctcatcc cagttaatca ccccggctcc agaaacggta ttttttatag 18900
ccccgcaggt ggacatgatc cccccctcgg aactgaaagc ctgggaaatg caaatatgtg 18960
agggaaacta tgctcccggg ccagagggaa ctttcatccc ccaatctggc accctccgcc 19020
caaagtttat taaaatggct tatgatgacc tgactcagga gcataactat gatgtttcag 19080
acccccggaa cgtgttcgcc cgtgccgctg cccacggccc catcgctatc attatggatg 19140
agtgcatgga gaatctgggg ggtcacaaag gcgtctccaa attttttcat gcttttccct 19200
ctaagctgca tgataaattt cccaagtgca ccggatacac tgtcttggtg gttctgcaca 19260
atatgaaccc gagacgggat ctaggcggca acattgccaa cctcaagatc cagtccaaaa 19320
tgcatataat ttcccccagg atgcacccgt cccagctcaa cagatttgta aacacctaca 19380
ctaagggcct ccccgttgca attagtctgc tcctaaaaga tattgtgcaa caccatgcac 19440
tccgaccttg ctatgactgg gtgatttata acactacccc ggagcaagag gctcttcaat 19500
ggagctatct ccacccccga gacggactaa tgcccatgta tctaaacatt caatcccacc 19560
tttacagggt actggaaaag atccaccgag ttctcaatga tcgagaccga tggtccaggg 19620
cataccgcgc gcgaaaaacc aaataaacat tcatttgttt ttataaca 19668
<210> 134
<211> 4121
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 50 sequence
<400> 134
tataaaacgc ctggtgatca gaggccgagg tatccagctc aacgacgagt cggttagctc 60
ttcgcttggt ctgcgaccag acggagtctt ccagatcgcc ggctgtggga gatcttcctt 120
cactcctcgt caggctgtgc tgactttgga gagttcgtcc tcgcagcccc gctcgggcgg 180
catcggaact ctccagtttg tggaggagtt tactccctct gtctacttca accccttctc 240
cggctctcct ggccagtacc cggacgagtt cataccgaac ttcgacgcaa tcagcgagtc 300
agtggatggc tatgattgat gtctaatggt ggcgcggctg agctagctcg actgcgacac 360
ctagaccact gccgccgctt tcgctgtttc gcccgggaac tcaccgagtt catctacttc 420
gaactctccg aggagcaccc tcagggtccg gcccacggag tgcggattac catcgaaggg 480
ggaatagact ctcgcctgca tcgcatcttc tcccagcggc ccgtgctgat tgagcgcgac 540
cagggaaata caaccatctc catctactgc atctgtaacc accccggatt gcatgaaagc 600
ctttgctgtc ttgtttgtgc tgagtttaat aaaaactgag ttaagacctt cctacggact 660
accgcttctt caatcaggac tttacaacac caaccagatc ttccagaaga cccagaccct 720
tcctcctctg atccaggact ctaactctac cttaccagca ccctccacta ctaaccttcc 780
cgaaactaac aagcttggat ctcatctgca acaccgcctt tcacgaagcc ttctttctgc 840
caatactacc actcccaaaa ccggaggtga gctccgcggt cttcctactg acgacccctg 900
ggtggtagcg ggttttgtaa cgttaggatt agttgcgggt gggcttgtgc taatcctttg 960
ctacctatac acaccttgct gtgcatattt agtcatattg tgctgttggt ttaagaaatg 1020
ggggccatac tagtcgtgct tgctttactt tcgcttttgg gtctgggctc tgctaatctc 1080
aatcctcttg atcacaatcc atgtctagac ttcgacccag aaaattgcac acttactttt 1140
gcacccgaca caagccgtct ctgtggagtt cttattaagt gcggatggga ctgcaggtcc 1200
gttgaaatta cacataataa caaaacatgg aacaatacct tatccaccac atgggagcca 1260
ggagttcccg agtggtatac tgtctctgtc cgaggtcctg acggttccat tcgcattagt 1320
aacaacactt tcattttttc tgaaatgtgc gatctggcca tgtttatgag caaacagtat 1380
gacctatggc ctcctagcaa agagaacatt gtggcatttt ccattgctta ttgcttggta 1440
acatgcatca tcactgctat catttgtgtg tgcatacact tgcttatagt tattcgccct 1500
agacaaagca atgaggaaaa agagaaaatg ccttaacctt tttcctcata ccttttcttt 1560
acagcatggc ttctgttaca gctctaatta ttgccagcat tgtcactgtc gctcacgggc 1620
aaacaattgt ccatattacc ttaggacata atcacactct tgtagggccc ccaattactt 1680
cagaggttat ttggaccaaa cttggaagtg ttgattattt tgatataatt tgcaacaaaa 1740
ctgaaccaat atttgtaatc tgtaacagac aaaatctcac gttaattaat gttagcaaaa 1800
tttataacgg ttactattat ggttatgata gatccagtag ccaatataaa aattacttag 1860
ttcgcataac tcagcccaaa tcaacagtgc caactatgac aataattaaa atggctaata 1920
aagcattaga aaattttaca ttaccaacaa cgcccaatga aaaaaacatt ccaaattcaa 1980
tgattgcaat tattgcggcg gtggcattgg gaatggcact aataataata tgcatgttcc 2040
tatatgcttg ttgctataaa aagtttcaac ataaacagga tccactacta aattttaaca 2100
tttaattttt tatacagatg atttccacta caatttttat cattactagc cttgcagctg 2160
taacttatgg ccgttcacac ctaactgtac ctgttggctc aacatgtaca ctacaaggac 2220
cccaagaagg ctatgtcact tggtggagaa tatatgataa tggagggttc gctagaccat 2280
gtgatcagcc tggtacaaaa ttttcatgca acggaagaga cttgaccatt attaacataa 2340
cattaaatga gcaaggcttc tattatggaa ccaactataa aaatagttta gattacaaca 2400
ttattgtagt gccagccacc acttctgctc cccgcaaatc cactttctct agcagcagtg 2460
ccaaagcaag cacaattcct aaaacagctt ctgctatgtt aaagcttcga aaaatcgctt 2520
taagtaattc cacagcagct cccaatacaa ttcctaaatc aacaattggc atcattactg 2580
ccgtggtagt gggattaatg attatatttt tgtgcataat gtactacgcc tgctgctata 2640
gaaaacatga acaaaaaggt gatgcattac taaattttga tatttaattt tttatagaat 2700
tatgatattg tttcaatcca atgccactaa cactatcaat gtgcagacta ctttaaaaca 2760
tgacatggaa aaccacacta cctcctatgc atacacaaat attcagccta aatacgctat 2820
gcaactagaa atcaccatac taattgtaat tggaattctt atactatctg ttattcttta 2880
ttttatattc tgccgtcaaa tacccaatgt tcatagaaat tctaaaagac gtcccatcta 2940
ttctcctatg attagtcgtc cccatatggc tctgaatgaa atctaagatc tttttttttc 3000
ttttacagta tggtgaacat caatcatgat tcctagaaat ttcttcttca ccatactcat 3060
ctgtgctttc aatgtctgtg ctactttcac agcagtagcc actgcaagcc cagactgtat 3120
aggaccattt gcttcctatg cactttttgc ctttgttact tgcatctgcg tgtgtagcat 3180
agtctgcctg gttattaatt ttttccaact ggtagactgg atctttgtgc gaattgccta 3240
cctacgtcac catcccgaat accgcaatca aaatgttgcg gcacttctta ggcttattta 3300
aaaccatgca ggctatgcta ccagttattt taattctgct actaccctgc attgccctac 3360
cttccaccgc cactcgcgct acacctgaac aacttagaaa atgcaaattt caacaaccat 3420
ggtcatttct tgattgctac catgaaaaat ctgattttcc cacatactgg atagtgattg 3480
ttggaataat taacatactt tcatgtacct ttttctcaat cacaatatac cccacattta 3540
attttgggtg gaattctccc aatgcactgg gttacccaca agagctagat gaacatatcc 3600
cactacaaca catacaacaa ccactagcat tggtagagta tgaaaatgag ccacaacctt 3660
cactgcctcc tgctattagt tacttcaacc taaccggcgg agatgactga aatactcacc 3720
acctccaatt ccgccgagga tctgcttgat atggacggcc gcgcctcaga acagcgactc 3780
gcccaactac gcatccgcca gcagcaggaa cgcgtgacca aagagctcag agatgtcatc 3840
caaattcacc aatgcaaaaa aggcatattt tgtttggtaa aacaagccaa gatatcctac 3900
gagatcaccg ctactgacca tcgcctctct tacgaacttg gcccccaacg acaaaaattt 3960
acatgcatgg tgggaatcaa ccctatagtt atcacccagc aaagtggaga tactaagggt 4020
tgcattcact gctcttgcga ttccaccgag tgcacctaca ccctgctgaa gaccctatgc 4080
ggcctaagag acctgctacc catgaattaa aaattaataa a 4121
<210> 135
<211> 972
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 50 sequence
<400> 135
atgaccaaga gagtccggct cagtgattcc ttcaaccctg tctaccccta tgaagacgaa 60
agcacctccc aacacccctt tataaaccca gggtttattt ccccaaatgg ctttacacaa 120
agcccagacg gagttcttac tttaaattgt ttaaccccac taacaaccac aggcgggcct 180
ttacagttaa aagtgggagg gggacttata gtggatgaca ctgatgggac cttacaagaa 240
aacatacgtg ttacagcacc cattactaaa aataatcatt ctgtagaact atccattgga 300
aatggattag aaacacaaaa caataaacta tgtgccaaat tgggaaatgg gttaaaattt 360
aacaacggtg acatttgtat aaaggatagt attaacacct tatggactgg aataaagcct 420
ccacctaact gtcaaatagt ggaaaacact gatacaaacg atggcaaact tactttagta 480
ttagtaaaaa acggaggact tgttaatggc tacgtatctc tagttggtgt atcagacact 540
gtgaaccaaa tgttcacaca aaagtcagca accatacaat taagattata tttcgactct 600
tctggaaatc tattaactga tgaatcaaac ttaaaaattc cacttaaaaa taaatcttct 660
acagcaacca gtgaagctgc aaccagcagc aaagccttta tgccaagtac tacagcttat 720
ccctttaaca ccactactag ggatagtgaa aactatattc atggaatatg ttactatatg 780
actagttatg atagaagtct agttccctta aacatttcta taatgctaaa cagccgtacg 840
atttcttcca atgttgccta tgccatacaa tttgaatgga atctaaatgc aaaagaatct 900
ccagaaagca acatagctac gctgaccaca tccccctttt tcttttctta tattagagaa 960
gacgacaact aa 972
<210> 136
<211> 273
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 50 sequence
<400> 136
gacggagttc ttactttaaa ttgtttaacc ccactaacaa ccacaggcgg gcctttacag 60
ttaaaagtgg gagggggact tatagtggat gacactgatg ggaccttaca agaaaacata 120
cgtgttacag cacccattac taaaaataat cattctgtag aactatccat tggaaatgga 180
ttagaaacac aaaacaataa actatgtgcc aaattgggaa atgggttaaa atttaacaac 240
ggtgacattt gtataaagga tagtattaac acc 273
<210> 137
<211> 570
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 50 sequence
<400> 137
ttatggactg gaataaagcc tccacctaac tgtcaaatag tggaaaacac tgatacaaac 60
gatggcaaac ttactttagt attagtaaaa aacggaggac ttgttaatgg ctacgtatct 120
ctagttggtg tatcagacac tgtgaaccaa atgttcacac aaaagtcagc aaccatacaa 180
ttaagattat atttcgactc ttctggaaat ctattaactg atgaatcaaa cttaaaaatt 240
ccacttaaaa ataaatcttc tacagcaacc agtgaagctg caaccagcag caaagccttt 300
atgccaagta ctacagctta tccctttaac accactacta gggatagtga aaactatatt 360
catggaatat gttactatat gactagttat gatagaagtc tagttccctt aaacatttct 420
ataatgctaa acagccgtac gatttcttcc aatgttgcct atgccataca atttgaatgg 480
aatctaaatg caaaagaatc tccagaaagc aacatagcta cgctgaccac atcccccttt 540
ttcttttctt atattagaga agacgacaac 570
<210> 138
<211> 1683
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 50 sequence
<400> 138
atgaggcgaa ccgtgctagg cggagcggtg gtgtatccgg agggtcctcc tccttcgtac 60
gagagcgtga tgcagcaggc ggcggcggcg gcgatgcagc caccactgga ggctcccttt 120
gtaccccctc ggtacctggc acctacggag gggagaaaca gcattcgtta ctcggagctg 180
gcaccattgt atgataccac ccggttgtat ttggtggaca acaagtccgc ggacatcgcc 240
tcactgaact atcagaacga ccacagcaac ttcctcacca cggtggtgca aaacaatgac 300
tttaccccca cggaggccag cacccagacc atcaactttg acgagcggtc gcgatggggc 360
ggtcagctga agactatcat gcacaccaac atgcccaacg tgaacgagta catgtttagc 420
aacaagttca aagctcgggt gatggtgtct agaaaggctc ctgaaggtgt cacagtagat 480
gacaattatg atcacaagca ggatattttg gaatatgagt ggtttgagtt tactctaccg 540
gaagggaact tctcagccac aatgaccatt gacctaatga acaatgccat cattgataat 600
taccttgaag tgggcagaca gaatggagtg ttggagagtg acattggtgt taaatttgac 660
accaggaact ttagactggg ttgggatccg gaaactaagt tgattatgcc tggggtttac 720
acctatgagg cattccatcc tgacattgta ttgttgcctg gttgcggagt tgactttact 780
gaaagtcgcc ttagtaactt gcttggtatc aggaaaagac acccattcca ggagggtttt 840
aagatcttgt atgaggatct tgaagggggt aatatcccgg ccctgttgga tgtagaagcc 900
tataagaaca gtaagaaaga acgagaagcc aaaacagaag ccgctaaagc tgctgctatt 960
gctaaagcca acatagttgt cagcgaccct gtaagggtgg ctaatgccga agaagtcaga 1020
ggagacaact atacagcttc atctgttgca actgaagaat cgctattggc tgctgtggcc 1080
gaaactacag agaccaaact cactattaaa cctgtagaaa aagacagcaa gagtagaagt 1140
tacaatgtct tggaagataa agtgaataca gcctaccgca gctggtacct gtcctacaac 1200
tatggtgacc ctgaaaaagg agtccgttcc tggacactgc tcaccacctc ggatgtcacc 1260
tgtggagcag agcaggtgta ctggtcgctc ccagacatga tgcaggaccc tgtcacattc 1320
cgttccacga gacaagtcag caactatcca gtggtaggtg cagagctcat gccggtcttc 1380
tcaaagagtt tctacaacga gcaagccgtg tactcccagc agcttcgcca gtccacctcg 1440
ctcacgcacg tcttcaaccg cttccctgag aaccagatcc tcatccgccc gccagcgccc 1500
accattacca ccgtcagtga aaacgttcct gctctcacag atcacgggac cctgccgttg 1560
cgcagcagta tccggggagt ccagcgcgtg accgttactg acgccagacg ccgcacctgc 1620
ccctacgtct acaaggccct gggcatagtc gcgccgcgcg tcctttcaag ccgcactttc 1680
taa 1683
<210> 139
<211> 2823
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 50 sequence
<400> 139
atggccaccc catcgatgct gccccagtgg gcatacatgc acatcgccgg acaggatgct 60
tcggagtacc tgagtccggg tctggtgcag ttcgcccgcg ccacagacac ctacttcaat 120
ctggggaaca agtttaggaa ccccaccgtg gcgcccaccc atgatgtgac caccgaccgc 180
agtcagcggc tgatgctgcg ctttgtgccc gttgaccggg aagacaatac ctacgcatac 240
aaagttcgat acaccttggc tgtgggcgac aacagagtgc tggatatggc cagcactttc 300
tttgacattc ggggtgtgtt ggatagaggt cctagcttca agccatattc tggcactgct 360
tacaactcat tggcccctaa gggcgctccc aatacatctc agtggcttaa taagggagat 420
gaagaggatg gggaagacga ccaacaagct acatacactt ttggcaatgc gccagtaaaa 480
gccgaagctg aaattacaaa agaaggactg ccaataggtt tggaagttcc atctgaaggt 540
ggccctaaac ccatttatgc tgataaactg tatcagccag aacctcaggt gggagaggaa 600
tcttggactg atacggatgg cacagatgaa aaatatggag gcagagcact taaacctgaa 660
actaaaatga aaccctgcta cgggtctttc gctaaaccta ctaatgttaa aggcgggcag 720
gcaaaagtga agaaagaaga agaaggcaag gttgaatatg acattgacat gaactttttc 780
gacctaagat cacaaatgac tggcctcaag cctaaaattg taatgtatgc agaaaatgtg 840
gatctagaaa ctcctgacac tcatgtggtg tacaaacctg gagcttcaga tgctagctct 900
catgcaaacc ttggtcaaca gtccatgccc aatagaccta actatattgg cttcagggac 960
aacttcatcg gactcatgta ctacaacagt actggcaaca tgggagtgct ggctggacaa 1020
gcgtctcagc taaatgcagt ggttgacttg caagacagaa acacagaatt gtcatatcaa 1080
ctcttgcttg attctctggg ggacagaacc agatatttca gtatgtggaa tcaagcagtg 1140
gatagctatg acccagatgt gcgtgttatt gagaaccatg gtgtggaaga tgaacttcct 1200
aactattgtt ttccattgga tggtgtaggt ccgcgaatag acagttacaa gggaattgag 1260
acaaatggtg atgaaaccac tacttggaaa gatttagagc caaagggcat aagtgaaatt 1320
gctaagggaa atccgtttgc catggaaatt aacctccaag ctaatctctg gagaagtttt 1380
ctttattcca atgtggctct gtatctccca gactcctaca aatacacccc agccaatgtc 1440
actcttccaa ctaacaccaa cacttatgac tacatgaatg ggcgggtggt tcccccatcc 1500
ctggtggata cctacgtaaa cattggcgcc agatggtctt tggatgccat ggacaatgtc 1560
aaccccttta accatcaccg caacgctggc ctgcgatacc ggtccatgct tttgggcaat 1620
ggtcgttacg tgcctttcca cattcaagtg cctcagaaat tctttgctgt gaagaacctg 1680
ctgcttctac ccggttctta cacctacgag tggaacttca gaaaggatgt gaacatggtc 1740
ctgcagagtt cccttggtaa tgatctccgg gtcgatggtg ccagcataag ttttaccagc 1800
atcaatctct atgccacctt cttccccatg gcccacaaca ctgcctccac ccttgaagcc 1860
atgctgcgca atgacaccaa tgatcaatca ttcaatgact acctttctgc tgccaacatg 1920
ctctacccca tcccggccaa cgctaccaac gttcccatct ccattccctc tcgcaactgg 1980
gccgccttca gaggctggtc cttcaccaga ctcaaaacca aggagactcc ctctttggga 2040
tcagggttcg atccctactt tgtttactct ggttctatac cctacctgga tggtaccttc 2100
taccttaacc acactttcaa gaaagtctcc atcatgtttg actcttcagt gagctggcct 2160
ggtaatgaca gattgctaag tccaaatgag ttcgaaatca agcgcacagt tgatggggaa 2220
ggctacaatg tggcccaatg taacatgacc aaagactggt tcctggtcca gatgcttgcc 2280
aactacaaca ttggatacca gggcttctac gttcctgagg gttacaagga tcgcatgtac 2340
tccttcttca gaaacttcca gcccatgagt agacaggtgg ttgatgagat taactacaaa 2400
gactataaag ctgtcgccgt accctaccag cataataact ctggctttgt gggttacatg 2460
gctcctacca tgcgtcaggg tcaagcgtac cctgctaact acccataccc cctaattgga 2520
accactgcag taaccagtgt cacccagaaa aaattcctgt gcgacaggac catgtggcgc 2580
atcccattct ctagcaactt catgtccatg ggtgccctta cagacctggg acagaacttg 2640
ctgtatgcca actcggccca tgcgctggac atgacttttg aggtggatcc catggatgag 2700
cccaccctgc tttatcttct tttcgaagtc ttcgacgtgg tcagagtgca ccagccacac 2760
cgcggcgtca tcgaggccgt ctacctgcgc acaccgttct cggccggcaa cgccaccaca 2820
taa 2823
<210> 140
<211> 323
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 50 sequence
<400> 140
Met Thr Lys Arg Val Arg Leu Ser Asp Ser Phe Asn Pro Val Tyr Pro
1 5 10 15
Tyr Glu Asp Glu Ser Thr Ser Gln His Pro Phe Ile Asn Pro Gly Phe
20 25 30
Ile Ser Pro Asn Gly Phe Thr Gln Ser Pro Asp Gly Val Leu Thr Leu
35 40 45
Asn Cys Leu Thr Pro Leu Thr Thr Thr Gly Gly Pro Leu Gln Leu Lys
50 55 60
Val Gly Gly Gly Leu Ile Val Asp Asp Thr Asp Gly Thr Leu Gln Glu
65 70 75 80
Asn Ile Arg Val Thr Ala Pro Ile Thr Lys Asn Asn His Ser Val Glu
85 90 95
Leu Ser Ile Gly Asn Gly Leu Glu Thr Gln Asn Asn Lys Leu Cys Ala
100 105 110
Lys Leu Gly Asn Gly Leu Lys Phe Asn Asn Gly Asp Ile Cys Ile Lys
115 120 125
Asp Ser Ile Asn Thr Leu Trp Thr Gly Ile Lys Pro Pro Pro Asn Cys
130 135 140
Gln Ile Val Glu Asn Thr Asp Thr Asn Asp Gly Lys Leu Thr Leu Val
145 150 155 160
Leu Val Lys Asn Gly Gly Leu Val Asn Gly Tyr Val Ser Leu Val Gly
165 170 175
Val Ser Asp Thr Val Asn Gln Met Phe Thr Gln Lys Ser Ala Thr Ile
180 185 190
Gln Leu Arg Leu Tyr Phe Asp Ser Ser Gly Asn Leu Leu Thr Asp Glu
195 200 205
Ser Asn Leu Lys Ile Pro Leu Lys Asn Lys Ser Ser Thr Ala Thr Ser
210 215 220
Glu Ala Ala Thr Ser Ser Lys Ala Phe Met Pro Ser Thr Thr Ala Tyr
225 230 235 240
Pro Phe Asn Thr Thr Thr Arg Asp Ser Glu Asn Tyr Ile His Gly Ile
245 250 255
Cys Tyr Tyr Met Thr Ser Tyr Asp Arg Ser Leu Val Pro Leu Asn Ile
260 265 270
Ser Ile Met Leu Asn Ser Arg Thr Ile Ser Ser Asn Val Ala Tyr Ala
275 280 285
Ile Gln Phe Glu Trp Asn Leu Asn Ala Lys Glu Ser Pro Glu Ser Asn
290 295 300
Ile Ala Thr Leu Thr Thr Ser Pro Phe Phe Phe Ser Tyr Ile Arg Glu
305 310 315 320
Asp Asp Asn
<210> 141
<211> 91
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 50 sequence
<400> 141
Asp Gly Val Leu Thr Leu Asn Cys Leu Thr Pro Leu Thr Thr Thr Gly
1 5 10 15
Gly Pro Leu Gln Leu Lys Val Gly Gly Gly Leu Ile Val Asp Asp Thr
20 25 30
Asp Gly Thr Leu Gln Glu Asn Ile Arg Val Thr Ala Pro Ile Thr Lys
35 40 45
Asn Asn His Ser Val Glu Leu Ser Ile Gly Asn Gly Leu Glu Thr Gln
50 55 60
Asn Asn Lys Leu Cys Ala Lys Leu Gly Asn Gly Leu Lys Phe Asn Asn
65 70 75 80
Gly Asp Ile Cys Ile Lys Asp Ser Ile Asn Thr
85 90
<210> 142
<211> 190
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 50 sequence
<400> 142
Leu Trp Thr Gly Ile Lys Pro Pro Pro Asn Cys Gln Ile Val Glu Asn
1 5 10 15
Thr Asp Thr Asn Asp Gly Lys Leu Thr Leu Val Leu Val Lys Asn Gly
20 25 30
Gly Leu Val Asn Gly Tyr Val Ser Leu Val Gly Val Ser Asp Thr Val
35 40 45
Asn Gln Met Phe Thr Gln Lys Ser Ala Thr Ile Gln Leu Arg Leu Tyr
50 55 60
Phe Asp Ser Ser Gly Asn Leu Leu Thr Asp Glu Ser Asn Leu Lys Ile
65 70 75 80
Pro Leu Lys Asn Lys Ser Ser Thr Ala Thr Ser Glu Ala Ala Thr Ser
85 90 95
Ser Lys Ala Phe Met Pro Ser Thr Thr Ala Tyr Pro Phe Asn Thr Thr
100 105 110
Thr Arg Asp Ser Glu Asn Tyr Ile His Gly Ile Cys Tyr Tyr Met Thr
115 120 125
Ser Tyr Asp Arg Ser Leu Val Pro Leu Asn Ile Ser Ile Met Leu Asn
130 135 140
Ser Arg Thr Ile Ser Ser Asn Val Ala Tyr Ala Ile Gln Phe Glu Trp
145 150 155 160
Asn Leu Asn Ala Lys Glu Ser Pro Glu Ser Asn Ile Ala Thr Leu Thr
165 170 175
Thr Ser Pro Phe Phe Phe Ser Tyr Ile Arg Glu Asp Asp Asn
180 185 190
<210> 143
<211> 560
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 50 sequence
<400> 143
Met Arg Arg Thr Val Leu Gly Gly Ala Val Val Tyr Pro Glu Gly Pro
1 5 10 15
Pro Pro Ser Tyr Glu Ser Val Met Gln Gln Ala Ala Ala Ala Ala Met
20 25 30
Gln Pro Pro Leu Glu Ala Pro Phe Val Pro Pro Arg Tyr Leu Ala Pro
35 40 45
Thr Glu Gly Arg Asn Ser Ile Arg Tyr Ser Glu Leu Ala Pro Leu Tyr
50 55 60
Asp Thr Thr Arg Leu Tyr Leu Val Asp Asn Lys Ser Ala Asp Ile Ala
65 70 75 80
Ser Leu Asn Tyr Gln Asn Asp His Ser Asn Phe Leu Thr Thr Val Val
85 90 95
Gln Asn Asn Asp Phe Thr Pro Thr Glu Ala Ser Thr Gln Thr Ile Asn
100 105 110
Phe Asp Glu Arg Ser Arg Trp Gly Gly Gln Leu Lys Thr Ile Met His
115 120 125
Thr Asn Met Pro Asn Val Asn Glu Tyr Met Phe Ser Asn Lys Phe Lys
130 135 140
Ala Arg Val Met Val Ser Arg Lys Ala Pro Glu Gly Val Thr Val Asp
145 150 155 160
Asp Asn Tyr Asp His Lys Gln Asp Ile Leu Glu Tyr Glu Trp Phe Glu
165 170 175
Phe Thr Leu Pro Glu Gly Asn Phe Ser Ala Thr Met Thr Ile Asp Leu
180 185 190
Met Asn Asn Ala Ile Ile Asp Asn Tyr Leu Glu Val Gly Arg Gln Asn
195 200 205
Gly Val Leu Glu Ser Asp Ile Gly Val Lys Phe Asp Thr Arg Asn Phe
210 215 220
Arg Leu Gly Trp Asp Pro Glu Thr Lys Leu Ile Met Pro Gly Val Tyr
225 230 235 240
Thr Tyr Glu Ala Phe His Pro Asp Ile Val Leu Leu Pro Gly Cys Gly
245 250 255
Val Asp Phe Thr Glu Ser Arg Leu Ser Asn Leu Leu Gly Ile Arg Lys
260 265 270
Arg His Pro Phe Gln Glu Gly Phe Lys Ile Leu Tyr Glu Asp Leu Glu
275 280 285
Gly Gly Asn Ile Pro Ala Leu Leu Asp Val Glu Ala Tyr Lys Asn Ser
290 295 300
Lys Lys Glu Arg Glu Ala Lys Thr Glu Ala Ala Lys Ala Ala Ala Ile
305 310 315 320
Ala Lys Ala Asn Ile Val Val Ser Asp Pro Val Arg Val Ala Asn Ala
325 330 335
Glu Glu Val Arg Gly Asp Asn Tyr Thr Ala Ser Ser Val Ala Thr Glu
340 345 350
Glu Ser Leu Leu Ala Ala Val Ala Glu Thr Thr Glu Thr Lys Leu Thr
355 360 365
Ile Lys Pro Val Glu Lys Asp Ser Lys Ser Arg Ser Tyr Asn Val Leu
370 375 380
Glu Asp Lys Val Asn Thr Ala Tyr Arg Ser Trp Tyr Leu Ser Tyr Asn
385 390 395 400
Tyr Gly Asp Pro Glu Lys Gly Val Arg Ser Trp Thr Leu Leu Thr Thr
405 410 415
Ser Asp Val Thr Cys Gly Ala Glu Gln Val Tyr Trp Ser Leu Pro Asp
420 425 430
Met Met Gln Asp Pro Val Thr Phe Arg Ser Thr Arg Gln Val Ser Asn
435 440 445
Tyr Pro Val Val Gly Ala Glu Leu Met Pro Val Phe Ser Lys Ser Phe
450 455 460
Tyr Asn Glu Gln Ala Val Tyr Ser Gln Gln Leu Arg Gln Ser Thr Ser
465 470 475 480
Leu Thr His Val Phe Asn Arg Phe Pro Glu Asn Gln Ile Leu Ile Arg
485 490 495
Pro Pro Ala Pro Thr Ile Thr Thr Val Ser Glu Asn Val Pro Ala Leu
500 505 510
Thr Asp His Gly Thr Leu Pro Leu Arg Ser Ser Ile Arg Gly Val Gln
515 520 525
Arg Val Thr Val Thr Asp Ala Arg Arg Arg Thr Cys Pro Tyr Val Tyr
530 535 540
Lys Ala Leu Gly Ile Val Ala Pro Arg Val Leu Ser Ser Arg Thr Phe
545 550 555 560
<210> 144
<211> 940
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 50 sequence
<400> 144
Met Ala Thr Pro Ser Met Leu Pro Gln Trp Ala Tyr Met His Ile Ala
1 5 10 15
Gly Gln Asp Ala Ser Glu Tyr Leu Ser Pro Gly Leu Val Gln Phe Ala
20 25 30
Arg Ala Thr Asp Thr Tyr Phe Asn Leu Gly Asn Lys Phe Arg Asn Pro
35 40 45
Thr Val Ala Pro Thr His Asp Val Thr Thr Asp Arg Ser Gln Arg Leu
50 55 60
Met Leu Arg Phe Val Pro Val Asp Arg Glu Asp Asn Thr Tyr Ala Tyr
65 70 75 80
Lys Val Arg Tyr Thr Leu Ala Val Gly Asp Asn Arg Val Leu Asp Met
85 90 95
Ala Ser Thr Phe Phe Asp Ile Arg Gly Val Leu Asp Arg Gly Pro Ser
100 105 110
Phe Lys Pro Tyr Ser Gly Thr Ala Tyr Asn Ser Leu Ala Pro Lys Gly
115 120 125
Ala Pro Asn Thr Ser Gln Trp Leu Asn Lys Gly Asp Glu Glu Asp Gly
130 135 140
Glu Asp Asp Gln Gln Ala Thr Tyr Thr Phe Gly Asn Ala Pro Val Lys
145 150 155 160
Ala Glu Ala Glu Ile Thr Lys Glu Gly Leu Pro Ile Gly Leu Glu Val
165 170 175
Pro Ser Glu Gly Gly Pro Lys Pro Ile Tyr Ala Asp Lys Leu Tyr Gln
180 185 190
Pro Glu Pro Gln Val Gly Glu Glu Ser Trp Thr Asp Thr Asp Gly Thr
195 200 205
Asp Glu Lys Tyr Gly Gly Arg Ala Leu Lys Pro Glu Thr Lys Met Lys
210 215 220
Pro Cys Tyr Gly Ser Phe Ala Lys Pro Thr Asn Val Lys Gly Gly Gln
225 230 235 240
Ala Lys Val Lys Lys Glu Glu Glu Gly Lys Val Glu Tyr Asp Ile Asp
245 250 255
Met Asn Phe Phe Asp Leu Arg Ser Gln Met Thr Gly Leu Lys Pro Lys
260 265 270
Ile Val Met Tyr Ala Glu Asn Val Asp Leu Glu Thr Pro Asp Thr His
275 280 285
Val Val Tyr Lys Pro Gly Ala Ser Asp Ala Ser Ser His Ala Asn Leu
290 295 300
Gly Gln Gln Ser Met Pro Asn Arg Pro Asn Tyr Ile Gly Phe Arg Asp
305 310 315 320
Asn Phe Ile Gly Leu Met Tyr Tyr Asn Ser Thr Gly Asn Met Gly Val
325 330 335
Leu Ala Gly Gln Ala Ser Gln Leu Asn Ala Val Val Asp Leu Gln Asp
340 345 350
Arg Asn Thr Glu Leu Ser Tyr Gln Leu Leu Leu Asp Ser Leu Gly Asp
355 360 365
Arg Thr Arg Tyr Phe Ser Met Trp Asn Gln Ala Val Asp Ser Tyr Asp
370 375 380
Pro Asp Val Arg Val Ile Glu Asn His Gly Val Glu Asp Glu Leu Pro
385 390 395 400
Asn Tyr Cys Phe Pro Leu Asp Gly Val Gly Pro Arg Ile Asp Ser Tyr
405 410 415
Lys Gly Ile Glu Thr Asn Gly Asp Glu Thr Thr Thr Trp Lys Asp Leu
420 425 430
Glu Pro Lys Gly Ile Ser Glu Ile Ala Lys Gly Asn Pro Phe Ala Met
435 440 445
Glu Ile Asn Leu Gln Ala Asn Leu Trp Arg Ser Phe Leu Tyr Ser Asn
450 455 460
Val Ala Leu Tyr Leu Pro Asp Ser Tyr Lys Tyr Thr Pro Ala Asn Val
465 470 475 480
Thr Leu Pro Thr Asn Thr Asn Thr Tyr Asp Tyr Met Asn Gly Arg Val
485 490 495
Val Pro Pro Ser Leu Val Asp Thr Tyr Val Asn Ile Gly Ala Arg Trp
500 505 510
Ser Leu Asp Ala Met Asp Asn Val Asn Pro Phe Asn His His Arg Asn
515 520 525
Ala Gly Leu Arg Tyr Arg Ser Met Leu Leu Gly Asn Gly Arg Tyr Val
530 535 540
Pro Phe His Ile Gln Val Pro Gln Lys Phe Phe Ala Val Lys Asn Leu
545 550 555 560
Leu Leu Leu Pro Gly Ser Tyr Thr Tyr Glu Trp Asn Phe Arg Lys Asp
565 570 575
Val Asn Met Val Leu Gln Ser Ser Leu Gly Asn Asp Leu Arg Val Asp
580 585 590
Gly Ala Ser Ile Ser Phe Thr Ser Ile Asn Leu Tyr Ala Thr Phe Phe
595 600 605
Pro Met Ala His Asn Thr Ala Ser Thr Leu Glu Ala Met Leu Arg Asn
610 615 620
Asp Thr Asn Asp Gln Ser Phe Asn Asp Tyr Leu Ser Ala Ala Asn Met
625 630 635 640
Leu Tyr Pro Ile Pro Ala Asn Ala Thr Asn Val Pro Ile Ser Ile Pro
645 650 655
Ser Arg Asn Trp Ala Ala Phe Arg Gly Trp Ser Phe Thr Arg Leu Lys
660 665 670
Thr Lys Glu Thr Pro Ser Leu Gly Ser Gly Phe Asp Pro Tyr Phe Val
675 680 685
Tyr Ser Gly Ser Ile Pro Tyr Leu Asp Gly Thr Phe Tyr Leu Asn His
690 695 700
Thr Phe Lys Lys Val Ser Ile Met Phe Asp Ser Ser Val Ser Trp Pro
705 710 715 720
Gly Asn Asp Arg Leu Leu Ser Pro Asn Glu Phe Glu Ile Lys Arg Thr
725 730 735
Val Asp Gly Glu Gly Tyr Asn Val Ala Gln Cys Asn Met Thr Lys Asp
740 745 750
Trp Phe Leu Val Gln Met Leu Ala Asn Tyr Asn Ile Gly Tyr Gln Gly
755 760 765
Phe Tyr Val Pro Glu Gly Tyr Lys Asp Arg Met Tyr Ser Phe Phe Arg
770 775 780
Asn Phe Gln Pro Met Ser Arg Gln Val Val Asp Glu Ile Asn Tyr Lys
785 790 795 800
Asp Tyr Lys Ala Val Ala Val Pro Tyr Gln His Asn Asn Ser Gly Phe
805 810 815
Val Gly Tyr Met Ala Pro Thr Met Arg Gln Gly Gln Ala Tyr Pro Ala
820 825 830
Asn Tyr Pro Tyr Pro Leu Ile Gly Thr Thr Ala Val Thr Ser Val Thr
835 840 845
Gln Lys Lys Phe Leu Cys Asp Arg Thr Met Trp Arg Ile Pro Phe Ser
850 855 860
Ser Asn Phe Met Ser Met Gly Ala Leu Thr Asp Leu Gly Gln Asn Leu
865 870 875 880
Leu Tyr Ala Asn Ser Ala His Ala Leu Asp Met Thr Phe Glu Val Asp
885 890 895
Pro Met Asp Glu Pro Thr Leu Leu Tyr Leu Leu Phe Glu Val Phe Asp
900 905 910
Val Val Arg Val His Gln Pro His Arg Gly Val Ile Glu Ala Val Tyr
915 920 925
Leu Arg Thr Pro Phe Ser Ala Gly Asn Ala Thr Thr
930 935 940
<210> 145
<211> 35343
<212> DNA
<213> Human mastadenovirus B
<400> 145
ctatctatat aatatacctt atagatggaa tggtgccaac atgtaaatga ggtaatttaa 60
aaaagtgcgc gctgtgtggt gattggctgc ggggttaacg gctaaaaggg gcggcgcgac 120
cgtgggaaaa tgacgtgact tatgtgggag gagttatgtt gcaagttatt acggtaaatg 180
tgacgtaaaa cgaggtgtgg tttgaacacg gaagtagaca gttttcccac gcttactgac 240
aggatatgag gtagttttgg gcggatgcaa gtgaaaattc tccattttcg cgcgaaaact 300
aaatgaggaa gtgaatttct gagtcatttc gcggttatgc cagggtggag tatttgccga 360
gggccgagta gactttgacc gtttacgtgg aggtttcgat taccgtgttt ttcacctaaa 420
tttccgcgta cggtgtcaaa gttctgtgtt tttacgtagg tgtcagctga tcgctagggt 480
atttaaacct gacgagttcc gtcaagaggc cactcttgag tgccagcgag aagagttttc 540
tcctccgcgc cgcaagtcag ttctgcgctt tgaaaatgag acacctgcgc ttcctgccac 600
aggaggttat ctccagtgag accgggatcg aaatactgga gtttgtggta aataccctaa 660
tgggagacga cccggaaccg ccagtgcagc ctttcgatcc acctacgctg cacgatctgt 720
atgatttaga gatagacggg ccggaggatc ccaatgagga agctgtgaat gggtttttta 780
ctgattctat gctgctagct gctgatgaag gattggacat aaaccctcct cctgagacac 840
ttgttacccc aggggtggtt gtggaaagcg gcataggtgg gaaaaaattg cctgatctgg 900
gagcagctga aatggacttg cgttgttatg aagagggttt tcctcccagt gatgatgaag 960
atggggaaac tgagcagtcc atccataccg cagtaaatga gggagtaaaa gctgccagcg 1020
atgtttttaa gttggactgt ccggagctgc ctggacatgg ctgtaagtct tgtgaatttc 1080
acaggaataa cactggaatg aaagaactat tgtgctcgct ttgctatatg agaatgcact 1140
gccactttat ttacagtaag tgtatttaag tgaaatttaa aggaatagtg tagctattta 1200
ataactgttg aatggtagat ttatgttttt ttcttgcgat tttttgtagg tcctgtgtct 1260
gatgatgagt caccttctcc tgattcaact acctcacctc ctgaaattca ggcgcccgca 1320
cctgcaaacg tatgcaagcc cattcctgtg aagcctaagc ctgggaaacg ccctgctgtg 1380
gataagcttg aggacttgtt ggagggtggg gatggacctt tggaccttag tacccggaaa 1440
ctgccaaggc aatgagtgcc ctgcagctgt gtttatttaa tgtgacgtca tgtaataaaa 1500
ttatgtcagc tgctgagtgt tttattactt cttgggtggg gacttggata tataagtagg 1560
agcagatctg tgtggttagc tcacagcaac ctgctgccat ccatggaggt ttgggctatc 1620
ttggaagacc tcagacagac taagctactg ctagaaaacg cctcggacgg agtctctggc 1680
ctttggagat tctggttcgg tggtgatcta gctaggctag tgtttaggat aaaacaggac 1740
tacagggaag aatttgaaaa gttattggac gatagtccgg gactttttga agctcttaac 1800
ttgggtcatc aggctcattt taaggagaag gttttatcag ttttagattt ttctactcct 1860
ggtagaactg ctgctgctgt agcttttctt acttttatat tggataaatg gatccgccaa 1920
actcacttca gcaagggata cgttttggat ttcatagcag cagctttgtg gagaacatgg 1980
aaggctcgca ggatgaggac aatcttagat tactggccag tgcagcctct gggagtagca 2040
gggatactga gacacccacc gaccatgcca gcggttctgc aggaggagca gcaggaggac 2100
aatccgagag ccggcctgga ccctccggtg gaggagtagc tgacctgttt cctgaactgc 2160
gacgggtgct tactaggtct acgaccagtg gacagaacag gggaattaag agggagagga 2220
atcctagtgg gaataattca agaaccgagt tggctttaag tttaatgagc cgcaggcgtc 2280
ctgaaactgt ttggtggcat gaggttcaga gcgaaggcag ggatgaagtt tcaatattgc 2340
aggagaaata ttcactagaa caacttaaga cctgttggtt ggaacctgag gatgattggg 2400
aggtggccat taggaattat gctaagatat ctctgaggcc tgataaacaa tatagaatta 2460
ctaagaagat taatattaga aatgcatgct acatatcagg gaatggggca gaggttataa 2520
tagatacaca agataaagca gtttttagat gttgtatgat gggtatgtgg ccaggggttg 2580
tcggcatgga agcagtaaca cttatgaata ttaggtttaa aggggatggg tataatggca 2640
ttgtatttat ggctaacact aagctgattc tacatggttg tagctttttt gggtttaata 2700
atacgtgtgt agaagcttgg gggcaagtta gtgtgagggg ttgtagtttt tatgcatgct 2760
ggattgcaac atcaggtagg gtcaagagtc agttgtctgt gaagaaatgc atgtttgaga 2820
gatgtaatct tggcatactg aatgaaggtg aagcaagggt ccgccactgc gcagctacag 2880
aaactggctg cttcattcta ataaagggaa atgccagtgt gaagcataat atgatctgtg 2940
gacattcgga tgagaggcct tatcagatgc tgacctgcgc tggtggacat tgcaatattc 3000
ttgctaccgt gcatatcgtt tcacatgcac gcaaaaaatg gcctgtattt gaacataatg 3060
tgattaccaa gtgcaccatg cacataggtg gtcgcagggg aatgtttatg ccttaccagt 3120
gtaacatgaa tcatgtgaag gtaatgttgg aaccagatgc cttttccaga gtgagcttaa 3180
caggaatctt tgatatgaat attcaactat ggaagatcct gagatatgat gacactaaac 3240
caagggtgcg cgcatgcgaa tgcggaggca agcatgctag attccagccg gtgtgcgtgg 3300
atgtgactga agacttgaga cccgatcatt tggtgcttgc ctgcactgga gcggagttcg 3360
gttctagtgg tgaagaaact gactaaagtg agtagtgggg caagatgtgg atggggactt 3420
tcaggttggt aaggtgggca gattgggtaa attttgttaa tttctgtctt gcagctgcca 3480
tgagtggaag cgcttctttt gaggggggag tatttagccc ttatctgacg ggcaggctcc 3540
caccatgggc aggagttcgt cagaatgtca tgggatccac tgtggatggg agacccgtcc 3600
agcccgccaa ttcctcaacg ctgacctatg ccactttgag ttcgtcacca ttggatgcag 3660
ctgcagccgc cgccgctact gctgccgcca acaccatcct tggaatgggc tattatggaa 3720
gcatcgttgc caattccagt tcctctaata acccttcaac cctggctgag gacaagctac 3780
ttgttctctt ggcgcagctc gaggccttaa cccaacgctt aggcgaactg tctaagcagg 3840
tggcccagtt gcgtgagcaa actgagtctg ctgttgccac agcaaagtct aaataaagat 3900
ctcaaatcaa taaataaaga aatacttgat ataaaacaaa tgaatgttta tttgattttt 3960
cgcgcgcggt atgccctgga ccatcggtct cgatcattga gaacgcggtg gatcttttcc 4020
agtaccctgt aaaggtggga ttgaatgttt agatacatgg gcattagtcc gtctcggggg 4080
tggagatagc tccattgaag agcctcttgc tccggggtag tgttataaat cacccagtca 4140
tagcaaggtc ggagtgcatg gtgttgcaca atatctttta ggagcagact aattgcaacg 4200
gggaggccct tagtgtaggt gtttacaaat ctgttgagct gggacgggtg catccggggt 4260
gaaattatat gcattttgga ctggatcttg aggttggcaa tgttgccgcc tagatcccgt 4320
ctcgggttca tattgtgcag gaccaccaag acagtgtatc cggtgcactt gggaaattta 4380
tcatgcagct tagagggaaa agcatgaaaa aatttggaga cgcctttgtg accccccaga 4440
ttctccatgc actcatccat aatgatagcg atggggccgt gggcagcggc acgggcgaac 4500
acgttccggg ggtctgaaac atcatagtta tgctcctgag tcaggtcatc ataagccatt 4560
ttaataaact ttgggcggag ggtgccagat tgggggatga aagttccctc tggcccggga 4620
gcatagtttc cctcacatat ttgcatttcc caggctttca gttcagaggg ggggatcatg 4680
tccacctgcg gggctataaa aaataccgtt tctggagccg gggtgattaa ctgggacgag 4740
agcaaattcc taagcagctg agacttgccg cacccagtgg gaccgtaaat gaccccaatt 4800
acgggttgca gatggtagtt tagggaacga cagctgccgt cctcccggag caggggggcc 4860
acttcgttca tcatttccct tacatggata ttttcccgca ccaagtccgt taggaggcgc 4920
tctcccccaa gggatagaag ctcctggagc gaggagaagt ttttcagcgg cttcagcccg 4980
tcagccatgg gcattttgga aagagtctgt tgcaagagct cgagccggtc ccagagctcg 5040
gtgatgtgct ctatggcatc tcgatccagc agacctcctc gtttcgcggg ttgggacggc 5100
tcctggagta gggaatcaga cgatgggcgt ccagcgctgc cagggtccga tccttccatg 5160
gtcgcagcgt ccgagtcagg gttgtttccg tcacggtgaa ggggtgcgcg cctggttggg 5220
cgcttgcgag ggtgcgcttc agactcatcc tgctggtcga gaaccgctgc cgattggcgc 5280
cctgcatgtc ggccaggtag cagtttacca tgagttcgta gttgagcgcc tcggccgcgt 5340
ggcctttggc acggagctta cctttggaag ttttatggca ggcggggcag tagatacatt 5400
tgagggcata caacttgggc gcgaggaaaa tggattcggg ggagtatgca tccgcaccgc 5460
aggaggcgca gacggtttcg cactccacga gccaggtcag atccggctca tcggggtcaa 5520
aaacaagttt tccgccatgt tttttgatgc gtttcttacc tttggtttcc atgagttcgt 5580
gtccccgctg ggtgacaaag aggctgtccg tgtccccgta gaccgacttt atgggcctgt 5640
cctcgagcgg agtgcctcgg tcctcttcgt agaggaaccc agcccactct gatacaaaag 5700
cgcgtgtcca ggccagcaca aaggaggcca cgtgggaggg gtagcggtcg ttgtcaacca 5760
gggggtccac cttctctacg gtatgtaaac acatgtcccc ctcctccaca tccaagaatg 5820
tgattggctt gtaagtgtag gccacgtgac caggggtccc cgccgggggg gtataaaagg 5880
gggcgggcct ctgttcgtcc tcactgtctt ccggatcgct gtccaggagc gccagctgtt 5940
ggggtaggta ttccctctcg aaggcgggca tgacctctgc actcaggttg tcagtttcta 6000
ggaacgagga ggatttgata ttgacagtac cagcagagat gcctttcata agactctcgt 6060
ccatctggtc agaaaacaca atcttcttgt tgtccagctt ggtggcaaat gatccataga 6120
gggcattgga tagaagcttg gcgatggagc gcatggtttg gttcttttcc ttgtccgcgc 6180
gctccttggc ggtgatgtta agctggacgt actcgcgcgc cacacatttc cattcaggaa 6240
agatggttgt cagttcatcc ggaactattc tgattcgcca tcccctattg tgcagggtta 6300
tcagatccac actggtggcc acctcgcctc ggaggggctc attggtccag cagagtcgac 6360
ctccttttct tgaacagaaa ggggggaggg ggtctagcat gaactcatca ggggggtccg 6420
catctatggt aaatattccc ggtagcaaat ctttgtcaaa atagctgatg gtggcgggat 6480
catccaaggt catctgccat tctcgaactg ccagcgcgcg ctcatagggg ttaagagggg 6540
tgccccaggg catggggtgg gtgagcgcgg aggcatacat gccacagata tcgtagacat 6600
agaggggctc ttcgaggatg ccgatgtaag tgggataaca tcgcccccct ctgatgcttg 6660
ctcgcacata gtcatagagt tcatgtgagg gggcaagaag acccgggccc agattggtgc 6720
ggttgggttt ttccgccctg taaacgatct ggcgaaagat ggcatgggaa ttggaagaga 6780
tagtaggtct ctggaatatg ttaaaatggg catgaggtaa gcctacagag tcccttatga 6840
agtgggcata tgactcttgc agcttggcta ccagctcggc ggtgatgagt acatccaggg 6900
cacagtagtc gagagtttcc tggatgatgt cataacgcgg ttggcttttc ttttcccaca 6960
gctcgcggtt gagaaggtat tcttcgtgat ccttccagta ctcttcgagg ggaaacccgt 7020
ctttttctgc acggtaagag cccaacatgt agaactgatt gactgccttg tagggacagc 7080
atcccttctc cactgggaga gagtatgctt gggctgcatt gcgcagcgag gtatgagtga 7140
gggcaaaagt gtccctgacc atgactttga ggaattgata cttgaagtcg atgtcatcac 7200
aggccccctg ttcccagagt tggaagtcca cccgcttctt gtaggcgggg ttgggcaaag 7260
cgaaagtaac atcattgaag aggatcttgc cggccctggg catgaaattt cgggtgattt 7320
tgaaaggctg aggaacctct gctcggttat tgataacctg agcggccaag acgatctcat 7380
caaagccatt gatgttgtgc cccactatgt acagttctaa gaatcgaggg gtgcccctga 7440
catgaggcag cttcttgagt tcttcaaaag tgagatctgt agggtcagtg agagcatagt 7500
gttcgagggc ccattcgtgc acgtgagggt tcgctttaag gaaggaggac cagaggtcca 7560
ctgccagtgc tgtttgtaac tggtcccggt actgacgaaa atgctgtccg actgccatct 7620
tttctggggt gacgcaatag aaggtttggg ggtcctgccg ccagcgatcc cacttgagtt 7680
ttatggcgag gtcataggcg atgttgacga gccgctggtc tccagagagt ttcatgacca 7740
gcatgaaggg gattagctgc ttgccaaagg accccatcca ggtgtaggtt tccacatcgt 7800
aggtgagaaa gagcctttct gtgcgaggat gagagccaat cgggaagaac tggatctcct 7860
gccaccagtt ggaggaatgg ctgttgatgt gatggaagta gaactccctg cgacgcgccg 7920
agcattcatg cttgtgcttg tacagacggc cgcagtactc gcagcgattc acgggatgca 7980
ccttatgaat gagttgtacc tgacttcctt tgacgagaaa tttcagtgga aaattgaggc 8040
ctggcgcttg tacctcgcgc tttactatgt tgtctgcatc ggcatgacca tcttctgtct 8100
cgatggtggt catgctgacg agccctcgcg ggaggcaagt ccagacctcg gcgcggcagg 8160
ggcggagctc gaggacgaga gcgcgcaggc cggagctgtc cagggtcctg agacgctgcg 8220
gagtcaggtt agtaggcagt gtcaggagat taacttgcat gatcttttgg agggcgtgag 8280
ggaggttcag atagtacttg atctcaacgg gtccgttggt ggagatgtcg atggcttgca 8340
gggttccgtg tcccttgggc gctaccaccg tgcccttgtt tttcattttg gacggcggtg 8400
gctctgttgc ttcttgcatg tttagaagcg gtgtcgaggg cgcgcaccgg gcggcagggg 8460
cggctcggga cccggcggca tggctggcag tggtacgtcg gcgccgcgcg cgggtaggtt 8520
ctggtactgc gccctgagaa gactcgcatg cgcgacgacg cggcggttga catcctggat 8580
ctgacgcctc tgggtgaaag ctaccggccc cgtgagcttg aacctgaaag agagttcaac 8640
agaatcaatc tcggtatcgt tgacggcggc ttgcctaagg atttcttgca cgtcgccaga 8700
gttgtcctgg taggcgatct cggccatgaa ctgctcgatc tcttcctctt gaagatctcc 8760
gcggcccgct ctctcgacgg tggccgcgag gtcgttggag atgcgcccaa tgagttgaga 8820
gaatgcattc atgcccgcct cgttccagac gcggctgtag accacagccc ccacgggatc 8880
tctcgcgcgc atgaccacct gggcgaggtt gagctccacg tggcgggtga agaccgcata 8940
gttgcatagg cgctggaaaa ggtagttgag tgtggtggcg atgtgctcgg tgacgaagaa 9000
atacatgatc catcgtctca gcggcatctc gctgacatcg cccagcgctt ccaagcgctc 9060
catggcctcg tagaagtcca cggcaaagtt aaaaaactgg gagttacgcg cggacacggt 9120
caactcctct tccagaagac ggataagttc ggcgatggtg gtgcgcacct cgcgctcgaa 9180
agcccctggg atttcttcct caatctcttc ttcttccact aacatctctt cctcttcagg 9240
tggggctgca ggaggagggg gaacgcggcg acgccggcgg cgcacgggca gacggtcgat 9300
gaatctttca atgacctctc cgcggcggcg gcgcatggtc tcggtgacgg cacgaccgtt 9360
ctccctgggt ctcagagtga agacgcctcc gcgcatctcc ctgaagtggt gactgggagg 9420
ctctccgttg ggcagggaca ccgcgctgat tatgcatttt atcaattgcc ccgtaggtac 9480
tccgcgcaag gacctgatcg tctcaagatc cacgggatct gaaaaccttt cgacgaaagc 9540
gtctaaccag tcgcaatcgc aaggtaggct gagcactgtt tcttgcgggc gggggcggct 9600
agacgctcgg tcggggttct ctctttcttc tccttcctcc tcttgggagg gtgagacgat 9660
gctgctggtg atgaaattaa aataggcagt tttgagacgg cggatggtgg cgaggagcac 9720
caggtctttg ggtccggctt gttggatacg caggcgatga gccattcccc aagcattatc 9780
ctgacatctg gccagatctt tatagtagtc ttgcatgagt cgttccacgg gcacttcttc 9840
ttcgcccgct ctgccatgca tgcgagtgat cccgaacccg cgcatgggct ggacaagtgc 9900
caggtccgct acaacccttt cggcgaggat ggcttgctgc acctgggtga gggtggcttg 9960
gaagtcgtca aagtccacga agcggtggta ggccccggtg ttgattgtgt aggagcagtt 10020
ggccatgact gaccagttga ctgtctggtg cccagggcgc acgagctcgg tgtacttgag 10080
gcgcgagtat gcgcgggtgt caaagatgta atcgttgcag gtgcgcacca ggtactggta 10140
gccaatgaga aagtgtggcg gtggctggcg gtacaggggc catcgctctg tagccggggc 10200
tccgggggcg aggtcttcca gcatgaggcg gtggtagccg tagatgtacc tggacatcca 10260
ggtgataccg gaggcggtgg tggatgcacg tgggaactcg cgcacgcggt tccagatgtt 10320
gcgcagcggc atgaagtagt tcatggtagg cacggtctgg ccagtgaggc gcgcgcagtc 10380
attgacgctc tgtagacacg gagaaaacga aagcgatgag cggctcgact ccgtggtctg 10440
ggggaacgtg aacgggttgg gtcgcggtgt accccggttc gagtccaaag ctaagcgatc 10500
acgctcggat cggccggagc cgcggctaac gtggtattgg ctatcccgtc tcgacccagc 10560
cgacgaatat ccagggtacg gagtagagtc gtttttgctg ctttttcctg gacgtgtgcc 10620
attgccacgt caagctttag aacgctcagt tctcgggccg tgagtggctc gcgcccgtag 10680
tctggagaat cagtcgccag ggttgcgttg cggtatgccc cggttggagc ctaagcgcgg 10740
ctcgtatcgg ccggtttccg cgacaagcga gggtttggca gccccgttat ttccaagacc 10800
ccgccagccg acttctccag tttacgggag cgagcccttt tttttttttt tttgtttttg 10860
tcgcccagat gcatccagtg ctgcgacaga tgcgccccca gcaacaggcc ccttctcagc 10920
aacagccaca aaaggctctt cttgctcctg caactactgc agctgcagcc gtgagcggcg 10980
cgggacagcc cgcctatgat ctggacttgg aagagggcga gggattggcg cgcctggggg 11040
ctccatcgcc cgagcggcac ccgcgggtgc aactaaaaaa ggactctcgc gaggcgtacg 11100
tgccccagca gaacctgttc agggacagga gcggcgagga gccagaggag atgcgagcat 11160
ctcgatttaa cgcgggtcgc gagctgcgcc acggtctgga tcgaagacgg gtgctgcaag 11220
acgaggattt tgaggtcgat gaagtcacag ggatcagccc agctagggca catgtggccg 11280
cggccaacct agtctcggcc tacgagcaga ccgtgaagga ggagcgcaac ttccaaaaat 11340
cttttaacaa ccatgtgcgc accctgatcg cccgcgagga agtgaccctg ggtctgatgc 11400
atctgtggga cctgatggag gctatcgccc aaaaccccac tagcaaacca ctgacagctc 11460
agctgtttct ggtggttcaa catagcaggg acaacgaggc attcagggag gcgttgttga 11520
acatcaccga gcctgatggg agatggctgt atgatctgat caacatcctg caaagtatta 11580
tagtgcagga acgtagcctg ggtttggctg agaaagtggc agctatcaac tactcggtct 11640
tgagcctggg caaatactac gctcgcaaga tctacaagac cccctacgta cccatagaca 11700
aggaggtgaa gatagatggg ttttacatgc gcatgactct gaaggtgctg actctgagcg 11760
acgatctggg ggtgtatcgc aatgacagga tgcaccgcgc ggtgagcgcc agcaggaggc 11820
gcgagctgag cgacagagaa cttatgcaca gcttgcaaag agctctaacg ggggccggga 11880
ctgatgggga gaactacttt gacatgggag cggatttgca atggcaaccc agtcgcaggg 11940
ccatggaggc tgcagggtgt gagcttcctt acatagaaga ggtggatgaa gtcgaggacg 12000
aggagggcga gtacttggaa gactgatggc gcgacccgta tttttgctag atggaacagc 12060
agcaggcacc ggaccccgca atgcgggcgg cgctgcagag ccagccgtcc ggcattaact 12120
cctcggacga ttggacccag gccatgcaac gcataatggc gctgacgacc cgcaaccccg 12180
aagcctttag acagcaaccc caggccaacc gcctttctgc catactggag gccgtagtgc 12240
cctcccgctc caaccccacc cacgagaagg tcctggctat cgtgaacgcg ctggtggaga 12300
acaaggccat ccgtcccgat gaggccgggc tggtatacaa tgctctcttg gagcgcgtgg 12360
cccgttacaa cagcagcaac gtgcaaacca acctggaccg gatggtgacc gatgtgcgcg 12420
aggccgtgtc tcagcgcgag cgattccagc gcgacgccaa cttggggtcg ttggtagcgc 12480
taaacgcttt cctcagcacc cagcccgcca acgtgccccg tggtcagcaa gactatacaa 12540
actttttgag tgcattgaga ctcatggtag ctgaggtgcc ccagagcgag gtgtaccagt 12600
ccgggccaga ttacttcttc cagaccagca gacagggctt gcagacagtg aacctgactc 12660
aggctttcaa gaacctgaag ggtctgtggg gagtgcacgc cccagtaggg gatcgcgcga 12720
ccgtgtctag cttgctgact cccaactccc gcctgctgct gctgctggta tcccccttta 12780
ctgacagcgg tagcattgac cgcaactcgt acttgggcta cctgcttaac ctgtatcgcg 12840
aggccatagg acagagccag gtggacgagc agacctatca agaaatcacc caagtgagcc 12900
gcgccctggg tcaggaagac acgggcagtt tggaagccac cctgaacttc ttgctaacca 12960
accggtcaca gaagatccct cctcagtatg cgcttaccgc tgaggaggag cggatcctca 13020
gatacgtgca acagagcgtt ggactgttcc tgatgcagga gggggcgaca cctaccgccg 13080
cgctggacat gacagctcga aacatggagc ccagcatgta tgctagtaac aggcctttca 13140
ttaacaaact gctggactac ctgcacaggg cggccgccat gaactctgat tatttcacca 13200
atgctatcct gaacccacac tggctgcccc cacctggttt ctacactggc gagtacgaca 13260
tgcccgaccc caatgacggg ttcctgtggg acgatgtgga cagcagcata ttttccccgc 13320
ctcccggtta tacagtttgg aagaaggaag ggggcgatag aagacactct tccgtgtcgc 13380
tatccggaac ggctggtgct gccgcgaccg tgcccgaagc tgcaagtcct ttccctagct 13440
tgcccttttc actaaacagc gttcgcagca gtgaactggg gagaataacc cgcccgcgct 13500
tgatgggcga ggatgagtac ttgaatgact ctttgctgag gccagagagg gaaaagaact 13560
tccccaacaa tggaatagag agtctggtgg ataagatgag tagatggaag acctatgcgc 13620
aggatcacag agacgagccc aggatcttgg gggctacaag cagaccgatc cgtagacgcc 13680
agcgccacga caggcagatg ggtcttgtgt gggacgatga ggactctgcc gatgatagca 13740
gcgtgttgga cttgggtgga agaggagggg gcaacccgtt cgctcatctg cgtcccagat 13800
tcgggcgcat gttgtaaaag tgaaagtaaa ataaaaaggc aactcaccaa ggccatggcg 13860
accgagcgtg cgttcgttct tttttgttat ctgtgtctag tacgatgagg agacgagccg 13920
tgctaggcgg agcggtggtg tatccggagg gtcctcctcc ttcttacgag agcgtgatgc 13980
agcaacaggc ggcgatgata cagcccccac tggaggctcc cttcgtaccc ccacggtacc 14040
tggcgcctac ggaagggaga aacagcattc gttactcgga gctgtcgccc ctgtacgata 14100
ccaccaagtt gtatctggtg gacaacaagt cggcggacat cgcctccctg aactatcaga 14160
acgaccacag caacttcctg accacggtgg tgcagaacaa tgactttacc cccacggagg 14220
ctagcaccca gaccatcaac tttgacgagc ggtcgcgatg gggcggtcag ctgaagacca 14280
tcatgcacac caacatgccc aacgtgaacg agtacatgtt cagcaacaag ttcaaggcga 14340
gggtgatggt gtccagaaaa gctcctgaag gtgttacagt aaatgacacc tatgatcata 14400
aagaggatat cttgaagtat gagtggtttg agttcatttt accagaaggc aacttttcag 14460
ccaccatgac gatcgacctg atgaacaatg ccatcattga caactacctg gaaattggca 14520
gacagaatgg agtgctggaa agtgacattg gtgttaagtt tgacactaga aatttcaggc 14580
tcgggtggga ccccgaaact aagttgatta tgccaggtgt ctacacttat gaggcattcc 14640
atcctgacat tgtattgctg cctggttgcg gggtagactt tactgaaagc cgacttagca 14700
acttgcttgg catcaggaag agacatccat tccaggaggg tttcaaaatc atgtatgaag 14760
atcttgaagg gggtaatatt cctgcccttt tggatgtcac tgcctatgag gaaagcaaaa 14820
aggataccac tactgaaaca accacactgg ctgttgcaga ggaaactagt gaagatgatg 14880
atataactag aggagatacc tatataactg aaaaacaaaa acgtgaagct gcagctgctg 14940
aagttaaaaa agagttaaag atccaacctc tagaaaaaga cagcaagagt agaagctaca 15000
atgtcttgga agacaaaatc aacacagcct accgcagttg gtacctgtcc tacaattacg 15060
gtaaccctga gaaaggaata aggtcttgga cactgctcac cacttcagat gtcacctgtg 15120
gggcagagca ggtctactgg tcgctccctg acatgatgca agacccagtc accttccgct 15180
ccacaagaca agtcaacaac tacccagtgg tgggtgcaga gcttatgccc gtcttctcaa 15240
agagtttcta caatgagcaa gccgtgtact ctcagcagct ccgacaggcc acttcgctca 15300
cgcacgtctt caaccgcttc cctgagaacc agatcctcat ccgcccgccg gcgcccacaa 15360
ttaccaccgt cagtgaaaac gttcctgctc tcacagatca cgggaccctg ccgttacgca 15420
gcagtatccg gggagtccag cgcgtgaccg ttactgacgc cagacgccgc acctgtccct 15480
acgtttacaa ggccctgggc atagtcgcgc cgcgcgttct ttcaagccgc actttctaaa 15540
aaaaaaaaaa atgtccattc tcatctcgcc cagtaataat accggttggg gactgtatgc 15600
gcccaccaag atgtatggag gcgcccgcaa gcgctctacc cagcatcctg tgcgcgttcg 15660
cggtcatttc cgcgctccct ggggcgcact caagggtcgt acccgcactc ggaccacggt 15720
cgatgatgtg atcgaccagg tggtcgccga tgctcgtaat tatactccta ctgcgcctac 15780
atctactgtg gatgcagtta ttgacagtgt ggtggcagac gcccgcgcct atgctcgccg 15840
gaagagccga aggaggcgca tcgccaggcg ccacagggct actcccgcca tgcgagccgc 15900
aaaagctatt ctgcggaggg ccaaacgtgt ggggcgaaga gccatgctta gagcggccag 15960
acgcgcggct tcaggtgcca gcagcggcag gtcccgcagg cgcgcggcca cggcggcagc 16020
agcggccatt gccaacatgg cccaaccgcg aagaggcaat gtgtactggg tgcgtgatgc 16080
cactaccggc cagcgcgtgc ccgtgcgcac ccgcccccct cgcacttaga agatactgag 16140
cagtctccga tgttgtgtcc cagcggcaag tatgtccaag cgcaaataca aggaagagat 16200
gctccaggtc atcgcgcctg aaatctacgg tccgccggtg aaggatgaaa aaaagccccg 16260
caaaatcaag cgggtcaaaa ataacaaaaa ggaagaagat gacgatgatg ggctggtgga 16320
gtttgtgcgc gagttcgccc caagacggcg cgtgcagtgg cgcgggcgca aagtgcgtca 16380
agtgctcaga cccgggacca ctgtggtttt tacacctggc gagcgttcca gcactacttt 16440
taaacggtcc tatgatgagg tgtacgggga tgacgatatt cttgagcagg cggcagaccg 16500
ccttgacgag tttgcttatg gcaagcgcac tagatccagt cccaaagagg aggctgtgtc 16560
cattcctttg gatcatggaa atcccacccc cagcctcaaa ccagtcaccc tgcagcaagt 16620
gctgcccgtg cctgcgcgga gaggcgtaaa gcgcgagggt gaggacctat atcccaccat 16680
gcagctaatg gtgcccaagc gccagaggct agaagacgta ctggagaaaa tgaaagtgga 16740
tgccgatatc cagcctgagg tcaaagtaag acctatcaag gaagtggcgc caggtttggg 16800
agtacaaacc ttcgacatca agattcccac cgagtccatg gaagtgcaga ccgaacctgc 16860
aaaacccacc acctcaattg aggtgcaaac ggaaccctgg atgcccgcgc ccgttgccgc 16920
ccccagcacc actcgaagat cacgacgaaa gtacggccca gcaagtctgc taatgcccaa 16980
ctatgctctg cacccatcca tcattcccac tccgggttac agaggcactc gctactatcg 17040
aaaccggagc aacacctctc gccgccgcaa accacctgca agtcgcactc gccgtcgccg 17100
ccgccgcaac actgccagca aattgactcc cgccgccctg gtgcggagag tgtaccgcga 17160
tggtcgcgct gaacctctga cgctgccgcg cgcgcgctac catccaagca tcaccactta 17220
atgactgttg acgctgcctc cttgcagata tggccctcac ttgccgcctt cgcgtcccca 17280
ttactggcta ccgaggaaga aactcgcgcc gtagaaggat gttggggcga gggatgcgcc 17340
gccacagacg aaggcgcgct atcagcagac gattaggggg tggctttttg ccagctctta 17400
tacccatcat cgccgcagcg atcggggcga taccaggcat agcttcagtg gcggttcagg 17460
cctcgcagcg ccactaacat tggaaaaaac ttataaataa aaaatagaat ggactctgac 17520
gctcctggtc ctgtgactat gtttttgtag agatggaaga catcaatttt tcatccctgg 17580
ctccgcgaca cggcacgagg ccgtacatgg gcacctggag cgacatcggc acgagccaac 17640
tgaacggggg cgccttcaat tggagcagta tctggagcgg gcttaaaaat tttggctcga 17700
ccgtaaaaac ctatgggaac aaagcttgga acagcagcac agggcaggct ctgagaaata 17760
agcttaagga acaaaacttc caacagaagg tggtcgatgg gatcgcctct ggtattaacg 17820
gcgtagtgga tctggccaac caggctgtac aaaaacagat aaacagccgc ctggacccgc 17880
cgcccgcaac ccctggtgaa atggaagtgg aggaagaact tcctccgctg gaaaagcggg 17940
gcgacaagcg tccgcgaccc gagctagagc agacgctggt gacgcgcgca gacgagcccc 18000
cttcatatga ggaggcagta aagctcggaa tgcccactac caggcctgta gctcacatgg 18060
ctaccggggt gatgaaacct tctcagtcac atcgacccgc caccttggac ttgcctcctc 18120
cccctgcttc tgcggcgcct gttcccaaac ctgtcgctac cagaaagccc accgccgtac 18180
agcccgtcgc cgtagccaga ccgcgtcctg ggggcacacc gcgcccgaaa gcaaactggc 18240
aaagtactct gaacagcatc gtgggtctgg gcgtgcagag tgtaaagcgc cgtcgctgct 18300
attaattaaa tatggagtag cgcttaactt gcttgtctgt gtgtatgtat catcaccacg 18360
ccgccgcagc agaggagaaa ggaagaggtc gcgcgccgag gctgagttgc tttcaagatg 18420
gccaccccat cgatgatgcc ccaatgggca tacatgcaca tcgccggaca ggatgcttcg 18480
gagtacctca gtccgggtct ggtgcagttc gcccgtgcaa cagacaccta cttcagtatg 18540
gggaacaaat ttagaaaccc cacagtggcg cccacccacg atgtgaccac cgaccgtagc 18600
cagcgcctga tgctgcgctt cgtgcccgtt gaccgggaag acaataccta ctcttacaaa 18660
gttcgctaca cgctggctgt aggcgacaac agagtgcttg acatggccag cacattcttt 18720
gacattcggg gggtgcttga tagaggtcct agcttcaagc catattccgg cacagcttac 18780
aattcactcg ctcctaaggg cgcgcccaat acatctcagt ggatagttac aacaaatggg 18840
gacaatgcag taactaccac cacaaacaca tttggcattg cttccatgaa gggagacaat 18900
attactaaag aaggtttgca aattgggaaa gacattacca ctactgaagg agaagaaaag 18960
cccatttatg ccgataaaac atatcagcca gagcctcaag ttggagaaga atcatggact 19020
gatactgatg gaacaaatga aaagtttggt ggaagagccc ttaaaccagc taccaacatg 19080
aagccatgct acgggtcttt tgcaagacct acaaacataa aagggggcca agctaaaaac 19140
agaaaagtaa aaccaacaac cgaaggaggg gttgaaactg aggaaccaga tattgatatg 19200
gaatttttcg atggtagaga tgctgttgca ggagctttag cgcctgaaat tgtgctttat 19260
acggaaaatg taaatttgga aactccagac agtcatgtgg tatataaacc agaaacgtct 19320
aataactctc atgcaaattt gggtcaacaa gccatgccta acagacccaa ttacattggc 19380
ttcagggata acttcgtagg cctaatgtac tacaacagta ctggaaatat gggagttttg 19440
gctggccaag catcacaact gaatgcagtg gttgacttgc aggacagaaa tactgaactg 19500
tcatatcagc ttttgcttga ttctctggga gacagaacca gatacttcag catgtggaat 19560
caggctgtgg acagttacga tcccgatgtt cgcattattg aaaatcatgg catcgaggat 19620
gaactgccta attactgttt tcctctgaat ggcataggac cagggcacac atatcaaggc 19680
attaaagtta aaaccgatga cactaatgga tgggaaaaag atgctaatgt tgctccagct 19740
aatgaaataa ccataggcaa caacctggct atggaaatta atatccaagc taacctttgg 19800
agaagttttc tgtactctaa tgtggctttg taccttccag atgtttacaa gtacacgcca 19860
cctaacatta ctttgcccac taacaccaac acctatgagt acatgaacgg gcgagtggta 19920
tccccatccc tggttgattc atacatcaac attggcgcca ggtggtctct tgacccaatg 19980
gacaatgtga atccattcaa ccaccaccgc aatgctggtc tgcgctacag gtccatgctt 20040
ctgggaaatg gtcgttatgt gcctttccac atacaagtgc ctcagaaatt ctttgctgtc 20100
aagaacctac ttcttctacc tggctcctac acctacgagt ggaacttccg aaaggatgtg 20160
aacatggtcc tgcaaagttc ccttggaaat gacctcagaa cggatggtgc taccataagt 20220
ttcaccagca tcaatctcta tgccaccttc ttccccatgg ctcacaacac agcttccacc 20280
cttgaagcca tgctgcgcaa cgataccaat gatcagtcat ttaacgacta cctctctgca 20340
gctaacatgc tttaccccat tcctgccaat gcaaccaaca ttccaatttc catcccatct 20400
cgcaactggg cagccttcag gggctggtcc ttcaccagac tcaaaaccaa ggagactcca 20460
tctcttggat cagggttcga tccctacttc gtatattctg gatctattcc ctacctggat 20520
ggcacctttt accttaacca cactttcaag aaggtctcca tcatgtttga ctcctcagtc 20580
agctggcctg gcaatgacag gctgttgagt ccaaatgagt ttgaaatcaa gcgcactgtg 20640
gacggggaag gatacaacgt ggcacaatgc aacatgacca aagactggtt cctggttcag 20700
atgcttgcca attacaacat tggctaccag ggcttttaca tccctgaggg atacaaggat 20760
cgcatgtact cctttttcag aaacttccag cctatgagca ggcaggtggt tgatgaggtt 20820
aattacactg actacaaagc cgtcacctta ccataccaac acaacaactc tggctttgta 20880
gggtaccttg cacctactat gagacaaggg gaaccttacc cagccaatta tccatacccg 20940
ctcatcggaa ctactgccgt taagagtgtc acccagaaaa agttcctgtg cgacaggacc 21000
atgtggcgca ttcccttctc cagcaacttc atgtccatgg gggcccttac cgacctggga 21060
cagaacatgc tctatgccaa ctcagcccat gcgctggaca tgacttttga ggtggatccc 21120
atggatgagc ccaccctgct ttatcttctt ttcgaagtct tcgacgtggt cagagtgcac 21180
cagccacacc gcggcgtcat cgaggccgtc tacctgcgca caccgttctc ggccggcaac 21240
gccaccacat aagaagcctc ttgcttcttg caagcagcag ctgcagccat gacatgcggg 21300
tccggaaacg gctccagcga gcaagagctc aaagccatcg tccgagacct gggctgcgga 21360
ccctatttcc tgggaacctt tgacaagcgt ttcccggggt tcatggcccc cgacaagctc 21420
gcctgcgcca tagtcaacac tgccggacgc gagacggggg gagagcactg gctggctttt 21480
ggttggaacc cgcgctacaa cacctgctac ctttttgatc cttttgggtt ctcggatgag 21540
cggctcaaac agatttacca gtttgagtac gaggggctcc tgcgtcgcag tgcccttgct 21600
accaaagacc gctgcatcac cctggagaag tctacccaaa gcgtgcaggg tccgcgctca 21660
gccgcctgtg gacttttttg ctgtatgttc cttcatgcct ttgtgcactg gcccgaccgc 21720
cccatggacg gaaaccccac catgaagttg ctgactgggg tgtccaacag catgctccaa 21780
tcaccccaag tccagcccac cctgcgccgc aaccaggagg tgctataccg cttcctaaac 21840
acccactcat cttactttcg ttctcaccgc gcgcgcattg aaagggccac cgcgtttgac 21900
cgtatggata tgcaataagt catgtaaaac cgtgttcaat aaacagcact ttatttttac 21960
atgcactgag gctctggttt tgctcatttg tttcatcatt tactcagaag tcgaatgggt 22020
tctggcggga gtcagagtga cccgcgggca gggatacgtt gcggaactgt aacctgttct 22080
gccacttgaa ctcggggatt accagcttgg gaactggaat ctcgggaaag gtgtcttgcc 22140
acaactttct ggtcagttgc atagcgccaa gcaggtcagg agcagagatc ttgaaatcac 22200
agttggggcc ggcattctgg acacgggagt tgcgatacac tgggttgcaa cactggaaca 22260
ctatcaacgc tgggtgtctt acgcttgcca acacggttgg gtcactgatg gtagtcacat 22320
ccaagtcttc agcattggcc atcccaaagg gggtcatctt acatgtctgc ctgcccatca 22380
cgggagcgca gcctggcttg tggttgcaat cacaatgaat ggggatcagc atcatcctgg 22440
cttggtcggg agttatccct gggtacacag ccttcatgaa ggcttcgtac tgcttaaaag 22500
cttcctgggc cttacttccc tcggtgtaga acatcccaca ggacttgctg gaaaattgat 22560
tagtagtaca gttggcatca ttcacacaac agcgggcatc gttgttggcc aactgaacca 22620
catttctgcc ccagcggttt tgggtgatct tggctctgtc tggattctcc ttcatagcgc 22680
gctgcccgtt ctcgctcgcc acatccatct cgataatgtg gtccttctgg atcatgatag 22740
tgccatgcag gcatttcacc ttgccttcat aatcggtgca tccatgagcc cacagagcgc 22800
acccggtgca ctcccaatta ttgtgggcga tctcagaata ataatgtacc aatccctgca 22860
tgaatcttcc catcattgtt gtcaaggtct tcatgctggt aaatgtcagc gggatgccac 22920
ggtgctcctc gttcacatac tggtggcaga tacgcttgta ttgctcgtgc tgctctggca 22980
tcagcttgaa agaggttctc agatcattat ccagcctgta cctttccatt agcacagcca 23040
tcacttccat gcccttctcc caggcagata ccaggggcag actcaaagga ttcctaacag 23100
caataaaagt agctccttta gctatagggt cattcttgtc gatcttctca acacttctct 23160
tgccatcctt ctcaatgatg cgcaccgggg ggtagctgaa gcccacggcc accaactgag 23220
cctgttctct ttcttcttca ctatcctggc tgatgtcttg cagagggaca tgcttggtct 23280
tcctgggctt cttcttggga gggatcgggg gaggactgtt gctccgctcc ggagacaggg 23340
atgactgcga agtttcgctt accaatacca cctggctctc ggtagaagaa ccggacccca 23400
cacgacggta ggtgttcctc ttcgggggca gaggtggagg cgactgagat gggctgcggt 23460
ctggccttgg aggcggatgg ctggcagagc tcattccgcg ttcgggggtg tgctcccggt 23520
ggcggtcgct tgactgattt cctccgcggc tggccattgt gttctcctag gcagagaaac 23580
aacagacatg gaaactcagc catcactgcc aacatcgctg caagcaccat cacacctcgc 23640
ccccagcagc gacgaggagg agagcttaac caccccacca cccagtcccg ctaccaccac 23700
ctctaccctc gatgatgagg aggaggtcga cgcagcccag gagatgcagg cgcaggataa 23760
tgtgaaaacg gaagagattg aggcagatgt cgagcaggac ccgggctatg tgacgccggc 23820
ggagcaccag gaggagctga aacgctttct agacagagag gatgacgacc gcccagagca 23880
tcaagcagat ggcgtttacc aggaggctgg gatcagggat catgtcgccg actacctcac 23940
cggccttggt ggggaggacg tgctcctcaa acatctagca aggcagtcga tcatagttaa 24000
agacgcattg ctcgatctca ctgaagtgcc catcagtgtg gaagagctta gccgcgccta 24060
cgagctgaac ctcttttcgc ctcaggtacc ccccaagcgg cagccaaacg gcacctgcga 24120
ggccaaccct cgactcaact tctatccagc ttttactatc cccgaagtgt tggccaccta 24180
ccacatcttt ttcaagaacc aaaagattcc agtctcctgc cgcgccaacc gcacccgcgc 24240
cgatgccctg ctcaacttgg gtccgggagc tcgcttacct gatatagctt ccttggaaga 24300
ggttccaaag atctttgagg gtctgggaag tgatgagaca cgggccgcaa atgctctgca 24360
acagggagag aatgacatgg atgaacacca cagcgctctg gtggaactgg agggtgacaa 24420
tgcccggatt gcagtgctca agcgcagtat cgtggtcacc cattttgcct accccgctgt 24480
taacctgccc cccaaagtta tgagcgctgt catggaccat ctgctcatca aacgagcaag 24540
acctctttca gaaaaccaga acatgcagga tccagacgcc tcggacgagg gcaagccggt 24600
agtcagtgac gagcagctat ctcgctggct gggtaccaac tccccccgag atttggaaga 24660
gaggcgcaag cttatgatgg ctgtagtgct agtaactgtg gagctggagt gtctgcgccg 24720
ctttttcacc gaccctgaga ccctgcgcaa gctagaggag aacctgcact acacctttag 24780
acatggcttc gtgcggcagg catgcaagat ctccaacgtg gagcttacca acctggtttc 24840
ttacatgggc attttgcatg agaaccgact agggcagagc gtcctgcaca ccacccttaa 24900
aggggaggcc cgccgtgact acatccgaga ctgtgtctac ctctacctct gccatacctg 24960
gcaaactggt atgggtgtgt ggcaacagtg tttggaagag cagaacctaa aagagctgga 25020
caagctcttg cagagatccc tcaaagccct gtggacaggt tttgatgagc gcaccgtcgc 25080
ctcggacctg gcagacatca tcttccccga gcgtctcagg gttactctgc gaaacggcct 25140
gccagacttt atgagccaga gcatgcttaa caactttcgc tctttcatcc tggaacgctc 25200
cggtatcctg cctgccacct gctgtgcgct gccctccgac tttgtgcctc tcacctaccg 25260
cgagtgccca ccgccgctat ggagccactg ctacctgttc cgcctggcca actacctctc 25320
ctaccactcg gatgttatag aggatgtgag cggagacggc ctgctggaat gccactgccg 25380
ctgcaatctt tgcacacccc accgctccct tgcctgcaac ccccagttgc tgagcgagac 25440
ccagattatc ggcaccttcg agctgcaggg tcccagaagt aaaggcgagg ggtcttctcc 25500
ggggcagagt ttgaaactga caccggggct gtggacctcc gcctacctgc gcaagtttca 25560
ccccgaggac taccatccct atgagatcag gttctatgag gaccaatcac atcctcccaa 25620
agtcgagctc tcagcctgcg tcatcaccca gggagcaatt ctggcccaat tgcaagccat 25680
ccaaaaatct cgccaagaat ttctgctaaa aaagggaaac ggggtctacc ttgaccctca 25740
gaccggtgag gagctcaaca caaggttccc ccaggatgtc ccatcgccga ggaagcaaga 25800
agttgaaggt gcagctgtcg cccccagagg atatgaagga agactgggac agtcaggcag 25860
aggaggagat ggaagattgg gacagccagg cagaggaggt ggacagcctg gaggaagaca 25920
gtttggagga ggaagacgag gaggcagagg aggtggaaga agcaaccgcc gccaaacagt 25980
tgtcatcggc ggcggagaca agcaagtccc cagacagcag cacggctacc atctccgctc 26040
cgggtcgggg ggcccagcgg cggcccaaca gtagatggga cgagaccggg cgattcccaa 26100
acccgaccac cgcttccaag accggtaaga aggagcgaca gggatacaag tcctggcgtg 26160
gacataaaaa cgctatcatc tcctgcttgc atgaatgcgg gggcaacata tccttcaccc 26220
ggcgatacct gctcttccac cacggtgtaa acttcccccg caatatcttg cattactacc 26280
gtcacctcca cagcccctac tgcagtcagc aagtcccggc aaccccgaca gaaaaataca 26340
gcagcgacaa cggtgaccag aaaaccagca gttagaaaat ccacaacaag tgcaccagga 26400
ggaggactga ggatcacagc gaacgagcca gcgcagacca gagagctgag gaaccggatc 26460
tttccaaccc tctatgccat tttccagcag agtcgggggc aagagcagga actgaaagta 26520
aaaaaccgat ctctgcgctc gctcaccaga agttgtttgt atcacaagag cgaagaccaa 26580
cttcagcgca ctctcgagga cgccgaggct ctcttcaaca agtactgcgc gctgactctt 26640
aaagagtagc ccttgcccgc gctcattttg aaaacggcgg gaatcacgtc acccttggca 26700
cctgtccttt gcccttgtca tgagtaaaga gattcccacg ccttacatgt ggagctatca 26760
gccccaaatg gggttggcag caggcgcttc ccaggactac tccacccgca tgaattggct 26820
tagcgccggg ccctcaatga tatcacgggt taatgatata cgagcttatc gaaaccagtt 26880
actcctagaa cagtcagctc tcaccaccac accccgtcaa caccttaatc cccgaaattg 26940
gcccgccacc ctggtgtacc aggaaaatcc cgctcccacc accgtactac ttcctcgaga 27000
cgcccaggcc gaagttcaga tgactaacgc aggtgtacag ctggcgggcg gttccgccct 27060
atgtcgtcac cgacctcaac agagtataaa acgcctggtg attagaggcc gaggtatcca 27120
gctcaacgac gagtcggtta gctcttcgct tggtctgcga ccagacggag tcttccaaat 27180
cgccggctgt gggagatctt ccttcactcc tcgtcaggct gtgctgactt tggagagttc 27240
gtcctcgcag ccccgctcgg gcggcattgg aactctccag tttgtggagg agtttactcc 27300
ctctgtctac ttcaacccct tctccggctc tcctggccag tacccggacg agttcatacc 27360
aaacttcgac gcaatcagcg agtcagtgga tggctatgat tgatgtctaa tggtggtgcg 27420
gctgagctag ctcgactgcg acacctagac cactgccgcc gctttcgctg cttcgcccgg 27480
gaactcaccg agttcatcta cttcgaactc tccgaggagc accctcaggg tccggcccac 27540
ggagtgcgga ttaccatcga agggggaata gactctcgcc tgcatcgcat cttctcccag 27600
cggcccgtgc taattgaacg cgaccaggga aatacaacca tctccatcta ctgcatctgt 27660
aaccaccccg gattgcatga aagcctttgc tgtcttgttt gtgctgagtt taataaaaac 27720
tgagttaaga ccctcctacg gactaccgct tcttcaatca ggactttaca acaccaacca 27780
gatcttccag aagacccaga cccttcctcc tttcatccag gactctaact ctaccttacc 27840
agcaccctcc actactaacc ttcccgaaac aaacaagctt gcatctcatc tgcaacaccg 27900
cctttcacga agccttcttt ctgccaatac taccactccc aaaaccggag gtgagctccg 27960
cggtcttcct actgacgacc cctgggtggt agcgggtttt gtaacgttag gagtagttgc 28020
gggtgggctt gtgctgatcc tttgctacct atacacacct tgctgtgcat atttagtcat 28080
attgtgctgt tggtttaaga aatgggggcc atactagtcg tgcttgcttt actttcgctt 28140
ttgggtctgg gctctgctaa tctcaatcct ctcgatcacg atccatgttt agacttcgac 28200
ccagaaaact gcacacttac ttttgcaccc gacacaagcc gtctctgtgg agttcttatt 28260
aagtgcggat gggactgcag gtccgttgaa attacacata ataacaaaac atggaacaat 28320
accttatcca ccacatggga gccaggagtt ccccagtggt atactgtctc tgtccgaggt 28380
cctgacggtt ccatccgcat tagtaacaac actttcattt tttctgaaat gtgcgatctg 28440
gccatgttca tgagcagaca gtatgaccta tggcctccca gcaaagagaa cattgtggca 28500
ttttccattg cttattgctt ggtaacatgc atcatcactg ctatcatttg tgtgtgcata 28560
cacttgctta tagttattcg ccctagacaa agcaatgagg aaaaagagaa aatgccttaa 28620
cctttttcct catacctttt ctttacagca tggcttctgt tacagctcta attattgcca 28680
gcattgtcac tgtcgctcac gggcaaacaa ttgtccatat taccttagga cataatcaca 28740
ctcttgtagg gcccccaatt acttcagagg ttatttggac caaacttgga agtgttgatt 28800
attttgatat aatttgcaac aaaactaaac caatatttgt aatctgtaac agacaaaatc 28860
tcacgttaat taatgttagc aaaatttata acggttacta ttatggttat gacagatcca 28920
gtagtcaata taaaaattac ttagttcgca taactcagcc caaattaaca gtgccaacta 28980
tgacaataat taaaatggct aataaagcat tagaaaattt tacatcacca acaacaccca 29040
atgaaaaaaa cattccaaat tcaatgattg caattattgc ggcggtggca ttgggaatgg 29100
cactaataat aatatgcatg ctcctatatg cttgttacta taaaaagttt caacataaac 29160
aggatccact actaaatttt aacatttaat tttttataca gatgatttcc actacaattt 29220
ttatcattac tagccttgca gctgtaactt atggccgttc acacctaact gtacctgttg 29280
gctcaacatg tacactacaa ggaccccaag aaggctatgt cacttggtgg agaatatatg 29340
ataatggagg gttcgctaga ccatgtgatc agcctggtac aaaattttca tgcaacggaa 29400
gagacttgac cattattaac ataacatcaa atgagcaagg cttctattat ggaaccaact 29460
ataaaaatag tttagattac aacattattg tagtgccagc caccacttct gctccccgca 29520
aatccacttt ctctagcagc agtgccaaag caagcacaat tcctaaaaca gcttctgcta 29580
tgttaaagct tccaaaaatc gctttaagta attccacagc cgctcccaat acaattccta 29640
aatcaacaat tggcatcatt actgccgtgg tagtgggatt aatgattata tttttgtgta 29700
taatgtacta cgcctgctgc tatagaaaac atgaacaaaa aggtgatgca ttactaaatt 29760
ttgatattta attttttata gaattatgat attgtttcaa tcaaatacca ctacctccta 29820
tgcatacaca aacattcagc ctaaatacgc tatgcaacta gaaatcacaa tactaattgt 29880
aattggaatt cttatactat ctgttattct ttattttata ttctgccgtc aaatacccaa 29940
tgttcataga aattctaaaa gacgtcccat ctattctcct atgattagtc gtccccatat 30000
ggctctgaat gaaatctaag atcttttttt ttttctctta cagtatggtg aacatcaatc 30060
atgatcccta gaaatttctt cttcaccata ctcatctgtg cttttaatgt ctgtgctact 30120
ttcacagcag tagccactgc aagcccagac tgtataggac catttgcttc ctatgcactt 30180
tttgccttcg ttacttgcat ctgcgtgtgt agcatagtct gcctggttat taattttttc 30240
caactggtag actggatctt tgtgcgaatt gcctacctac gtcaccatcc cgaataccgc 30300
aatcaaaatg ttgcggcact tcttaggctt atttaaaacc atgcaggcta tgctaccagt 30360
cattttaatt ttgctactac cctgcattcc cctagcttcc accgccactc gcgctacacc 30420
tgaacaactt agaaaatgca aatttcaaca accatggtca tttcttgatt gctaccatga 30480
aaaatctgat tttcccacat actggatagt gattgttgga ataattaaca tactttcatg 30540
tacctttttc tcaatcacaa tataccccac atttaatttt gggtggaatt ctcccaatgc 30600
actgggttac ccacaagaac cagatgaaca tattccacta caacacatac aacaaccact 30660
agcactggta cagtatgaaa atgagccaca accttcactg ccccctgcca ttagttactt 30720
caacctaacc ggcggagatg actgacccaa tcgccacatc atccaccgct gccaaggagc 30780
tgctggacat ggacggacgt gcctcagaac agcgactcat ccaactacgc attcgtcagc 30840
agcaggaacg agcagtaaaa gagctaaggg atgccattgg gattcaccag tgcaaaaaag 30900
gcatattctg cttagtaaaa caatccaaaa tctcctacga gatcaccgct actgaccatc 30960
gtctctcata cgagctcggt ccgcagcgac aaaaattcac ctgcatggtg ggaatcaacc 31020
ccatagttat cacccagcag tctggagata ctaagggttg tatccagtgt tcctgtgatt 31080
ccaccgagtg catctacaca ctgctgaaga ccctctgcgg ccttcgagac ctcctaccca 31140
tgaactaatc attgccccta ccttacccaa tcaaaatatt aataaagaca cttacttgaa 31200
atcagcaata cagtctttgt caaaactttc taccagcagc acctcaccct cttcccaact 31260
ctggtactct aaacgtcgga gggtggcata ctttctccac actttgaaag ggatgtcaaa 31320
ttttatttcc tcttctttgc ccacaatctt catttcttta tccccagatg gccaagcgag 31380
ctcggctaag cacttccttc aacccggtgt acccttatga agatgaaagc agctcacaac 31440
acccatttat aaatcctggt ttcatttccc ctgacgggtt cacacaaagt ccaaacgggg 31500
ttttaagtct taaatgtgtt aatccactta ccactgcaag cggctccctc caacttaaag 31560
tgggaagtgg tcttacagta gacactactg atggatcctt agaagaaaac atcaaagtta 31620
acacccccct aacaaagtca aaccattcta taaatttacc aataggaaac ggtttgcaaa 31680
tagaacaaaa caaactttgc agtaaactcg gaaatggtct tacatttgac tcttccaatt 31740
ctattgcact gaaaaataac actttatgga caggtccaaa accagaagcc aactgcataa 31800
ttgaatacgg gaaacaaaac ccagatagca aactaacttt aatccttgta aaaaatggag 31860
gaattgttaa tggatatgta acgctaatgg gagcctcaga ctacgttaac accttattta 31920
aaaacaaaaa tgtctccatt aatgtagaac tatactttga tgccactggt catatattac 31980
cagactcatc ttctcttaaa acagatctag aactaaaata caagcaaacc gctgacttta 32040
gtgcaagagg ttttatgcca agtactacag cgtatccatt tgtccttcct aatgcgggaa 32100
cacataatga aaattatatt tttggtcaat gctactacaa agcaagcgat ggtgcccttt 32160
ttccgttgga agttactgtt atgcttaata aacgcctgcc agatagtcgc acatcctatg 32220
ttatgacttt tttatggtcc ttgaatgctg gtctagctcc agaaactact caggcaaccc 32280
tcataacctc cccatttacc ttttcctata ttagagaaga tgactgacaa caaaaataaa 32340
gttcaacatt ttttattgaa attcctttta cagtattcga gtagttattt tgcctccccc 32400
ttcccattta acagaataca ccaatctctc cccacgcaca gctttaaaca tttggatacc 32460
attagagata gacatagttt tagattccac attccaaaca gtttcagagc gagccaatct 32520
ggggtcagta atacataaaa atgcatcggg atagtctttt aaagcgcttt cacagtccaa 32580
ctgttgcgga tgcgactccg gagtctgaat cacggtcatc tggaagaaga acgatgggaa 32640
tcataatccg aaaacggaat cgggcgattg tgtctcatca aacccacaag caaccgctgt 32700
ctgcgtcgct ccgtgcgact gctgtttatg ggatcggggt ccgcagtgtc ctgaagcatg 32760
attttaatag cccttaacat taactttctg gtgcgatgcg cgcagcaacg cattctgatt 32820
tcacttagat tactacagta ggtacagcac attatcacaa tattgtttaa taaaccataa 32880
ttaaaagcgc tccagccaaa actcatatct gatataatcg cccctgcatg accatcatac 32940
caaagtttaa tataaattaa atgtcgttcc ctcaaaaaca cactacccac atacatgatc 33000
tcttttggca tgtgcatatt aacaatttgt ctgtaccatg gacaacgttg gttaatcatg 33060
caacccaata taaccttccg gaaccacact gccaacaccg ctcccccagc catgcattga 33120
agtgaaccct gctgattaca atgacaatga agaacccaat tctctcgacc atgaatcact 33180
tgagactgaa aaatatctat agtagcacaa caaagacata aatgcatgca tcttctcata 33240
atttttaact cctctggatt taaaaacata tcccaaggaa tgggaaactc ttgcagaaca 33300
gtaaagctgg cagaacaagg aagaccacga acacaactta cactatgcat agtcatagta 33360
tcacaatctg gcaacagcgg gtggtcttca gtcatagaag ctcgggtttc attttcctca 33420
catcgtggta attgggctct ggtgtaaggg tgatgtctgg cgcatgatgt ggagcgtgcg 33480
cgcaaccttg tcataatgga gttgcttcct gacattctcg tattttgtat agcaaaacgc 33540
tgccctggca caacacactc ttcttcgtct tctatcctgc cgcttagtgt gttccgtctg 33600
ataattcaag tacagccaca ctcttaagtt ggtcaaaaga atgctggctt cagttgtaat 33660
caaaactcca tcatatttaa ttgttctaag gaaatcatcc acggtagcat atgcaaatcc 33720
caaccaagca atgcaactgg attgcgtttc aagcagcaga ggagagggaa gagacggaag 33780
aatcatgtta atttttattc caaacgatct cgcagtactt caaattgtag atcgcgcaga 33840
tggcatctat cgcccccact gtgttggtga aaaagcacag ctaaatcaaa agaaatgcga 33900
ttttcaaggt gctcaacggt ggcttccaac aaagcctcca cgcgcacatc caaaaacaaa 33960
agaataccaa aagaaggagc attttctaac tcctcaaaca tcatattaca ttcctgcacc 34020
attcccagat aattttcagc tttccagcct tgaattattc gtgtcagttc ttgtggtaaa 34080
tccaaaccac acattacaaa caggtcccgg agggcgccct ccaccaccat tcttaaacac 34140
accctcataa tgacaaaata tcttgctcct gtgtcacctg tagcaaatta agaatggcat 34200
catcaattga catgcccttg gctctaagtt cttctctaag ttctagttgt agatactctc 34260
tcatattatc accaaactgc ttagccagaa gccccccggg aacaatagca ggggacgcta 34320
cagtgcagta caagcgcaga cctccccaat tggctccagc aaaaacaaga ttagaataag 34380
catactggga accaccagta atatcatcaa agttgctgga aatataatca ggcagagttt 34440
cttgtaaaaa ttgaataaaa gaaaaatttt ccaaagaaac attcaaaacc gttgggatgc 34500
aaatacaata ggttaccgcg ctgcgctcca acattgttag ttttgaatta gtctgcaaaa 34560
taaaagaaac aagcgtcata tcatagtagc ctgtcgaaca ggtggaaaaa tcagtctttc 34620
catcacaaga caagccacag ggtctccagc tcgaccctcg taaaacctgt cattgtgatt 34680
aaacaacagc accgaaagtt cctcgcggtg gccagcatga ataattcttg atgaagcata 34740
caatccagac atgttagcat cagttaaaga gaaaaaacag ccaacatagc ctctgggtat 34800
aattatgctt aattttaagt atagcaaagc cacccctcgc ggatacaaag taaaaggcac 34860
aggagaataa aaaatataat tatttctctg ctgctgttca ggcaacgttg ctcccggtcc 34920
ctctaaatag acatacaaag cctcatcagc catggcttac caggcaaagt acagcgggcg 34980
cacaaagcac aagctctaaa gaagctctaa aaacactctc caacctctcc acaatatata 35040
cacaagccct aaactgacgt aatgggagta aagtgaaaaa aaaataccgc caagcccaac 35100
acacaccccg aaactgcgtc agcaggaaaa agtacagttt cacttccgca ttcccaacaa 35160
gcgtaacttc ctctttctca tggtacgtca catccgatta acttgcaacg tcattttccc 35220
acggtcgcgc cgcccctttt agccgttaac cccgcagcca atcaccacac agcgcgcact 35280
tttttaaatt acctcattta catgttggca ccattccatc tataaggtat attatataga 35340
tag 35343
<210> 146
<211> 35514
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 7 sequence
<400> 146
ctctctattt aatatacctt atagatggaa tggtgccaat atgtaaatga ggtaatttaa 60
aaaagtgcgc gctgtgtggt gattggctgt ggggttaacg gctaaaatgg gcggggcggc 120
cgtgggaaaa tgacgtgact tatgtgggag gagctatgtt gcaagttatt gcggtaaatg 180
tgacgtaaaa cgaggtgtgg tttgaacacg gaagtagaca gttttcccac gcttactgac 240
aggatatgag gtagttttgg gcggatgcaa gtaaaaattc tccattttcg cgcgaaaact 300
gaatgaggaa gtgaatttct gagtcatttc gcggttatga cagggtggag tatttgccga 360
gggccgagta gactttgacc gtttacgtgg aggtttcgat taccgtgttt ttcacctaaa 420
tttccgcgta cggtgtcaaa gtcctgtgtt tttacgtagg tgtcagctga tcgctagggt 480
atttaaacct gacgagttcc gtcaagaggc cactcttgag tgccagcgag aagagttttc 540
tccttcgcgc cgcaagtcag ttctgcgctt tgaaaatgag acacctgcgt ttcctgccac 600
aggagattat cttcagtgag accgggatcg aaatactgga gtttgtggta aataccctaa 660
tgggagacga cccggaaccg ccagtgcagc ctttcgatcc acctacgctg cacgatctgt 720
atgatttaga ggtagacggg cctcaggatc ccaatgagga agctgtgaat gggtttttta 780
ctgattctat gctgctagct gccgatgaag gattggacat aaaccctcct cctgagaccc 840
ttgttacccc aggggtggtt gtggaaagcg gcagaggtgg gaaaaaattg cctgatctgg 900
gagcagctga aatggacttg cgttgttatg aagagggttt tcctccgagt gatgatgaag 960
atggggaaac tgagcagtcc atccataccg cagtgaatga gggagtaaaa gctgccagcg 1020
atgtttttaa gttggactgt ccggagctgc ctggacatgg ctgtaagtct tgtgaatttc 1080
acaggaataa cactggaatg aaagaactat tgtgctcgct ttgctatatg agaatgcact 1140
gccactttat ttacagtaag tgtatttaag tgaaatttaa aggaatagtg tagctgttta 1200
ataactgttg aatggtagat ttatgttttt tacttgtgat tttttgtagg tcctgtgtct 1260
gatgatgagt caccttctcc tgattcaact acctcacctc ctgaaattca ggcgcccgca 1320
cctgcaaacg tatgcaagcc cattcctgta aagcctaagc ctgggaaacg ccctgctgtg 1380
gataagcttg aggacttgtt ggagggtggg gatggacctt tggaccttag tacccggaaa 1440
ctgccaaggc aataagtgcc ctgcagctgt gtttatttaa tgtgacgtca tgtaataaaa 1500
ttatgtcagc tgctgagtgt tttattactt cttgggtggg gacttggata tataagtagg 1560
agcagatctg tgtggttagc tcacagcaac ctgctgccat ccatggaggt ttgggctatc 1620
ttggaagacc tcagacagac taggctactg ctagaaaacg cctcggacgg agtctctggc 1680
ctttggagat tctggttcgg tggtgatcta gctaggctag tgtttaggat aaaacaggac 1740
tacagcgtag aatttgaaaa gttattggac gacagtccag gactttttga agctcttaac 1800
ttgggtcatc aggctcattt taaggagaag gttttatcag ttttagattt ttctactcct 1860
ggtagaactg ctgctgctgt agcttttctt acttttatat tggataaatg gatccgccaa 1920
actcacttca gcaagggata cgttttggat ttcatagcag cagctttgtg gagaacatgg 1980
aaggctcgca ggatgaggac aatcttagat tactggccag tgcagcctct aggagtagca 2040
gggatactga gacacccacc gaccatgcca gcggttctgc aggaggagca gcaggaggac 2100
aatccgagag ccggcctgga ccctccggtg gaggagtagc tgacctgttt cctgaactgc 2160
gacgggtgct tactaggtct acgaccagtg gacagaacag aggcattaag agggagagga 2220
atcctagtgg gaataattca agaaccgagt tggctttaag tttaatgagc cgcaggcgtc 2280
ctgaaactgt ttggtggcat gaggttcaga gcgaaggcag ggatgaagtt tcaatattgc 2340
aggagaaata ttcactagaa caacttaaga cctgttggtt ggaacctgag gatgattggg 2400
aggtggccat taggaattat gctaagatat ctctgaggcc tgataaacaa tatagaatta 2460
ctaagaagat taatattaga aatgcatgct acatatcagg gaatggggca gaggttataa 2520
tagatacaca agataaagca gcttttagat gttgtatgat gggtatgtgg ccaggggttg 2580
tcggcatgga agcagtaaca cttatgaata ttaggtttag aggggatggg tataatggca 2640
ttgtatttat ggctaacact aagctgattc tacatggttg tagctttttt gggtttaata 2700
atacgtgtgt agaagcttgg gggcaagtta gtgtgagggg ttgtagtttt tatgcatgct 2760
ggattgcaac atcaggtagg gtcaagagtc agttgtctgt gaagaaatgc atgtttgaga 2820
gatgtaatct tggcatactg aatgaaggtg aagcaaggat ccgccactgc gcagctacag 2880
aaactggctg cttcattcta ataaagggaa atgccagtgt gaagcataat atgatctgtg 2940
gacattcgga tgagaggcct tatcagatgc tgacctgcgc tggtggacat tgcaatattc 3000
ttgctactgt gcatatcgtt tcacatgcac gcaagaaatg gcctgtattt gaacataatg 3060
tgattaccaa gtgcaccatg cacataggtg gtcgcagggg aatgtttatg ccttaccagt 3120
gtaacatgaa tcatgtgaag gtaatgttgg aaccagatgc cttttccaga gtgagcttaa 3180
caggaatctt tgatatgaat attcaactat ggaagatcct gagatatgat gacactaaac 3240
cgagggtgcg cgcatgcgaa tgcggaggca agcatgctag attccagccg gtgtgcgtgg 3300
atgtgactga agacctgaga cccgatcatt tggtgcttgc ctgcactgga gcggagttcg 3360
gttccagtgg tgaagaaact gactaaagtg agtagtgggg gcaagatgtg gatggggact 3420
ttcaggttgg taaggtggac agattgggta aattttgtta atttctgtct tgcagctgcc 3480
atgagtggaa gcgcttcttt tgagggggga gtatttagcc cttatctgac gggcaggctc 3540
ccaccatggg caggagttcg tcagaatgtc atgggatcca ctgtggatgg gagacccgtc 3600
cagcccgcca attcctcaac gctgacctat gccactttga gttcgtcacc attggatgca 3660
gctgcagccg ccgccgctac tgctgccgcc aacactatcc ttggaatggg ctattacgga 3720
agcatcgttg ccaattccag ttcctctaat aacccttcaa ccctggctga ggacaagcta 3780
cttgttctgt tggctcagct cgaggcctta acccaacgct taggcgaact gtctaagcag 3840
gtggcccagt tgcgtgagca aactgagtct gctgttgcta cagcaaagtc taaataaaga 3900
tctcaaatca ataaataaag aaatacttgt tataaaaaca aatgaatgtt tatttgattt 3960
ttcgcgcgcg gtatgccctg gaccatcggt ctcgatcatt gagaactcgg tggatctttt 4020
ccagtaccct gtaaaggtgg gattgaatgt ttagatacat aggcattagt ccgtctcggg 4080
ggtggagata gctccattga agagcctctt gctccggggt agtgttataa atcacccagt 4140
catagcaagg tcggagtgca tggtgttgca caatatcttt taggagcaga ctaattgcaa 4200
cggggaggcc cttagtgtag gtgtttacaa atctattgag ctgggacggg tacatccggg 4260
gtgaaattat atgcattttg gactggatct tgaggttggc aatgttgccg cctagatccc 4320
gtctcgggtt catattgtgc aggaccacta agacagtgta tccggtgcac ttgggaaatt 4380
tatcatgcag cttagaggga aaagcatgaa aaaatttgga gacgcctttg tgacccccca 4440
gattctccat gcactcatcc ataatgatag cgatggggcc gtgggcagcg gcacgggcga 4500
acacgttccg ggggtctgaa acatcatagt tatgctcctg agtcaggtca tcataagcca 4560
ttttaataaa ctttgggcgg agggtgccag attgggggat gaaagttccc tctggcccgg 4620
gagcatagtt cccctcacat atttgcattt cccaggcttt cagttcagag ggggggatca 4680
tgtccacctg cggggctata aaaaataccg tttctggagc cggggtgatt aactgggatg 4740
agagcaaatt cctaagcagc tgagacttgc cgcacccagt gggaccgtaa atgaccccaa 4800
ttacgggttg cagatggtag tttagggagc gacagctgcc gtcctcccgg agtagggggg 4860
ccacttcgtt catcatttcc cttacatgga tattttcccg caccaagtcc gttaggaggc 4920
gctctccccc aagggataga agctcctgga gcgaggagaa gtttttcagc ggcttcagcc 4980
cgtcagccat gggcattttg gaaagagtct gttgcaagag ctcgagccgg tcccagagct 5040
cggtgatgtg ctctatggca tctcgatcca gcagacctcc tcgtttcgcg ggttgggacg 5100
gctcctggag tagggaatca gacgatgggc gtccagcgct gccagggtcc gatccttcca 5160
tggtcgcagc gtccgagtca gggttgtttc cgtcacggtg aatgggtgcg cgcctggttg 5220
ggcgcttgcg agggtgcgct tcagactcat cctgctggtc gagaaccgct gccgatcggc 5280
gccctgcatg tcggccaggt agcagtttac catgagttcg tagttgagcg cctcggccgc 5340
gtggcctttg gcacggagct tacctttgga agttttatgg caggcggggc agtagataca 5400
tttgagggca tacagcttgg gcgcgaggaa aatggattcg ggggagtatg catccgcacc 5460
gcaggaggcg cagacggttt cgcactccac gagccaggtc agatccggct catcggggtc 5520
aaaaacaagt tttccgccat gttttttgat gcgtttctta cctttggttt ccatgaggtc 5580
gtgtccccgc tgggtgacaa agaggctgtc cgtgtccccg tagaccgact ttatgggcct 5640
gtcctcgagc ggagtgcctc ggtcctcttc gtagaggaac ccagcccact ctgatacaaa 5700
agcgcgtgtc caggccagca caaaggaggc cacgtgggag gggtagcggt cgttgtcaac 5760
cagggggtcc accttctcta cggtatgtaa acacatgtcc ccctcctcca catccaagaa 5820
tgtgattggc ttgtaagtgt aggccacgtg accaggggtc cccgccgggg gggtataaaa 5880
gggggcgggc ctctgttcgt cctcactgtc ttccggatcg ctgtccagga gcgccagctg 5940
ttggggtagg tattccctct cgaaggcggg catgacctct gcactcaggt tgtcagtttc 6000
taggaacgag gaggatttga tattgacagt accagcagag atgcctttca taagactctc 6060
gtccatctgg tcagaaaaca caatcttctt gttgtccagc ttggtagcaa atgatccata 6120
gagggcattg gatagaagct tggcgatgga gcgcatggtt tggttctttt ccttgtccgc 6180
gcgctccttg gcggcgatgt taagctggac gtactcgcgc gccacacatt tccattcagg 6240
gaagatggtt gtcagttcat ccggaactat tctgactcgc catcccctat tgtgcagggt 6300
tatcagatcc acactggtgg ccacctcgcc tcggaggggc tcattggtcc agcagagtcg 6360
acctcctttt cttgaacaga aaggggggag ggggtctagc atgagctcat caggggggtc 6420
cgcatctatg gtaaatattc ccggtagcaa atctttgtca aaatagctga tggtggtggg 6480
atcatccaag gtcatctgcc attctcgaac tgccagcgcg cgctcatagg ggttaagagg 6540
ggtgccccag ggcatggggt gggtgagcgc ggaggcatac atgccacaga tatcgtatac 6600
atagaggggc tcttcgagga tgccgatgta agtgggataa cagcgccccc ctctgatgct 6660
tgctcgcaca tagtcataga gttcatgtga gggggcgaga agacccgggc ccagattggt 6720
gcggttgggt ttttccgccc tgtaaacgat ctggcgaaag atggcatggg aatttgaaga 6780
gatagtaggt ctctggaata tgttaaaatg ggcatgaggt aggcctacag agtcccttat 6840
gaagtgggca tatgactctt gcagcttggc taccagctcg gcggtgacga gtacatccag 6900
ggcacagtag tcgagagttt cctggatgat gtcataacgc ggttggcttt tcttttccca 6960
cagctcgcgg ttgagaaggt attcttcgcg atccttccag tactcttcga ggggaaaccc 7020
gtctttttct gcacggtaag agcccaacat gtagaactga ttgactgcct tgtagggaca 7080
gcatcccttc tccactggga gagagtatgc ttgggctgca ttgcgcagcg aggtatgagt 7140
gagggcaaaa gtgtccctga ccatgacttt gaggaattga tacttgaagt ccatgtcatc 7200
acaggccccc tgttcccaga gttggaagtc cacccgcttc ttgtaggcgg ggttgggcaa 7260
agcgaaagta acatcattga agaggatctt gccggccctg ggcatgaaat ttcgggtgat 7320
tctgaaaggc tgagggacct ctgctcggtt attgataacc tgagcggcca agacgatctc 7380
atcaaagcca ttgatgttgt gccccactat gtacagttct aagaatcgag gggtgcccct 7440
gacatgaggc agcttcttga gttcttcaaa agtgagatct gtagggtcag tgagagcata 7500
gtgttcgagg gcccattcgt gcacgtgagg gttcgctttg aggaaggagg accagaggtc 7560
cactgcgagt gctgtttgta actggtcccg gtattgacga aaatgctgcc cgactgccat 7620
tttttctggg gtgacgcaat agaaggtttg ggggtcctgc cgccagcgat cccacttaag 7680
tttcatggcg aggtcatagg cgatgttgac gagccgctgg tctccagaga gtttcatgac 7740
cagcatgaag gggattagct gcttgccaaa ggaccccatc caggtgtagg tttccacatc 7800
gtaggtgagg aagagccttt ctgtgcgagg atgagagcca atcgggaaga actggatctc 7860
ctgccaccag ttggaggaat ggctgttgat gtgatggaag tagaactccc tgcgacgcgc 7920
cgagcattca tgcttgtgct tgtacagacg gccgcagtac tcgcagcgat tcacgggatg 7980
cacctcatga atgagttgta cctgacttcc tttgacgaga aatttcagtg gaaaattgag 8040
gcctggcgtt tgtacctggc gctctactat gttgtctgca tcggcatgac catcttctgt 8100
ctcgatggtg gtcatgctga cgagccctcg cgggaggcaa gtccagacct cggcgcggca 8160
ggggcggagc tcgaggacga gagcgcgcag gccggagctg tccagggtcc tgagacgctg 8220
cggagtcagg ttagtaggca gtgtcaggag attgacttgc atgatctttt cgagggcgtg 8280
agggaggttc agatggtact tgatctccac gggtccgttg gtggagatgt caatggcttg 8340
cagggttccg tgccccttgg gcgctaccac cgtgcccttg tttttccttt tgggcggcgg 8400
tggctctgtt gcttcttgca tgtttaggag cggtgtcgag ggcgcgcacc gggcggcagg 8460
ggcggctcgg gacccggcgg catggctggc agtggtacgt cggcgccgcg cgcgggtagg 8520
ttctggtact gcgccctgag aagactcgca tgtgcgacga cgcggcggtt gacatcctgg 8580
atctgacgcc tctgggtgaa agctaccggc cccgtgagct tgaacctgaa agagagttca 8640
acagaatcaa tctcggtatc gttgacggcg gcttgcctaa ggatttcttg cacgtcgcca 8700
gagttatcct ggtaggcgat ctcggccatg aactgctgga tctcttcctc ttgaagatct 8760
ccgcggcccg ctctctcgac ggtggccgct aggtcgttgg agatgcgccc aatgagttga 8820
gagaatgcat tcatgcccgc ctcgttccag acgcggctgt agaccacagc ccccacggga 8880
tctctcgcgc gcataaccac ctgggcgagg ttaagctcta cgtggcgggt gaagaccgca 8940
tagttgcata ggcgctggaa aaggtagttg agtgtggtgg cgatgtgctc ggtgacgaag 9000
aaatacatga tccatcgtct cagcggcatc tcgctgacat cgcccagcgc ttccaagcgc 9060
tccatggcct cgtagaagtc cacggcaaag ttgaaaaact gggagttacg cgcggacacg 9120
gtcaactcct cttccagaag acggatgagt tcggcaatgg tggtgcgcac ctcgcgctcg 9180
aaatcccccg ggatttcttc ctcaatctct tcttcttcca ctaacatctc ttcctcttca 9240
ggtggggctg caggaggagg gggaacgcgg cgacgccggc ggcgcacggg cagacggtcg 9300
atgaatcttt caatgacctc tccgcggcgg cggcgcatgg tctcggtgac ggcacgaccg 9360
ttctccctgg gtctcagagt gaagacgcct ccgcgcatct ccctgaagtg gtgactggga 9420
ggctctccgt tgggcaggga caccgcgctg attatgcatt ttatcaattg ccccgtaggt 9480
actccgcgca aggacctgat cgtctcaaga tccacgggat ctgaaaacct ttcgacgaaa 9540
gcgtctaacc agtcgcaatc gcaaggtagg ctgagcactg tttcttgcgg gcgggggcgg 9600
ctagacgctc ggtcggggtt ctctctttct tttccttcct cctcttggga ggatgagacg 9660
atgctgctgg tgatgaaatt aaaataggca gttttgagac ggcggatggt ggcgaggagc 9720
accaggtctt tgggtccggc ttgttggatg cgcaggcgat gggccattcc ccaagcatta 9780
tcctgacatc tggccagatc tttatagtag tcttgcatga gtcgttccac gggcacttct 9840
tcttcgcccg ctctgccatg catgcgagtg atcccgaacc cgcgcatggg ctggacaagt 9900
gccaggtccg ctacaaccct ttcggcgagg atggcttgct gcacctgggt gagggtggct 9960
tggaagtcgt caaagtccac aaagcggtgg taggccccgg tgttgattgt gtaggagcag 10020
ttggccatga ctgaccagtt gactgtctgg tgcccagggc gcacgagctc ggtgtacttg 10080
aggcgcgagt atgcgcgggt gtcaaagatg taatcgttgc aggtgcgcac caggtactgg 10140
tagccgatga gaaagtgtgg cggtggctgg cggtacaggg gccatcgctc tgtagccggg 10200
gctccggggg caaggtcttc cagcatgagg cggtggtaac cgtagatgta cctggacatc 10260
caggtgatac cggaggcggt ggtggatgcc cgcgggaact cgcgtacgcg gttccagatg 10320
ttgcgcagcg gcatgaagta gttcatggta ggcacggttt ggcccgtgag acgtgcacag 10380
tcgttgatgc tctagacata cgggcaaaaa cgaaagcggt cagcggctcg tctccgtggc 10440
ctggaggcta agcgaacggg ttgggctgcg cgtgtacccc ggttcgaatc tcggatcagg 10500
ctggagccgc agctaacgtg gtactggcac tcccgtctcg acccaggcct gcacaaaacc 10560
tccaggatac ggaggcgggt cgtttttttg ctttttcctg gatgggagcc agtgctgcgt 10620
caagctttag aacactcagt tctcggggct gggagtggct cgcgcccgta gtctggagaa 10680
ttaatcgcca gggttgcgtt gcggtgtgcc ccggttcgag tcttagcgcg ccggatcggc 10740
cggtttccgc gacgtttcta agaccccgcc agccgacttc tccagtttac gggagcgagc 10800
cctctttttt ttttttgttt tttgttgccc agatgcatcc cgtgctgcga cagatgcgcc 10860
cccagcaaca gcccccttct cagcagcagc tacaacaaca gccacaaaag gctcttcctg 10920
ctcctgtaac tactgcggct gcagccgtca gcggcgcggg acagcccgcc tatgatctgg 10980
aattggaaga gggcgaggga ctggcgcgcc tgggcgcacc atcgcccgag cggcacccgc 11040
ccagccgact tctccagttt acgggagcga gccctctttt ttttttttgt tttttgttgc 11100
ccagatgcat cccgtgctgc gacagatgcg cccccagcaa cagccccctt ctcagcagca 11160
gctacaacaa cagccacaaa aggctcttcc tgctcctgta actactgcgg ctgcagccgt 11220
cagcggcgcg ggacagcccg cctatgatct ggaattggaa gagggcgagg gactggcgcg 11280
cctgggcgca ccatcgcccg agcggcaccc gcgggtgcaa ctgaaaaagg actctcgcga 11340
ggcgtacgtg ccccagcaga acctgttcag ggacaggagc ggtgaggagc cagaggagat 11400
gcgagcatct cgatttaacg cgggtcgcga gctgcgccac ggtctggatc gaagacgggt 11460
gctgcaagac gaggattttg aggtcgatga agtgacaggg atcagcccag ctagggcaca 11520
tgtggccgcg gccaacctag tctcagccta cgagcagacc gtgaaggagg agcgcaactt 11580
ccaaaaatct tttaacaacc atgtgcgcac cctgatcgcc cgcgaggaag tgaccctggg 11640
tctgatgcat ctgtgggacc tgatggaggc tatcacccag aaccccacta gcaaaccact 11700
gacagctcag ctgtttctgg tggttcaaca tagcagggac aacgaggcat tcagggaggc 11760
gttgttgaac atcaccgagc ctgatgggag atggctgtat gatctgatca acatcctgca 11820
aagtattata gtgcaggaac gtagcctggg tttggctgag aaagtggcag ctatcaacta 11880
ctcggtcttg agcctgggca aatactacgc tcgcaagatc tacaagaccc cctacgtacc 11940
catagataag gaggtaaaga tagatgggtt ttacatgcgc atgactctga aggtgctgac 12000
tctgagcgac gatctggggg tgtatcgcaa tgacaggatg caccgcgcgg tgagcgccag 12060
caggaggcgc gagctgagcg acagagaact tatgcacagc ttgcaaagag ctctaacggg 12120
ggccgggact gatggggaga actactttga catgggagcg gacttgcaat ggcaacccag 12180
tcgcagggcc atggaggctg cagggtgtga gcttccttac atagaagagg tggatgaagt 12240
cgaggacgag gagggcgagt acttggaaga ctgatggcgc gacccgtatt tttgctagat 12300
ggaacagcag caggcaccgg accccgcaat gcgggcggcg ctgcagagcc agccgtccgg 12360
cattaactct tcggacgatt ggacccaggc catgcaacgc ataatggcgc tgacgacccg 12420
caaccccgaa gcctttagac agcaacccca ggccaaccgc ctttcggcca tactggaggc 12480
cgtagtgccc tcccgctcca accccaccca cgagaaggtc ctggctatcg tgaacgcgct 12540
ggtggagaac aaggccatcc gtcccgatga ggccgggctg gtatacaatg ctctcttgga 12600
gcgcgtggcc cgttacaaca gcagcaacgt gcaaaccaac ctggacagga tggtgaccga 12660
tgtgcgcgag gccgtgtctc agcgcgagcg gttccagcgc ggcgccaact tggggtcgtt 12720
ggtagcgcta aacgctttcc tcagcaccca gcccgccaac gtgccccgtg gtcagcaaga 12780
ctatacaaac tttttgagtg cattgagact catggtagct gaggtgcccc agagcgaggt 12840
gtaccagtcc gggccagatt acttcttcca gaccagcaga cagggcttgc agacagtgaa 12900
cctgactcag gctttcaaga acctgaaggg tctgtgggga gtgcacgccc cagtaggaga 12960
tcgcgcgacc gtgtctagct tgctgactcc caactcccgc ctgctgctgc tgctggtatc 13020
cccctttact gacagcggta gcatcgaccg caactcgtac ttgggctacc tgcttaacct 13080
gtatcgcgag gccatagggc agagccaggt ggacgagcag acctatcaag aaatcaccca 13140
agtgagccgc gccctgggtc aggaagacac gggcagtttg gaagccaccc tgaacttctt 13200
gctaaccaac cggtcgcaga agatccctcc tcagtatgcg cttaccgctg aggaggagcg 13260
gatcctcaga tacgtgcaac agagcgttgg actgtttctg atgcaggagg gggcgacacc 13320
taccgccgcg ctggacatga cagctcgaaa catggagccc agcatgtatg ctagtaacag 13380
gcctttcatt aacaaactgc tggactacct gcacagggcg gccgccatga actctgatta 13440
tttcaccaat gctatcctga acccacactg gctgccccca cctggtttct acactggcga 13500
gtacgacatg cccgacccca atgacgggtt cctgtgggac gatgtggaca gcagcatatt 13560
ctccccgcct cccggttata cagtttggaa gaaggaaggg ggcgatagaa gacactcttc 13620
cgtgtcgctg tccggaacgg ctggtgctgc cgcgaccgtg cccgaagctg caagtccttt 13680
ccctagcttg cccttttcac taaacagcgt tcgcagcagt gaactgggga gaataacccg 13740
cccgcgcttg atgggcgagg atgagtactt gaatgactct ttgctgaggc cagagaggga 13800
aaagaacttc cccaacaatg gaatagagag tctggtggat aagatgagta gatggaagac 13860
ctatgcgcag gatcacagag acgagcccag gatattgggg gctacaagca gaccgacccg 13920
tagacgccag cgccacgaca gacagatggg tcttgtgtgg gacgatgagg actctgccga 13980
tgatagcagc gtgttggact tgggtggaag aggagggggc aacccgttcg ctcatctgcg 14040
tcccagattc gggcgcatgt tgtaaaagtg aaagtaaaat aaaaatgcaa ctcaccaagg 14100
ccatggcgac cgagcgtgcg ttcgttcttt tttgttatct gtgtctagta cgatgaggag 14160
acgagccgtg ctaggcggag cggtggtgta tccggagggt cctcctcctt cttacgagag 14220
cgtgatgcag caacaggcgg cgatgataca gcccccactg gaggttccct tcgtaccccc 14280
gcggtacctg gcgcctacgg aagggagaaa cagcattcgt tactcggagc tgtcgcccct 14340
gtacgatacc accaagttgt atctggttga caacaagtcg gcggacatcg cctccctgaa 14400
ctatcagaac gaccacagca acttcctgac cacggtggtg cagaacaatg actttacccc 14460
cacggaggct agcacccaga ccatcaactt tgacgaacgg tcgcgatggg gcggtcatct 14520
gaagaccatc atgcacacca acatgcccaa cgtgaacgag tacatgttca gcaacaagtt 14580
caaggcgagg gtgatggtgt ccagaaaagc tcctgaaggt gttacagtaa atgacaccta 14640
tgatcataaa gaggatatct tgaagtatga gtggtttgag ttcattttac cagaaggcaa 14700
cttttcagcc accatgacga tcgacctgat gaacaatgcc atcattgaca actacctgga 14760
aattggcaga cagaatggag tgctggaaag tgacattggt gttaagtttg acactagaaa 14820
tttcaggctc gggtgggacc ccgaaactaa gttgattatg ccaggagtct acacttatga 14880
ggcattccat cctgacattg tattgctgcc tggttgcggg gtagacttta ctgaaagccg 14940
acttagcaac ttgcttggca tcaggaagag acatccattc caggagggtt tcaaaatcat 15000
gtatgaagat cttgaagggg gtaatattcc tgcccttttg gatgtcactg cctatgagga 15060
aagcaaaaag gataccacta ctgaaacaac cacactggct gttgcagagg aaactagtga 15120
agatgataat ataactagag gagataccta tataacagaa aaacacaaac gtgaagctgc 15180
agctgctgaa gttaaaaaag agttaaagat ccaacctcta gaaaaagaca gcaagagtag 15240
aagctacaat gtcttggaag acaaaatcaa cacggcctac cgcagttggt acctgtccta 15300
caattacggt aaccctaaga aaggaataag gtcttggaca ctgctcacca cttcagatgt 15360
cacctgtggg gcagagcagg tttactggtc gctccctgac atgatgcaag acccagtcac 15420
gttccgctcc acaagacaag tcaacaacta cccagtggtg ggtgcagagc ttatgcccgt 15480
cttctcaaag agtttctaca atgagcaagc cgtgtactct cagcagctcc gacaggccac 15540
ttcgctcacg cacgtcttca accgcttccc tgagaaccag atcctcatcc gcccgccggc 15600
gcccacaatt accaccgtca gtgaaaacgt tcctgctctc acagatcacg ggaccctgcc 15660
gttacgcagc agtatccggg gagtccagcg cgtgaccgtt actgacgcca gacgccgcac 15720
ctgtccctac gtttacaagg ccctgggcat agtcgcgccg cgcgttcttt caagccgcac 15780
tttctaaaaa aaaaaaatgt ccattctcat ctcgcccagt aataataccg gttggggact 15840
gtatgcgccc accaagatgt atggaggcgc ccgcaaacgc tctacccagc accctgtgcg 15900
cgttcgcggt catttccgcg ctccctgggg cgcactcaag ggtcgtaccc gcactcggac 15960
cacggtcgat gatgtgatcg accaggtggt cgccgatgct cgtaattata ctcctactgc 16020
gcctacatct actgtggatg cagttattga cagtgtggtg gcagacgccc gcgcctatgc 16080
tcgccggaag agccgaagga ggcgcatcgc caggcgccac agggctactc ccgccatgcg 16140
agctgcaaaa gctattctgc ggagggccaa acgtgtgggg cgaagagcca tgcttagagc 16200
ggccagacgc gcggcttcag gtgccagcag cggcaggtcc cgcaggcgcg cggccacggc 16260
ggcagcagcg gccattgcca acatggccca accgcgaaga ggcaatgtgt actgggtgcg 16320
tgatgccact accggccagc gcgtgcccgt gcgcactcgc ccccctcgca cttagaagat 16380
actgagcagt ctccgatgtt gtgtcccagc ggcaagtatg tccaagcgca aatacaagga 16440
agagatgctc caggtcatcg cgcctgaaat ctacggtcca ccggtgaagg atgaaaaaaa 16500
gccccgcaaa atcaagcggg tcaaaaataa caaaaaggaa gaagatgacg atgatgggct 16560
ggtggagttt gtgcgcgagt tcgccccaag acggcgcgtg cagtggcgcg ggcgcaaagt 16620
gcgtcaagtg ctcagacccg ggaccactgt ggtttttaca cccggcgagc gttccagcac 16680
tacttttaaa cggtcctatg atgaggtgta cggggatgac aatattcttg agcaggcggc 16740
agaccgcctt gacgagtttg cttatggcaa gcgcactaga tccagtccca aagaggaggc 16800
ggtgtccatt cctttggatc atggaaatcc cacccccagc ctcaaaccag tcaccctgca 16860
gcaagtgctg cccgtgcctg cgcggagagg cgtaaagcgc gagggtgagg acctgtatcc 16920
caccatgcag ctaatggtgc ccaagcgcca gaggctagaa gacgtactgg agaaaatgaa 16980
agtggatgcc gatatccagc ctgaggtcaa agtaagacct atcaaggaag tggcgccagg 17040
tttgggagta caaaccttcg acatcaagat tcccaccgag tccatggaag tgcagaccga 17100
acctgcaaaa cccacaacca cctcaattga ggtgcaaacg gaaccctgga tgcccgcgcc 17160
cgttgccgcc cccagcacca ctcgaagatc acgacgaaag tacggcccag caagtctgct 17220
aatgcccaac tatgctctgc acccatccat cattcccact ccgggttaca gaggcactcg 17280
ctactatcga aaccggagca acacctctcg ccgccgcaaa ccacctgcaa gtcgcactcg 17340
ccgtcgccgc cgccgcaaca ctgccagcaa attgactccc gccgccctgg tgcggagagt 17400
gtaccgcgat ggtcgcgctg aacctctgac gctgccgcgc gcgcgctacc atccaagcat 17460
caccacttaa tgactgttga cgctgcctcc ttgcagatat ggccctcact tgccgccttc 17520
gcgtccccat tactggctac cgaggaagaa actcgcgccg tagaaggatg ttggggcgag 17580
ggatgcgccg ccacagacga aggcgcgcta tcagcagacg attagggggt ggctttttgc 17640
cagctcttat acccatcatc gccgcagcga tcggggcgat accaggcata gcttccgtgg 17700
cggttcaggc ctcgcagcgc cactaacatt ggaaaaactt ataaataaaa aatagaatgg 17760
actctgacgc tcctggtcct gtgactatgt ttttgtagag atggaagaca tcaatttttc 17820
atccctggct ccgcgacacg gcacgaggcc gtacatgggc acctggagcg acatcggcac 17880
gagccaactg aacgggggcg ccttcaattg gagcagtatc tggagcgggc ttaaaaattt 17940
tggctcgacc gtaaaaacct atgggaacaa agcttggaac agcagcacag ggcaggctct 18000
gagaaataag cttaaggaac aaaacttcca acagaaggtg gtcgatggga tcgcctctgg 18060
tattaacggc gtagtggatc tggccaacca ggctgtacaa aaacagataa acagccgcct 18120
ggacccgccg cccgcaaccc ctggtgaaat ggaagtggag gaagaacttc ctccgctgga 18180
aaagcggggc gacaagcgtc cgcgacccga gctagagcac acgctggtga cgcgcgcaga 18240
cgagccccct tcatacgagg aggcagtaaa gctcggaatg cccactacca ggcccgtagc 18300
tcacatggct accggggtga tgaaaccttc tgagttacat cgacccgcca ccttggactt 18360
gcctcctccc cctgcttctg cggcgcctgt tcccaaacct gtcgctacca gaaagcccac 18420
cgccgtacag cccgttgccg tagccagacc gcgtcctggg ggcacaccgc gcccgaaagc 18480
aaactggcaa agtactctga acagcatcgt gggtctgggc gtgcagagtg taaagcgccg 18540
tcgctgctat taattaaata tggagtagcg cttaacttgc ttgtctgtgt gtatgtatca 18600
tcaccacgcc gccgcagcag aggagaaagg aagaggtcgc gcgccgaggc tgagttgctt 18660
tcaagatggc caccccatcg atgatgcccc aatgggcata catgcacatc gccggacagg 18720
atgcttcgga gtacctgagt ccgggtctgg tgcagttcgc ccgtgcaaca gacacctact 18780
tcagtatggg gaacaagttt agaaacccca cagtggcgcc cacccacgat gtgaccaccg 18840
accgtagcca gcgactgatg ctgcgcttcg tgcccgttga ccgggaggac aatacatact 18900
cttacaaagt gcggtacacc ctcgccgtgg gcgacaacag agtgcttgac atggccagca 18960
cattctttga cattaggggg gtgcttgata gaggtcctag cttcaagcca tattccggca 19020
cagcttacaa ttcactggct cctaagggcg cgcctaacac atctcagtgg atagttacaa 19080
cgggagaaga caatgccacc acatacacat ttggcattgc ttccacgaag ggagacaata 19140
ttactaagga aggtttagaa attgggaaag acattactgc agacaacaag cccatttatg 19200
ccgataaaac atatcagcca gagcctcaag ttggagaaga atcatggact gatattgatg 19260
gaacaaatga aaaatttgga ggtagagctc ttaaaccagc tactaaaatg aagccatgct 19320
acgggtcttt tgcaagacct acaaacataa aagggggcca agctaaaaac agaaaagtaa 19380
caccaaccga aggagatgtt gaagctgagg agccagatat tgatatggaa tttttcgatg 19440
gtagagaagc tgctgacgct ttttcgcctg aaattgtgct ttacacggaa aatgtcaatt 19500
tggaaactcc agacagccat gtggtataca agccaggaac ttctgatggt aactctcatg 19560
caaatttggg tcaacaagcc atgcctaaca gacccaatta cattggcttc agggataact 19620
ttgtaggtct tatgtactac aacagtactg gaaatatggg agttttggcc ggccaagcat 19680
cacaactgaa tgcagtggtt gacttgcagg acagaaacac tgaactgtca tatcagcttt 19740
tgcttgattc tctgggagac agaagcagat acttcagcat gtggaatcag gctgtggaca 19800
gctatgatcc cgatgttcgt attattgaaa atcatggcgt cgaggatgaa ctgcctaatt 19860
actgttttcc tctggatggc ataggaccag ggaacaaata tcaaggcatt aaacctagag 19920
acactgcatg ggaaaaagat actaaagttt ctacagctaa tgaaatagcc ataggcaaca 19980
atctggctat ggaaattaat atccaagcta atctttggag aagttttctg tactccaatg 20040
tggctttgta ccttccagat gtttacaagt acacgccaac taacattact ctgcccgcta 20100
acaccaacac ctatgagtac atgaacgggc gagtggtttc cccatctctg gtcgattcat 20160
acatcaacat tggcgccagg tggtctcttg acccaatgga caatgtgaat ccatttaacc 20220
accaccgcaa tgctggccta cgctaccggt ccatgcttct gggcaatggc cgttatgtgc 20280
ctttccacat acaagtgcct caaaaattct ttgctgtcaa gaacctactt cttctacctg 20340
gctcctacac ctatgagtgg aacttcagaa aggatgtgaa catggtcctg caaagttccc 20400
ttggaaatga cctcagaaca gatggtgcta acataagttt caccagcatc aacctctatg 20460
ccaccttctt ccccatggct cacaacaccg cttcaactct tgaagccatg ctgcgcaacg 20520
ataccaatga tcagtcattc aacgactacc tctctgcagc taacatgctt taccccatcc 20580
ctgccaatgc aaccaacatt ccaatttcca tcccatctcg caactgggca gccttcaggg 20640
gctggtcctt caccagactc aaaaccaagg agactccatc tcttggatca gggttcgatc 20700
cctacttcgt ttattctgga tctattccct acctggatgg cactttttac cttaaccaca 20760
ctttcaagaa ggtctccatc atgtttgact cctcagtcag ctggcctggc aatgacaggc 20820
tgttgtctcc aaatgagttt gaaatcaagc gcactgtgga tggggaagga tacaatgtgg 20880
cccaatgcaa catgaccaaa gactggttcc tggttcagat gcttgccaac tacaacattg 20940
gctaccaggg cttttacatc cctgagggat acaaggatcg catgtactcc tttttcagaa 21000
acttccagcc tatgagcagg caggtggttg atgaggttaa ttacactgac tacaaagccg 21060
tcaccttacc atatcaacac aacaactctg gctttgtagg ataccttgcg cctactatga 21120
gacaagggga accttaccca gccaattatc catacccgct catcggaact actgccgtta 21180
aaagtgttac ccaaaaaaag ttcctgtgcg acaggaccat gtggcgcata ccgttctcca 21240
gcaacttcat gtccatggga gcccttacgg acctgggaca gaacctgctc tatgccaact 21300
cggcccatgc gctggacatg acttttgagg tggatcccat ggatgagccc accctgcttt 21360
atcttctttt cgaagtcttc gacgtggtca gagtgcacca gccacaccgc ggcgtcatcg 21420
aggccgtcta cctgcgcaca ccgttctcgg ccggcaacgc caccacataa gaagcctctt 21480
gcttcttgca agcagcagct gcagccatgt catgcgggtc cggaaacggc tccagcgagc 21540
aagagctcaa agccatcgtc cgagacctgg gttgcggacc ctatttcctg ggaacctttg 21600
acaagcgttt cccggggttc atggcccccg acaagctcgc ctgcgccata gtcaacactg 21660
ccggacgcga gacgggggga gagcactggc tggcttttgg ttggaacccg cgctccaaca 21720
cctgctacct ttttgatcct tttgggttct cggatgagcg actcaaacag atttaccagt 21780
ttgagtacga ggggctcctg cgccgcagtg cccttgctac caaagaccgc tgcatcaccc 21840
tggaaaagtc cacccagagc gtgcagggcc cacgctcagc cgcctgtgga cttttttgct 21900
gtatgttcct tcatgccttt gtgcactggc ccgaccgccc catgaacgga aaccccacca 21960
tgaagttgct gactggggtg cccaacagca tgctccaatc tccccaagtg cagcccaccc 22020
tgcgccgcaa ccaggaggcg ctatatcgct tcctaaacac ccactcatct tactttcgtt 22080
ctcaccgcgc acgcatcgaa agggccaccg cgtttgaccg tatggatatg caataagtca 22140
tgtaaaaccg tgttcaataa aaagcacttt atttttacat gcactaaggc tctcgttttt 22200
tactcattcg ttttcattat tcactcagaa atcaaatggg ttctggcggg agtcaaagtg 22260
acccgcgggc agggatacgt tgcggaactg taacctgttc tgccacttga actcggggat 22320
caccaacttg ggaactggaa tctcgggaaa ggtgtcttgc cacaactttc tggtcagctg 22380
cagggcgcca agtaggtcag gagcagagat cttgaaatca cagttgggac cggcattctg 22440
gacacgggag ttgcggtaca ctgggttgca acactggaac accatcaagg ctgggtgtct 22500
cacgcttgcc agcacggtcg ggtcactgat ggtagtcaca tccaagtctt cagcattggc 22560
catcccaaag ggggtcatct tacaggtctg cctgcccatc acgggagcgc agcctggctt 22620
gtggttgcaa tcgcaatgaa tggggatcag catcatcctg gcttggtcgg gggttatccc 22680
tgggtacacg gccttcatga aggcttcgta ctgcttgaaa gcttcctgag ccttacttcc 22740
ctcggtatag aacatcccac aggacttgct ggaaaattga ttagtagcac agttggcatc 22800
atttacacag cagcgggcat cgttgttggc caactggacc acatttctgc cccagcggtt 22860
ctgggtgatc ttggctctgt ctgggttctc cttcatagcg cgctgtccgt tctcgctcgc 22920
cacatccatc tcgataatgt ggtccttctg aatcatgata gtgccatgca ggcatttcac 22980
cttgccttca taatcggtgc atccatgagc ccacagagcg cacccggtgc actcccaact 23040
attgtgggcg atctcagaat aagaatgtac caatccctgc atgaatcttc ccatcatcgc 23100
tgtcagggtc ttcatgctac taaatgtcag cgggatgcca cggtgctcct cgttcacata 23160
ctggtggcag atacgcttgt actgctcgtg ctgctctggc atcagcttga aagaggttct 23220
caggtcatta tccagcctgt acctctccat tagcacagcc atcacttcca tgcccttctc 23280
ccaggcagat accaggggca agctcaaagg attcctaaca gcaatagaag tagctccttt 23340
agctataggg tcattcttgt cgatcttctc aacacttctc ttgccatcct tctcaatgat 23400
gcgcaccggg gggtagctga agcccacggc caccaactga gcctgttctc tttcttcttc 23460
gctgtcgtgg ccgatgtctt gcagagggac atgcttggtc tttctgggct tcttcttggg 23520
agggatcggg ggaggactgt tgctccgttc cggagacagg gatgaccgcg aagtttcgct 23580
taccagtacc acctggctct cgatagaaga atcggacccc acgcgacggt aggtgttcct 23640
cttcgggggc agaggtggag gcgactgaga tgggctgcgg tctggccttg gaagcggatg 23700
gctggcagag cccattccgc gttcgggggt gtgctcccgt tggcggtcgc ttgactgatt 23760
tcctccgcgg ctggccattg tgttctccta ggcagagaaa caacagacat ggaaactcag 23820
ccatcactgc caacatcgct gcaagcgcca tcacacctcg cccccagcag cgacgaggag 23880
gagagcttaa ccaccccacc acccagtcca gctaccacca cctctaccct cgatgatgag 23940
gaggaggagg tcgacgcagc ccaggagatg caggcgcagg ataatgtgaa agcggaagag 24000
attgaggcag atgtcgagca ggacccgggc tatgtgacac cggcggagca cgaggaggag 24060
ctgaaacgtt ttatagacag agaggatgac gaccgcccag agcatcaagc agatggcgat 24120
caccaggagg ctggcatcgg ggatcaagtt gccgactacc tcaccgggct tgggggggaa 24180
gacgtgctcc tcaaacatct agcaaggcag tcgaacatag ttaaagacgc actactcgac 24240
ctcaccgaag tgcccatcag tgtggaagag cttagccgcg cctacgagct gaacctcttt 24300
tcgcctcaca taccccccaa gcggcagcca aacggcacct gcgaggccaa ccctcgactg 24360
aacttctatc cagcttttac tgtccccgaa gtgctggcca cctaccacat cttttttaag 24420
aaccaaaaga ttccagtctc ctgccgcgcc aaccgcaccc gcgccgatgc ccttctcaac 24480
ttgggtccgg gagctcgctt acctgatata gcttccttgg aagaggttcc aaaaatcttt 24540
gagggtctgg gaagtgatga gactcgggcc gcaaatgctc tgcaacaggg agagaatggc 24600
atggatgaac atcacagcgc tttagtggaa ctggagggtg acaatgcccg gcttgcagtg 24660
ctcaagcgca gtatcgtggt cacccatttt gcctaccccg ctgttaacct gccccccaaa 24720
gttatgagcg ctgttatgga ccatctgctc atcaaacgag caggtccact ttcagaaaac 24780
cagaacatgc aggatccaga cgcctcggac gagggcaagc cggtagtcag tgacgagcag 24840
ctatctcgct ggctgggtac caactccccc cgagatttgg aagagaggcg caagcttatg 24900
atggctgtag tgctagtaac tgtggagctg gagtgtttgc gccgcttttt caccgacccc 24960
gagaccctgc gcaagctaga ggagaacctg cactacacct ttagacatgg cttcgtgcgg 25020
caggcatgca agatctccaa cgtggagctt accaacctgg tttcttacat gggcattttg 25080
catgagaacc ggctagggca gagcgtcctg cacaccaccc ttaaagggga ggcccgccgt 25140
gactacatcc gagactgtgt ctacctctac ctctgccata cctggcagac tggcatgggt 25200
gtgtggcaac agtgtttgga agagcagaac ctaaaagagc tggacaagct cttgcagaga 25260
tccctcaaag ccctgtggac aggttttgat gagcgcaccg tcgcctcgga cctggcagac 25320
atcatcttcc ccgagcgtct cagggttact ctgcgaaacg gcctgccaga ctttatgagc 25380
cagagcatgc ttaacaactt tcgctctttc atcctggaac gctccggtat cctgcctgcc 25440
acctgctgtg cgctgccctc cgactttgtg cctctcacct accgcgagtg cccaccgccg 25500
ctatggagcc actgctacct gttccgcctg gccaactacc tctcctacca ctcggatgtt 25560
atagaggatg tgagcggaga cggtctgctg gaatgccact gccgctgcaa tctttgcaca 25620
ccccaccgct cccttgcctg caacccccag ttgctgagcg agacccagat catcggcacc 25680
ttcgagttgc agggtcccag cagtgaaggc gaggggtctt ctccggggca gagtctgaaa 25740
ctgacaccgg ggctgtggac ctccgcctac ctgcgcaagt ttcatcccga ggattaccac 25800
ccctatgaga tcaggttcta tgaggaccag tcacatcctc ccaaagtcga gctctcagcc 25860
tgcgtcatca cccagggagc aattctggcc caattgcaag ccatccaaaa atcccgccaa 25920
gaatttctac tgaaaaaggg aagcggggtc taccttgacc cccagaccgg tgaggagctc 25980
aacacaaggt tcccccagga tgtcccatcg ccgaggaagc aagaagctga aggtgcagct 26040
gacgccccca gaggatatgg aggaagactg ggacagtcag gcagaggagg agatggaaga 26100
ttgggacagc caggcagagg aggtggacag cctggaggaa gacagtttgg aggaggaaga 26160
cgaggaggca gaggaggtgg aagaagcaac cgccgccaaa cagttgtcat cggcggcgga 26220
gacaagcaag tccccagaca gcagcacggc taccatctcc gctccgggtc ggggggtcca 26280
gcggcggccc aacagtagat gggacgagac cgggcgattc ccaaacccga ccaccgcttc 26340
caagaccggt aagaaggagc gacagggata caagtcctgg cgtggacata aaaacgctat 26400
catctcctgc ttgcatgaat gcgggggcaa catatccttc acccggcgat acctgctctt 26460
ccaccacggt gtgaacttcc cccgcaatat cttgcattac taccgtcacc tccacagccc 26520
ctactgcagt cagcaagtcc cggcaacccc gacagaaaaa gacagcagcg acaacggtga 26580
ccagaaaacc agcagttaga aaatctacaa caagtgcagc aggaggagga ctgaggatca 26640
cagcgaacga gccagcgcag accagagagc tgaggaaccg gatctttcca accctctatg 26700
ccatcttcca gcagagtcgg gggcaagagc aggaactgaa agtaaaaaac cgatctctgc 26760
gctcgctcac cagaagttgt ttgtatcaca agagcgaaga ccaacttcag cgcactctcg 26820
aggacgccga ggctctcttc aacaagtact gcgcgctgac tcttaaagag tagcccttgc 26880
ccgcgcttat tcgaaaacgg cgggaatcac gtcacccttg gcacctgtcc tttgccctag 26940
tcatgagtaa agagattccc acgccttaca tgtggagcta tcagccccaa atggggttgg 27000
cagcaggcgc ctcccaggac tactccaccc gcatgaattg gcttagcgcc gggccctcaa 27060
tgatatcacg ggttaatgat atacgagctt atcgaaacca gttactccta gaacagtcag 27120
ctctcaccac cacaccccgc caacacctta atccccgaaa ttggcccgcc gccctggtgt 27180
accaggaaac tcccgctccc accaccgtac tacttcctcg agacgcccag gccgaagttc 27240
agatgactaa cgcaggtgta cagctggcgg gcggttccgc cctatgtcgt caccgacctc 27300
aacagagtat aaaacgcctg gtgatcagag gccgaggtat ccagctcaac gacgagtcgg 27360
ttagctcttc gcttggtctg cgaccagacg gagtcttcca gatcgccggc tgtgggagat 27420
cttccttcac ccctcgtcag gctgtactga ctttggagag ttcgtcctcg cagccccgct 27480
cgggcggcat cggaactctc cagttcgtgg aggagtttac tccctctgtc tacttcaacc 27540
ccttctccgg ctctcctggc cagtacccag acgagttcat accgaacttc gacgcaatca 27600
gcgagtcagt ggatggctat gattgatgtc taatggtggc gcggctgagc tagctcgact 27660
gcgacaccta gaccactgcc gccgctttcg ctgcttcgcc cgggaactca ccgagttcat 27720
ctacttcgaa ctccccgagg agcaccctca gggtccggcc cacggagtgc ggattaccat 27780
cgaaggggga atagactctc gcctgcatcg aatcttctcc cagcgacccg tgctgattga 27840
gcgcgaccag ggaaatacaa ccatctccat ttactgcatc tgtaaccacc ccggattgca 27900
tgaaagcctt tgctgtcttg tttgtgctga gtttaataaa aactgagtta agaccctcct 27960
acggactacc gcttcttcaa tcaggacttt acaacaccaa ccagatcttc cagaagaccc 28020
agacccttcc tcctctgatc caggactcta actctacctt accagcacca tccactacta 28080
accttcccga aactaacaag cttggatctc atctgcaaca ccgcctttca cgaagccttc 28140
tttctgccaa tactaccact cccaaaaccg gaggtgagct ccgcggtctc cctactgacg 28200
acccctgggt ggtagcgggt tttgtaacgt taggagtagt tgcgggtggg cttgtgctaa 28260
tcctttgcta cctatacata ccttgctgtg catatttagt catattgcgc tgttggttta 28320
aaaaatgggg gccatattag tcgtgcttgc tttactttcg cttttgggtc tgggctctgc 28380
taatctcaat cctcttgatc acgatccatg tctagacttc gacccagaaa actgcacact 28440
tacttttgca cccgacacaa gccgtctctg tggagttctt attaagtgcg gatgggactg 28500
caggtccgtt gaaattacac ataataataa aacatggaac aataccttat ccaccacatg 28560
ggagccagga gttcccgagt ggtatactgt ctctgtccga ggtcctgacg gttccatccg 28620
cattagtaac aacactttta ttttttctga aatgtgcgat ctggccatgt tcatgagcag 28680
acagtatgac ctatggcctc ccagcaaaga gaacattgtg gcattttcca ttgcttattg 28740
cttggtaaca tgcatcatca ctgctatcat ttgtgtgtgc atacacttgc ttatagttat 28800
tcgccctaga caaagcaata aggaaaaaga gaaaatgcct taaccttttt actcatacct 28860
tttctttaca gcatggcttt tgttacagct ctaattattg ccaacattgt cactgtcgct 28920
cacgggcaaa caattatcca tattacctta ggacataatc acacccttgt agggccccca 28980
attacttcag aggttatttg gaccaaactt ggaagtgttg attattttga tataatttgc 29040
aacaaaacta aaccaatatt tgtaatctgt aacagacaaa atctcacgtt aattaatgtt 29100
agcaaaattt ataacggtta ctattatggt tatgacagat ccagtagtca atataaaaat 29160
tacttagttc gcataactca gcccaaatta acagtgccca ctatgacaat aattaaaatg 29220
gctaataaag cattagaaaa ttttacatca ccaacaacgc ccaatgaaaa aaacattcca 29280
aattcaatga ttgcaattat tgcggcggtg gcattgggaa tggcactaat aataatatgc 29340
atgttcctat atgcttgttg ctataaaaag tttcaacata aacaggatcc actactaaat 29400
tttaacattt aattttttat acagatgttt tccactacaa tttttatcat tactagcctt 29460
gcagctgtaa cttatggccg ttcacaccta actctacctg ttggctcaac atgtacacta 29520
caaggacccc aacaaggcta tgtcacttgg tggagaatat atgataatgg agggttcgct 29580
agaccatgtg atcagcctgg tacaaaattt tcatgcaacg gaagagactt gaccataatt 29640
aacataacat caaatgagca aggcttctat tatggaacca actataaaga tagtttagat 29700
tacaacatta ttgtagtgcc agccaccact tctgctcccc gcaaaaccac tttctctagc 29760
agcagtgcca aagcaagcac aattcctaaa acagcttctg ctatgttaaa gcttcaaaaa 29820
atcgctttaa ataattccac agccgctccc aatacaattc ctaaatcaac aattggcatc 29880
attactgccg tggtagtggg attaattatt atatttttgt gcataatgta ctatgcctgc 29940
tgctatagaa aacatgaaca aaaaggtgat gcattactaa attttgacat ttaatttttt 30000
atagaattat gatattgttt caatcaaata ccactaacac tatcaatgtg cagactactt 30060
taaatcatga catggaaaac cacactacct cctatgcata cacaaacatt cagcctaaat 30120
acgctatgca atagaaattc taaaagacgt cccatctatt ctcctatgat tagtcgtccc 30180
catatggctt tgaatgaaat ctaagatctt tttttttttt ctcttacagt atggtgaaca 30240
ccaatcatga tccctagaaa tttcttcttc accatactca tctgtgcttt caatgtctgt 30300
gctactttca cagcagtagc cactgcaagc ccagactgta taggaccatt tgcttcctat 30360
gcactttttg ccttcgttac ttgcatctgc gtgtgtagca tagtctgcct ggttattaat 30420
tttttccaac tggtagactg gatctttgta cgaattgcct acctacgtca ccatcccgaa 30480
taccgcaatc aaaatgttgc ggcacttctt aggcttattt aaaaccatgc aggctatgct 30540
accagtcatt ttaattctgc tactaccctg cattgcccta gcttccaccg ccactcgcgc 30600
tacacctgaa caacttagaa aatgcaaatt tcaacaacca tggtcatttc ttgattgcta 30660
ccatgaaaaa tctgatttcc ccacatactg gatagtgatt gttggaataa ttaacatact 30720
ttcatgtacc tttttctcaa tcacaatata ccccacattt aattttgggt ggaattctcc 30780
caatgcactg ggttacccac aagaaccaga tgaacatatc ccactacaac acatacaaca 30840
accactagca ctggtagagt atgaaaatga gccacaacct tcactacctc ctgccattag 30900
ttacttcaac ctaaccggcg gagatgactg aaatactcac cacctccaat tccgccgagg 30960
atctgcttga tatggacggc cgcgtctcag aacagcgact cgcccaacta cgcatccgcc 31020
agcagcagga acgcgtgacc aaagagctca gagatgtcat ccaaattcac caatgcaaaa 31080
aaggcatatt ttgcttggta aaacaagcca agatatccta cgagatcacc gctactgacc 31140
atcgcctctc ttacgaactt ggcccccaac gacaaaaatt tacatgcatg gtgggaatca 31200
cccctatagt tatcactcag caaagtggag atactaaggg gtgcattcac tgctcttgcg 31260
attccatcga gtgcacctac accctgctaa agaccctatg cggcctaaga gacctgctac 31320
ccatgaatta aaaattaata aaaaatcact tacttgaaat cagcaataag gtctctgttg 31380
aaattttctc ccagcagcac ctcacttccc tcttcccaac tctggtattc taaaccccgt 31440
tcagcggcat actttctcca tactttaaag gggatgtcaa attttaactc ctgtcctgta 31500
cccacaatct tcatgtcttt cttcccagat gaccaagaga gtccggctca gtgattcctt 31560
caaccctgtc tacccctatg aagatgaaag cacctcccaa caccccttta taaacccagg 31620
gtttatttcc ccaaatggct ttacacaaag cccagacgga gttcttactt taaaatgttt 31680
aaccccacta acaaccacag gcgggtctct acagttaaaa gtgggagggg gtcttacaat 31740
agatgacacc gacggttttt tgaaagaaaa cataagtgcc accacaccac tcgttaagac 31800
tggtcactct ataggtttgt cgctaggacc cggattagga acaaatgaaa acaaactttg 31860
tgccaaattg ggagaaggac ttacattcaa ttccaacaac atttgcatta atgacaatat 31920
taacacccta tggacaggag ttaaccccac cagagccaac tgtcaaataa tggcctccag 31980
tgaatctaat gattgcaaat taattctaac actagttaaa actggagccc tcgtcactgc 32040
atttgtttat gttataggag tatctaacga ttttaatatg ctaactacac ataaaaatat 32100
aaatttcact gcagagctgt tttttgattc tactggtaat ttattaacta gcctttcatc 32160
cctaaaaact ccacttaatc ataaatcagg gcaaaacatg gctactggtg cccttactaa 32220
tgctaaaggt ttcatgccca gcacaactgc ctatcctttc aatgttaatt ccagagaaaa 32280
agaaaactac atttacggaa cttgttacta cacagctagt gatcacactg cttttcccat 32340
tgacatatct gtcatgctta accaaagagc attaaataat gagacatcat attgtattcg 32400
tgtaacttgg tcctggaata caggagttgc cccagaagtg caaacctctg ctactaccct 32460
agtcacctct ccatttacct tttactacat tagagaagac gactgacaaa taaagtttaa 32520
cttgtttatt taaaatcaat tcataaaatt cgagtagtta ttttgcctcc cccttcccat 32580
ttaacagaat acaccaatct ctccccacgc acagctttaa acatttggat accattacag 32640
atagacatag ttttagattc cacattccaa acagtttcaa agcgagccaa tctggggtca 32700
gtgatacata aaaatgcatc gggatagtct tttaaagcgc tttcacagtc caactgctgc 32760
ggatgcgact ccggagtctg gatcacggtc atctggaaga agaacgatgg gaatcataat 32820
ccgaaaacgg aatcgggcga ttgtgtctca tcaaacccac aagcagccgc tgtctgcgtc 32880
gctccgtgcg actgctgttt ataggatcgg gatccacagt gtcctgaagc atgattttaa 32940
tagcccttaa cattaacttt ctggtgcggt gcgcgcagca acgcattctg atttcactta 33000
gattactaca gtaggtacag cacattatca caatattgtt taataaacca taattaaaag 33060
cgctccagcc aaaactcata tcagatataa tcgcccctgc atgaccatca taccaaattt 33120
taatataaat taaatgtcgt tccctcaaaa acacactacc cacatacata atctcttttg 33180
gcatgtgcat attaacaatc tgtctgtacc atggacaacg ttggttaatc atgcaaccca 33240
atataacctt ccgaaaccac actgccaaca ccgctccccc agccatgcat tgaagtgaac 33300
cctgccgatt acaatgacaa tgaagaaccc aattctctcg accatgaatc acttgagaat 33360
aaaaaatatc tatagtagca caacaaagac ataaatgcat gcatcttctc ataattctta 33420
actcctcggg atttagaaac atatcccaag gaatgggaaa ctcttgcaga acagtaaagc 33480
tggcagaaca aggaagacca cgaacacaac ttacactatg catagtcata gtatcacaat 33540
ctggcaacag cgggtggtct tcagtcatag aagctcgggt ttcattttcc tcacatcgtg 33600
gtaactgggc tctggtgtaa gggtgatgtc tggcgcatga tgtcgagcgt gcgcgcaacc 33660
ttgtcataat ggagttgctt cctgacattc tcgtattttg tatagcaaaa cgcggccctg 33720
gcacaacaca ctcttcttcg tcttctatcc tgccgcttag tgtgttccgt ctgataattc 33780
aagtacagcc acactcttaa gttggtcaaa agaatgctgg cttcagttgt aatcaaaact 33840
ccatcatatt taattgttct aaggaaatca tccacggtag catatgcaaa tcccaaccaa 33900
gcaatgcaac tggattgcgt ttcaagcagc agaggagagg gaagagacgg aagaatcatg 33960
ttaattttta ttccaaacga tctcgcagta cttcaaattg tagatcgcgc agatggcatc 34020
tatcgccccc actgtgttgg tgaaaaagca cagctaaatc aaaagaaatg cgattttcaa 34080
ggtgctcaac ggtggcttcc aacaaagcct ccacgcgcac atccaaaaac aaaagaatac 34140
caaaagaagg agcattttct aactcctcaa acatcatatt acattcctgc accattccca 34200
gataattttc agctttccag ccttgaatta ttcgtgtcag ttcttgtggt aaatccaaac 34260
cacacattac aaacaggtcc cggagggcgc cctccaccac cattcttaaa cacaccctca 34320
taatgtcaaa atatcttgct cctgtgtcac ctgtagcaaa ttaagaatgg catcatcaat 34380
tgacatgccc ttggctctaa gttcttctct aagttctagt tgtaaatact ctttcatatt 34440
atcaccaaac tgcttagcca gaagcccccc gggaacaata gcaggggacg ctacagtgca 34500
gtacaagcgc agacctcccc aattggctcc agcaaaaaca agattagaat aagcatactg 34560
ggaaccacca gtaatatcat caaagttgct ggaaatataa tcaggcagag tttcttgtaa 34620
aaattgaata aaagaaaaat tttccaaaga aacattcaaa acctctggga tgcaaatgca 34680
ataggttacc gcgctgcgct ccaacattat tagttttgaa ttagtctgta aaataaaaga 34740
aacaagcgtc atatcatagt agcctgtcga acaggtggat aaatcagtct ttccattaca 34800
agacaagcca cagggtctcc agctcgaccc tcgtaaaacc tgtcatcgtg attaaacaac 34860
agcaccgaaa gttcctcgcg gtggccagca tgaataattc ttgatgaagc atataatcca 34920
gacatgttag catcagttaa agaaaaaaaa cagccaacat agcctctggg tataattatg 34980
cttaatctta agtatagcaa agccacccct cgcggataca aagtaaaagg cacaggagaa 35040
taaaaaatat aattatttct ctgctgctgt tcaggcaacg ttgcccccgg tccctctaaa 35100
tacacataca aagcctcatc agccatggct taccagacaa agtatagcgg gcgcacaaag 35160
cacaagctct aaagaagctc taaagacgct ctccaacctc tccacaatat atacacaagc 35220
cctaaactga cgtaatggga gtaaagtgta aaaaatcccg ccaagcccaa cacacacccc 35280
gaaactgcgt cagcagggaa aagtacagtt tcacttccgc aaacccaaca agcgtagctt 35340
cctctttctc acggtacgtc acatccgatt aacttgcaac gtcattttcc cacggccgcc 35400
ccgcccattt tagccgttaa ccccacagcc aatcaccaca cagcgcgcac ttttttaaat 35460
tacctcattt acatattggc accattccat ctataaggta tattatatag agag 35514
<210> 147
<211> 34794
<212> DNA
<213> Human mastadenovirus B
<400> 147
catcatcaat aatatacctt atagatggaa tggtgccaat atgtaaatga ggtgatttta 60
aaaagtgtgg atcgtgtggt gattggctgt ggggttaacg gctaaaaggg gcggtgcgac 120
cgtgggaaaa tgacgttttg tgggggtgga gtttttttgc aagttgtcgc gggaaatgtg 180
acgcataaaa aggctttttt ctcacggaac tacttagttt tcccacggta tttaacagga 240
aatgaggtag ttttgaccgg atgcaagtga aaattgttga ttttcgcgcg aaaactgaat 300
gaggaagtgt ttttctgaat aatgtggtat ttatggcagg gtggagtatt tgttcagggc 360
caggtagact ttgacccatt acgtggaggt ttcgattacc gtgtttttta cctgaatttc 420
cgcgtaccgt gtcaaagtct tctgttttta cgtaggtgtc agctgatcgc tagggtattt 480
atacctcagg gtttgtgtca agaggccact cttgagtgcc agcgagaaga gttttctcct 540
ctgcgccggc agtttaataa taaaaaaatg agagatttgc gatttctgcc tcaggaaata 600
atctctgctg agactggaaa tgaaatattg gagcttgtgg tgcacgccct gatgggagac 660
gatccggagc cacctgtgca gctttttgag cctcctacgc ttcaggaact gtatgattta 720
gaggtagagg gatcggagga ttctaatgag gaagctgtaa atggcttttt taccgattct 780
atgcttttag ctgctaatga agggttagaa ttagatccgc ctttggacac ttttgatact 840
ccaggggtaa ttgtggaaag cggtacaggt gtaagaaaat tacctgattt gagttccgtg 900
gactgtgatt tgcactgcta tgaagacggg tttcctccga gtgatgagga ggaccatgaa 960
aaggagcagt ccatgcagac tgcagcgggt gagggagtga aggctgccaa tgttggtttt 1020
cagttggatt gcccggagct tcctggacat ggctgtaagt cttgtgaatt tcacaggaaa 1080
aatactggag taaaggaact gttatgttcg ctttgttata tgagaacgca ctgccacttt 1140
atttacagta agtgtgttta agttaaaatt taaaggaata tgctgttttt cacatgtata 1200
ttgagtgtga gttttgtgct tcttattata ggtcctgtgt ctgatgctga tgaatcacca 1260
tctcctgatt ctactacctc acctcctgag attcaagcac ctgttcctgt ggacgtgcgc 1320
aagcccattc ctgtgaagct taagcctggg aaacgtccag cagtggaaaa acttgaggac 1380
ttgttacagg gtggggacgg acctttggac ttgagtacac ggaaacgtcc aagacaataa 1440
gtgttccata tccgtgttta cttaaggtga cgtcaatatt tgtgtgacag tgcaatgtaa 1500
taaaaatatg ttaactgttc actggttttt attgcttttt gggcggggac tcaggtatat 1560
aagtagaagc agacctgtgt ggttagctca taggagctgg ctttcatcca tggaggtttg 1620
ggccattttg gaagacctta ggaagactag gcaactgtta gagaacgctt cggacggagt 1680
ctccggtttt tggagattct ggttcgctag tgaattagct agggtagttt ttaggataaa 1740
acaggactat aaccaagaat ttgaaaagtt gttggtagat tgcccaggac tttttgaagc 1800
tcttaatttg ggccatcagg ttcactttaa agaaaaagtt ttatcagttt tagacttttc 1860
aaccccaggt agaactgctg ctgctgtggc ttttcttact tttatattag ataaatggat 1920
cccgcagact catttcagca ggggatacgt tttggatttc atagccacag cattgtggag 1980
aacatggaag gttcgcaaga tgaggacaat cttaggttac tggccagtgc agcctttggg 2040
tgtagcggga atcctgaggc atccaccggt catgccagcg gttctggagg aggaacagca 2100
agaggacaac ccgagagccg gcctggaccc tccagtggag gaggcggagt agctgacttg 2160
tctcctgaac tgcaacgggt gcttactgga tctacgtcca ctggacggga taggggcgtt 2220
aagagggaga gggcatctag tggtactgat gctagatctg agttggcttt aagtttaatg 2280
agtcgcagac gtcctgaaac catttggtgg catgaggttc agaaagaggg aagggatgaa 2340
gtttctgtat tgcaggagaa atattcactg gaacaggtga aaacatgttg gttggagcct 2400
gaggatgatt gggaggtggc cattaaaaat tatgccaaga tagctttgag gcctgataaa 2460
cagtataaga ttactagacg gattaatatc cggaatgctt gttacatatc tggaaatggg 2520
gctgaggtgg taatagatac tcaagacaag gcagttatta gatgctgcat gatggatatg 2580
tggcctgggg tagtcggtat ggaagcagta acttttgtaa atgttaagtt taggggagat 2640
ggttataatg gaatagtgtt tatggccaat accaaactta tattgcatgg ttgtagcttt 2700
tttggtttca acaatacctg tgtagatgcc tggggacagg ttagtgtacg gggatgtagt 2760
ttctatgcgt gttggattgc cacagctggc agaaccaaga gtcaattgtc tctgaagaaa 2820
tgcatatttc aaagatgtaa cctgggcatt ctgaatgaag gcgaagcaag ggtccgccac 2880
tgcgcttcta cagatactgg atgttttatt ttgattaagg gaaatgccag cgtaaagcat 2940
aacatgattt gcggtgcttc cgatgagagg ccttatcaaa tgctcacttg tgctggtggg 3000
cattgtaata tgctggctac tgtgcatatt gtttcccatc aacgcaaaaa atggcctgtt 3060
tttgatcaca atgtgatgac gaagtgtacc atgcatgcag gtgggcgtag aggaatgttt 3120
atgccttacc agtgtaacat gaatcatgtg aaagtgttgt tggaaccaga tgccttttcc 3180
agaatgagcc taacaggaat ttttgacatg aacatgcaaa tctggaagat cctgaggtat 3240
gatgatacga gatcgagggt acgcgcatgc gaatgcggag gcaagcatgc caggttccag 3300
ccggtgtgtg tagatgtgac tgaagatctc agaccggatc atttggttat tgcccgcact 3360
ggagcagagt tcggatccag tggagaagaa actgactaag gtgagtattg ggaaaacttt 3420
ggggtgggat tttcagatgg acagattgag taaaaatttg ttttttctgt cttgcagctg 3480
tcatgagtgg aaacgcttct tttaaggggg gagtcttcag cccttatctg acagggcgtc 3540
tcccatcctg ggcaggagtt cgtcagaatg ttatgggatc tactgtggat ggaagacccg 3600
tccaacccgc caattcttca acgctgacct atgctacttt aagttcttca cctttggacg 3660
cagctgcagc tgccgccgcc gcttctgttg ccgctaacac tgtgcttgga atgggttact 3720
atggaagcat catggctaat tccacttcct ctaataaccc ttctaccctg actcaggaca 3780
agttacttgt ccttttggcc cagctggagg ctttgaccca acgtctgggt gaactttctc 3840
agcaggtggt cgagttgcga gtacaaactg agtctgctgt cggcacggca aagtctaaat 3900
aaaaaaatcc cagaatcaat gaataaataa acaagcttgt tgttgattta aaatcaagtg 3960
tttttatttc atttttcgcg cacggtatgc cctagaccac cgatctctat cattgagaac 4020
tcggtggatt ttttccagga tcctatagag gtgggattga atgtttagat acatgggcat 4080
taggccgtct ttggggtgga gatagctcca ttgaagggat tcatgctccg gggtagtgtt 4140
gtaaatcacc cagtcataac aaggtcgcag tgcatggtgt tgcacaatat cttttagaag 4200
taggctgatt gccacagata agcccttggt gtaggtgttt acaaaccggt tgagctggga 4260
tgggtgcatt cggggtgaaa ttatgtgcat tttggattgg atttttaagt tggcaatatt 4320
gccgccaaga tcccgtcttg ggttcatgtt atgaaggacc accaagacgg tgtatccggt 4380
acatttagga aatttatcgt gcagcttgga tggaaaagcg tggaaaaatt tggagacacc 4440
cttgtgtcct ccaagatttt ccatgcactc atccatgata atagcaatgg ggccgtgggc 4500
agcggcgcgg gcaaacacgt tccgtgggtc tgacacatca tagttatgtt cctgagttaa 4560
atcatcataa gccattttaa tgaatttggg gcggagagta ccagattggg gtatgaatgt 4620
tccttcgggc cccggagcat agttcccctc acagatttgc atttcccaag ctttcagttc 4680
cgagggtgga atcatgtcca cctggggggc tatgaaaaac accgtttctg gggcgggggt 4740
gattaattgt gatgatagca aatttctgag caattgagat ttgccacatc cggtggggcc 4800
ataaatgatt ccgattacgg gttgcaggtg gtagtttagg gaacggcaac tgccgtcttc 4860
tcgaagcaag ggggccacct cgttcatcat ttcccttaca tgcatatttt cccgcaccaa 4920
atccattagg aggcgctctc ctcctagtga tagaagttct tgtagtgagg aaaagttttt 4980
cagcggtttc agaccgtcag ccatgggcat tttggagaga gtttgctgca aaagttctag 5040
tctgttccac agttcagtga tgtgttctat ggcatctcga tccagcagac ctcctcgttt 5100
cgcgggtttg gacggctcct ggaatagggt atgagacgat gggcgtccag cgctgccagg 5160
gttcggtcct tccagggtct cagtgttcga gtcagggttg tttccgtcac agtgaagggg 5220
tgtgcgcctg cttgggcgct tgccagggtg cgcttcagac tcatcctgct ggtcgaaaac 5280
ttctgtcgct tggcgccctg tatgtcggcc aagtagcagt ttaccatgag ttcgtagttg 5340
agcgcctcgg ctgcgtggcc tttggcgcgg agcttacctt tggaagtttt cttgcatacc 5400
gggcagtata ggcatttcag cgcatacaac ttgggcgcaa ggaaaacgga ttctggggag 5460
tatgcatctg cgccgcagga ggcgcaaaca gtttcacatt ccaccagcca ggttaaatcc 5520
ggttcattgg ggtcaaaaac aagttttccg ccatattttt tgatgcgttt cttacctttg 5580
gtctccatga gttcgtgtcc tcgttgagtg acaaacaggc tgtccgtgtc cccgtagact 5640
gattttacag gcctcttctc cagtggagtg cctcggtctt cttcgtacag gaactctgac 5700
cactctgata caaaggcgcg cgtccaggcc agcacaaagg aggctatgtg ggaggggtag 5760
cgatcgttgt caaccagggg gtccaccttt tccaaagtat gcaaacacat gtcaccctct 5820
tcaacatcca ggaatgtgat tggcttgtag gtgtatttca cgtgacctgg ggtccccgct 5880
gggggggtat aaaagggggc ggttctttgc tcttcctcac tgtcttccgg atcgctgtcc 5940
aggaacgtca gctgttgggg taggtattcc ctctcgaagg cgggcatgac ctctgcactc 6000
aggttgtcag tttctaagaa cgaggaggat ttgatattga cagtgccggt tgagatgcct 6060
ttcatgaggt tttcgtccat ttggtcagaa aacacaattt ttttattgtc aagtttggtg 6120
gcaaatgatc catacagggc gttggataaa agtttggcaa tggatcgcat ggtttggttc 6180
ttttccttgt ccgcgcgctc tttggcggcg atgttgagtt ggacatactc gcgtgccagg 6240
cacttccatt cggggaagat agttgttaat tcatctggca cgattctcac ttgccaccct 6300
cgattatgca aggtaattaa atccacactg gtggccacct cgcctcgaag gggttcattg 6360
gtccaacaga gcctacctcc tttcctagaa cagaaagggg gaagtgggtc tagcataagt 6420
tcatcgggag ggtctgcatc catggtaaag attcccggaa gtaaatcctt atcaaaatag 6480
ctgatgggag tggggtcatc taaggccatt tgccattctc gagctgccag tgcgcgctca 6540
tatgggttaa ggggactgcc ccatggcatg ggatgggtga gtgcagaggc atacatgcca 6600
cagatgtcat agacgtagat gggatcctca aagatgccta tgtaggttgg atagcatcgc 6660
ccccctctga tacttgctcg cacatagtca tatagttcat gtgatggcgc tagcagcccc 6720
ggacccaagt tggtgcgatt gggtttttct gttctgtaga cgatctggcg aaagatggcg 6780
tgagaattgg aagagatggt gggtctttga aaaatgttga aatgggcatg aggtagacct 6840
acagagtctc tgacaaagtg ggcataagat tcttgaagct tggttaccag ttcggcggtg 6900
acaagtacgt ctagggcgca gtagtcaagt gtttcttgaa tgatgtcata acctggttgg 6960
tttttctttt cccacagttc gcggttgaga aggtattctt cgcgatcctt ccagtactct 7020
tctagcggaa acccgtcttt gtctgcacgg taagatccta gcatgtagaa ctgattaact 7080
gccttgtaag ggcagcagcc cttctctacg ggtagagagt atgcttgagc agcttttcgt 7140
agcgaagcgt gagtaagggc aaaggtgtct ctgaccatga ctttgagaaa ttggtatttg 7200
aagtcgatgt cgtcacaggc tccctgttcc cagagttgga agtctacccg tttcttgtag 7260
gcggggttgg gcaaagcgaa agtaacatca ttgaagagaa tcttaccggc tctgggcata 7320
aaattgcgag tgatgcgaaa aggctgtggt acttccgctc gattgttgat cacctgggca 7380
gctaggacga tctcgtcgaa accgttgatg ttgtgtccta cgatgtataa ttctatgaaa 7440
cgcggcgtgc ctctgacgtg aggtagctta ctgagctcat caaaggttag gtctgtgggg 7500
tcagataagg cgtagtgttc gagagcccat tcgtgcaggt gaggatttgc atgtaggaat 7560
gatgaccaaa gatctaccgc cagtgctgtt tgtaactggt cccgatactg acgaaaatgc 7620
cggccaattg ccattttttc tggagtgaca cagtagaagg ttctggggtc ttgttgccat 7680
cgatcccact tgagtttaat ggctagatcg tgggccatgt tgacgagacg ctcttctcct 7740
gagagtttca tgaccagcat gaaaggaact agttgtttgc caaaggatcc catccaggtg 7800
taagtttcca catcgtaggt caggaagagt ctttctgtgc gaggatgaga gccgatcggg 7860
aagaactgga tttcctgcca ccagttggag gattggctgt tgatgtgatg gaagtagaag 7920
tttctgcggc gcgccgagca ttcgtgtttg tgcttgtaca gacggccgca gtagtcgcag 7980
cgttgcacgg gttgtatctc gtgaatgagt tgtacctggc ttcccttgac gagaaatttc 8040
agtgggaagc cgaggcctgg cgattgtatc tcgtgctctt ctatattcgc tgtatcggcc 8100
tgttcatctt ctgtttcgat ggtggtcatg ctgacgagcc cccgcgggag gcaagtccag 8160
acctcggcgc gggaggggcg gagctgaagg acgagagcgc gcaggctgga gctgtccaga 8220
gtcctgagac gctgcggact caggttagta ggtagggaca gaagattaac ttgcatgatc 8280
ttttccaggg cgtgcgggag gttcagatgg tacttgattt ccacaggttc gtttgtagag 8340
acgtcaatgg cttgcagggt tccgtgtcct ttgggcgcca ctaccgtacc tttgtttttt 8400
cttttgatcg gtggtggctc tcttgcttct tgcatgctca gaagcggtga cggggacgcg 8460
cgccgggcgg cagcggttgt tccggacccg agggcatggc tggtagtggc acgtcggcgc 8520
cgcgcacggg caggttctgg tactgcgctc tgagaagact tgcgtgcgcc accacgcgtc 8580
gattgacgtc ttgtatctga cgtctctggg tgaaagctac cggccccgtg agcttgaacc 8640
tgaaagagag ttcaacagaa tcaatttcgg tatcgttaac ggcagcttgt ctcagtattt 8700
cttgtacgtc accagagttg tcctggtagg cgatctccgc catgaactgc tcgatttctt 8760
cctcctgaag atctccgcga cccgctcttt cgacggtggc cgcgaggtca ttggagatac 8820
ggcccatgag ttgggagaat gcattcatgc ccgcctcgtt ccagacgcgg ctgtaaacca 8880
cggccccctc ggagtctctt gcgcgcatca ccacctgagc gaggttaagc tccacgtgtc 8940
tggtgaagac cgcatagttg cataggcgct gaaaaaggta gttgagtgtg gtggcaatgt 9000
gttcggcgac gaagaaatac atgatccatc gtctcagcgg catttcgcta acatcgccca 9060
gagcttccaa gcgctccatg gcctcgtaga agtccacggc aaaattaaaa aactgggagt 9120
ttcgcgcgga cacggtcaat tcctcctcga gaagacggat gagttcggct atggtggccc 9180
gtacttcgcg ttcgaaggct cccgggatct cttcttcctc ttctatctct tcttccacta 9240
acatctcttc ttcgtcttca ggcgggggcg gagggggcac gcggcgacgt cgacggcgca 9300
cgggcaaacg gtcgatgaat cgttcaatga cctctccgcg gcggcggcgc atggtttcag 9360
tgacggcgcg gccgttctcg cgcggtcgca gagtaaaaac accgccgcgc atctccttaa 9420
agtggtgact gggaggttct ccgtttggga gggagagggc gctgattata cattttatta 9480
attggcccgt agggactgca cgcagagatc tgatcgtgtc aagatccacg ggatctgaaa 9540
acctttcgac gaaagcgtct aaccagtcac agtcacaagg taggctgagt acggcttctt 9600
gtgggcgggg gtggttatgt gttcggtctg ggtcttctgt ttcttcttca tctcgggaag 9660
gtgagacgat gctgctggtg atgaaattaa agtaggcagt tctaagacgg cggatggtgg 9720
cgaggagcac caggtctttg ggtccggctt gctggatacg caggcgattg gccattcccc 9780
aagcattatc ctgacatcta gcaagatctt tgtagtagtc ttgcatgagc cgttctacgg 9840
gcacttcttc ctcacccgtt ctgccatgca tacgtgtgag tccaaatccg cgcattggtt 9900
gtaccagtgc caagtcagct acgactcttt cggcgaggat ggcttgctgt acttgggtaa 9960
gggtggcttg aaagtcatca aaatccacaa agcggtggta agctcctgta ttaatggtgt 10020
aagcacagtt ggccatgact gaccagttaa ctgtctggtg accagggcgc acgagctcgg 10080
tgtatttaag gcgcgaatag gcgcgggtgt caaagatgta atcgttgcag gtgcgcacca 10140
gatactggta ccctataaga aaatgcggcg gtggttggcg gtagagaggc catcgttctg 10200
tagctggagc gccaggggcg aggtcttcca acataaggcg gtgatagccg tagatgtacc 10260
tggacatcca ggtgattcct gcggcggtag tagaagcccg aggaaactcg cgtacgcggt 10320
tccaaatgtt gcgtagcggc atgaagtagt tcattgtagg cacggtttga ccagtgaggc 10380
gcgcgcagtc attgatgctc tatagacacg gagaaaatga aagcgttcag cgactcgact 10440
ccgtagcctg gaggaacgtg aacgggttgg gtcgcggtgt accccggttc gagacttgta 10500
ctcgagccgg ccggagccgc ggctaacgtg gtattggcac tcccgtctcg acccagccta 10560
caaaaatcca ggatacggaa tcgagtcgtt ttgctggttt ccgaatggca gggaagtgag 10620
tcctattttt tttttttgcc gctcagatgc atcccgtgct gcgacagatg cgcccccaac 10680
aacagccccc ctcgcagcag cagcagcagc aatcacaaaa ggctgtccct gcaactactg 10740
caactgccgc cgtgagcggt gcgggacagc ccgcctatga tctggacttg gaagagggcg 10800
aaggactggc acgtctaggt gcgccttcac ccgagcggca tccgcgagtt caactgaaaa 10860
aagattctcg cgaggcgtat gtgccccaac agaacctatt tagagacaga agcggcgagg 10920
agccggagga gatgcgagct tcccgcttta acgcgggtcg tgagctgcgt cacggtttgg 10980
accgaagacg agtgttgcgg gacgaggatt tcgaagttga tgaaatgaca gggatcagtc 11040
ctgccagggc acacgtggct gcagccaacc ttgtatcggc ttacgagcag acagtaaagg 11100
aagagcgtaa cttccaaaag tcttttaata atcatgtgcg aaccctgatt gcccgcgaag 11160
aagttaccct tggtttgatg catttgtggg atttgatgga agctatcatt cagaacccta 11220
ctagcaaacc tctgaccgcc cagctgtttc tggtggtgca acacagcaga gacaatgagg 11280
ctttcagaga ggcgctgctg aacatcaccg aacccgaggg gagatggttg tatgatctta 11340
tcaacattct acagagtatc atagtgcagg agcggagcct gggcctggcc gagaaggtgg 11400
ctgccatcaa ttactcggtt ttgagcttgg gaaaatatta cgctcgcaaa atctacaaga 11460
ctccatacgt tcccatagac aaggaggtga agatagatgg gttctacatg cgcatgacgc 11520
tcaaggtctt gaccctgagc gatgatcttg gggtgtatcg caatgacaga atgcatcgcg 11580
cggttagcgc cagcaggagg cgcgagttaa gcgacaggga actgatgcac agtttgcaaa 11640
gagctctgac tggagctgga accgagggtg agaattactt cgacatggga gctgacttgc 11700
agtggcagcc tagtcgcagg gctctgagcg ccgcgacggc aggatgtgag cttccttaca 11760
tagaagaggc ggatgaaggc gaggaggaag agggcgagta cttggaagac tgatggcaca 11820
acccgtgttt tttgctagat ggaacagcaa gcaccggatc ccgcaatgcg ggcggcgctg 11880
cagagccagc cgtccggcat taactcctcg gacgattgga cccaggccat gcaacgtatc 11940
atggcgttga cgactcgcaa ccccgaagcc tttagacagc aaccccaggc caaccgtcta 12000
tcggccatca tggaagctgt agtgccttcc cgctctaatc ccactcatga gaaggtcctg 12060
gccatcgtga acgcgttggt ggagaacaaa gctattcgtc cagatgaggc cggactggta 12120
tacaacgctc tcttagaacg cgtggctcgc tacaacagta gcaatgtgca aaccaatttg 12180
gaccgtatga taacagatgt acgcgaagcc gtgtctcagc gcgaaaggtt ccagcgtgat 12240
gccaacctgg gttcgctggt ggcgttaaat gctttcttga gtactcagcc tgctaatgtg 12300
ccgcgtggtc aacaggatta tactaacttt ttaagcgctt tgagactgat ggtatcagaa 12360
gtacctcaga gcgaagtgta tcagtccggt cctgattact tctttcagac tagcagacag 12420
ggcttgcaga cggtaaatct gagccaagct tttaaaaacc ttaaaggttt gtggggagtg 12480
catgccccgg taggagaaag agcaaccgtg tctagcttgt taactccgaa ctcccgccta 12540
ttattactgt tggtagctcc tttcaccgac agcggtagca tcgaccgtaa ttcctatttg 12600
ggttacctac taaacctgta tcgcgaagcc atagggcaaa gtcaggtgga cgagcagacc 12660
tatcaagaaa ttacccaagt cagtcgcgct ttgggacagg aagacactgg cagtttggaa 12720
gccactctga acttcttgct taccaatcgg tctcaaaaga tccctcctca atatgctctt 12780
actgcggagg aggagaggat ccttagatat gtgcagcaga gcgtgggatt gtttctgatg 12840
caagaggggg caactccgac tgcagcactg gacatgacag cgcgaaatat ggagcccagc 12900
atgtatgcca gtaaccgacc tttcattaac aaactgctgg actacttgca cagagctgcc 12960
gctatgaact ctgattattt caccaatgcc atcttaaacc cgcactggct gcccccacct 13020
ggtttctaca cgggcgaata tgacatgccc gaccctaatg acggatttct gtgggacgac 13080
gtggacagcg atgttttttc acctctttct gatcatcgca cgtggaaaaa ggaaggcggc 13140
gatagaatgc attcttctgc atcgctgtcc ggggtcatgg gtgctaccgc ggctgagccc 13200
gagtctgcaa gtccttttcc tagtctaccc ttttctctac acagtgtacg tagcagcgaa 13260
gtgggtagaa taagtcgccc gagtttaatg ggcgaagagg agtatctaaa cgattccttg 13320
ctcagaccgg caagagaaaa aaatttccca aacaatggaa tagaaagttt ggtggataaa 13380
atgagtagat ggaagactta tgctcaggat cacagagacg agcctgggat catggggatt 13440
acaagtagag cgagccgtag acgccagcgc catgacagac agaggggtct tgtgtgggac 13500
gatgaggatt cggccgatga tagcagcgtg ctggacttgg gtgggagagg aaggggcaac 13560
ccgtttgctc atttgcgccc tcgcttgggt ggtatgttgt aaaaaaaaat aaaaaaaaaa 13620
ctcaccaagg ccatggcgac gagcgtacgt tcgttcttct ttattatctg tgtctagtat 13680
aatgaggcga gtcgtgctag gcggagcggt ggtgtatccg gagggtcctc ctccttcgta 13740
cgagagcgtg atgcagcagc agcaggcgac ggcggtgatg caatccccac tggaggctcc 13800
ctttgtgcct ccgcgatacc tggcacctac ggagggcaga aacagcattc gttattcgga 13860
actggcacct cagtacgata ccaccaggtt gtatctggtg gacaacaagt cggcggacat 13920
tgcttctctg aactatcaga atgaccacag caacttcttg accacggtgg tgcaaaacaa 13980
tgactttacc cctacggaag ccagcaccca gaccattaac tttgatgaac gatcgcggtg 14040
gggcggtcag ctaaagacca tcatgcatac taacatgcca aacgtgaacg agtatatgtt 14100
tagtaacaag ttcaaagcgc gtgtgatggt gtccagaaaa cctcccgacg gtgctgcagt 14160
tggggatact tatgatcaca agcaggatat tttgaaatat gagtggttcg agtttacttt 14220
gccagaaggc aacttttcag ttactatgac tattgatttg atgaacaatg ccatcataga 14280
taattacttg aaagtgggta gacagaatgg agtgcttgaa agtgacattg gtgttaagtt 14340
cgacaccagg aacttcaagc tgggatggga tcccgaaacc aagttgatca tgcctggagt 14400
gtatacgtat gaagccttcc atcctgacat tgtcttactg cctggctgcg gagtggattt 14460
taccgagagt cgtttgagca accttcttgg tatcagaaaa aaacagccat ttcaagaggg 14520
ttttaagatt ttgtatgaag atttagaagg tggtaatatt ccggccctct tggatgtaga 14580
tgcctatgag aacagtaaga aagaacaaaa agccaaaata gaagctgcta cagctgctgc 14640
agaagctaag gcaaacatag ttgccagcga ctctacaagg gttgctaacg ctggagaggt 14700
cagaggagac aattttgcgc caacacctgt tccgactgca gaatcattat tggccgatgt 14760
gtctgaagga acggacgtga aactcactat tcaacctgta gaaaaagata gtaagaatag 14820
aagctataat gtgttggaag acaaaatcaa cacagcctat cgcagttggt atctttcgta 14880
caattatggc gatcccgaaa aaggagtgcg ttcctggaca ttgctcacca cctcagatgt 14940
cacctgcgga gcagagcagg tctactggtc gcttccagac atgatgaagg atcctgtcac 15000
tttccgctcc actagacaag tcagtaacta ccctgtggtg ggtgcagagc ttatgcccgt 15060
cttctcaaag agcttctaca acgaacaagc tgtgtactcc cagcagctcc gccagtccac 15120
ctcgcttacg cacgtcttca accgctttcc tgagaaccag attttaatcc gtccgccggc 15180
gcccaccatt accaccgtca gtgaaaacgt tcctgctctc acagatcacg ggaccctgcc 15240
gttgcgcagc agtatccggg gagtccaacg tgtgaccgtt actgacgcca gacgccgcac 15300
ctgtccctac gtgtacaagg cactgggcat agtcgcaccg cgcgtccttt caagccgcac 15360
tttctaaaaa aaaaaaaaat gtccattctt atctcgccca gtaataacac cggttggggt 15420
ctgcgcgctc caagcaagat gtacggaggc gcacgcaaac gttctaccca acatcctgtc 15480
cgtgttcgcg gacattttcg cgctccatgg ggcgccctca agggccgcac tcgcgttcga 15540
accaccgtcg atgatgtaat cgatcaggtg gttgccgacg cccgtaatta tactcctact 15600
gcgcctacat ctactgtgga tgcagttatt gacagtgtag tggctgacgc tcgcaactat 15660
gctcgacgta agagccggcg aaggcgcatt gccagacgcc accgagctac cactgccatg 15720
cgagccgcaa gagctctgct acgaagagct agacgcgtgg ggcgaagagc catgcttagg 15780
gcggccagac gtgcagcttc gggcgccagc gccggcaggt cccgcaggca agcagccgct 15840
gtcgcagcgg cgactattgc cgacatggcc caatcgcgaa gaggcaatgt atactgggtg 15900
cgtgacgctg ccaccggtca acgtgtaccc gtgcgcaccc gtccccctcg cacttagaag 15960
atactgagca gtctccgatg ttgtgtccca gcggcgagga tgtccaagcg caaatacaag 16020
gaagaaatgc tgcaggttat cgcacctgaa gtctacggcc aaccgttgaa ggatgaaaaa 16080
aaaccccgca aaatcaagcg ggttaaaaag gacaaaaaag aagaggaaga tggcgatgat 16140
gggctggcgg agtttgtgcg cgagtttgcc ccacggcgac gcgtgcaatg gcgtgggcgc 16200
aaagttcgac atgtgttgag acctggaact tcggtggtct ttacacccgg cgagcgttca 16260
agcgctactt ttaagcgttc ctatgatgag gtgtacgggg atgatgatat tcttgagcag 16320
gcggctgacc gattaggcga gtttgcttat ggcaagcgta gtagaataac ttccaaggat 16380
gagacagtgt cgataccctt ggatcatgga aatcccaccc ctagtcttaa accggtcact 16440
ttgcagcaag tgttacccgt aactccgcga acaggtgtta aacgcgaagg tgaagatttg 16500
tatcccacta tgcaactgat ggtacccaaa cgccagaagt tggaggacgt tttggagaaa 16560
gtaaaagtgg atccagatat tcaacctgag gttaaagtga gacccattaa gcaggtagcg 16620
cctggtctgg gggtacaaac tgtagacatt aagattccca ctgaaagtat ggaagtgcaa 16680
actgaacccg caaagcctac tgccacctcc actgaagtgc aaacggatcc atggatgccc 16740
atgcctatta caactgacgc cgccggtccc actcgaagat cccgacgaaa gtacggtcca 16800
gcaagtctgt tgatgcccaa ttatgttgta cacccatcta ttattcctac tcctggttac 16860
cgaggcactc gctactatcg cagccgaaac agtacctccc gccgtcgccg caagacacct 16920
gcaaatcgca gtcgtcgccg tagacgcaca agcaaaccga ctcccggcgc cctggtgcgg 16980
caagtgtacc gcaatggtag tgcggaacct ttgacactgc cgcgtgcgcg ttaccatccg 17040
agtatcatca cttaatcaat gttgccgctg cctccttgca gatatggccc tcacttgtcg 17100
ccttcgcgtt cccatcactg gttaccgagg aagaaactcg cgccgtagaa gagggatgtt 17160
gggacgcgga atgcgacgct acaggcgacg gcgtgctatc cgcaagcaat tgcggggtgg 17220
ttttttacca gccttaattc caattatcgc tgctgcaatt ggcgcgatac caggcatagc 17280
ttccgtggcg gttcaggcct cgcaacgaca ttgacattgg aaaaaaacgt ataaataaaa 17340
aaaaaaaaat acaatggact ctgacactcc tggtcctgtg actatgtttt cttagagatg 17400
gaagacatca atttttcatc cttggctccg cgacacggca cgaagccgta catgggcacc 17460
tggagcgaca tcggcacgag ccaactgaac gggggcgcct tcaattggag cagtatctgg 17520
agcgggctta aaaattttgg ctcaaccata aaaacatacg ggaacaaagc ttggaacagc 17580
agtacaggac aggcgcttag aaataaactt aaagaccaga acttccaaca aaaagtagtc 17640
gatgggatag cttccggcat caatggagtg gtagatttgg ctaaccaggc tgtgcagaaa 17700
aagataaaca gtcgtttgga cccgccgcca gcaaccccag gtgaaatgca agtggaggaa 17760
gaaattcctc cgccagaaaa acgaggcgac aagcgtccgc gtcccgattt ggaagagacg 17820
ctggtgacgc gcgtagatga accgccttct tatgaggaag caacgaagct tggaatgccc 17880
accactagac cgatagcccc aatggccacc ggggtgatga aaccttctca gttgcatcga 17940
cccgtcacct tggatttgcc ccctccccct gctgctactg ctgtacccgc ttctaagcct 18000
gtcgctgccc cgaaaccagt cgccgtagcc aggtcacgtc ccgggggcgc tcctcgtcca 18060
aatgcgcact ggcaaaatac tctgaacagc atcgtgggtc taggcgtgca aagtgtaaaa 18120
cgccgtcgct gcttttaatt aaatatggag tagcgcttaa cttgcctatc tgtgtatatg 18180
tgtcattaca cgccgtcaca gcagcagagg aaaaaaggaa gaggtcgtgc gtcgacgctg 18240
agttactttc aagatggcca ccccatcgat gctgccccaa tgggcataca tgcacatcgc 18300
cggacaggat gcttcggagt acctgagtcc gggtctggtg cagttcgccc gcgccacaga 18360
cacctacttc aatctgggaa ataagtttag aaatcccacc gtagcgccga cccacgatgt 18420
gaccaccgac cgtagccagc ggctcatgtt gcgcttcgtg cccgttgacc gggaggacaa 18480
tacatactct tacaaagtgc ggtacaccct ggccgtgggc gacaacagag tgctggatat 18540
ggccagcacg ttctttgaca ttaggggtgt gttggacaga ggtcccagtt tcaaacccta 18600
ttctggtacg gcttacaact ccctggctcc taaaggcgct ccaaatacat ctcagtggat 18660
tgcagaaggt gtaaaaaata caactggtga ggaacacgta acagaagagg aaaccaatac 18720
tactacttac acttttggca atgctcctgt aaaagctgaa gctgaaatta caaaagaagg 18780
actcccagta ggtttggaag tttcagatga agaaagtaaa ccgatttatg ctgataaaac 18840
atatcagcca gaacctcagc tgggagatga aacttggact gaccttgatg gaaaaaccga 18900
aaagtatgga ggcagggctc tcaaacccga tactaagatg aaaccatgct acgggtcctt 18960
tgccaaacct actaatgtga aaggcggtca ggcaaaacaa aaaacaacgg agcagccaaa 19020
tcagaaagtc gaatatgata tcgacatgga gttttttgat gcggcatcgc agaaaacaaa 19080
cttaagtcct aaaattgtca tgtatgcaga aaatgtaaat ttggaaactc cagacactca 19140
tgtagtgtac aaacctggaa cagaagacac aagttccgaa gctaatttgg gacaacaatc 19200
tatgcccaac agacccaact acattggctt cagagataac tttattggac ttatgtacta 19260
taacagtact ggtaacatgg gggtgctggc tggtcaagcg tctcagttaa atgcagtggt 19320
tgacttgcag gacagaaaca cagaactttc ttaccaactc ttgcttgact ctctgggcga 19380
cagaaccaga tactttagca tgtggaatca ggctgtggac agttatgatc ctgatgtacg 19440
tgttattgaa aatcatggtg tggaagatga acttcccaac tactgttttc cactggacgg 19500
cataggtgtt ccaacaacca gttacaaatc aatagttcca aatggagaca atgcgcctaa 19560
ttggaaggaa cctgaagtaa atggaacaag tgagatcgga cagggtaatt tgtttgccat 19620
ggaaattaac cttcaagcca atctatggcg aagtttcctt tattccaatg tggctctata 19680
tctcccagac tcgtacaaat acaccccgtc caatgtcact cttccagaaa acaaaaacac 19740
ctacgactac atgaacgggc gggtggtgcc gccatctcta gtagacacct atgtgaacat 19800
tggtgccagg tggtctctgg atgccatgga caatgtcaac ccattcaacc accaccgtaa 19860
cgctggcttg cgttaccgat ccatgcttct gggtaacgga cgttatgtgc ctttccacat 19920
acaagtgcct caaaaattct tcgctgttaa aaacctgctg cttctcccag gctcctacac 19980
ttatgagtgg aactttagga aggatgtgaa catggttcta cagagttccc tcggtaacga 20040
cctgcgggta gatggcgcca gcatcagttt cacgagcatc aacctctatg ctactttttt 20100
ccccatggct cacaacaccg cttccaccct tgaagccatg ctgcggaatg acaccaatga 20160
tcagtcattc aacgactacc tatctgcagc taacatgctc taccccattc ctgccaatgc 20220
aaccaatatt cccatttcca ttccttctcg caactgggcg gctttcagag gctggtcatt 20280
taccagactg aaaaccaaag aaactccctc tttggggtct ggatttgacc cctactttgt 20340
ctattctggt tctattccct acctggatgg taccttctac ctgaaccaca cttttaagaa 20400
ggtttccatc atgtttgact cttcagtgag ctggcctgga aatgacaggt tactatctcc 20460
taacgaattt gaaataaagc gcactgtgga tggcgaaggc tacaacgtag cccaatgcaa 20520
catgaccaaa gactggttct tggtacagat gctcgccaac tacaacatcg gctatcaggg 20580
cttctacatt ccagaaggat acaaagatcg catgtattca tttttcagaa acttccagcc 20640
catgagcagg caggtggttg atgaggtcaa ttacaaagac ttcaaggccg tcgccatacc 20700
ctaccaacac aacaactctg gctttgtggg ttacatggct ccgaccatgc gccaaggtca 20760
accctatccc gctaactatc cctatccact cattggaaca actgccgtaa atagtgttac 20820
gcagaaaaag ttcttgtgtg acagaaccat gtggcgcata ccgttctcga gcaacttcat 20880
gtctatgggg gcccttacag acttgggaca gaatatgctc tatgccaact cagctcatgc 20940
tctggacatg acctttgagg tggatcccat ggatgagccc accctgcttt atcttctctt 21000
cgaagttttc gacgtggtca gagtgcatca gccacaccgc ggcatcatcg aggcagtcta 21060
cctgcgtaca ccgttctcgg ccggtaacgc taccacgtaa gaagcttctt gcttcttgca 21120
aatagcagct gcaaccatgg cctgcggatc ccaaaacggc tccagcgagc aagagctcag 21180
agccattgtc caagacctgg gttgcggacc ctattttttg ggaacctacg ataagcgctt 21240
cccggggttc atggcccccg ataagctcgc ctgtgccatt gtaaatacgg ccggacgtga 21300
gacgggggga gagcactggt tggctttcgg ttggaaccca cgttctaaca cctgctacct 21360
ttttgatcct tttggattct cggatgatcg tctcaaacag atttaccagt ttgaatatga 21420
gggtctcctg cgccgcagcg ctcttgctac caaggaccgc tgtattacgc tggaaaaatc 21480
tacccagacc gtgcagggtc cccgttctgc cgcctgcgga cttttctgct gcatgttcct 21540
tcacgccttt gtgcactggc ctgaccgtcc catggacgga aaccccacca tgaaattgct 21600
aactggagtg ccaaacaaca tgcttcattc tcctaaagtc cagcccaccc tgtgtgacaa 21660
tcaaaaagca ctctaccatt ttcttaatac ccattcgcct tattttcgct cccatcgtac 21720
acacatcgaa agggccactg cgttcgaccg tatggatgtt caataatgac tcatgtaaac 21780
aacgtgttca ataaacatca ctttattttt ttacatgtat caaggctctg cattacttat 21840
ttatttacaa gtcgaatggg ttctgacgag aatcagaatg acccgcaggc agtgatacgt 21900
tgcggaactg atacttgggt tgccacttga attcgggaat caccaacttg ggaaccggta 21960
tatcgggcag gatgtcactc cacagctttc tggtcagctg caaagctcca agcaggtcag 22020
gagccgaaat cttgaaatca caattaggac cagtgctttg agcgcgagag ttgcggtaca 22080
ccggattgca gcactgaaac accatcagcg acggatgtct cacgcttgcc agcacggtgg 22140
gatctgcaat catgcccaca tccagatctt cagcattggc aatgctgaac ggggtcatct 22200
tgcaggtctg cctacccatg gcgggcaccc aattaggctt gtggttgcaa tcgcagtgca 22260
gggggatcag tatcatcttg gcctgatcct gtctgattcc tggatacacg gctctcatga 22320
aagcatcata ttgcttgaaa gcctgctggg ctttactacc ctcggtataa aacatcccgc 22380
aggacctgct cgaaaactgg ttagctgcac agccggcatc attcacacag cagcgggcgt 22440
cattgttagc tatttgcacc acacttctgc cccagcggtt ttgggtgatt ttggttcgct 22500
cgggattctc ctttaaggct cgttgtccgt tctcgctggc cacatccatc tcgataatct 22560
gctccttctg aatcataata ttgccatgca ggcacttcag cttgccctca taatcattgc 22620
agccatgagg ccacaacgca cagcctgtac attcccaatt atggtgggcg atctgagaaa 22680
aagaatgtat cattccctgc agaaatcttc ccatcatcgt gctcagtgtc ttgtgactag 22740
tgaaagttaa ctggatgcct cggtgctcct cgtttacgta ctggtgacag atgcgcttgt 22800
attgttcgtg ttgctcaggc attagtttaa aagaggttct aagttcgtta tccagcctgt 22860
acttctccat cagcagacac atcacttcca tgcctttctc ccaagcagac accaggggca 22920
agctaatcgg attcttaaca gtgcaggcag cagctccttt agccagaggg tcatctttag 22980
cgatcttctc aatgcttctt ttgccatcct tctcaacgat gcgcacgggc gggtagctga 23040
aacccactgc tacaagttgc gcctcttctc tttcttcttc gctgtcttga ctgatgtctt 23100
gcatggggat atgtttggtc ttccttggct tctttttggg gggtatcgga ggaggaggac 23160
tgtcgctccg ttccggagac agggaggatt gtgacgtttc gctcaccatt accaactgac 23220
tgtcggtaga agaacctgac cccacacggc gacaggtgtt tctcttcggg ggcagaggtg 23280
gaggcgattg cgaagggctg cggtccgacc tggaaggcgg atgactggca gaaccccttc 23340
cgcgttcggg ggtgtgctcc ctgtggcggt cgcttaactg atttccttcg cggctggcca 23400
ttgtgttctc ctaggcagag aaacaacaga catggaaact cagccattgc tgtcaacatc 23460
gccacgagtg ccatcacatc tcgtcctcag cgacgaggaa aaggagcaga gcttaagcat 23520
tccaccgccc agtcctgcca ccacctctac cctagaagat aaggaggtcg acgcatctca 23580
tgacatgcag aataaaaaag cgaaagagtc tgagacagac atcgagcaag acccgggcta 23640
tgtgacaccg gtggaacacg aggaagagtt gaaacgcttt ctagagagag aggatgaaaa 23700
ctgcccaaaa caacgagcag ataactatca ccaagatgct ggaaataggg atcagaacac 23760
cgactacctc atagggcttg acggggaaga cgcgctcctt aaacatctag caagacagtc 23820
gctcatagtc aaggatgcat tattggacag aactgaagtg cccatcagtg tggaagagct 23880
cagccgcgcc tacgagctta acctcttttc acctcgtact ccccccaaac gtcagccaaa 23940
cggcacctgc gagccaaatc ctcgcttaaa cttttatcca gcttttgctg tgccagaagt 24000
actggctacc tatcacatct tttttaaaaa tcaaaaaatt ccagtctcct gccgcgctaa 24060
tcgcacccgc gccgatgccc tactcaatct gggacctggt tcacgcttac ctgatatagc 24120
ttccttggaa gaggttccaa agatcttcga gggtctgggc aataatgaga ctcgggccgc 24180
aaatgctctg caaaagggag aaaatggcat ggatgagcat cacagcgttc tggtggaatt 24240
ggaaggcgat aatgccagac tcgcagtact caagcgaagc atcgaggtca cacacttcgc 24300
atatcccgct gtcaacctgc cccctaaagt catgacggcg gtcatggacc agttactcat 24360
taagcgcgca agtccccttt cagaagacat gcatgaccca gatgcctgtg atgagggtaa 24420
accagtggtc agtgatgagc agctaacccg atggctgggc accgactctc ccagggattt 24480
ggaagagcgt cgcaagctta tgatggccgt ggtgctggtt accgtagaac tagagtgtct 24540
ccgacgtttc tttaccgatt cagaaacctt gcgcaaactc gaagagaatc tgcactacac 24600
ttttagacac ggctttgtgc ggcaggcatg caagatatct aacgtggaac tcaccaacct 24660
ggtttcctac atgggtattc tgcatgagaa tcgcctagga caaagcgtgc tgcacagcac 24720
cctgaagggg gaagcccgcc gtgattacat ccgcgattgt gtctatctgt acctgtgcca 24780
cacgtggcaa accggcatgg gtgtatggca gcaatgttta gaagaacaga acttgaaaga 24840
gcttgacaag ctcttacaga aatctcttaa ggttctgtgg acagggttcg acgagcgcac 24900
cgtcgcttcc gacctggcag acctcatctt cccagagcgt ctcagggtta ctttgcgaaa 24960
cggattgcct gactttatga gccagagcat gcttaacaat tttcgctctt tcatcctgga 25020
acgctccggt atcctgcccg ccacctgctg cgcactgccc tccgactttg tgcctctcac 25080
ctaccgcgag tgccccccgc cgctatggag tcactgctac ctgttccgtc tggccaacta 25140
tctctcctac cactcggatg tgatcgagga tgtgagcgga gacggcttgc tggagtgtca 25200
ctgccgctgc aatctgtgca cgccccaccg gtccctagct tgcaaccccc agttgatgag 25260
cgaaacccag ataataggca cctttgaatt gcaaggcccc agcagccaag gcgatgggtc 25320
ttctcctggg caaagtttaa aactgacccc gggactgtgg acctccgcct acttgcgcaa 25380
gtttgctccg gaagattacc acccctatga aatcaagttc tatgaggacc aatcacagcc 25440
tccaaaggcc gaactttcgg cctgcgtcat cacccagggg gcaattctgg cccaattgca 25500
agccatccaa aaatcccgcc aagaatttct actgaaaaag ggtaaggggg tctaccttga 25560
cccccagacc ggcgaggaac tcaacacaag gttccctcag gatgtcccaa cgacgagaaa 25620
acaagaagtt gaaggtgcag ccgccgcccc cagaagatat ggaggaagat tgggacagtc 25680
aggcagagga ggcggaggag gacagtctgg aggacagtct ggaggaagac agtttggagg 25740
aggaaaacga ggaggcagag gaggtggaag aagtaaccgc cgacaaacag ttatcctcgg 25800
ctgcggagac aagcaacagc gctaccatct ccgctccgag tcgaggaacc cggcggcgtc 25860
ccagcagtag atgggacgag accggacgct tcccgaaccc aaccagcgct tccaagaccg 25920
gtaagaagga tcggcaggga tacaagtcct ggcgggggca taagaatgcc atcatctcct 25980
gcttgcatga gtgcgggggc aacatatcct tcacgcggcg ctacttgcta ttccaccatg 26040
gggtgaactt tccgcgcaat gttttgcatt actaccgtca cctccacagc ccctactata 26100
gccagcaaat cccggcagtc tcgacagata aagacagcgg cggcgacctc caacagaaaa 26160
ccagcagcgg cagttagaaa atacacaaca agtgcagcaa caggaggatt aaagattaca 26220
gccaacgagc cagcgcaaac ccgagagtta agaaatcgga tctttccaac cctgtatgcc 26280
atcttccagc agagtcgggg tcaagagcag gaactgaaaa taaaaaaccg atctctgcgt 26340
tcgctcacca gaagttgttt gtatcacaag agcgaagatc aacttcagcg cactctcgag 26400
gacgccgagg ctctcttcaa caagtactgc gcgctgactc ttaaagagta ggcagcgacc 26460
gcgcttattc aaaaaaggcg ggaattacat catcctcgac atgagtaaag aaattcccac 26520
gccttacatg tggagttatc aaccccaaat gggattggcg gcaggcgcct cccaggacta 26580
ctccacccgc atgaattggc tcagcgccgg gccttctatg atttctcgag ttaatgatat 26640
acgcgcctac cgaaaccaaa tacttttgga acagtcagct cttaccacca cgccccgcca 26700
acaccttaat cccagaaatt ggcccgccgc cctagtgtac caggaaagtc ccgctcccac 26760
cactgtatta cttcctcgag acgcccaggc cgaagtccaa atgactaatg caggtgcgca 26820
gttagctggc ggctccaccc tatgtcgtca caggcctcgg cataatataa aacgcctgat 26880
gatcagaggc cgaggtatcc agctcaacga cgagtcggtg agctctccgc ttggtctacg 26940
accagacgga atctttcaga ttgccggctg cgggagatct tccttcaccc ctcgtcaggc 27000
tgttctgact ttggaaagtt cgtcttcgca accccgctcg ggcggaatcg ggaccgttca 27060
atttgtggag gagtttactc cctctgtcta cttcaacccc ttctccggat ctcctgggca 27120
ttacccggac gagttcatac cgaacttcga cgcgattagc gagtcagtgg acggctacga 27180
ttgatgtctg gtgacgcggc tgagctatct cggctgcgac atctagacca ctgccgccgc 27240
tttcgctgct ttgcccggga actcattgag ttcatctact tcgaactccc caaggatcac 27300
cctcaaggtc cggcccacgg agtgcggatt tctatcgaag gcaaaataga ctctcgcctg 27360
caacgaattt tctcccagcg gcccgtgctg atcgagcgag accagggaaa caccacggtt 27420
tccatctact gcatttgtaa tcaccccgga ttgcatgaaa gcctttgctg tcttatgtgt 27480
actgagttta ataaaaactg aattaagact ctcctacgga ctgccgcttc ttcaacccgg 27540
attttacaac cagaagaacg aaacttttcc tgtcgtccag gactctgtta acttcacctt 27600
tcctactcac aaactagaag ctcaacgact acaccgcttt tccagaagca ttttccctac 27660
taatactact ttcaaaaccg gaggtgagct ccaaggtctt cctacagaaa acccttgggt 27720
ggaagcgggc cttgtagtgc taggaattct tgcgggtggg cttgtgatta ttctttgcta 27780
cctatacaca ccttgcttca ctttcttagt ggtgttgtgg tattggttta aaaaatgggg 27840
cccatactag tcttgcttgt tttactttcg cttttggaac cgggttctgc caattacgat 27900
ccatgtctag acttcgaccc agaaaactgc acacttactt ttgcacccga cacaagccgc 27960
atctgtggag ttcttattaa gtgcggatgg gaatgcaggt ccgttgaaat tacacacaat 28020
aacaaaacct ggaacaatac cttatccacc acatgggagc caggagttcc cgagtggtac 28080
actgtctctg tccgaggtcc tgacggttcc atccgcatta gtaacaacac tttcattttt 28140
tctgaaatgt gcgatctggc catgttcatg agcaaacagt attctctatg gcctcctagc 28200
aaggacaaca tcgtaacgtt ctccattgct tattgcttgt gcgcttgcct tcttactgct 28260
ttactgtgcg tatgcataca cctgcttgta accactcgca tcaaaaacgc caataacaaa 28320
gaaaaaatgc cttaacctct ttctgtttac agacatggct tctcttacat ctctcatatt 28380
tgtcagcatt gtcactgccg ctcatggaca aacagtcgtc tctatccctc taggacataa 28440
ttacactctc ataggacccc caatcacttc agaggtcatc tggaccaaac tgggaagcgt 28500
tgattacttt gatataatct gcaacaaaac aaaaccaata atagtaactt gcaacataca 28560
aaatcttaca ttgattaatg ttagcaaagt ttacagcggt tactattatg gttatgacag 28620
atacagtagt caatatagaa attacttggt tcgtgttacc cagttgaaaa ccacgaaaat 28680
gccaaatatg gcaaagattc gatccgatga caattctcta gaaactttta catctcccac 28740
cacacccgac gaaaaaaaca tcccagattc aatgattgca attgttgcag cggtggcagt 28800
ggtgatggca ctaataataa tatgcatgct tttatatgct tgtcgctaca aaaagtttca 28860
tcctaaaaaa caagatctcc tactaaggct taacatttaa tttcttttta tacagccatg 28920
gtttccacta ccacattcct tatgcttact agtctcgcaa ctctgacttc tgctcgctca 28980
cacctcactg taactatagg ctcaaactgc acactaaaag gacctcaagg tggtcatgtc 29040
ttttggtgga gaatatatga caatggatgg tttacaaaac catgtgacca acctggtaga 29100
tttttctgca acggcagaga cctaaccatt atcaacgtga cagcaaatga caaaggcttc 29160
tattatggaa ccgactataa aagtagttta gattataaca ttattgtact gccatctacc 29220
actccagcac cccgcacaac tactttctct agcagcagtg tcgctaacaa tacaatttcc 29280
aatccaacct ttgccgcgct tttaaaacgc actgtgaata attctacaac ttcacataca 29340
acaatttcca cttcaacaat cagcattatc gctgcagtga caattggaat atctattctt 29400
gtttttacca taacctacta cgcctgctgc tatagaaaag acaaacataa aggtgatcca 29460
ttacttagat ttgatattta atttgttctt ttttttttta tttacagtat ggtgaacacc 29520
aatcatggta cctagaaatt tcttcttcac catactcatt tgtgcattta atgtttgcgc 29580
tactttcaca gcagtagcca cagcaacccc agactgtata ggagcatttg cttcctatgc 29640
actttttgct tttgttactt gcatctgcgt atgtagcata gtctgcctgg ttattaattt 29700
tttccaactt atagactgga tccttgtgcg aattgcctac ctgcgccacc atcccgaata 29760
ccgcaaccaa aatatcgcgg cacttcttag actcatctaa aaccatgcag gctatactac 29820
caatattttt gcttctattg cttccctacg ctgtctcaac cccagctgcc tatagtactc 29880
caccagaaca ccttagaaaa tgcaaattcc aacaaccgtg gtcatttctt gcttgctatc 29940
gagaaaaatc agaaattccc ccaaatttaa taatgattgc tggaataatt aatataatct 30000
gttgcaccat aatttcattt ttgatatacc ccctatttga ttttggctgg aatgctccca 30060
atgcacatga tcatccacaa gacccagagg aacacattcc cctacaaaac atgcaacatc 30120
caatagcgct aatagattac gaaagtgaac cacaaccccc actactccct gctattagtt 30180
acttcaacct aaccggcgga gatgactgaa acactcacca cctccaattc cgccgaggat 30240
ctgctcgata tggacggccg cgtctcagaa cagcgactcg cccaactacg catccgccag 30300
cagcaggaac gcgcggccaa agagctcaga gatgtcatcc aaattcacca atgcaaaaaa 30360
ggcatattct gtttggtaaa acaagccaag atatcctacg agatcaccgc tactgaccat 30420
cgcctctctt acgaacttgg cccccaacga caaaaattta cctgcatggt gggaatcaac 30480
cccatagtta tcacccagca aagtggagat actaagggtt gcattcactg ctcctgcgat 30540
tccatcgagt gcacctacac cctgctgaag accctatacg gcctaagaga cctgctacca 30600
atgaattaaa aaatgattaa taaaaaatca cttacttgaa atcagcaata aggtctctgt 30660
tgaaattttc tcccagcagc acctcacttc cctcttccca actctggtat tctaaacccc 30720
gttcagcggc atactttctc catactttaa aggggatgtc aaattttagc tcctctcctg 30780
tacccacaat cttcatgtct ttcttcccag atgaccaaga gagtccggct cagtgactcc 30840
ttcaaccctg tctaccccta tgaagatgaa agcacctccc aacacccctt tataaaccca 30900
gggtttattt ccccaaatgg cttcacacaa agcccaaacg gagttcttac tttaaaatgt 30960
ttaaccccac taacaaccac aggcggatct ctacagctaa aagtgggagg gggacttaca 31020
gtggatgaca ccaacggttt tttgaaagaa aacataagtg ccaccacacc actcgttaag 31080
actggtcact ctataggttt accactagga gccggattgg gaacgaatga aaataaactt 31140
tgtatcaaat taggacaagg acttacattc aattcaaaca acatttgcat tgatgacaat 31200
attaacacct tatggacagg agtcaacccc accgaagcca actgtcaaat catgaactcc 31260
agtgaatcta atgattgcaa attaattcta acactagtta aaactggagc actagtcact 31320
gcatttgttt atgttatagg agtatctaac aattttaata tgctaactac acacagaaat 31380
ataaatttta ctgcagagct gtttttcgat tctactggta atttactaac tagactctca 31440
tccctcaaaa ctccacttaa tcataaatca ggacaaaaca tggctactgg tgccattact 31500
aatgctaaag gtttcatgcc cagcacgact gcctatcctt tcaatgataa ttctagagaa 31560
aaagaaaact acatttacgg aacttgttac tacacagcta gtgatcgcac tgcttttccc 31620
attgacatat ctgtcatgct taaccgaaga gcaataaatg acgagacatc atattgtatt 31680
cgtataactt ggtcctggaa cacaggagat gccccagagg tgcaaacctc tgctacaacc 31740
ctagtcacct ccccatttac cttttactac atcagagaag acgactgaca aataaagttt 31800
aacttgttta tttgaaaatc aattcacaaa atccgagtag ttattttgcc tcccccttcc 31860
catttaacag aatacaccaa tctctcccca cgcacagctt taaacatttg gataccatta 31920
gatatagaca tggttttaga ttccacattc caaacagttt cagagcgagc caatctgggg 31980
tcagtgatag ataaaaatcc atcgggatag tcttttaaag cgctttcaca gtccaactgc 32040
tgcggatgcg actccggagt ctggatcacg gtcatctgga agaagaacga tgggaatcat 32100
aatccgaaaa cggtatcgga cgattgtgtc tcatcaaacc cacaagcagc cgctgtctgc 32160
gtcgctccgt gcgactgctg tttatgggat cagggtccac agtgtcctga agcatgattt 32220
taatagccct taacatcaac tttctggtgc gatgcgcgca gcaacgcatt ctgatttcac 32280
tcaaatcttt gcagtaggta caacacatta ttacaatatt gtttaataaa ccataattaa 32340
aagcgctcca gccaaaactc atatctgata taatcgcccc tgcatgacca tcataccaaa 32400
gtttaatata aattaaatga cgttccctca aaaacacact acccacatac atgatctctt 32460
ttggcatgtg catattaaca atctgtctgt accatggaca acgttggtta atcatgcaac 32520
ccaatataac cttccggaac cacactgcca acaccgctcc cccagccatg cattgaagtg 32580
aaccctgctg attacaatga caatgaagaa cccaattctc tcgaccgtga atcacttgag 32640
aatgaaaaat atctatagtg gcacaacata gacataaatg catgcatctt ctcataattt 32700
ttaactcctc aggatttaga aacatatccc agggaatagg aagctcttgc agaacagtaa 32760
agctggcaga acaaggaaga ccacgaacac aacttacact atgcatagtc atagtatcac 32820
aatctggcaa cagcgggtgg tcttcagtca tagaagctcg ggtttcattt tcctcacaac 32880
gtggtaactg ggctctggtg taagggtgat gtctggcgca tgatgtcgag cgtgcgcgca 32940
accttgtcat aatggagttg cttcctgaca ttctcgtatt ttgtatagca aaacgcggcc 33000
ctggcagaac acactcttct tcgccttcta tcctgccgct tagcgtgttc cgtgtgatag 33060
ttcaagtaca accacactct taagttggtc aaaagaatgc tggcttcagt tgtaatcaaa 33120
actccatcgc atctaatcgt tctgaggaaa tcatccacgg tagcatatgc aaatcccaac 33180
caagcaatgc aactggattg tgtttcaagc aggagaggag agggaagaga cggaagaacc 33240
atgttaattt ttattccaaa cgatctcgca gtacttcaaa ttgtagatcg cgcagatggc 33300
atctctcgcc cccactgtgt tggtgaaaaa gcacagctag atcaaaagaa atgcgatttt 33360
caaggtgctc aacggtggct tccagcaaag cctccacgcg cacatccaag aacaaaagaa 33420
taccaaaaga aggagcattt tctaactcct caatcatcat attacattcc tgcaccattc 33480
ccagataatt ttcagctttc cagccttgaa ttattcgtgt cagttcttgt ggtaaatcca 33540
atccacacat tacaaacagg tcccggaggg cgccctccac caccattctt aaacacaccc 33600
tcataatgac aaaatatctt gctcctgtgt cacctgtagc gaattgagaa tggcaacatc 33660
aattgacatg cccttggctc taagttcttc tttaagttct agttgtaaaa actctctcat 33720
attatcacca aactgcttag ccagaagccc cccgggaaca agagcagggg acgctacagt 33780
gcagtacaag cgcagacctc cccaattggc tccagcaaaa acaagattgg aataagcata 33840
ttgggaaccg ccagtaatat catcgaagtt gctggaaata taataaggca gagtttcttg 33900
taaaaattga ataaaagaaa aatttgccaa aaaaacattc aaaacctctg ggatgcaaat 33960
gcaataggtt accgcgctgc gctccaacat tgttagtttt gaattagtct gcaaaaataa 34020
aaaaaaaaac aagcgtcata tcatagtagc ctgacgaaca gatggataaa tcagtctttc 34080
catcacaaga caagccacag ggtctccagc tcgaccctcg taaaacctgt catcatgatt 34140
aaacaacagc accgaaagtt cctcgcggtg accagcatga ataattcttg atgaagcata 34200
caatccagac atgttagcat cagttaacga gaaaaaacag ccaacatagc ctttgggtat 34260
aattatgctt aatcgtaagt atagcaaagc cacccctcgc ggatacaaag taaaaggcac 34320
aggagaataa aaaatataat tatttctctg ctgctgttca ggcaacgtcg cccccggtcc 34380
ctctaaatac acatacaaag cctcatcagc catggcttac cagacaaagt acagcgggca 34440
cacaaagcac aagctctaaa gtgactctcc aacctctcca caatatatat atacacaagc 34500
cctaaactga cgtaatggga gtaaagtgta aaaaatcccg ccaaacccaa cacacacccc 34560
gaaactgcgt caccagggaa aagtacagtt tcacttccgc aatcccaaca ggcgtaactt 34620
cctctttctc acggtacgtg atatcccact aacttgcaac gtcattttcc cacggtcgca 34680
ccgccccttt tagccgttaa ccccacagcc aatcaccaca cgatccacac tttttaaaat 34740
cacctcattt acatattggc accattccat ctataaggta tattattgat gatg 34794
<210> 148
<211> 34764
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 14 sequence
<400> 148
catcatcaat aatatacctt atagatggaa tggtgccaat atgtaaatga ggtgatttta 60
aaaagtgtgg gctgtgtggt aattggctgt ggggttaacg gctaaaaggg gcggcgcggc 120
cgtgggaaaa tgacgttttt tgggggtgga gtgtttttgc aagttgtcgc ggtaaatgtg 180
acgcaaacaa aggctttttt tttacggaac tacttagtgt tcccacggta tttaacagga 240
aatgaggtag ttttggccgg atgcaagtaa aaattgttca ttttcgcgcg aaaactgaat 300
gaggaagtgg ttttctgaat aatgcggtat ttatggcagg gtggagtatt tgttcagggc 360
caggtagact ttgacccatt acgtggaggt ttcgattacc gcggaggttt cgattaccgt 420
gttttttacc taaatttccg cgtaccgtgt gaaagtcttc tgtttttacg taggtgtcag 480
ctgatcgcta cggtatttat acctcagggt ttgtgtcaag aggccactct tgagtgccag 540
cgagaagagt tttctcctct gcgccggcag tttaatatta aaaaaaatga gacacttgcg 600
atttatgcct caggaaataa tttctgctga gactggaaac gaaatactgg agtttgtggt 660
gcacgccctg atgggagacg atccggagcc acctgtgcag ctttttgagc ctcctacgct 720
tcaggaactg tatgatttag aggtagaggg atcggaggat tctaatgagg aagctgtgaa 780
tggctttttt accgattcta tgcttttagc tgctaatgaa ggattagaat tagatccgcc 840
tttggacact ttcgatactc caggggtgat tgtggaaagc ggtacagctg taagaaaatt 900
acctgatttg ggttccgtgg actgtgattt gcactgctat gaagacgggt ttcctttgag 960
tgatgaggag gaccatgaaa aggagcagtc tatgcagact gcagcgggtg agggagtgaa 1020
ggctgccatt ggttttcagt tggattgccc ggagcttcct ggacatggct gtaagtcttg 1080
tgaatttcac aggaaaaata ctggagtaaa ggaactgtta tgttcgcttt gttatatgag 1140
agcgcactgc cactttattt acagtaagtg tgtttaagtt aaaatttaaa ggaatatgct 1200
gtttttcaca tgtatattga gtgggaaatt tgtgcttctt attataggtc ctgtgtctga 1260
tgctgatgag tcaccatctc ctgattctac tacctcacct cctgagattc aagcacctgt 1320
tcctgtggac gtgcacaagc ccattcctgt aaagcttaag cctggaaaac gtccagcagt 1380
ggaaaaactc gaggacttgt tacagggtgg ggacggacct ttggacttga gtacacggaa 1440
acggccaaga caataagtgt tccatatccg tgtttactta aggtgacgtc aatatttgtg 1500
tgagagtgca atgtaataaa aatatgttaa ctgtgtactg gtttttattg ctttttgggc 1560
ggggactcag gtatataagt agaagcagac ctgtgtggtt agctcataga agctggcttt 1620
gattcatgga ggtttgggcc attttggaag accttagaaa gactaggcaa ctgttagaga 1680
acgcttcgga cggagtctcc ggtttttgga gattctggtt cgctagtgaa ttagctaggg 1740
tagtttttag gataaaacag gactataaag aagaatttga aaagttgttg gtagattgtc 1800
caggactttt tgaagctctt aatttgggcc atcaagttca ctttaaagaa aaagttttat 1860
cagttttaga cttttcgacc ccaggtagaa ctgccgctgc tgtggctttt cttactttta 1920
tattagataa atggatcccg cagactcatt tcagcagggg atacgttttg gatttcgtag 1980
ccacagcatt gtggagaaca tggaaggttc gcaagatgag gacaatctta ggttactggc 2040
cagtgcagcc tttgggtgta gcgggaatcc tgaggcatcc accggtcatg ccagcggttc 2100
tggaggagga acagcaagag gacaacccga gagccggcct ggaccctcca gtggaggagg 2160
cggagtagct gacttgtctc ctgaactgca acgggtgctt actggatcta cgtccactgg 2220
acgggatagg ggcgttaaaa gggagagggc atctagtggt actgatgcta gatctgagtt 2280
ggctttaagt ttaatgagtc gcagacgtcc tgaaaccatt tggtggcatg aggtccagaa 2340
agagggaagg gatgaagttt ctgtattgca ggagaaatat tcactggaac aggtgaaaac 2400
atgttggttg gagcctgagg atgattggga ggtggccatt aaaaattatg ccaagatagc 2460
tttgaggcct gataaacagt ataagattac tagacggatt aatatccgga atgcttgtta 2520
catatctgga aatggggctg aggtggtaat agatactcca gacaagacag ttattagatg 2580
ctgcatgatg gatatgtggc ctggagtagt cggtatggaa gcagtaactt ttgtaaatgt 2640
taagtttagg ggagatggtt ataatggaat agtgtttatg gccaatacca aacttatatt 2700
gcatggttgt agcttttttg gttttaacaa tacctgtgta gatgcctggg gacaggttag 2760
tgtacgggga tgtagtttct atgcgtgttg gattgccaca gctggcagaa ccaagagtca 2820
attgtctctg aagaaatgca tattccaaag atgtaacctg ggcattctta atgaaggcga 2880
agcaagggtc cgccactgcg cttctacaga tactggatgt tttattttaa ttaagggcaa 2940
tgccagcgta aagcataaca tgatttgcgg tgcttccgat gagaggcctt atcaaatgct 3000
cacttgtgcc ggagggcatt gtaacatgct ggctactgtg catattgttt ctcatcaacg 3060
caaaaaatgg cctgtttttg atcacaatgt gttgaccaag tgtaccatgc atgcaggtgg 3120
gcgtagagga atgtttatgc cttaccagtg taacatgaat catgtaaaag tgttgttgga 3180
accagatgcc ttttccagaa tgagtctaac aggaatgttt gacatgaaca tgcaaatctg 3240
gaagatcctg aggtatgatg atacaagatc gagggtgcgc gcatgcgaat gcggaggcaa 3300
gcatgccagg ttccagccgg tgtgtgtaga tgtgactgaa gatctgagac cggatcattt 3360
ggttattgcc cgcactggag cagagttcgg atccagtgga gaagaaactg actaaggtga 3420
gtattgggaa aactttgggg tgggattttc agatggacag attgagtaaa aatttgtttt 3480
tctgtcttgc agctgtcatg agtggaaacg cttcttttaa tgggggagtc ttcagccctt 3540
atctgacagg gcgtctccca tcctgggcag gagttcgtca gaatgttatg ggatctactg 3600
tggatggaag acccgtccaa cccgccaatt cttcaacgct gacctatgct actttaagtt 3660
cttcaccttt ggacgcagct gcagccgccg ctgccgcctc tgttgccgct aacactgtgc 3720
ttggaatggg ttactatgga agcatcctgg ctaattccac ttcctctaat aacccttcta 3780
ccctgactca ggacaagtta cttgtccttt tggcccagct ggaggctttg acccaacgtc 3840
tgggtgaact ttctcagcag gtggccgagt tgcgagtaca aactgagtct gctgtcggca 3900
cggcaaagtc taaataaaaa aaaaaaattc cagaatcaat gaataaataa acgagcttgt 3960
tgttgattta aaatcaagtg ttttttattt catttttcgc gcacggtatg ccctagacca 4020
ccgatctcga tcattgagaa cacggtggat tttttccaaa atcctataaa ggtgggattg 4080
aatgtttaga tacatgggca ttaggccgtc tttggggtgg agatagctcc attgaaggga 4140
ttcatgctcc ggggtagtgt tgtaaattac ccagtcataa caaggtcgct gtgcatggtg 4200
ttgcacaata tcttttagaa gtaggctgat tgccacagat aagcccttgg tgtaggtgtt 4260
tacaaaccgg ttgagctggg aggggtgcat tcggggtgaa attatgtgca ttttggattg 4320
gatttttaag ttggcaatat tgccgccaag atctcgtctt gggttcatgt tatgaagtac 4380
caccaagacg gtgtatccgg tacatttagg aaatttatcg tgcagcttgg atggaaaagc 4440
gtggaaaaat ttggagacac ccttgtgtcc tccgagattt tccatgcact catccatgat 4500
aatagcaata gggccgtggg cagcagcgcg ggcaaacacg ttccgtgggt ctgacacatc 4560
atagttatgt tcctgagtta aatcatcata ggccatttta ataaatttgg gacggagagt 4620
acccgattgg ggtatgaatg ttccttcggg ccccggagca tagttcccct cacagatttg 4680
catttcccaa gctttcagtt ccgagggtgg aatcatgtcc acctgggggg ctataaagaa 4740
caccgtttct ggggctgggg taattagttg ggatgatagc aagtttctga gcaattgaga 4800
tttgccacat ccggtggggc cataaatgat tccgattaca ggttgcagtt ggtagtttag 4860
ggaacggcaa ctgccgtctt ctcgaagcaa gggggccacc tcgttcatca tttcccttac 4920
atgcatattt tcccgcacca aatccattag gaggcgctct cctcctagtg atagaagttc 4980
ttgtagtgag gaaaagtttt tcagcggttt tagaccgtca gccatgggca ttttggagag 5040
agtctgttgc aaaagttcta gtctgttcca cagttcagtg atgtgttcta tggcatctcg 5100
atccagcaga cctcctcgtt tcgcgggttt ggacggctcc tggagtaggg tatgagacga 5160
tgggcgtcca gcgctgccag ggttcggtcc ttccagggtc tcaaagttcg ggtcagggtt 5220
gtttccgtca cagtgaaggg gtgtgcgcct gcttgggcgc ttgccagggt gcgcttcaga 5280
ctcatcctgc tggtcgaaaa cttgtgccgc ttggcgccct gtatgtcggc caagtagcag 5340
tttaccatga gttcgtagtt gagcgcctcg gctgcgtggc ccttggcgcg gagcttacct 5400
ttggaagttt tcttgcatac cgggcagtat aggcatttca gcgcatacag cttgggcgca 5460
aggaaaatgg attctgggga gtatgcatcc gcgccgcagg aggcgcaaac agtttcacat 5520
tccaccagcc aggttaaatc cggttcattg gggtcaaaaa caagttttcc gccatatttt 5580
ttgatgcgtt tcttaccttt ggtctccatg agttcgtgtc ctcgttgagt gacaaacagg 5640
ctgtccgtgt ccccgtagac tgattttaca ggcctctttt ccagtggagt gcctcggtct 5700
tcttcgtata ggaactctga ccactctgat acaaaggcgc gcgtccaggc cagcacaaag 5760
gaggctatgt gggaggggta gcgatcgttg tcaaccaggg ggtccacctt ttccaaagta 5820
tgcaaacaca tgtcactctc ttcaacatcc aggaatgtga ttggcttgta ggtgtatttc 5880
acgtgacctg gggtcccagc tgggggggta taaaaggggg cggttctctg ctcttcctca 5940
ctgtcttccg gatcgctgtc caggaacgtc agctgttggg gtaggtattc cctctcgaag 6000
gcgggcatga cctctgcact caggttgtca gtttctaaga acgaggagga tttgatattg 6060
acagtgccgc ttgagatgcc tttcatgagg ttttcgtcca tttggtcaga aaacacaatt 6120
tttttattgt caagtttggt ggcaaatgat ccatacaggg cgttggataa aagtttggca 6180
atggatcgca tggtttggtt cttttccttg tccgcgcgct ctttggcagc gatgttgagt 6240
tggacatatt cgcgtgccag gcacttccat tcggggaaga tagttgtcaa ttcatctggc 6300
acaattctca cttgccaccc tcggttatgc aaggtaatta aatccacact ggtggccacc 6360
tcgcctcgaa ggggttcgtt ggtccagcag agcctacctc ctttcctaga acagaaaggt 6420
ggaagtgggt ctagcataag ttcatcggga gggtctgcat ccatggtaaa gattccagga 6480
agtaaatcct tatcaaaata gctgatggga gtggggtcat ctaaggccat ttgccattct 6540
cgagctgcca gtgcgcgctc atatgggtta aggggactgc cccagggcat gggatgggtg 6600
agtgcagagg catacatgcc acagatgtca tagacgtaga tgggatcctc aaagatgcct 6660
atgtaggttg gatagcatcg cccccctctg atacttgctc gcacatagtc atatagttca 6720
tgtgacggcg ctagcagccc cggacccaag ttggtgcgat tgggtttttc tgttctgtag 6780
acaatctggc gaaagatggc gtgagaattg gaagagatgg tgggtctttg aaaaatgttg 6840
aagtgggcat gaggtagacc tacagagtct ctgataaagt gggcataaga ttcttcaagc 6900
ttggttacca gttgggcggt gacaagtacg tccagggcgc agtagtcaag tgtttcttga 6960
atgatgtcat aacctggttg gtttttcttt tcccacagtt cgcggttgag aaggtattct 7020
tcgcgatcct tccagtactc ttctagcgga aacccgtctt tgtctgcacg gtaagatcct 7080
agcatgtaga actgattaac tgccttgtaa gggcagcagc ccttctctac gggtagagag 7140
tatgcttgag cagcttttcg tagcgaagcg tgagtaaggg cgaaggtgtc tctaaccatg 7200
actttgacaa attggtattt aaagtccatg tcgtcacagg ctccctgttc ccagagttgg 7260
aagtctaccc gtttcttgta ggcggggttg ggcaaagcga aagtaacatc gttgaagaga 7320
atcttaccgg ctctgggcat aaaattgcga gtgatgcgaa aaggctgtgg tacttccgct 7380
cgattgttga tcacctgggc agctaggacg atctcgtcga agccgttgat gttgtgtcct 7440
acaatgtata attctatgaa acgcggcgtg cctctgacgt gaggtagctt attgagctca 7500
tcaaaggtta ggtctgtagg gtcagataag gcgtagtgtt caagggccca ttcgtgcaga 7560
tgaggatttg catgtaggaa tgatgaccaa agatccaccg ccagtgctgt ttgtaactgg 7620
tcccgatact gacgaaaatg ctggccaatt gccatttttt ctggagtgac acagtagaag 7680
gttccgggat cttgttgcca tcgatcccac ttaagtttaa tggctagatc gtgggccatg 7740
ttgacgagac gctcttctcc tgagagtttc atgaccagca tgaaaggaac tagttgtttg 7800
ccaaaggacc ccatccaggt gtaagtttcc acatcgtagg tcaggaagag tctttctgtg 7860
cgaggatgag agccgattgg gaaaaactgg atttcctgcc accagttgga ggattggctg 7920
ttgatgtgat ggaagtagaa gtttctgcgg cgcgccgagc attcgtgttt gtgcttgtac 7980
agacggccgc agtagtcgca gcgttgcacg ggttgtatct cgtgaatgag ctgtacctgg 8040
cttcccttga cgagaaattt cagtgggaag ccgaggcctg gcgattgtat ctcgtgctct 8100
tctatattcg ctgtattggc ctgttcatct tctgtttcga tggtggtcat gctgacgagc 8160
ccccgcggga ggcaagtcca gacctcggcg cgggaggggc ggagctgaag gacgagagcg 8220
cgcaggctgg agctgtccag agtcctgaga cgctgcggac tcaggttagt aggtagggac 8280
agaagattaa cttgcatgat cttttccagg gcgtgcggga ggtttagatg gtacttgatt 8340
tccacaggtt cgtttgtaga gacgtcaatg gcttgcaggg ttccgtgtcc tttgggtgcc 8400
actaccgtac ctttgttttt tcttttgatc ggtggtggct ctcttgcttc ttgcatgctt 8460
aaaagcggtg acggggacgc gcgccgggcg gcagcggttg ttccggaccc gggggcatgg 8520
ctggtagtgg cacgtcggcg ccgcgcacgg gcaggttctg gtactgcgct ctgagaagac 8580
ttgcgtgcgc caccacgcgt cgattgacgt cttgtatctg acgtctttgg gtgaaagcta 8640
ccggccccgt gagcttgaac ctgaaagaga gttcaacaga atcaatttcg gtatcgttaa 8700
cggcagcttg tctcagtatt tcttgtacgt caccagagtt gtcctggtag gcgatctccg 8760
ccatgaactg ctcgatttct tcctcctgaa gatctccgcg acccgctctc tcgacggtgg 8820
ccgcgaggtc attggagata cggcccatga gttgggagaa tgcattcatg cccgcctcgt 8880
tccagacgcg gctgtaaacc acggccccct cggagtctct tgcgcgcatc accacctgag 8940
cgaggttaag ctccacgtgt ctggtgaaga ccgcatagtt gcataggcgc tgaaaaaggt 9000
agttgagtgt ggtggcgatg tgttcggcga caaagaaata catgatccat cgtctcagcg 9060
gcatttcgct gacatcgccc agagcttcca agcgctccat ggcctcgtag aagtccacgg 9120
caaaattaaa aaactgggag tttcgcgcgg acacggtcaa ttcctcctcg agaagacgga 9180
tgagttcggc tatggtggcc cgtacttcgc gttcgaaggc tcccggcatc tcttcttcct 9240
cttctatctc ttcttccact aacatctctt cttcgtcttc aggcgggggc ggagggggca 9300
cgcggcgacg tcgacggcgc acgggcaaac ggtcgatgaa tcgttcaatg acctctccgc 9360
ggcggcggcg catggtttca gtgacggcgc ggccgttctc gcgcggtcgc agagtaaaaa 9420
caccgccgcg catctcctta aagtggtgac tgggaggttc tccgtttggg agggaaaggg 9480
cgctgattat acattttatt aattggcccg tagggactgc gcgcagagat ctaatcgtgt 9540
caagatccac gggatctgaa aacctttcaa cgaaagcgtc taaccagtca cagtcacaag 9600
gtaggctgag tacggcttct tgtgggcggg ggtggttatg tgttcggtct gggtcttcta 9660
ttccttcttc atctcgggaa ggtgagacga tgctgctggt gatgaaatta aagtaggcag 9720
ttctaagacg gcggatggtg gcgaggagca ccaggtcttt gggtccggct tgctggatac 9780
gcaggcgatt ggccattccc caagcattat cctgacatct agccagatct ttgtagtagt 9840
cttgcatgag ccgttctacg ggcacttctt cttcacccgt tctgccatgc atacgtgtga 9900
gtccaaaccc gcgcattggt tggaccagtg ccaagtcagc tacaactctt tcggcgagga 9960
tggcttgctg tacttgggtg agggtggctt gaaagtcatc aaaatccacg aagcggtggt 10020
aagccccggt attgatggtg taagcacagt tggccatgac tgaccagtta actgtttggt 10080
gaccatggcg cacgagctcg gtgtatttaa ggcgcgaata ggcgcgggtg tcaaaaatgt 10140
aatcgttgca ggtgcgcacc agatactggt accctataag aaaatgcggt ggtggttggc 10200
ggtagagagg ccattgttct gtagctggag cgccgggggc gaggtcttcc aacataaggc 10260
ggtgatagcc gtagatgtac ctggacatcc aggtgattcc tgcggcggta gtggaagccc 10320
gaggaaactc gcgtacgcgg ttccaaatgt tgcgtagcgg catgaagtag ttcattgtag 10380
gcacggtttg accagtgagg cgcgcgcagt cattgatgct ctatagacac gaagaaaatg 10440
aaagcgttca gcgactcgac tctgtagcct ggaggaacgt gaacgggttg ggtcgcggtg 10500
taccccggtt caagacttgt actcgagccg gccggagccg cggctaacgt ggtattggca 10560
ctcccgtctc gacccagcct acaaaaatcc aggatacgga atcgagtcgt tttgctggtt 10620
gctgaatggc agggaagtga gtcctatttt tttttttgcc gctcagatgc atcccgtgct 10680
gcgacagatg cgtccccaac aacagccccc ctcgcagcag cagcaaccac aaaaggctgt 10740
ccctgcaact actgcaactg ccgccgtgag cggtgcggga cagcccgcct atgatctgga 10800
cttggaagag ggcgaaggac tggcacgtct aggtgcgccc tcgcccgagc ggcatccgcg 10860
agttcaactg aaaaaagatt ctcgcgaggc gtatgtgccc caacagaacc tatttagaga 10920
cagaagcggc gaggagccgg aggagatgcg agcttcccgc tttaacgcgg gtcgtgagct 10980
gcgtcacggt ttggaccgaa gacgagtgtt gcgggacgag gatttcgaag ttgatgaagt 11040
gacagggatc agtcctgcca gggcacacgt ggctgcagcc aaccttgtat cggcttacga 11100
gcagacagta aaggaagagc gtaacttcca aaagtctttt aataatcatg tgcgaaccct 11160
gattgcccgc gaagaagtta ctcttggttt gatgcatttg tgggatttga tggaagctat 11220
cattcagaac cctactagca aacctctgac cgcacagctg tttctggtgg tgcaacacag 11280
cagagacaac gaggctttca gagaggcact gctcaacatc actgaacccg aggggagatg 11340
gttgtatgat cttatcaaca ttctacagag tatcatagtg caggagcgga gcctgggcct 11400
ggccgaaaag gtggctgcca tcaattactc ggttttaagt ttgggaaaat attacgctcg 11460
caagatctac aagactccat acgttcccat agacaaggag gtgaagatag atgggttcta 11520
catgcgtatg acgctcaagg tcttgaccct gagcgatgat cttggggtgt accgcaatga 11580
cagaatgcat cgcgccgtta gcgccagtag gaggcgcgag ttaagcgaca gggaactgat 11640
gcacagtttg caaagagctc tgactggagc tggaacagag ggtgagaatt actttgacat 11700
gggagctgac ttgcagtggc agcctagtcg cagggctctg agcgccgcga cggcaggatg 11760
tgagcttcct tacatagaag aggcggatga aggcgaggag gaagagggcg agtacttgga 11820
agactgatgg cacaacccgt gttttttgct agatggaaca gcaagcaccg gatcccgcaa 11880
cgcgggcggc gctgcagagc cagccgtccg gcattaactc ctcggacgat tggacccagg 11940
ccatgcaacg tatcatggcg ttgacgactc gcaaccccga agcctttaga cagcaacccc 12000
aggccaaccg tctatcggcc atcatggaag ctgtagtgcc ttcccgctct aatcccactc 12060
atgagaaggt cctggccatt gtaaacgcgt tggtggagaa caaagctatt cgtccagatg 12120
aggccggact ggtatacaac gctcttttag aacgcgtggc tcgctacaac agtagcaatg 12180
tgcaaaccaa tttggaccgt atgataacag atgtacgcga agccgtgtct cagcgtgaaa 12240
ggttccagcg cgatgccaac cttggttcgc tggtggcgtt aaatgctttt ttgagtactc 12300
agcctgctaa tgtgccgcgt ggtcaacagg attatactaa ctttttgagt gcgttgagac 12360
tgatggtatc tgaagtacct cagagcgaag tgtatcagtc cggacctgac tacttctttc 12420
agactagcag acagggtttg cagacggtaa atctgagcca agcttttaaa aaccttaaag 12480
gtttgtgggg agtgcatgcc ccggtaggag aaagagcaac cgtgtctagc ttgttaactc 12540
caaactcccg cctattacta ctgttggtag ctcctttcac cgacagcggc agcatcgacc 12600
gtaattccta tttgggttac ctactaaacc tgtatcgcga agccataggg caaagccagg 12660
tggacgagca gacctatcaa gaaattaccc aagtcagtcg cgctttgggt caggaagaca 12720
ctggcagttt ggaagccact ctgaacttct tgcttaccaa tcggtctcag aagatccctc 12780
ctcaatatgc tcttactgcg gaggaggaga ggatccttag atatgtgcag cagagcgtgg 12840
gattgtttct gatgcaagag ggggcaactc cgactgcggc attggacatg acagcgcgaa 12900
atatggagcc cagcatgtat gccagtaacc ggcctttcat taacaaactg ctggactact 12960
tgcacagagc tgccgctatg aactctgatt attttaccaa tgccatccta aacccgcact 13020
ggctgccccc acctggtttc tacacgggcg aatatgacat gcccgaccct aatgacgggt 13080
ttctgtggga cgacgtggac agtaatgttt tttcacctct ttttgatcat cgcacgtgga 13140
aaaaggaagg cggcgataga atgcattctt ctgcatcgct gtccggggtc atgggtgcta 13200
ccgcggctga gcccgagtct gcaagtcctt ttcctagtct acccttttct ctacacagtg 13260
tacgtagcag cgaagtgggt agaataagtc gcccgagttt aatgggcgaa gaggaatacc 13320
taaacgattc cttgctcaga ccggcgagag aaaaaaattt cccaaacaat ggaatagaaa 13380
gtttggtgga taagatgagt agatggaaga cttatgctca ggatcacaga gacgagcctg 13440
ggatcatggg gactacaagt agagcgagcc gtagacgcca gcgtcatgac agacagaggg 13500
gtcttgtgtg ggaagatgag gattcggccg atgatagcag cgtgttggac ttgggtggga 13560
gaggaagggg caacccgttt gctcatttgc gccctcgctt gggtggtatg ttgtaaaaaa 13620
aaaataaaaa ggaaaactca ccaaggccat ggcgacgagc gtacgttcgt tcttctttat 13680
tatttgtgtc tagtataatg aggcgagtcg tgctaggcgg agcggtggtg tatccggagg 13740
gtcctcctcc ttcgtacgag agcgtgatgc agcagcagca ggcgacggcg gtgatgcaat 13800
ccccactgga ggctcccttt gtacctccgc gatacctggc acctacggag ggcagaaaca 13860
gcattcgtta ctcggaactg gcacctcagt acgataccac caggttgtat ctggtggaca 13920
acaagtcggc ggacattgct tctctgaact atcagaatga ccacagcaac ttcttgacca 13980
cggtggtgca gaacaatgac tttaccccta cggaagccag tacccagacc attaactttg 14040
atgaacgatc gcggtggggc ggtcagctaa agaccatcat gcatactaac atgcccaacg 14100
taaacgagta tatgtttagt aacaacttca aagcgcgtgt gatggtgtcc agaaaacctc 14160
ccgaaggtgc tgcagttggg gatacatatg atcacaagca ggatattttg gaatatgagt 14220
ggttcgagtt tactttgcca gaaggcaact tttcagttac tatgaccatt gatttgatga 14280
acaatgccat catagataac tacttgaaag tgggcagaca gaatggagtg cttgaaagtg 14340
acattggtgt taagttcgac accaggaact tcaagctggg atgggatccc gaaaccaagt 14400
tgattatgcc tggagtgtat acgtatgaag cctttcatcc tgacattgtc ttactgcctg 14460
gctgtggagt ggactttacc gaaagtcgtt tgagcaacct tcttggtatc agaaaaaaac 14520
agccatttca agagggtttt aagattttgt atgaagattt agaaggaggt aatattccgg 14580
ccctcttgga tgtagatgcc tatgagaaca gtaagaaaga acaaaaagcc aaaatagaag 14640
ctgctgcgga agctaaggca aacatagttg ccagcgactt tacaagggtt gctaacgctg 14700
gagaggtcag aggagacaat tttgcaccaa cacctgttcc gactgcagaa tcattattgg 14760
ccgatgtaac tggaggaacg gacgtgaaac tcactattca acctgtagaa aaagatagta 14820
agaatagaag ctataatgtg ttggaagata aaatcaacac agcctatcgc agttggtacc 14880
tttcgtacaa ttatggcgat cccgaaaaag gagtgcgttc ctggacattg ctcaccacct 14940
cagatgtcac ctgcggagca gagcaggtct actggtcgct tccagacatg atgcaggatc 15000
ctgtcacttt ccgctccact agacaagtca gcaactaccc tgtggtgggt gcagagctta 15060
tgcccgtctt ctcaaagagc ttctacaacg aacaagctgt gtactcccag cagctccgcc 15120
agtccacctc gcttacgcac gtcttcaacc gctttcctga gaaccagatt ttaatccgtc 15180
cgccggcgcc caccattacc accgtcagtg aaaacgttcc tgctctcaca gatcacggga 15240
ccctgccgtt gcgcagcagt atccggggag tccaacgtgt gaccgttact gacgccagac 15300
gccgcacctg tccctacgtg tacaaggcac tgggcatagt cgcaccgcgc gtcctttcaa 15360
gccgcacttt ctaaaaaaat gtccattctt atctcgccca gtaataacac cggttggggt 15420
ctgcgcgctc caagcaagat gtacggaggc gcacgcaaac gttctaccca acatcccgtg 15480
cgtgttcgcg gtcattttcg cgctccatgg ggtgccctca agggccgcac tcgcgttcga 15540
accaccgtcg atgatgtaat cgatgaggtg gttgccgacg cccgtaatta tactcctact 15600
gcgcctacat ctactgtgga tgcagttatt gacagtgtag tggctgacgc tcgcaactat 15660
gctcgacgta agagccggcg aaggcgcatt gccagacgcc accgagctac cactgccatg 15720
cgagccgcaa gagctctgct acgaagagct agacgcgtgg gacgaagagc catgcttagg 15780
gcggccagac gtgcagcttc gggcgccagc gccggcaggt cccgcaggca agcagccgct 15840
gtcgcagcgg cgactattgc cgacatggcc caaacgcgaa gaggcaatgt atactgggtg 15900
cgtgacgctg ccaccggtca acgtgtaccc gtgcgcaccc gtccccctcg cacttagaag 15960
atactgagca gtctccgatg ttgtgtccca gcggcgagga tgtccaagcg caaatacaag 16020
gaagaaatgc tgcaggttat cgcacctgaa gtctacggcc aaccgctgaa ggatgaaaaa 16080
aaaccccgca aaatcaagcg ggctaaaaag gacaaaaaag aagaggaaga tggcgatgat 16140
gggctggcgg agtttgtgcg cgagtttgcc ccacggcgac gcgtgcaatg gcgtggacgc 16200
aaagttcgac atttgttgag acctggaact tcggtggtct ttacacccgg cgagcgttca 16260
agcgctactt ttaagcgttc ctatgatgag gtgtacgggg atgatgatat tcttgagcag 16320
gcggctgacc gattaggcga gtttgcttat ggcaagcgta gtagaataaa tcccaaggat 16380
gagacagtgt ccataccctt ggatcatgga aatcccaccc ctagtcttaa accggtcact 16440
ttgcagcaag tgttacccgt aactccgcga acaggtgtta aacgcgaagg tgaagatttg 16500
tatcccacta tgcaactaat ggtacccaaa cgccaaaagt tggaggacgt tttggagaaa 16560
gtaaaagtgg atccagatat tcaacctgag gttaaagtga gacccattaa gcaggtagcg 16620
cctggtctgg gagtacaaac tgtagacatt aagattccca ctgaaagtat ggaagtgcaa 16680
actgaacccg caaagcctac tgccacctcc actgaagtgc aaacggatcc atggatgccg 16740
atgcctatta caactgacgc cgccggtccc actcgaagat cccgacgaaa gtacggtcca 16800
gcaagtctgt tgatgcccaa ctatgttgta cacccatcta ttattcctac tcctggttac 16860
cgaggcactc gctactatcg cagccgaaac agtacctccc gccgtcgccg caagacacct 16920
gcaaatcgca gtcgtcgccg tagacgcaca agcaaaccga ctcccggcgc cctggtgcgg 16980
caagtgtacc gcaatagtag tgcggaacct ttgacactgc cgcgtgcgcg ttaccatcca 17040
agtatcatca cttaatcaat gttgccgctg cctccttgca gatatggccc tcacttgtcg 17100
ccttcgcgtt cccatcactg gttaccgagg aagaaattcg cgccgtagaa gagggatgtt 17160
ggggcgcgga atgcgacgct acaggcgacg gcgtgctatc cgcaagcaat tgcggggtgg 17220
ttttttgcca gccttaattc caattatcgc tgctgcaatt ggcgcgatac caggcatagc 17280
ttccgtggcg gttcaggcct cgcaacgaca ttgacattgg aaaaaaaagt ataaataaaa 17340
aaaaaaatac aatggactct gacactcctg gtcctgtgac tatgttttct tagagatgga 17400
aaacatcaat ttttcatcct tggctccgcg acacggcacg aagccgtaca tgggcacctg 17460
gagcgacatc ggcacgagcc aactgaacgg gggcgccttc aattggagca gtatctggag 17520
cgggcttaaa aattttggct caaccataaa aacatacggg aacaaagctt ggaacagcag 17580
tacaggacag gcgcttagaa ataaacttaa agaccagaac tttcaacaaa aagtagtcga 17640
tgggatagct tccggcatca atggagtggt agatttggct aatcaggctg tgcagaaaaa 17700
gataaacagt cgtttggacc cgccgccagc aaccccaggt gaaatacaag tggaggaaga 17760
aattcctccg ccagaaaaac gaggcgacaa gcgtccgcgt cccgatttgg aagagacgct 17820
ggtgacgcgc gtagatgaac cgccttctta tgaggaagca acgaagcttg gaatgcccac 17880
cactagaccg atagccccta tggctaccgg ggtaatgaaa ccttctcagt tgcatcgacc 17940
cgtcactttg gatttgcccc ctccccctgc tgctactgct gtacccgctt ctaagcctgt 18000
cgctgccccg aaaccagtcg ccgtagccag gtcacgtccc gggggcgctc ctcgtccaaa 18060
tgcgcactgg caaaatactc tgaacagcat cgtgggtcta ggcgtgcaaa gtgtaaaacg 18120
ccgtcgctgc ttttaattaa atatggagta gcgcttaact tgcctatctg tgtatatgtg 18180
tcattacacg ccgtcacagc agcagaggaa aaaaggaaga ggtcgtgcgt cgacgctgag 18240
ttactttcaa gatggccacc ccatcgatgc tgccccagtg ggcatacatg cacatcgccg 18300
gacaggatgc ttcggagtac ctgagtccgg gtctggtgca gttcgcccgc gccacagaca 18360
cctacttcaa tctgggaaat aagtttagaa atcccaccgt agcgccaacc cacgatgtga 18420
ccaccgaccg tagccagcgg ctcatgttgc gcttcgtgcc cgttgaccgg gaggacaata 18480
catactctta caaagtgcgg tacaccctgg ccgtgggcga caacagagtg ctggatatgg 18540
ccagcacgtt ctttgacatt aggggcgtgt tggacagagg tcccagtttc aaaccctatt 18600
ctggtacggc ttacaactct ctggctccta aaggcgctcc aaatgcatct cagtggttgg 18660
ataaaggggt tgaaactact gaagaacggc aaaatgaaga cggggaaaat gacgaaaaag 18720
ctacatacac ttttggcaat gccccagtaa aagccgatgc tgacattaca aaagacggac 18780
taccaatagg tttggaagtc ccagctgaag gtgaccctaa acctatctac gctaataagc 18840
tttaccaacc agaaccccag gtgggacagg aatcgtggac tgatacagat ggcactgaag 18900
aaaaatacgg aggcagagta cttaaaccgg acactaaaat gaaaccgtgc tatgggtctt 18960
ttgctaaacc tactaatgtg aaaggcggac aggcaaaagt gaaaacagaa gaaggcaaca 19020
acattgaata tgacattgac atgaactttt ttgacttaag atcacaaaaa caaggtctta 19080
aacctaagat tgtaatgtat gcagaaaatg tggacctgga atctccagat actcatgttg 19140
tgtacaaacc tgaagtttca gatgctagtt caaatgctaa tcttggacag cagtctatgc 19200
ccaacagacc caactacatt ggcttcagag ataattttat tggtcttatg tactataaca 19260
gtactggtaa catgggggtg ctggctggcc aagcatctca gttgaatgca gtggttgact 19320
tgcaggacag aaacacagaa ctgtcttacc aactcttgct tgactccctg ggcgatagaa 19380
ccagatactt tagcatgtgg aatcaggctg ttgacagtta tgatcccgat gtgcgtgtta 19440
ttgaaaatca tggtgtggaa gatgaacttc ccaactactg ttttccactg gacggcatcg 19500
gtccgcgaac agatagttac aaggagattc agttaaatgg agaccaagct tggaaagatg 19560
taaatccaaa tggtatcagt gaacttgtta agggaaatcc atttgccatg gaaattaacc 19620
ttcaagccaa tctatggcga agtttccttt attccaatgt ggctctgtat ctcccagact 19680
cgtacaaata caccccgtcc aatgtcactc ttccagaaaa caaaaacacc tacgactaca 19740
tgaacgggcg ggtggtgccg ccatctctag tagacaccta tgtgaacatt ggcgccaggt 19800
ggtctctgga tgctatggac aatgtcaacc cattcaacca ccaccgtaac gctggcttgc 19860
gttaccgatc catgcttttg ggtaacggac gttatgtgcc tttccacata caagtgcctc 19920
aaaaattctt cgctgtcaaa aacctgctgc ttctcccagg ctcctacact tatgagtgga 19980
acttcaggaa ggatgtgaac atggtgctac agagttccct cggtaacgac ctacgggtag 20040
atggcgccag catcagtttc acgagcatca acctctatgc tacctttttc cccatggctc 20100
acaacaccgc ttccaccctt gaagccatgc tgcggaatga caccaatgat cagtcattca 20160
acgactatct atctgcagct aacatgctct atcccattcc tgccaatgca accaatattc 20220
ccatttccat tccttctcgc aactgggcgg ctttcagagg ctggtcattt accagactca 20280
aaaccaaaga aactccctct ttggggtctg gatttgaccc ctactttgtc tattctggtt 20340
ctattcccta cctggatggt accttctacc tgaaccacac ttttaagaag gtttccatca 20400
tgtttgactc ttcagtgagc tggcctggaa atgacaggtt actatctccc aacgaatttg 20460
aaataaagcg cactgtggat ggcgaaggct acaatgtagc ccaatgcaac atgaccaaag 20520
actggttctt ggtacagatg ctcgccaact acaacatagg ctatcagggc ttctacattc 20580
cagaaggata caaagatcgc atgtattcat ttttcagaaa cttccagccc atgagcaggc 20640
aggtggttga tgaggtcaat tacaaagact tcaaggccgt cgccataccc taccaacaca 20700
acaactctgg ctttgtgggt tacatggctc cgaccatgcg ccaaggtcaa ccctatcccg 20760
ctaactatcc ctatccactc attggaacaa ctgccgtaaa tagtgttacg cagaaaaagt 20820
tcttgtgtga cagaaccatg tggcgcatac cgttctcgag caacttcatg tctatggggg 20880
cccttacaga cttgggacag aacatgcttt atgccaactc agctcatgct ctggacatga 20940
cctttgaggt ggatcccatg gatgagccca ccctgcttta tcttctcttc gaagttttcg 21000
acgtggtcag agtgcatcag ccacatcgcg gcatcatcga gacagtctac ctgcgtacac 21060
cgttctcggc cggtaacgct accacgtaaa aagcttcttg cttcttgcaa acagcagctg 21120
caaccatggc ctgcggatcc caaaacggct ccagcgagca agagctcaga gccattgtcc 21180
aagacctggg ttgcggaccc tattttttgg gaacctacga taagcgcttc ccggggttca 21240
tggcccccga taagctcgcc tgtgccattg taaacacggc cggacgtgag acggggggag 21300
agcactggtt ggctttcggt tggaacccac gttctaacac ctgctacctt tttgatcctt 21360
ttggattctc ggatgatcgt cttaaacaga tttaccagtt tgaatatgag ggtctcctgc 21420
gccgcagcgc tcttgctacc aaggaccgct gtattacgct ggaaaaatct acccagaccg 21480
tgcagggccc ccgttctgcc gcctgcggac ttttctgctg catgttcctt catgcctttg 21540
tgcactggcc tgaccgtccc atggacggaa accccaccat gaaattgctg actggagtgc 21600
caaacaacat gcttcattct cctaaagtcc agcccaccct gtgtgacaat caaaaagcac 21660
tctaccattt tctcaatacc cattcgcctt attttcgctc ccatcgtaca cacatcgaaa 21720
gggccactgc gttcgaccgt atggatgtgc aataatgact catgtaaaca acgtgttgaa 21780
taaacagcac tttatttttt acacgtatca aggctctgga ttacttattt atttacaagt 21840
cgaatgggtt ctgacgagaa tcagaatgac ccgcgggcag tgatacgttg cggaactgat 21900
acttgggttg ccacttgaat tcgggaatca ccaacttggg aaccggtata tcgggtagga 21960
tgtcactcca cagctttctg gtcagctgca aagctcccag caggtcagga gccgaaatct 22020
tgaaatcaca attaggacca gtgctctgag cgcgagagtt gcggtacacc ggattgcagc 22080
actgaaacac catcagcgac ggatgtctca cgcttgccag cacggtggga tctgcaatca 22140
tgcccacatc cagatcttca gcattggcaa tgctgaacgg ggtcatcttg caggtctgcc 22200
tacccatggc gggcacccaa ttaggcttgt ggttgcaatc gcagtgcagg gggattagta 22260
tcatcttggc ctgatcctgt ctgattcctg gatacacggc tctcatgaaa gcatcatatt 22320
gcttgaaagc ctgctgggct ttactaccct cggtatagaa catcccgcag gacctgctcg 22380
aaaactggtt agctgcgcag ccggcatcat tcacacagca gcgggcgtca ttgttggcta 22440
tttgcaccac acttctgccc cagcggtttt gggtgatttt ggttcgctcg ggattctcct 22500
tcaaggctcg ttgtccattc tcgctggcca catccatctc gataatctgc tccttctgaa 22560
tcataatagt gccatgcagg cacttcagct tgccctcata atcattgcag ccatgaggcc 22620
acaacgcaca gcctgtacat tcccaattat ggtgggcgat ctgagaaaaa gaatgtatca 22680
ttccctgcag aaatcttccc atcatcgtgc tcagtgtctt gtgactagtg aaagttaact 22740
ggatgcctcg gtgctcctcg tttacgtact ggtgacagat gcgcttgtat tgttcgtgct 22800
gctcaggcat tagtttaaaa gaggttctaa gttcgttatc cagcctgtac ttctccatca 22860
gtacacacat cacttccatg cccttctccc aagcagacac caggggcaag ctaatcggat 22920
tcttaacagt acaggcagca gctcctttag ccagaggatc atctttggca atcttttcaa 22980
tgcttctttt gccatccttc tcaacgatgc gcacgggcgg gtagctgaaa cctactgcta 23040
caagctgcgc ctcttctctt tcttcttcgc tgtcttgact gatgtcttgc atgggaacat 23100
gtttggtctt ccttggcttc tttttggggg gtatcggggg aggaggactg tcgctccgtt 23160
ccggagacag ggaggattgt gaagtttcgc tcaccattac caactgactg tcggtagaag 23220
aacctgaccc cacacggcga caggtgtttc tcttcggggg cagaggtgga ggcgattgcg 23280
aagggctgcg gtccgacctg gaaggcggat gactggcaga accccttccg cgttcggggg 23340
tgtgctccct gtggcggtcg cttaactgat ttccttcgcg gctggccatt gtgttctcct 23400
aggcagagaa acaacagaca tggaaactca gccattgctg tcaacatcgc cacaagtgcc 23460
atcacatctc gtcgtcagcg acgaggaaaa ggagcagagc ttaaccattc caccgcccag 23520
tcctgccacc acctctaccc tagaagataa ggaggtcgac gcatctcatg acatgcagaa 23580
taaaaaagcg aaagagtctg aaacagacat cgagcaagac ccgggctatg tgacaccggt 23640
ggaacacgag gaagagttga aacgctttct agagagagag gatgaaaact gcccaaaaca 23700
gcaagcggat aactatcacc aagatgctgg aaatagggat cagaacaccg actacctcat 23760
agggcttgac ggggaagacg cgctccttaa acatctagca agacagtcac tcatagtcaa 23820
ggatgcatta ttggacagaa ctgaagtgcc catcagtgtg gaagagctca gccgcgccta 23880
cgagcttaac cttttttcac ctcgtactcc ccccaaacgc cagccaaacg gcacctgcga 23940
gccaaatcct cgcttaaact tttatccagc ttttgctgtg ccagaagtac tcgctactta 24000
tcacatcttt tttaaaaatc aaaaaattcc agtctcctgc cgcgctaatc gcacccgcgc 24060
tgacgcccta cttaatctgg gacctggttc acgcttacct gatatagctt ccttggaaga 24120
ggttccaaaa atcttcgagg gtctgggcaa taatgagact cgggccgcaa atgctctgca 24180
aaagggagaa aatggcatgg atgagcatca cagcgttctg gtggaattgg agggcgataa 24240
tgccagactc gcagtactca agcgaagcgt cgaggtcaca cactttgcat accccgctgt 24300
caacctgccc cctaaagtta tgacggcggt catggaccag ttactcatta agcgcgcaag 24360
tcccctttca gaagacatgc atgacccaga cgcctgtgat gagggtaaac cagtggtcag 24420
tgatgagcag ctaacccgat ggctggacac cgactctccc cgggatttgg aagagcgtcg 24480
caagcttatg atggccgtag tgctggttac cgtagaacta gagtgtctcc ggcgtttctt 24540
taccgattca gaaaccttgc gcaaactcga agagaatctg cactacactt ttagacacgg 24600
ctttgtgcgg caggcgtgca agatatctaa cgtggaactc accaacctgg tttcctacat 24660
gggtattctg catgagaatc gtctaggaca aagcgtgctg cacagcaccc ttaaggggga 24720
agcccgccgt gattacatcc gcgattgtgt ctatctctac ctgtgccaca cgtggcaaac 24780
cggcatgggt gtatggcagc aatgtttaga agaacagaac ttgaaagagc ttaacaagct 24840
cttacagaaa tctcttaagg ttctgtggac agggttcgac gagcgcaccg tcgcttccga 24900
cctggcagac ctcatcttcc cagagcgtct tagggttact ttgcgaaacg gactgcctga 24960
ctttatgagc cagagcatgc ttaacaattt tcgctctttc atcctggaac gctccggtat 25020
cctgcccgcc acctgctgcg cactgccctc cgactttgtg cctctcacct accgcgagtg 25080
ccccccgccg ctatggagtc actgctacct gttccgtctg gccaactacc tctcctacca 25140
ctcggatgtg atcgaggatg tgagcggaga cggcttgctg gagtgtcact gccgctgcaa 25200
tctgtgcacg ccccaccggt ccctagcttg caacccccag ttgatgagcg aaacccagat 25260
aataggcacc tttgaactgc aaggccccag cagccaaggc gatgggtctt ctcctgggca 25320
aagtttaaaa ctgaccccgg gactgtggac ctctgcctac ttgcgcaagt ttgccccgga 25380
agattaccac ccctatgaaa tcaagttcta tgaggaccaa tcacagcctc caaaggccga 25440
actttcggcc tgcgtcatca cccagggggc aattctagcc caattgcaag ccatccaaaa 25500
atcccgccaa gaatttctac tgaaaaaggg taagggggtc taccttgacc cccagaccgg 25560
cgaggaactc aacacaaggt tccctcagga tgtcccaacg acgagaaagc aagaagttga 25620
aggtgcagcc gccgccccca gaagatatgg aggaagattg ggacagtcag gcagaggaag 25680
cggaggagga cagtctggag gacagtctgg aggaagacag tttggaggag gaaaacgagg 25740
aggcagagga ggtggaagaa gtaaccgccg acaaacagtt atccccggct gcggagacaa 25800
gcaacagcgc tatcatctcc gctccgagtc gaggaacgcg gcggcgtccc agcagtagat 25860
gggacgagac cggacgcttc ccgaacccaa ccaccgcttc caagaccggt aagaaggatc 25920
ggcagggata caagtcctgg cgggggcata agaatgccat catctcctgc ttgcatgagt 25980
gcgggggaaa catatccttc acgcgacgct acttgctatt ccaccatggg gtgaactttc 26040
cacgcaatgt tttgcattac taccgtcacc tccacagccc ctactatagc cagcaaatcc 26100
cggcaatctc gacagaaaaa gacagcggcg gcgacctcca acagaaaacc agcagcggca 26160
gttaaaaaat acacaacaag tgcagcaaca ggaggattaa agattacagc caacgagcca 26220
gcgcaaaccc gagagctaag aaatcggatc tttccaaccc tgtatgccat cttccagcag 26280
agtcggggcc aagagcagga actgaaaata aaaaaccgat ctttgcgttc gctcaccaga 26340
agttgtttgt atcacaagag cgaagatcaa cttcagcgca ctcttgagga cgccgaggct 26400
ctcttcaaca agtactgcgc gctgactctt aaagagtagg cagcgaccgc gcttattcaa 26460
aaaaggcggg aattacatca tcctcgtcat gagtaaagaa attcccacgc cttacatgtg 26520
gagttatcag ccccaaatgg gattggcggc aggcgcctcc caggactact ccacccgcat 26580
gaattggctc agcgccgggc cttctatgat ttctcgagtt aatgatatac gcgcctaccg 26640
aaaccaaata cttttggaac agtcagctct taccaccacg ccccgccaac accttaatcc 26700
cagaaattgg cccgccgccc tagtatacca ggaaagtccc gctcccacca ctgtattact 26760
tcctcgagac gcccaggccg aagtccaaat gactaatgca ggtgcgcagt tagctggcgg 26820
ctccacccta tgtcgtcaca ggcctcggca taatataaaa cgcctgatga ttagaggccg 26880
aggtattcag cttaacgacg agtcggtgag ctctccgctt ggtctacgac cagacggaat 26940
ctttcaaatt gccggctgcg ggagatcttc cttcacccct cgtcagactg ttttgacttt 27000
ggaaagttcg tcttcgcaac cccgctcggg cggaatcggg accgttcaat ttgtggagga 27060
gtttactccc tctgtctact tcaacccttt ctccggatct cctgggcact acccggacga 27120
gttcataccg aactttgacg caattagcga gtcagtggac ggctacgatt gatgtctggt 27180
gacgcggctg agctatctcg gctgcgacat ctagaccact gccgccgctt tcgctgtttt 27240
gcccgggaac tcattgagtt catttacttc gaactcccca aggatcaccc tcaaggtccg 27300
gcccacggag tgcggattac tatcgaaggt aaaataaact ctcgcctgca tcgaattttc 27360
tcccagcggc ccgtgctgat cgagcgagac cagggaaaca ccacggtttc tatctactgc 27420
atttgtaatc acccaggatt gcatgaaagc ctttgctgtc ttatgtgtac tgagtttaat 27480
aaaaactgaa ttaagactct cctacggact gccgcttctt caacccggat tttacaacca 27540
gaagaacgaa acttttcctc tcatccagga ctctgttaac tttacctttc ctacttacaa 27600
accagaagct caacgacaac accgcttttc cagaagcatt ttccctacta atactacttt 27660
caaaaccgga ggtgagctcc acagtctccc cgcagaaaac ccttgggtgg aagcgggcct 27720
tgtagtgcta ggaattcttg cgggcgggct tgtgattatt ctttgctacc tatacacacc 27780
ttgcttcact ttcctagtgg tgttgtggta ttggtttaaa aaatggggcc catactagtc 27840
ttgcttgttt tactttcgct tttgggaccg ggttctgcca actacaatcc atgtctagac 27900
tttgacccag aaaactgcac acttactttt gcacccgaca caagccgcat ctgtggagtt 27960
cttattaagt gcggatggga atgcaggtcc gttgaaatta cacacaataa caaaacctgg 28020
aacaatacct tatccaccac atgggagcca ggagttcccg agtggtacac tgtctctgtc 28080
cgaggtcctg acggttccat ccgcattagt aacaacactt ttattttttc tacaatgtgc 28140
gatctggcca tgttcatgag caaacagtat tctctatggc ctcccagcaa ggacaacatt 28200
gtaacgttct ccattgctta ttgcttgtgc gcttgccttc ttactgcttt actgtgcgta 28260
tgcatacacc tgcttgtaac cactcgtatc aaaaacgcca ataacaaaga aaaaatgcct 28320
taacctcttt ctgtttacag acatggcttt tcttacagct ctcatacttg tcagcattgt 28380
cactgccgct cacggacaaa cagtcgtctc tatccctcta ggtcataatt acactctcat 28440
aggaccccca atcacttcag aggtcatctg gaccaaactg ggaagcgttg attactttga 28500
tataatctgt aacaaaacaa aaccaataat agtaacctgc aacatacaaa atcttacatt 28560
aattaatgtt agcaaagttt acagcggtta ctattatggt tatgacagat acagtagtca 28620
atatagaaat tacttggttc gtgttaccca gtccaaaacc acgaaaatgc caaatatggc 28680
agaaattcga tccgatgaca attctctaga aacttttaca tcttccacca cacctgacga 28740
aaaaaatatc ccagattcaa tgattgcaat tatcgcagcg gtggcagtgg tgatggcact 28800
aacagtaata tgcatgcttt tatatgcttg tcgctacaaa aagtttcatc ctaaaaaaca 28860
agatctccta ctaaggctta acatttaatt tctttttaca cagccatggt ttccactacc 28920
acattcctta tgcttactag tatagcaact ctgacttctg ctcgctcaca cctcactgta 28980
actataggct caaactgcac actaaaagga cctcaaggtg gtcatgtctt ttggtggaga 29040
atatatgaca atggatggtt tacaaaacca tgtgaccaac ctggtagatt tttctgcaac 29100
ggcagagacc taaccattat caacgtgaca gcaaatgaca aaggcttcta ttatggaacc 29160
gactataaaa gtagtttaga ttataacatt attgtactgc catccaccac tccagcgccc 29220
cgcaaaacta ctttctctag cagcagtgcc gctaacaata caatttccaa tccaaccttt 29280
accgcgcttt taaaacgcac tgtgaataat tctacaacaa tttccacttc aacaatcagc 29340
atcatcgctg ccgtgacaat tggaatatct attcttgttt ttaccataac ctactacacc 29400
tgctgctata aaaaagacga acataaaggt gatccattac ttagatttga tatttaattt 29460
gttctttttt tttttattta cagtatggtg aacaccaatc atggtaccta gaaatttctt 29520
cttcaccata ctcatctgtg cttttaatgt ttgcgctact ttcacagcag tagccacagc 29580
aagcccagac tgtataggag catttgcttc ctatgcactt tttgcttttg tcacttgcat 29640
ctgcgtatgt agcatagtct gcctggttat taattttttc caacttctag actggatcct 29700
tgtgcgaatt gcctacctgc gccaccatcc cgaataccgc aaccaaaata tcgcggcact 29760
tcttagactt atctaaaacc atgcaggcta tactaccaat atttttgctt ctattgcttc 29820
cctacgctgt ctcaacccca gctacctata gtactccacc agaacacctt agaaaatgca 29880
aattccaaca accgtggtca tttcttgctt gctatcgaga aaaatctgaa attcccccaa 29940
ctttaataat gattgctgga ataattaatg taatctgttg caccataatt tcatttctga 30000
tataccccct atttgatttt ggctggaatg ctcccaatgc acatgattat tcccaagacc 30060
cagaggaaca cattccccta cataacatgc aacaaccaat agcgctaata gaatacgaaa 30120
gtgaaccaca acccccacta ctccctgcta ttagttactt caacctaacc ggcggagatg 30180
actgaaacac tcaccacctc caattccgcc gaggatctgc ttgatatgga cggccgcgtc 30240
tcagaacagc gactcgccca actacgcatc cgccagcagc aggaacgcgt ggccaaagag 30300
ctcagagatg tcatccaaat tcaccaatgc aaaaaaggca tattctgttt ggtaaaacaa 30360
gccaaaatat cctacgagat caccgctacc gaccatcgcc tctcttacga gcttggcccc 30420
caacgacaaa aatttacctg catggtggga atcaacccca tagttatcac ccaacaaagt 30480
ggagatacta agggttgcat tcactgctcc tgcgattcca tcgagtgcac ctacaccctg 30540
ctgaagaccc tatgcggact aagagacctg ctacccatga attaaaaaaa tgattaataa 30600
aaaatcactt acttaaaatc agcaataagg tctctattga aattttctcc cagcagcacc 30660
tcacttccct cttcccaact ctggtattct aaaccccgtt cagcggcata ctttctccat 30720
actttaaagg ggatgtcaaa ttttagctcc tctcctgtac ccacaatctt catctctttc 30780
ttcccagatg accaagagag tccggctcag tgactccttc aaccctgtct acccctatga 30840
agatgaaagc acctcccaac acccctttat aaacccaggg tttatttccc caaatggctt 30900
cacccaaagc ccagacggag ttcttacttt aaaatgttta accccgctaa caaccacagg 30960
cgggtctcta cagctaaaag tgggaggggg acttacagta gatgacactg atgggacctt 31020
acaagaaaac ataggtgcca ccacaccact tgttaagact gggcactcta taggtttatc 31080
cctaggagcc ggattgggaa cagatgaaaa taaactttgt accaaattgg gagaaggact 31140
tacattcaat tcaaacaaca tttgcattga tgacaatatt aacaccctgt ggacaggagt 31200
taaccccacc gaagccaact gtcaaatgat ggactccagt gaatctaatg attgcaaatt 31260
aattctaaca ctagttaaaa ctggagccct agtcactgca tttgtttatg ttataggagt 31320
atctaacaat tttaatatgc taactacata cagaaatata aattttactg cggagctgtt 31380
ttttgattct gcgggtaatt tactaactag cctgtcatcc ctaaaaactc cacttaatca 31440
taaatcagga caaaacatgg ctactggtgc cattactaat gctaaaagtt tcatgcccag 31500
cacaactgct tatcctttca ataataattc tagagaaaaa gaaaactaca tttacggaac 31560
ttgtcactac acagctagtg atcacactgc ttttcccatt gacatatctg tcatgcttaa 31620
ccaaagagca ataagagctg atacatcata ttgtattcgt ataacttggt cctggaacac 31680
aggagatgcc ccagaggggc aaacctctgc tacaacccta gttacctccc catttacctt 31740
ttactacatc agagaagacg actgacaaat aaagtttaac ttgtttattt gaaaatcaat 31800
tcacaaactc cgagtagtta ttttgcctcc cccttcccat ttaacagaat ataccaatct 31860
ctccccacgc acagctttaa acatttggat accattagag atagacatgg ttttagattc 31920
cacattccaa acagtttcag agcgagccaa tctggggtca gtgatagata aaaatccatc 31980
gggatagtct tttaaagcgc tttcacagtc caactgatgc ggatgcgact ccggagtctg 32040
gatcacggtc atctggaaga agaacgatgg gaatcataat ccgaaaacgg gatcgggcga 32100
ttgtgtctca tcaaacccac aagcagccgc tgtctgcgtc gctccgtgcg actgctgttt 32160
atgggatcgg gatccacagt gtcctgaagc atgattttaa tagcccttaa cattaacttt 32220
ctggtgcgat gcgcgcagca acgcattctt atttcactta gattaataca gtaggtacag 32280
cacattatca caatattgtt taataaacca taattaaaag cactccagcc aaaactcata 32340
tctgatataa tcgcccctgc atgaccatca taccaaagtt taatataaat taaatgacgt 32400
tccctcaaaa acacactacc cacatacatg atctcttttg gcatgtgcat attaacaatc 32460
tgtctgtacc atggacaacg ttggttaatc atgcagccca atataacctt ccggaaccac 32520
actgccaaca ccgctccccc agccatgcat tgaagtgaac cctgctgatt acaatgacaa 32580
tgaagaatcc aattctctcg accgtgaatc acttgagaat gaaaaatatc tatagtagca 32640
caacatagac ataaatgcat gcatcttctc ataattttta actcctcagg atttagaaac 32700
atatcccaag gaataggaag ctcttgcaga acagtaaagc tggcagaaca aggaagacca 32760
cgaacacaac ttacactatg catagtcata gtatcacaat ctggcaacag cgggtggtct 32820
tcagtcatag aagctcgggt ttcattttcc tcacaacgtg gtaactgggc tctggtgtaa 32880
ggatgatgtc tggcgcatga tgtcgagcgt gcgcacaacc ttgtcataat ggagttgctt 32940
cctgacattc tcgtattttg tatagcaaaa cgcggccctg gcagaacaca ctcttcttcg 33000
ccttttatcc tgccgcttag cgtgttccgt gtgatagttc aagtacagcc acactcttaa 33060
gttggtcaaa agaatgctgg cttcagttgt aatcaaaact ccatcacatc taatcgttct 33120
gaggaaatga tccacggtag catatgcaaa tcccaaccaa gcaatgcaac tggattgcgt 33180
ttcaagcagg agaggagagg gaagagacgg aagaaccatg ttaattttta ttccaaacga 33240
tctcgcagta cttcaaattg tagatcgcgc agatggcatc tgtcgccccc actgtgttgg 33300
tgaaaaagca cagctagatc aaaagaaatg cgattttcaa ggtgctcaac ggtggcttcc 33360
agcaaagcct ccacgcgcac atccaagaac aaaagaatac caaaagaagg agcattttct 33420
aactcctcaa tcatcatatt acagtcctgc accattccca gataattttc agctttccag 33480
ccttggatta ttcgtgtcat ttcttgtggt aaatccaatc cacacattac aaacaggtcc 33540
cggagggcgc cctccaccac cattcttaaa cacaccctca taatgacaaa atatcttgct 33600
cctgtgtcac ctgtagcaaa ttgagaatgg caacatcaat tgacatgccg ttggctctaa 33660
gttcttctct aagttctagt tgtaaatact ctttcatatt atcaccaaac tgcttagcca 33720
gaagcccccc gggaacaaga gcaggacacg ctacagtgca gtacaagcgc agacctcccc 33780
aattggctcc agcaaaaaca agattggaat aagcatattg ggaaccacca gtaatgtcat 33840
caaagttgct ggaaatataa tcaggcagag tttgttgtaa aaattgaata aaagaaaaat 33900
ttgccaaaaa aacattcaaa acctctggga tgcaaatgca ataagttacc gcgctgcgct 33960
ccaacattgt tagttttgaa tgagtctgca aaaaataaaa aaacaagcgt catatcagag 34020
tagcctgacg aacaggtgga taaatcagtc tttccatcac aagacaagcc acagggtctc 34080
cagcccgacc ctcgtaaaac ctgtcatcgt gattaaacaa cagcaccgaa agttcctcgc 34140
ggtgaccagc atgaataatt cttgatgaag catacaatcc aaacatgtta gcatcagtta 34200
aagacaaaaa acagccaata tagcctctgg gtataattat gcttaatcgt aaatatagca 34260
aagccacccc tcgcggatac aaagtaaaag gcacaggaga ataaaaaata taattattcc 34320
tttgctgctg ttcaggcaac gtcgcccccg gtccctctaa atacacatac aaagcctcat 34380
cagccatggc ttaccagaca aagtacagca ggcacacaaa gcacaagctc taaagtcact 34440
caccaacctg tccacagtat atatacacaa accctaaact gacgtaatgg ggctaaagta 34500
cacaaaatcc cgccaaaccc aacacacacc ccgaaactgc gtcaccacaa aagtacagtt 34560
tcacttccgc aatcccaaca agcggcactt cctctttctc acgggacgtc acatccgctt 34620
aacttgcaac ctcattttcc cacggccgcg ccgccccttt tagccgttaa ccccacagcc 34680
aattaccaca cagcccacac tttttaaaat cacctcattt acatattggc accattccat 34740
ctataaggta tattattgat gatg 34764
<210> 149
<211> 35522
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 16 sequence
<400> 149
cattatctat aatatacctt atagatggaa tggtgccaac atgtaaatga ggtaatttaa 60
aaaagtgcgc gctgtgtggt gattggctgc ggggtgaacg gctaaaaggg gcgggcaatg 120
ctgggatgtg acgtaactta tgtgggagga gttatgttgc aagttatcgc ggtaaaggtg 180
acgtaaaacg aggtgtggtt tggacacgga agtagacagt tttcccacgt ttactgacag 240
gatatgaggt agttttgggc ggatgcaagt gaaaattctc cattttcgcg cgaaaactga 300
atgaggaagt gaatttctga gtcatttcgc ggttatgaca gggtggagta tttgccgagg 360
gccgagtaga ctttgaccgt ttacgtggag gtttcgatta ccgtgttttt cacctaaatt 420
tccgcgtacg gtgtcaaagt cctgtgtttt tacgtaggtg tcagctgatc actagggtat 480
ttaaacctgt cgagttccgt caagaggcca ctcttgagtg ccagcgagaa gagttttctc 540
ctccgcgctg cgagtcagtt ttgcgctttg aaaatgagac acctgcgatt cctgccacag 600
gagattatct ccagcgagac cgggatcgaa atactggagt ttgtggtaaa taccctgatg 660
ggagatgacc cggaaccgcc agtgcagcct ttcgatccac ctacgctgca cgatctgtat 720
gatttagagg tagacgggcc tgatgatccc aatgaggaag ctgtaaatgg gttttttact 780
gattctatgc tgctagctgc cgatgaagga ttggacataa accctcctcc tgagaccctt 840
gataccccag gggtggttgt ggaaagcggc agaggtggga aaaaattgcc tgatctggga 900
gcagctgaaa tggacttgcg ttgttatgaa gagggttttc ctccgagtga tgatgaagac 960
ggggaaactg aacagtccat ccataccgca gtgaatgagg gagtaaaagc tgccagcgat 1020
gtttttaagt tggactgtcc ggagctgcct ggacatggct gtaagtcttg tgaatttcac 1080
aggaataaca ctggaatgaa agaactattg tgctcgcttt gctatatgag aatgcactgc 1140
cactttattt acagtaagtg tatttaagtg aaatttaaag gaatagtgta gctgtttaat 1200
aactgttgaa tggtagattt atgtttttgc ttgcgatttt ttgtaggtcc tgtgtctgat 1260
gatgagtcac cttctcctga ttcaactacc tcacctcctg aaattcaggc gcccgtacct 1320
gcaaacgtat gcaagcccat tcctgtgaag cctaagtctg ggaaacgccc tgctgtggat 1380
aagcttgagg acttgttgga gggtggggat ggacctttgg accttagtac ccggaaactg 1440
ccaaggcaat gagtgccctg cagctgtgtt tatttagtga cgtcatgtaa taaaattatg 1500
tcagctgctg agtgttttat tgcttcttgg gtggggactt ggatatataa gtaggagcag 1560
atctgtgtgg ttagctcata gcaacctgct gccatccatg gaggtttggg ctatcttgga 1620
agacctgaga cagactaggc tactgctaga aaacgcctcg gacggagtct ctggcttttg 1680
gagattctgg ttcggtggcg atctagctag gctagtgttt aggataaaac aggactatag 1740
ggaagaattt gaaaagttat tggacgacag tccaggactt tttgaagctc ttaacttggg 1800
ccatcaggct cattttaagg agaaggtttt atcagtttta gatttttcta ctcctggtag 1860
aactgctgct gctgtagctt ttcttacttt tatattggat aaatggatcc gccaaaccca 1920
cttcagcaag ggatacgttt tggatttcat agcagcagct ttgtggagaa catggaaggc 1980
tcgcaggatg aggacaatct tagattactg gccagtgcag cctctgggag tagcagggat 2040
actgagacac ccaccggcca tgccagcggt tctggaggag gagcagcagg aggacaatcc 2100
gagagccggc ctggaccctc cggtggagga gtagctgact tgtttcctga actgcgacgg 2160
gtgcttacta ggtctacgtc cagtggacag gacaggggca ttaagaggga aaggaatcct 2220
agtgggaata attcaagaac cgagttggct ttaagtttaa tgagccgtag gcgtcctgaa 2280
actgtttggt ggcatgaggt tcagagcgaa ggcagggatg aagtttcaat attgcaggag 2340
aaatattcac tagaacaact taagacctgt tggttggaac ctgaggatga ttgggaggtg 2400
gccattagga attatgctaa gatatctctg aggcctgata aacagtatag aattactaag 2460
aagattaata ttagaaatgc atgctacata tcagggaatg gggcagaggt tataatagat 2520
acacaagata aagcagcttt tagatgttgt atgatgggta tgtggccagg ggttgtcggc 2580
atggaagcag taacatttat gaatattagg tttaaagggg atgggtataa tggcattgta 2640
tttatggcta acactaagct gattctacat ggttgtagct tttttgggtt taataatact 2700
tgtgtagaag cttgggggca agttagtgtg aggggttgta gtttttatgc atgctggatt 2760
gcaacatcag gtagggtcaa gagtcagttg tctgtgaaga aatgcatgtt tgagagatgt 2820
aatcttggca tactgaatga aggtgaagca agggtccgcc actgcgcagc tacagaaact 2880
ggctgcttca ttctaataaa gggaaatgcc agtgtgaagc ataatatgat ctgtggacat 2940
tcgaatgaga ggccttatca gatgctgacc tgcgctggtg gacattgcaa tattctggct 3000
accgtgcata tcgtttccca tgcacgcaag aaatggcctg tatttgaaca taatgtgatt 3060
accaagtgca ccatgcacat aggtggtcgc aggggaatgt ttatgcctta ccagtgtaac 3120
atgaatcatg tgaaggtgat gttggaacca gatgcctttt ccagagtaag cttaacagga 3180
atctttgata tgaatattca actatggaag atcctgagat atgatgacac taaaccgagg 3240
gtgcgcgcat gcgaatgcgg aggcaagcat gctagattcc agccggtgtg cgtggatgtg 3300
actgaagacc tgagacccga tcatttggtg cttgcctgca ctggagcgga gttcggttct 3360
agtggtgaag aaactgacta aagtgagtag tgggacgagc tgtggaggtg ggactttgag 3420
gttggtaagg tgggcagatt gggtaaattt tgttaatttc tgtcttgcag ctgccatgag 3480
tggaagcgct tcttttgagg ggggagtatt tagcccttat ctgacgggca ggctcccacc 3540
atgggcagga gttcgtcaga atgtcatggg atccactgtg gatgggagac ccgtccagcc 3600
cgccaattcc tcaacgctga cctatgccac tttgagttcg tcaccattgg atgcagctgc 3660
agccgccgcc gctactgctg ccgccaacac catccttgga atgggctatt acggaagcat 3720
cgttgccaat tccagttcct ctaataaccc ttcaaccctg gctgaggaca agctacttgt 3780
tctcttggct cagctcgagg ccttaaccca acgcttaggc gaactgtcta agcaggtggc 3840
ccagttgcgt gagcaaactc agtctgctgt tgccacagca aagtctaaat aaagatctta 3900
aatcaataaa taaagaaata cttgttataa aaacaaatga atgtttattt gatttttcgc 3960
gcgcggtatg ccctggacca tcggtctcga tcattgagaa ctcggtggat cttttccagt 4020
accctgtaaa ggtgggattg aatgtttaga tacatgggca ttagtccgtc ccgggggtgg 4080
agatagctcc attgaagagc ctcttgctcc ggggtagtgt tataaatcac ccagtcatag 4140
caaggtcgga gtgcatggtg ttgcacaata tcttttagga gcagactaat tgcaacgggg 4200
aggcccttag tgtaggtgtt tacaaatctg ttgagctggg acgggtgcat ccggggtgaa 4260
attatatgca ttttggactg gatcttgagg ttggcaatgt tgccgcctag atcccgtctg 4320
gggttcatat tgtgcagaac caccaagaca gtgtatccgg tgcacttggg aaatttatca 4380
tgcagcttag agggaaaagc atgaaaaaat ttggagacgc ctttgtgacc ccccagattc 4440
tccatgcact catccataat gatagcgatg gggccgtggg cagcggcacg ggcgaacacg 4500
ttccgggggt ctgaaacatc atagttatgc tcctgagtca ggtcatcata agccatttta 4560
ataaactttg ggcgaagggt gccagattgg gggatgaaag ttccctctgg cccgggagca 4620
tagtttccct cacatatttg catttcccag gctttcagtt cagagggggg gatcatatcc 4680
acctgcgggg ctataaaaaa tactgtttct ggagccgggg tgattaactg ggatgagagc 4740
aaattcctaa gcagctgaga cttgccgcac ccagtgggac cgtaaatgac cccaattacg 4800
ggttgcagat ggtagtttag ggagcgacag ctgccgtcct cccggagcag gggggccact 4860
tcgttcatca tttcccttac atggatattt tcccgcacca agtccgttag gaggcgctct 4920
cccccaaggg atagaagctc ctggagcgag gagaagtttt tcagcggctt cagcccgtca 4980
gccatgggca ttttggaaag agtctgttgc aagagctcga gccggtccca gagctcggtg 5040
atgtgctcta tggcatctcg atccagcaga cctcctcgtt tcgcgggttg ggacggctcc 5100
tggagtaggg aatcagacga tgggcgtcca gcgctgccag ggtccgatcc ttccatggtc 5160
gcagcgtccg agtcagggtt gtttccgtca cggtgaaggg gtgcgcgcct ggttgggcgc 5220
ttgcgagggt gcgcttcaga ctcatcctgc tggtcgagaa ccgctgccga tcggcgccct 5280
gcatgtcggc caggtagcag tttaccatga gttcgtagtt gagcgcctcg gccgcgtggc 5340
ctttggcacg gagcttacct ttggaagttt tatggcaggc ggggcagtag atacatttga 5400
gggcatacag cttgggcgcg aggaaaatgg attcggggga gtatgcatcc gcaccgcagg 5460
aggcgcagac ggtttcgcac tccacgagcc atgtcagatc cggctcatcg gggtcaaaaa 5520
caagttttcc gccatgtttt ttgatgcgtt tcttaccttt ggtttccatg agttcgtgtc 5580
cccgctgggt aacaaagagg ctgtccgtgt ccccgtagac tgactttatg ggcctgtcct 5640
cgagcggagt gccgcggtcc tcttcgtaga ggaacccagc ccactctgat acaaaagcgc 5700
gtgtccaggc cagcacaaag gaggccacgt gggaggggta gcggtcgttg tcaaccaggg 5760
ggtccacctt ctctacggta tgtaaacaca tgtccccctc ctccacatcc aagaatgtga 5820
ttggcttgta agtgtaggcc acgtgaccag gggtccccgc cgggggggta taaaaggggg 5880
cgggcctctg ttcgtcttca ctgtcttccg gatcgctgtc caggagcgcc agctgttggg 5940
gtaggtattc cctctcgaag gcgggcatga cctctgcact caggttgtca gtttctagga 6000
acgaggagga tttgatattg acagtaccag cagagatgcc tttcataaga ctctcgtcca 6060
tctggtcaga aaacacaatc ttcttgttgt ccagcttggt ggcaaatgat ccatagaggg 6120
cattggatag aagcttggcg atagagcgca tggtttggtt cttttccttg tccgcgcgct 6180
ccttggcggc gatgttaagc tggacgtact cgcgcgccac acatttccat tcagggaaga 6240
tggttgtcag ttcatccgga actattctga ctcgccatcc cctattgtgc agggttatca 6300
gatccacact ggtggctacc tcgcctcgga ggggctcatt ggtccagcag agtcgacctc 6360
cttttcttga acagaaaggg gggagggggt ctagcatgaa ctcatcaggg gggtccgcat 6420
ctatggtaaa tattcccggt agcaaatcct tgtcaaaata gctgatggtg gcgggatcat 6480
ccaaagtcat ctgccattct cgaactgcca gcgcgcgctc ataggggtta agaggggtgc 6540
cccagggcat ggggtgggtg agcgcggagg catacatgcc acagatatcg tagacataga 6600
ggggctcttc gaggatgccg atgtaagtgg gataacagcg cccccctctg atgcttgctc 6660
gcacatagtc atagagttca tgtgaggggg cgagaagacc cgggcccaga ttggtgcggt 6720
tgggtttttc cgccctgtaa acgatctggc gaaagatggc atgggaattg gaagagatag 6780
taggtctctg gaatatgtta aaatgggcat gagggaggcc tacagagtcc cttatgaagt 6840
gggcatatga ctcttgcagc ttggctacca gctcggcggt gacaagtacg tctagggcac 6900
agtagtcgag agtttcctgg atgatgtcat aacgcggttg gtttttcttt tcccacagct 6960
cgcggttgag aaggtattct tcgcgatcct tccagtactc ttcgagggga aacccgtctt 7020
tttctgcacg gtaagagccc aacatgtaga attgattgac tgccttgtag ggacagcatc 7080
ccttctccac tgggagagag tatgcttggg ctgcattgcg cagcgaggta tgagtgaggg 7140
caaaagtgtc cctgaccatg actttgagga attgatactt gaagtcgatg tcatcacagg 7200
ccccctgttc ccagagttgg aagtccaccc gcttcttgta ggcggggttg ggcaaagcga 7260
aagtaacatc attgaagagg atcttgccgg ccctgggcat aaaatttcgg gtgattctga 7320
aaggctgagg gacctctgct cggttattga taacctgagc ggccaagacg atctcatcaa 7380
agccattgat gttgtgcccc actatgtaca gttctaagaa tcgaggtgtg cccctgacat 7440
gaggcagctt cttgagttct tcaaaagtga ggtctgtagg gtcagtgaga gcatagtgtt 7500
cgagggccca ttcgtgcagg tgagggttcg ctttgaggaa ggaggaccag aggtccactg 7560
ccagtgctgt ttgtaactgg tcccggtact gacgaaaatg ctgcccgact gccatctttt 7620
ctggggtgac gcaatagaag gtttgggggt cctgctgcca gcgatcccac ttgagtttta 7680
tagccaggtc ataggcgatg ttgacgagcc gctggtctcc agagagtttc atgaccagca 7740
tgaaggggat tagctgcttg ccaaaggacc ccatccaggt gtaggtttcc acatcgtagg 7800
tgaggaagag cctttctgtg cgaggatgag agccaatcgg gaagaactgg atctcctgcc 7860
accagttgga ggaatggctg ttgatgtgat ggaagtagaa ctccctgcga cgcgccgagc 7920
attcatgctt gtgcttgtac agacggccgc agtactcgca tcgattcacg ggatgcacct 7980
catgaatgag ttgtacctga cttcctttga cgagaaattt cagtggaaaa ttgaggcctg 8040
gcgcttgtac ctcgcgctct actatgttgt ctgcatcggc atgaccatct tctgtctcga 8100
tggtggtcat gctgacgagc cctcgcggga ggcaagtcca gacctcggcg cggcaggggc 8160
ggagctcgag gacgagagcg cgcaggtcgg agctgtccag ggtcctgaga cgctgcggag 8220
tcaggttagt aggcagtgtc aggagattga cttgcatgat cttttcgagg gcgtgaggga 8280
ggttcagatg gtacttgatc tccacgggtc cgttggtgga gatgtcgatg gcttgcaggg 8340
ttccgtgccc cttgggcgct accaccgtgc ccttgttttt ccgtttgggc ggcggtggct 8400
ctgttgcttc ttgcatgttt agaagcggtg tcgagggcgc gcaccgggcg gcaggggcgg 8460
ctcgggaccc ggcggcatgg ccggcagtgg tacgtcggcg ccgcgcgcgg gtaggttctg 8520
gtactgcgcc ctgagaagac ttgcatgcgc gacgacgcgg cggttgacat cctggatctg 8580
acgcctctgg gtgaacgcta ccggccccgt gagcttgaac ctgaaagaga gttcaacaga 8640
atcaatctcg gtatcgttga cggcggcttg cctaaggatt tcttgcacgt cgccagagtt 8700
gtcctggtag gcgatctcgg ccatgaactg ctcgatctct tcctcttgaa gatctccgcg 8760
gcccgctctc tcgacggtgg ccgcaaggtc gttggagatg cgtccaatga gttgagagaa 8820
tgcattcatg cccgcctcgt tccagacgcg gctgtagacc acagccccct cgggatctct 8880
cgcgcgcatg accacctggg cgaggttgag ctccacgtgg cgggtgaaga ccgcatagtt 8940
gcataggcgc tggaaaaggt agttgagtgt ggtggcgatg tgctcggtga cgaagaaata 9000
catgatccat cgtctcagcg gcatctcgct aacatcgccc agcgcttcca agcgctccat 9060
ggcctcgtag aagtccacgg caaagttgaa aaactgggag ttacgcgcgg acacggtcaa 9120
ctcctcttcc agaagacgga tgagttcggc gatggtggtg cgcacctcgc gctcgaaagc 9180
ccccgggatt tcttcctcaa tttcttcttc ttccactaac atctcttcct cttcaggtgg 9240
ggctgcagga ggagggggaa cgcggcgacg ccggcggcgc acaggcagac ggtcgatgaa 9300
tctttcaatg acctctccgc ggcggcggcg catggtctcg gtgacggcac gaccgttctc 9360
cctgggtctc agagtgaaga cgcctccgcg catctccctg aagtggtgac tgggaggctc 9420
tccgttgggc agggacaccg cgctgattat gcattttatc aattgccccg taggtactcc 9480
gcgcaaggac ctgatcgtct caagatccac gggatctgaa aacctttcga cgaaagcgtc 9540
taaccagtcg caatcgcaag gtaggctgag cactgtttct tgcgggcggg ggcggctaga 9600
cgctcggtcg gggttctctc tttcttctcc ttcctcctct ttggagggtg agacgatgct 9660
gctggtgatg aaattaaaat aggcagtttt gagacggcgg atggtggcga ggagcaccag 9720
gtctttgggt ccggcttgtt ggatgcgcag gcgatgggcc attccccaag cattatcctg 9780
acatctggcc agatctttat agtagtcttg catgagtcgt tccacgggca cttcttcttc 9840
gcccgctctg ccatgcatgc gagtgatccc gaacccgcgc atgggctgga caagtgccag 9900
gtccgctaca accctttctg cgaggatggc ttgctgcacc tgggtgaggg tggcttggaa 9960
gtcgtcaaag tccacgaagc ggtggtaagc cccggtgttg attgtgtagg agcagttggc 10020
catgactgac cagttgactg tctggtgccc cggacgcaca atctcggtgt acttgaggcg 10080
cgagtaggcg cgggtgtcaa agatgtaatc gttacaggtg cgcaccaggt actggtagcc 10140
gatgagaaag tgaggcggcg gctggcggta taggggccat cgctctgtag ccggggcgcc 10200
aggggcgagg tcttccagca tgaggcggtg ataaccgtag atgtacctgg acatccaggt 10260
gataccggag gcggtggtgg atgcccgcgg gaactcgcgt acgcggttcc agatgttgcg 10320
cagcggcatg aagtagttca tggtaggcac ggtttggccc gtgagacgcg cacagtcgtt 10380
gatgctctag acatacgggc aaaaacgaaa gcggtcagcg gctcgtctcc gtggcctgga 10440
ggctaagcga acgggttggg ctgcgcgtgt accccggttc gaatctcgga tcaggctgga 10500
gccgcagcta acgtggtact ggcactcccg tctcgaccca ggcctgcaca aaacctccag 10560
gatacggagg cgggtcgttt tttttttgct ttttcctgga tgggagccag tgctgcgtca 10620
agctttagaa cactcagttc tcggggctgg gagtggctcg cgcccgtagt ctggagaatc 10680
aatcgccagg gttgcgttgc ggtgtgcccc ggttcgagtc ttagcgcgcc ggatcggccg 10740
gtttccgcga caagcgaggg tttggcagcc tcgtcatttc taagaccccg ccagccgact 10800
tctccagttt acgggagcga gccctctttt ttttgttttt tgttgcccag atgcatcccg 10860
tgctgcgaca gatgcgcccc cagcaacagc ccccttctca gcagcagcta caacaacagc 10920
cacaaaaggc tcttcctgct cctgtaacta ctgcggctgc agccgtcagc ggcgcgggac 10980
agcccgccta tgatctggac ttggaagagg gcgagggatt ggcgcgcctg ggggctccat 11040
cgcccgagcg gcacccgcgg gtgcaactaa aaaaggactc tcgcgaggcg tacgtgcccc 11100
aacagaacct attcagggac aggagcggcg aggagccaga ggagatgcga gcatctcgat 11160
ttaacgcggg tcgcgagctg cgccacggtc tggatcgaag acgggtgctg caagacgagg 11220
attttgaggt cgatgaagtg acagggatca gcccagctag ggcacatgtg gccgcggcca 11280
acctagtctc ggcctacgag cagaccgtga aggaggagcg caacttccaa aaatctttta 11340
acaaccatgt gcgcaccctg atcgcccgcg aggaagtgac cctgggtctg atgcacctgt 11400
gggacctgat ggaggctatc acccagaacc ccactagcaa acccctgaca gctcagctgt 11460
ttctggtggt tcaacatagc agggacaacg aggcattcag ggaggcgttg ttgaatatca 11520
ccgagcctga tgggagatgg ctgtatgatc tgattaacat cctgcaaagt attatagtgc 11580
aggaacgtag cctgggtttg gctgagaaag tggcagctat caactactcg gtcttgagcc 11640
tgggcaaata ctacgctcgc aagatctaca agacccccta cgtacccatt gacaaggagg 11700
tgaagataga tgggttttac atgcgcatga ctctcaaggt gttgacttta agcgacgatc 11760
tgggggtgta tcgcaatgac aggatgcacc gcgcggtgag cgccagcagg aggcgcgagc 11820
tgagcgacag agaacttatg cacagcttgc aaagggctct aacgggggcc ggaactgatg 11880
gggagaacta ctttgacatg ggagcggact tgcaatggca acccagtcgc agggccatgg 11940
aggctgcagg gtgtgagctt ccttacatag aagaggtgga tgaagtcgag gacgaggagg 12000
gcgagtactt ggaagactga tggcgcgacc cgtatttttg ctagatggaa caacagcagg 12060
caccggaccc cgcaatgcgg gcggcgctac agagccagcc gtccggcatt aactcctcgg 12120
acgattggac ccaggccatg caacgtataa tggcgctgac gacccgcaac cccgaagcct 12180
ttagacagca accccaggcc aaccgccttt cggccatact ggaggccgta gtgccctccc 12240
gctccaaccc cacccacgag aaggtcctgg ctatcgtgaa cgcgctggtg gagaacaagg 12300
ccatccgtcc cgatgaggcc gggctggtat acaatgctct tttggagcgc gtggcccgtt 12360
acaacagcag caacgtgcag accaacctgg accggatggt gaccgatgtg cgcgaggctg 12420
tgtctcagcg cgagcggttc cagcgcgacg ccaacttggg gtcattggta gcgctaaacg 12480
ctttccttag cacccagccc gccaacgtgc cccgtggtca gcaagactat acaaactttt 12540
tgagtgcatt gagactcatg gtatctgagg tgccccagag cgaggtgtac cagtccgggc 12600
cagattactt cttccagacc agcagacagg gcttgcagac agtgaacctg acccaggctt 12660
tcaagaacct gaagggtctg tggggagtgc acgccccagt aggagatcgc gcgaccgtgt 12720
ctagcttgct gactcccaac tcccgcctgc tgctgctgct ggtatccccc ttcactgaca 12780
gcggtagcat cgaccgcaac tcctacttgg gctacctgct taacctgtat cgcgaggcta 12840
taggacagag ccaggtggac gagcagacct atcaagaaat cacccaagtg agccgcgccc 12900
tgggtcagga agacacaggc ggtttggaag ccaccctgaa cttcttacta accaaccggt 12960
cgcagaagat ccctcctcag tatgcgctta ccgctgagga ggagcggatc ctaagatacg 13020
tgcaacagag cgttggactg tttttgatgc aggagggggc gacacctacc gccgcgctgg 13080
atatgacagc tcgaaacatg gagcccagca tgtatgctag taacaggcct ttcattaaca 13140
aactgctgga ctacctgcac agggcggccg ccatgaactc tgattatttc accaatgcta 13200
ttctgaaccc acactggctg cccccacctg gtttctacac tggcgaatac gacatgcccg 13260
atcccaatga cgggttccta tgggacgatg tggacagtag catattttcc ccgccgccag 13320
gttatacggt ttggaagaag gaagggggcg atagaaggca ctcttccgta tcgttgcccg 13380
gaacggctgg tgctgccgcg gccgtgcccg aagctgcgag tcctttccct agcttgtcct 13440
tttcactaaa cagcgttcgc agcagtgaac tggggagaat aaaccgcccg cgcttgatgg 13500
gcgaggatga gtacttgaat gactctttgc tgaggccaga gagggaaaag aacttcccta 13560
acaatggaat agagagcctg gtggataaga tgagtagatg gaagacctat gcgcaggatc 13620
acagagacga gcccaggatc ttgggggcta caagcagacc gagccgtaga cgccagcgcc 13680
acgacaggca gatgggtctt gtgtgggacg acgaggactc tgccgatgac agcagcgtgt 13740
tggacttggg tggaaaagga gttggcaacc cgttcgctca tctgcgtccc cgtttcggtc 13800
gcatgttgta aaagtgaaag taaaaataaa aaggcaactc accaaggcca tggcaaccga 13860
gcgtgcgttc gttctttttt ttgttatctg tatctagtac gatgaggaga cgagccgtgc 13920
taggcggagc ggtggtgtat ccggagggtc ctcctccttc ttacgagagc gtgatgcagc 13980
aacaggcggc gatgatacag cccccactgg aggctccctt cgtaccccct cggtacctgg 14040
cgcctacgga agggagaaat agcattcgtt actcggagct gtcaccccag tacgatacca 14100
ccaagttgta tctggtggac aacaagtcgg cggacatcgc ctccctgaac tatcagaacg 14160
accacagcaa cttcctgacc acagtggtgc agaacaatga ctttaccccc acggaggcta 14220
gcacccagac cattaacttt gacgagcggt cgcggtgggg cggtcagctg aagaccatta 14280
tgcacaccaa catgcccaac gtgaacgagt acatgttcag caacaagttt aaggcgaggg 14340
tgatggtatc taggaaggct cctgaaggtg ttacagtaaa tgatcataaa gatgatattt 14400
tgaaatatga gtggtttgag ttcactttac cagaaggtaa cttctcagct accatgacca 14460
tcgacctgat gaacaatgcc atcattgaca actacctgaa aattggcaga cagaatggag 14520
tgctggaaag tgacattggt gttaagtttg acactagaaa cttcaggctc gggtgggacc 14580
ccgaaactaa gttgattatg ccaggggtct acacttatga ggcattccat cctgacattg 14640
ttttgttgcc tggttgcggg gtagatttta ctgaaagccg acttagcaac ttgcttggca 14700
tcaggaagag acatccattc caggagggtt tcaaaatcat gtatgaagat cttgaagggg 14760
gtaatattcc tgcccttttg gatgtcactg cctatgagga aagcaaaaag gataccacta 14820
ctgaaacagg cgaaaaggcg gtggttaaaa caaccacagt ggctgttgca gaggaaacca 14880
gtgaagatga taatataact agaggagata cttatataac tgaaaaacaa aaacgtgaag 14940
ctgcagctgc agaactatta cttatgtctg aagttaaaaa agagttaaag atccaacctt 15000
tagaaaaaga cagcaagaat agaagctaca atgtcttgga agacaaaatc aacacagcct 15060
accgcagctg gtacctgtcc tacaattatg gtaaccctga gaaaggaata aggtcctgga 15120
cactgctcac cacttcggat gtcacctgtg gagccgagca ggtctactgg tcgctccccg 15180
acatgatgca agaccccatc accttccgct cctcgagaca agtcaacaac tacccagtag 15240
tgggtgcaga gcttatgccg gtcttctcaa agagtttcta caatgagcaa gccgtgtact 15300
ctcagcagct ccgacagtcc acctcgctca cgcacgtctt caaccgcttc cctgagaacc 15360
agatcctcat ccgcccgccg gcgcccacaa ttaccaccat cagtgaaaac gttcctgctc 15420
tcacagatca cgggaccctg ccgttacgca gcagtatccg gggagtccag cgcgtgaccg 15480
ttactgacgc cagacgtcgc acctgtccct acgtttacaa ggccctgggc atagtcgcgc 15540
cgcgcgttct ttcaagccgc actttctaaa aaaaaaaaaa aatgtccatt ctcatctcgc 15600
ccagtaataa taccggttgg ggactgcatg cgcccaccaa gatgtacgga ggcgcccgca 15660
aacgctctac ccagcacccc gtgcgcgttc gcggtcattt ccgcgctccc tggggcgccc 15720
tcaagggccg tacccgcact cggaccacgg tcgatgatgt gatcgaccag gtggttgccg 15780
atgctcgtaa ttatactcct actgcgccta catctactgt ggatgcagtt attgacagtg 15840
tagtggcaga cgctcgcgcc tatgctcgcc ggaagagccg aaggaggcgc atcgccaggc 15900
gccacagggc tactcccgct atgcgagctg caaaagctat tctgcggagg gccaaacgtg 15960
tgggacgaag agccatgctt agagcggcca gacgcgcggc ttctggtgct agcagcggca 16020
ggtcccgcag gcgcgcggcc acggcggcag cagcggccat tgccaacatg gcccaaccgc 16080
gaagaggcaa tgtgtattgg gtgcgcgatg ccactaccgg ccagcgcgtg cccgtgcgca 16140
cccgcccccc tcgcacttag aagatactga gcagtctccg atgttgtgtc ccagcggcaa 16200
gtatgtccaa gcgcaaatac aaggaagaga tgctccaggt catcgcgcct gaaatctacg 16260
gtccgccgat gaaggatgaa aaaaagcccc gcaaaatcaa gcgggttaaa aaggacaaaa 16320
aagaagaaga tggcgatgat ggactggtgg agtttgtgcg cgagttcgcg ccaagacggc 16380
gcgtgcagtg gcgcggtcga aaagtacgcc aagtgcttag acccgggacc actgtggtct 16440
ttacacctgg cgagcgttcc agcactactt ttaaacggtc ctatgatgag gtgtatgggg 16500
atgacgatat tattgagcag gcggcagacc gccttggcga gtttgcttat ggcaagcgca 16560
caagatccag tcccaaagag gaggcggtat ctattccctt ggatcatgga aatcccaccc 16620
ctagcctcaa accagtcacc ctgcagcaag tgctgcccgt acctgcgagc agaggcgtaa 16680
agcgcgaggg tgaggaccta tatcccacca tgcagctaat ggtgcccaag cggcagagat 16740
tagaagacgt actggagaaa atgaaagtgg atgccgatat ccagcctgag gtgaaagtga 16800
gacccatcaa ggaagtggcg ccaggtttgg gagtacaaac ctttgacatc aagattccca 16860
ctgagtccat ggaagtgcag accgaacctg caaaacccac agtcacctca attgaggttc 16920
agacggaacc ctggatgccc gcgcccgttg ccgcccccag caccactaga agatcacgtc 16980
gaaagtatgg cccagcaagt ctgctaatgc ccaactatgc tctgcaccca tccatcattc 17040
ccactccggg ttacagaggc actcgctact atcgaagtcg gagcaacacc tcacgccgcc 17100
gcaaactacc tgcaagtcgc actcgccgtc gccgccgccg caccactgcc agcaaattaa 17160
ctcccgccgc cctggtgcgg agagtgtacc gcgatggtcg cgctgaacct ctgacgctgc 17220
cgcgcgcgcg ctatcatcca agcatcacca cttaatgact gttgacgctg cctccttgca 17280
gatatggctc tcacttgccg ccttcgcgtc cccattactg gctaccgagg aagaaactcg 17340
cgccgtagaa ggatgttggg gcgagggatg cgccgccaca gacgaaggcg cgctatcagc 17400
aagcgattag ggggtggctt tctgccagct cttataccca tcatcgccgc ggcgatcggg 17460
gcgataccag gcatagcttc cgtggcggtt caggcctcgc agcgccacta acaatggaaa 17520
aatttataaa taaaaaatag aatggactct gacgctcctg gtcctgtgac tatgtttttg 17580
tagagatgga agacatcaat ttttcatccc tggctccgcg acacggcacg aggccgtaca 17640
tgggcacctg gagcgacatc ggcacgagcc aactgaacgg gggcgccttc aattggagca 17700
gtatctggag cgggcttaaa aattttggct cgaccataaa aacctatggg aacaaagctt 17760
ggaacagcag cacagggcag gcccttagaa ataagcttaa ggagcagaac ttccaacaaa 17820
aggtggtcga tggtatcgcc tctggtatta acggcgtagt ggatctagcc aaccaggctg 17880
tgcagaaaca gataaacagc cgcctggacc cgccgcccgc aactcctggt gaaatggaag 17940
tggaggaaga gcttcctccg ctggagaagc ggggcgacaa gcgaccgcgt cccgagctgg 18000
aacagacgtt ggtgacgcgc gcagacgagc ccccttcata cgaggaggca gtaaagctcg 18060
gaatgcccac taccaggcct gtagctcaca tggctaccgg ggtgatgaaa ccttctcagt 18120
cgcatcggcc tgccaccttg gacttgcctc ctccccctgc ttctgcggcg cctattccca 18180
aacctgtcgc taccagaaag cccaccgccg tacagcccgt cgccgtagcc agaccgcgtc 18240
ctggggcaca ccgcgcccga aagcaaactg gcagagtact ctgaacagca tcgtgggtct 18300
gggcgtgcag agtgtaaagc gccgtcgctg ctattaatta aatatggagt agcgcttaac 18360
ttgcttgtct gtgtgtatgt atcatcacca tgccgccgca gcagaggaga aaggaagagg 18420
tcgcgcgccg aggctgagtt gctttcaaga tggccacccc atcgatgatg ccccaatggg 18480
catacatgca catcgccgga caggatgctt cggagtacct gagtccgggt ctggtgcagt 18540
tcgcccgtgc aacagacacc tacttcagta tggggaacaa gtttagaaac cccacagtgg 18600
cgcccaccca cgatgtgacc accgaccgta gccagcgact aatgctgcgc ttcgtgcccg 18660
ttgaccggga agacaatacc tactcttaca aagttcgcta cacgctggct gtaggggaca 18720
acagagtact ggatatggcc agcacgttct ttgacatccg cggcgtgctg gaccggggcc 18780
ctagcttcaa accctactcc gggaccgcct acaacagcct ggctcccaag ggagcgccca 18840
acacctgcca gtggaaggat tctgacagca aaatgcatac ctttggggta gctgccatgc 18900
ccggtgttac tgggaaaaag atagaagctg atgggctgcc tattggaata gattcaactt 18960
ctggaactga cacagtaatt tatgctgata aaactttcca accagaacca caagttggaa 19020
atgccagttg ggttgacgcc aatggtacag aggaaaaata tggaggcaga gctctgaagg 19080
acactacaaa gatgaaaccc tgctatggtt ctttcgccaa gcctaccaac aaagaaggtg 19140
gtcaggctaa cttaaaagat tcagaaaccg ccgccaccac tcctaactat gatatagatc 19200
tggctttctt tgacaacaaa aatattgctg ctaactacga tccagatatt gtaatgtaca 19260
cagaaaatgt tgacttgcag actccagata ctcatattgt atacaaacct ggaacagagg 19320
acaccagctc tgaatccaat ttgggtcagc aagccatgcc taacagaccc aactacattg 19380
gcttcagaga caattttatt gggctcatgt actacaacag cactggcaat atgggggtgc 19440
tggccggtca ggcctctcag ctgaatgctg tggttgactt gcaagacaga aacactgaac 19500
tgtcctacca gctcttgctt gactctctgg gtgacagaac ccggtatttc agtatgtgga 19560
atcaggcggt ggacagctat gatcctgatg tgcgtattat tgaaaaccat ggtgtggagg 19620
acgaattgcc aaactattgc tttccgttga atggtgtggg atttacagac acttaccaag 19680
gtgttaaagt taaaacagat gcagttgctg gaaccagtgg aacacagtgg gacaaagatg 19740
acaccacagt tagtactgct aatgaaatcc atggaggcaa tccttttgcc atggaaatca 19800
acatccaagc caatctatgg cgaagtttcc tttattccaa tgtggctttg tatctcccag 19860
actcgtataa atacaccccg tccaatgtca ctctcccaga aaacaaaaac acctacgact 19920
acatgaacgg gcgggtggtg ccgccatctc tagtagacac ctatgtgaac attggtgcca 19980
ggtggtctct ggatgccatg gacaatgtca acccattcaa ccaccaccgt aacgctggct 20040
tgcgttaccg atccatgctt ctgggtaacg gacgttatgt gcctttccac atacaagtgc 20100
ctcaaaaatt cttcgctgtt aaaaacctgc tgcttctccc aggctcctac acttatgagt 20160
ggaactttag gaaggatgta aacatggttc tacagagttc ccttggtaac gacctacggg 20220
tagatggcgc cagcatcagt ttcacgagca tcaatcttta tgctactttt ttccccatgg 20280
ctcacaacac cgcttccacc cttgaagcca tgctgcggaa tgacaccaat gatcagtcat 20340
tcaacgacta cctatctgca gctaacatgc tctaccccat acctgccaac gcaaccaata 20400
ttcccatttc cattccttct cgcaactggg cggctttcag aggctggtca tttaccagac 20460
tgaaaaccaa agaaactccc tctttggggt ctggatttga cccatacttt gtctattccg 20520
gttctattcc ctacctggat ggtaccttct atctaaatca cacttttaag aaggtttcca 20580
tcatgtttga ctcttcagtg agctggcctg gaaatgacag gttactatct cctaacgaat 20640
ttgaaataaa gcgcactgtg gatggcgaag gctacaacgt agcccaatgc aacatgacca 20700
aagactggtt cttggtacag atgctcgcca actacaacat tggctaccag ggcttttaca 20760
tccctgaggg atacaaggat cgcatgtact cctttttcag aaacttccag cctatgagca 20820
ggcaggtggt tgatgaggtt aattacactg actacaaagc cgtcacctta ccatatcaac 20880
acaacaactc tggctttgta ggataccttg cgcctactat gagacaaggg gaaccttacc 20940
cagccaatta tccatacccg ctcatcggaa ctactgccgt taagagtgtt acccaaaaaa 21000
agttcctgtg cgacaggacc atgtggcgca taccgttctc cagcaacttc atgtccatgg 21060
gggcccttac agacctggga caaaacctgc tctatgccaa ctcggcccat gcactggaca 21120
tgacttttga ggtggatccc atggatgagc ccaccctgct ttatcttctt ttcgaagtct 21180
tcgacgtggt cagagtgcac cagccacacc gcggcgtcat cgaggccgtc tacctgcgca 21240
caccgttctc ggccggcaac gccaccacat aagaagcctc ttgcttcttg caagcagcag 21300
ctgcagccat gtcatgcggg tccggaaacg gctccagcga gcaagagctc aaagccatcg 21360
tccgagacct gggttgcggt ccctatttcc tgggaacctt tgacaagcgt ttcccggggt 21420
tcatggcccc cgacaagctc gcctgcgcca tagtcaacac tgccggacgc gagacggggg 21480
gagagcactg gctggctttt ggttggaacc cgcgctccaa cacctgctac ctttttgatc 21540
cttttgggtt ctcggatgag cgactcaaac agatttacca gtttgagtac gaggggctcc 21600
tgcgccgcag tgcccttgct accaaagacc gctgcatcac cctggaaaag tccacccaga 21660
gcgtgcaggg cccacgctca gccgcctgtg gacttttttg ctgtatgttc cttcatgcct 21720
ttgtgcactg gcccgaccgt cccatgaacg gaaaccccac catgaagttg ctgactgggg 21780
tgcccaacag catgctccaa tctccccaag tccagcccac cctgcgccgc aaccaggagg 21840
cactataccg cttcctaaac acccactcat cttactttcg ttctcaccgc gcacgcatcg 21900
aaagggccac cgcgtttgac cgtatggata tgcaataagt catgtaaaac cgtgttcaat 21960
aaaaagcact ttatttttac atgcactaag gctctggttt tttgctcatt cgttttcatc 22020
attcactcag aaatcaaatg ggttctggcg ggagtcatag tggcccgcgg gcagggatac 22080
gttgcggaac tgtaacctgt tctgccactt gaactcgggg atcaccagct tgggaactgg 22140
aatctcggga aaggtgtctt gccacaactt tctggtcagt tgcagggcgc caagcaggtc 22200
aggagcagag atcttgaaat cacagttggg gccggcattc tggacacggg agttgcggta 22260
cactgggttg caacactgga acaccatcaa ggctgggtgt ctcacgcttg ccagcacggt 22320
cgggtcactg atggtagtca catccaagtc ttcagcattg gccatcccaa agggggtcat 22380
cttacaggtc tgcctgccca tcacgggagc gcagcctggc ttgtggttgc aatcgcaatg 22440
aatgggaatc agcatcatcc tggcttggtc gggggttatc cctggatata cggccttcat 22500
gaaggcttcg tactgcttga aagcttcctg agccttactt ccctcggtgt agaacattcc 22560
acaggacttg ctggaaaatt ggttagtagc acagttggca tcatttacac agcagcgggc 22620
atcgttgttg gccaactgaa ccacatttct gccccagcgg ttctgggtga tcttggctct 22680
gtctgggttc tccttcatag cgcgctgccc gttctcgctc gccacatcca tctcgataat 22740
gtggtccttc tggatcatga tagtgccatg caggcatttc accttgcctt cgtaatcggt 22800
gcatccatga gcccacagag cgcacccggt gcactcccaa ttattgtggg cgatctcaga 22860
ataagaatgc accaatccct gcatgaatct tcccatcatc gctgtcaggg tcttcatgct 22920
actaaatgtc agcggaatgc cacggtgctc ctcgttcaca tactggtggc agatacgctt 22980
gtactgctcg tgctgctctg gcatcagctt gaaagaggtt ctcaggtcat tatccagcct 23040
atacctctcc attagcacag ccatcacttc catgcccttc tcccaggcag ataccagggg 23100
caagctcaaa ggattcctaa cagcaataga agtagctcct ttagctatag ggtcattctt 23160
gtcgatcttc tcaacacttc tcttgccatc cttctcaatg atgcgcaccg gggggtagct 23220
gaagcccacg gccaccaact gagcctgttc tctttcttct tcgctgtcct ggctgatgtc 23280
ttgcagaggg acatgcttgg tcttcctggg cttcttcttg ggagggatcg ggggaggact 23340
gttgctccgt tccggagaca gggatgaccg cgaagtttcg cttaccagta ccacctggct 23400
ctcgatagaa gaatcggacc ccacgcgacg gtaggtgttc ctcttcgggg gcagaggtgg 23460
aggcgactga gatgggctgc ggtctggcct tggaggcgga tggctggcag agcccattcc 23520
gcgttcgggg gtgtgctccc gttggcggtc gcttgactga tttcctccgc ggctggccat 23580
tgtgttctcc taggcagaga aacaacagac atggaaactc agccatcact gccaacatcg 23640
ctgcaagcgc catcacacct cgcccccagc agcgacgagg aggagagctt aaccacccca 23700
ccacccagtc ccgctaccac cacctctacc ctcgatgatg aggaggaggt cgacgcagcc 23760
caggagatgc aggcgcagga taatgtgaaa gcggaagaga ttgaggcaga tgtcgagcag 23820
gacccgggct atgtgacacc ggcggagcac gaggaggagc tgaaacgttt tctagacaga 23880
gaggatgacg accgcccaga gcatcaagca gatggcgatc accaggaggc tggcctcggg 23940
gatcatgttg ccgactacct ctccgggcgt gggggggagg acgtgctcct caaacatcta 24000
gcaaggcagt cgctcatagt taaagacgca ctactcaacc tcaccgaagt gcccatcagt 24060
gtggaagagc ttagccgcgc ctacgagctg aacctctttt cgcctcagat accccccaag 24120
cggcagccaa acggcacctg cgaggccaac cctcgactca acttctatcc agcttttact 24180
gtccccgaag tgctggccac ctaccacatc ttttttaaga accaaaagat tccagtctcc 24240
tgccgcgcca accgcacccg cgcagatgcc cttctcaact tgggtccggg agctcgctta 24300
cctgatatag cttccttgga agaggttcca aagatctttg agggtctggg aagtgatgag 24360
actcgggccg caaatgctct gcaacaggga gagaatggca tggatgaaca tcacagcgct 24420
ctagtggaac tggagggtga caatgcccgg cttgcagtgc tcaagcgcag tatcgtggtc 24480
acccattttg cctaccccgc tgttaacctg ccgcccaaag tcatgagcgc tgtcatggac 24540
catctgctca tcaaacgagc aagtccactt tcagaaaacc agaacatgca ggatccagac 24600
gcctcggacg agggcaagcc ggtagtcagt gacgagcagc tatctcgctg gctgggtacc 24660
aactcccccc gagatttgga agaaagacgc aagcttatga tggctgtagt gctagtaact 24720
gttgagttgg agtgtctgcg ccgctttttt accgaccccg agaccctgcg caagctagag 24780
gagaacctgc actacacctt cagacatggc ttcgtgcggc aggcatgcaa gatctccaac 24840
gtggagctca ccaacctggt ttcatacatg ggcattttgc atgagaaccg gctagggcag 24900
agcgttctgc acaccaccct gaagggggag gcccgccgcg actacatccg agactgtgtc 24960
tacctctacc tctgccatac ctggcagact ggtatgggtg tgtggcaaca gtgtttggaa 25020
gagcagaacc ttaaagagct ggacaagctc ttgcagagat ccctcaaagc cctgtggaca 25080
ggttttgacg agcgcaccgt cgcctcggac ttggcggaca tcatcttccc cgagcgtctt 25140
acggttactc tgcgaaacgg cctgccagac ttcatgagcc agagcatgct taacaacttt 25200
cgctctttca tcctggaacg ctccggtatc ctgcctgcca cctgctgtgc gctgccctcc 25260
gactttgtgc ctctcaccta ccgcgagtgc ccaccgccgc tatggagcca ctgctaccta 25320
ttccgcctgg ccaactacct ctcctaccac tcggatgtga tagaggatgt gagcggagac 25380
ggcctgctgg aatgccactg ccgatgcaat ttatgcacac cccaccgctc cctcgcctgc 25440
aacccccagt tgctaagcga gacccagatc atcggcacct tcgagttgca gggtcccaac 25500
agtgaaggcg aggggtcttc tccggggcag agtctgaaac tgacaccggg gctgtggacc 25560
tccgcctacc tgcgcaagtt tcatcccgag gactatcatc cctatgagat caggttctat 25620
gaggaccagt cacatcctcc caaagtcgag ctctcagcct gcgtcatcac ccagggggca 25680
attctggccc aattgcaagc catccaaaaa tcccgccaag aatttctgct gaaaaaggga 25740
agcggggtct accttgaccc ccagaccggt gaggagctca acacaaggtt cccccaggat 25800
gtcccatcgc cgaggaagca agaagctgaa ggtgcagctg tcacccccag aggatatgga 25860
ggaagactgg gacagtcagg cagaggagga gatggaagat tgggacagcc aggcagagga 25920
ggtggacagc ctggaggaag acagtttgga ggaggaagac gaggaggcag aggaggtgga 25980
agaagcaacc gccgccaaac agttgtcatc ggcggcggag acaagcaagt ccccagacag 26040
cagcacggct accatctccg ctccgggtcg gggggcccag cggcggccca acagtagatg 26100
ggacgagacc gggcgattcc caaacccgac caccgcttcc aagaccggta agaaggagcg 26160
acagggatac aagtcctggc gtggacataa aaacgctatc atctcctgct tgcatgaatg 26220
cgggggcaac atatccttca cccggcgata cctgcttttc caccacggtg tgaacttccc 26280
ccgcaatatc ttgcattact accgtcacct ccacagcccc tactgcagtc agcaagtccc 26340
ggcaaccccg acagaaaaag acagcagcga caacggtgac cagaaaacca gcagttagaa 26400
aatccacaac aagtgcagca ggaggaggac tgaggatcac agcgaacgag ccagcgcaga 26460
ccagagagct gaggaaccgg atctttccaa ccctctatgc catcttccag cagagtcggg 26520
ggcaagagca ggaattaaaa gtaaaaaacc gatctctgcg ctcgctcacc agaagttgtt 26580
tgtatcacaa gagcgaagac caacttcagc gcactctcga ggacgccgag gctctcttca 26640
acaagtactg cgcgctgact cttaaagagt agcccttgcc cgcgctcatt cgaaaacggc 26700
gggaatcacg tcacccttgg cagctgtcct ttgccctcgt catgagtaaa gagattccca 26760
cgccttacat gtggagctat cagccccaaa tggggttggc agcaggtgct tcccaggact 26820
actccacccg catgaattgg cttagcgccg ggccctcaat gatatcacgg gttaatgata 26880
tacgagctta tcgaaaccag ttactcctag aacagtcagc tctcaccacc acaccccgcc 26940
aacaccttaa tccccgaaat tggcccgccg ccctggtgta ccaggaaaat cccgctccca 27000
ccaccgtact acttcctcga gacgcccagg ccgaagttca gatgactaac gcaggtgtac 27060
agctggcggg cggttccgcc ctatgtcgtc accgacctca acagagtata aaacgcctgg 27120
tgatcagagg ccgaggtatc cagctcaacg acgagtcggt tagctcttcg cttggtctgc 27180
gaccagacgg agtcttccag atcgccggct gtgggagatc ttccttcact cctcgtcagg 27240
ctgtgctgac tttggagagt tcgtcctcgc agccccgctc gggcggcatc ggaactctcc 27300
agtttgtgga ggagtttact ccctctgtct acttcaaccc cttctccggc tctcctggcc 27360
agtacccgga cgagttcata ccgaacttcg acgcaatcag cgagtcagtg gatggctatg 27420
attgatgtct aatggtggcg cggctgagct agctcgactg cgacacctag accactgccg 27480
ccgctttcgc tgtttcgccc gggaactcac cgagttcatc tacttcgaac tctccgagga 27540
gcaccctcag ggtccggccc acggagtgcg gattaccatc gaagggggaa tagactctcg 27600
cctgcatcgc atcttctccc agcggcccgt gctgattgag cgcgaccagg gaaatacaac 27660
catctccatc tactgcattt gtaaccaccc cggattgcat gaaagccttt gctgtcttgt 27720
ttgtgctgag tttaataaaa actgagttaa gaccctccta cggactaccg cttcttcaat 27780
caggacttta caacaccaac cagatcttcc agaagaccca gacccttcct cctctgatcc 27840
aggactctaa ctctacctta ccagcaccct ccactactaa ccttcccgaa actaacaagc 27900
ttggatctca tctgcaacac cgcctttcac gaagccttct ttctgccaat actaccactc 27960
ccaaaaccgg aggtgagctc cgcggtcttc ctactgacga cccctgggtg gtagcgggtt 28020
ttgtaacgtt aggagtagtt gcgggtgggc ttgtgctaat cctttgctac ctatacacac 28080
cttgctgtgc atatttagtc atattgtgct gttggtttaa gaaatggggg ccatactagt 28140
cgtgcttgct ttactttcgc ttttgggtct gggctctgct aatctcaatc ctcttgatca 28200
cgatccatgt ctagacttcg acccagaaaa ctgcacactt acttttgcac ccgacacaag 28260
ccgtctctgt ggagttctta ttaagtgcgg atgggactgc aggtccgttg aaattacaca 28320
taataacaaa acatggaaca ataccttatc caccacatgg gagccaggag ttcccgagtg 28380
gtatactgtc tctgtccgag gtcctgacgg ttccattcgc attagtaaca acactttcat 28440
tttttctgaa atgtgcgatc tggccatgtt tatgagcaaa cagtatgacc tatggcctcc 28500
tagcaaagag aacattgtgg cattttccat tgcttattgc ttggtaacat gcatcatcac 28560
tgctatcatt tgtgtgtgca tacacttgct tatagttatt cgccctagac aaagcaatga 28620
ggaaaaagag aaaatgcctt aacctttttc ctcatacctt ttctttacag catggcttct 28680
gttacagctc taattattgc cagcattgtc actgtcgctc acgggcaaac aattgtccat 28740
attaccttag gacataatca cactcttgta gggcccccaa ttacttcaga ggttatttgg 28800
accaaacttg gaagtgttga ttattttgat ataatttgca acaaaactaa accaatattt 28860
gtaatctgca acagacaaaa tctcacgtta attaatgtca gcaaaattta taacggttac 28920
tattatggtt atgatagatc cagtagtcaa tataaaaatt acttagttcg cataactcaa 28980
cccaaatcaa cagtgccaac tatgacaata attaaaatgg ctaataaagc attagaaaat 29040
tttacattac caacaacgcc caatgaaaaa aacattccaa attcaatgat tgcaattatt 29100
gcggcggtgg cattgggaat ggcactaata ataatatgca tgttcctata tgcttgttgc 29160
tataaaaagt ttaaacataa acaggatcca ctactaaatt ttaacattta attttttata 29220
cagatgattt ccactacaat ttttatcatt actagccttg cagctgtaac ttatggccgt 29280
tcacacctaa ctgtacctgt tggctcaaca tgtacactac aaggacccca agaaggccat 29340
gtcacttggt ggagaatata tgataatgga gggttcgcta gaccatgtga tcagcctggt 29400
acaaaatttt catgcaacgg aagagacttg accattatta acataacatt aaatgagcaa 29460
ggcttctatt atggaaccaa ctataaaaat agtttagatt acaacattat tgtagtgcca 29520
gccaccactt ctgctccccg caaatccact ttctctagca gcagtgccaa agcaagcaca 29580
attcctaaaa cagcttctgc tatgttaaag cttcgaaaaa tcgctttaag taattccaca 29640
gccgctccca atacaattcc taaatcaaca attggcatca ttactgccgt ggtagtggga 29700
ttaataatta tatttttgtg cataatgtac tacgcctgct gctatagaaa acatgaacaa 29760
aaaggtgatg cattactaaa ttttgatatt taatttttta tagaattatg atattgtttc 29820
aatcaaatac cactaacact atcaatgtgc agactacttt aaatcatgac atggaaaacc 29880
acactacctc ctatgcatac acaaacattc agcctaaata cgctatgcaa ctaagaaatc 29940
accatactaa ttgtaattgg aattcttata ctatctgtta ttctttattt tatattctgc 30000
cgtcaaatac ccaatgttca tagaaattct aaaagacgac ccatctattc tcctatgatt 30060
agtcgtcccc atatggctct gaatgaaatc taagatcttt ttttttctct tacagtatgg 30120
tgaacatcaa tcatgattcc tagaaatttc ttcttcacca tactcatctg tgctttcaat 30180
gtctgtgcta ctttcacagc agtagccact gcaagcccag actgtatagg accatttgct 30240
tcctatgcac tttttgcctt cgttacttgc atctgcgtgt gtagcatagt ctgcctggtt 30300
attaattttt tccaactggt agactggatc tttgtgcgaa ttgcctacct acgtcaccat 30360
cccgaatacc gcaatcaaaa tgttgcggca ctttttaggc ttatttaaaa ccatgcaggc 30420
tatgctgcca gtcattttaa ttctgctcct accctgcatt gccctagctt ccaccgccac 30480
tcgcgctaca cctgaacaac ttagaaaatg caaatttcaa caaccatggt catttcttga 30540
ttgctaccat gaaaaatctg attttcccac atactggata gtgattgttg gaataattaa 30600
catactttca tgtacctttt tctcaatcac aatatacccc acatttaatt ttgggtggaa 30660
ttctcccaat gcactgggtt acccacaaga accacatgaa catatcccac tacaacacat 30720
acaacaacca ctagcactgg tagagtatga aaatgagcca caaccttcac tgcctcctgc 30780
cattagttac ttcaacctaa ccggcggaga tgactgaaat actcaccacc tccaattccg 30840
ccgaggatct gcttgatatg gacggccgcg cctcagaaca gcgactcgcc caactacgca 30900
tacgccagca gcaggaacgt gccgccaagg agctcaggga tgctattgaa attcaccaat 30960
gcaaaaaagg catattttgt ttggtaaaac aagccaagat atcctacgag attaccaata 31020
ctgaccatcg cctctcatac gagctcggac cgcagcgaca aaaattcact tgtatggtgg 31080
gaatcaaccc cataatcatc acccagcaag ctggagatac caagggttgc atccactgtt 31140
cctgcagttc cgccgagtgc atctacaccc tgctgaagac cctctgcggc cttcgagacc 31200
tcctacccat gaactaatca acccagcccc tcacttacca attacataaa gccaattaat 31260
aaaaacactt acttgaaatc agaaataagg tttctgtcta cgttgtttcc aagcagcacc 31320
tcacttcctt cttcccaact ctggtactct aagcctcggc gggtggcata cttcctccac 31380
actttgaaag ggatgtcaaa ttttagttcc tcttctttgc ccacaatctt catttcttta 31440
tccccagatg gccaaacgag ctcggctaag cagctccttc aatccggtct acccctatga 31500
agatgaaagc agctcacaac acccctttat aaaccctggt ttcatttcct caaatggttt 31560
tgcacaaagc ccagatggag ttctaactct taaatgtgtt aatccactca ctaccgccag 31620
cggacccctc caacttaaag ttggaagcag tcttacagta gatactatcg atgggtcttt 31680
ggaggaaaat ataactgccg cagcgccact cactaaaact aaccactcca taggtttatt 31740
aataggatct ggcttgcaaa caaaggatga taaactttgt ttatcgctgg gagatgggtt 31800
ggtaacaaag gatgataaac tatgtttatc gctgggagat gggttaataa caaaaaatga 31860
tgtactatgt gccaaactag gacatggcct tgtgtttgac tcttccaatg ctatcaccat 31920
agaaaacaac accttgtgga caggcgcaaa accaagcgcc aactgtgtaa ttaaagaggg 31980
agaagattcc ccagactgta agctcacttt agttctagtg aagaatggag gactgataaa 32040
tggatacata acattaatgg gagcctcaga atatactaac accttgttta aaaacaatca 32100
agttacaatc gatgtaaacc tcgcatttga taatactggc caaattatta cttacctatc 32160
atcccttaaa agtaacctga actttaaaga caaccaaaac atggctactg gaaccataac 32220
cagtgccaaa ggcttcatgc ccagcaccac cgcctatcca tttataacat acgccactga 32280
gaccctaaat gaagattaca tttatggaga gtgttactac aaatctacca atggaactct 32340
ctttccacta aaagttactg tcacactaaa cagacgtatg ttagcttctg gaatggccta 32400
tgctatgaat ttttcatggt ctctaaatgc agaggaagcc ccggaaacta ccgaagtcac 32460
tctcattacc tcccccttct ttttttctta tatcagagaa gatgactgac aacaaaaaaa 32520
ataaagatca acttttttat tgaaaatcag tttacaagat tcgagtagtt attttgcccc 32580
cctcttccca ttttatagaa tacacaattc tctccccacg cacagctttg aacatttgaa 32640
ttccattaga gatagacata gttttagatt ccacattcca cacagtttca gagcgggcca 32700
atcttggatc agtgatagat ataaatccat cggaacagtc tttcaaggtg gtttcacagt 32760
ccaactgctg cggctgcggc tccggggttt ggattagggt catctggaag aagaacgatg 32820
ggagtcataa tccgagaacg ggatcgggcg gttgtgtctt aaacctcgaa gcaatcgctg 32880
tctgcgccgc tccgtgcgac tgctgctgat gggatcagga tccacagtct ctcgaagcat 32940
aattttaata gccctcaaca ttaacatcct ggtgcgatgg gcacaacaac gcattctaat 33000
ttcgcttagc tcactgcagt aggtacaaca cattaccaca atgttgttta acaggccata 33060
attaaaggtg ctccagccaa aactcatctc agggataatc atacccgcgt gaccatcgta 33120
ccaaatctta atgtaaatta gatgacgccc cctccagaac acactgccca catacataat 33180
ttccttgggc atatgcatgt tcacaatttc tctgtaccat ggacagcgct ggttaatcat 33240
acagccccta ataaccttcc ggaaccacat agctagcact gctcccccag caatacattg 33300
aagagaaccc ggctgtttac agtgacaatg gagaacccac ttctctcgcc catggatcac 33360
ttgagaatta aatatatcta tagtggcaca acacaaacat aaatgcatgc atcttttcat 33420
aaccctcaac tcttcggggg ttaaaaacat atcccaggga ataggaagct cttgcaaaac 33480
agtaaagctg gcagaacaag gaagaccacg aacacaactt acactatgca tagtcatagt 33540
atcacaatct ggcaacagcg ggtggtcttc agtcatagaa gctcgggttt cattttcctc 33600
acatcgtggt aactgggctc tggtgtaagg gtgatgtctg gcgcatgatg tcgagcgtgc 33660
gcgcaacctt gtcataatgg agttgcttcc tgacattctc gtattttgta tagcaaaatg 33720
cggccctggc acaacacact tttcttcgtc ttctatcctg ccgcttagtg tgttccgtct 33780
gataattcaa gtacagccac actcttaagt tggtcaaaag aatgctggct tcagttgtaa 33840
tcaaaactcc atcatattta attgttctaa ggaaatcatc cacggtagca tatgcaaatc 33900
ccaaccaagc aatgcaactg gattgcgttt caagcagcag aggagaggga agagacggaa 33960
gaatcatgtt aatttttatt ccaaacgatc tcgcagtact tcaaattgta gatcgcgcag 34020
atggcatcta tcgcccccac tgtgttggtg aaaaagcaca gctaaatcaa aagaaatgcg 34080
attttcaagg tgctcaacgg tggcttccaa caaagcctcc acgcgcacat ccaaaaacaa 34140
aagaatacca aaagaaggag cattttctaa ctcctcaaac atcatattac attcctgcac 34200
cattcccaga taattttcag ctttccagcc ttgaattatt cgtgtcagtt cttgtggtaa 34260
atccaaacca cacattacaa acaggtcccg gagggcgccc tccaccacca ttcttaaaca 34320
caccctcata atgacaaaat atcttgctcc tgtgtcacct gtagcaaatt aagaatggca 34380
tcatcaattg acatgccctt ggctctaagt tcttctctaa gttctagttg taaatactct 34440
ctcatattat caccaaactg cttagccaga agccccccgg gaacaatagc aggggacgct 34500
acagtgcagt acaagcgcag acctccccaa ttggctccag caaaaacaag attagaataa 34560
gcatactggg aaccaccagt aatatcatca aagttgctgg aaatataatc aggcagagtt 34620
tcttgtaaaa attgaataaa agaaaaattt tccaaagaaa cattcaaaac ctctgggatg 34680
caaatgcaat aggttaccgc gctgcgctcc aacattgtta gttttgaatt agtctgtaaa 34740
ataaaagaaa caagcgtcat atcatagtag cctgtcgaac aggtggataa atcagtcttt 34800
ccatcacaag acaagccaca gggtctccag cttgaccctc gtaaaacctg tcatcgtgat 34860
taaacaacag caccgaaagt tcctcgcggt ggccagcatg aataattctt gatgaagcat 34920
ataatccaga catgttagca tcagttaaag agaaaaaaca gccaacatag cctctgggta 34980
taattatgct taatcttaag tatagcaaag ccacccctcg cggatacaaa gtaaaaggca 35040
caggagaata aaaaatataa ttatttctct gctgctgttc aggcaacgtc gcccccggtc 35100
cctctaaata cacatacaaa gcctcatcag ccatggctta ccagacaaag tacagcgggc 35160
gcacaaagca caagctctaa agaagctcta aagacactct ccaacctctc cacaatatat 35220
acacaagccc taaactgacg taatgggagt aaagtgtaaa aaatcccgcc aagcccaaca 35280
cacaccccga aactgcgtca gcagggaaaa gtacagtttc acttccgcaa acccaacaag 35340
cgtaacttcc tctttctcac ggtacgtcac atccgattaa cttgcaacgt cattttccca 35400
cggccgcacc gcccctttta gccgttcacc ccgcagccaa tcaccacaca gcgcgcactt 35460
ttttaaatta cctcatttac atgttggcac cattccatct ataaggtata ttattgataa 35520
tg 35522
<210> 150
<211> 35382
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 21 sequence
<400> 150
ctatctatat aatatacctt atagatggaa tggtgccaat atgcaaatga ggtaatttaa 60
aaaagtgcgc gctgtgtggt gattggctgc ggggtgaacg gctaaaaggg gcgggcaatg 120
ctgggaggtg acgtaactta tgtaggagga gttatgttgc aagttatcgc ggtaaaggtg 180
acgtaaaacg aggtgtggtt tggacacgga agtagacagt tttcccacgc ttactgacag 240
gatatgaggt agttttgggc ggatgcaagt gaaaattctc cattttcgcg cgaaaactga 300
atgaggaagt gaatttctga gtcatttcgc ggttatgaca gggtggagta tttgccgagg 360
gccgagtaga ctttgaccgt ttacgtggag gtttcgatta ccgtgttttt cacctaaatt 420
tccgcgtacg gtgtcaaagt cctgtgtttt tacgtaggtg tcagctgatc actagggtat 480
ttaaacctgt cgagttccgt caagaggcca ctcttgagtg ccagcgagaa gagttttctc 540
ctccgcgctg cgagtcagtt ttgcgctttg aaaatgagac acctgcgatt cctgccacag 600
gagattatct ccagcgagac cgggatcgaa atactggagt ttgtggtaaa taccctgatg 660
ggagatgacc cggaaccgcc agtgcagcct ttcgatccac ctacgctgca cgatctgtat 720
gatttagagg tagacgggcc tgatgatccc aatgaggaag ctgtaaatgg gttttttact 780
gattctatgc tgctagctgc cgatgaagga ttggacataa accctcctcc tgggaccctt 840
gataccccag gggtggttgt ggaaagcggc agaggtggga aaaaattgcc tgatctggga 900
gcagctgaaa tggacttgcg ttgttatgaa gagggttttc ctccgagtga tgatgaagat 960
ggggaaactg aacagtccat ccataccgca gtgaatgagg gagtaaaagc tgccagcgat 1020
gtttttaagt tggactgtcc ggagctgcct ggacatggct gtaagtcttg tgaatttcac 1080
aggaataaca ctggaatgaa agaactattg tgctcgcttt gctatatgag aatgcactgc 1140
cactttattt acagtaagtg tatttaagtg aaatttaaag gaatagtgta gctgtttaat 1200
aactgttgaa tggtagattt atgtttttac ttgcgatttt ttgtaggtcc tgtgtctgat 1260
gatgaggcgc cttctcctga ttcaactacc tcacctcctg aaattcaggc gcccgtacct 1320
gcaaacgtat gcaagcccat tcctgtgaag cctaagtgtg ggaaacgccc tgctgtggat 1380
aagcttgagg acttgttgga gggtggggat ggacctttgg accttagtac ccggaaactg 1440
ccaagacaat gagtgccctg cagctgtgtt tatttaatgt gacgtcatgt aataaaatta 1500
tgtcagctgc tgagtgtttt attgcttctt gggtggggac ttggatatat aagtaggagc 1560
agatctgtgt ggttagctca tagcaacctg ctgccatcca tggaggtttg ggctatcttg 1620
gaagacctga gacagactag gctactgcta gaaaacgcct cggacggagt ctctggcttt 1680
tggagattct ggttcggtgg tgatctagct aggctagtgt ttaggataaa acaggactac 1740
agggaagaat ttgaaaagtt attggacgac agtccaggac tttttgaagc tcttaacttg 1800
ggccaccagg ctcattttaa ggagaaggtt ttatcagttt tagatttttc tactcctggt 1860
agaactgctg ctgctgtagc ttttcttact tttatattgg ataaatggat ccgccaaacc 1920
cacttcagca agggatacgt tttggatttc atagcagcag ctttgtggag aacatggaag 1980
gctcgcagga tgaggacaat cttagattac tggccagtgc agcctctggg agtagcaggg 2040
atactgagac acccaccggc catgccagcg gttctggagg aggagcagca ggaggacaat 2100
ccgagagccg gcctggaccc tccggtggag gagtagctga cctgtttcct gaactgcgac 2160
gggtgcttac taggtctacg tccagtggac aggacagggg cattaagagg gagaggaatc 2220
ctagtgggaa taattcaaga accgagttgg ctttaagttt aatgagccgt aggcgtcctg 2280
aaactgtttg gtggcatgag gttcagagcg aaggcaggga tgaagtttca atattgcagg 2340
agaaatattc actagaacaa cttaagacct gttggttgga acctgaggat gattgggagg 2400
tggccattag gaattatgct aagatatctc tgaggcctga taaacagtat agaattacta 2460
agaagattaa tattagaaat gcatgctaca tatcagggaa tggggcagag gttataatag 2520
atacccaaga taaagcagct tttagatgtt gtatgatggg tatgtggcca ggggttgtcg 2580
gcatggaagc agtaacattt atgaatatta ggtttaaagg ggatgggtat aatggcattg 2640
tatttatggc taacactaag ctgattctac atggttgtag cttttttggg tttaataata 2700
cttgtgtaga agcttggggg caagttggtg tgaggggttg tagtttttat gcatgctgga 2760
ttgcaacatc aggtagggtc aagagtcagt tgtctgtgaa gaaatgcatg tttgagagat 2820
gtaatcttgg catactgaat gaaggtgaag caagggtccg ccactgcgca gctacagaaa 2880
ctggctgctt cattctaata aagggaaatg ccagtgtgaa gcataatatg atctgtggac 2940
attcgaatga gaggccttat cagatgctga cctgcgctgg tggacattgc aatattcttg 3000
ctaccgtgca tatcgtttcc catgcacgca agaaatggcc tgtatttgaa cataatgtga 3060
ttaccaagtg caccatgcac ataggtggtc gcaggggaat gtttatgcct taccagtgta 3120
acatgaatca tgtgaaggtg atgttggaac cagatgcctt ttccagagtg agcttaacag 3180
gaatctttga tatgaatatt caactatgga agatcctgag atatgatgac actaaaccga 3240
gggtgcgcgc atgcgaatgc ggaggcaagc atgctagatt ccagccggtg tgcgtggatg 3300
tgactgaaga cctgagaccc gatcatttgg tgcttgcctg cactggagcg gagttcggtt 3360
ctagtggtga agaaactgac taaagtgagt agtggggcaa tatgtggatg gggactttca 3420
ggttggtaag gtggacagat tgggtaaatt ttgttaattt ctgtcttgca gctgccatga 3480
gtggaagcgc ttcttttgag gggggagtat ttagccctta tctgacgggc aggctcccat 3540
catgggcagg agttcgtcag aatgtcatgg gatccactgt ggatgggaga cccgtccagc 3600
ccgccaattc ctcaacgctg acctatgcca ctttgagttc gtcatcattg gatgcagctg 3660
cagccgccgc cgctactgct gccgccaaca ccatccttgg aatgggctat tacggaagca 3720
tcgttgccaa ttccagttcc tctaataacc cttcaaccct ggctgaggac aagctgcttg 3780
ttctcttggc tcagctcgag gccttaaccc aacgcttagg cgaactgtct aagcaggtgg 3840
cccagttgcg tgagcaaact gagtctgctg ttgccacagc aaagtctaaa taaagatctc 3900
aaatcaataa ataaagaaat acttgttata aaaacaaatg aatgtttatt tgatttttcg 3960
cgcgcggtat gccctggacc atcggtctcg atcattgaga actcggtgga tcttttccag 4020
taccctgtaa aggtgggatt gaatgtttag atacatgggc attagtccgt ctcgggggtg 4080
gagatagctc cattgaagag cctcttgctc cggggtagtg ttataaatca cccagtcata 4140
gcaaggtcgg agtgcatggt gttgcacaat atcttttagg agcagactaa ttgcaacggg 4200
gaggccctta gtgtaggtgt ttacaaatct gttgagctgg gacgggtgca tcctgggtga 4260
aattatatgc attttggact ggatcttgag gttggcaatg ttgccgccta gatcccgtct 4320
cggattcata ttgtgcagaa ccaccaagac agtgtatccg gtgcacttgg gaaatttatc 4380
atgcagctta gagggaaaag catgaaaaaa tttggagacg cctttgtgac cccccagatt 4440
ctccatgcac tcatccataa tgatagcgat ggggccgtgg gcagcggcac gggcgaacac 4500
gttccggggg tctgaaacat catagttatg ctcctgagtc aggtcatcat aagccatttt 4560
aataaacttt gggcggaggg tgccagattg ggggatgaaa gttccctctg gcccgggagc 4620
atagtttccc tcacatattt gcatttccca ggctttcagt tccgaggggg ggatcatgtc 4680
cacctgcggg gctataaaaa ataccgtttc tggagccggg gtgattaact gggatgagag 4740
caaattccta agcagctgag acttgccgca cccagtggga ccgtaaatga ccccaattac 4800
gggttgcaga tggtagttta gggagcgaca gctgccgtcc tcccggagca ggggggccac 4860
ttcgttcatc atttccctta catggatatt ttcccgcacc aagtccgtta ggaggcgctc 4920
tcccccaagg gatagaagct cctggagcga ggagaagttt ttcagcggct tcagcccgtc 4980
agccatgggc attttggaaa gagtctgttg caagagctcg agccggtccc agagctcggt 5040
gatgtgctct atggcatctc gatccaacag acctcctcgt ttcgcgggtt gggacggctc 5100
ctggagtagg gaatcagacg atgggcgtcc agcgctgcta gggtccgatc cttccatggt 5160
cgcagcgtcc gagtcagggt tgtttccgtc acggtgaagg ggtgcgcgcc tggttgggcg 5220
cttgcgaggg tgcgcttcag actcatcctg ctggtcgaga accgctgccg atcggcgccc 5280
tgcaggtcgg ccaggtagca gtttaccatg agttcgtagt tgagcgcctc ggccgcgtgg 5340
cctttggcac ggagcttacc tttggaagtt ttatggcagg cggggcagta gatacatttg 5400
agggcataca gcttgggcgc gaggaaaatg gattcggggg agtatgcatc cgcaccgcag 5460
gaggcgcaga cggtttcgca ctccacgagc caggtcagat ccggctcatc ggggtcaaaa 5520
acaagttttc cgccatgttt tttgatgcgt ttcttacctt tggtttccat gagttcgtgt 5580
ccccgctggg tgacaaagag gctgtccgtg tccccgtaga ccgactttat gggcctgtcc 5640
tcgagcggag tgcctcggtc ctcttcgtag aggaacccag cccactctga tacaaaagcg 5700
cgtgtccagg ccagcacaaa ggaggccacg tgggaggggt agcggtcgtt gtcaaccagt 5760
gggtccacct tctctacggt atgtaaacac atgtccccct cctccacatc caagaatgtg 5820
attggcttgt aagtgtaggc cacgtgacca ggggtccccg ccgggggggt ataaaagggg 5880
gcgggcctct gttcgtcctc actgtcttca ggatcgctgt ccaggagcgc cagctgttgg 5940
ggtaggtatt ccctctcgaa ggcgggcatg acctctgcac tcaggttgtc agtttctagg 6000
aacgaggagg atttgatatt gacagtacca gcagagacgc ctttcataag actctcgtcc 6060
atctggtcag aaaacacaat cttcttgttg tccagcttgg tggcaaatga tccataaagg 6120
gcattggaca gaagcttggc gatggagcgc atggtttggt tcttttcctt gtccgcgcgc 6180
tccttggcgg cgatgttaag ctggacgtac tcgcgcgcca cacatttcca ttcagggaag 6240
atggttgtca gttcatccgg aactattctg actcgccatc ccctattgtg cagggttatc 6300
agatccacac tggtggccac ctcgcctcgg aggggctcat tggtccagca gagtcgacct 6360
ccttttcttg aacagaaagg tgggaggggg tctagcatga actcatcagg ggggtccgca 6420
tctatggtaa atattcccgg tagcaaatct ttgtcaaaat agctgatggt ggcgggatca 6480
tccaaggtca tctgccattc tcgaactgcc agcgcgcgct cataggggtt aagaggggtg 6540
ccccagggca tggggtgggt gagcgcggag gcatacatgc cacagatatc gtagacatag 6600
aggggctctt cgaggatgcc gatgtaagtg ggataacagc gcccccctct gatgcttgct 6660
cgcacatagt catagagttc atgtgagggg gcgagaagac ccgggcccag attggtgcgg 6720
ttgggttttt ccgccctgta aacgatctgg cgaaagatgg catgggaatt ggaagagata 6780
gtaggtctct ggaatatgtt aaaatgggca tgaggtaggc ctacagagtc ccttatgaag 6840
tgggcatatg actcttgcag cttggctacc agctcggcgg tgacgagtac atccagggca 6900
cagtagtcga gagtttcctg gatgatgtca taacgcggtt ggcttttctt ttcccacagc 6960
tcgcggttga gaaggtattc ttcgcgatcc ttccagtact cttcgagggg aaacccgtct 7020
ttttctgcac ggtaagagcc caacatgtag aactgattga ctgccttgta gggacagcat 7080
cccttctcca ctggaagaga gtatgcttgg gctgcattgc gcagcgaggt atgagtgagg 7140
gcaaaagtgt ccctgaccat gactttgagg aattgatact tgaagtcaat gtcatcacag 7200
gccccctgtt cccagagttg gaagtccacc cgcttcttgt aggcggggtt gggcaaagcg 7260
aaagtaacat cattgaagag gatcttgccg gccctgggca tgaaatttcg ggtgattttg 7320
aaaggctgag ggacctctgc tcggttattg ataacctgag cggccaagac gatctcatca 7380
aagccattga tgttgtgccc cactatgtac agttctaaga atcgaggggt gcccctgaca 7440
tgaggcagct tcttgagttc ttcaaaagtg agatctgtag ggtcagtgag agcatagtgt 7500
tcgagggccc attcgtgcac gtgagggttc gctttgagga aggaggacca gaggtccact 7560
gccagtgctg tttgtaactg gtcccggtac tgacgaaaat gctgcccgac tgccatcttt 7620
tctggggtga cgcaatagaa ggtttggggg tcctgccgcc agcgatccca cttgagtttc 7680
atggcgaggt cataggcgat gttgacgagc cgctggtctc cagagagttt catgaccagc 7740
atgaagggga ttagctgctt gccaaaggac cccatccagg tgtaggtttc cacatcgtag 7800
gtgaggaaga gcctttctgt gcgaggatga gagccaatcg ggaagaactg gatctcctgc 7860
caccagttgg aggaatggct gttgatgtga tggaagtaga actccctgcg acgcgccgag 7920
cattcatgct tgtgcttgta cagacggccg cagtactcgc agcgattcac gggatgcacc 7980
tcatgaatga gttgtacctg acttcctttg acgagaaatt tcagtggaaa attgaggcct 8040
ggcgtttgta cctcgcgctc tactatgttg tctgcatcgg catgaccatc ttctgtctcg 8100
atggtggtca tgctgacgag ccctcgcggg aggcaagtcc agacctcggc gcggcagggg 8160
cggagctcga ggacgagagc gcgcaggccg gagctgtcca gggtcctgag acgctgcgga 8220
gtcaggttag taggcagtgt caggagattg acttgcatga tcttttcgag ggcgtgaggg 8280
aggttcagat ggtacttgat ctccacgggt ccgttggtgg agatgtcgat ggcttgcagg 8340
gttccgtgcc ccttgggtgc taccaccgtg cccttgtttt tccttttggg cggcggtggc 8400
tctgttgctt cttgcatgtt tagaagcggt gtcgagggcg cgcaccgggc ggcaggggcg 8460
gttcgggacc cggcggcatg gctggcagtg gtacgtcggc gccgcgcgcg ggtaggttct 8520
ggtactgtgc tctgagaaga ctcgcatgcg cgacgacgcg gcggttgaca tcctggatct 8580
gacgcctctg ggtgaaagct accggccccg tgagcttgaa cctgaaagag agttcaacag 8640
aatcaatctc ggtatcgttg acggcggctt gcctaaggat ttcttgcacg tcgccagagt 8700
tgtcctggta ggcgatctcg gccatgaact gctcgatctc ttcctcttga agatctccgc 8760
ggcccgctct ctcgacggtg gccgccaggt cgttggagat gcgcccaatg agttgagaga 8820
atgcattcat gcccgcctcg ttccagacgc ggctgtagac cacagccccc acgggatctc 8880
tcgcgcgcat gaccacctgg gcgaggttga gctccacgtg gcgggtgaag accgcatagt 8940
tgcatagacg ctggaaaagg tagttgagtg tggtggcgat gtgctcggtg acgaagaaat 9000
acatgatcca tcgtctcagc ggcatctcgc tgacatcgcc cagcgcttcc aagcgctcca 9060
tggcctcgta gaagtccacg gcaaagttga aaaactggga gttacgcgcg gacacggtca 9120
actcctcttc cagaagacgg atgagttcgg cgacggtggt gcgcacctcg cgctcgaaag 9180
cccctgggat ttcttcctca atctcttctt cttccactaa catctcttcc tcttcaggtg 9240
gggctgcagg aggaggggga acgcggcgac gccggcggcg cacgggcaga cggtcgatga 9300
atctttcaat gacctctccg cggcggcggc gcatggtctc ggtgacggca cgaccgttct 9360
ccctgggtct cagagtgaag acgcctccgc gcatctccct gaagtggtga ctgggaggct 9420
ctccgttggg cagggacacc gcgctgatta tgcattttat caattgcccc gtaggtactc 9480
cgcgcaagga cctgatcgtc tcaagatcca cgggatctga aaacctttcg acgaaagcgt 9540
ctaaccagtc gcaatcgcaa ggtaggctga gcactgtttc ttgcgggcgg gggcggctag 9600
acgctcggtc ggggttctct ctttcttctc cttcctcctc tttggagggt gagacgatgc 9660
tgctggtgat gaaattaaaa taggcagttt tgagacggcg gatggtggcg aggagcacca 9720
ggtctttggg tccggcttgt tggatgcgca ggcgatgggc cattccccaa gcattatcct 9780
gacatctggc cagatcttta tagtagtctt gcatgagtcg ttccacgggc acttcttctt 9840
cgcccgctct gccatgcatg cgagtgatcc cgaacccgcg catgggctgg acaagtgcca 9900
ggtccgctac aaccctttct gcgaggatgg cttgctgcac ctgggtgagg gtggcttgga 9960
agtcgtcaaa gtccacgaag cggtggtaag ccccggtgtt gattgtgtag gagcagttgg 10020
ccatgactga ccagttgact gtctggtgcc ccggacgcac aatctcggtg tacttgaggc 10080
gcgagtaggc gcgggtgtca aagatgtaat cgttacaggt gcgcaccagg tactggtagc 10140
cgataagaaa gtgcggcggc ggctggcggt ataggggcca tcgctctgta gccggggcgc 10200
caggggcgag gtcttccagc atgaggcggt gataaccgta gatgtacctg gacatccagg 10260
tgataccgga ggcggtggtg gatgcccgcg ggaactcgcg tacgcggttc cagatgttgc 10320
gcagcggcat gaagtagttc atggtaggca cggtttggcc cgtgagacgt gcacagtcgt 10380
tgatgctcta gacatacggg caaaaacgaa agcggtcagc ggctcgtctc cgtggcctgg 10440
aggctaagcg aacgggttgg gctgcgcgtg taccccggtt cgaatctcgg atcaggctgg 10500
agccgcagct aacgtggtac tggcactccc gtctcgaccc aggcctgcac aaaacctcca 10560
ggatacggag gcgggtcgtt tttttttttt tttgcttttt cctggatggg agccagtgct 10620
gcgtcaagct ttagaacact cagttctcgg ggctgggagt ggctcgcgcc cgtagtctgg 10680
agaatcaatc gccagggttg cgttgcggtg tgccccggtt cgagtcttag cgcgccggat 10740
cggccggttt ccgcgacaag cgagggtttg gcagccccgt catttctaag accccgccag 10800
ccgacttctc cagtttacgg gagcgagccc tctttttttg tttttttgtt gcccagatgc 10860
atcccgtgct gcgacagatg cgcccccagc aacagccccc ttctcagcag cagctacaac 10920
aacagccaca aaaggctctt cctgctcctg taactactgc ggctgcagcc gtcagcggcg 10980
cggggcagcc cgcctatgat ctggacttgg aagagggcga gggactggcg cgcctgggcg 11040
caccatcgcc cgagcggcac ccgcgggtgc aactgaaaaa ggactctcgc gaggcgtacg 11100
tgccccagca gaacctgttc agggacagga gcggcgagga gcctgaggaa atgcgagctt 11160
cccgctttaa cgcgggtcgc gaactgcgtc acggtctgga ccgaagacgg gtgctgcgtg 11220
atgatgattt tgaagtcgat gaagtgacag gaataagtcc tgctagggca catgtggccg 11280
cggccaacct agtatcagct tacgagcaga ccgtgaagga ggagcgcaac tttcaaaaat 11340
ctttcaacaa ccatgtgcgc accctgattg cccgcgagga agtgacactg ggactgatgc 11400
acctgtggga cctgatggaa gccattaccc agaaccccac cagcaaacct ctaaccgctc 11460
agctgtttct ggtggtgcaa catagtagag acaatgaggc atttagggag gcgctgttga 11520
acattactga gcccgagggg agatggttgt atgatcttat caatattctg caaagtataa 11580
tagtgcaaga acgtagcctg ggtctagctg agaaggtggc tgctattaac tactcggtct 11640
tgagcctggg caagcactac gctcgcaaga tctacaaaac cccatacgta cctatagaca 11700
aggaggtgaa gatagatggg ttttatatgc gcatgactct caaggtgctg accttgagtg 11760
acgatctggg agtgtaccgc aacgacagga tgcaccgcgc agtgagcgcc agcagaaggc 11820
gtgagctgag cgacagagaa cttatgcaca gcttgcaaag agctctgact ggggctggaa 11880
ccgaggggga gaactacttt gacatgggag cggacttgca atggcagccc agtcgcaggg 11940
ccctggacgc agcagggtat gagcttcctt acatagaaga ggtggatgaa ggccaggatg 12000
aggagggcga gtacctggaa gactgatggc gcgaccatcc atatttttgc tagatggaac 12060
agcaggcacc ggaccccgca aaacgggcgg cgctacagag ccagccgtcc ggcattaact 12120
cctcggacga ttggagccag gccatgcaac gcatcatggc gctgacgacc cgcaaccccg 12180
aagcctttag gcagcaaccc caggccaacc gcctttctgc tatcctggag gccgtagtgc 12240
cctcccgctc caaccccaca cacgagaagg tcctggccat cgtgaacgcg ctggtggaga 12300
acaaagccat acgtcccgat gaggctgggc tggtatacaa tgccctattg gagcgcgtag 12360
cccgctacaa cagcagcaac gtgcagacca acctggaccg gatggtgacc gatgtgcgcg 12420
aggccgtgtc tcagcgcgag cggttccagc gagacgccaa tttagggtcg ctggtggctt 12480
tgaacgcctt cctcagcact cagcctgcca acgtgcctcg cggtcagcaa gactacacaa 12540
actttctaag tgcattgaga ctcatggtgg ccgaagtccc tcaaagcgaa gtgtaccagt 12600
ccgggccaga ctactttttc cagaccagca gacagggctt gcagacagtg aacctgagcc 12660
aggcttttaa gaacctgaat ggtctgtggg gagtgcgcgc cccagtggga gatcgggcga 12720
ccgtgtctag cttgctgacc cccaactccc gcctactact gctcttggta gccccattca 12780
ctgacagcgg tagcatcgac cgtaattcgt acttgggcta tctgttgaac ctgtatcgcg 12840
aggccatagg gcaaactcag gtagatgagc aaacctatca agaaattacc caagtgagcc 12900
gcgctctggg tcgggaggac actggcagct tggaagccac cttaaacttc ttgctgacca 12960
accggtcgca gaagatccct cctcagtatg cgcttaccgc ggaggaggaa cggatcctga 13020
gatacgtgca gcagagcgtg ggactgttcc taatgcagga gggggcgact cctactgctg 13080
cgctcgatat gacagcccga aacatggagc ccagcatgta tgccagtaac cggcctttta 13140
tcaataaact gctagactac ttacacaggg cggctgctat gaactctgat tatttcacca 13200
atgctatcct gaacccccat tggctgcccc cacctgggtt ctatacgggc gagtatgaca 13260
ttgcccgacc caatgacggg tttttatggg acgatgtgga cagtagtgtt ttctccccgc 13320
ctcctggtta taacacttgg aagaaggaag gtggcgatag aaggcactct tccgtgtcac 13380
tgtccggggc aacgggtgct gccgcagcgg ctcccgaggc cgcaagtcct ttccctagtt 13440
tgccattttc gctaaacagt gtacgcagca gtgagctggg aagaataacc cgtcctcgct 13500
tgatcggcga ggaggagtat ttgaacgact ccctgttgag acccgagagg gagaagaatt 13560
tccccaacaa cgggatagaa agcttggttg acaaaatgaa ccgctggaag acgtacgcgc 13620
acgatccccg ggcgctgggg gatagccggg gcagcgctac ccgtaaacgc cagtggcacg 13680
acaggcagcg gggcctggtg tgggccgatg atgattccgc cgacgacagc agcgtgttgg 13740
acttgggtgg gagtggtggt aacccgttcg ctcacctgcg cccccgcgtc gggcgcctga 13800
tgtaagaaac cgaaaataaa tactcaccaa ggccatggcg accagcgtgc gttcgtttct 13860
tctctgttat atctagtatg atgaggcgaa ccgtgctagg cggagcggtg gtgtatccgg 13920
agggtcctcc tccttcgtac gagagcgtga tgcagcaggc ggcggcggcg acgatgcagc 13980
caccactgga ggctcccttt gtaccccctc ggtacctggc acctacggag gggagaaaca 14040
gcattcgtta ctcggagctg gcaccattgt atgataccac ccggttgtat ttggtggaca 14100
acaagtccgc ggacatcgcc tcactgaact atcagaacga ccacagcaac ttcctcacca 14160
cggtggtgca aaacaatgac tttaccccca cggaggccag cacccagacc atcaactttg 14220
acgagcggtc gcgatggggc ggtcagctga agactatcat gcacaccaac atgcccaacg 14280
tgaacgagta catgtttagc aacaagttca aagctcgggt gatggtgtct agaaaggctc 14340
ctgaaggtgt cacagtagat gacaattatg atcacaagca ggatattttg gaatatgagt 14400
ggtttgagtt tactctaccg gaagggaatt tctcagccac aatgaccatt gacctaatga 14460
acaatgccat cattgataat taccttgaag tgggcagaca gaatggagtg ttagagagtg 14520
acattggtgt taaatttgac accaggaact ttagactggg ttgggatccg gaaactaagt 14580
tgattatgcc tggggtttac acctatgagg cattccatcc tgacattgta ttgttgcctg 14640
gttgcggagt tgactttact gaaagtcgcc ttagtaactt gcttggtatc aggaaaagac 14700
acccattcca ggagggtttt aagatcttgt atgaggatct tgaagggggt aatatcccgg 14760
ccctgttgga tgtagaagcc tatgagaaca gtaagaaaga acaagaagcc aaaacagaag 14820
ccgctaaagc tgctgctatt gctaaagcca acatagttgt cagcgaccct gtaagggtgg 14880
ctaatgcaga agaagtcaga ggagacaact atacagcttc atctgttgca actgacgaat 14940
cgctattggc tgctgtggcc gaaactacag agacaaaact cactattaaa cctgtagaaa 15000
aagacagcaa gagtagaagt tacaatgtct tggaagataa agtgaataca gcctaccgca 15060
gctggtacct gtcctacaac tatggtgacc ctgaaaaagg agtccgttcc tggacactgc 15120
tcaccacctc ggatgtcacc tgtggagcag agcaggtgta ctggtcgctc ccagacatga 15180
tgcaggaccc tgtcacattc cgttccacga gacaagtcag caactatcca gtggtaggtg 15240
cagagctcat gccggtcttc tcaaagagtt tctacaacga gcaagccgtg tactcccagc 15300
agcttcgcca gtccacctcg ctcacgcacg tcttcaaccg cttccctgag aaccagatcc 15360
tcatccgccc gccagcgccc accattacca ccgtcagtga aaacgttcct gctctcacag 15420
atcacgggac cctgccgttg cgcagcagta tccggggagt ccagcgcgtg accgttactg 15480
acgccagacg ccgcacctgc ccctacgtct acaaggccct gggcatagtc gcgccgcgcg 15540
tcctttcaag ccgcactttc taaaaaaaaa aatgtccatt cttatctcac ctagtaataa 15600
caccggttgg ggcctgcgcg cgccaagcaa gatgtacgga ggtgctcgca aacgctctac 15660
acagcaccct gtgcgcgtgc gcgggcactt ccgcgctcca tggggcgccc tcaagggtcg 15720
tgcccgcact agaaccaccg tcgatgatgt gatcgaccag gtggtggccg atgctcgtaa 15780
ttatactcct actgcaccta catctactgt ggatgcagtt attgacagcg tagtggctga 15840
cgcccgcgcc tatgctcgcc ggaagagcag gcggagacgc atcgccaggc gccaccgggc 15900
tactcccgct atgcgagcgg caagagctct gctacggagg gccaaacgcg tggggcgaag 15960
agctatgctt agagcggcca gacgcgcggc ttcaggtgcc agtgccggca ggtcccgcag 16020
gcgcgcagcc acggcggcag cagcggccat tgccaacatg gcccaaccgc gaagaggcaa 16080
tgtgtactgg gtgcgcgacg ccaccaccgg ccagcgcgtg cccgtgcgca cccgcccccc 16140
tcgctcttag aagatactga gcagtctccg atgttgtgtc ccagcgagga tgtccaagcg 16200
caaatacaag gaagagatgc tccaggtcat cgcgcctgaa atctacggtc cgccggtgaa 16260
ggatgaaaaa aagccccgca aaatcaagcg ggtcaaaaag gacaaaaagg aagaagatgg 16320
caatgatggt ctggcggagt ttgtacgcga gttcgcccca aggcggcgtg tgcagtggcg 16380
tggacgcaaa gtgcggcctg tgctgagacc tggaaccacg gtggtcttta cgcccggcga 16440
gcgctccagc actgctttta agcggtccta tgatgaggtg tatggggatg atgatattct 16500
ggagcaggcg gccgaccgcc tgggcgagtt tgcttatggc aagcgctccc gctcgagccc 16560
caaggaggag gcggtgtcca ttcccttgga caatgggaat cccaccccta gtctcaagcc 16620
agtcaccctg cagcaagtgc tgcccgtgcc tccacgcaga ggcaacaagc gagagggtga 16680
ggatctgtat cccactatgc aattgatggt gcccaagcgc cagcggctgg aggacgtgct 16740
ggagaaaatg aaagtggatc ccgatataca acctgaggtc aaagtgagac ccatcaagca 16800
ggtggcgcca ggtttgggag tacaaaccgt agacatcaag attcccaccg agtccatgga 16860
agtccaaacc gaacctgcaa agcccacaac cacctccatt gaggtgcaaa cggatccctg 16920
gatgaccgca cccgttacaa ctccagctgc tgtcaacacc actcgaagat cccggcgaaa 16980
gtacggtcca gcaagtttgc tgatgccaaa ttatgctctg cacccatcca ttattccaac 17040
tccgggttac cgaggcactc gctactaccg cagcaggagc agcacttccc gccgtcgccg 17100
caaaacacct gcaagtcgta gtcaccgtcg tcgccgccgc cccaccagca atctgactcc 17160
cgctgctctg gtgcggagag tgtatcgcga tggccgcgcg gatcccctga cgttgccgcg 17220
cgtacgctac catccaagca tcacaactta acaactgttg ccgctgcctc cttgcagata 17280
tggccctcac ttgccgcctt cgtgtcccca ttactggcta ccgaggaaga aactcgcgcc 17340
gtagaagagg gatgttgggg cgcggaatgc gacgccacag gcggcggcgc gctatcagca 17400
agaggctggg gggtggcttt ctgcctgctc tgatccccat catagccgcg gcgatcgggg 17460
cgataccagg catagcttcc gtggcggttc aggcctcgca gcgccactga cattggaaaa 17520
acttataaat aaaacagaat ggactctgat gctcctggtc ctgtgactat gtttttgtag 17580
agatggaaga catcaatttt tcatccctgg ctccgcgaca cggcacgagg ccgtacatgg 17640
gcacctggag cgacatcggc accagccaac tgaacggggg cgccttcaat tggagcagta 17700
tctggagcgg gcttaaaaat tttggctcta ccataaaaac ctatgggaac aaagcttgga 17760
acagcagcac agggcaggca ttgagaaata agcttaaaga gcaaaacttc caacagaagg 17820
tggttgatgg aatcgcctct ggtatcaatg gggtggtgga tctggccaac caggccgtgc 17880
agaaacagat aaacagccgc attgacccgc cgccgtcagc cccgggtgaa atggaagtgg 17940
aggaagatct ccctcccctt gaaaagcggg gcgacaagcg tccgcgcccc gatctggagg 18000
agacactagt cacacgctca gacgacccgc cctcctacga ggaggcagtg aagcttggaa 18060
tgcccaccac cagacctgta gcccccatgg ctaccggggt aatgaaacct tctcagtcac 18120
accgacccgc taccttggac ttgcctcccc ctgctgttgc agcgcctgct cgcaagcctg 18180
tcgctacccc gaagcccacc accgtacagc ccgtcgccgt agccagaccg cgtcctgggg 18240
gcactccacg tccgaatgca aactggcaga gtactctgaa cagcatcgtg ggtctgggcg 18300
tgcaaagtgt aaagcgccgt cgctgctttt aaattaatat ggagtagcgc ttaacttgcc 18360
tgtctgtgtg tatgtgtcat catcacgccg ccgccgcagc aacagcagag gagcaaggaa 18420
gaggtcgcgc gccgaggctg agttgatttc aagatggcca ccccatcgat gctgccccag 18480
tgggcataca tgcacatcgc cggacaggat gcttcggagt acctgagtcc gggtctggtg 18540
cagttcgccc gcgccacaga cacctacttc aatctgggga acaagtttag gaaccccacc 18600
gtggcgccca cccatgatgt gaccaccgac cgcagtcagc ggctgatgct gcgctttgtg 18660
cccgttgacc gggaagacaa tacctacgca tacaaagttc gatacacctt ggctgtgggc 18720
gacaacagag tgctggatat ggccagcact ttctttgaca ttcggggtgt gttggataga 18780
ggccctagct tcaagccata ctctggcact gcttacaact cgttggcccc taagggcgct 18840
cccaatacat ctcagtggat tgctgaaggc gtaaaaaaag aagatggggg atctgacgaa 18900
gaggaagaga aaaatctcac cacttacact tttggaaatg ccccagtgaa agcagaaggt 18960
ggtgatatca ctaaagacaa aggtcttcca attggttcag aaattacaga cggcgaagcc 19020
aaaccaattt atgcagataa actataccaa ccagaacctc aggtgggaga tgaaacttgg 19080
actgacacag atggaacaac tgagaagtat ggtggtagag ctctaaagcc agaaactaaa 19140
atgaaaccct gctatgggtc ttttgctaaa cccactaacg tcaaaggcgg acaggcaaaa 19200
caaaaaacta ctgaacaacc gcaaaaccag caggttgaat atgatattga catgaacttt 19260
tttgatgaag cgtcacagaa agcaaacttc agtccaaaaa ttgtgatgta tgcagaaaat 19320
gtagacttgg aaaccccaga cactcatgtg gtgtacaaac ctggtacttc agaagaaagt 19380
tctcatgcta atctgggtca acaatctatg cccaacagac ccaactacat tggctttaga 19440
gataacttta ttggacttat gtactacaac agtactggca acatgggagt gctggcaggt 19500
caagcatccc aattgaatgc ggtggttgac ttgcaggaca gaaacacaga actatcatat 19560
caactactgc ttgactctct gggtgacaga accagatact tcagcatgtg gaatcaagca 19620
gtcgatagct atgatcctga tgtgcgcatt attgaaaatc atggggtgga agatgagctt 19680
cccaactact gctttccatt ggatggagta ggggtaccaa taagtagtta caaaataatt 19740
gaaccaaacg gacagggtgc agattggaaa gagcctgaca taaatggaac aagtgaaatt 19800
ggacaaggaa atctctttgc catggaaatt aacctccaag ctaatctctg gagaagtttt 19860
ctttattcca atgtggctct gtatctccca gactcctaca aatacacccc agccaatgtc 19920
actcttccaa ctaacaccaa cacttatgac tacatgaatg ggcgggtggt tcccccatcc 19980
ctggtggata cctacgtaaa cattggcgcc agatggtctt tggatgccat ggacaatgtc 20040
aaccccttta accatcaccg caacgctggc ctgcgatacc ggtccatgct tttgggcaat 20100
ggtcgttacg tgcctttcca cattcaagtg cctcagaaat tctttgctgt gaagaacctg 20160
ctgcttctac ccggttctta cacctacgag tggaacttca gaaaggatgt gaacatggtc 20220
ctgcagagtt cccttggtaa tgatctccgg gtcgatggtg ccagcataag ttttaccagc 20280
atcaatctct atgccacctt cttccccatg gcccacaaca ctgcctccac ccttgaagcc 20340
atgctgcgca atgacaccaa tgatcaatca ttcaatgact acctttctgc tgccaacatg 20400
ctctacccca tcccggccaa cgctaccaac gttcccatct ccattccctc tcgcaactgg 20460
gccgccttca gaggctggtc cttcaccaga ctcaaaacca aggagactcc ctctttggga 20520
tcagggttcg atccctactt tgtttactct ggttctatac cctacctgga tggtaccttc 20580
taccttaacc acactttcaa gaaagtctcc atcatgtttg actcttcagt gagctggcct 20640
ggtaatgaca gattgctaag tccaaatgag ttcgaaatca agcgcacagt tgatggggaa 20700
ggctacaatg tggcccaatg taacatgacc aaagactggt tcctggtcca gatgcttgcc 20760
aactacaaca ttggatacca gggcttctac gttcctgagg gttacaagga tcgcatgtac 20820
tccttcttca gaaacttcca gcccatgagt agacaggtgg ttgatgagat taactacaaa 20880
gactataaag ctgtcgccgt accctaccag cataataact ctggctttgt gggttacatg 20940
gctcctacca tgcgtcaggg tcaagcgtac cctgctaact acccataccc cctaattgga 21000
accactgcag taaccagtgt cacccagaaa aaattcctgt gcgacaggac catgtggcgc 21060
atcccattct ctagcaactt catgtccatg ggtgccctta cagacctggg acagaacttg 21120
ctgtatgcca actcggccca tgcgctggac atgacttttg aggtggatcc catggatgag 21180
cccaccctgc tttatcttct tttcgaagtc ttcgacgtgg tcagagtgca ccagccacac 21240
cgcggcgtca tcgaggccgt ctacctgcgc acaccgttct cggccggcaa cgccaccaca 21300
taagaagcct cttgcttctt gcaagcagca gctgcagcca tgtcatgcgg gtccggaaac 21360
ggctccagcg agcaagagct caaagccatc gtccgagacc tgggctgcgg accctatttc 21420
ctgggaacct ttgacaagcg tttcccgggg ttcatggccc ccgacaagct cgcctgcgcc 21480
atagtcaaca ctgccggacg cgagacgggg ggagagcact ggctggcttt tggttggaac 21540
ccgcgctcca acacctgcta cctttttgat ccttttgggt tctcggatga gcgactcaaa 21600
cagatttacc agtttgagta cgaggggctc ctgcgccgca gtgcccttgc taccaaagac 21660
cgctgcatca ccctggaaaa gtccacccag agcgtgcagg gcccgcgctc agccgcctgt 21720
ggactttttt gctgtatgtt ccttcatgcc tttgtgcact ggcccgaccg ccccatgaac 21780
ggaaacccca ccatgaagtt gctgactggg gtgtcaaaca gcatgctcca atcaccccaa 21840
gtccagccca ccctgcgtcg caaccaggag gcgctatatc gcttcctaaa cacccactca 21900
tcttactttc gttctcaccg cgcacgcatc gaaagggcca ccgcgtttga ccgtatggat 21960
atgcaataag tcatgtaaaa ccgtgttcaa taaaaagcac tttattttta catgcactaa 22020
ggctctggtt ttttgctcat tcgttttcat cattcactca gaaatcaaat gggttctggc 22080
gtgagtcaga gtgacccgtg ggcagggaga cgttgcggaa ctgtaacctg ttctgccact 22140
tgaactcggg gatcaccagc ttgggaactg gaatttcggg aaaggtgtct tgccacaact 22200
ttctggtcag ttgcagggcg ccaagcaggt caggagcaga gatcttgaaa tcacagttgg 22260
ggccggcatt ctggacacgg gagttgcggt acactgggtt gcaacactgg aacaccatca 22320
aggctgggtg tctcacgctt gccagcacgg tcgggtcact gatggtagtc acatccaagt 22380
cttcagcatt ggccattcca aagggggtca tcttacaggt ctgcctgccc atcacgggag 22440
cgcagcctgg cttgtggttg caatcgcaat gaatggggat cagcatcatc ctggcttggt 22500
cgggggttat ccctgggtac acggccttca tgaaggcttc gtactgcttg aaagcttcct 22560
gagccttact tccctcggtg taaaacatcc cacaggactt gctggaaaat tggttagtag 22620
cacagttggc atcattcaca cagcagcggg catcgttgtt ggccaactgg accacatttc 22680
tgccccagcg gttctgggtg atcttggctc tgtctgggtt ctccttcata gcgcgctgcc 22740
cgttttcgct cgccacatcc atctcgataa tgtggtcctt ctggatcata atagtgccat 22800
gcaggcattt caccttgcct tcgtaatcgg tgcatccatg agcccacaga gcgcacccgg 22860
tgcactccca attattgtgg gcgatctcag aataagaatg caccaatccc tgcatgaatc 22920
ttcccatcat cgctgtcagg gtcttcatgc tactaaatgt cagcgggatg ccacggtgct 22980
cctcgttcac atactggtgg cagatacgct tgtactgctc gtgctgctct ggcatcagct 23040
tgaaagaggt tctcaggtca ttatccagcc tatacctctc cattagcaca gccatcactt 23100
ccatgccctt ctcccaggca gataccaggg gcaagctcaa aggattccta acagcaatag 23160
aagtagctcc tttagctata gggtcattct tgtcgatctt ctcaacactt ctcttgccat 23220
ccttctcaat gatgcgcacc ggggggtagc tgaagcccac ggccaccaac tgagcctgtt 23280
ctctttcttc ttcgctgtcc tggctgatgt cttgcagagg gacatgcttg gtcttcctgg 23340
gcttcttctt gggagggatc gggggaggac tgttgctccg ttccggagac agggatgacc 23400
gcgaagtttc gcttaccagt accacctggc tctcgataga agaatcggac cccacgcgac 23460
ggtaggtgtt cctcttcggg ggcagaggtg gaggcgactg agatgggctg cggtccggcc 23520
ttggaggcgg atggctggca gagcccattc cgcgttcggg ggtgtgctcc cgttggcggt 23580
cgcttgactg atttcctccg cggctggcca ttgtgttctc ctaggcagag aaacaacaga 23640
catggaaact cagccatcac tgccaacatc gctgcaagcg ccatcacacc tcgcccccag 23700
cagcgacgag gaggagagct taaccacccc accacccagt cccgctacca ccacctctac 23760
cctcgatgat gaggaggagg tcgacgcagc ccaggagatg caggcgcagg ataatgtgaa 23820
agcggaagag attgaggcag atgtcgagca ggacccgggc tatgtgacac cggcggagca 23880
cgaggaggag ctgaaacgtt ttctagacag agaggatgac gaccgcccag agcatcacca 23940
ggaggctggc ctcggggatc atgttgccga ctacctctcc gggcttgggg gggaggacgt 24000
gctcctcaaa catctagcaa ggcagtcgat catagttaaa gacgcactac tcaacctcac 24060
cgaagtgccc atcagtgtgg aagagcttag ccgcgcctac gagctgaacc tcttttcgcc 24120
tcagataccc cccaagcggc agcgaaacgg cacctgcgag gccaaccctc gactcaactt 24180
ctatccagct tttactgtcc ccgaagtgct ggccacctac cacatctttt ttaagaacca 24240
aaagattcca gtctcctgcc gcgccaaccg cacccgcgca gatgcccttc tcaacttggg 24300
tccgggagct cgtttacctg atatagcttc cttggaagag gttccaaaga tctttgaggg 24360
tctgggaagt gatgagactc gggccgcaaa tgctctgcaa cagggagaga atggcatgga 24420
tgaacatcac agcgctctag tggaactgga gggtgacaat gcccggcttg cagtgctcaa 24480
gcgcagtatc gtggtcaccc attttgccta ccccgctgtt aacctgccgc ccaaagtcat 24540
gagcgctgtc atggaccatc tgctcatcaa acgagcaagt ccactttcag aaaaccagaa 24600
catgcaggat ccagacgcct cggacgaggg caagccggta gtcagtgacg agcagctatc 24660
tcgctggctg ggtaccaact ccccccgaga tttggaagaa agacgcaagc ttatgatggc 24720
tgtagtgcta gtaactgttg agttggagtg tctgcgccgc ttttttaccg accccgagac 24780
cctgcgcaag ctagaggaga acctgcacta caccttcaga catggcttcg tgcgccaggc 24840
atgcaagatc tccaacgtgg agctcaccaa cctggtttca tacatgggca ttttgcatga 24900
gaaccggcta gggcagagcg ttctgcacac caccctgaag ggggaggccc gccgcgacta 24960
catccgagac tgtgtctacc tctacctctg ccatacctgg cagactggta tgggtgtgtg 25020
gcaacagtgt ttggaagagc agaaccttaa agagctggac aagctcttgc agagatccct 25080
caaagccctg tggacaggtt ttgacgagcg caccgtcgcc tcggacctgg cggacatcat 25140
cttccccgag cgtcttaggg ttactctgcg aaacggcctg ccagacttca tgagccagag 25200
catgcttaac aactttcgct ctttcatcct ggaacgctcc ggtatcctgc ctgccacctg 25260
ctgtgcgctg ccctccgact ttgtgcctct cacctaccgc gagtgcccac cgccgctatg 25320
gagccactgc tacctattcc gcctggccaa ctacctctcc taccactcgg atgtgataga 25380
ggatgtgagc ggagacggcc tgctggaatg ccactgccga tgcaatttat gcacacccca 25440
ccgctccctc gcctgcaacc cccagttgct aagcgagacc cagatcatcg gcaccttcga 25500
gttgcagggt cccaacagtg aaggcgaggg gtcttctccg gggcagagtc tgaaactgac 25560
accggggctg tggacctccg cctacctgcg caagttttat cccgaggact atcatcccta 25620
tgagatcagg ttctatgagg accagtcaca tcctcccaaa gtcgagctct cagcctgcgt 25680
catcacccag ggggcaattc tggcccaatt gcaagccatc caaaaatccc gccaagaatt 25740
tctgctgaaa aagggaagcg gggtctacct tgacccccag accggtgagg agctcaacac 25800
aaggttcccc caggatgtcc catcgccgag gaagcaagaa gctgaaggtg cagctgtcac 25860
ccccagagga tatggaggaa gactgggaca gtcaggcaga ggaggagatg gaagattggg 25920
acagccaggc agaggaggtg gacagcctgg aggaagacag tttggaggag gaagacgagg 25980
aggcagagga ggtggaagaa gcaaccgccg ccaaacagtt gtcatcggcg gcggagacaa 26040
gcaagtcccc agacagcagc acggctacca tctccgctcc gggtcggggg gcccagcggc 26100
ggcccaacag tagatgggac gagaccgggc gatttccaaa cccgaccacc gcttccaaga 26160
ccggtaagaa ggagcgacag ggatacaagt cctggcgtgg acataaaaac gctatcatct 26220
cctgcttgca tgaatgcggg ggcaacatat ccttcacccg gcgatacctg cttttccacc 26280
acggtgtgaa cttcccccgc aatatcttgc attactaccg tcacctccac agcccctact 26340
gcagtcagca agtcccggca accccgacag aaaaagacag cagcgacaac ggtgaccaga 26400
aaaccagcag ttagaaaatc cacaacaagt gcagcaggag gaggactgag gatcacagcg 26460
aacgagccag cgcagaccag agagctgagg aaccggatct ttccaaccct ctatgccatc 26520
ttccagcaga gtcgggggca agagcaggaa ttgaaagtaa aaaaccgatc tctgcgctcg 26580
ctcaccagaa gttgtttgta tcacaagagc gaagaccaac ttcagcgcac tctcgaggac 26640
gccgaggctc tcttcaacaa gtactgcgcg ctgactctta aagagtagcc cttgcccgcg 26700
ctcattcgaa aacggcggga atcacgtcac ccttggcagc tgtcctttgc cctcgtcatg 26760
agtaaagaca ttcccacgcc ttacatgtgg agctatcagc cccaaatggg gttggcagca 26820
ggtgcttccc aggactactc cacccgcatg aattggctta gcgccgggcc ctcaatgata 26880
tcacgggtta atgatatacg agcttatcga aaccagttac tcctagaaca gtcagctctt 26940
accaccacac cccgccaaca ccttaatccc cgaaattggc ccgccgccct ggtgtaccag 27000
gaaaatcccg ctcccaccac cgtactactt cctcgagacg cccaggccga agttcagatg 27060
actaacgcag gtgtacagct ggcgggcggt tccgccctat gtcgtcaccg gcctcaacag 27120
agtataaaac gcctggtgat cagaggccga ggtatccagc tcaacgacga gtcggttagc 27180
tcttcgcttg gtctgcgacc agacggagtc ttccagatcg ccggctgtgg gagatcttcc 27240
ttcactcctc gtcaggctgt gctgactttg gagagttcgt cctcgcagcc ccgctcgggc 27300
ggcatcggaa ctctccagtt tgtggaggag tttactccct ctgtctactt caaccccttc 27360
tccggctctc ctggccagta cccggacgag ttcataccga acttcgacgc aatcagcgag 27420
tcagtggatg gctatgattg atgtctaatg gtggcgcggc tgagctagct cgactgcgac 27480
acctagacca ctgccgccgc tttcgctgtt tcgcccggga actcaccgag ttcatttact 27540
tcgaactctc cgaggagcac cctcagggtc cggcccacgg agtgcggatt accatcgaag 27600
ggggaataga ctctcgcctg catcgcatct tctcccagcg gcccgtgctg attgagcgcg 27660
accagggaaa tacaaccatc tccatctact gcatctgtaa ccaccccgga ttgcatgaaa 27720
gcctttgctg tcttgtttgt gctgagttta ataaaaactg agttaagacc ctcctacgga 27780
ctaccgcttc ttcaatcagg actttacaac accaaccaga tcttccagaa gacccagacc 27840
cttcctcctc tgatccagga ctctaactct accttaccag caccctccac tactaacctt 27900
cccgaaacta acaagcttgg atctcatctg caacaccgcc tttcacgaag ccttctttct 27960
gccaatacta ccactcccaa aaccggaggt gagctccgcg gtcttcctac tgacgacccc 28020
tgggtggtag cgggttttgt aacgttagga ttagttgcgg gtgggcttgt gctaatcctt 28080
tgctacctat acacaccttg ctgtgcatat ttagtcatat tgtgctgttg gtttaagaaa 28140
tgggggccat actagtcgtg cttgctttac tttcgctttt gggtctgggc tctgctaatc 28200
tcaatcctct tgatcacgat ccatgtctag acttcgaccc agaaaattgc acacttactt 28260
ttgcacccga cacaagccgt ctctgtggag ttcttattaa gtgcggatgg gactgcaggt 28320
ccgttgaaat tacacataat aacaaaacat ggaacaatac attatccacc acatgggaac 28380
caggagttcc cgagtggtat actgtctctg tccgaggtcc tgacggttcc attcgcatta 28440
gtaacaacac tttcattttt tctgaaatgt gcgatctggc catgtttatg agcaaacagt 28500
atgacctatg gcctcctagc aaagagaaca ttgtggcatt ttccattgct tattgcttgg 28560
taacatgcat catcactgct atcatttgtg tgtgcataca cttgcttata gttattcgcc 28620
ctagacaaag caatgaggaa aaagagaaaa tgccttaacc tttttcctca taccttttct 28680
ttacagcatg gcttctgtta cagctctaat tattgccagc attgtcactg tcgctcacgg 28740
gcaaacaatt gtccatatta ccttaggaca taatcacact cttgtagggc ccccaattac 28800
ttcagaggtt atttggacca aacttggaag tgttgattat tttgatataa tttgcaacaa 28860
aactgaacca atatttgtaa tctgtaacag acaaaatctc acgttaatta atgttagcaa 28920
aatttataac ggttactatt atggttatga tagatccagt agtcaatata aaaattactt 28980
agttcgcata actcagccca aatcaacagt gccaactatg acaataatta aaatggctaa 29040
taaagcatta gaaaatttta cattaccaac aacgcccaat gaaaaaaaca ttccaaattc 29100
aatgattgca attattgcgg cggtggcatt gggaatggca ctaataataa tatgcatgtt 29160
cctatatgct tgttgctata aaaagtttca acataaacag gatccactac taaattttaa 29220
catttaattt tttatacaga tgatttccac tacaattttt atcattacta gccttgcagc 29280
tgtaacttat ggccgttcac acctaactgt acctgttggc tcaacatgta cactacaagg 29340
accccaagaa ggctatgtca cttggtggag aatatatgat aatggagggt tcgctagacc 29400
atgtgatcag cctggtacaa aattttcatg caacggaaga gacttgacca ttattaacat 29460
aacattaaat gagcaaggct tctattatgg aaccaactat aaaaatagtt tagattacaa 29520
cattattgta gtgccagcca ccacttctgc tccccgcaaa tccactttct ctagcagcag 29580
tgccaaagca agcacaattc ctaaaacagc ttctgctatg ttaaagcttc gaaaaatcgc 29640
tttaagtaat tccacagcag ctcccaatac aattcctaaa tcaacaattg gcatcattac 29700
tgccgtggta gtgggattaa tgattatatt tttgtgcata atgtactacg cctgctgcta 29760
tagaaaacat gaacaaaaag gtgatgcatt actaaatttt gatattgttt caatcaaatg 29820
ccactaacac tctcaatgtg cagactactt taaaacatga catggaaaac cacactacct 29880
cctatgcata cacaaatatt cagcctaaat acgctatgca acttagaaat caccatacta 29940
attgtaattg gaattcttac actatctgtt attctttatt ttatattctg ccgtcaaata 30000
cccaatgttc atagaaattc taaaagacgt cccatctatt ctcctatgat tagtcgtccc 30060
catatggctc tgaatgaaat ctaagatctt tttttttctt ttacagtatg gtgaacatca 30120
atcatgattc ctagaaattt cttcttcacc atactcatct gtgctttcaa tgtctgtgct 30180
actttcacag cagtagccac tgcaagccca gactgtatag gaccatttgc ttcctatgca 30240
ctttttgcct ttgttacttg catctgcgtg tgtagcatag tctgcctggt tattaatttt 30300
ttccaactgg tagactggat ctttgtgcga attgcctacc tacgtcacca tcccgaatac 30360
cgcaatcaaa atgttgcggc acttcttagg cttatttaaa accatgcagg ctatgctacc 30420
agttatttta attctgctac taccctgcat tgccctacct tccaccgcca ctcgcgctac 30480
acctgaacaa cttagaaaat gcaaatttca acaaccatgg tcatttcttg attgctacca 30540
tgaaaaatct gattttccca catactggat agtgattgtt ggaataatta acatactttc 30600
atgtaccgtt ttctcaatca caatataccc cacatttaat tttgggtgga attctcccaa 30660
tgcactgggt tacccacaag aactagatga acatatccca ctacaacaca tacaacaacc 30720
actagcattg gtagagtatg aaaatgagcc acaaccttca ctgcctcctg ctattagtta 30780
cttcaaccta accggcggag atgactgaaa tactcaccac ctccaattcc gccgaggatc 30840
tgcttgatat ggacggccgc gcctcagaac agcgactcgc ccaactacgc atccgccagc 30900
agcaggaacg cgtgaccaaa gagctcagag atgtcatcca aattcaccaa tgcaaaaaag 30960
gcatattttg tttggtaaaa caagccaaga tatcctacga gatcaccgct actgaccatc 31020
gcctttctta cgaacttggc ccccaacgac aaaaatttac atgcatggtg ggaatcaacc 31080
ctatagttat cacccagcaa agtggagata ctaagggttg cattcactgc tcttgcgatt 31140
ccaccgagtg cacctacacc ctgctgaaga ccctatgcgg cctaagagac ctgctaccca 31200
tgaattaaaa attaataaaa aattacttac ttgaaatcag caataaggtc tctgttgaaa 31260
ttttttccca gcagcacctc gcttccctct tcccaactct ggtattctaa accccgttca 31320
gcggcatact ttctccatac tttaaatggg atgtcaaatt ttagctcctc tcctgtaccc 31380
acgatcttca tgtctttctt cccagatgac caagagagtc cggctcagtg attccttcaa 31440
ccctgtctac ccctatgaag atgaaagcac ctcccaacac ccctttataa acccagggtt 31500
tatttcccca aatggcttta cacaaagccc agacggagtt cttactttaa attgtttaac 31560
cccactaaca accacaggcg ggcctttaca gttaaaagtg ggagggggac ttatagtgga 31620
tgacactgat gggaccttac aagaaaacat acgtgctaca gcacccatta ctaaaaataa 31680
tcattctgta gaactatcca ttggaaatgg attagaaaca caaaacaata aactatgtgc 31740
caaattggga aatgggttaa aatttaacaa cggtgacatt tgtataaagg atagtattaa 31800
caccttatgg actggaataa agcctccacc taactgtcaa attgtggaaa acactgatac 31860
aaacgatggc aaacttactt tagtattagt aaaaaacgga gggcttgtta atggctacgt 31920
atctctagtt ggtgtatcag acactgtgaa ccaaatgttc acacaaaagt cagcaaccat 31980
acaattaaga ttatatttcg actcttctgg aaatctatta actgatgaat caaacttaaa 32040
aattccactt aaaaataaat cttctacagc aaccagtgaa gctgcaacca gcagcaaagc 32100
ctttatgcca agtactacag cttatccctt taacaccact actagggata gtgaaaacta 32160
tattcatgga atatgttact atatgactag ttatgataga agtctagttc ccttaaacat 32220
ttctataatg ctaaacagcc gtacgatttc ttccaatgtt gcctatgcca tacaatttga 32280
atggaatcta aatgcaaaag aatctccaga aagcaacata gctacgctga ccacatcccc 32340
ctttttcttt tcttatatta gagaagacga caactaaaaa ataaagttta agtgttttta 32400
tttaaaaatc acaaaattcg agtagttatt ttgcctcccc cttcccattt aacagaatac 32460
accaatctct ccccacgcac agctttaaac atttggatac cattagagat agacatagtt 32520
ttagtttcca cattccaaac agtttcagag cgagccaatc tggggtcagt gatacataaa 32580
aatgcatcgg gatagtcttt taaagcgctt tcacagtcca actgctgcgg atgcgactcc 32640
ggagtctgga tcacagtcat ctggaagaag aacgatggga atcataatcc gaaaacggaa 32700
tcgggcgatt gtgtctcatc aaacccacaa gcagccgctg tctgcgtcgc tccgtgcgac 32760
tgctgtttat gggatcgggg tctgcagtgt cctgaagcat gattttaata gcccttaaca 32820
ttaactttct ggtgcgatgc gcgcagcaac gcattctgat ttcacttaga ttactacagt 32880
atgtacagca cattatcaca atattgttta ataaaccata attaaaagcg ctccagccaa 32940
aactcatatc tgatacaatc gcccctgcat gaccatcata ccaaatttta atataaatta 33000
aatgtcgttc cctcaaaaac acactaccca catacatgat ctcttttggc atgtgcatat 33060
taacaatctg tctgtaccat ggacaacgtt ggttaatcat gcaacccaat ataaccttcc 33120
ggaaccacac tgccaacacc gctcccccag ccatgcattg aagtgaaccc tgctgattac 33180
aatgacaatg aagaacccaa ttctctcgac catgaatcac ttgagactga aaaatatcta 33240
tagtagcaca acaaagacat aaatgcatgc atcttctcat aatttttaac tcatctggat 33300
ttaaaaacat atcccaagga atgggaaact cttgcaaaac agtaaagctg gcagaacaag 33360
gaagaccacg aacacaactt acactatgca tagtcatagt atcacaatct ggcaacagcg 33420
ggtggtcttc agtcatagaa gctcgggttt cattttcctc acatcgtggt aactgggctc 33480
tggtgtaagg gtgatgtctg gcgcatgatg tcgagcgtgc gcgcaacctt gtcataatgg 33540
agttgtttcc tgacattctc gtattttgta tagcaaaatg cggccctggc acaacacact 33600
cttcttcgtc ttctatcctg ccgcttagtg tgttccgtct gataattcaa gtacagccac 33660
actcttaagt tggtcaaaag aatgctggct tcagttgtaa tcaaaactcc atcatattta 33720
attgttctaa ggaaatcatc cacggtagca tatgcaaatc ccaaccaagc aatgcaactg 33780
gattgtgttt caagcagcag aggagaggga agagacggaa gaatcatgtt aatttttatt 33840
ccaaacgatc tcgcagtact tcaaattgta gatcgcgcag atggcatcta tcgcccccac 33900
tgtgttggtg aaaaagcaca gctaaatcaa aagaaatgcg attttcaagg tgctcaacgg 33960
tggcttccaa caaagcctcc acgcgcacat ccaaaaacaa aagaatacca aaagaaggag 34020
cattttctaa ctcctcaaac atcatattac attcctgcac cattcccaga taattttcag 34080
ctttccagcc ttgaattatt cgtgtcagtt cttgtggtaa atccaaacca cacattacaa 34140
acaggtcacg gagggcgccc tccaccacca ttcttaaaca caccctcata atgacaaaat 34200
atcttgctcc tgtgtcacct gtagcaaatt aagaatggca tcatcaattg acatgccctt 34260
ggctctaagt tcttctctaa gttctagttg taaatactct ctcatattat caccaaactg 34320
cttagccaaa agccccccgg gaacaatagc aggggacgct acagtgcagt acaagcgcag 34380
acctccccaa ttggctccag caaaaacaag attagaataa gcatactggg aaccaccagt 34440
aatatcatca aagttgctgg aaatataatc aggcagagtt tcttgtaaaa attgaataaa 34500
agaaaaattt tccaaagaaa cattcaaaat ctctgggatg caaatgcaat aggttaccgc 34560
gctgcgctcc aacattgtta gttttgaatt agtctgcaaa ataaaagaaa caagcgtcat 34620
atcatagtag cctgtcgaac aggtggataa atcagtcttt ccatcacaag acaagccaca 34680
gggtctccag ctcgaccctc gtaaaacctg tcatcgtgat taaacaacag caccgaaagt 34740
tcctcgcggt ggccagcatg aataattctt gatgaagcat ataatccaga catgttagca 34800
tcagttaaag agaaaaaaca gccaacatag cctctgggta taattatgct taatcttaag 34860
tatagcaaag ccacccctcg cggatacaaa gtaaaaggca caggagaata aaaaatataa 34920
ttatttctct gccgctgttc aggcaacgtc gcccccggtc catctaaata cacatacaaa 34980
gcctcatcag ccatggctta ccagacaaag aacagcgggc gcacaaagca caagctctaa 35040
agaagctcta aagacactct ccaacctctc cacaatatat acacaagccc taaactgacg 35100
taatgggagt aaagtataaa aaatcccgcc aagcccaaca cacaccccga aactgcgtca 35160
gcagggaaaa atacagtttc acttccgcat tcccaacaag cgtaagttcc tctttctcat 35220
ggtacgtcac atccgattaa cttgcaacgt cattttccca cggtcgcacc gcccctttta 35280
gccgttcacc ccgcagccaa tcaccacaca gcgcgcactt ttttaaatta cctcatttgc 35340
atattggcac cattccatct ataaggtata ttatatagat ag 35382
<210> 151
<211> 34775
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 34 sequence
<400> 151
catcatcaat aatatacctt atagatggaa tggtgccaat atgtaaatga ggtgatttta 60
aaaattgtgg ggtgtgtggt gattggctgt ggggttaacg gctaaacggg gcggcgcggc 120
cgtgggaaaa tgacgttttg tgggggtgga gtttttttgc aagttgtcgc gggaaatgtg 180
acgcataaaa aggctttttt tctcacggaa ctactgactt ttcccacggt atttaacagg 240
aaatgaggta gttttgaccg gatgcaagtg aaaattgctg atttgcgcgc gaaaactgaa 300
tgaggaagtg tttttctgaa taatgtggta tttatggcag ggtggagtat ttgttcaggg 360
ccaggtagac tttgacccat tacgtggagg tttcgattac cgtgtttttt acctgaattt 420
ccgcgtaccg tgtcaaagtc ttctgttttt acgtaggtgt cagctgatcg ctacggtatt 480
tatacctcag ggtttgtgtc aagaggccac tcttgagtgc cagcgagaag agttttctcc 540
tctgcgccgg cagtttaata ataaaaaaat gagagatttg cgatttctgc ctcaggaaat 600
aatttctgct gagactggaa atgaaatact ggagcttgtg gtgcacgccc tgatgggaga 660
cgatccggag ccacctgtgc agctttttga gcctcctacg cttcaggaac tgtatgattt 720
agaggtagag ggatcggagg attctaatga ggaagctgtg aatggctttt ttaccgattc 780
tatgctttta gctgctaatg aaggattaga attagatccg cctttggaca ctttcgatac 840
tccaggggtg attgtggaaa gcggtacagg tgtaagaaaa ttacctgatt tgggttccgt 900
ggactgtgat ttgcactgct atgaagacgg gtttcctccg agtgatgagg aggaccatga 960
aaaggagcag tctatgcaga ctgcagcggg tgagggagtg aaggctgcca gtgttggttt 1020
tcagttggat tgcccggagc ttcctggaca tggctgtaag tcttgtgaat ttcacaggaa 1080
aaatactgga gtaaaggaac tgttatgttc gctttgttat atgagagcgc actgccactt 1140
tatttacagt aagtgtgttt aagttaaaat ttaaaggaat atgctgtttt tcacatgtat 1200
attgagtggg agttttgtgc ttcttattat aggtcctgtg tctgatgctg atgagtcacc 1260
atctcctgat tctactacct cacctcctga gattcaagca cctgttcctg tggacgtgcg 1320
caagcccatt cctgtgaagc ttaagcctgg gaaacgtcca gcagtggaaa aacttgagga 1380
cttgttacag ggtggggacg gacctttgga cttgagtaca cggaaacggc caagacaata 1440
agtgttccat atccgtgttt acttaaggtg acgtcaatat ttgtgtgaga gtgcaatgta 1500
ataaaaatat gttaactgtt cactggtttt tattgctttt tgggcgggga ctcaggtata 1560
taagtagaag cagacctgta tggttagctc ataggagctg gctttcatcc atggaggttt 1620
gggccatttt ggaagacctt agaaagacta ggcaactgtt agaggacgct tcggacggag 1680
tctccggttt ttggagattc tggttcgcta gtgaattagc tagggtagtt tttaggataa 1740
aacaggacta taaagaagaa tttgaaaagt tgttggtaga ttgcccagga ctttttgaag 1800
ctcttaattt gggccatcaa gttcacttta aagaaaaagt tttatcagtt ttagactttt 1860
caaccccagg tagaactgcc gctgctgtgg cttttcttac ttttatatta gataaatgga 1920
tcccgcagac tcatttcagc aggggatacg ttttggattt cgtagccaca gcattgtgga 1980
gaacatggaa ggttcgcaag atgaggacaa tcttaggtta ctggccagtg cagcctttgg 2040
gtgtagcggg aatcctgagg catccaccgg tcatgccagc ggttctggag gaggaacagc 2100
aagaggacaa cccgagagcc ggcctggacc ctccagtgga ggaggcggag tagctgactt 2160
gtctcctgaa ctgcaacggg tgcttactgg atctacgtcc actggacggg ataggggcgt 2220
taagagggag agggcatcta gtggtactga tgctagatct gagttggctt taagtttaat 2280
gagtcgcaga cgtcctgaaa ccatttggtg gcatgaggtc cagaaagagg gaagggatga 2340
agtttctgta ttgcaggaga aatattcact ggaacaggtg aaaacatgtt ggttggagcc 2400
tgaggatgat tgggaggtgg ccattaaaaa ttatgccaag atagctttga ggcctgataa 2460
acagtataag attactagac ggattaatat ccggaatgct tgttacatat ctggaaatgg 2520
ggctgaggtg gtaatagata ctcaagacaa ggcagttatt agatgctgca tgatggatat 2580
gtggcctgga gtagtcggta tggaagcagt aacttttgta aatgttaagt ttaggggaga 2640
tggttataat ggaatagtgt ttatggccaa taccaaactt atattgcatg gttgtagctt 2700
ttttggtttc aacaatacct gtgtagatgc ctggggacag gttagtgtac ggggatgtag 2760
tttctatgcg tgttggattg ccacagctgg cagaaccaag agtcaattgt ctctgaagaa 2820
atgcatattc caaagatgta acctgggcat tctgaatgaa ggcgaagcaa gggtccgcca 2880
ctgcgcttct acagatactg gatgttttat tttaattaag ggcaatgcca gcgtaaagca 2940
taacatgatt tgcggtgctt ccgatgagag gccttatcaa atgctcactt gtgccggtgg 3000
gcattgtaat atgctggcta ctgtgcatat tgtttcccat caacgcaaaa aatggcctgt 3060
ttttgatcac aatgtgttga ccaagtgtac catgcatgca ggtgggcgta gaggaatgtt 3120
tatgccttac cagtgtaaca tgaatcatgt gaaagtgttg ttggaaccag atgccttttc 3180
cagaatgagc ctaacaggaa tctttgacat gaacatgcaa atctggaaga tcctgaggta 3240
tgatgatacg agatcgaggg tgcgcgcatg cgaatgcgga ggcaagcatg ccaggttcca 3300
gccggtgtgt gtagatgtga ctgaagatct gagaccggat catttggtta ttgcccgcac 3360
tggagcagag ttcggatcca gtggagaaga aactgactaa ggtgagtatt gggaaaactt 3420
ggggtggggt tttcagatgg acagattgag taaaaatttg ttttttctgt ctttcagctg 3480
tcatgagtgg aaacgcttct tttaaggggg gagtcttcag cccttatctg acagggcgtc 3540
tcccatcctg ggcaggagtt cgtcagaatg ttatgggatc tactgtggat ggaagacccg 3600
tccaacccgc caattcttca acgctgacct atgctacttt aagttcttca cctttggacg 3660
cagctgcagc cgccgccgcc gcctctgttg ccgctaacac tgtgcttgga atgggttact 3720
atggaagtat cgtggctaat tccacttcct ctaataaccc ttctaccctg actcaggaca 3780
agttacttgt ccttttggcc cagctggagg ctttgaccca acgtctgggt gaactttatc 3840
agcaggtggc cgagttgcga gtacaaactg agtctgctgt cggcacggca aagtctaaat 3900
aaaaaaaaat tccacaatca atgaataaat aaacgagctt gttgttgatt taaaatcaag 3960
tgtttttatt tcatttttcg cgcacggtat gccctagacc accgatctcg atcattgaga 4020
acacggtgga ttttttccag aatcctatag aggtgggatt gaatgtttag atacatgggc 4080
attaggccat ctttggggtg gagatagctc cattgaaggg attcatgctc cggggtagtg 4140
ttgtaaatca cccagtcata acaaggtcgc agtgcatggt gttgcacaat atcttttaga 4200
agtaggctga ttgccacaga taagcccttg gtgtaggtgt ttacaaaccg gttgagctgg 4260
gaggggtgca ttcggggtga aattatgtgc attttggatt ggatttttaa gttggcaata 4320
ttgccgccaa gatctcgtct tgggttcatg ttatgaagga ccaccaagac ggtgtatccg 4380
gtacatttag gaaatttatc gtgtagcttg gatggaaaag cgtggaaaaa tttggagaca 4440
cccttgtgtc ctccgagatt ttccatgcac tcatccatga taatagcaat ggggccgtgg 4500
gcagcagcgc gggcaaacac gttccgtggg tctgacacat catagttatg ttcctgagtt 4560
aaatcatcat aagccatttt aatgaatttg gggcggagag tacccgattg gggtatgaat 4620
gttccttcgg gccccggagc atagttcccc tcacagattt gcatttccca agctttcagt 4680
tccgatggtg gaatcatgtc cacctggggg gctatgaaga acaccgtttc tggggcgggg 4740
gtgattagtt gggatgatag caagtttctg agcaattgag atttgccaca tccggtgggg 4800
ccataaatga ttccgattac aggttgcagg tggtagttta gggaacggca actgccgtct 4860
tctcgaagca agggggccac ctcgttcatc atttccctta catgcatatt ttcccgcacc 4920
aaatccatta ggaggcgctc tcctcctagt gatagaagtt cttgtagtga ggaaaagttt 4980
ttcagcggtt ttagaccgtc agccatgggc attttggaga gagtttgctg caaaagttct 5040
agtctgttcc acagttcagt gatgtgttct atggcatctc gatccagcag acctcctcgt 5100
ttcgcgggtt tggacggctc ctggagtagg gtatgagacg atgggcgtcc agcgctgcca 5160
gggttcggtc cttccagggt ctcagtgttc gagtcagggt tgtttccgtc acagtgaagg 5220
ggtgtgcgcc tgcttgggcg cttgccaggg tgcgcttcag actcattctg ctggtggaga 5280
acttctgtcg cttggcgccc tgtatgtcgg ccaagtagca gtttaccatg agttcgtagt 5340
tgagcgcctc ggctgcgtgg cctttggcgc ggagcttacc tttggaagtt ttcttgcata 5400
ccgggcagta taggcatttc agcgcataca gcttgggcgc aaggaaaatg gattctgggg 5460
agtatgcatc tgcgccgcag gaggcgcaaa cagtttcaca ttccaccagc caggttaaat 5520
ccggttcatt ggggtcaaaa acaagttttc cgccatattt tttgatgcgt ttcttacctt 5580
tggtctccat gagttcgtgt cctcgttgag tgacaaacag gctgtccgta tccccgtaga 5640
ctgattttac aggcctcttc tccagtggag tgcctcggtc ttcttcgtac aggaactctg 5700
accactctga tacaaaggcg cgcgtccagg ccagcacaaa ggaggctatg tgggaggggt 5760
agcgatcgtt gtcaaccagg gggtccacct tttccaaagt atgcaaacac atgtcaccct 5820
cttcaacatc caggaatgtg attggcttgt aggtgtattt cacgtgacct ggggtccccg 5880
ctgggggggt ataaaagggg gcggttcttt gctcttcctc actgtcttcc ggatcgctgt 5940
ccaggaacgt cagctgttgg ggtaggtatt ccctctcgaa ggcgggcatg acctctgcac 6000
tcaggttgtc agtttctaag aacgaggagg atttgatatt gacagtgccg gttgagatgc 6060
ctttcatgag gttttcgtcc atttggtcag aaaacacaat ttttttattg tcaagtttgg 6120
tggcaaatga tccatacagg gcgttggata aaagtttggc aatggatcgc atggtttggt 6180
tcttttcctt gtccgcgcgc tctttggcag cgatgttgag ttggacatac tcgcgtgcta 6240
ggcacttcca ttcggggaag atagttgtca attcatctgg cacgattctc acttgccacc 6300
ctcgattatg caaggtaatt aaatccacac tggtggccac ctcgcctcga aggggttcgt 6360
tggtccaaca gagcctacct cctttcctag aacagaaagg gggaagtggg tctagcataa 6420
gttcatcggg agggtctgca tccatggtaa agattcccgg aagtaaatcc ttatcaaaat 6480
agctgatggg agtggggtca tctaaggcca tttgccattc tcgagctgcc agtgcacgct 6540
catatgggtt aaggggactg ccccagggca tgggatgggt gagtgcagag gcatacatgc 6600
cacagatgtc atagacgtag atgggatcct caaagatgcc tatataggtt ggatagcatc 6660
gcccccctct gatacttgct cgcacatagt catatagttc atgtgatggc gctagcaacc 6720
ccggacccaa gttggtgcga ttgggttttt ctgttctgta gacaatctgg cgaaagatgg 6780
cgtgagaatt ggaagagatg gtgggtcttt gaaaaatgtt gaaatgggca tgaggtagac 6840
ctacagagtc tctgacaaag tgggcataag attcttgaag cttggttacc agttcggcgg 6900
tgacaagtac gtctagggcg cagtagtcaa gtgtttcttg aatgatgtca taacctggtt 6960
ggtttttctt ttcccacagt tcgcggttga gaaggtattc ttcgcgatcc ttccagtact 7020
cttctagcgg aaacccgtct ttgtctgcac ggtaagatcc tagcatgtag aactgattaa 7080
ctgccttgta agggcagcag cccttctcta cgggtagaga gtatgcttga gcagcttttc 7140
gcagcgaagc gtgagtaagg gcgaaggtgt ctctgaccat gactttgaga aattggtatt 7200
tgaagtccat gtcgtcacag gctccctgtt cccagagttg gaagtctacc cgtttcttgt 7260
aggcggggtt gggcaaagcg aaagtaacat cgttgaagag aatcttaccg gctctgggca 7320
taaaattgcg agtgatgcgg aaaggctgtg gtacttccgc tcgattgttg atcacctggg 7380
cagctaggac gatctcgtcg aaaccgttga tgttgtgtcc tacgatgtat aattctatga 7440
aacgcggcgt gcctttgacg tgaggtagct tattgagctc atcaaaggtt aggtctgtag 7500
ggtcagataa ggcgtagtgt tcgagagccc attcgtgcag gtgaggattt gcatgtagga 7560
atgatgacca aagatccacc gccagtgctg tttgtaactg gtcccgatac tgacgaaaat 7620
gctggccaat tgccattttt tctggagtga cacagtagaa ggttctgggg tcttgttgcc 7680
atcgatccca ctttagttta atggctagat cgtgggccat gttgacgaga cgctcttctc 7740
ctgagagttt catgaccagc atgaaaggaa ctagttgttt gccaaaggac cccatccagg 7800
tgtaagtttc cacatcgtag gtcaggaaga gtctttctgt gcgaggatga gagccgatcg 7860
ggaagaactg gatttcctgc caccagttgg aggattggct gttgatgtga tggaagtaga 7920
agtttctgcg gcgcgccgag cattcgtgtt tgtgcttgta cagacggccg cagtagtcgc 7980
agcgttgcac gggttgtatc tcgtgaatga gctgtacctg gcttcccttg acgagaaatt 8040
tcagtgggaa gccgaggcct ggcgattgta tctcgtgctc ttctatattc gctgtatcgg 8100
cctgttcatc ttctgtttcg gtggtggtca tgctgacgag cccccgcggg aggcaagtcc 8160
agacctcggc gcgggagggg cggagctgaa ggaccagagc gcgcaggctg gagctgtcca 8220
gagtcctgag acgctgcgga ctcaggttag taggtaggga cagaagatta acttgcatga 8280
tcttttccag ggcgtgcggg aggttcagat ggtacttgat ttccacaggt tcgtttgtag 8340
agatgtcaat ggcttgcagg gttccgtgtc ctttgggcgc cactaccgta cctttgtttt 8400
ttcttttgat cggtggtggc tctcttgctt cttgcatgct cagaagcgat gacggggacg 8460
cgcgccgggc ggaagcggtt gttccggacc cggaggcatg gctggtagtg gcacgtcggc 8520
gccgcgcacg ggcaggttct ggtactgcgc tctgagaaga cttgcgtgcg ccaccacgcg 8580
tcgattgacg tcttgtatct gacgtctctg ggtgaaagct accggccccg tgagcttgaa 8640
cctgaaagag agttcaacag aatcaatttc ggtatcgtta acggcagctt gtctcagtat 8700
ttcttgtacg tcaccagagt tgtcctggta ggcgatctcc gccatgaact gctcgatttc 8760
ttcctcctga agatctccgc gacccgctct ctcgacggtg gccgcgaggt cattggagat 8820
acggcccatg agttgggaga atgcagtcat gcccgcctcg ttccagacgc ggctgtaaac 8880
cacggccccc tcggagtctc ttgcgcgcat caccacctga gcgaggttaa gctccacgtg 8940
tctggtgaag accgcatagt tgcataggcg ctgaaaaagg tagttgagtg tggtggcaat 9000
gtgttcggcg acgaagaaat acatgatcca tcgtctcagc ggcatttcgc tgacatcgcc 9060
cagagcttcc aagcgctcca tggcctcgta gaagtccacg gcaaaattaa aaaactggga 9120
gtttcgcgcg gacacggtca attcctcctc gagaagacgg atgagttcgg ctatggtggc 9180
ccgtacttcg cgttcgaagg ctcccgggat ctcttcttcc tcttctatct cttcttccac 9240
taacatctct tcttcgtctt caggcggggg cggagggggc acacggcgac gtcgacggcg 9300
cacgggcaaa cggtcgatga atcgttcaat gacctctccg cggcggcggc gcatggtttc 9360
agtgacggcg cggccgttct cgcgcggtcg cagagtaaaa acaccgccgc gcatctcctt 9420
aaagtggtga ctgggaggtt ctccgtttgg gagggagagg gcgctgatta tacattttat 9480
taattggccc gtagggactg cgcgcagaga tctgatcgtg tcaagatcca cgggatctga 9540
aaacctttcg acgaaagcgt ctaaccagtc acagtcacaa ggtaggctga gtacggcttc 9600
ttgtgggcgg gggtggttat gtgttcggtc tgggtcttct gtttcttctt catctcggga 9660
aggtgagacg atgctgctgg tgatgaaatt aaagtaggca gttctaagac ggcggatggt 9720
ggcgaggagc accaggtctt tgggtccggc ttgctggata cgcaggcgat tggccattcc 9780
ccaagcatta tcctgacatc tagcaagatc tttgtagtag tcttgcatga gccgttctac 9840
gggcacttct tcctcacccg ttctgccatg catacgtgtg agtccaaacc cgcgcattgg 9900
ttgtaccagt gccaagtcag ctacgactct ttcggcgagg atggcttgct gtacttgggt 9960
gagggtggct tgaaagtcat caaaatccac aaagcggtgg taagccccgg tattaatggt 10020
gtaagcacag ttggccatga ctgaccagtt aactgtctgg tgaccagggc gcacgagctc 10080
ggtgtattta aggcgcgaat aggcgcgggt gtcaaagatg taatcgttgc aggtgcgcac 10140
cagatactgg taacctataa gaaaatgcgg cggtggttgg cggtagagag gccatcgttc 10200
tgtagctgga gcgccggggg cgaggtcttc caacataagg cggtgatagc cgtagatgta 10260
cctggacatc caggtgattc ctgcggcggt agtagaagcc cgaggaaact cgcgtacgcg 10320
gttccaaatg ttgcgtagcg gcatgaagta gttcattgta ggcacggttt gaccagtgag 10380
gcgcgcgcag tcattgatgc tctatagaca cggagaaaat gaaagcgttc agcgactcga 10440
ctccgtagcc tggaggaacg tgaacgggtt gggtcgcggt gtaccccggt tcgagacttg 10500
tactcgagcc ggccggagcc gcggctaacg tggtattggc actcccgtct cgacccagcc 10560
tacaaaaatc caggatacgg aatcgagtcg ttttgctggt tgccgaatgg cagggaagtg 10620
agtcctattt tttttttttg ccgctcagat gcatcccgtg ctgcgacaga tgcgtcccca 10680
acaacagccc ccctcgcagc agcagcaacc acaaaaggct gtccctgcaa ctactgcaac 10740
tgccgctgtg agcggtgcgg gacagcccgc ctatgatctg gacttggaag agggcgaagg 10800
actggcacgt ctaggtgcgc cttcgcccga gcggcatccg cgagttcaac tgaaaaaaga 10860
ttctcgcgag gcgtatgtgc cccaacagaa cctatttaga gacagaagcg gcgaggagcc 10920
ggaggagatg cgagcttccc gctttaacgc gggtcgtgag ctgcgtcacg gtttggacag 10980
aagacgagtg ttgcgggacg aggatttcga agttgatgaa gtgacaggga tcagtcctgc 11040
cagggcacac gtggctgcag ccaaccttgt atcggcttac gaacagacag taaaggaaga 11100
gcgtaatttc caaaagtctt ttaataatca tgtgcgaacc ctcattgccc gcgaagaagt 11160
cacccttggt ttgatgcatt tgtgggattt gatggaagct atcattcaga accctactag 11220
caaacctctg accgcacagc tgtttctggt ggtgcaacac agcagagaca atgaggcttt 11280
cagagaggcg ctgctcaaca tcaccgaacc cgaggggaga tggttgtatg atcttatcaa 11340
cattctacag agtatcatag tgcaggagcg gagcctgggc ctggccgaga aggtggctgc 11400
catcaattac tcggttttga gcttgggaaa gtattacgct cgcaagatct acaagactcc 11460
atacgttccc atagacaagg aggtgaagat agatgggttc tacatgcgca tgacgctgaa 11520
ggtgttgacc ctgagcgatg atcttggggt gtaccgcaat gacagaatgc atcgcgcggt 11580
gagcgccagc aggaggcgcg agttaagcga cagggaactg atgcacagtt tgcaaagagc 11640
tctaactgga gctggaaccg agggtgagaa ttactttgat atgggagctg acttgcagtg 11700
gcagcctagt cgcagggctc tgaacgccgc gacggcagga tgtgagcttc cttacataga 11760
agaggcggat gaaggcgagg aggaagaggg cgagtacttg gaagactgat ggcacaaccc 11820
gtgttttttg ctagatggaa cagcaagcac cggatcccgc aatgcgggcg gcgctgcaga 11880
gccagccgtc cggcattaac tcctcggacg attggaccca ggccatgcaa cgtatcatgg 11940
cgttgacgac tcgcaacccc gaagccttta gacagcaacc ccaggccaac cgtctatcgg 12000
ccatcatgga agctgtagtg ccttcccgct ctaatcccac tcatgagaag gtcctggcca 12060
tcgtgaacgc gttggtggag aacaaagcta ttcgtccaga tgaggccgga ctggtataca 12120
acgctctctt agaacgcgtg gctcgctaca acagtagcaa tgtgcaaacc aatttggacc 12180
gtatgataac agatgtacgc gaagccgtgt ctcagcgcga aaggttccag cgcgatgcca 12240
acctgggttc gctggtggcg ttaaatgctt tcttgagtac tcagcctgct aatgtgccgc 12300
gtggtcaaca ggattatact aactttttaa gtgctttgag actgatggta tcagaagtac 12360
ctcagagcga agtatatcag tccggtcctg attacttctt tcagactagc agacagggct 12420
tgcagacggt aaatctgagc caagctttta aaaaccttaa aggtttgtgg ggagtgcatg 12480
ccccggtagg agaaagagca accgtgtcta gcttgttaac tccgaactcc cgcctattat 12540
tactgttggt agctcctttc accgacagcg gtagcatcga ccgtaattcc tatttgggtt 12600
acctactaaa cctgtatcgc gaagccatag ggcaaagtca ggtggacgag cagacctatc 12660
aagaaattac ccaagtcagt cgcgctttgg gacaggaaga cactggcagt ttggaagcca 12720
ctctgaactt cttgcttacc aatcggtctc aaaagatccc tcctcaatat gctcttactg 12780
cggaggagga gaggatcctt agatatgtgc agcagagcgt gggattgttt ctgatgcaag 12840
agggggcaac tccgactgca gcactggaca tgacagcgcg aaatatggag cccagcatgt 12900
atgccagtaa ccgacctttc attaacaaac tgctggacta cttgcacaga gctgccgcta 12960
tgaactctga ttatttcacc aatgccatct taaacccgca ctggctgccc ccacctggtt 13020
tctacacggg cgaatatgac atgcccgacc ctaatgacgg atttctgtgg gacgacgtgg 13080
acagcgatgt tttttcacct ctttctgatc atcgcacgtg gaaaaaggaa ggcggcgata 13140
gaatgcattc ttctgcatcg ctgtccgggg tcattggtgc taccgcggct gagcccgagt 13200
ctgcaagtcc ttttcctagt ctaccctttt ctctacacag tgtacgtagc agcgaagtgg 13260
gtagaataag tcgcccgagt ttaatgggcg aagaggagta cctaaacgat tccttgctca 13320
gaccggcaag agaaaaaaat ttcccaaaca atggaataga aagtttggtg gataaaatga 13380
gtagatggaa gacttatgct caggatcaca gagacgagcc tgggatcatg gggactacaa 13440
gtagagcgag ccgtagacgc cagcgccatg acagacagag gggtcttgtg tgggacgatg 13500
aggattcggc cgatgatagc agcgtattgg acttgggtgg gagaggaagg ggcaacccgt 13560
ttgctcattt gcgccctcgc ttgggtggta tgttgtaaaa aaaaataaaa aagaaaaaac 13620
tcaccaaggc catggcgacg agcgtacgtt cgttcttctt tattatctgt gtctagtata 13680
atgaggcgag tcgtgctagg cggagcggtg gtgtatccgg agggtcctcc tccttcgtac 13740
gagagcgtga tgcagcagca gcaggcgacg gcggtgatgc aatccccact ggaggctccc 13800
tttgtgcctc cgcgatacct ggcacctacg gagggcagaa acagcattcg ttactcggaa 13860
ctggcacctc agtacgatac caccaggttg tatctggtgg acaacaagtc ggcggacatt 13920
gcttctctga actatcagaa tgaccacagc aacttcttga ccacggtggt gcaaaacaat 13980
gactttaccc ctacggaagc cagcacccag accattaact ttgatgaacg atcgcggtgg 14040
ggcggtcagc taaaaaccat catgcatact aacatgccca acgtgaacga gtatatgttt 14100
agtaacaagt tcaaagcgcg tgtgatggtg tccagaaaac ctcctgaggg tgttagagta 14160
gacgataatt atgatcataa gcaagatatt ctaaaatacg agtggttcga gtttactttg 14220
ccagaaggca acttttcggt cactatgact atcgacttga tgaacaatgc catcatagac 14280
aattacttga aagtgggcag acagaatgga gtgttggaaa gtgacattgg tgttaagttc 14340
gacactagga acttcaagtt gggatgggat ccagaaacta agttgatcat gcctggggtt 14400
tacacctatg aggccttcca tcctgacatc gtattgctgc ctggctgcgg agtggacttt 14460
accgaaagcc gtctgagcaa ccttcttggc attagaaaga aacacccatt ccaagagggt 14520
tttaagatct tgtatgagga tttagaagga ggaaatattc cagccctttt ggatgtagat 14580
gcttatgaga acagcaagaa agatcaaaaa gccaaaatag aagctgctgc agaagctaaa 14640
gcaaacatag ttgccaacga tccggtaagg gtggctaacg ctagtgaaat caggggagac 14700
agttttgccg caacatccgt tccgactaaa gaatcattat tggatgatgt gtctcaaaac 14760
atagagttaa aactcactat taagcctgtg gaaaaagatg gcaaaaacag aagttacaat 14820
gtgttggaag ataaaatcaa cacggcctat cgcagttggt acctttcgta caattatggc 14880
gaccccgaaa aaggagtgcg ttcctggaca ttgctcacca cctcagatgt cacctgcgga 14940
gcggagcagg tctactggtc gcttccagac atgatgcagg atcctgtcac tttccgctcc 15000
actagacaag tcagtaacta ccctgtggtg ggtgcagagc ttatgcccgt cttttcaaag 15060
agcttctaca acgaacaagc tgtgtactcc cagcagctcc gccagtccac ctcgcttacg 15120
cacgtcttca accgctttcc tgagaaccag attttaatcc gtccgccggc gcccacaatt 15180
accaccgtca gtgaaaacgt tcctgctctc acagatcacg ggaccctgcc gttgcgcagc 15240
agtatccggg gagtccaacg tgtgaccgtt actgacgcca gacgccgcac ctgtccctac 15300
gtgtacaagg cactgggcat agtcgcaccg cgcgtccttt caagccgcac tttctaaaaa 15360
aaaaaaaaaa atgtccgttc ttatctcgcc cagtaataac accggttggg gtctgcgcgc 15420
tcccagcaag atgtacggag gcgcacgcaa acgttctacc caacatcccg tgcgtgttcg 15480
cgggcatttt cgcgctccat ggggtgccct caagggccgc actcgcgttc gaaccaccgt 15540
cgatgatgta atcgatcagg tggttgccga cgcccgtaat tatactccta ctgcgcctac 15600
atctactgtg gacgcagtta ttgacagtgt agtggctgac gctcgcaact atgctcgacg 15660
taagagccgg cgaaggcgca ttgccagacg tcaccgagct accactgcca tgcgagcagc 15720
aagagctctg ctacgaagag ctagacgcgt ggggcgaaga gccatgctta gggcggccag 15780
acgtgcagct tcgggcgcca gcgccggcag gtcccgcagg caagcagccg ctgtcgcagc 15840
ggcgactatt gccgacatgg cccaatcgcg aagaggcaat gtatactggg tgcgtgacgc 15900
tgccaccggt caacgtgtac ccgtgcgcac ccgtccccct cgcacttaga agatactgag 15960
cagtctccga tgttgtgtcc cagcggcgag gatgtccaag cgcaaataca aggaagaaat 16020
gctgcaggtt atcgcacctg aagtctacgg ccaaccgttg aaggatgaaa aaaaaccccg 16080
caaaatcaag cgggtaaaaa aggacaaaaa agaagaggaa gatggcgatg atgggctggc 16140
ggagtttgtg cgcgagtttg ccccacggcg acgcgtgcaa tggcgtgggc gcaaagttcg 16200
acatgtgttg agacctggaa cttcggtggt ctttacaccc ggcgagcgtt caagcgctac 16260
ttttaagcgt tcctatgatg aggtgtacgg ggatgatgat attcttgagc aggcagctga 16320
ccgattaggc gagtttgctt atggcaagcg tagtagaata aatcccaagg atgaaacagt 16380
gtccataccc ttggatcatg gaaatcccac ccctagtctt aaaccggtca ctttgcagca 16440
agtgttaccc gtaactccgc gaacaggtgt taaacgcgaa ggtgaagatt tgtatcccac 16500
tatgcaactg atggtgccca aacgccagaa gttggaggac gttttggaga aagtaaaagt 16560
ggatccagat attcaacctg aggttaaagt gagacccatt aagcaggtag cgcctggtct 16620
gggagtacaa actgtagaca ttaaaattcc cactgaaagt atggaagtgc aaactgaacc 16680
cgcaaagcct actgccacct ccactgaagt gcaaacggac ccatggatgc ccatgcctat 16740
tacaactgac gccgtcggtc ccactcgaag atcccgacga aagtacggtc cagcaagtct 16800
gttgatgccc aactatgtcg tacacccatc tattattcct actcctggtt accgaggcac 16860
tcgctactat cgcagccgaa acagtacttc ccgccgtcgc cgcaagacac ctgcaaatcg 16920
cagtcgtcgc cgtagacgca caagcaaacc gattcccggc gccctggtgc ggcaagtgta 16980
ccgcaatggt agtgcggaac ctttgacact gccgcgtgcg cgttaccatc ctagtatcat 17040
cacttaatca atgttgccgc tgcctccttg cagatatggc cctcacttgt cgccttcgcg 17100
ttcccatcac tggttaccga ggaagaaact cgcgccgtag aagagggatg ttggggcgcg 17160
gaatgcgacg ctacaggcga cggcgtgcta tccgcaagca attgcggggt ggttttttgc 17220
cagccttaat tccaattatc gctgctgcga ttggcgcaat accaggcata gcttccgtgg 17280
cggttcaggc ctcgcaacga cattgacatt ggaaaaaaaa aaaacgtata aataaaaaat 17340
acaatggact ctgacactcc tggtactgtg actatgtttt cttagagatg gaagacatca 17400
atttttcatc cttggctccg cgacacggca cgaagccgta catgggcacc tggagcgaca 17460
tcggcacgag ccaactgaac gggggcgcct tcaattggag cagtatctgg agcgggctta 17520
aaaattttgg ctcaaccata aaaacatacg ggaacaaagc ttggaacagc agtacaggac 17580
aggcgcttag aaataaactt aaagaccaga acttccaaca aaaagtagtc gatgggatag 17640
cttccggtat caatggagtg gtagatttgg ctaaccaggc tgtgcagaaa aagataaaca 17700
gtcgtttgga cccgccgcca gcaaccccag gtgaaatgca agtggaggaa gaaattcctc 17760
cgccagaaaa acgaggcgac aagcgtccgc gtcccgattt ggaagagacg ctggtgacgc 17820
gcgtagatga accgccttct tatgaggaag caacgaagct tggaatgccc accactagac 17880
cgatagcccc tatggccacc ggggtgatga aaccttctca gttgcatcga cccgtcacct 17940
tggatttgcc ccctcctcct gctgctactg ctgtacccgc ttctaagcct gtcgctgccc 18000
cgaaaccagt cgccgtagcc aggtcacgtc ccgggggcgc tcctcgtcca aatgcacact 18060
ggcaaaatac tctgaacagc atcgtgggtc taggcgtgca aagtgtaaaa cgccgtcgct 18120
gcttttaatt aaatatggag tagcgcttaa cttgcctatc tgtgtatatg tgtcattaca 18180
cgccgtcaca gcatcagagg aaaaaaggaa gaggtcgtgc gtcgacgctg agttactttc 18240
aagatggcca ccccatcgat gctgccccaa tgggcataca tgcacatcgc cggacaggat 18300
gcttcggagt acctgagtcc gggtctggtg cagttcgccc gcgccacaga cacctacttc 18360
aatctgggaa ataagtttag aaatcctacc gtagcgccga cccacgatgt gaccaccgat 18420
cgtagccagc ggctcatgtt gcgcttcgtg cccgttgacc gggaggacaa tacatactct 18480
tacaaagtgc ggtacaccct ggccgtgggc gacaacagag tgctggatat ggccagcacg 18540
ttctttgaca ttaggggcgt gttggacaga ggtcccagtt ttaaacccta ttctggtacg 18600
gcttacaact ccctggctcc taaaggcgct ccaaatgcat ctcagtggtt ggataaggga 18660
gttacaagca ctggcctagt ggacgacggc aatactgatg atggggaaga agccaaaaaa 18720
gcaacataca cttttggtaa tgctccagta aaagccgagg ctgaaatcac aaaagacgga 18780
ttgccggtgg gcttggaagt ttcaactgaa ggtcctaaac caatctatgc tgataagctt 18840
tatcagccag aacctcaagt gggagacgaa acttggactg acctagacgg aaaaaccgaa 18900
gagtatggag ggagggttct taaacctgaa actaaaatga aaccctgcta cggatctttt 18960
gctaaaccta ctaatattaa aggaggtcag gcaaaggtaa aaccaaaaga agacgatggc 19020
actaacaaca tcgagtatga cattgacatg aacttctttg acttaagatc acaaagatca 19080
gaactcaaac ctaaaattgt aatgtatgca gaaaatgtgg acctggaatg tccagatact 19140
catgttgtgt acaaacctgg agtttcagat gctagttctg agaccaatct tggacaacag 19200
tctatgccca acagacccaa ctacattggc ttcagagata acttcatcgg acttatgtac 19260
tataacagta ctggcaacat gggggtactg gctggccaag cgtctcagtt gaatgcagtg 19320
gttgacttgc aggacagaaa cacagaactg tcttaccaac tcttgcttga ctctctgggc 19380
gacagaacca gatactttag catgtggaat caggctgtgg acagttatga tcctgatgta 19440
cgtgttattg aaaatcatgg tgtggaagat gaacttccca actattgttt tccgttggat 19500
ggtgtcggtc cgcgaacaga tagttacaag gagattaagc caaatggaga ccaatctact 19560
tggacaaatg tagacccaac tggcagcagt gaacttgcta agggaaatcc atttgccatg 19620
gaaattaacc ttcaagccaa tctatggcga agtttccttt attccaatgt ggctctatat 19680
ctcccagact cgtacaaata caccccgtcc aatgtcactc ttccagaaaa caaaaacacc 19740
tacgactaca tgaacgggcg ggtggtgccg ccatctctag tagacaccta tgtgaacatt 19800
ggtgccaggt ggtctctgga tgccatggac aatgtcaacc cattcaacca ccaccgtaac 19860
gctggcttgc gttaccgatc catgcttctg ggtaacggac gttatgtgcc tttccacata 19920
caagtgcctc aaaaattctt cgctgttaaa aacctgctgc ttctcccagg ctcctacact 19980
tatgagtgga actttaggaa ggatgtaaac atggttctac agagttccct cggtaacgac 20040
ctacgggtag atggcgccag catcagtttt acgagcatca acctctatgc tacttttttc 20100
cccatggctc acaacaccgc ttccaccctt gaagccatgc tgcggaatga caccaatgat 20160
cagtcattca acgactacct atctgcagct aacatgctct accccattcc tgccaatgca 20220
accaatattc ccatttccat tccttctcgc aactgggcgg ctttcagagg ctggtcattt 20280
accagactga aaaccaaaga aactccctct ttggggtctg gatttgaccc ctacttcgtc 20340
tattctggtt ctattcccta cctggatggt accttctacc tgaaccacac ttttaagaag 20400
gtttccatca tgtttgactc ttcagtgagc tggcctggaa atgacaggtt actatctcct 20460
aacgaatttg aaataaagcg cactgtggat ggcgaaggct acaacgtagc ccaatgcaac 20520
atgaccaaag actggttctt ggtacagatg ctcgccaact acaacatcgg ctatcagggc 20580
ttctacattc cagaaggata caaagatcgc atgtattcat ttttcagaaa cttccagccc 20640
atgagcaggc aggtggttga tgaggtcaat tacaaagact tcaaggccgt cgccataccc 20700
taccaacaca acaactctgg ctttgtgggt tacatggctc cgaccatgcg tcaaggtcaa 20760
ccctatcccg ctaactatcc ctatccactc attggaacaa ctgccgtaaa tagtgttacg 20820
cagaaaaagt tcttgtgtga cagaaccatg tggcgcatac cgttctcaag caacttcatg 20880
tctatgggag cccttacaga cttgggacag aacatgctct atgccaactc agctcatgct 20940
ctggacatga cctttgaggt ggatcccatg gatgagccca ccctgcttta tcttctcttc 21000
gaagttttcg acgtggtcag agtgcatcag ccacaccgcg gcatcatcga ggcagtctac 21060
ctgcgtacac cgttctcggc cggtaacgct accacgtaag aagcttcttg cttcttgcaa 21120
acagcagctg caaccatggc ctgcggatcc caaaacggct ccagcgagca agagctcaga 21180
gccattgtcc aagacctggg ttgcggacca tattttttgg gaacctttga taagcgcttc 21240
ccggggttca tggcccccga taagctcgcc tgtgccattg taaatacggc cggacgtgag 21300
acggggggag agcactggtt ggctttcggt tggaacccac gttctaacac ctgctacctt 21360
tttgatcctt ttggattctc ggatgatcgt ctcaaacaga tttaccagtt tgaatatgag 21420
ggtctcctgc gccgcagcgc tcttgctacc aaggaccggt gtattacgct ggaaaaatct 21480
acccagaccg tgcagggccc ccgttctgcc gcctgcggac ttttctgctg catgttcctt 21540
catgcctttg tgcactggcc tgaccgtccc atggacggaa accccaccat gaaattgcta 21600
actggagtgc caaacaacat gcttcattct cctaaagtcc agcccaccct gtgtgacaat 21660
caaaaagcac tctaccattt tctcaatacc cattcgcctt attttcgctc tcatcgtaca 21720
cacatcgaaa gggccactgc gttcgaccgt atggatgtgc aataatgatt catgtaaaca 21780
acgtgttcaa taaacagcac tttatttttt acatgtatcg aggctctgga ttacttattt 21840
atttacaagt cgaatgggtt ctgacgagaa tcagaatgac ccgcaggcag tgatacgttg 21900
cggaactgat acttgggttg ccacttgaat tcgggaatca ccaacttggg aaccggtata 21960
tcgggcagga tgtcactcca cagctttctg gtcagctgca aagctcccag caggtcagga 22020
gccgaaatct tgaaatcaca attaggacca gtgctctgag cgcgagagtt gcggtacacc 22080
ggattgcagc actgaaacac catcagcgac ggatgtctta cgcttgccag cacggtggga 22140
tctgcaatca tgcccacatc cagatcttca gcattggcaa tgctgaacgg ggtcatcttg 22200
caggtctgcc tacccatggc gggcacccaa ttaggcttgt ggttacaatc gcagtgcagg 22260
gggatcagta tcatcttggc ctgatcctgt ctgattcctg gatacacggc tctcatgaaa 22320
gcatcatatt gcttgaaagc ctgctgggct ttactaccct cggtataaaa catcccgcag 22380
gacctgctcg aaaactggtt agctgcgcag ccggcatcat tcacacagca gcgggcgtca 22440
ttgttggcta tttgcaccac acttctgccc cagcggtttt gggtgatttt ggttcgctcg 22500
ggattctcct tcaaggctcg ttgtccgttc tcgctggcca catccatctc gataatctgc 22560
tccttctgaa tcataatatt gccatgcaag cacttcagct tgccctcata atcattgcag 22620
ccatgaggcc acaacgcaca gcctgtacat tcccaattat ggtgggcgat ctgagaaaaa 22680
gaatgtatca ttccctgcag aaatcttccc atcatcgtgc tcagtgtctt gtgactagtg 22740
aaagttaact ggatgcctcg gtgctcctcg ttcacgtact ggtgacagat gcgcttgtat 22800
tgttcgtgct gctcaggcat tagtttaaaa gaggttctaa gttcgttatc cagcctgtac 22860
ttctccatca gcagacacat cacttccatg cctttctccc aagcagacac caggggcaag 22920
ctaatcggat tcttaacagt gcaggcagca gctcctttag ccagagggtc atctttggcg 22980
atcttctcaa tgcttctttt gccatccttc tcaacgatgc gcacgggcgg gtagctgaaa 23040
cccactgcta caagttgcgc ctcttctctt tcttcttcgc tgtcttgact gatgtcttgc 23100
atggggacat gtttggtctt ccttggcttc tttttcgggg gtatcggagg aggaggactg 23160
tcgctccgtt ccggagacag ggaggattgt gacgtttcgc tcaccattac caactgactg 23220
tcggtagaag aacctgaccc cacacggcga caggtgtttc tcttcggggg cagaggtgga 23280
ggcgattgcg aagggctgcg gtccgacctg gaaggcggat gactggcaga accccttccg 23340
cgttcggggg tgtgctccct gtggcggtcg cttaactgat ttccttcgcg gctggccatt 23400
gtgttctcct aggcagagaa acaacagaca tggaaactca gccattgctg tcaacatcgc 23460
cacgagtgcc atcacatctc gtcctcagcg acgaggaaaa ggagcagagc ttaagcattc 23520
caccgcccag tcctgccacc acctctaccc tagaagataa ggaggtcgac gcatctcatg 23580
acatgcagaa taaaaaagcg aaagagtctg agccagacat cgaacaagac ccgggctatg 23640
tgacaccggt ggaacacgag gaagagttga aacgctttct agagagagag gatgaaaact 23700
gcccaaaaca gcaagcggat aactatcacc aagatgctgg aaatagggat cagaacaccg 23760
actacctcat agggcttgac ggggaagacg cgctccttaa acatctagca agacagtcac 23820
tcatagtcaa ggatgcatta ttggacagaa ctgaagtgcc catcagtgtc gaagagctca 23880
gccgcgccta cgagcttaac ctattttcac ctcgtactcc ccccaaacgt cagccaaacg 23940
gcacctgcga gccaaatcct cgcttaaact tttatccagc ttttgctgtg ccagaagtac 24000
tggctaccta tcacatcttt tttaaaaatc aaaaaattcc agtctcctgc cgcgctaatc 24060
gcacccgcgc cgatgcccta ctcaatctgg gacctggttc acgcttacct gatatagctt 24120
ccttggaaga ggttccaaag atcttcgagg gtctgggcaa taatgagact cgggccgcaa 24180
atgctctgca aaagggagaa aatggcatgg atgagcatca cagcgttctg gtggaattgg 24240
aaggcgataa tgccagactc gcagtactca agcgaagcgt cgaggtcaca cactttgcat 24300
accccgctgt caacctgccc cctaaagtca tgacggccgt catggaccag ttactcatta 24360
agcgcgcaag tcccctttca gaagacatgc atgacccaga tgcctgtgat gagggtaaac 24420
cagtggtcag tgatgagcag ctaacccgat ggctgggcac cgactctccc cgggatttgg 24480
aagagcgtcg caagcttatg atggccgtgg tgctggttac cgtagaacta gagtgtcttc 24540
ggcgtttctt taccgattca gaaaccttgc gcaaactcga agagaatctg cactacactt 24600
ttagacacgg ctttgtgcgg caggcatgca agatatctaa cgtggaactc accaacctgg 24660
tttcctacat gggtattctg catgagaatc gcctaggaca aagcgtgctg cacagcaccc 24720
ttaaggggga agcccgccgt gattacatcc gcgattgtgt ttatctctac ctgtgccaca 24780
cgtggcaaac cggcatgggt gtatggcagc aatgtttaga agaacagaac ctgaaagagc 24840
taaacaagct cttacagaaa tctcttaagg ttctgtggac agggttcgac gagcgcaccg 24900
tcgcttccga cctggcagac ctcatcttcc cagagcgtct cagggttact ttgcgaaacg 24960
gactgcctga ctttatgagc cagagcatgc ttaacaattt tcgctctttc atcctggaac 25020
gctccggtat cctgcccgcc acctgctgcg cactgccctc cgactttgtg cctctcacct 25080
accgcgaatg ccccccgccg ctatggagtc actgctacct gttccgtctg gccaactacc 25140
tctcctacca ctcggatgtg atcgaggatg tgagcggaga cggcttgctg gagtgtcact 25200
gccgctgcaa tctgtgcacg ccccaccggt ccctagcttg caacccccag ttgatgagcg 25260
aaacccagat aataggcacc tttgaattgc aaggccccag cagccaaggc gatgggtctt 25320
ctcctgggca aagtttaaaa ctgaccccgg gactgtggac ctccgcctac ttgcgcaagt 25380
ttgccccgga agattaccac ccctatgaaa tcaagttcta tgaggaccaa tcacagcctc 25440
cgaaagccga actttcggcc tgcgtcatca cccagggggc aattctggcc caattgcaag 25500
ccatccaaaa atcccgccaa gaatttctac tgaaaaaggg taagggggtc taccttgacc 25560
cccagaccgg cgaggaactc aacacaaggt tccctcagga tgtcccaacg acgagaaagc 25620
aagaagttga aggtgcagcc gccgccccca gaagatatgg aggaagattg ggacagtcag 25680
gcagaggaag cggaggagga ggacagtctg gaggacagtc tggaggaaga cagtttggag 25740
gaggaaaacg aggaggcaga ggaggtggaa gaagtaaccg ccgacaaaca gttatcctcg 25800
gctgcggaga caagcaacag cgctaccatc tccgctccga gtcgaggaac ccggcggcgt 25860
cccagcagta gatgggacga gaccggacgc ttcccgaacc caaccagcgc ttccaagacc 25920
ggtaagaagg atcggcaggg atacaagtcc tggcgggggc ataagaatgc catcatctcc 25980
tgcttgcatg agtgcggggg caacatatcc ttcacgcggc gctacttgct attccaccat 26040
ggggtgaact ttccgcgcaa tgttttgcat tactaccgtc acctccacag cccctactat 26100
agccagcaaa tcccggcagt ctcgacagat aaagacagcg gcggcgacct ccaacagaaa 26160
accagcagcg gcagttagaa aatacacaac aagtgcagca acaggaggat taaagattac 26220
agccaacgag ccagcgcaaa cccgagagtt aagaaatcgg atctttccaa ccctgtatgc 26280
catcttccag cagagtcggg gccaagagca ggaactgaaa ataaaaaacc gatctctgcg 26340
ttcgctcacc agaagttgtt tgtatcacaa gagcgaagat caacttcagc gcactctcga 26400
ggacgccgag gctctcttca acaagtactg cgcgctgact cttaaagagt aggcagcgac 26460
cgcgcttatt caaaaaaggc gggaattaca tcatcctcga catgagtaaa gaaattccca 26520
cgccttacat gtggagttat cagccccaaa tgggattggc ggcaggcgcc tcccaggact 26580
actccacccg catgaattgg ctcagcgccg ggccttctat gatttctcga gttaatgata 26640
tacgcgccta ccgaaaccaa atacttttgg aacagtcagc tcttaccacc acgccccgcc 26700
aacaccttaa tcccagaaat tggcccgccg ccctagtgta ccaggaaagt cccgctccca 26760
ccactgtatt acttcctcga gacgcccagg ccgaagtcca aatgactaat gcaggtgcgc 26820
agttagcggg cggctccacc ctatgtcgtc acaggcctcg gcataatata aaacgcctga 26880
tgatcagagg ccgaggtatc cagctcaacg acgagtcggt gagctctccg cttggtctac 26940
gaccagacgg aatctttcag attgccggct gcgggagatc ttccttcacc cctcgtcagg 27000
ctgttctgac tttggaaagt tcgtcttcgc aaccccgctc gggcggaatc gggaccgttc 27060
aatttgtgga ggagtttact ccctctgtct acttcaaccc cttctccgga tctcctgggc 27120
actacccgga cgagttcata ccgaacttcg acgcgattag cgagtcagtg gacggctacg 27180
attgatgtct ggtgacgcgg ctgagctatc tcggctgcga catctagacc actgccgccg 27240
ctttcgctgc tttgcccggg aactcattga gttcatctac ttcgaactcc ccaaggatca 27300
ccctcaaggt ccggcccacg gagtgcggat tactatcgaa ggcaaaatac actctcgcct 27360
gcaacgaatt ttctcccagc ggcccgtgct gatcgagcga gaccagggaa acaccacggt 27420
ttccatctac tgcatttgta atcaccccgg attgcatgaa agcctttgct gtcttatgtg 27480
tactgagttt aataaaaact gaattaagac tctcctacgg actgccgctt cttcaacccg 27540
gattttacaa ccagaagaac gaaacttttc ctgtcgtcca ggactctgtt aacttcacct 27600
ttcctactca caaactagaa gctcaacgac tacaccgctt ttccagaagc attttcccta 27660
ctaatactac tttcaaaacc ggaggtgagc tccaaggtct tcctacagaa aacccttggg 27720
tggaagcggg ccttgtagtg ctaggaattc ttgcgggtgg gcttgtgatt attctttgct 27780
acctatacac accttgcttc actttcctag tggtgttgtg gtattggttt aaaaaatggg 27840
gcccatacta gtcttgcttg ttttactttc gcttttggaa ccgggttctg ccaattacga 27900
tccatgtcta gacttcgacc cagaaaactg cacacttact tttgcacccg acacaagccg 27960
catctgtgga gttcttatta agtgcggatg ggaatgcagg tccgttgaaa ttacacacaa 28020
taacaaaacc tggaacaata ccttatccac cacatgggag ccaggagttc ccgagtggta 28080
cactgtctct gtccgaggtc ctgacggttc catccgcatt agtaacaaca ctttcatttt 28140
ttctgaaatg tgcgatctgg ccatgttcat gagcaaacag tattctctat ggcctcctag 28200
caaggacaac atcgtaacgt tctccattgc ttattgcttg tgcgcttgcc ttcttactgc 28260
tttactgtgc gtatgcatac acctgcttgt aaccactcgc atcaaaaacg ccaataacaa 28320
agaaaaaatg ccttaacctc tttctgttta cagacatggc ttctcttaca tctctcatat 28380
ttgtcagcat tgtcactgcc gctcacggac aaacagtcgt ctctatccct ctaggacata 28440
attacactct cataggaccc ccaatcactt cagaggtcat ctggaccaaa ctgggaagcg 28500
ttgattactt tgatataatc tgcaacaaaa caaaaccaat aatagtaact tgcaacatac 28560
aaaatcttac attgattaat gttagcaaag tttacagcgg ttactattat ggttatgaca 28620
gatacagtag tcaatataga aattacttgg ttcgtgttac ccagttaaaa accacgaaaa 28680
tgccaaatat ggcaaagatt cgatccgatg acaattctct agaaactttt acatctccca 28740
ccacacccga cgaaaaaaac atcccagatt caatgattgc aattgttgca gcggtggcag 28800
tggtgatggc actaataata atatgcatgc ttttatatgc ttgtcgctac aaaaagtttc 28860
atcctaaaaa acaagatctc ctactaaggc ttaacattta atttcttttt atacagccat 28920
ggtttccact accacattcc ttatgcttac tagtcttgca actctgactt ctgctcgctc 28980
acacctcact gtaactatag gctcaaactg cacactaaaa ggacctcaag gtggtcatgt 29040
cttttggtgg agaatatatg acaatggatg gtttacaaaa ccatgtgacc aacctggtag 29100
atttttctgc aacggcagag acctaaccat tatcaacgtg acagcaaatg acaaaggctt 29160
ctattatgga accgactata aaagtagttt agattataac attattgtac tgccatctac 29220
cactccagca ccccgcacaa ctactttctc tagcagcagt gtcgctaaca atacaatttc 29280
caatccaacc tttgccgcgc ttttaaaacg cactgtgaat aattctacaa cttcacatac 29340
aacaatttcc acttcaacaa tcagcattat cgctgcagtg acaattggaa tatctattct 29400
tgtttttacc ataacctact acgcctgctg ctatagaaaa gacaaacata aaggtgatcc 29460
attacttaga tttgatattt aatttgttct tttttttttt atttacagta tggtgaacac 29520
caatcatggt acctagaaat ttcttcttca ccatactcat ttgtgcattt aatgtttgcg 29580
ctactttcac agcagtagcc acagcaaccc cagactgtat aggagcattt gcttcctatg 29640
cactttttgc ttttgttact tgcatctgcg tatgtagcat agtctgcctg gttattaatt 29700
ttttccaact tctagactgg atccttgtgc gaattgccta cctgcgccac catcccgaat 29760
accgcaacca aaatatcgcg gcacttctta gactcatcta aaaccatgca ggctatacta 29820
ccaatatttt tgcttctatt gcttccctac gctgtctcaa ccccagctgc ctatagtact 29880
ccaccagaac accttagaaa atgcaaattc caacaaccgt ggtcatttct tgcttgctat 29940
cgagaaaaat cagaaattcc cccaaattta ataatgattg ctggaataat taatataatc 30000
tgttgcacca taatttcatt tttgatatac cccctatttg attttggctg gaatgctccc 30060
aatgcacatg atcatccaca agacccagag gaacacattc ccctacaaaa catgcaacat 30120
ccaatagcgc taatagatta cgaaagtgaa ccacaacccc cactactccc tgctattagt 30180
tacttcaacc taaccggcgg agatgactga aacactcacc acctccaatt ccgccgagga 30240
tctgctcgat atggacggcc gcgtctcaga acagcgactt gcccaactac gcatccgcca 30300
gcagcaggaa cgcgcggcca aagagctcag agatgtcatc caaattcacc aatgcaaaaa 30360
aggcatattc tgtttggtaa aacaagccaa gatatcctac gagatcaccg ctactgacca 30420
tcgcctctct tacgaacttg gcccccaacg acaaaaattt acctgcatgg tgggaatcaa 30480
ccccatagtt atcacccagc aaagtggaga tactaagggt tgcattcact gctcctgcga 30540
ttccatcgag tgcacctaca ccctgctgaa gaccctatgc ggcctaagag acctgctacc 30600
aatgaattaa aaaatgatta ataaaaaatc acttacttga aatcagcaat aaggtctctg 30660
ttgaaatttt ctcccagcag cacctcactt ccctcttccc aactctggta ttctaaaccc 30720
cgttcagcgg catactttct ccatacttta aaggggatgt caaattttag ctcctctcct 30780
gtacccacaa tcttcatgtc tttcttccca gatgaccaag agagtccggc tcagtgactc 30840
cttcaaccct gtctacccct atgaagatga aagcacctcc caacacccct ttataaaccc 30900
agggtttatt tccccaaatg gcttcacaca aagcccagac ggagttctta ctttaaaatg 30960
tttaacccca ctaacaacca caggcggatc tctacagcta aaagtgggag ggggacttac 31020
agtggatgac actgatggta ccttacaaga aaacatacgt gctacagcac ccattactaa 31080
aaataatcac tctgtagaac tatccattgg aaatggatta gaaactcaaa acaataaact 31140
atgtgccaaa ttgggaaatg ggttaaaatt taacaacggt gacatttgta taaaggatag 31200
tattaacacc ttatggactg gaataaaccc tccacctaac tgtcaaattg tggaaaacac 31260
taatacaaat gatggcaaac ttactttagt attagtaaaa aacggagggc ttgttaatgg 31320
ctacgtgtct ctagttggtg tatcagacac tgtgaaccaa atgttcacac aaaagacagc 31380
aaacatccaa ttaagattat attttgactc ttctggaaat ctattaactg atgaatcaga 31440
cttaaaaatt ccacttaaaa ataaatcttc tacagcgacc agtgaaactg tagccagcag 31500
caaagccttt atgccaagta ctacagctta tcccttcaac accactacta gggatagtga 31560
aaactacatt catggaatat gttactacat gactagttat gatagaagtc tatttccctt 31620
gaacatttct ataatgctaa acagccgtat gatttcttcc aatgttgcct atgccataca 31680
atttgaatgg aatctaaatg caagtgaatc tccagaaagc aacatagcta cgctgaccac 31740
atcccccttt ttcttttctt acattacaga agacgacaac taaaataaag tttaagtgtt 31800
tttatttaaa atcacaaaat tcgagtagtt attttgcctc caccttccca tttgacagaa 31860
tacaccaatc tctccccacg cacagcttta aacatttgga taccattaga gatagacatt 31920
gttttagatt ccacattcca aacagtttca gagcgagcca atctggggtc agtgatagat 31980
aaaaatccat cgcgatagtc ttttaaagcg ctttcacagt ccaactgctg cggatgcgaa 32040
tccggagtct ggatcacggt catctggaag aagaacgatg ggaatcataa tccgaaaacg 32100
gtatcggacg attgtgtctc atcaaaccca caagcagccg ctgtctgcgt cgctccgtgc 32160
aactgctgtt tatgggatca gggtccacag tgtcctgaag catgatttta atagccctta 32220
acatcaactt tctggtgcga tgcgcgcagc aacgcattct gatttcactc aaatctttgc 32280
agtaggtaca acacattatt acaatattgt ttaataaacc ataattaaaa gcgctccagc 32340
caaaactcat atctgatata atcgcccctg catgaccatc ataccaaagt ttaatataaa 32400
ttaaatgacg ttccctcaaa aacacactac ccacatacat gatctctttt ggcatgtgca 32460
tattaacaat ctgtctgtac catggacaac gttggttaat catgcaaccc aatataacct 32520
tccggaacca cactgccaac accgctcccc cagccatgca ttgaagtgaa ccctgctgat 32580
tacaatgaca atgaagaacc caattctctc gaccgtgaat cacttgagaa tgaaaaatat 32640
ctatagtggc acaacataga cataaatgca tgcatcttct cataattttt aactcctcag 32700
gatttagaaa catatcccag ggaataggaa gctcttgcag aacagtaaag ctggcagaac 32760
aaggaagacc acgaacacaa cttacactat gcatagtcat agtatcacaa tctggcaaca 32820
gcgggtggtc ttcagtcata gaagctcggg tttcattttc ctcacaacgt ggtaactggg 32880
ctctggtgta agggtgatgt ctggcgcatg atgtcgagcg tgcgcgcaac cttgtcataa 32940
tggagttgct tcctgacatt ctcgtatttt gtatagcaaa acgcggccct ggcagaacac 33000
actcttcttc gccttctatc ctgccgctta gcgtgttccg tgtgatagtt caagtacagc 33060
cacactctta agttggtcaa aagaatgctg gcttcagttg taatcaaaac tccatcgcat 33120
ctaattgttc tgaggaaatc atccacggta gcatatgcaa atcccaacca agcaatgcaa 33180
ctggattgcg tttcaagcag gagaggagag ggaagagacg gaagaaccat gttaattttt 33240
attccaaacg atctcgcagt acttcaaatt gtagatcgcg cagatggcat ctctcgcccc 33300
cactgtgttg gtgaaaaagc acagctaaat caaaagaaat gcgattttca aggtgctcaa 33360
cggtggcttc caacaaagcc tccacgcgca catccaagaa caaaagaata ccaaaagaag 33420
gagcattttc taactcctca atcatcatat tacattcctg caccattccc agataatttt 33480
cagctttcca gccttgaatt attcgtgtca gttcttgtgg taaatccaat ccacacatta 33540
caaacaggtc ccggagggcg ccctccacca ccattcttaa acacaccctc ataatgacaa 33600
aatatcttgc tcctgtgtca cctgtagcga attgagaatg gcaacatcaa ttgacatgcc 33660
cttggctcta agttcttctt taagttctag ttgtaaaaac tctctcatat tatcaccaaa 33720
ctgcttagcc agaagccccc cgggaacaag agcaggggac gctacagtgc agtacaagcg 33780
cagacctccc caattggctc cagcaaaaac aagattggaa taagcatatt gggaaccgcc 33840
agtaatatca tcgaagttgc tggaaatata atcaggcaga gtttcttgta aaaattgaat 33900
aaaagaaaaa tttgccaaaa aaacattcaa aacctctggg atgcaaatgc aataggttac 33960
cgcgctgcgc tccaacattg ttagttttga attagtctgc aaaaataaaa aaaaaaacaa 34020
gcgtcatatc atagtagcct gacgaacagg tggataaatc agtctttcca tcacaagaca 34080
agccacaggg tctccagctc gaccctcgta aaacctgtca tggtgattaa acaacagcac 34140
cgaaagttcc tcgcggtgac cagcatgaat aattcttgat gaagcataca atccagacat 34200
gttagcatca gttaacgaga aaaaacagcc aacatagcct ttgggtataa ttatgcttaa 34260
tcgtaagtat agcaaagcca cccctcgcgg atacaaagta aaaggcacag gagaataaaa 34320
aatataatta tttctctgct gctgttcagg caacgtcgcc cccggtccct ctaaatacac 34380
atacaaagcc tcatcagcca tggcttacca gacaaagtac agcgggcacg cacaagctct 34440
aaagtcactc tccaacctct ccacaatata tatacacaag ccctaaactg acgtaatggg 34500
agtaaagtgt aaaaaatccc gccaaaccca acacacaccc cgaaactgcg tcaccaggga 34560
aaagtacagt ttcacttccg caatcccaac aagcgtcact tcctctttct cacggtacgt 34620
cacatcccat taacttgcaa cgtcattttc ccacggccgc gccgccccgt ttagccgtta 34680
accccacagc caatcaccac acaccccaca atttttaaaa tcacctcatt tacatattgg 34740
caccattcca tctataaggt atattattga tgatg 34775
<210> 152
<211> 35213
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus D37 sequence
<400> 152
catcatcata atatacccca caaagtaaac aaaagttaat atgcaaatga gcttttgaat 60
tttaacggtt ttggggcgga gccaacgctg attggacgag aagcggtgat gcaaataacg 120
tcacgacgca cggctaacgg ccggcgcgga ggcgtggcct aggccggaag caagtcgcgg 180
ggctaatgac gtataaaaaa gcggacttta gacccggaaa cggccgattt tcccgcggcc 240
acgcccggat atgaggtaat tctgggcgga tgcaagtgaa attaggtcat tttggcgcca 300
aaactgaatg aggaagtgaa aagtgaaaaa tacctgtccc gcccagggcg gaatatttac 360
cgagggccga gagactttga ccgattacgt ggggtttcga ttgcggtgtt tttttcgcga 420
atttccgcgt ccgtgtgaaa gtccggtgtt tatgtcacag atcagctgat ccacagggta 480
tttaaaccag ttgagcccgt caagaggcca ctcttgagtg ccagcgagta gagatttctc 540
tgagctccgc tcccaaagtg tgagaaaaat gagacacctg cgcctcctgt cttcaactgt 600
gcctattaac atggccgcat tattgctgga ggactatgtg agtacagtat tggaggacga 660
actacatcca tctccatttg agctgggacc tacacttcag gacctttatg atttggaggt 720
agatgcccat gatgacgacc caaacgaaga ggctgtgaat ttaatatttc cagaatctct 780
gattcttcag gctgacatag ccagcgaagc tgtacctaca ccacttcata caccgacttt 840
gtcacccata cctgaattgg aagaggagga cgagttagac ctccgatgtt atgaggaagg 900
ttttcctccc agcgattcag aggacgaaca gggtgagcag agcatggctc taatctcaga 960
atatgcttgt gtggttgtgg aagagcattt tgtgttggac aatcctgagg tgcccgggca 1020
aggctgtaga tcctgccagt accaccggga taagaccgga gacacaaacg cctcctgcgc 1080
tctgtgttac atgaaaaaga acttcagctt tatttacagt aagtggagtg aatgtgagag 1140
aggctgagtg cttaacacat aactgggtga tgcttaaaca gctgtgctaa gtgtggttta 1200
tttttgtttc taggtccggt gtcagaggat gagtcatcac cctcagaaga aaaccacccg 1260
tgtccccctg agctgtcagg cgaaacgccc ctgcaagtgc acaaacccac cccagtcaga 1320
cccagtggcg agaggcgagc agctgttgaa aaaattgagg acttgttaca tgacatgggt 1380
ggggatgaac ctttggacct gagcttgaaa cgccccagga actaggcgca gctgtgctta 1440
gtcatgtgta aataaagttg tacaataaaa gtatatgtga cgcatgcaag gtgtggttta 1500
tgactcatgg gcggggctta gtcctatata agtggcaaca cctgggcact gggcacagac 1560
cttcagggag ttcctgatgg atgtgtggac tatccttgca gactttagca agacacgccg 1620
gcttgtagag gatagttcag acgggtgctc cgggttctgg agacactggt ttggaactcc 1680
tctatctcga ctggtgtaca cagttaagaa ggattataac gaggaatttg aaaatctttt 1740
tgctgattgc tctggcctgc tagattctct gaatctcggc caccagtccc ttttccagga 1800
aagggtactc cacagccttg atttttccag cccagggcgc actacagccg gggttgcttt 1860
tgtggttttt ctggttgaca aatggagcca gaacacccaa ctgagcaggg gctacattct 1920
ggacttcgca gccatgcacc tgtggagggc atgggtgagg cagcggggac agagaatctt 1980
gaactactgg cttatacagc cagcagctcc gggtcttctt cgtctacaca gacaaacatc 2040
catgttggag gaagaaatga ggcaggccat ggacgagaac ccgaggagcg gcctggaccc 2100
tccgtcggaa gaggagctgg attgaatcag gtatccagct tgtacccaga gcttagcaag 2160
gtgctgacat ccatggctag gggagtgaag agggagagga gcgatggggg caataccggg 2220
atgatgaccg agctgacggc cagcctgatg aatcgcaagc gcccagagcg cattacctgg 2280
cacgagctac agatggagtg cagggatgag ttgggcctga tgcaggataa atatggcctg 2340
gagcagataa aaacacattg gttgaaccca gatgaggatt gggaggaggc cattaagaaa 2400
tatgccaaga tagccctgcg cccagattgc aagtacatag tgaccaagac cgtgaatatt 2460
agacatgcct gctacatttc agggaacggg gcagaggtgg tcatcgatac cctggacaag 2520
gccgccttca ggtgttgcat gatgggaatg agagcaggag tgatgaatat gaattccatg 2580
atcttcatga acatgaagtt caatggagag aagtttaatg gggtgctgtt catggccaac 2640
agccacatga ccctgcatgg ctgcagtttc tttggcttca acaatatgtg cgccgaggtc 2700
tggggcgctt ccaagatcag gggatgtaag ttttatggct gctggatggg cgtggtcgga 2760
agacctaaga gcgagatgtc tgtgaagcag tgtgtgtttg agaaatgcta cctgggagtc 2820
tctaccgagg gcaatgctag agtgagacac tgctcttccc tggatacggg ctgcttctgc 2880
ctggtgaagg gtacggcctc tctgaagcat aatatggtga agggctgcac agatgagcgc 2940
atgtacaaca tgctaacatg cgactcgggg gtctgtcata tcctgaagaa catccatgtg 3000
acctcccacc ccagaaagaa gtggccagtg tttgagaata acctgctgat caagtgccat 3060
atgcacctgg gtgccagaag gggcaccttc cagccgtacc agtgcaactt tagccagacc 3120
aagctgctgt tggaaaacga tgccttctcc agggtgaacc tgaacggcat ctttgacatg 3180
gatgtctcgg tgtacaagat cctgagatac gatgagacca agtccagggt gcgcgcttgc 3240
gagtgcgggg gcagacacac caggatgcag ccagtggccc tggatgtgac cgaggagctg 3300
agaccagacc acctggtgat ggcctgtacc gggaccgagt tcagctccag tggggaggac 3360
acagattaga ggtaggtttg agtagtgggc gtggctaatg tgagtataaa ggcgggtgtc 3420
ttacgagggt ctttttgctt ttctgcagac atcatgaacg ggaccggcgg ggccttcgaa 3480
ggggggcttt ttagccctta tttgacaacc cgcctgccgg gatgggccgg agttcgtcag 3540
aatgtgatgg gatctacggt ggatgggcgt ccagtgcttc cagcaaattc ctcgaccatg 3600
acctacgcga ccgtggggag ctcgtcgctt gacagcaccg ccgcagccgc ggcagccgca 3660
gccgccatga cagcgacgag actggcctcg agctatatgc ccagcagcgg tagcagcccc 3720
tctgtgccca gttccatcat cgccgaggag aaactgctgg ccctgctggc cgagctggaa 3780
gccctgagcc gccagctggc cgccctgacc cagcaggtgt ccgatctccg cgagcaacag 3840
cagcagcaaa ataaatgatt caataaacac agattctgat tcaaacagca aagcatcttt 3900
attatttatt ttttcgcgcg cggtaggccc tggtccacct ctcccgatca ttgagagtgc 3960
ggtggatttt ttccaggacc cggtagaggt gggattggat gttgaggtac atgggcatga 4020
gcccgtcccg ggggtggagg tagcaccact gcatggcctc gtgctctggg gtcgtgttgt 4080
agataatcca gtcatagcag gggcgctggg cgtggtgctg gatgatgtcc ttgaggagga 4140
gactgatggc cacggggagc cccttggtgt aggtgttggc aaagcggtta agctgggagg 4200
gatgcatgcg gggggagatg atgtgcagtt tggcctggat cttgaggttg gcgatgttgc 4260
cacccagatc ccgccggggg ttcatattgt gcaggaccac cagaacggtg tagcccgtgc 4320
acttggggaa cttatcatgc aacttggaag ggaatgcgtg gaagaatttg gagacgccct 4380
tgtgcccgcc caggttttcc atgcactcat ccatgatgat ggcaatgggc ccgtgggctg 4440
cggctttggc aaaaacgttt ctggggtcag agacatcata attatgctcc tgggtgagat 4500
catcataaga cattttaatg aatttggggc gaagggtgcc agattggggg acgatcgttc 4560
cctcgggccc cggggcgaag ttcccctcgc agatctgcat ctcccaggct ttcatctcgg 4620
agggggggat catgtccacc tgcggggcga tgaaaaaaac ggtttccggg gcgggggtga 4680
tgagctgcga ggagagcagg tttcttaaca gctgggactt gccgcacccg gtcgggccgt 4740
agatgacccc gatgacgggt tgcaggtggt agttcaagga gatgcagctg ccgtcgtccc 4800
ggaggagggg ggccacctcg ttgagcatgt ctctcacttg gaggttttcc cggacgagct 4860
cgccgaggag gcggtccccg cccagcgaga gcagctcttg cagggaagca aagtttttca 4920
ggggcttgag cccgtcggcc atgggcatct tggcaagggt ctgcgagagg agctccaggc 4980
ggtcccatag ctcggtgacg tgctctacgg catctcgatc cagcagactt cctcgtttcg 5040
ggggttggga cgactgcgac tgtagggcac gagacgatgg gcgtccagcg cggccagcgt 5100
catgtccttc cagggtctca gggtccgagt gagggtggtc tccgtcacgg tgaaggggtg 5160
ggccccgggc tgggcgcttg caagggtgcg cttgagactc atcctgctgg tgctgaaacg 5220
ggcacggtct tcgccctgcg cgtcggcgag atagcagttg accatgagct tgtagttaag 5280
ggcctcggcg gcgtggccct tggcacggag cttgcctttg gaagagcgcc cgcaggcggg 5340
acagaggagg gattgcaggg cgtagagctt gggtgcgaga aagacggact cgggagcgaa 5400
ggcgtccgct ccgcagtggg cgcagacggt ttcgcactcg acgagccagg tgagctcggg 5460
ctgctcgggg tcaaaaacca gttttccccc gttctttttg atgcgcttct tacctcgcgt 5520
ctccatgagt ctgtgtccgc gttcggtgac aaacaggctg tctgtgtccc cgtagacgga 5580
cttgattggc ctgtcctgca ggggcgtccc gcggtcctcc tcgtagagaa actcggacca 5640
ctctgagaca aaggcgcgcg tccacgccaa gacaaaggag gccacgtgcg aggggtagcg 5700
gtcgttgtcc accagggggt ccaccttttc caccgtgtgc agacacatgt ccccctcctc 5760
cgcatccaag aaggtgattg gcttgtaggt gtaggccacg tgaccggggg tccccgacgg 5820
gggggtataa aagggggcgg gtctgtgctc gtcctcactc tcttccgcgt cgctgtccac 5880
gagcgccagc tgttggggta ggtattccct ctcgagagcg ggcatgacct cggcactcag 5940
gttgtcagtt tctagaaacg aggaggattt gatgttggcc tgccctgccg caatgctttt 6000
taggagactt tcatccatct ggtcagaaaa gactattttt ttattgtcaa gcttggtggc 6060
aaaggagcca tagagggcgt tggagagaag cttggcgatg gatctcatgg tctgattttt 6120
gtcacggtcg gcgcgctcct tggccgcgat gttgagctgg acatactcgc gcgcgacaca 6180
cttccattct gggaagacgg tggtgcgctc gtcgggcacg atcctgacgc gccagccgcg 6240
attatgcagg gtgaccaggt ccacgctggt ggccacctcg ccgcgcaggg gctcgttggt 6300
ccagcagagg cgtccgccct tgcgcgagca gaacgggggc agcacatcaa gcagatgctc 6360
gtcagggggg tccgcatcga tggtgaagat gcccggacag agttccttgt caaaataatc 6420
gatttttgag gatgcatcat ccaaggccat ctgccactcg cgggcggcca gcgctcgctc 6480
gtaggggttg aggggcggac cccagggcat gggatgcgtg agggcggagg cgtacatgcc 6540
gcagatgtcg tagacataga tgggctccga gaggatgccg atgtaggtgg gataacagcg 6600
ccccccgcgg atgctggcgc gcacatagtc atacaactcg tgcgaggggg ccaagaaagc 6660
ggggccgaga ttggtgcgct ggggctgctc ggcgcggaag acgatctggc gaaagatggc 6720
atgcgagttg gaggagatgg tgggccgttg gaagatgtta aagtgggcgt ggggcaagcg 6780
gaccgagtcg cggatgaagt gcgcgtagga gtcttgcagc ttggcaacga gctcggcggt 6840
gacaaggacg tccatggcgc agtagtccag cgtttcacgg atgatgtcat aacccgcctc 6900
ttctttcttc tcccacagcg cgcggttgag ggcgtactcc tcgtcatcct tccagtactc 6960
ccggagcggg aatcctcgat cgtccgcacg gtaagagccc agcatgtaga aatggttcac 7020
ggccttgtag ggacagcagc ccttctccac ggggagggcg taagcttgag cggccttgcg 7080
gagcgaggtg tgcgtcaggg cgaaggtatc cctaaccatg actttcaaga actggtactt 7140
gaaatccgag tcgtcgcagc cgccgtgctc ccagagctcg aaatcggtgc gcttcttcga 7200
gagggggtta ggcagagcga aagtgacgtc attgaagaga atcttgcctg cccgcggcat 7260
gaaattgcgg gtgatgcgga aagggcccgg aacggaggct cggttgttga tgacctgggc 7320
ggcgaggacg atctcgtcga agccgttgat gttgtgcccg acgatgtaga gttccatgaa 7380
tcgcgggcgg cctttgatgt gcggcagctt tttgagttcc tcgtaggtga ggtcctcggg 7440
gcattgcagg ccgtgctgct cgagcgccca ctcctggaga tgtgggttgg cttgcatgaa 7500
tgaagcccag agctcgcggg ccatgagggt ctggagctcg tcgcgaaaga ggcggaactg 7560
ctggcccacg gccatctttt ctggggtgac gcagtagaag gtgagggggt cccgctccca 7620
gcgatcccag cgtaagcgca cggcgagatc gcgagcgagg gcgaccagct cggggtcccc 7680
ggagaatttc atgaccagca tgaaggggac gagctgcttg ccgaaggacc ccatccaggt 7740
gtaggtttct acatcgtagg tgacaaagag ccgctccgtg cgaggatgag agccgattgg 7800
gaagaactgg atttcctgcc accagttggt cgagtggctg ttgatgtgat gaaagtagaa 7860
atcccgccgg cgaaccgagc actcgtgctg atgcttgtaa aagcgtccgc agtactcgca 7920
gcgctgcacg ggctgtacct catccacgag atacacagcg cgtcccttga ggaggaactt 7980
caggagtggc ggccctggct ggtggttttc atgttcgcct gcgtgggact caccctgggg 8040
ctcctcgagg acggagaggc tgacgagccc gcgcgggagc caggtccaga tctcggcgcg 8100
gcgggggcgg agagcgaaaa cgagggcgcg cagttgggag ctgtccatgg tgtcgcggag 8160
atccaggtcc gggggcaggg ttctgaggtt gacctcgtag aggcgggtga gggcgtgctt 8220
gagatgcaga tggtacttga tctccacggg tgagttggtg gtcgtgtcca cgcattgcat 8280
gagcccgtag ctgcgcgggg ccacgaccgt gccgcggtgc gcttttagaa gcggtgtcgc 8340
ggacgcgctc ccggcggcag cggcggttcc ggccccgcgg gcagtggcgg tagaggcacg 8400
tcggcgtggc gctcgggcag gtcccggtgc tgcgccctga gagcgctggc gtgcgcgacg 8460
acgcggcggt tgacatcctg gatctgccgc ctttgcgtga agaccacggg ccccgtgact 8520
ttgaacctga aagacagttc aacagaatca atctcggcgt cattgacggc ggcctgacgc 8580
aggatctctt gcacgtcgcc cgagttgtcc tggtaggcga tctcggacat gaactgctcg 8640
atttcctcct cctggagatc gccgcggccc gcgcgctcta cggtggcggc aaggtcattc 8700
gagatgcgac ccatgagctg cgagaaggcg cccaggccgc tctcgttcca gacgcggctg 8760
taaaccacgt ccccgtcggc gtcgcgcgcg cgcatgacca cctgcgcgag gttgagctcc 8820
acgtgccgcg cgaagacggc atagttgcgc aggcgttgga agaggtagtt gagggtggtg 8880
gcgatgtgct cggtgacgaa gaagtacata atccagcggc gcaggggcat ttcgctgatg 8940
tcgccaatgg cctccagcct ttccatggcc tcgtagaaat ccacggcgaa gttgaaaaac 9000
tgggcgttgc gggccgagac cgtgagctcg tcttccagga gcctgatgag ttcggcgatg 9060
gtggcgcgca cctcgcgctc gaaatccccg ggggcctcct cctcttcctc ttcttccatg 9120
acgacctctt cttctatttc ttcctctggg ggcggtggtg gtggcggggc ccgacgacga 9180
cggcgacgca ccgggagacg gtcgacgaag cgctcgatca tctccccgcg gcggcgacgc 9240
atggtttcgg tgacggcgcg accccgttcg cgaggacgca gcgtgaagac gccgccggtc 9300
atctcccggt aatggggtgg gtccccgttg ggcagcgata gggcgctgac aatgcatctt 9360
atcaattgcg gtgtagggca cgtgagcgcg tcgagatcga ccggatcgga gaatctttcg 9420
aggaaagcgt ctagccaatc gcagtcgcaa ggtaagctca aacacgtagc agccctgtgg 9480
acgctgttag aattgcggtt gctgatgatg taattgaagt aggcgttttt gaggcggcgg 9540
atggtggcga ggaggaccag gtccttgggt cccgcttgct ggatgcggag ccgctcggcc 9600
atgccccagg cctggccctg acaccggctc aggttcttgt agtagtcatg catgagcctc 9660
tcgatgtcat cactggcgga ggcggagtct tccatgcggg tgaccccgac gcccctgaac 9720
ggctgcacga gcgccaggtc ggcgacgacg cgctcggcga ggatggcctg ttgcacgcgg 9780
gtgagggtgt cctggaagtc gtccatgtcg acgaagcggt ggtaggcccc tgtgttgatg 9840
gtgtaagtgc agttggccat aagcgaccag ttgacggtct gcaggccggg ttgcacgacc 9900
tcggagtacc tgagccgcga gaaggcgcgc gagtcgaaga catagtcgtt gcaggtgcgc 9960
acgaggtact ggtatccgac tagaaagtgc ggcggcggct ggcggtagag cggccagcgc 10020
tgggtggccg gcgcgcccgg ggccaggtcc tcaagcatga gtcggtggta gccgtagagg 10080
tagcgggaca tccaggtgat gccggcggcg gtggtggagg cgcgcgggaa ctcgcggacg 10140
cggttccaga tgttgcgcag gggcaggaaa tagtccatgg tcggcacggt ctggccggtg 10200
agacgcgcgc agtcattgat gctctagagg caaaaacgaa agcggttgag cgggctcttc 10260
ctccgtagcc tggcggaacg caaacgggtt aggccgcgtg tgtaccccgg ttcgagtccc 10320
ctcgaatcag gctggagccg cgactaacgt ggtattggca ctcccgtctc gacccaagcc 10380
cgatagccgc caggatacgg cggagagccc tttttgtcgg ccgaggggag tcgctagact 10440
tgaaagcggc cgaaaaccct gccgggtagt ggctcgcgcc cgtagtctgg agaagcatcg 10500
ccagggttga gtcgcggcag aacccggttc aaggacggcc gcggcgagcg ggacttggtc 10560
accccgccga tttaaagacc cacagccagc cgacttctcc agttacggga gcgagccccc 10620
ttttttcttt ttgccagatg catcccgtcc tgcgccaaat gcgtcccacc cccccggcga 10680
ccaccgcgac cgcggccgta gcaggcgccg gcgctagcca gccacagcca cagacagaga 10740
tggacttgga agagggcgaa gggctggcga gactgggggc gccgtccccg gagcgacatc 10800
cccgcgtgca gctgcagaag gacgtgcgcc cggcgtacgt gcctgcgcag aacctgttca 10860
gggaccgcag cggggaggag cccgaggaga tgcgcgactg ccggtttcgg gcgggcaggg 10920
agctgcgcga gggcctggac cgccagcgcg tgctgcgcga cgaggatttc gagccgaacg 10980
agcagacggg gatcagcccc gcgcgcgcgc acgtggcggc ggccaacctg gtgacggcct 11040
acgagcagac ggtgaagcag gagcgcaact tccaaaagag tttcaacaac cacgtgcgca 11100
ccctgatcgc gcgcgaggag gtggccctgg gcctgatgca cctgtgggac ctggcggagg 11160
ccatcgtgca gaacccggac agcaagcctc tgacggcaca gctgttcctg gtggtgcagc 11220
acagcaggga caacgaggcg ttcagggagg cactgctgaa catcgccgag cccgagggtc 11280
gctggctgct ggagctgatt aacatcttgc agagcatcgt agtgcaggag cgcagcctga 11340
gcctggccga gaaggtggcg gcgatcaact actcggtgct gagcctgggc aagttttacg 11400
cgcgcaagat ttacaagacg ccgtatgtgc ccatagacaa ggaggtgaag atagacagct 11460
tttacatgcg catggcgctc aaggtgctga cgctgagcga cgacctgggc gtgtaccgca 11520
acgaccgcat ccacaaggcc gtgagcacaa gccggcggcg cgagctgagc gaccgcgagc 11580
tgatgctgag tctgcgccgg gcgctggtag gaggcgccac cggcggtgag gagtcctact 11640
ttgacatggg ggcggacctg cattggcagc cgagccgacg cgccttggag gccgcctacg 11700
gtccagagga cttggatgag gaagaggaag aggaggagga tgcacccgtt gcggggtact 11760
gacgcctccg tgatgtgttt ttagatgcag caagccccgg accccgccat aagggcggcg 11820
ctgcaaagcc agccgtccgg tctagcatcg gacgactggg aggccgcgat gcaacgcatc 11880
atggccctga cgacccgcaa ccccgagtcc tttagacaac agccgcaggc caacagactc 11940
tcggccattc tggaggcggt ggttccttct cggaccaacc ccacgcacga gaaggtgctg 12000
gcgatcgtga acgcgctggc ggagaacaag gccatccgtc ccgacgaggc cgggctagtg 12060
tacaacgccc tgctggagcg cgtgggccgc tacaacagca caaacgtgca gtccaacctg 12120
gaccggctgg tgacggacgt gcgcgaggcc gtggcgcagc gcgagcggtt caagaacgag 12180
ggcctgggtt cgctggtggc gctgaacgcc ttcctggcga cgcagccggc gaacgtgccg 12240
cgcgggcagg atgattatac caactttata agcgcgctgc ggctgatggt gaccgaggtg 12300
ccccagagcg aggtgtacca gtcgggcccg gactactttt tccagacgag cagacagggc 12360
ctgcagacgg tgaacctgag tcaggctttc aagaacctgc gcgggctgtg gggcgtgcag 12420
gcgcccgtgg gcgaccggtc gacggtgagc agcttgctga cgcccaactc gcggctgctg 12480
ctgctgctga tcgcgccctt caccgacagt ggcagcgtga accgcaactc gtacctgggt 12540
cacctgctga cgctgtaccg cgaggccata ggccaggcgc aggtggatga gcagaccttc 12600
caggagatca ctagcgtgag ccgcgcgctg ggtcagaacg acaccgacag tctgagggcc 12660
accctgaact tcttgctgac caatagacag cagaagatcc cggcgcagta cgcgctgtcg 12720
gccgaggagg agcgcatcct gagatatgtg cagcagagcg tagggctgtt cctgatgcag 12780
gagggggcca cccccagcgc cgcgctggac atgaccgcgc gcaacatgga acctagcatg 12840
tacgccgcca accggccgtt tattaataag ctgatggact acctgcaccg cgcggcgtcc 12900
atgaactcgg actactttac caatgccatc ttgaacccgc actggctccc gccgccgggg 12960
ttctacacgg gcgagtacga catgcctgac cccaacgacg ggtttttgtg ggacgacgtg 13020
gacagcgcgg tgttctcacc gaccttgcaa aagcgccagg aggcggtgcg cacgcccgcg 13080
agcgagggcg cggtgggtcg gagccccttt cctagcttag ggagtttgca tagcttgccg 13140
ggctcggtga acagcggcag ggtgagccgg ccgcgcttgc tgggcgagga cgagtacctg 13200
aacgactcgc tgctgcagcc gccgcgggtc aagaacgcca tggtcaataa cgggatagag 13260
agtctggtgg acaaactgaa ccgctggaaa acctacgctc aggaccatag ggaacctgcg 13320
cccgcgccgc ggcgacagcg tcacgaccgg cagcggggcc tggtgtggga cgacgaggac 13380
tcggccgacg atagcagcgt gttggacttg ggcgggagcg gtggggccaa cccgttcgcg 13440
catctgcagc ccagactggg gcgacggatg ttttgaatgc aaaataaaac tcaccaaggc 13500
catagcgtgc gttctcttcc ttgttagaga tgaggcgcgc ggtggtgtct tcctctcctc 13560
ctccctcgta cgagagcgtg atggcgcagg cgaccctgga ggttccgttt gtgcctccgc 13620
ggtatatggc tcctacggag ggcagaaaca gcattcgtta ctcggagctg gctccgctgt 13680
acgacaccac tcgcgtgtat ttggtggaca acaagtcggc ggacatcgct tccctgaact 13740
accaaaacga ccacagcaac ttcctgacca cggtggtgca gaacaacgat ttcacccctg 13800
ccgaggccag cacgcagacg ataaattttg acgagcggtc gcggtggggc ggtgatctga 13860
agaccattct gcacaccaac atgcctaatg tgaacgagta catgttcacc agcaagttta 13920
aggcgcgggt gatggtggct agaaaaaagg cggaaggggc tgatgcaaat gataggagca 13980
aggatatctt agagtatcag tggtttgagt ttaccctgcc cgagggcaac ttttccgaga 14040
ccatgaccat agacctaatg aacaacgcca tcttggaaaa ctacttgcaa gtggggcggc 14100
aaaatggcgt gctggagagt gatatcggag tcaagtttga cagcagaaat ttcaagctgg 14160
gctgggaccc ggtgaccaag ctggtgatgc caggggtcta cacctacgag gccttccacc 14220
cggacgtggt gctgctgccg ggctgcgggg tggatttcac cgagagccgc ctgagcaacc 14280
tcctgggcat tcgcaagaag caaccttttc aagagggctt cagaatcatg tatgaggacc 14340
tagtaggggg caacatcccc gctctcctga atgtcaagga gtatctgaag gataaggaag 14400
aagctggcaa agcagatgca aatactatta aggctcagaa tgatgccgtc ccaagaggag 14460
ataactatgc atcagcggca gaagccaaag cagcaggaaa agaaattgag ttgaaggcca 14520
ttttgaaaga tgattcagac agaagctaca atgtgatcga gggaaccaca gacaccctgt 14580
accgcagttg gtacctgtcc tatacctacg gggatcccga gaagggggtg cagtcgtgga 14640
cgctgctcac caccccggac gtcacctgcg gcgcggagca agtctactgg tcgctgccgg 14700
acctcatgca agaccccgtc accttccgct ctacccagca agtcagcaac taccccgtgg 14760
tcggcgccga gctcatgccc ttccgcgcca agagctttta caacgacctc gccgtctact 14820
cccagctcat ccgcagctac acctccctca cccacgtctt caaccgcttc cccgacaacc 14880
agatcctttg ccgcccgccc gcgcccacca tcaccaccgt cagtgaaaac gtgcctgctc 14940
tcacagatca cgggacgcta ccgctgcgca gcagtatccg cggagtccag cgagtgaccg 15000
tcactgacgc ccgtcgccgc acctgtccct acgtctacaa ggccctgggc atagtcgcgc 15060
cgcgcgtgct ttccagtcgc accttctaaa aaatgtctat tctcatctcg cccagcaata 15120
acaccggctg gggtcttact aggcccagca ccatgtacgg aggagccaag aaacgctccc 15180
agcagcaccc cgtccgcgtc cgcggtcact tccgcgctcc ctggggcgct tacaagcggg 15240
ggcggacctc tgctcctgcc gccgtgcgca ccaccgtcga cgacgtcatc gactcggtgg 15300
tcgccgatgc gcgcaactac acccccgccc cctcgaccgt ggacgcggtc atcgacagcg 15360
tggtggcaga cgcgcgtgac tatgccagac gcaagagccg gcggcgacgg atcgccaggc 15420
gccaccggag cacgcccgcc atgcgcgccg cccgagctct gctgcgccgc gccagacgca 15480
cgggccgccg ggccatgatg cgagccgcgc gccgcgctgc cactgcaccc acccccgcag 15540
gcaggactcg cagacgagcg gccgctgccg ccgccgcggc catctctagc atgaccagac 15600
ccaggcgcgg aaacgtgtac tgggtgcgcg actccgtcac gggcgtgcgc gtgcccgtgc 15660
gcacccgtcc tcctcgtccc tgatctaatg cttgtgtcct cccccgcaag cgacgatgtc 15720
aaagcgcaaa atcaaggagg agatgctcca ggtcgtcgcc ccggagattt acggaccacc 15780
ccaggcggac cagaaacccc gcaaaatcaa gcgggttaaa aaaaaggatg aggtggacga 15840
gggggcagta gagtttgtgc gcgagttcgc tccgcggcgg cgcgtaaatt ggaaggggcg 15900
cagggtgcag cgtgtgttgc ggcccggcac ggcggtggtg ttcacgcccg gcgagcggtc 15960
ctcggtcagg agcaagcgta gctatgacga ggtgtacggc gacgacgaca tcctggacca 16020
ggcggcggag cgggcgggcg agttcgccta cgggaagcgg tcgcgcgaag aggagctgat 16080
ctcgctgccg ctggacgaaa gcaaccccac gccgagccta aagcccgtga ccctgcagca 16140
ggtgctgccc caggcagtgc tgctgccgag ccgcggggtc aagcgcgagg gcgagagcat 16200
gtacccgacc atgcagatca tggtgcccaa gcgccggcgc gtggaggacg tgctggacac 16260
cgtaaaaatg gatgtggagc ccgaggtcaa ggtgcgcccc atcaagcagg tggcgccggg 16320
cctgggcgtg caaaccgtgg acattcagat ccccaccgac atggatgtcg acaaaaaacc 16380
ctcgaccagc atcgaggtgc aaaccgaccc ctggctccca gcctccaccg ctaccgcgtc 16440
cacttctacc gccgccacgg ctaccgagcc tcccaggagg cgaagatggg gcgccgccag 16500
ccggctgatg cccaactacg tgttgcatcc ttccatcatc ccgacgccag gctaccgcgg 16560
cacccggtac tacgccagcc gcaggcgccc agccagcaaa cgccgccgcc gcaccgccac 16620
ccgccgccgt ctggcccccg cccgcgtgcg ccgcgtgacc acgcggcggg gccgctcgct 16680
cgttctgccc accgtgcgct accaccccag catcctttaa tccgtgtgct gtgatactgt 16740
tgcagagaga tggctctcac ttgccgcctg cgcatccccg tcccgaatta ccgaggaaga 16800
tcccgccgca ggagaggcat ggcaggcagt ggcctgaacc gccgccggcg gcgggccatg 16860
cgcaggcgcc tgagtggcgg ctttctgccc gcgctcatcc ccataatcgc cgcggccatc 16920
ggcacgatcc cgggcatagc ttccgttgcg ctgcaggcgt cgcagcgccg ttgatgtgcg 16980
aataaagcct ctttagactc tgacacacct ggtcctgtat atttttagaa tggaagacat 17040
caattttgcg tccctggctc cgcggcacgg cacgcggccg ttcatgggca cctggaacga 17100
gatcggcacc agccagctga acgggggcgc cttcaattgg agcagtgtct ggagcgggct 17160
taaaaatttc ggctcgacgc tccggaccta tgggaacaag gcctggaata gtagcactgg 17220
gcagttgtta agggaaaagc tcaaagacca gaacttccag caaaaggtgg tggacgggct 17280
ggcctcgggc attaacgggg tggtggacat cgcgaaccag gccgtgcagc gcgagataaa 17340
cagccgcctg gacccgcggc cgcccacggt ggtggagatg gaagatgcaa ctcttccgcc 17400
gcccaagggc gagaagcgac cgcggcccga cgcggaggag acaatcctgc aagtggacga 17460
gccgccctcg tacgaggagg ccgtcaaggc cggcatgccc accacgcgca tcatcgcgcc 17520
gctggccacg ggtgtaatga aacccgctac ccttgacctg cctccaccac ccacgcccgc 17580
tccaccaaaa gcagctccgg ttgtgcagcc ccctccggtg gcgaccgccg tgcgccgcgt 17640
ccccgcccgc cgccaggccc agaactggca gagcacgctg cacagtatcg tgggcctggg 17700
agtgaaaagt ctgaagcgcc gccgatgcta ttgagagaga gtaaagagga cactaaaggg 17760
agagcttaac ttgtatgtgc cttaccgcca gagaacgcgc gaagatggcc accccctcga 17820
tgatgccgca gtgggcgtac atgcacatcg ccgggcagga cgcctcggag tacctgagcc 17880
cgggtctggt gcagtttgcc cgcgccaccg acacgtactt cagcctgggc aacaagttta 17940
ggaaccccac ggtggctccc acccacgatg tgaccacgga ccggtcccag cgtctgacgc 18000
tgcgctttgt gcccgtggat cgcgaggaca ccacgtactc gtacaaggcg cgcttcactc 18060
tggccgtggg cgacaaccgg gtgctagaca tggccagcac ttactttgac atccgcggcg 18120
tcctggaccg cggcccaagc ttcaaaccct actcgggcac ggcttacaac agcctggccc 18180
ccaagggcgc ccccaatccc agtcagtgga ctaccaaaga aaagcaaaac ggaggaactg 18240
gagcagaaaa agatgttaca aagacatttg gacttgccgc catgggaggc agtaatattt 18300
ctaaagacgg tttgcagatt ggaactgaca aaacagcaaa tgctgaaaaa ccaatctatg 18360
cagacaaaac tttccagcca gaacctcaag ttggagaaga aaactggcag gataatgatg 18420
aatattatgg cggcagggct cttaaaaaag ataccaaaat gaagccatgc tatggttcat 18480
ttgctaaacc cacaaacaag gaaggtgggc aggctaaatt gaaagaaaca cccaatggta 18540
ccgatcctca atacgatgtg gacatggctt tctttgactc aagcactata aatataccag 18600
atgtggtgtt gtacactgaa aatgtagatt tggaaactcc agatacacat gtggtgtaca 18660
aaccaggcaa agaggatgac agttctgaag ctaatttaac tcagcagtcc atgcctaaca 18720
gaccaaacta cattggcttc agagacaact ttgtggggct attgtactac aacagcactg 18780
gcaacatggg tgtgctggct ggtcaggctt ctcagttgaa tgccgtggtc gacttgcaag 18840
acagaaacac cgaactgtct taccagctct tgctagattc tcttggtgac agaaccagat 18900
attttagtat gtggaactct gcggtggaca gctatgatcc cgatgtcagg atcattgaga 18960
accacggtgt ggaagatgaa cttcctaact attgcttccc cttggacggt gttcaaacta 19020
attcagccta tcaaggtgtt aaactaaagc ctgatcaaac aggaggcgga gttaatggag 19080
attgggtaaa ggatgatgac atttcagccc ataatcaaat tggaaagggc aacatctttg 19140
ccatggagat caacctccag gccaacctgt ggaagagttt tctgtactcg aacgtggccc 19200
tgtacctgcc cgactcctac aagtacacgc cggccaacgt cacgctgccc gccaacacca 19260
acacctatga gtacatgaac ggccgcgtgg tagccccctc gctggtggac gcctacatta 19320
acatcggcgc ccgctggtcg ctggacccca tggacaacgt caaccccttt aaccaccacc 19380
gcaatgcggg cctgcgctac cgctccatgc ttttgggcaa tggccgctac gtgcccttcc 19440
acatccaagt gccccaaaag ttctttgcca tcaagaacct gctcctgctc cccggctcct 19500
acacctacga gtggaacttc cgcaaggatg tcaacatgat cctgcagagt tccctcggaa 19560
acgacctgcg cgtcgacggc gcctccgtcc gcttcgacag cgtcaacctc tacgccacct 19620
tcttccccat ggcgcacaac accgcctcca ccctggaagc catgctgcgc aacgacacca 19680
acgaccagtc cttcaacgac tacctctcgg ccgccaacat gctctacccc atcccggcca 19740
aggccaccaa cgtgcccatt tccatcccct cgcgcaactg ggccgccttc cgcggctgga 19800
gtttcacccg gctcaagacc aaggaaactc cctcccttgg ctcgggtttt gacccctact 19860
ttgtctactc gggctccatc ccctacctcg acgggacctt ctacctcaac cacaccttca 19920
agaaggtttc catcatgttc gactcctcgg tcagctggcc cggcaacgac cggctgctta 19980
cgccgaacga gttcgagatc aagcgcagcg tcgacgggga gggctacaac gtggcccaat 20040
gcaacatgac caaggactgg ttcctcgtcc agatgctctc ccactacaac atcggctacc 20100
agggcttcca tgtgcccgag ggctacaagg accgcatgta ctccttcttc cgcaacttcc 20160
agcccatgag caggcaggtg gtcgatgaga tcaactacaa ggactacaag gcagtcaccc 20220
tgcccttcca gcacaacaac tctggcttca ccggctacct ggcacccacc atgcgtcagg 20280
ggcagcccta ccccgccaac ttcccctacc cgctcatcgg ctccaccgca gtgccatccg 20340
tcacccagaa aaagttcctc tgcgacaggg tcatgtggcg catccccttc tccagcaact 20400
tcatgtccat gggcgccctc accgacctgg gtcagaacat gctctacgcc aactcggccc 20460
acgcgctcga catgaccttc gaggtggacc ccatggatga gcccaccctc ctctatcttc 20520
tcttcgaagt tttcgacgtg gtcagagtgc accagccgca ccgcggcgtc atcgaggccg 20580
tctacctgcg cacgcccttc tccgccggca acgccaccac ctaagcatga gcggctccag 20640
cgaacgagag ctcgcggcca tcgtgcgcga cctgggctgc gggccctact ttttgggcac 20700
ccacgacaag cgcttcccgg gcttcctcgc cggcgacaag ctggcctgcg ccatcgtcaa 20760
cacggccggc cgcgagaccg ggggcgtgca ctggctcgcc tttggctgga acccgcgctc 20820
gcgcacctgc tacatgttcg accccttcgg gttctcggac cgccggctca agcagattta 20880
cagcttcgag tacgaggcca tgctgcgccg aagcgccctg gcctcctcgc ccgatcgctg 20940
tcttagcctc gaacagtcca cccagaccgt gcaggggccc gactccgccg cctgcggact 21000
cttctgttgc atgttcttgc atgccttcgt gcactggccc gaccgaccca tggacgggaa 21060
ccccaccatg aacttgctga cgggggtgcc caacggcatg ctacaatcgc cacaggtgct 21120
gcccaccctc aggcgcaacc aggaggagct ctaccgcttc ctcgcgcgcc actcccccta 21180
ctttcgctcc caccgcgccg ccatcgaaca cgccaccgct tttgataaaa tgaaacaact 21240
gcgtgtatga ctcaaataaa cagcactttt attttacaca tgcgctggag tatatgcaag 21300
ttatttaaaa gtcgaagggg ttctcgcgct cgtcgttgtg cgccgcgctg gggagggcca 21360
cgttgcggta ctggaacttg ggctgccact tgaactcggg gatcaccagt ttgggcactg 21420
gagtctcggg gaaggtctcg ctccacatgc gccggctcat ttgcagggcg cccagcatgt 21480
cagggccgga gatcttgaaa tcgcagttgg gaccggtgct ctgcgcgcgc gagttgcggt 21540
acacggggtt gcagcactgg aacaccatca gactggggta cttcacactg gcaagcacgc 21600
tcttgtcgct aatctgatcc ttgtccaggt cctcggcgtt gctcaggccg aacggggtca 21660
tcttgcacag ctggcggccc aggaagggca cgctctgagg cttgtggtta cactcgcagt 21720
gcacgggcat cagcatcatc cccgcgccgc gctgcatatt cgggtagagg gccttgacga 21780
aggccgcgat ctgcttgaaa gcttgctggg ccttggcccc ctcgctaaaa aacaggccgc 21840
agctcttccc gctgaactgg ttattcccgc acccggcatc atgcacgcag cagcgcgcgt 21900
catggctggt cagttgcacc acgctccgtc cccagcggtt ctgggtcacc ttagccttgc 21960
tgggctgctc cttcagcgcg cgctgtccgt tctcgctggt cacatccatc tccaccacgt 22020
ggtccttgtg aatcatcacc gttccatgca gacacttgag ctgaccttcc acctcggtgc 22080
agccgtgatc ccacaggacg cagccggtgc actcccaatt cttgtgcgcg atcccgctgt 22140
ggctgaaaat gtaaccttgc aacaggcgac ccataatggt gctaaatgct ttctgggtgg 22200
tgaatgtcag ttgcatcccg cgggcctcct cgttcatcca ggtctggcac atcttctgga 22260
agatctcggt ctgctccggc atgagcttgt aagcatcgcg caagccgctg tcgacgcggt 22320
agcgttccat cagcacgttc atggtatcca tgcccttctc ccatgacgag accagaggca 22380
gactcagggg gttgcgcacg ttcaggacac caggggtcgc gggctcgacg atgcgttttc 22440
cgtccttgcc ttccttcaac agaaccggag gctggctgaa tcccactccc acgatcacgg 22500
cgtcttcctg gggcatctct tcgtcggggt ctaccttggt cacatgcttg gtctttctgg 22560
cttgcttctt ttttggaggg ctgtccacgg ggaccacgtc ctcctcggaa gacccggagc 22620
ccacccgctg atactttcgg cgcttggtgg gcagaggagg tggcggcggc gaggggctcc 22680
tctcctgctc cggcggatag cgcgccgacc cgtggccccg gggcggagtg gcctctcgct 22740
ccatgaaccg gcgcacgtcc tgactgccgc cggccattgt ttcctagggg aagatggagg 22800
agcagccgcg taagcaggag caggaggagg acttaaccac ccacgagcaa cccaaaatcg 22860
agcaggacct gggcttcgaa gagccggctc gtctaaaacc cccacaggat gaacaggagc 22920
acgagcaaga cgcaggccag gaggagaccg acgctgggct cgagcatggc tacctgggag 22980
gagaggagga tgtgctgcta aaacacctgc agcgccagtc cctcatcctc cgggacgccc 23040
tggccgaccg gagcgaaacc cccctcagcg tcgaggagct gtgtcgggcc tacgagctca 23100
acctcttctc gccgcgcgtg ccccccaaac gccagcccaa cggcacctgc gagcccaacc 23160
cgcgtctcaa cttctatccc gtctttgcgg tccccgaggc ccttgccacc tatcacatct 23220
ttttcaagaa ccaaaagatc cccatctcct gtcgcgccaa tcgcactcgc gccgacgcgc 23280
tcctcgctct ggggcccggc gcgcgcatac ctgatatcgc ttccctggaa gaggtgccca 23340
agatcttcga agggctcggt cgggacgaga cgcgcgcggc aaacgctctg aaagaaacag 23400
cagaggaaga gggttacact agcgccctgg tagagttgga aggcgacaac gccaggctgg 23460
ccgtgcttaa gcgcagcgtc gagctcaccc atttcgccta ccccgccgtc aacctcccgc 23520
ccaaggtcat gcgtcgcatc atggatcagc tcatcatgcc ccacatcgag gcccttgatg 23580
aaagtcagga acagcgcccc gagaacgccc agcccgtggt cagcgacgag atgctcgcgc 23640
gctggctcgg gacccgcgac ccccaggccc tggagcagcg gcgcaagctc atgctggccg 23700
tggtcctggt cacccttgag ctcgaatgca tgcgccgctt ttttaccgac cccgagaccc 23760
tgcgcaaggt cgaggagacc ctgcactaca ctttcagaca cggtttcgtc aggcaggcct 23820
gcaagatctc caacgtggag ctgaccaacc tggtctcctg cctggggatc ctacacgaga 23880
accgcttggg acagaccgtg ctccactcta ccctgaaggg cgaggcgcgg cgggactaca 23940
tccgcgactg cgtctttctc tttctctgcc acacatggca agcggccatg ggcgtgtggc 24000
agcagtgtct cgaggacgag aacctgaagg agctggacaa gcttcttgct agaaacctta 24060
aaaagctgtg gacgggcttc gacgagcgca ccgtcgcctc ggacctggcc gagatcgtct 24120
tccccgagcg cctgaggcag acgctgaaag gagggctgcc cgacttcatg agccagagca 24180
tgttgcaaaa ctaccgcact ttcattctcg agcgatctgg gatgctgccc gccacctgca 24240
acgccttccc ctccgacttt gtcccgctga gctaccgcga gtgtcccccg ccgctgtgga 24300
gccactgcta cctcttgcag ctggccaact acattgccca ccactcggat gtgatcgagg 24360
acgtgagcgg cgaggggctg ctcgagtgcc actgtcgctg caacctatgc tccccgcacc 24420
gctccctggt ctgcaacccc cagctactga gcgagaccca ggtcatcggt acctttgagc 24480
tgcaaggtcc gcaggagtcc accgctccgc tgaaactcac gccggggttg tggacttccg 24540
cgtacctgcg caaatttgta cccgaggact actacgccca tgagataaag ttcttcgagg 24600
accaatcgcg tccgcagcac gcggatctca cggcctgcgt catcacccag ggcgcgatcc 24660
tcgcccaatt gcacgccatc caaaaatccc gccaagagtt tcttctgaaa aagggtagag 24720
gggtctacct ggacccccag acgggcgagg tgctcaaccc gggtctcccc cagcatgccg 24780
aggaagaagc aggagccgct agtggaggag atggaagaag aatgggacag ccaggcagag 24840
gaggacgaat gggaggagga gacagaggag gaagacttgg aagaggtgga agaggagcag 24900
gcaacagagc agcccgtcgc cgcaccatcc gcgccggcag cccctccggt cacggataca 24960
acctccgcag ctccggccaa gcctcctcgt agatgggatc gagtgaaggg tgacggtaag 25020
cacgagcgac agggctaccg atcatggagg gcccacaaag ccgcgatcat cgcctgcttg 25080
caagactgcg gggggaacat cgctttcgcc cgccgctacc tgctcttcca ccgcggggtg 25140
aacatccccc gcaacgtgtt gcattactac cgtcaccttc acagctaaga aaaagcaagt 25200
caaaggagtc gccggaggag gaggcctgag gatcgcggcg aacgagccct tgaccaccag 25260
ggagctgagg aaccggatct tccccactct ttatgccatt tttcagcaaa gtcgaggtca 25320
gcagcaagag ctcaaagtaa aaaaccggtc tctgcgctcg ctcacccgca gttgcttgta 25380
ccacaaaaac gaagatcagc tgcagcgcac tctcgaagac gccgaggctc tgttccacaa 25440
gtactgcgcg ctgactctta aagactaagg cgcgcccacc cggaaaaaag gcgggaatta 25500
cctcatcgcc accatgagca aggagattcc caccccttac atgtggagct atcagcccca 25560
gatgggcctg gccgcgggcg cctcccagga ctactccacc cgcatgaact ggcttagtgc 25620
cggcccctcg atgatctcac gggtcaacgg ggtccgtaac catcgaaacc agatattgtt 25680
gcagcaggcg gcggtcacct ccacgcccag ggcaaagctc aacccgcgta attggccctc 25740
caccctggtg tatcaggaaa tccccgggcc gactaccgta ctacttccgc gtgacgcact 25800
ggccgaagtc cgcatgacta actcaggtgt ccagctggcc ggcggcgctt cccggtgccc 25860
gctccgccca caatcgggta taaaaaccct ggtgatccga ggcagaggca cacagctcaa 25920
cgacgagttg gtgagctctt caatcggtct gcgaccggac ggagtgttcc aactagccgg 25980
agccgggaga tcgtccttca ctcccaacca ggcctacctg accttgcaga gcagctcttc 26040
ggagcctcgc tcgggaggca tcggaaccct ccagttcgtg gaggagtttg tgccctcggt 26100
ctacttcaac cccttctcgg gctcgccagg cctctacccg gacgagttta taccgaactt 26160
cgacgcagtg agagaagcgg tggacggcta cgactgaatg tcctatggtg actcggctga 26220
gctcgctcgg ttgaggcatc tggaccactg ccgccgcctg cgctgctttg cccgggagag 26280
ctacggcctc atctactttg agctgcccga ggagcacccc aacggccctg cacacggagt 26340
gcggatcacc gtagagggca ccaccgagtc tcacctggtc aggttcttca cccagcaacc 26400
cttcctggtc gagcgggacc ggggcgccac cacctacacc gtctactgca tttgtcctac 26460
cccgaagttg catgagaatt tttgttgtac tctttgtggt gagtttaata aaagctaaac 26520
tcttgcaata ctctggacct tgtcgtcatc aactcaacga gaccgtctac ctcaccaacc 26580
agactgaggt aaaacttacc tgcagaccac acaagaccta tatcatctgg ttcttcgaga 26640
acacctcatt tgcagtctcc aacactcact gcaacgacgg tgttgaactt cccaacaacc 26700
tttccagtgg actgagttac aatacacgta gagctaagct catcctctac aatccttttg 26760
tagagggaac ctaccagtgc cagagcggac cttgcttcca cagttttact ttggtgaacg 26820
ttaccggcag cagcacagcc gctccagaaa ctaaccttcc ttctgatact atcaaacctt 26880
gtttcggagg tgagctaagg cttccccctt ctcaggaggg ggttagccca tacgaagtgg 26940
tcgggtattt gattttaggg gtggtcctgg gtgggtgcat agcggtgcta gctcagctgc 27000
cttgctgggt ggaaatcaaa atctttatat gctgggtaag acattgtggg gaggaactat 27060
gaaggggctc ttgctgatta tcctttccct ggtggggggt gtgctgtcat gccacgaaca 27120
gccacgatgt aacatcacca caggcaatga gaggaacgac tgctctgtag ttatcaaatg 27180
cgagcaccat tgtcctctca acattacatt caaaaataag accatgggaa atgtatgggt 27240
gggattctgg caaccaggag atgagcagaa ctacacggtc actgtccatg gtagcaatgg 27300
caatcacact ttcggtttca aattcatttt tgaagtcatg tgtgatatca cactacatgt 27360
ggctagactt catggcttgt ggccccctac caaggataac atggtgggtt tttctttggc 27420
ttttgtgatc atggcctgct tgatgtcagg tctgctggta ggggctctag tgtggtttct 27480
gaaacgcaag cccaggtatg gaaatgaaga gaaggaaaaa ttgctataaa ttctttttct 27540
ttttcgcaga accatgaata cagtgatccg tatcgtgctg ctctctcttc ttgtagcttt 27600
tagtcaggca ggatttcata ctatcaatgc tacatggtgg gctaatataa ctttagtggg 27660
acccccagac acaccagtca cttggtatga tactcaagga ttgtggtttt gcaatggcag 27720
tagagttaag aatcctcaaa tcagacatac atgtaatgat caaaacctta ctttgatcca 27780
tgtgaacaaa acttatgaaa gaacatacat gggttataat agacaaggga ctaaaaaaga 27840
agactacaaa gttgtagtta taccacctcc tcctgctact gtaaaaccac agccagagcc 27900
agagtatgtg tttgtttata tgggagagaa caaaactcta gaaggtcctc cgggaactcc 27960
agtcacatgg tttaatcagg atggaaagaa attttgtgaa ggagaaaaag ttcttcatcc 28020
agaatttaac cacacctgtg acaaacaaaa ccttatacta ctgtttgtga attttacaca 28080
tgatggagct taccttgggt acaatcatca aggaacccag agaacacact atgaagttac 28140
agtattagat ctttttccag attctggcca aatgaaaatt gaaaatcata gtgaggaaac 28200
agagcaaaaa aatgatgaac atcataactg gcagaaacag ggtgggcaaa aacagggtgg 28260
gcaaaaaaca aatcaaacaa aagttaatga caggagaaaa acagcgcaaa aaagaccatc 28320
aaagctaaag ccggcaacta ttgaggcaat gctggttaca gtgactgccg ggtctaactt 28380
aactttggtt ggacctaaag cagaaggaaa agttacttgg tttgatggag atttaaaaag 28440
accatgtgag cctaattaca gactaagaca cgaatgtaat aatcaaaact taactctgat 28500
taatgtaact aaagattatg agggaactta ctatggtaca aatgacaaag atgagggcaa 28560
aaggtacaga gtgaaagtaa atactacaaa ttctcaatct gtgaaaattc agccatatac 28620
cagacaaact actcctgatc aagagcacaa atttgaatta cagttcgaaa ctaatggaaa 28680
ttatgattca aaaattccct caaccactgt ggcaatcgtg gtgggtgtga ttgcgggctt 28740
cataactctg atcattgtct tcatatgcta catctgctgc cgcaagcgtc ccagggcata 28800
caatcatatg gtagacccac tactcagctt ctcttactaa gactcagtca ctttcatttc 28860
agaaccatga aggctttcac agcttgcgtt ctgattagcc tagtcacact tagtgtagct 28920
attaaaaatc aatatcatgt tcataatgtt accagagatg gatatatcac attaaatgta 28980
acaattgata atactacctg gacaagatat catttaaata agtggcatca aatttgtacg 29040
tggtcagacc catcatacaa atgtcacagc aatggcagca ttaccattca tgctttcaat 29100
attacttctg gccagtacaa agctgaaagt tttactaact ggtttagata ttacggtaat 29160
cataaacatg aaattcatat ttttaacata actgtaattg agcatcctac aacaaaagca 29220
cccaccactg ctaatacagc tacatcaatt aaatcaacaa ccacacagcc tactactagg 29280
gagacaactc aacctaccac cacagtcagt acaactactg agaccactac tcaaactaca 29340
cagctagaca caacagtgca gaatagcact gtgttggtta ggtatctgtt gagggaggaa 29400
agtactactg aacagacaga ggctacctca agtgccttta gcagcactgc aaatttaact 29460
tcgcttgctt ggactaatga aaccggagta tcattgatga atcatcagcc tttctcaggt 29520
ttggatattc aaattacttt tctggttgtt tgtgggatct ttattcttgt ggttcttctg 29580
tactttgtct gctgcaaagc cagagagaaa tctaggaggc ccatctacag gccagtaatc 29640
ggggaacctc agccactcca agtggaaggg ggtctaagga atcttctttt ctctttttca 29700
gtatggtgat cagccatgat tcctaggttc ttcctattta acatcctctt ctgtctcttc 29760
aacatctgcg ctgcctttgc agccgtctcg cacgcctcgc ccgactgtct cgggcccttc 29820
ccaacctacc tcctctttgc cctgctcacc tgcacctgcg tctgcagcat tgtctgcctg 29880
gtcatcacct tcctgcagct tatcgactgg tgctgtgcgc gctacaatta tctccatcac 29940
agtcccgaat acagggacaa gaacgtagcc agaatcttaa ggctcatctg accatgcaga 30000
ctctgctcat gctgctatcc ctcctatccc ctgccctagc cacttatgct gattactcta 30060
aatgcaaatt cgcagacata tggaatttct tagattgcta tcaggaaaaa attgatatgc 30120
cctcctatta cttggtgatt gtgggaatag tcatggtctg ctcctgcact ttctttgcca 30180
tcatgattta cccctgtttt gatctcggct ggaactctgt tgaagcattc acatacacac 30240
tagaaagcag ttcactagcc tccacgccac cacccacacc gcctcctcgc agaaatcagt 30300
tccccctgat acagtactta gaagagcccc ctccccgacc cccttccact gttagctact 30360
ttcacataac cggcggcgat gactgaccac cacctggacc tcgagatgga cggccaggcc 30420
tccgagcagc gcatcctgca actgcgcgtc cgtcagcagc aggagcgggc cgccaaggag 30480
ctccttgatg ccatcaacat ccaccagtgc aagaagggca tcttctgcct ggtcaaacag 30540
gcaaagatca cctacgagct cgtgtccaac ggcaaacagc atcgccttac ctatgagatg 30600
ccccagcaga agcagaagtt cacctgcatg gtgggcgtca accccatagt catcacccag 30660
cagtcgggcg agaccaacgg ctgcatccac tgctcctgcg aaagccccga gtgcatctac 30720
tcccttctca agaccctttg cggactccgc gacctcctcc ccatgaactg atgttgatta 30780
aaagcccaga aaccaatcag acccttcctc atttccccat cccaatactc ataagaataa 30840
atcattggaa ttaatcattc aataaagatc acttacttga aatctgaaag tatgtctctg 30900
gtgtagttgc tcagcaacac ctcggtaccc tcctcccagc tctggtactc cagtccccgg 30960
cgggcggcga acttcctcca caccttgaaa gggatgtcaa attcctggtc cacaattttc 31020
attgtcttcc ctcttagatg tcaaagaggc tccgggtgga agatgacttc aaccccgtct 31080
acccctatgg ctacgcgcgg aatcagaata tccccttcct cactcccccc tttgtctcct 31140
ccgatggatt caaaaacttc ccccctgggg tactgtcact caaactggct gatccaatca 31200
ccattaccaa tggggatgta tccctcaagg tgggaggtgg tctcactttg caagatggaa 31260
gcctaactgt aaaccctaag gctccactgc aagttaatac tgataaaaaa cttgagcttg 31320
catatgataa tccatttgaa agtagtgcta ataaacttag tttaaaagta ggacatggat 31380
taaaagtatt agatgaaaaa agtgctgcgg ggttaaaaga tttaattggc aaacttgtgg 31440
ttttaacagg aaaaggaata ggcactgaaa atttagaaaa tacagatggt agcagcagag 31500
gaattggtat aaatgtaaga gcaagagaag ggttgacatt tgacaatgat ggatacttgg 31560
tagcatggaa cccaaagtat gacacgcgca cactttggac aacaccagac acatctccaa 31620
actgcacaat tgctcaagat aaggactcta aactcacttt ggtacttaca aagtgtggaa 31680
gtcaaatatt agctaatgtg tctttgattg tggtcgcagg aaagtaccac atcataaata 31740
ataagacaaa tccaaaaata aaaagtttta ctattaaact gctatttaat aagaacggag 31800
tgcttttaga caactcaaat cttggaaaag cttattggaa ctttagaagt ggaaattcca 31860
atgtttcgac agcttatgaa aaagcaattg gttttatgcc taatttggta gcgtatccaa 31920
aacccagtaa ttctaaaaaa tatgcaagag acatagttta tggaactata tatcttggtg 31980
gaaaacctga tcagccagca gtcattaaaa ctacctttaa ccaagaaact ggatgtgaat 32040
actctatcac atttaacttt agttggtcca aaacctatga aaatgttgaa tttgaaacca 32100
cctcttttac cttctcctat attgcccaag aatgaaagac caataaacgt gtttttcatt 32160
tgaaattttc atgtatcttt attgattttt acaccagcac gagtagacag tctcccacca 32220
ccagcccatt ttacagtgta cacggttctc tcagcacggg tagccttaaa tagggaaata 32280
ttctcattag tgcgggaatt ggacttgggg tctataatcc acacagtttc ctggcgagcc 32340
aaacgggggt cggtgattga aataaagccg tcctctgaaa agtcatccaa gcgggcctca 32400
cagtccaagg tcacagtctg gtggaacgag aagaacgcac agattcatac tcggaaaaca 32460
ggatgggtct gtgcctctcc atcagcgccc tcagcagtct ctgccgccgg ggctcggtgc 32520
ggctgctgca aatgggatcg ggatcacaag tctctctgac tatgatccca acagccttca 32580
gcatcagtct cctggtgcga cgggcacagc accgcatcct gatctctgcc atgttctcac 32640
agtaagtgca gcacataatc accatgttat tcagcagccc ataattcagg gcgctccagc 32700
caaagctcat gttgggaatg atggaaccca cgtgaccatc gtaccagatg cgacagtata 32760
tcaggtgcct gcccctcatg aacacactgc ccatgtacat gatctctttg ggcatgtttc 32820
tgtttacaat ctggcggtac caggggaagc gctggttgaa catgcacccg taaatgactc 32880
tcctgaacca cacggccagc agggtgcctc ccgcccgaca ctgcagggag ccaggggatg 32940
aacagtggca atgcaggatc cagcgctcgt acccgctcac catttgagct cttaccaagt 33000
ccagggtagc ggggcacagg cacactgaca tacatctttt taaaattttt atttcctctg 33060
tggtgaggat catatcccag gggactggaa actcttggag cagggtaaag ccagcagcac 33120
atggtaatcc acggacagaa cttacattat gataatctgc atgatcacaa tcgggcaaca 33180
ggggatgttg ttcagtcagt gaagccctgg tttcctcatc agatcgtggt aaacgggccc 33240
tgcgatatgg atgatggcgg agcgagctgg attgaatctc ggtttgcatt gtagtggatt 33300
ctcttgcgta ccttgtcgta cttctgccag cagaaatggg cccttgaaca gcatataccc 33360
ctcctacggc cgtcctttcg ctgctgccgc tcagtcatcc aactaaagta catccattct 33420
cgaagattct ggagaagttc ctctgcatct gataaaataa aaaacccgtc catgcgaatt 33480
cccctcatca catcagccag gactctgtag gccatcccca tccagttaat gctgccttgt 33540
ctatcattca gagggggcgg tggcaggact ggaagaacca tttttattcc aaacggtctc 33600
gaaggacgat aaagtgcaag tcacgcaggt gacagcgttc ccctccgctg tgctggtgga 33660
aacagacagc caggtcaaaa cccactctat tttcaaggtg ctcgaccgtg gcttcgagca 33720
gtggctctac gcgcacatcc agcataagaa tcacattaaa ggctggccct ccatcgattt 33780
catcaatcat caggttacat tcctgcacca tccccaggta attctcattt ttccagcctt 33840
ggattatctc tacaaattgt tggtgtaagt ccactccgca catgtggaaa agctcccaca 33900
gtgccccctc cactttcata atcaggcaga ccttcataat agaaacagat cctgctgctc 33960
caccacctgc agcgtgttca aaacaacaag attcaataag gttctgccct ccgccctgag 34020
ctcgcgcctc aatgtcagct gcaaaaagtc acttaagtcc tgggccacta cagctgacaa 34080
ttcagagcca gggctaagcg tgggactggc aagcgtaagg gaaaacttta atgctccaaa 34140
gctagcaccc aaaaactgca tgctggaata agctctcttt gtgtctccgg tgatgccttc 34200
caaaatgtga gtgataaagc gtggtagttt ttctttaatc atttgcgtaa tagaaaagtc 34260
ctctaaataa gtcactagga ccccagggac cacaatgtgg tagcttacac cgcgtcgctg 34320
aagcatggtt agtagagatg agagtctgaa aaacagaaag catgcactaa actaaggtgg 34380
ctattttcac tgaaggaaaa atcactctct ccagcagcag ggtacccact gggtggccct 34440
tgcggacata caaaaatcgg tccgtgtgat taaaaagcag cacagtaagt tcctgtcttc 34500
ttccggcaaa aatcacatca gactgggtta gtatgtccct ggcatggtag tcattcaagg 34560
ccataaatct gccctgatat ccagtaggaa ccagcacact cacttttagg tgaagcaata 34620
ccaccccatg cggaggaatg tggaaagatt cagggcaaaa aaattatatc tattgctagc 34680
cccttcctgg acgggagcaa tccctccagg actatctata aaagcataca gagattcagc 34740
catagcttag cccgcttacc agtagacaga aagcacagca gtacaagcgc caacagcagc 34800
aactgactac ccactgaccc agctccctat ttaaaggcac cttacactga cgtaatgacc 34860
aaaggtctaa aaaccccgcc aaaaaaaaca cacacgccct gggtgttttt cacaaaaaca 34920
cttccgcgtt ctcacttcct cgtatcgatt ttgtgactca acttccgggt tcccacgtta 34980
cgtcacttct gcccttacat gtaacttggc cgtatggcgc catcttgccc acgtccaaaa 35040
tggctttcat gaccggccac gcctccgcgc cggccgttag ccgtgcgtcg tgacgttatt 35100
tgcatcaccg cttctcgtcc aatcagcgtt ggctccgccc caaaaccgtt aaaattcaaa 35160
agctcatttg catattaact tttgtttact ttgtggggta tattatgatg atg 35213
<210> 153
<211> 35385
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 50 sequence
<400> 153
caatcaatat aatatacctt atagatggaa tggtgccaat atgtaaatga ggtaatttaa 60
aaaagtgcgc gctgtgtggt gattggctgc ggggtgaacg gctaaaaggg gcggacatgc 120
tgggaggtga cgtgacttat gggggaggag ttatgttgca agttatcgcg gtaaaggtga 180
cgtaaaacga ggtgtggttt ggacacggaa gtagacagtt ttcccacgct tactgacagg 240
atatgaggta gttttgggcg gatgcaagtg aaaattctcc attttcgcgc gaaaactgaa 300
tgaggaagtg aatttctgag tcatttcgcg gttatgacag ggtggagtat ttgccgaggg 360
ccgagtagac tttgaccgtt tacgtggagg tttcgattac cgtgtttttc acctaaattt 420
ccgcgtacgg tgtcaaagtc ctgtgttttt acgtaggtgt cagctgatcg ctagggtatt 480
taaacctgtc gagttccgtc aagaggccac tcttgagtgc cagcgagaag agttttctcc 540
tccgcgccgc gagtcagttt tgcgctttga aaatgagaca cctgcgattc ctgccacagg 600
agattatctc cagcgagacc gggatagaaa tactggagtt tgtggtaaat accctgatgg 660
gagatgaccc ggaaccgcca gcgcagcctt tcgatccacc tacgctgcac gatctgtatg 720
atttagaggt agacgggccg gacgatccca atgaggaagc tgtaaatggg ttttttactg 780
attctatgct actagctgcc gatgaaggat tggacataaa ccctcctcct gagacccttg 840
ataccccagg ggtggttgtg gaaagcggca gaggtgggat aaaattgcct gatctgggag 900
cagctgaaat ggacttgcgt tgttatgaag agggttttcc tccgagtgat gatgaagatg 960
gggaaactga acagtccatc cataccgcag tgaatgaggg agtaaaagct gccagcgatg 1020
tttttaagtt ggactgtccg gagctgcctg gacatggctg taagtcttgt gaatttcaca 1080
ggaataacac tggaatgaaa gaactattgt gctcgctttg ctatatgaga atgcactgcc 1140
attttattta cagtaagtgt atttaagtga aatttaaagg aatagtgtag ctgtttaata 1200
actgttgaat ggtagattta tgtttttact tgtgattttt tgtaggtcct gtgtctgatg 1260
atgagtcgcc ttctcctgat tcaactacct cacctcctga aattcaggcg cccgtacctg 1320
caaacgtatg caagcccatt cctgtgaagc ctaagtctgg gaaacgccct gctgtggata 1380
agcttgagga cttgttggag ggtggggatg gacctttgga ccttagtacc cggaaactgc 1440
caaggcaatg agtgccctgc agctgtgttt atttaatgtg acgtcatgta ataaaattat 1500
gtcagctgct gagtgtttta ttgcttcttg ggtggggact tggatatata agtaggagca 1560
gatctgtgtg gttagcttat agcaacctgc tgccatccat ggaggtttgg gctatcttgg 1620
aagacctgag acagactagg ctactgctag aaaacgcctc ggacggagtc tctggctttt 1680
ggagattctg gttcggtggt gatctagcta ggctagtgtt taggataaaa caggactaca 1740
gggaagaatt tgaaaagtta ttggacgaca gtccaggact ttttgaagct cttaacttgg 1800
gccatcaggc tcattttaag gagaaggttt tatcagtttt agatttttct actcctggta 1860
gaactgctgc tgctgtagct tttcttactt ttatattgga taaatggatc cgacaaaccc 1920
acttcagcaa gggatacgtt ttggatttca tagcagcagc tttgtggaga acatggaagg 1980
ctcgcagcat gaggacaatc ttagattact ggccagtgca gcctctggga gtagcaggga 2040
tactgagaca cccaccgacc atgccagcgg ttctggagga ggagcagcag gaggacaatc 2100
cgagagccgg cctggaccct ccggtggagg agtagctgac ctgtttcctg aactgcgacg 2160
ggtgcttact aggtctacgt ccagtggaca ggacaggggc attaagaggg aaaggaatcc 2220
tagtgggaat aattcaagaa ccgagttggc tttaagttta atgagccgta ggcgtcctga 2280
aactgtttgg tggcatgagg ttcagagcga aggcagggat gaagtttcaa tattgcagga 2340
gaaatattca ctagaacaac ttaagacctg ttggttggaa cctgaggatg attgggaggt 2400
ggccattagg aattatgcta agatatctct gaggcctgat aaacagtata gaattactaa 2460
aaagattaat attagaaatg catgctacat atcagggaat ggggcagagg ttataataga 2520
tacccaagat aaagcagctt ttagatgttg tatgatgggt atgtggccag gggttgtcgg 2580
catggaagca gtaacattta tgaatattag gtttaaaggg gatgggtata atggcattgt 2640
atttatggct aacactaagc tgattctaca tggttgtagc ttttttgggt ttaataatac 2700
ttgtgtagaa gcttgggggc aagttggtgt gaggggttgt agtttttatg catgctggat 2760
tgcaacatca ggtagggtca agagtcagtt gtctgtgaag aaatgcatgt ttgagagatg 2820
taatcttggc atactgaatg aaggtgaagc aagggtccgc cactgcgcag ctacagaaac 2880
tggctgcttc attctaataa agggaaatgc cagtgtgaag cataatatga tctgtggaca 2940
ttcgaatgag aggccttatc agatgctgac ttgcgctggt ggacattgca atattcttgc 3000
taccgtgcat atcgtttccc atgcacgcaa gaaatggcct gtatttgaac ataatgtgat 3060
taccaagtgc accatgcaca taggtggtcg caggggaatg tttatgcctt accagtgtaa 3120
catgaatcat gtgaaggtga tgttggaacc agatgccttt tccagagtga gcttaacagg 3180
aatctttgat atgaatattc aactatggaa gatactgaga tatgatgaca ctaaaccgag 3240
ggtgcgcgca tgcgaatgcg gaggcaagca tgctagattc cagccggtgt gcgtggatgt 3300
gactgaagac ctgagacccg atcatttggt gcttgcctgc actggagcgg agttcggttc 3360
tagtggtgaa gaaactgact aaagtgagta gtggggcaag atgtggatgg agactttcag 3420
gttggtaagg tggacagatt gggtaaattt tgttaatttc tgtcttgcag ctgccatgag 3480
tggaagcgct tcttttgagg ggggagtatt tagcccttat ctgacgggca ggctcccatc 3540
atgggcagga gttcgtcaga atgtcatggg atccactgtg gatgggagac ccgtccagcc 3600
cgccaattcc tcaacgctga cctatgccac tttgagttcg tcaccattgg atgcagctgc 3660
agccgccgcc gctactgctg ccgccaacac catccttgga atgggctatt acggaagcat 3720
cgttgccaat tccagttcct ctaataaccc ttcaaccctg gctgaggaca agctacttgt 3780
tctcttggct cagctcgagg ccttaaccca acgcttaggc gaactgtcta agcaggtggc 3840
ccagttgcgt gagcaaactg agtctgctgt tgccacagca aagtctaaat aaagatctca 3900
aatcaataaa taaagaaata cttgttataa aaacaaatga atgtttattt ggtttttcgc 3960
gcgcggtatg ccctggacca tcggtctcga tcattgagaa ctcggtggat cttttccagt 4020
accctgtaaa ggtgggattg aatgtttaga tacatgggca ttagtccgtc tcgggggtgg 4080
agatagctcc attgaagagc ctcttgctcc ggggtagtgt tataaatcac ccagtcatag 4140
caaggtcgga gtgcatggtg ttgcacaata tcttttagga gcagactaat tgcaacgggg 4200
aggcccttag tgtaggtgtt tacaaatctg ttgagctggg acgggtgcat cctgggggaa 4260
attatatgca ttttggactg gatcttgagg ttggcaatgt tgccgcctag atcccgtctc 4320
gggttcatat tgtgcagaac caccaagaca gtgtatccgg tgcacttggg aaatttatca 4380
tgcagcttag agggaaaagc atgaaaaaat ttggagacgc ctttgtgacc ccccagattc 4440
tccatgcact catccataat gatagcgatg gggccgtggg cagcggcacg ggcgaacacg 4500
ttccgggggt ctgaaacatc atagttatgc tcctgagtca ggtcatcata agccatttta 4560
ataaactttg ggcggagggt gccagattgg gggatgaaag ttccctctgg cccgggagca 4620
tagtttccct cacatatttg catttcccag gctttcagtt ccgagggggg gatcatgtcc 4680
acctgcgggg ctataaaaaa taccgtttct ggagccgggg tgattaactg ggatgagagc 4740
aaattcctaa gcagctgaga cttgccgcac ccagtgggac cgtaaatgac cccaattacg 4800
ggttgcagat ggtagtttag ggagcgacag ctgccgtcct cccggagcag gggggccact 4860
tcgttcatca tttcccttac atggatattt tcccgcacca agtccgttag gaggcgctct 4920
cccccaaggg atagaagctc ctggagcgag gagaagtttt tcaacggttt cagcccgtca 4980
gccatgggca ttttggaaag agtctgttgc aagagctcga gccggtccca gagctcggtg 5040
atgtgctcta tggcatctcg atccagcaga cctcctcgtt tcgcgggttg ggacggctcc 5100
tggagtaggg aatcagacga tgagcgtcca gcgctgctag ggtccgatcc ttccatggtc 5160
gcagcgtccg agtcagggtt gtttccgtca cggtgaaggg gtgcgcgcct ggttgggcgc 5220
ttgcgagggt gcgcttcaga ctcatcctgc tggtcgagaa ccgctgccga tcggcgccct 5280
gcatgtcggc caggtagcag tttaccatga gttcgtagtt gagcgcctcg gccgcgtggc 5340
ctttggcacg gagcttacct ttggaagttt tatggcaggc ggggcagtag atacatttga 5400
gggcatacag cttgggcgcg aggaaaatgg attcggggga gtatgcatcc gcaccgcagg 5460
aggcgcagac ggtttcgcac tccacgagcc aggtcagatc cggctcatcg gggtcaaaaa 5520
caagttttcc gccatgtttt ttgatgcgtt tcttaccttt ggtttccatg agttcgtgtc 5580
cccgctgggt gacaaagagg ctgtccgtgt ccccgtagac cgactttatg ggcctgtcct 5640
cgagcggagt gcctcggtcc tcttcgtaga ggaacccagc ccactctgat acaaaagcgc 5700
gtgtccaggc cagcacaaag gaggccacgt gggaggggta gcggtcgttg tcaaccaggg 5760
ggtccacctt ctctacggta tgtaaacaca tgtccccctc ctccacatcc aagaatgtga 5820
ttggcttgta agtgtaggcc acgtgaccag gggtccccgc cgggggggta taaaagtggg 5880
cgggcctctg ttcgtcctca ctgtcttccg gatcactgtc caggagcgcc agctgttggg 5940
gtaggtattc tctctcgaag gcgggcatga cctctgcact caggttgtca gtttctagga 6000
acgaggagga tttgatattg acagtaccag cagagatgcc tttcataaga ctctcgtcca 6060
tctggtcaga aaacacaatc ttcttgttat ccagcttggt ggcaaatgat ccatagaggg 6120
cattggatag aagcttggcg atggagcgca tggtttggtt cttttccttg tccgcgcgct 6180
ccttggcggc gatgttaagc tggacgtact cgcgcgccac acatttccat tcagggaaga 6240
tggttgtcag ttcatccgga actattctga ctcgccatcc cctattgtgc agggttatca 6300
gatccacact ggtggctacc tcgcctcgga ggggctcatt ggtccagcag agtcgacctc 6360
cttttcttga acagaaaggg gggagggggt ctagcatgaa ctcatcaggg gggtccgcat 6420
ctatggtaaa tattcccggt agcaaatctt tgtcaaaata gctgatggtg gcgggatcat 6480
ccaaggtcat ctgccattct cgaactgcca gcgcgcgctc gtaggggtta agaggggtgc 6540
cccagggcat ggggtgggtg agcgcggagg catacatgcc acagatatcg tagacataga 6600
ggggctcttc gaggatgccg atgtaagtgg gataacagcg cccccctctg atgcttgctc 6660
gcacatagtc atagagttca tgtgaggggg cgagaagacc cgggcccaga ttggtgcggt 6720
tgggtttttc cgccctgtaa acgatctggc gaaagatggc atgggaattg gaagagatag 6780
taggtctctg gaatatgtta aaatgggcat gaggtaggcc tacagagtcc cttatgaagt 6840
gggcatatga ctcttgcagc ttggctacca gctcggcggt gacgagtacg tccagggcac 6900
agtagtcgag agtttcctgg atgatgtcat aacgcggttg gcttttcttt tcccacagct 6960
cgcggttgag aaggtattct tcgcgatcct tccagtactc ttcgagggga aacccgtctt 7020
tttctgcacg gtaagagccc aacatgtaga actgattgac tgccttgtag ggacagcatc 7080
ccttctccac tgggagagag tatgcttggg ctgcattgcg cagcgaggta tgagtgaggg 7140
caaaagtgtc cctgaccatg actttgagga attgatactt gaagtcgatg tcatcacagg 7200
ccccctgttc ccagagttgg aagtccaccc gcttcttgta ggcggggttg ggcaaagcga 7260
aagtaacatc attgaagagg atcttgccgg ccctgggcat gaaatttcgg gtgattctga 7320
aaggctgagg gacctctgct cggttattga taacctgagc ggccaagacg atctcatcaa 7380
agccattgat gttgtgcccc actatgtaca gttctaagaa tcgaggggtg cccctgacat 7440
gaggcagctt cttgagttct tcaaaagtga ggtctgtagg gtcagtgaga gcatagtgtt 7500
cgagggccca ttcgtgcacg tgagggttcg ctttgaggaa ggaggaccag aggtccactg 7560
ccagtgctgt ttgtaactgg tcccggtact gacgaaaatg ctgcccgact gccatctttt 7620
ctggggtgac gcaatagaag gtttgggggt cctgccgcca gcgatcccac ttgagtttta 7680
tggccaggtc ataggcgatg ttgacgagcc gctggtctcc agagagtttc atgaccagca 7740
tgaaggggat tagctgcttg ccaaaggacc ccatccaggt gtaggtttcc acatcgtagg 7800
tgaggaagag cctttctgtg cgaggatgag agccaatcgg gaagaactgg atctcctgcc 7860
accagttgga ggaatggctg ttgatgtgat ggaagtagaa ctccctgcga cgcgccgagc 7920
attcatgctt gtgcttgtac agacggccgc agtactcgca tcgattcacg ggatgcacct 7980
catgaatgag ttgtacctga cttcctttga cgagaaattt cagtggaaaa ttgaggcctg 8040
gcgattgtac ctcgcgctct actatgttgt ctgcatcggc atgaccatct tctgtctcga 8100
tggtggtcat gctgacgagc cctcgcggga ggcaagtcca gacctcggcg cggcaggggc 8160
ggagctcgag gacgagagcg cgcaggccgg agctgtccag ggtcctgaga cgctgcggag 8220
tcaggttagt aggcagtgtc aggagattga cttgcatgat cttttcgagg gcgtgaggga 8280
ggttcagatg gtacttgatc tccacgggtc cgttggtgga gatgtcgatg gcttgcaggg 8340
ttccgtgccc cttgggcgct accaccgtgc ccttgttttt ccttttgggc ggcggtggct 8400
ctgttgcttc ttgcatgttt agaagcggtg tcgagggcgc gcaccgggcg gcaggggcgg 8460
ttcgggaccc ggcggcatgg ccggcagtgg tacgtcggcg ccgcgcgcgg gtaggttctg 8520
gtactgcgcc ctcagaagac tcgcatgcgc cacgacgcgg cggttgacat cctggatctg 8580
acgcctctgg gtgaaagcta ccggccccgt gagcttgaac ctgaaagaga gttcaacaga 8640
atcaatctcg gtatcgttga cggcggcttg cctaaggatt tcttgcacgt cgccagagtt 8700
gtcctggtag gcgatctcgg ccatgaactg ctcgatctct tcctcttgaa gatctccgcg 8760
gcccgctctc tcgacggtgg ccgcgaggtc gttggagata cgcccaatga gttgagagaa 8820
tgcattcatg cccgcctcgt tccagacgcg gctgtagacc acagccccca cgggatctct 8880
cgcgcgcatg accacctggg cgaggttgag ctccacgtgg cgggtgaaga ccgcatagtt 8940
gcataggcgc tggaaaaggt agttgagtgt ggtggcgatg tgctcggtga cgaagaaata 9000
catgatccat cgtctcagcg gcatctcgct gacatcgccc agcgcttcca agcgctccat 9060
ggcctcgtag aagtccacgg caaagttgaa aaactgggag ttacgcgcgg acacggtcaa 9120
ctcttcttcc aaaagacgga tgagttcggc gatggtggtg cgcacctcga gctcgaaagc 9180
ccctgggatt tcttcctcaa tctcttcttc ttccactaac atctcttcct cttcaggtgg 9240
ggctgcagga ggagggggaa cgcggcgacg ccggcggcgc acgggcagac ggtcgatgaa 9300
tctttcaatg acctctccgc ggcggcggcg catggtctcg gtgacggcac gaccgttctc 9360
cctgggtctc agagtgaaga cgcctccgcg catctccctg aagtggtgac tgggaggctc 9420
tccgttgggc agggacaccg cgctgattat gcattttatt aattgccccg taggtactcc 9480
gcgcaaggac ctgatcgtct caagatccac gggatctgaa aacctttcga cgaaagcgtc 9540
taaccagtcg caatcgcaag gtaggctgag cactgtttct tgcgggcggg ggcggctaga 9600
cgctcggtcg gggttctctc tttcttctcc ttcctcctct ttggagggtg agacgatgct 9660
gctggtgatg aaattaaaat aggcagtttt gagacggcgg atggtggcga ggagcaccag 9720
gtctttgggt ccggcttgtt ggatgcgcag gcgatgggcc attccccaag cattatcctg 9780
acatctggcc agatctttat agtagtcttg catgagtcgt tccacgggca cttcttcttc 9840
gcccgctctg ccatgcatgc gagtgatccc gaacccgcgc atgggctgga caagtgccag 9900
gtccgctaca accctttctg cgaggatggc ttgctgcacc tgggtgaggg tggcttggaa 9960
gtcgtcaaag tccacgaagc ggtggtaagc cccggtgttg attgtgtagg agcagttggc 10020
catgactgac cagttgactg tctggtgccc agggcgcaca agctcggtat acttaaggcg 10080
cgagtatgcg cgggtgtcaa agatgtaatc gttacaggtg cgcaccaggt actggtagcc 10140
gatgagaaag tgcggcggcg gctggcggta taggggccat cgctctgtag ccggggcgcc 10200
aggggcgagg tcttccagca tgaggcggtg ataaccgtag atgtacctgg acatccaggt 10260
gataccggag gcggtggtgg atgcccgcgg gaactcgcgt acgcggttcc agatgttgcg 10320
cagcggcatg aagtagttca tggtaggcac ggtttggccc gtgagacgtg cacagtcgtt 10380
gatgctctag acatacgggc aaaaacgaaa gcggtcagcg gctcgtctcc gtggcctgga 10440
ggctaagcga acgggttggg ctgcgcgtgt accccggttc gaatctcgga tcaggctgga 10500
gccgcagcta acgtggtact ggcactcccg tctcgaccca ggcctgcaca aaacctccag 10560
gatacggagg cgggtcgttt tttttttttt ggctttttcc tggatgggag ccaatgctgc 10620
gtcaagcttt agaacactca gttctcgggg ctgggagtgg ctcgcgcccg tagtctggag 10680
aatcaatcgc cagggttgcg ttgcggtgtg ccccggttcg agtcttagcg cgccggatcg 10740
gccggtttcc gcgacaagcg agggtttggc agcctcgtca tttctaagac cccgccagcc 10800
gacttctcca gtttacggga gcgagccctc tttttttgtt tttttgttgc ccagatgcat 10860
cccgtgctgc gacagatgcg cccccagcaa cagccccctt ctcagcagca gctacaacaa 10920
cagccacaaa aggctcttcc tgctcctgta actactgcgg ctgcagccgt cagcggcgcg 10980
gggcagcccg cctatgatct ggacttggaa gagggcgagg gactggcgcg cctgggcgca 11040
ccatcgcccg agcggcaccc gcgggtgcaa ctgaaaaagg actctcgcga ggcgtacgtg 11100
ccccagcaga acctgttcag ggacaggagc ggcgaggagc ctgaggaaat gcgagcttcc 11160
cgctttaacg cgggtcgcga actgcgtcac ggtctggacc gaagacgggt gctgcgtgat 11220
gatgattttg aagtcgatga agtgacagga ataagtcctg ctagggcaca tgtggccgcg 11280
gccaacctag tatcagctta cgagcagacc gtgaaggagg agcgcaactt tcaaaaatct 11340
ttcaacaacc atgtgcgcac cctgattgcc cgcgaggaag tgacactggg tctgatgcac 11400
ctgtgggacc tgatggaagc cattacccag aaccccacca gcaaacctct aaccgctcag 11460
ctgtttctgg tggtgcaaca tagtagagac aatgaggcat ttagggaggc gctgttgaac 11520
attactgagc ccgaggggag atggttgtat gatcttatca atattctgca aagtataatc 11580
gtgcaagaac gtagcctggg tctagctgag aaggtggctg ctattaacta ctcggtcttg 11640
agcctgggca agcactacgc tcgcaagatc tacaaaaccc catacgtacc tatagacaag 11700
gaggtgaaga tagatgggtt ttatatgcgc atgactctca aggtgctgac cttgagtgac 11760
gatctgggag tgtaccgcaa cgacaggatg caccgcgcag tgagcgccag cagaaggcgt 11820
gagctgagcg acagagaact tatgcacagc ttgcaaagag ctctgactgg ggctggaacc 11880
gagggggaaa actactttga catgggagcg gacttgcagt ggcagcccag tcgcagggcc 11940
ctggacgcag cagggtatga gcttccttac atagaagagg tggatgaagg ccaggatgag 12000
gagggcgagt atctggaaga ctgatggcgc gaccatccat atttttgcta gatggaacag 12060
caggcaccgg accccgcaaa acgggcggcg ctacagagcc agccgtccgg cattaactcc 12120
tcggacgatt ggagccaggc catgcaacgc atcatggcgc tgacgacccg caaccccgaa 12180
gcctttagac agcaacccca ggccaaccgc ctttctgcca tcctggaggc cgtagtgccc 12240
tcccgctcca accccacaca cgagaaggtc ctggccatcg tgaacgcgct ggtggagaac 12300
aaagccatac gtcccgatga ggctgggctg gtatacaatg ccctattgga gcgcgtagcc 12360
cgttacaaca gcagcaacgt gcagaccaac ctggaccgga tggtgaccga tgtgcgcgag 12420
gccgtgtctc agcgcgagcg gttccagcga gacgccaatt tagggtcgct ggtggctttg 12480
aacgccttcc tcagcactca gcctgccaac gtgcctcgcg gtcagcaaga ctacacaaac 12540
tttctaagtg cattgagact catggtggcc gaagtccctc aaagcgaagt gtaccagtcc 12600
gggccagact actttttcca gaccagcaga cagggcttgc agacagtgaa cctgagccag 12660
gcttttaaga acctgaatgg tctgtgggga gtgcgcgccc cagtgggaga tcgggcgacc 12720
gtgtctagct tgctgacccc caactcccgc ctactactgc tcttggtagc cccattcact 12780
gacagcggta gcatcgaccg taattcgtac ttgggctatc tgttgaacct gtatcgcgag 12840
gccatagggc aaactcaggt agatgagcaa acctatcaag aaattaccca agtgagccgc 12900
gctctgggtc gggaggacac tggcagcttg gaagccacct taaacttctt gctgaccaac 12960
cggtcgcaga agatccctcc tcagtattcg cttaccgcgg aggaggaacg gatcctgaga 13020
tacgtgcagc agagcgtggg actgttccta atgcaggagg gggcgactcc tactgctgcg 13080
ctcgatatga cagcccgaaa catggagccc agcatgtatg ccagtaaccg gccttttatc 13140
aataaactgc tagactactt acacagggcg gctgctatga actctgatta tttcaccaat 13200
gctatcctga acccccattg gctgccccca cctgggttct atacgggcga gtatgacatg 13260
cccgacccca atgacgggtt tttatgggac gatgtggaca gtagtgtttt ctccccgcct 13320
cctggttata acacttggaa gaaggaaggt ggcgatagaa ggcactcttc cgtgtcactg 13380
tccggagcaa cgggtgctgc agcggctccc gaggccgcaa gtcctttccc tagtttgcca 13440
ttttcgctaa acagtgtacg cagcagtgag ctgggaagaa taacccgtcc tcgcttgatc 13500
ggcgaggagg agtatttgaa cgactccctg ttgagacccg agagggagaa gaatttcccc 13560
aacaacggga tagaaagctt ggttgacaaa atgaaccgct ggaagacgta cgcgcacgat 13620
cacagggacg atccccgggc gctgggggat agccggggca tcgctacccg taaacgccag 13680
tggcacgaca ggcagcgggg cctggtgtgg gccgatgatg attccgccga cgacagcagc 13740
gtgttggact tgggtgggag tggtggtaac ccgttcgctc acctgcgccc ccgcgtcggg 13800
cgcctgatgt aagaaaccga aaataaatac tcaccaaggc catggcgacc agcgtgcgtt 13860
cgtttcttct ctgttatagc tagtatgatg aggcgaaccg tgctaggcgg agcggtggtg 13920
tatccggagg gtcctcctcc ttcgtacgag agcgtgatgc agcaggcggc ggcggcggcg 13980
atgcagccac cactggaggc tccctttgta ccccctcggt acctggcacc tacggagggg 14040
agaaacagca ttcgttactc ggagctggca ccattgtatg ataccacccg gttgtatttg 14100
gtggacaaca agtccgcgga catcgcctca ctgaactatc agaacgacca cagcaacttc 14160
ctcaccacgg tggtgcaaaa caatgacttt acccccacgg aggccagcac ccagaccatc 14220
aactttgacg agcggtcgcg atggggcggt cagctgaaga ctatcatgca caccaacatg 14280
cccaacgtga acgagtacat gtttagcaac aagttcaaag ctcgggtgat ggtgtctaga 14340
aaggctcctg aaggtgtcac agtagatgac aattatgatc acaagcagga tattttggaa 14400
tatgagtggt ttgagtttac tctaccggaa gggaacttct cagccacaat gaccattgac 14460
ctaatgaaca atgccatcat tgataattac cttgaagtgg gcagacagaa tggagtgttg 14520
gagagtgaca ttggtgttaa atttgacacc aggaacttta gactgggttg ggatccggaa 14580
actaagttga ttatgcctgg ggtttacacc tatgaggcat tccatcctga cattgtattg 14640
ttgcctggtt gcggagttga ctttactgaa agtcgcctta gtaacttgct tggtatcagg 14700
aaaagacacc cattccagga gggttttaag atcttgtatg aggatcttga agggggtaat 14760
atcccggccc tgttggatgt agaagcctat aagaacagta agaaagaacg agaagccaaa 14820
acagaagccg ctaaagctgc tgctattgct aaagccaaca tagttgtcag cgaccctgta 14880
agggtggcta atgccgaaga agtcagagga gacaactata cagcttcatc tgttgcaact 14940
gaagaatcgc tattggctgc tgtggccgaa actacagaga ccaaactcac tattaaacct 15000
gtagaaaaag acagcaagag tagaagttac aatgtcttgg aagataaagt gaatacagcc 15060
taccgcagct ggtacctgtc ctacaactat ggtgaccctg aaaaaggagt ccgttcctgg 15120
acactgctca ccacctcgga tgtcacctgt ggagcagagc aggtgtactg gtcgctccca 15180
gacatgatgc aggaccctgt cacattccgt tccacgagac aagtcagcaa ctatccagtg 15240
gtaggtgcag agctcatgcc ggtcttctca aagagtttct acaacgagca agccgtgtac 15300
tcccagcagc ttcgccagtc cacctcgctc acgcacgtct tcaaccgctt ccctgagaac 15360
cagatcctca tccgcccgcc agcgcccacc attaccaccg tcagtgaaaa cgttcctgct 15420
ctcacagatc acgggaccct gccgttgcgc agcagtatcc ggggagtcca gcgcgtgacc 15480
gttactgacg ccagacgccg cacctgcccc tacgtctaca aggccctggg catagtcgcg 15540
ccgcgcgtcc tttcaagccg cactttctaa aaaaaaatgt ccattcttat ctcacctagt 15600
aataacaccg gttggggcct gcgcgcgcca agcaagatgt acggaggtgc tcgcaaacgc 15660
tctacacagc accctgtgcg cgtgcgcggg cacttccgcg ctccatgggg cgccctcaag 15720
ggtcgtaccc gcactagaac caccgtcgat gatgtgatcg accaggtggt ggccgatgct 15780
cgtaattata ctcctactgc acctacatct actgtggatg cagttattga cagcgtagtg 15840
gctgacgccc gcgcctatgc tcgccggaag agcaggcgga gacgcatcgc caggcgccac 15900
cgggctactc ccgctatgcg agcggcaaga gctctgctga ggagggccaa acgcgtgggg 15960
cgaagagcta tgcttagagc ggccagacgc gcggcttcag gtgccagtgc cggcaggtcc 16020
cgcaggcgcg cagccacggc ggcagcagcg gccattgcca acatggccca accgcgaaga 16080
ggcaatgtgt actgggtgcg cgacgccacc accggccagc gcgtgcccgt gcgcacccgc 16140
ccccctcgct cttagaagat actgagcagt ctccgatgtt gtgtcccagc gaggatgtcc 16200
aagcgcaaat acaaggaaga gatgctccag gtcatcgcgc ctgaaatcta cggtccgccg 16260
gtgaaggatg aaaaaaagcc ccgcaaaatc aagcgggtca aaaaggacaa aaaggaagaa 16320
gatggcaatg atggtctggc ggagtttgta cgcgagttcg ccccaaggcg gcgagtgcag 16380
tggcgtggac gcaaagtgca gcctgtgctg agacctggaa ccacggtggt ctttacgccc 16440
ggcgagcgct ccagcactgc ttttaagcgg tcctatgatg aggtgtatgg ggatgatgat 16500
attctggagc aggcggccga ccgcctgggc gagtttgctt atggcaagcg ctcccgctcg 16560
agccccaagg aggaggcggt gtccattccc ttggacaatg ggaatcccac ccctagtctc 16620
aagccagtca ccctgcagca agtgctgccc gtgcctccac gcagaggcaa caagcgagag 16680
ggtgaggatc tgtatcccac tatgcaattg atggtgccca agcgccagcg gctggaggac 16740
gtgctggaga aaatgaaagt ggatcccgat atacaacctg aggtcaaagt gagacccatc 16800
aagcaggtgg cgccaggttt gggagtacaa accgtagaca tcaagattcc caccgagtca 16860
atggaagtcc aaaccgaacc tgcaaagccc acaaccacct ccattgaggt gcaaacggat 16920
ccctggatga ccgcacccgt tacaactcca gctgctgtca acaccactcg aagatcccgg 16980
cgaaagtacg gtccagcaag tttgctgatg ccaaattatg ctctgcaccc atccattatt 17040
ccaactccgg gttaccgagg cactcgctac taccgcagca ggagcagcac ttcccgccgt 17100
cgccgcaaaa cacctgcaag tcgtagtcat cgtcgtcgcc gccgccccac cagcaatctg 17160
actcccgctg ctctggtgcg gagagtgtat cgcgatggcc gcgcggatcc cctgacgtta 17220
ccgcgcgtac gctaccatcc aagcatcaca acttaacaac tgttgccgct gcctccttgc 17280
agatatggcc ctcacttgcc gccttcgtgt ccccattact ggctaccgag gaagaaactc 17340
gcgccgtaga agagggatgt tggggcgcgg aatgcgacgc cacaggcggc ggcgcgctat 17400
cagcaagagg ctggggggtg gctttctgcc tgctctgatc cccatcatag ccgcggcgat 17460
cggggcgata ccaggcatag cttccgtggc ggttcaggcc tcgcagcgcc actgacattg 17520
gaaaaactta taaataaaac agaatggact ctgatgctcc tggtcctgtg actatgtttt 17580
tgtagagatg gaagacatca atttttcatc cctggctccg cgacacggca cgaggccgta 17640
catgggcacc tggagcgaca tcggcaccag ccaactgaac gggggcgcct tcaattggag 17700
cagtatctgg agcgggctta aaaattttgg ctctaccata aaaacctatg ggaacaaagc 17760
ttggaacagc agcacagggc aggcattgaa aaataagctt aaagagcaaa acttccaaca 17820
gaaggtggtt gatggaatcg cctctggtat caatggggtg gtggatctgg ccaaccaggc 17880
cgtgcagaaa cagataaaca gccgccttga cccgccgccg tcagcccctg gtgaaatgga 17940
agtggaggaa gatctccctc cccttgaaaa gcggggcgac aagcgtccgc gccccgatct 18000
ggaggagaca ctagtcacac gctcagacga cccgccctcc tacgaggagg cagtgaagct 18060
tggaatgccc accaccagac ctgtagcccc catggctacc ggggtaatga aaccttctca 18120
gtcacaccga cccgctacct tggacttgcc tccccctgct gttgcagcgc ctgctcgcaa 18180
gcctgtcgct accccgaagc ccaccaccgt acagcccgtc gccgtagcca gaccgcgtcc 18240
tgggggcact ccacgtccga atgcaaactg gcagagtact ctgaacagca tcgtgggtct 18300
gggcgtgcaa agtgtaaagc gccgtcgctg cttttaaatt aaatatggag tagcgcttaa 18360
cttgcctgtc tgtgtgtatg tgtcatcatc acgccgccgc cgcagcaaca gcagaggagc 18420
aaggaagagg tcgcgcgccg aggctgagtt gatttcaaga tggccacccc atcgatgctg 18480
ccccagtggg catacatgca catcgccgga caggatgctt cggagtacct gagtccgggt 18540
ctggtgcagt tcgcccgcgc cacagacacc tacttcaatc tggggaacaa gtttaggaac 18600
cccaccgtgg cgcccaccca tgatgtgacc accgaccgca gtcagcggct gatgctgcgc 18660
tttgtgcccg ttgaccggga agacaatacc tacgcataca aagttcgata caccttggct 18720
gtgggcgaca acagagtgct ggatatggcc agcactttct ttgacattcg gggtgtgttg 18780
gatagaggtc ctagcttcaa gccatattct ggcactgctt acaactcatt ggcccctaag 18840
ggcgctccca atacatctca gtggcttaat aagggagatg aagaggatgg ggaagacgac 18900
caacaagcta catacacttt tggcaatgcg ccagtaaaag ccgaagctga aattacaaaa 18960
gaaggactgc caataggttt ggaagttcca tctgaaggtg gccctaaacc catttatgct 19020
gataaactgt atcagccaga acctcaggtg ggagaggaat cttggactga tacggatggc 19080
acagatgaaa aatatggagg cagagcactt aaacctgaaa ctaaaatgaa accctgctac 19140
gggtctttcg ctaaacctac taatgttaaa ggcgggcagg caaaagtgaa gaaagaagaa 19200
gaaggcaagg ttgaatatga cattgacatg aactttttcg acctaagatc acaaatgact 19260
ggcctcaagc ctaaaattgt aatgtatgca gaaaatgtgg atctagaaac tcctgacact 19320
catgtggtgt acaaacctgg agcttcagat gctagctctc atgcaaacct tggtcaacag 19380
tccatgccca atagacctaa ctatattggc ttcagggaca acttcatcgg actcatgtac 19440
tacaacagta ctggcaacat gggagtgctg gctggacaag cgtctcagct aaatgcagtg 19500
gttgacttgc aagacagaaa cacagaattg tcatatcaac tcttgcttga ttctctgggg 19560
gacagaacca gatatttcag tatgtggaat caagcagtgg atagctatga cccagatgtg 19620
cgtgttattg agaaccatgg tgtggaagat gaacttccta actattgttt tccattggat 19680
ggtgtaggtc cgcgaataga cagttacaag ggaattgaga caaatggtga tgaaaccact 19740
acttggaaag atttagagcc aaagggcata agtgaaattg ctaagggaaa tccgtttgcc 19800
atggaaatta acctccaagc taatctctgg agaagttttc tttattccaa tgtggctctg 19860
tatctcccag actcctacaa atacacccca gccaatgtca ctcttccaac taacaccaac 19920
acttatgact acatgaatgg gcgggtggtt cccccatccc tggtggatac ctacgtaaac 19980
attggcgcca gatggtcttt ggatgccatg gacaatgtca acccctttaa ccatcaccgc 20040
aacgctggcc tgcgataccg gtccatgctt ttgggcaatg gtcgttacgt gcctttccac 20100
attcaagtgc ctcagaaatt ctttgctgtg aagaacctgc tgcttctacc cggttcttac 20160
acctacgagt ggaacttcag aaaggatgtg aacatggtcc tgcagagttc ccttggtaat 20220
gatctccggg tcgatggtgc cagcataagt tttaccagca tcaatctcta tgccaccttc 20280
ttccccatgg cccacaacac tgcctccacc cttgaagcca tgctgcgcaa tgacaccaat 20340
gatcaatcat tcaatgacta cctttctgct gccaacatgc tctaccccat cccggccaac 20400
gctaccaacg ttcccatctc cattccctct cgcaactggg ccgccttcag aggctggtcc 20460
ttcaccagac tcaaaaccaa ggagactccc tctttgggat cagggttcga tccctacttt 20520
gtttactctg gttctatacc ctacctggat ggtaccttct accttaacca cactttcaag 20580
aaagtctcca tcatgtttga ctcttcagtg agctggcctg gtaatgacag attgctaagt 20640
ccaaatgagt tcgaaatcaa gcgcacagtt gatggggaag gctacaatgt ggcccaatgt 20700
aacatgacca aagactggtt cctggtccag atgcttgcca actacaacat tggataccag 20760
ggcttctacg ttcctgaggg ttacaaggat cgcatgtact ccttcttcag aaacttccag 20820
cccatgagta gacaggtggt tgatgagatt aactacaaag actataaagc tgtcgccgta 20880
ccctaccagc ataataactc tggctttgtg ggttacatgg ctcctaccat gcgtcagggt 20940
caagcgtacc ctgctaacta cccatacccc ctaattggaa ccactgcagt aaccagtgtc 21000
acccagaaaa aattcctgtg cgacaggacc atgtggcgca tcccattctc tagcaacttc 21060
atgtccatgg gtgcccttac agacctggga cagaacttgc tgtatgccaa ctcggcccat 21120
gcgctggaca tgacttttga ggtggatccc atggatgagc ccaccctgct ttatcttctt 21180
ttcgaagtct tcgacgtggt cagagtgcac cagccacacc gcggcgtcat cgaggccgtc 21240
tacctgcgca caccgttctc ggccggcaac gccaccacat aagaagcctc ttgcttcttg 21300
caagcagcag ctgcagccat gtcatgcggg tccggaaacg gctccagcga gcaagagctc 21360
aaagccatcg tccgagacct gggctgcgga ccctatttcc tgggaacctt tgacaagcgt 21420
ttcccggggt tcatggcccc cgacaagctc gcctgcgcca tagtcaacac tgccggacgc 21480
gagacggggg gagagcactg gctggctttt ggttggaacc cgcgctccaa cacctgctac 21540
ctttttgatc cttttgggtt ctcggatgag cgactcaaac agatttacca gtttgagtac 21600
gaggggctcc tgcgccgcag tgcccttgct accaaagacc gctgcatcac cctggaaaag 21660
tccacccaga gcgtgcaggg cccgcgctca gccgcctgtg gacttttttg ctgtatgttc 21720
cttcatgcct ttgtgcactg gcccgaccgc cccatgaacg gaaaccccac catgaagttg 21780
ctgactgggg tgtcaaacag catgctccaa tcaccccaag tccagcccac cctgcgccgc 21840
aaccaggagg cgctatatcg cttcctaaac acccactcat cttactttcg ttctcaccgc 21900
gcacgcattg aaagggccac cgcgtttgac cgtatggata tgcaataagt catgtaaaac 21960
cgtgttcaat aaaaagcatt ttatttttac atgcactaag gctctggttt tttgctcatt 22020
cgttttcatc attcactcag aaatcaaatg ggttctggcg ggagtcagag tgacccgtgg 22080
gcagggagac gttgcggaac tgtaacctgt tctgccactt gaactcgggg atcaccagct 22140
tgggaactgg aatttcggga aaggtgtctt gccacaactt tctggtcagt tgcagggcgc 22200
caagcaggtc aggagcagag atcttgaaat cacagttggg gccggcattc tggacacggg 22260
agttgcggta cactgggttg caacactgga acaccatcaa ggctgggtgt ctcacgcttg 22320
ccagcacggt cgggtcactg atggtagtca catccaagtc ttcagcattg gccattccaa 22380
agggggtcat cttacaggtc tgcctgccca tcacgggagc gcagcctggc ttgtggttgc 22440
aatcgcaatg aatggggatc agcatcatcc tggcttggtc gggggttatc cctgggtaca 22500
cggccttcat gaaggcttcg tactgcttga aagcttcctg agccttactt ccctcggtgt 22560
aaaacatccc acaggacttg ctggaaaatt ggttagtagc acagttggca tcattcacac 22620
agcagcgggc atcgttgttg gccaactgga ccacatttct gccccagcgg ttctgggtga 22680
tcttggctct gtctgggttc tccttcatag cgcgctgccc gttttcgctc gccacatcca 22740
tctcgataat gtggtccttc tggatcatga tagtgccatg caggcatttc accttgcctt 22800
cgtaatcggt gcatccatga gcccacagag cgcacccggt gcactcccaa ttattgtggg 22860
cgatctcaga ataagaatgc accaatccct gcatgaatct tcccatcatc gctgtcaggg 22920
tcttcatgct actaaatgtc agcgggatgc cacggtgctc ctcgttcaca tactggtggc 22980
agatacgctt gtactgctcg tgctgctctg gcatcagctt gaaagaggtt ctcaggtcat 23040
tatccagcct atacctctcc attagcacag ccatcacttc catgcccttc tcccaggcag 23100
ataccagggg caagctcaaa ggattcctaa cagcaataga agtagctcct ttagctatag 23160
ggtcattctt gtcgatcttc tcaacacttc tcttgccatc cttctcaatg atgcgcaccg 23220
gggggtagct gaagcccacg gccaccaact gagcctgttc tctttcttct tcgctgtcct 23280
ggctgatgtc ttgcagaggg acatgcttgg tcttcctggg cttcttcttg ggagggatcg 23340
ggggaggact gttgctccgt tccggagaca gggatgaccg cgaagtttcg cttaccagta 23400
ccacctggct ctcgatagaa gaatcggacc ccacgcgacg gtaggtgttc ctcttcgggg 23460
gcagaggtgg aggcgactga gatgggctgc ggtccggcct tggaggcgga tggctggcag 23520
agcccattcc gcgttcgggg gtgtgctccc gttggcggtc gcttgactga tttcctccgc 23580
ggctggccat tgtgttctcc taggcagaga aacaacagac atggaaactc agccatcact 23640
gccaacatcg ctgcaagcgc catcacacct cgcccccagc agcgacgagg aggagagctt 23700
aaccacccca ccacccagtc ccgctaccac cacctctacc ctcgatgatg aggaggaggt 23760
cgacgcagcc caggagatgc aggcgcagga taatgtgaaa gcggaagaga ttgaggcaga 23820
tgtcgagcag gacccgggct atgtgacacc ggcggagcac gaggaggagc tgaaacgttt 23880
tctagacaga gaggatgacg accgcccaga gcatcaccag gaggctggcc tcggggatca 23940
tgttgccgac tacctctccg ggcttgggag ggaggacgtg ctcctcaaac atctagcaag 24000
gcagtcgatc atagttaaag acgcactact caacctcacc gaagtgccta tcagtgtgga 24060
agagcttagc cgcgcctacg agctgaacct cttttcgcct cagatacccc ccaagcggca 24120
gcgaaacggc acctgcgagg ccaaccctcg actcaacttc tatccagctt ttactgtccc 24180
cgaagtgctg gccacctacc acatcttttt taagaaccaa aagattccag tctcctgccg 24240
cgccaaccgc acccgcgcag atgcccttct caacttgggt ccgggagctc gcttacctga 24300
tatagcttcc ttggaagagg ttccaaagat ctttgagggt ctgggaagtg atgagactcg 24360
ggccgcaaat gctctgcaac agggagagaa tggtatggat gaacatcaca gcgctctagt 24420
ggaactggag ggtgacaatg cccggcttgc agtgctcaag cgcagtatcg tggtcaccca 24480
ttttgcctac cccgctgtta acctgccgcc caaagtcatg agcgctgtca tggaccatct 24540
gctcatcaaa cgagcaagtc cactttcaga aaaccagaac atgcaggatc cagacgcctc 24600
ggaggagggc aagccggtag tcagtgacga gcagctatct cgctggctgg gtaccaactc 24660
cccccgagat ttggaagaaa gacgcaagct tatgatggct gtagtgctag taactgttga 24720
gttggagtgt ctgcgccgct tttttaccga ccccgagacc ctgcgcaagc tagaggagaa 24780
cctgcactac accttcagac atggcttcgt gcgccaggca tgcaagatct ccaacgtgga 24840
gctcaccaac ctggtttcat acatgggcat tttgcatgag aaccggctag ggcagagcgt 24900
tctgcacacc accctgaagg gggaggcccg ccgcgactac atccgagact gtgtctacct 24960
ctacctctgc catacctggc agactggtat gggtgtgtgg caacagtgtt tggaagagca 25020
gaaccttaaa gagctggaca agctcttgca gagatccctc aaagccctgt ggacaggttt 25080
tgacgagcgc accgtcgcct cggacctggc ggacatcatc ttccccgagc gtcttagggt 25140
tactctgcga aacggcctgc cagacttcat gagccagagc atgcttaaca actttcgctc 25200
tttcatcctg gaacgctccg gtatcctgcc tgccacctgc tgtgcgctgc cctccgactt 25260
tgtgcctctc acctaccgcg agtgcccacc gccgctatgg agccactgct acctattccg 25320
cctggccaac tacctctcct accactcgga tgtgatagag gatgtgagcg gagacggcct 25380
gctggaatgc cactgccgat gcaatttatg cacaccccac cgctccctcg cctgcaaccc 25440
ccagttgcta agcgagaccc agatcatcgg caccttcgag ttgcagggtc ccaacagtga 25500
aggcgagggg tcttctccgg ggcagagtct gaaactgaca ccggggctgt ggacctccgc 25560
ctacctgcgc aagtttcatc ccgaggacta tcatccctat gagatcaggt tctatgagga 25620
ccagtcacat cctcccaaag tcgagctctc agcctgcgtc atcacccagg gggcaattct 25680
ggcccaattg caagccatcc aaaaatcccg ccaagaattt ctgctgaaaa agggaagcgg 25740
ggtctacctt gacccccaga ccggtgagga gctcaacaca aggttccccc aggatgtccc 25800
atcgccgagg aagcaagaag ctgaaggtgc agctgtcacc cccagaggat atggaggaag 25860
actgggacag tcaggcagag gaggagatgg aagattggga cagccaggca gaggaggtgg 25920
acagcctgga ggaagacagt ttggaggagg aagacgagga ggcagaggag gtggaagaag 25980
caaccgccgc caaacagttg tcatcggcgg cggagacaag caagtcccca gacagcagca 26040
cggctaccat ctccgctccg ggtcgggggg cccagcggcg gcccaacagt agatgggacg 26100
agaccgggcg atttccaaac ccgaccaccg cttccaagac cggtaagaag gagcgacagg 26160
gatacaagtc ctggcgtgga cataaaaacg ctatcatctc ctgcttgcat gaatgcgggg 26220
gcaacatatc cttcacccgg cgatacctgc ttttccacca cggtgtgaac ttcccccgca 26280
atatcttgca ttactaccgt cacctccaca gcccctactg cagtcagcaa gtcccggcaa 26340
ccccgacaga aaaagacagc agcgacaacg gtgaccagaa aagcagcagt tagaaaatcc 26400
acaacaagtg cagcaggagg aggactgagg atcacagcga acgagccagc gcagaccaga 26460
gagctgagga accggatctt tccaaccctc tatgccatct tccagcagag tcgggggcaa 26520
gagcaggaat tgaaagtaaa aaaccgatct ctgcgctcgc tcaccagaag ttgtttgtat 26580
cacaagagcg aagaccaact tcagcgcact ctcgaggacg ccgaggctct cttcaacaag 26640
tactgcgcgc tgactcttaa agagtagccc ttgcccgcgc tcattcgaaa acggcgggaa 26700
tcacgtcacc cttggcagct gtcctttgcc ctcgtcatga gtaaagagat tcccacgcct 26760
tacatgtgga gctatcagcc ccaaatgggg ttggcagcag gtgcttccca ggactactcc 26820
acccgcatga attggcttag cgccgggccc tcaatgatat cacgggttaa tgatatacga 26880
gcttatcgaa accagttact cctagaacag tcagctctta ccaccacacc ccgccaacac 26940
cttaatcccc gaaattggcc cgccgccctg gtgtaccagg aaaatcccgc tcccaccacc 27000
gtactacttc ctcgagacgc ccaggccgaa gttcagatga ctaacgcagg tgtacagctg 27060
gcgggcggtt ccgccctatg tcgtcaccgg cctcaacaga gtataaaacg cctggtgatc 27120
agaggccgag gtatccagct caacgacgag tcggttagct cttcgcttgg tctgcgacca 27180
gacggagtct tccagatcgc cggctgtggg agatcttcct tcactcctcg tcaggctgtg 27240
ctgactttgg agagttcgtc ctcgcagccc cgctcgggcg gcatcggaac tctccagttt 27300
gtggaggagt ttactccctc tgtctacttc aaccccttct ccggctctcc tggccagtac 27360
ccggacgagt tcataccgaa cttcgacgca atcagcgagt cagtggatgg ctatgattga 27420
tgtctaatgg tggcgcggct gagctagctc gactgcgaca cctagaccac tgccgccgct 27480
ttcgctgttt cgcccgggaa ctcaccgagt tcatctactt cgaactctcc gaggagcacc 27540
ctcagggtcc ggcccacgga gtgcggatta ccatcgaagg gggaatagac tctcgcctgc 27600
atcgcatctt ctcccagcgg cccgtgctga ttgagcgcga ccagggaaat acaaccatct 27660
ccatctactg catctgtaac caccccggat tgcatgaaag cctttgctgt cttgtttgtg 27720
ctgagtttaa taaaaactga gttaagacct tcctacggac taccgcttct tcaatcagga 27780
ctttacaaca ccaaccagat cttccagaag acccagaccc ttcctcctct gatccaggac 27840
tctaactcta ccttaccagc accctccact actaaccttc ccgaaactaa caagcttgga 27900
tctcatctgc aacaccgcct ttcacgaagc cttctttctg ccaatactac cactcccaaa 27960
accggaggtg agctccgcgg tcttcctact gacgacccct gggtggtagc gggttttgta 28020
acgttaggat tagttgcggg tgggcttgtg ctaatccttt gctacctata cacaccttgc 28080
tgtgcatatt tagtcatatt gtgctgttgg tttaagaaat gggggccata ctagtcgtgc 28140
ttgctttact ttcgcttttg ggtctgggct ctgctaatct caatcctctt gatcacaatc 28200
catgtctaga cttcgaccca gaaaattgca cacttacttt tgcacccgac acaagccgtc 28260
tctgtggagt tcttattaag tgcggatggg actgcaggtc cgttgaaatt acacataata 28320
acaaaacatg gaacaatacc ttatccacca catgggagcc aggagttccc gagtggtata 28380
ctgtctctgt ccgaggtcct gacggttcca ttcgcattag taacaacact ttcatttttt 28440
ctgaaatgtg cgatctggcc atgtttatga gcaaacagta tgacctatgg cctcctagca 28500
aagagaacat tgtggcattt tccattgctt attgcttggt aacatgcatc atcactgcta 28560
tcatttgtgt gtgcatacac ttgcttatag ttattcgccc tagacaaagc aatgaggaaa 28620
aagagaaaat gccttaacct ttttcctcat accttttctt tacagcatgg cttctgttac 28680
agctctaatt attgccagca ttgtcactgt cgctcacggg caaacaattg tccatattac 28740
cttaggacat aatcacactc ttgtagggcc cccaattact tcagaggtta tttggaccaa 28800
acttggaagt gttgattatt ttgatataat ttgcaacaaa actgaaccaa tatttgtaat 28860
ctgtaacaga caaaatctca cgttaattaa tgttagcaaa atttataacg gttactatta 28920
tggttatgat agatccagta gccaatataa aaattactta gttcgcataa ctcagcccaa 28980
atcaacagtg ccaactatga caataattaa aatggctaat aaagcattag aaaattttac 29040
attaccaaca acgcccaatg aaaaaaacat tccaaattca atgattgcaa ttattgcggc 29100
ggtggcattg ggaatggcac taataataat atgcatgttc ctatatgctt gttgctataa 29160
aaagtttcaa cataaacagg atccactact aaattttaac atttaatttt ttatacagat 29220
gatttccact acaattttta tcattactag ccttgcagct gtaacttatg gccgttcaca 29280
cctaactgta cctgttggct caacatgtac actacaagga ccccaagaag gctatgtcac 29340
ttggtggaga atatatgata atggagggtt cgctagacca tgtgatcagc ctggtacaaa 29400
attttcatgc aacggaagag acttgaccat tattaacata acattaaatg agcaaggctt 29460
ctattatgga accaactata aaaatagttt agattacaac attattgtag tgccagccac 29520
cacttctgct ccccgcaaat ccactttctc tagcagcagt gccaaagcaa gcacaattcc 29580
taaaacagct tctgctatgt taaagcttcg aaaaatcgct ttaagtaatt ccacagcagc 29640
tcccaataca attcctaaat caacaattgg catcattact gccgtggtag tgggattaat 29700
gattatattt ttgtgcataa tgtactacgc ctgctgctat agaaaacatg aacaaaaagg 29760
tgatgcatta ctaaattttg atatttaatt ttttatagaa ttatgatatt gtttcaatcc 29820
aatgccacta acactatcaa tgtgcagact actttaaaac atgacatgga aaaccacact 29880
acctcctatg catacacaaa tattcagcct aaatacgcta tgcaactaga aatcaccata 29940
ctaattgtaa ttggaattct tatactatct gttattcttt attttatatt ctgccgtcaa 30000
atacccaatg ttcatagaaa ttctaaaaga cgtcccatct attctcctat gattagtcgt 30060
ccccatatgg ctctgaatga aatctaagat cttttttttt cttttacagt atggtgaaca 30120
tcaatcatga ttcctagaaa tttcttcttc accatactca tctgtgcttt caatgtctgt 30180
gctactttca cagcagtagc cactgcaagc ccagactgta taggaccatt tgcttcctat 30240
gcactttttg cctttgttac ttgcatctgc gtgtgtagca tagtctgcct ggttattaat 30300
tttttccaac tggtagactg gatctttgtg cgaattgcct acctacgtca ccatcccgaa 30360
taccgcaatc aaaatgttgc ggcacttctt aggcttattt aaaaccatgc aggctatgct 30420
accagttatt ttaattctgc tactaccctg cattgcccta ccttccaccg ccactcgcgc 30480
tacacctgaa caacttagaa aatgcaaatt tcaacaacca tggtcatttc ttgattgcta 30540
ccatgaaaaa tctgattttc ccacatactg gatagtgatt gttggaataa ttaacatact 30600
ttcatgtacc tttttctcaa tcacaatata ccccacattt aattttgggt ggaattctcc 30660
caatgcactg ggttacccac aagagctaga tgaacatatc ccactacaac acatacaaca 30720
accactagca ttggtagagt atgaaaatga gccacaacct tcactgcctc ctgctattag 30780
ttacttcaac ctaaccggcg gagatgactg aaatactcac cacctccaat tccgccgagg 30840
atctgcttga tatggacggc cgcgcctcag aacagcgact cgcccaacta cgcatccgcc 30900
agcagcagga acgcgtgacc aaagagctca gagatgtcat ccaaattcac caatgcaaaa 30960
aaggcatatt ttgtttggta aaacaagcca agatatccta cgagatcacc gctactgacc 31020
atcgcctctc ttacgaactt ggcccccaac gacaaaaatt tacatgcatg gtgggaatca 31080
accctatagt tatcacccag caaagtggag atactaaggg ttgcattcac tgctcttgcg 31140
attccaccga gtgcacctac accctgctga agaccctatg cggcctaaga gacctgctac 31200
ccatgaatta aaaattaata aaaaattact tacttgaaat cagcaataag gtctctgttg 31260
aaattttttc ccagcagcac ctcgcttccc tcttcccaac tctggtattc taaaccccgt 31320
tcagcggcat actttctcca tactttaaag gggatgtcaa attttagctc ctctcctgta 31380
cccacgatct tcatgtcttt cttcccagat gaccaagaga gtccggctca gtgattcctt 31440
caaccctgtc tacccctatg aagacgaaag cacctcccaa caccccttta taaacccagg 31500
gtttatttcc ccaaatggct ttacacaaag cccagacgga gttcttactt taaattgttt 31560
aaccccacta acaaccacag gcgggccttt acagttaaaa gtgggagggg gacttatagt 31620
ggatgacact gatgggacct tacaagaaaa catacgtgtt acagcaccca ttactaaaaa 31680
taatcattct gtagaactat ccattggaaa tggattagaa acacaaaaca ataaactatg 31740
tgccaaattg ggaaatgggt taaaatttaa caacggtgac atttgtataa aggatagtat 31800
taacacctta tggactggaa taaagcctcc acctaactgt caaatagtgg aaaacactga 31860
tacaaacgat ggcaaactta ctttagtatt agtaaaaaac ggaggacttg ttaatggcta 31920
cgtatctcta gttggtgtat cagacactgt gaaccaaatg ttcacacaaa agtcagcaac 31980
catacaatta agattatatt tcgactcttc tggaaatcta ttaactgatg aatcaaactt 32040
aaaaattcca cttaaaaata aatcttctac agcaaccagt gaagctgcaa ccagcagcaa 32100
agcctttatg ccaagtacta cagcttatcc ctttaacacc actactaggg atagtgaaaa 32160
ctatattcat ggaatatgtt actatatgac tagttatgat agaagtctag ttcccttaaa 32220
catttctata atgctaaaca gccgtacgat ttcttccaat gttgcctatg ccatacaatt 32280
tgaatggaat ctaaatgcaa aagaatctcc agaaagcaac atagctacgc tgaccacatc 32340
cccctttttc ttttcttata ttagagaaga cgacaactaa aaaataaagt ttaagtgttt 32400
ttatttaaaa atcacaaaat tcgagtagtt attttgcctc ccccttccca tttaacagaa 32460
tacaccaatc tctccccacg cacagcttta aacatttgga taccattaga gatagacata 32520
gttttagttt ccacattcca aacagtttca gagcgagcca atctggggtc agtgatacat 32580
aaaaatgcat cgggatagtc ttttaaagcg ctttcacagt ccaactgctg cggatgcgac 32640
tccggagtct ggatcacagt catctggaag aagaacgatg ggaatcataa tccgaaaacg 32700
gaatcgggcg attgtgtctc atcaaaccca caagcagccg ctgtctgcgt cgctccgtgc 32760
gactgctgtt tatgggatcg gggtctgcag tgtcctgaag catgatttta atagccctta 32820
acattaactt tctggtgcga tgcgcgcagc aacgcattct gatttcactg agattactac 32880
agtatgtaca gcacattatc acaatattgt ttaataaacc ataattaaaa gcgctccagc 32940
caaaactcat atctgataca atcgcccctg catgaccatc ataccaaatt ttaatataaa 33000
ttaaatgtcg ttccctcaaa aacacactac ccacatacat gatctctttt ggcatgtgca 33060
tattaacaat ctgtctgtac catggacaac gttggttaat catgcaaccc aatataacct 33120
tccggaacca cactgccaac accgctcccc cagccatgca ttgaagtgaa ccctgctgat 33180
tacaatgaca atgaagaacc caattctctc gaccatgaat cacttgagac tgaaaaatat 33240
ctatagtagc acaacaaaga cataaatgca tgcatcttct cataattttt aactcatctg 33300
gatttaaaaa catatcccaa ggaatgggaa actcttgcaa aacagtaaag ctggcagaac 33360
aaggaagacc acgaacacaa cttacactat gcatagtcat agtatcacaa tctggcaaca 33420
gcgggtggtc ttcagtcata gaagctcggg tttcattttc ctcacatcgt ggtaactggg 33480
ctctggtgta agggtgatgt ctggcgcatg atgtcgagcg tgcgcgcaac cttgtcataa 33540
tggagttgtt tcctgacatt ctcgtatttt gtatagcaaa acgcggccct ggcacaacac 33600
actcttcttc gtcttctatc ctgccgctta gtgtgttccg tctgataatt caagtacagc 33660
cacactctta agttggtcaa aagaatgctg gcttcagttg taatcaaaac tccatcatat 33720
ttaattgttc taaggaaatc atccacggta gcatatgcaa atcccaacca agcaatgcaa 33780
ctggattgcg tttcaagcag cagaggagag ggaagagacg gaagaatcat gttaattttt 33840
attccaaacg atctcgcagt acttcaaatt gtagatcgcg cagatggcat ctatcgcccc 33900
cactgtgttg gtgaaaaagc acagctaaat caaaagaaat gcgattttca aggtgctcaa 33960
cggtggcttc caacaaagcc tccacgcgca catccaaaaa caaaagaata ccaaaagaag 34020
gagcattttc taactcctca aacatcatat tacattcctg caccattccc agataatttt 34080
cagctttcca gccttgaatt attcgtgtca gttcttgtgg taaatccaaa ccacacatta 34140
caaacaggtc ccggagggcg ccctccacca ccattcttaa acacaccctc ataatgacaa 34200
aatatcttgc tcctgtgtca cctgtagcaa attaagaatg gcatcatcaa ttgacatgcc 34260
cttggctcta agttcttctc taagttctag ttgtaaatac tctctcatat tatcaccaaa 34320
ctgcttagcc aaaagccccc cgggaacaat agcaggggac gctacagtgc agtacaagcg 34380
cagacctccc caattggctc cagcaaaaac aagattagaa taagcatact gggaaccacc 34440
agtaatatca tcaaagttgc tggaaatata atcaggcaga atttcttgta aaaattgaat 34500
aaaagaaaaa ttttccaaag aaacattcaa aatctctggg atgcaaatgc aataggttac 34560
cgcgctgcgc tccaacattg ttagttttga attagtctgc aaaataaaag aaacaagcgt 34620
catatcatag tagcctgtcg aacaggtgga taaatcagtc tttccatcac aagacaagcc 34680
acagggtctc cagctcgacc ctcgtaaaac ctgtcatcgt gattaaacaa cagcaccgaa 34740
agttcctcgc ggtggccagc atgaataatt cttgatgaag catataatcc agacatgtta 34800
gcatcagtta aagagaaaaa acagccaaca tagcctctgg gtataattat gcttaatctt 34860
aagtatagca aagccacccc tcgcggatac aaagtaaaag gcacaggaga ataaaaaata 34920
taattatttc tctgctgctg ttcaggcaac gtcgcccccg gtccatctaa atacacatac 34980
aaagcctcat cagccatggc ttaccagaca aagtacagcg ggcgcacaaa gcacaagctc 35040
taaagaagct ctaaagacac tcttcaacct ctccacaata tatacacaag ccctaaactg 35100
acgtaatggg agtaaagtgt aaaaaatccc gccaagccca acacacaccc cgaaactgcg 35160
tcagcaggga aaagtacagt ttcacttccg cattcccaac aagcgtaagt tcctctttct 35220
catggtacgt cacatccgat taacttgcaa cgtcattttc ccacggtcgc accgcccctt 35280
ttagccgttc accccgcagc caatcaccac acagcgcgca cttttttaaa ttacctcatt 35340
tacatattgg caccattcca tctataaggt atattatatt gattg 35385
<210> 154
<211> 1468
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
ET3 sequence
<400> 154
Met Gln Leu Glu Leu Ser Thr Cys Val Phe Leu Cys Leu Leu Pro Leu
1 5 10 15
Gly Phe Ser Ala Ile Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser
20 25 30
Trp Asp Tyr Arg Gln Ser Glu Leu Leu Arg Glu Leu His Val Asp Thr
35 40 45
Arg Phe Pro Ala Thr Ala Pro Gly Ala Leu Pro Leu Gly Pro Ser Val
50 55 60
Leu Tyr Lys Lys Thr Val Phe Val Glu Phe Thr Asp Gln Leu Phe Ser
65 70 75 80
Val Ala Arg Pro Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile
85 90 95
Gln Ala Glu Val Tyr Asp Thr Val Val Val Thr Leu Lys Asn Met Ala
100 105 110
Ser His Pro Val Ser Leu His Ala Val Gly Val Ser Phe Trp Lys Ser
115 120 125
Ser Glu Gly Ala Glu Tyr Glu Asp His Thr Ser Gln Arg Glu Lys Glu
130 135 140
Asp Asp Lys Val Leu Pro Gly Lys Ser Gln Thr Tyr Val Trp Gln Val
145 150 155 160
Leu Lys Glu Asn Gly Pro Thr Ala Ser Asp Pro Pro Cys Leu Thr Tyr
165 170 175
Ser Tyr Leu Ser His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu
180 185 190
Ile Gly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu Thr Arg Glu Arg
195 200 205
Thr Gln Asn Leu His Glu Phe Val Leu Leu Phe Ala Val Phe Asp Glu
210 215 220
Gly Lys Ser Trp His Ser Ala Arg Asn Asp Ser Trp Thr Arg Ala Met
225 230 235 240
Asp Pro Ala Pro Ala Arg Ala Gln Pro Ala Met His Thr Val Asn Gly
245 250 255
Tyr Val Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys His Lys Lys Ser
260 265 270
Val Tyr Trp His Val Ile Gly Met Gly Thr Ser Pro Glu Val His Ser
275 280 285
Ile Phe Leu Glu Gly His Thr Phe Leu Val Arg His His Arg Gln Ala
290 295 300
Ser Leu Glu Ile Ser Pro Leu Thr Phe Leu Thr Ala Gln Thr Phe Leu
305 310 315 320
Met Asp Leu Gly Gln Phe Leu Leu Phe Cys His Ile Ser Ser His His
325 330 335
His Gly Gly Met Glu Ala His Val Arg Val Glu Ser Cys Ala Glu Glu
340 345 350
Pro Gln Leu Arg Arg Lys Ala Asp Glu Glu Glu Asp Tyr Asp Asp Asn
355 360 365
Leu Tyr Asp Ser Asp Met Asp Val Val Arg Leu Asp Gly Asp Asp Val
370 375 380
Ser Pro Phe Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr
385 390 395 400
Trp Val His Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro
405 410 415
Leu Val Leu Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn
420 425 430
Asn Gly Pro Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met
435 440 445
Ala Tyr Thr Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu
450 455 460
Ser Gly Ile Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu
465 470 475 480
Leu Ile Ile Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro
485 490 495
His Gly Ile Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys
500 505 510
Gly Val Lys His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe
515 520 525
Lys Tyr Lys Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp
530 535 540
Pro Arg Cys Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg
545 550 555 560
Asp Leu Ala Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu
565 570 575
Ser Val Asp Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val
580 585 590
Ile Leu Phe Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu
595 600 605
Asn Ile Gln Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp
610 615 620
Pro Glu Phe Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val
625 630 635 640
Phe Asp Ser Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp
645 650 655
Tyr Ile Leu Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe
660 665 670
Ser Gly Tyr Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr
675 680 685
Leu Phe Pro Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro
690 695 700
Gly Leu Trp Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly
705 710 715 720
Met Thr Ala Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp
725 730 735
Tyr Tyr Glu Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys
740 745 750
Asn Asn Ala Ile Glu Pro Arg Ser Phe Ala Gln Asn Ser Arg Pro Pro
755 760 765
Ser Ala Ser Ala Pro Lys Pro Pro Val Leu Arg Arg His Gln Arg Asp
770 775 780
Ile Ser Leu Pro Thr Phe Gln Pro Glu Glu Asp Lys Met Asp Tyr Asp
785 790 795 800
Asp Ile Phe Ser Thr Glu Thr Lys Gly Glu Asp Phe Asp Ile Tyr Gly
805 810 815
Glu Asp Glu Asn Gln Asp Pro Arg Ser Phe Gln Lys Arg Thr Arg His
820 825 830
Tyr Phe Ile Ala Ala Val Glu Gln Leu Trp Asp Tyr Gly Met Ser Glu
835 840 845
Ser Pro Arg Ala Leu Arg Asn Arg Ala Gln Asn Gly Glu Val Pro Arg
850 855 860
Phe Lys Lys Val Val Phe Arg Glu Phe Ala Asp Gly Ser Phe Thr Gln
865 870 875 880
Pro Ser Tyr Arg Gly Glu Leu Asn Lys His Leu Gly Leu Leu Gly Pro
885 890 895
Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val Thr Phe Lys Asn
900 905 910
Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser Leu Ile Ser Tyr Pro
915 920 925
Asp Asp Gln Glu Gln Gly Ala Glu Pro Arg His Asn Phe Val Gln Pro
930 935 940
Asn Glu Thr Arg Thr Tyr Phe Trp Lys Val Gln His His Met Ala Pro
945 950 955 960
Thr Glu Asp Glu Phe Asp Cys Lys Ala Trp Ala Tyr Phe Ser Asp Val
965 970 975
Asp Leu Glu Lys Asp Val His Ser Gly Leu Ile Gly Pro Leu Leu Ile
980 985 990
Cys Arg Ala Asn Thr Leu Asn Ala Ala His Gly Arg Gln Val Thr Val
995 1000 1005
Gln Glu Phe Ala Leu Phe Phe Thr Ile Phe Asp Glu Thr Lys Ser
1010 1015 1020
Trp Tyr Phe Thr Glu Asn Val Glu Arg Asn Cys Arg Ala Pro Cys
1025 1030 1035
His Leu Gln Met Glu Asp Pro Thr Leu Lys Glu Asn Tyr Arg Phe
1040 1045 1050
His Ala Ile Asn Gly Tyr Val Met Asp Thr Leu Pro Gly Leu Val
1055 1060 1065
Met Ala Gln Asn Gln Arg Ile Arg Trp Tyr Leu Leu Ser Met Gly
1070 1075 1080
Ser Asn Glu Asn Ile His Ser Ile His Phe Ser Gly His Val Phe
1085 1090 1095
Ser Val Arg Lys Lys Glu Glu Tyr Lys Met Ala Val Tyr Asn Leu
1100 1105 1110
Tyr Pro Gly Val Phe Glu Thr Val Glu Met Leu Pro Ser Lys Val
1115 1120 1125
Gly Ile Trp Arg Ile Glu Cys Leu Ile Gly Glu His Leu Gln Ala
1130 1135 1140
Gly Met Ser Thr Thr Phe Leu Val Tyr Ser Lys Lys Cys Gln Thr
1145 1150 1155
Pro Leu Gly Met Ala Ser Gly His Ile Arg Asp Phe Gln Ile Thr
1160 1165 1170
Ala Ser Gly Gln Tyr Gly Gln Trp Ala Pro Lys Leu Ala Arg Leu
1175 1180 1185
His Tyr Ser Gly Ser Ile Asn Ala Trp Ser Thr Lys Glu Pro Phe
1190 1195 1200
Ser Trp Ile Lys Val Asp Leu Leu Ala Pro Met Ile Ile His Gly
1205 1210 1215
Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe Ser Ser Leu Tyr Ile
1220 1225 1230
Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys Lys Trp Gln
1235 1240 1245
Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val Phe Phe Gly
1250 1255 1260
Asn Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe Asn Pro Pro
1265 1270 1275
Ile Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His Tyr Ser Ile
1280 1285 1290
Arg Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp Leu Asn Ser
1295 1300 1305
Cys Ser Met Pro Leu Gly Met Glu Ser Lys Ala Ile Ser Asp Ala
1310 1315 1320
Gln Ile Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe Ala Thr Trp
1325 1330 1335
Ser Pro Ser Lys Ala Arg Leu His Leu Gln Gly Arg Ser Asn Ala
1340 1345 1350
Trp Arg Pro Gln Val Asn Asn Pro Lys Glu Trp Leu Gln Val Asp
1355 1360 1365
Phe Gln Lys Thr Met Lys Val Thr Gly Val Thr Thr Gln Gly Val
1370 1375 1380
Lys Ser Leu Leu Thr Ser Met Tyr Val Lys Glu Phe Leu Ile Ser
1385 1390 1395
Ser Ser Gln Asp Gly His Gln Trp Thr Leu Phe Phe Gln Asn Gly
1400 1405 1410
Lys Val Lys Val Phe Gln Gly Asn Gln Asp Ser Phe Thr Pro Val
1415 1420 1425
Val Asn Ser Leu Asp Pro Pro Leu Leu Thr Arg Tyr Leu Arg Ile
1430 1435 1440
His Pro Gln Ser Trp Val His Gln Ile Ala Leu Arg Met Glu Val
1445 1450 1455
Leu Gly Cys Glu Ala Gln Asp Leu Tyr Val
1460 1465
<210> 155
<211> 147
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
beta-globin sequence
<400> 155
Met Val His Leu Thr Pro Glu Glu Lys Ser Ala Val Thr Ala Leu Trp
1 5 10 15
Gly Lys Val Asn Val Asp Glu Val Gly Gly Glu Ala Leu Gly Arg Leu
20 25 30
Leu Val Val Tyr Pro Trp Thr Gln Arg Phe Phe Glu Ser Phe Gly Asp
35 40 45
Leu Ser Thr Pro Asp Ala Val Met Gly Asn Pro Lys Val Lys Ala His
50 55 60
Gly Lys Lys Val Leu Gly Ala Phe Ser Asp Gly Leu Ala His Leu Asp
65 70 75 80
Asn Leu Lys Gly Thr Phe Ala Thr Leu Ser Glu Leu His Cys Asp Lys
85 90 95
Leu His Val Asp Pro Glu Asn Phe Arg Leu Leu Gly Asn Val Leu Val
100 105 110
Cys Val Leu Ala His His Phe Gly Lys Glu Phe Thr Pro Pro Val Gln
115 120 125
Ala Ala Tyr Gln Lys Val Val Ala Gly Val Ala Asn Ala Leu Ala His
130 135 140
Lys Tyr His
145
<210> 156
<211> 147
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
gamma-globin sequence
<400> 156
Met Gly His Phe Thr Glu Glu Asp Lys Ala Thr Ile Thr Ser Leu Trp
1 5 10 15
Gly Lys Val Asn Val Glu Asp Ala Gly Gly Glu Thr Leu Gly Arg Leu
20 25 30
Leu Val Val Tyr Pro Trp Thr Gln Arg Phe Phe Asp Ser Phe Gly Asn
35 40 45
Leu Ser Ser Ala Ser Ala Ile Met Gly Asn Pro Lys Val Lys Ala His
50 55 60
Gly Lys Lys Val Leu Thr Ser Leu Gly Asp Ala Thr Lys His Leu Asp
65 70 75 80
Asp Leu Lys Gly Thr Phe Ala Gln Leu Ser Glu Leu His Cys Asp Lys
85 90 95
Leu His Val Asp Pro Glu Asn Phe Lys Leu Leu Gly Asn Val Leu Val
100 105 110
Thr Val Leu Ala Ile His Phe Gly Lys Glu Phe Thr Pro Glu Val Gln
115 120 125
Ala Ser Trp Gln Lys Met Val Thr Ala Val Ala Ser Ala Leu Ser Ser
130 135 140
Arg Tyr His
145
<210> 157
<211> 42
<212> PRT
<213> Human mastadenovirus B
<400> 157
Met Ala Lys Arg Ala Arg Leu Ser Thr Ser Phe Asn Pro Val Tyr Pro
1 5 10 15
Tyr Glu Asp Glu Ser Ser Ser Gln His Pro Phe Ile Asn Pro Gly Phe
20 25 30
Ile Ser Pro Asp Gly Phe Thr Gln Ser Pro
35 40
<210> 158
<211> 42
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 7 sequence
<400> 158
Met Thr Lys Arg Val Arg Leu Ser Asp Ser Phe Asn Pro Val Tyr Pro
1 5 10 15
Tyr Glu Asp Glu Ser Thr Ser Gln His Pro Phe Ile Asn Pro Gly Phe
20 25 30
Ile Ser Pro Asn Gly Phe Thr Gln Ser Pro
35 40
<210> 159
<211> 42
<212> PRT
<213> Human mastadenovirus B
<400> 159
Met Thr Lys Arg Val Arg Leu Ser Asp Ser Phe Asn Pro Val Tyr Pro
1 5 10 15
Tyr Glu Asp Glu Ser Thr Ser Gln His Pro Phe Ile Asn Pro Gly Phe
20 25 30
Ile Ser Pro Asn Gly Phe Thr Gln Ser Pro
35 40
<210> 160
<211> 42
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 14 sequence
<400> 160
Met Thr Lys Arg Val Arg Leu Ser Asp Ser Phe Asn Pro Val Tyr Pro
1 5 10 15
Tyr Glu Asp Glu Ser Thr Ser Gln His Pro Phe Ile Asn Pro Gly Phe
20 25 30
Ile Ser Pro Asn Gly Phe Thr Gln Ser Pro
35 40
<210> 161
<211> 42
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 16 sequence
<400> 161
Met Ala Lys Arg Ala Arg Leu Ser Ser Ser Phe Asn Pro Val Tyr Pro
1 5 10 15
Tyr Glu Asp Glu Ser Ser Ser Gln His Pro Phe Ile Asn Pro Gly Phe
20 25 30
Ile Ser Ser Asn Gly Phe Ala Gln Ser Pro
35 40
<210> 162
<211> 42
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 21 sequence
<400> 162
Met Thr Lys Arg Val Arg Leu Ser Asp Ser Phe Asn Pro Val Tyr Pro
1 5 10 15
Tyr Glu Asp Glu Ser Thr Ser Gln His Pro Phe Ile Asn Pro Gly Phe
20 25 30
Ile Ser Pro Asn Gly Phe Thr Gln Ser Pro
35 40
<210> 163
<211> 42
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 34 sequence
<400> 163
Met Thr Lys Arg Val Arg Leu Ser Asp Ser Phe Asn Pro Val Tyr Pro
1 5 10 15
Tyr Glu Asp Glu Ser Thr Ser Gln His Pro Phe Ile Asn Pro Gly Phe
20 25 30
Ile Ser Pro Asn Gly Phe Thr Gln Ser Pro
35 40
<210> 164
<211> 42
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus D37 sequence
<400> 164
Met Ser Lys Arg Leu Arg Val Glu Asp Asp Phe Asn Pro Val Tyr Pro
1 5 10 15
Tyr Gly Tyr Ala Arg Asn Gln Asn Ile Pro Phe Leu Thr Pro Pro Phe
20 25 30
Val Ser Ser Asp Gly Phe Lys Asn Phe Pro
35 40
<210> 165
<211> 42
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 50 sequence
<400> 165
Met Thr Lys Arg Val Arg Leu Ser Asp Ser Phe Asn Pro Val Tyr Pro
1 5 10 15
Tyr Glu Asp Glu Ser Thr Ser Gln His Pro Phe Ile Asn Pro Gly Phe
20 25 30
Ile Ser Pro Asn Gly Phe Thr Gln Ser Pro
35 40
<210> 166
<211> 126
<212> DNA
<213> Human mastadenovirus B
<400> 166
atggccaagc gagctcggct aagcacttcc ttcaacccgg tgtaccctta tgaagatgaa 60
agcagctcac aacacccatt tataaatcct ggtttcattt cccctgacgg gttcacacaa 120
agtcca 126
<210> 167
<211> 126
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 7 sequence
<400> 167
atgaccaaga gagtccggct cagtgattcc ttcaaccctg tctaccccta tgaagatgaa 60
agcacctccc aacacccctt tataaaccca gggtttattt ccccaaatgg ctttacacaa 120
agccca 126
<210> 168
<211> 126
<212> DNA
<213> Human mastadenovirus B
<400> 168
atgaccaaga gagtccggct cagtgactcc ttcaaccctg tctaccccta tgaagatgaa 60
agcacctccc aacacccctt tataaaccca gggtttattt ccccaaatgg cttcacacaa 120
agccca 126
<210> 169
<211> 126
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 14 sequence
<400> 169
atgaccaaga gagtccggct cagtgactcc ttcaaccctg tctaccccta tgaagatgaa 60
agcacctccc aacacccctt tataaaccca gggtttattt ccccaaatgg cttcacccaa 120
agccca 126
<210> 170
<211> 126
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 16 sequence
<400> 170
atggccaaac gagctcggct aagcagctcc ttcaatccgg tctaccccta tgaagatgaa 60
agcagctcac aacacccctt tataaaccct ggtttcattt cctcaaatgg ttttgcacaa 120
agccca 126
<210> 171
<211> 126
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 21 sequence
<400> 171
atgaccaaga gagtccggct cagtgattcc ttcaaccctg tctaccccta tgaagatgaa 60
agcacctccc aacacccctt tataaaccca gggtttattt ccccaaatgg ctttacacaa 120
agccca 126
<210> 172
<211> 126
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 34 sequence
<400> 172
atgaccaaga gagtccggct cagtgactcc ttcaaccctg tctaccccta tgaagatgaa 60
agcacctccc aacacccctt tataaaccca gggtttattt ccccaaatgg cttcacacaa 120
agccca 126
<210> 173
<211> 126
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus D37 sequence
<400> 173
atgtcaaaga ggctccgggt ggaagatgac ttcaaccccg tctaccccta tggctacgcg 60
cggaatcaga atatcccctt cctcactccc ccctttgtct cctccgatgg attcaaaaac 120
ttcccc 126
<210> 174
<211> 126
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Human adenovirus 50 sequence
<400> 174
atgaccaaga gagtccggct cagtgattcc ttcaaccctg tctaccccta tgaagacgaa 60
agcacctccc aacacccctt tataaaccca gggtttattt ccccaaatgg ctttacacaa 120
agccca 126
<210> 175
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 175
Ser Gly Gly Ser Ser Gly Gly Ser
1 5
Claims (29)
- 포유류 대상체에서 생체내 유전자 치료의 방법으로서, 상기 방법은 대상체에게 아데노바이러스 벡터를 투여하는 단계를 포함하고, 아데노바이러스 벡터는
(a) Ad3, Ad7, Ad11, Ad14, Ad16, Ad21, Ad34, Ad37 또는 Ad50 혈청형의 하나 이상의 바이러스 폴리펩타이드를 포함하는 캡시드이되, 하나 이상의 바이러스 폴리펩타이드는
(i) 섬유 매듭(fiber knob);
(ii) 섬유 샤프트(fiber shaft);
(iii) 섬유 꼬리(fiber tail);
(iv) 펜톤; 및
(v) 헥손 중 하나 이상을 포함하는 캡시드; 및
(b) 이종성 핵산 페이로드를 포함하는 이중 가닥 DNA 게놈을 포함하는, 방법. - 제1항에 있어서, 게놈은
(a) 3' ITR 및 5' ITR이되, 3' ITR 및 5' ITR의 각각은 바이러스 폴리펩타이드 혈청형을 갖는 3' ITR 및 5' ITR; 및
(b) 패키징 서열이되, 패킹 서열은 바이러스 폴리펩타이드 혈청형을 갖는 패키징 서열을 추가로 포함하는, 방법. - 제1항 또는 제2항에 있어서, 상기 방법은 아데노바이러스 벡터의 투여 전에 대상체의 조혈 줄기 세포의 동원(mobilization)을 포함하는, 방법.
- 제1항 내지 제3항 중 어느 한 항에 있어서, 이종성 핵산 페이로드는 선택 가능한 마커를 포함하고, 선택적으로 선택 가능한 마커는 MGMTP140K인, 방법.
- 제4항에 있어서, 상기 방법은 대상체에게 선택 제제를 투여하는 단계를 포함하고, 선택적으로 선택 제제는 O6BG 및/또는 BCNU를 포함하는, 방법.
- 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 방법은 대상체에게 하나 이상의 면역억제 제제를 투여하는 단계를 포함하고, 선택적으로 하나 이상의 면역억제 제제의 투여는 아데노바이러스 벡터의 투여 전인, 방법.
- 아데노바이러스 공여자 벡터로서,
(a) Ad3, Ad7, Ad11, Ad14, Ad16, Ad21, Ad34, Ad37 또는 Ad50 혈청형의 하나 이상의 바이러스 폴리펩타이드를 포함하는 캡시드이되, 하나 이상의 바이러스 폴리펩타이드는
(i) 섬유 매듭;
(ii) 섬유 샤프트;
(iii) 섬유 꼬리;
(iv) 펜톤; 및
(v) 헥손 중 하나 이상을 포함하는 캡시드; 및
(b) 이종성 핵산 페이로드를 포함하는 이중 가닥 DNA 게놈을 포함하는, 아데노바이러스 공여자 벡터. - 제7항에 있어서, 게놈은
(a) 3' ITR 및 5' ITR이되, 3' ITR 및 5' ITR의 각각은 바이러스 폴리펩타이드 혈청형을 갖는 3' ITR 및 5' ITR; 및
(b) 패키징 서열이되, 패킹 서열은 바이러스 폴리펩타이드 혈청형을 갖는 패키징 서열을 추가로 포함하는, 벡터. - 제7항 또는 제8항에 있어서, 이종성 핵산 페이로드는 선택 가능한 마커를 포함하고, 선택적으로 선택 가능한 마커는 MGMTP140K인, 벡터.
- 제1항 내지 제9항 중 어느 한 항에 있어서, 하나 이상의 바이러스 폴리펩타이드는
(a) 섬유 매듭 및 섬유 샤프트;
(b) 섬유 매듭 및 섬유 꼬리;
(c) 섬유 매듭 및 펜톤;
(d) 섬유 매듭 및 헥손;
(e) 섬유 매듭, 헥손 및 펜톤;
(f) 섬유 샤프트 및 섬유 꼬리;
(g) 섬유 샤프트 및 펜톤;
(h) 섬유 샤프트 및 헥손;
(i) 섬유 샤프트, 헥손 및 펜톤;
(j) 섬유 꼬리 및 펜톤;
(k) 섬유 꼬리 및 헥손;
(l) 섬유 꼬리, 헥손 및 펜톤;
(m) 섬유 매듭, 섬유 샤프트 및 섬유 꼬리;
(n) 섬유 매듭, 섬유 샤프트 및 펜톤;
(o) 섬유 매듭, 섬유 샤프트 및 헥손;
(p) 섬유 매듭, 섬유 샤프트, 헥손 및 펜톤;
(q) 섬유 매듭, 섬유 샤프트, 섬유 꼬리 및 펜톤;
(r) 섬유 매듭, 섬유 샤프트, 섬유 꼬리, 펜톤 및 헥손; 또는
(s) 펜톤 및 헥손을 포함하는, 방법 또는 벡터. - 제1항 내지 제10항 중 어느 한 항에 있어서, 섬유 매듭은 서열 번호 14, 30, 46, 62, 78, 94, 110, 126 및 142로부터 선택된 서열과 적어도 80%의 동일성을 갖는 서열을 갖는, 방법 또는 벡터.
- 제1항 내지 제11항 중 어느 한 항에 있어서, 섬유 샤프트는 서열 번호 13, 29, 45, 61, 77, 93, 109, 125 및 141로부터 선택된 서열과 적어도 80%의 동일성을 갖는 서열을 갖는, 방법 또는 벡터.
- 제1항 내지 제12항 중 어느 한 항에 있어서, 섬유 꼬리는 서열 번호 157, 158, 159, 160, 161, 162, 163, 164 및 165로부터 선택된 서열과 적어도 80%의 동일성을 갖는 서열을 갖는, 방법 또는 벡터.
- 제1항 내지 제13항 중 어느 한 항에 있어서, 펜톤은 서열 번호 15, 31, 47, 63, 79, 95, 111, 127 및 143으로부터 선택된 서열과 적어도 80%의 동일성을 갖는 서열을 갖는, 방법 또는 벡터.
- 제1항 내지 제14항 중 어느 한 항에 있어서, 헥손은 서열 번호 16, 32, 48, 64, 80, 96, 112, 128 및 144로부터 선택된 서열과 적어도 80%의 동일성을 갖는 서열을 갖는, 방법 또는 벡터.
- 제1항 내지 제15항 중 어느 한 항에 있어서, 아데노바이러스 벡터는 바이러스 펩타이드의 혈청형의 섬유를 포함하는, 방법 또는 벡터.
- 제1항 내지 제16항 중 어느 한 항에 있어서, 섬유는 서열 번호 12, 28, 44, 60, 76, 92, 108, 124 및 140으로부터 선택된 서열과 적어도 80%의 동일성을 갖는 서열을 갖는, 방법 또는 벡터.
- 제1항 내지 제17항 중 어느 한 항에 있어서, 아데노바이러스 벡터는 캡시드가 바이러스 펩타이드의 혈청형을 갖지 않는 섬유 매듭, 섬유 샤프트, 섬유 꼬리, 헥손 또는 펜톤 중 적어도 하나를 포함한다는 점에서 규명된 키메라 벡터인, 방법 또는 벡터.
- 제1항 내지 제18항 중 어느 한 항에 있어서, 아데노바이러스 벡터는 헬퍼 의존적 벡터인, 방법.
- 아데노바이러스 공여자 벡터 게놈으로서,
(a) 3' ITR 및 5' ITR이되, 3' ITR 및 5' ITR은 Ad3, Ad7, Ad11, Ad14, Ad16, Ad21, Ad34, Ad37 또는 Ad50 혈청형으로부터 선택된 동일한 혈청형의 각각인 3' ITR 및 5' ITR;
(b) 패키징 서열이되, 패키징 서열은 ITR 혈청형을 갖는 패키징 서열; 및
(c) 이종성 핵산 페이로드를 포함하는, 아데노바이러스 공여자 벡터 게놈. - 제20항에 있어서, 이종성 핵산 페이로드는 선택 가능한 마커를 포함하고, 선택적으로 선택 가능한 마커는 MGMTP140K인, 아데노바이러스 공여자 벡터 게놈.
- 제1항 내지 제21항 중 어느 한 항에 있어서, 이종성 핵산 페이로드는 단백질을 암호화하는, 방법, 벡터 또는 게놈.
- 제1항 내지 제21항 중 어느 한 항에 있어서, 이종성 핵산 페이로드는 키메라 항원 수용체(CAR), T 세포 수용체(TCR) 또는 작은 RNA를 암호화하고, 선택적으로 작은 RNA는 shRNA인, 방법, 벡터 또는 게놈.
- 제1항 내지 제21항 중 어느 한 항에 있어서, 이종성 핵산 페이로드는 유전자 편집 효소 또는 시스템을 암호화하고, 유전자 편집은 CRISPR 편집, 염기 편집, 프라임 편집 또는 징크 핑거 뉴클레아제 편집으로부터 선택되는, 방법, 벡터 또는 게놈.
- 제1항 내지 제24항 중 어느 한 항에 있어서, 이종성 핵산 페이로드는 교모세포종, 헤모글로빈병증, 혈소판 장애, 판코니 빈혈, 알파-1 항트립신 결핍증, 겸상 세포 빈혈, 지중해빈혈, 중간형 지중해빈혈, 폰 빌레브란트 질환, A형 혈우병, B형 혈우병, V 인자 결핍증, VII 인자 결핍증, X 인자 결핍증, XI 인자 결핍증, XII 인자 결핍증, XIII 인자 결핍증, 베르나르 술리에 증후군, 그레이 혈소판 증후군, 점액다당류증, 낭성 섬유증, 테이 삭스병, 만성 육아종 질환, 비스코트 올드리치 증후군 및 페닐케톤뇨증으로부터 선택된 병태의 치료를 위한 제제를 암호화하는, 방법, 벡터 또는 게놈.
- 제1항 내지 제24항 중 어느 한 항에 있어서, 이종성 핵산 페이로드는 그레이브병, 류마티스성 관절염, 악성 빈혈, 다발성 경화증(MS), 염증성 장 질환, 전신 홍반 루푸스(SLE), 아데노신 데아미나제 결핍증(ADA-SCID) 또는 중증 복합 면역결핍 질환(SCID), 비스코트 올드리치 증후군(WAS), 만성 육아종 질환(CGD), 판코니 빈혈(FA), 배턴병, 부신백질이영양증(ALD) 또는 이염백질이영양증(MLD), 근이영양증, 폐포 단백증(PAP), 피루베이트 키나제 결핍증, 슈바크만 다이아몬드 블랙판 빈혈, 선천성 각화이상증, 낭성 섬유증, 파킨슨병, 알츠하이머병 및 근위축성 측색 경화증(루게릭병)으로부터 선택된 병태의 치료를 위한 제제를 암호화하는, 방법, 벡터 또는 게놈.
- 제1항 내지 제26항 중 어느 한 항에 있어서, 바이러스 폴리펩타이드의 혈청형은 Ad34인, 방법, 벡터 또는 게놈.
- 제7항 내지 제27항 중 어느 한 항의 아데노바이러스 벡터를 포함하는 약학 조성물로서, 약학 조성물은 이를 필요로 하는 대상체에 대한 주사를 위해 제형화된, 약학 조성물.
- 제1항 내지 제28항 중 어느 한 항에 있어서, 아데노바이러스 벡터는 CD34+ 세포, CD34+고 세포, CD34+/CD90+ 세포 및/또는 CD34+고/CD90+ 세포를 감염시키고/시키거나 형질도입하고, 선택적으로 세포는 조혈 세포인, 방법, 벡터, 게놈 또는 약학 조성물.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063129233P | 2020-12-22 | 2020-12-22 | |
US63/129,233 | 2020-12-22 | ||
PCT/US2021/064979 WO2022140618A1 (en) | 2020-12-22 | 2021-12-22 | Adenoviral gene therapy vectors |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230145051A true KR20230145051A (ko) | 2023-10-17 |
Family
ID=82158454
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237024788A KR20230145051A (ko) | 2020-12-22 | 2021-12-22 | 아데노바이러스 유전자 치료 벡터 |
Country Status (12)
Country | Link |
---|---|
US (1) | US20240108752A1 (ko) |
EP (1) | EP4267200A1 (ko) |
JP (1) | JP2024500191A (ko) |
KR (1) | KR20230145051A (ko) |
CN (1) | CN117157109A (ko) |
AR (1) | AR124489A1 (ko) |
AU (1) | AU2021410765A1 (ko) |
CA (1) | CA3204826A1 (ko) |
IL (1) | IL303899A (ko) |
MX (1) | MX2023007505A (ko) |
TW (1) | TW202242123A (ko) |
WO (1) | WO2022140618A1 (ko) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024158777A1 (en) * | 2023-01-23 | 2024-08-02 | The General Hospital Corporation | Methods and compositions for inhibiting suppression of anti-tumor immunity by targeting ligand-receptor interactions present in the placenta |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040253210A1 (en) * | 2001-08-30 | 2004-12-16 | Marjorie Robert-Guroff | Adenovirus type7 vectors |
EP1497412A4 (en) * | 2002-04-30 | 2006-11-22 | Avior Therapeutics Inc | ADENOVIRUS VECTORS FOR IMMUNOTHERAPY |
PL3021859T3 (pl) * | 2013-10-25 | 2018-06-29 | Psioxus Therapeutics Limited | Adenowirusy onkolityczne wyposażone w geny heterolityczne |
CN107405411A (zh) * | 2014-05-01 | 2017-11-28 | 华盛顿大学 | 使用腺病毒载体的体内基因改造 |
-
2021
- 2021-12-22 JP JP2023562641A patent/JP2024500191A/ja active Pending
- 2021-12-22 WO PCT/US2021/064979 patent/WO2022140618A1/en active Application Filing
- 2021-12-22 CN CN202180094007.2A patent/CN117157109A/zh active Pending
- 2021-12-22 AU AU2021410765A patent/AU2021410765A1/en active Pending
- 2021-12-22 US US18/268,392 patent/US20240108752A1/en active Pending
- 2021-12-22 IL IL303899A patent/IL303899A/en unknown
- 2021-12-22 AR ARP210103644A patent/AR124489A1/es unknown
- 2021-12-22 EP EP21912194.4A patent/EP4267200A1/en active Pending
- 2021-12-22 KR KR1020237024788A patent/KR20230145051A/ko unknown
- 2021-12-22 CA CA3204826A patent/CA3204826A1/en active Pending
- 2021-12-22 MX MX2023007505A patent/MX2023007505A/es unknown
- 2021-12-22 TW TW110148212A patent/TW202242123A/zh unknown
Also Published As
Publication number | Publication date |
---|---|
CA3204826A1 (en) | 2022-06-30 |
CN117157109A (zh) | 2023-12-01 |
TW202242123A (zh) | 2022-11-01 |
EP4267200A1 (en) | 2023-11-01 |
AU2021410765A1 (en) | 2023-07-13 |
AR124489A1 (es) | 2023-04-05 |
IL303899A (en) | 2023-08-01 |
JP2024500191A (ja) | 2024-01-04 |
US20240108752A1 (en) | 2024-04-04 |
MX2023007505A (es) | 2023-09-08 |
WO2022140618A8 (en) | 2022-08-04 |
WO2022140618A1 (en) | 2022-06-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2019204982B2 (en) | Recombinant HCMV and RhCMV Vectors and Uses Thereof | |
AU2020203872B2 (en) | Optimal maize loci | |
AU2020204196B2 (en) | Optimal maize loci | |
AU2020267257C1 (en) | Isolated polynucleotides and polypeptides, and methods of using same for increasing nitrogen use efficiency, yield, growth rate, vigor, biomass, oil content, and/or abiotic stress tolerance | |
AU2021200054B2 (en) | Isolated polynucleotides and polypeptides, and methods of using same for increasing yield of plants | |
AU2020202369B2 (en) | Isolated polynucleotides and polypeptides, and methods of using same for increasing plant yield and/or agricultural characteristics | |
AU2020209370B2 (en) | Isolated polynucleotides and polypeptides, and methods of using same for increasing abiotic stress tolerance, yield, growth rate, vigor, biomass, oil content, and/or nitrogen use efficiency of plants | |
KR102708641B1 (ko) | 미생물유전체를 조정함으로써 면역 체크포인트 차단 요법을 증강시키는 방법 | |
AU2020204520B2 (en) | Isolated polynucleotides and polypeptides, and methods of using same for increasing plant yield and/or agricultural characteristics | |
AU2020202204B2 (en) | Isolated polynucleotides and polypeptides, and methods of using same for increasing nitrogen use efficiency, yield, growth rate, vigor, biomass, oil content, and/or abiotic stress tolerance | |
AU2020267286B2 (en) | Isolated polynucleotides and polypeptides, and methods of using same for increasing plant yield and/or agricultural characteristics | |
AU2018203835B2 (en) | Recombinant dna constructs and methods for modulating expression of a target gene | |
AU2017248519B2 (en) | Isolated Polynucleotides And Polypetides, And Methods Of Using Same For Increasing Nitrogen Use Efficiency, Yield, Growth Rate, Vigor, Biomass, Oil Content, And/Or Abiotic Stress Tolerance | |
AU2021266196A9 (en) | Isolated polynucleotides and polypeptides, construct and plants comprising same and methods of using same for increasing nitrogen use efficiency of plants | |
JP2023145691A (ja) | 遺伝子操作のためのヌクレアーゼシステム | |
AU2021202753A1 (en) | Isolated polynucleotides and polypeptides and methods of using same for increasing plant yield, biomass, growth rate, vigor, oil content, abiotic stress tolerance of plants and nitrogen use efficiency | |
KR20230111189A (ko) | 재프로그램 가능한 iscb 뉴클레아제 및 이의 용도 | |
KR20130117753A (ko) | 포스포케톨라아제를 포함하는 재조합 숙주 세포 | |
KR20170035952A (ko) | 외인성 항원을 포함하는 인간 시토메갈로바이러스 | |
KR20230145051A (ko) | 아데노바이러스 유전자 치료 벡터 | |
KR20240035382A (ko) | 아데노바이러스 유전자 요법 벡터 | |
AU2017204404B2 (en) | Isolated Polynucleotides and Polypeptides, and Methods of Using Same for Increasing Plant Yield and/or Agricultural Characteristics | |
KR20070032043A (ko) | 재배열 병원체 마이크로어레이 |